Twierdzenie o funkcji odwrotnej

Udowodnimy w tym podrozdziale jedno z najważniejszych twierdzeń, jakie Czytelnik pozna w ciągu całego wykładu.

Twierdzenie [o funkcji odwrotnej] (#) Niech $ \Omega $ będzie zbiorem otwartym w $ \R^n $ i $ f\in C^1(\Omega, \R^n) $. Załóżmy, że dla pewnego $ \aa\in \Omega $ różniczka $ Df(\aa)\in L(\R^n,\R^n) $ jest izomorfizem liniowym. Istnieją wówczas liczba $ \delta>0 $ i zbiór otwarty $ V\subset \R^n $ takie, że

  1. $ f\colon B(\aa,\delta)\to V $ jest bijekcją;
  2. przekształcenie $ g=f^{-1}\colon V\to B(\aa,\delta)\subset \R^n $ jest klasy $ C^1 $ na $ V $;
  3. Jeśli $ \yy=f(\xx) $ i $ \xx\in B(\aa,\delta) $, to $ Dg(\yy)= \big(Df(\xx)\big)^{-1} $.

Zanim przejdziemy do dowodu, podkreślmy ważną rzecz: dla $ n=1 $ podobne twierdzenie ma charakter globalny. Jeśli $ f\in C^1(\R,\R) $ i $ f' $ nie znika w żadnym punkcie, to $ f' $ ma stały znak, a $ f $ jest ściśle monotoniczna na $ \R $. Zatem funkcja $ g=f^{-1} $ jest określona na przedziale otwartym $ I=f(\R) $. Dla $ n>1 $ jest inaczej: może się okazać, że różniczka $ Df(\xx)\in L(\R^n,\R^n) $ jest odwracalna dla każdego $ \xx\in \R^n $, ale $ f $ nie jest różnowartościowe!

Przykład (#) Niech

\[ 	\R^2\equiv \C \ni (x,y)=x+iy=z\longmapsto \exp z= \big(e^x\cos y, e^x\sin y) =: F(x,y)\in \R^2 	\]

To przekształcenie jest gładkie i oczywiście nie jest różnowartościowe, gdyż każda liczba $ 2\pi i k $, gdzie $ k\in \Z $, jest okresem funkcji wykładniczej w $ \C $. Jednak

\[ DF(x,y)=\begin{pmatrix} e^x\cos y & -e^x\sin y  \\ e^x\sin y & e^x\cos y \end{pmatrix}\ , \]

a więc $ \det DF(x,y)=e^{2x}(\cos^2y+\sin^2y)=e^{2x}>0 $. Dlatego $ DF(x,y) $ jest macierzą odwracalną dla każdego $ (x,y)\in \R^2 $.

    Dowód Twierdzenia [link] Krok 1. Niech $ A=Df(\aa) $. Rozpatrując zamiast $ f $ nową funkcję

\[ \Omega-\aa\ni \xx\longmapsto A^{-1}\cdot \Big(f(\xx+\aa) - f(\aa)\Big)\in \R^n\, , \]

można sprowadzić dowód do przypadku $ Df(\aa)=\mathrm{Id}\in L(\R^n,\R^n) $, $ \aa=f(\aa)=\zero\in \Omega $. Takie założenia odtąd przyjmujemy.

Krok 2: różnowartościowość $ f $ i odwracalność $ Df $ w otoczeniu zera. Zapiszmy $ f(\xx)=\xx+\varphi(\xx) $, gdzie $ \varphi\in C^1(\Omega,\R^n) $, $ \varphi(\zero)=\zero $. Zatem $ Df(\xx)=\mathrm{Id}+D\varphi(\xx) $ i $ D\varphi(\zero)=\zero $. Przekształcenie $ \pp\mapsto D\varphi(\pp) $ jest ciągłe na $ \Omega $, więc istnieje taka liczba $ \delta_1>0 $, że $ \|D\varphi(\pp)\|<\frac 12 $ dla wszystkich $ \pp\in B(\zero,2\delta_1) $. Wynika stąd, że $ Df(\pp) $ jest macierzą odwracalną dla wszystkich $ \pp\in B(\zero,2\delta_1) $. %Zatem, %

\[ \begin{eqnarray*} %\|Df(\xx)\vv_1-Df(\xx)\vv_2\| & =  &  %\|\vv_1-\vv_2+D\varphi(\xx)(\vv_1-\vv_2)\|\\ %& \ge & \|\vv_1-\vv_2\| %-\|D\varphi(\xx)\|\cdot \|\vv_1-\vv_2\|\ge \frac 12  %\|\vv_1-\vv_2\|\, , %\end{eqnarray*} \]

%tzn. $ Df(\xx) $ jest izomorfizmem liniowym dla $ \xx\in %B(\zero,2\delta_1) $.

Ponadto, wobec twierdzenia o wartości średniej,

\[ \begin{equation} 	\label{malefi} 	\|\varphi(\xx)- \varphi(\yy)\| \le  	\|\xx-\yy\| \sup_{\mpp\in [\mxx,\myy]} \|D\varphi(\pp)\|\le \frac 12 \|\xx-\yy\|, \qquad \xx,\yy\in \overline B(\zero,2\delta_1).    \end{equation} \]

(W szczególności, $ \|\varphi(\xx)\|\le \frac 12 \|x\| $ na kuli domkniętej $ \overline{B}(\zero,2\delta_1) $). Przeto

\[ \begin{eqnarray*} \|f(\xx)-f(\yy)\| & = &\big\|(\xx-\yy) + \varphi(\xx)- \varphi(\yy)\big\|  \\ & \ge & \|\xx-\yy\|-  \|\varphi(\xx)- \varphi(\yy)\| \ \ge\  \frac 12 \|\xx-\yy\|\,  \end{eqnarray*} \]

dla wszystkich $ \xx,\yy\in B(\zero,2\delta_1) $. Stąd wynika różnowartościowość $ f $ na kuli $ B(\zero,2\delta_1) $. Na obrazie tej kuli przekształcenie $ g=f^{-1} $ jest dobrze określone i spełnia warunek Lipschitza ze stałą 2, a więc jest ciągłe.

Kluczową trudnością dowodu jest wykazanie, że dla pewnego $ \delta>0 $ zbiór $ f\big(B(\zero,\delta)\big) $ jest otwarty w $ \R^n $. Aby ją pokonać, wykorzystamy twierdzenie Banacha o punkcie stałym.

Krok 3: funkcję $ g=f^{-1} $ można określić na pewnym zbiorze otwartym. Wykażemy, że istnieje funkcja ciągła

\[ \gamma \colon \overline B(\zero,\delta_1)\to \overline B(\zero,\delta_1) \]

taka, że

\[ \begin{equation} \label{efgamma}   	f\big(\yy+\gamma(\yy)\big)=\yy \qquad \mbox{dla wszystkich $\yy\in \overline B(\zero,\delta_1)$.} \end{equation} \]

Wyniknie stąd, że kula $ B(\zero,\delta_1) $ jest zawarta w obrazie $ f\big(B(\zero,2\delta_1)\big) $.

Funkcję $ g=f^{-1} $ można będzie określić wzorem $ g(\yy)=f^{-1}(\yy)=\yy+\gamma(\yy) $ właśnie na $ B(\zero,\delta_1) $. Zbiór $ U=f^{-1}(B(\zero,\delta_1)) $ jest otwarty w $ \R^n $, gdyż $ f $ jest ciągła. Ponadto, $ \zero\in U $, więc dla pewnego $ \delta_2>0 $ kula $ B(\zero,\delta_2)\subset U $. Biorąc $ V=g^{-1}\big(B(\zero,\delta_2))=f(B(\zero,\delta_2)) $, otrzymamy - wobec ciągłości $ g<img class="teximage" src="/sites/default/files/tex/4a077328ef24f87d86de72b4d22437702d319a7c.png" alt="d8992d26c8805a0773700e0d66f4273e:24:" />\R^n $. Zakończy to dowód punktu (i) oraz części punktu (ii) twierdzenia o funkcji odwrotnej. Pozostanie do wykazania, że $ g\in C^1 $ iróżniczki obu funkcji wiąże zależność (iii).

Mamy

\[ f(\underbrace{\yy+\gamma(\yy)}_{=\mxx})= \xx+\varphi(\xx) = \yy+\gamma(\yy)+ \varphi(\yy+\gamma(\yy))\, . \]

Zatem warunek efgamma zachodzi wtedy i tylko wtedy, gdy

\[ \begin{equation} \label{gammafi} 	\gamma(\yy)=-\varphi(\yy+\gamma(\yy)), \qquad \yy\in  \overline  B(0,\delta_1)\, .    \end{equation} \]

Ustalmy teraz $ \yy\in \overline B(\zero,\delta_1) $ i rozpatrzmy pomocnicze przekształcenie

\[ T_{\myy} (\zz) = -\varphi(\yy+\zz), \qquad \zz\in  \overline B(\zero,\delta_1)\, . \]

Ponieważ $ \varphi(\zero)=\zero $, więc na mocy malefi jest $ \|T_y(\zz)\|\le \|\varphi(\yy+\zz)\|\le \frac 12\|\yy+\zz\|\le \delta_1 $ dla $ \yy,\zz \in \overline B(\zero,\delta_1) $. Innymi słowy,

\[ T_{\myy} \colon \overline B(\zero,\delta_1)\rightarrow \overline B(\zero,\delta_1)\, . \]

Nietrudno też sprawdzić, że $ T $ jest kontrakcją, gdyż

\[ \|T_{\myy} (\zz_1)-T_{\myy} (\zz_2)\|= \|\varphi(\yy+\zz_1)-\varphi(\yy+\zz_2)\|\ \stackrel{\eqref{malefi}}\le \ \frac 12 \|(\yy+\zz_1)-(\yy+\zz_2)\|=\frac 12 \|\zz_1-\zz_2\|\, . \]

Na mocy Twierdzenia [link], $ T_{\myy} $ ma dokładnie jeden punkt stały $ \zz\in \overline B(\zero,\delta_1) $. Wobec Lematu [link] (jego założenia sprawdzamy łatwo, podobnie jak wyżej), przekształcenie

\[ \overline B(\zero,\delta_1)\ni \yy\longmapsto\gamma(\yy)= \zz=\text{punkt stały kontrakcji }T_{\myy}\in  \overline B(\zero,\delta_1)  \]

jest ciągłe. Oczywiście, $ T_{\myy}(\zz)=\zz=\gamma(\yy) $ wtedy i tylko wtedy, gdy zachodzi warunek gammafi, tzn. równoważny mu warunek efgamma.

Krok 4: różniczkowalność $ g $ i wzór $ Dg(\yy)=Df(\xx)^{-1} $ dla $ \yy=f(\xx) $. Przypuśćmy, że byłoby już wiadomo, że $ g=f^{-1} $ jest przekształceniem różniczkowalnym. Stosując twierdzenie o różniczce złożenia do funkcji

\[ g\circ f = \mathrm{Id}\colon B(\zero,\delta_2)\to \R^n \]

otrzymalibyśmy wtedy równość

\[ Dg\big(f(\xx)\big)\cdot Df(\xx)= \mathrm{Id} \qquad\mbox{dla $\xx\in B(\zero,\delta_2)$,\quad $\yy=f(\xx)\in V=f(B(\zero,\delta_2))$,} \]

tzn. $ Dg(f(\xx))=Df(\xx)^{-1} $ na $  B(\zero,\delta_2) $. Operacja odwracania macierzy jest ciągła na zbiorze macierzy odwracalnych w $ M_{n\times n}\simeq \R^{n^2} $ (przypomnijmy: jest to zbiór otwarty!), więc przekształcenie

\[ V\ni\yy \mapsto Dg(\yy) = \Big(Df\big(g(\yy)\big)\Big)^{-1}\in M_{n\times n} \]

jest ciągłe. Aby zakończyć cały dowód Twierdzenia [link], pozostaje więc wykazać, że $ Dg(\yy) $ istnieje, gdy $ \yy\in V $. Udowodnimy w tym celu następujący

Lemat [o różniczce przekształcenia odwrotnego] Niech $ U, V $ będą zbiorami otwartymi w $ \R^n $, a $ f\colon U\to V $ -- bijekcją różniczkowalną w punkcie $ \xx\in U $. Załóżmy, że różniczka $ Df(\xx)=A $ jest izomorfizmem liniowym. Jeśli funkcja $ g=f^{-1}\colon V\to U $ jest ciągła w punkcie $ \yy=f(\xx) $, to $ Dg(\yy) $ istnieje i jest równa $ A^{-1} $.

    Dowód lematu. Oznaczmy $ B=A^{-1}=(Df(\xx))^{-1} $ i $ M=\|A\|+2\|B\|+1 $. Różniczka $ Df(\xx)=A $ istnieje, więc

\[ \begin{equation} \label{df=a} f(\xx+\hh)-f(\xx)= A\hh + r(\hh), \qquad\mbox{gdzie}\quad  \lim_{\mhh\to\zero} \frac{r(\hh)}{\|\hh\|}=\zero\, . \end{equation} \]

Niech $ \vv\in\R^n $, $ \|\vv\|\ll 1 $. Wtedy $ \vv=f(\xx+\hh)-f(\xx) $ dla pewnego $ \hh\in\R^n $: wystarczy zapisać ostatnią równość jako $ f(\xx+\hh)=f(\xx)+\vv $, a stąd $ \hh=g(f(\xx)+\vv))-\xx $; wobec ciągłości $ g $ w $ \yy=f(\xx) $ jest $ \hh\to 0 $ dla $ \vv\to 0 $. Pokażemy, że w małym otoczeniu zera wektory $ \hh $ i $ \vv $ mają porównywalne długości. Wybierzmy $ \delta>0 $ tak, aby $ \|r(\hh)\|<\frac 1{2M} \|\hh\| $ dla $ \| \hh\|<\delta $. Po pierwsze,

\[ \|\vv\|=\|A\hh+r(\hh)\|\le \|A\|\cdot \|\hh\|+\frac 1{2M} \|\hh\| \le M\|\hh\|\, . \]

Po drugie, $ A\hh=\vv-r(\hh) $ na mocy df=a i dlatego

\[ \|\hh\|= \|B\cdot A\cdot \hh\|=\|B\vv -B\cdot r(\hh)\| \le \|B\|\Big(\|\vv\|+ \frac 1{2M} \|\hh\|\Big)\le \|B\|\cdot \|\vv\|+\frac {1}{2}\|\hh\|, \]

stąd zaś $ \|\hh\|\le 2\|B\|\cdot \|\vv\|\le M\|\vv\| $. Ostatecznie

\[ \begin{equation} 	\label{h-k} 	\frac{1}{M} \|\vv\|\le \|\hh\|\le M\|\vv\| \qquad \mbox{dla}\quad   \|\hh\|<\delta. \end{equation} \]

Ponieważ $ \yy=f(\xx) $, więc

\[ g(\yy+\vv)- g(\yy)=g(f(\xx)+\vv)- g(f(\xx))= \hh =B(A\hh) = B\vv - B(r(\hh)). \]

Częścią liniową przyrostu $ g $ jest $ B\vv $, zaś reszta $ r_1(\vv)=B(r(\hh)) $ spełnia warunek

\[ \frac{\norm{B(r(\hh))}}{\norm{\vv}}\le \frac{M \cdot \|r(\hh)\|}{\norm{\hh}} \cdot \frac{\norm{\hh}}{\norm{\vv}}\stackrel{}\le M^2 \frac{ \|r(\hh)\|}{\norm{\hh}}\to \zero\qquad\mbox{dla $\vv\to \zero$,}  \]

gdyż wobec h-k warunki $ \vv\to \zero $ i $ \hh\to \zero $ są równoważne. Z definicji różniczki, $ Dg(\yy)=B=A^{-1} $. Dowód lematu, a także dowód całego Twierdzenia [link], jest zakończony. □

Uwaga W dowodzie twierdzenia o lokalnej odwracalności twierdzenie Banacha o punkcie stałym można stosować do przestrzeni funkcyjnej $ X=C\big(\overline B(\zero,\delta_1),\overline B(\zero,\delta_1)\big) $ zmetryką `supremum'. Określamy przekształcenie

\[ T\colon X\to X, \qquad (T\gamma)(\yy)=-\varphi(\yy+\gamma(\yy))\, . \]

Sprawdzenie, że $ T\colon X\to X $ jest kontrakcją, wykonujemy tak samo, jak rachunki w 3. kroku dowodu. Funkcja $ \gamma $, która jest punktem stałym $ T $, spełnia równanie gammafi - i od razu, bez powoływania się na Lemat [link], wiadomo, że $ \gamma $ jest ciągła.

Czytelnik może się zastanowić, czy udałoby się stosować twierdzenie Banacha od razu do pewnego podzbioru funkcji klasy $ C^1 $.