Twierdzenie o funkcji uwikłanej

Poznamy teraz kolejne twierdzenie, które w ścisły sposób wypowiada naturalne oczekiwanie: jeśli mamy $ m $ równań, w których występuje $ n+m $ niewiadomych, to `zwykle' $ m $ spośród tych niewiadomych można wyznaczyć za pomocą pozostałych $ n $. (Oczywiście nie zawsze tak jest - równania mogą np. być sprzeczne).

Oznaczenia. W tym podrozdziale będziemy rozpatrywać funkcję

\[ F\colon \R^n\times \R^m\supset \Omega\longrightarrow \R^m, \qquad F\in C^1(\Omega,\R^m). \]

Punkty $ \R^n $ będziemy oznaczać literą $ \xx $, a punkty $ \R^m $ - literą $ \yy $. Różniczka $ DF(\xx,\yy) $ jest macierzą o $ m $ wierszach i $ n+m $ kolumnach; będziemy pisać

\[ \begin{equation} 	\label{DxDy} DF(\xx,\yy)= \big(D_{\mxx}F(\xx,\yy),D_{\myy}F(\xx,\yy)\big), \end{equation} \]

gdzie $ D_{\mxx}F(\xx,\yy)\in M_{m\times n} $ ma $ m $ wierszy i $ n $ kolumn, zaś $ D_{\myy}F(\xx,\yy)\in M_{m\times m} $ jest macierzą kwadratową o $ m $ wierszach i tyluż kolumnach. Inaczej mówiąc, zapis $ D_{\mxx}F\in M_{m\times n} $ oznacza, że chodzi o różniczkę $ F $ jako funkcji zmiennej $ \xx $, natomiast $ \yy $ traktujemy jako parametr; podobnie interpretujemy $ D_{\myy}F\in M_{m\times m} $.

Twierdzenie [o funkcji uwikłanej](#) Niech $ \Omega $ będzie zbiorem otwartym w $ \R^n\times \R^m $ i niech $ (\aa,\bb)\in \Omega $. Załóżmy, że $ F\in C^1(\Omega,\R^m) $ i $ F(\aa,\bb)=\zero $. Niech wreszcie

\[ 	  \det D_{\myy}F(\aa,\bb) \not=0\, . 	\]

Istnieją wówczas zbiory otwarte $ U\subset \R^n $ i $ V\subset \R^m $ oraz funkcja $ h\in C^1(U,\R^m) $ takie, że $ \aa\in U $, $ \bb\in V $, zaś warunek

\[ \begin{equation} 	\label{rownanie-TFU}   	F(\xx,\yy)=\zero,   \qquad (\xx,\yy) \in U\times V \subset \Omega \end{equation} \]

zachodzi wtedy i tylko wtedy, gdy $ \yy=h(\xx) $ dla pewnego $ \xx\in U $. Ponadto,

\[ \begin{equation} 	\label{dh-TFU}  	Dh(\xx)=- \Big(D_{\myy}F(\xx,h(\xx))\Big)^{-1}\cdot D_{\mxx} F(\xx,h(\xx))\, . \end{equation} \]

Nazwa twierdzenia ma następujący sens: w małym otoczeniu takiego punktu $ (\aa,\bb)\in \R^{n+m} $, w którym spełnione są założenia, równanie $ F(\xx,h(\xx))=0 $ definiuje funkcję $ \yy=h(\xx) $ wsposób uwikłany. Zanim podamy dowód, spójrzmy na dwa proste przykłady (z wieloma innymi Czytelnik spotka się później).

Przykład (#) (i). Niech $ A_1\in M_{m\times n} $, $ A_2\in M_{m\times m} $ i $ \det A_2\not =0 $. Rozpatrzmy przekształcenie liniowe

\[ 	F\colon \R^{n+m}=\R^n\times \R^m\rightarrow \R^m 	\]

dane wzorem $ F(\xx,\yy)= A_1\xx+ A_2\yy $ dla $ \xx\in \R^n $ oraz $ \yy\in \R^m $. Równanie $ F(\xx,\yy)=\zero $ można rozwiązać; zachodzi ono wtedy i tylko wtedy, gdy

\[ \yy = h(\xx)= -\big(A_2\big)^{-1}\cdot A_1\xx, \qquad \xx\in \R^n\, . \]

Mamy też oczywiście $ D_{\mxx} F\equiv A_1 $ i $ D_{\myy}F\equiv A_2 $. Widać więc, że w tej sytuacji funkcja $ h $ jest określona na całej przestrzeni $ \R^n $ i jest liniowa; zachodzi też warunek dh-TFU, opisujący jej różniczkę.      (ii). Niech $ n=m=1 $, $ a,b>0 $ i niech $ F(x,y)=\frac{x^2}{a^2}+\frac{y^2}{b^2}-1 $. Równanie $ F(x,y)=0 $ opisuje elipsę $ E $ w $ \R^2 $. Mamy

\[ F_x(x,y)=\frac{2x}{a^2}\, , \qquad F_y(x,y)=\frac{2y}{b^2}\, . \]

W otoczeniu każdego punktu $ (x_0,y_0)\in E $, który ma współrzędną $ y_0\not = 0 $, spełnione są założenia Twierdzenia [link]. Zatem, istnieją przedziały otwarte $ U,V\subset \R $ takie, że $ x_0\in U $, $ y_0\in V $, a równanie $ F(x,y)=0 $, rozpatrywane dla $ (x,y)\in U\times V $, wyznacza zmienną $ y $ jako funkcję $ x $. W tym przykładzie też możemy napisać jawny wzór

\[ \begin{equation} 	\label{elipsa}     	y=h(x)=\pm b\cdot \sqrt{1-\frac{x^2}{a^2}}\,  .   \end{equation} \]

Wybór znaku zależy od położenia $ (x_0,y_0) $ na elipsie, tzn. od znaku $ y_0 $. Widać też, że ważny jest wybór dwóch małych otoczeń $ U $ i $ V $: jeśli nie ograniczymy się do małego otoczenia punktu $ y_0 $, to nie wiemy, jaki znak wybrać we wzorze elipsa.

Załóżmy na chwilę, że $ y_0>0 $. Można wtedy wybrać jako $ V $ np. przedział $ (0,2b) $. Zgodnie z wzorem dh-TFU, powinno być

\[ h'(x) = - (F_y(x,y))^{-1}\cdot F_x(x,y) = -\frac{b^2}{2y}\cdot \frac{2x}{a^2} = - \frac{b^2}{a^2} \cdot \frac{x}{y} = - \frac{b^2}{a^2} \cdot \frac{x}{h(x)}\, .  \]

Taki właśnie wynik uzyskujemy, różniczkując funkcję $ h(x)=b\sqrt{1-(x^2/a^2)} $, daną wzorem elipsa.

W otoczeniu punktu $ (x_0,y_0)\in E $, $ y_0>0 $, elipsa $ E $ o równaniu $ x^2/a^2 + y^2/b^2=1 $ jest wykresem funkcji $ y=b\sqrt{1-(x^2/a^2)} $. W otoczeniu punktu $ (-a,0) $ ta sama elipsa jest wykresem funkcji $ x=-a\sqrt{1-(y^2/b^2)} $ zmiennej $ y $.

Zauważmy jeszcze, że jeśli $ \pp\in (x_0,y_0)\in E $ i $ y_0=0 $, to wtedy w otoczeniu punktu $ \pp $ równanie elipsy wyznacza $ x $ jako funkcję zmiennej $ y $. Nie kłóci się to z Twierdzeniem [link]. Możemy wszak je zastosować, wybierając inny, nieznikający minor macierzy $ DF $. W tym przypadku $ x_0\not=0 $ i $ F_x(x_0,y_0)\not = 0 $.

    Dowód Twierdzenia [link] Krok 1: zastosowanie twierdzenia o funkcji odwrotnej. Rozpatrzmy funkcję pomocniczą

\[ H\colon \Omega\to \R^n\times \R^m=\R^{n+m}, \qquad H(\xx,\yy) = \big(\xx, F(\xx,\yy)\big)\in \R^{n+m}\, . \]

Ponieważ $ F\in C^1 $, więc także $ H\in C^1 $. Nietrudno zauważyć, że macierz różniczki funkcji $ H $ wygodnie zapisuje się w postaci blokowej,

\[ DH(\xx,\yy) = \begin{pmatrix}\mathrm{Id} & \zero \\ A & B\end{pmatrix}, \]

gdzie

\[ \begin{gather*} \mathrm{Id}\in M_{n\times n}\, , \qquad\zero \in M_{n\times m}\, ,\\ A=D_{\mxx} F(\xx,\yy)\in M_{m\times n}\, , \qquad B =D_{\myy} F(\xx,\yy)\in M_{m\times m}\, . \end{gather*} \]

Posługując się $ n $-krotnie rozwinięciem Laplace'a, stwierdzamy, że

\[ \det DH(\aa,\bb) = \det D_{\myy} F(\aa,\bb)\not= 0\, . \]

Zatem, w punkcie $ \pp=(\aa,\bb)\in \Omega $ spełnione są założenia Twierdzenia [link] (o funkcji odwrotnej). Istnieje więc kula $ (n+m) $-wymiarowa $ B(\pp,r) $ i zbiór otwarty $ W\subset \R^{n+m} $ takie, że $ H\colon B(\pp,r)\to W $ jest bijekcją i funkcja $ G=H^{-1}\colon W\to B(\pp,r) $ jest klasy $ C^1 $. Ponadto, dla $ (\xx,\yy)\in B(\pp,r) $ jest $ \det D_{\myy}F(\xx,\yy)\not=0 $.

    Krok 2: postać funkcji odwrotnej do $ H $. Zapiszmy

\[ G(\xx,\yy)=\big(G_1(\xx,\yy), G_2(\xx,\yy) \big), \]

gdzie $ G_1\colon W\to \R^n $ i $ G_2\colon W\to \R^m $. Przy tych oznaczeniach,

\[ (\xx,\yy)=H\big(G(\xx,\yy)\big)=  \Big(G_1(\xx,\yy), F \big(G_1(\xx,\yy), G_2(\xx,\yy) \big) \Big)\, , \qquad (\xx,\yy)\in W. \]

Porównując $ n $ początkowych współrzędnych tej równości, otrzymujemy $ G_1(\xx,\yy)=\xx $ dla $ (\xx,\yy)\in W $, a następnie

\[ \begin{equation} 	\label{postacH} 	H\big(G(\xx,\yy)\big)=  \Big(\xx, F (\xx, G_2(\xx,\yy)) \Big)\, , \qquad (\xx,\yy)\in W.                                  \end{equation} \]

    Krok 3: opis rozwiązań równania $ F=\zero $. Jeśli $ (\xx,\yy)\in B(\pp,r) $, to warunek $ F(\xx,\yy)=\zero $ zachodzi wtedy i tylko wtedy, gdy

\[ H(\xx,\yy)= (\xx,F(\xx,\yy))= (\xx,\zero) \in W\, , \]

tzn. wtedy i tylko wtedy, gdy $ (\xx,\yy)=G(\xx,\zero)=\big(G_1(\xx,\zero),G_2(\xx,\zero)\big) $, co oznacza, że $ \yy=G_2(\xx,\zero) $. Z równania $ F=\zero $ wyznaczyliśmy więc $ \yy $ jako pewną funkcję $ \xx $.

W kuli $ B(\pp,r) $ zawarty jest pewien produkt $ U\times V $, gdzie $ U\subset \R^n $ i $ V\subset \R^m $ są zbiorami otwartymi; można np. wziąć $ U=B(\aa,r/2) $ i $ V=B(\bb,r/2) $. Wtedy

\[ h= G_2(\cdot,\zero) \colon U\to \R^m \]

i na zbiorze $ U\times V $ równanie $ F(\xx,\yy)=\zero $ zachodzi wtedy i tylko wtedy, gdy $ \yy=h(\xx) $ i $ \yy\in V $. Zmniejszając w razie potrzeby $ U $, np. biorąc $ \rho>0 $ tak małe, żeby $ U_1=B(\aa,\rho)\subset h^{-1}\big(B(\bb,r/2)\big) $ (tu korzystamy z ciągłości $ h<img class="teximage" src="/sites/default/files/tex/9068687679b332aeabe5c4dd15b423c7b6303397.png" alt="d75efa461506c69d4e5fcfccef585018:28:" />h(U)\subset V $. Ponieważ $ G\in C^1 $, więc $ G_1,G_2\in C^1 $ i dlatego $ h\in C^1 $. Udowodniliśmy więc całą tezę twierdzenia, wyjąwszy wzór dh-TFU.

    Krok 4: różniczka funkcji uwikłanej $ h $. Na zbiorze $ U\subset \R^n $ jest $ F(\xx,h(\xx))=\zero\in \R^m $. Różniczkując to równanie stronami i stosując wzór na pochodną złożenia

\[ \xx\longmapsto (\xx,h(\xx))\stackrel{F}\longmapsto F(\xx,h(\xx)) \]

(Czytelnik zechce sam narysować odpowiednie macierze, najlepiej w postaci blokowej), otrzymujemy

\[  D_{\mxx} F(\xx,h(\xx)) + D_{\myy} F(\xx,h(\xx))\cdot Dh(\xx)=\zero\in M_{m\times n}.  \]

Dla $ \xx\in U $ macierz $ D_{\myy}F(\xx,h(\xx)) $ jest odwracalna; przenosząc $ D_{\mxx} F(\ldots) $ na prawą stronę równania i mnożąc obie strony przez $ D_{\myy}F(\ldots)^{-1} $, otrzymujemy wzór dh-TFU. □

Uwaga (#) Jeśli w Twierdzeniu [link] o funkcji odwrotnej założymy dodatkowo, że $ f\in C^k $ dla pewnego $ k\in \N $, $ k>1 $, to wówczas także $ f^{-1}\in C^k $. Przypomnijmy: różniczka funkcji odwrotnej $ g=f^{-1} $ dana jest wzorem \( Dg(\yy) = \big(Df\big(g(\yy)\big)\big)^{-1}, \) tzn. jest złożeniem trzech odwzorowań:

\[ \begin{equation} 	\label{trzyfunkcje}    	\yy\mapsto g(\yy)=\zz, \qquad  \zz\mapsto Df(\zz), \qquad A\mapsto A^{-1}\, .  \end{equation} \]

To, że $ g=f^{-1}\in C^k $, gdy $ f\in C^k $, można więc łatwo wykazać przez indukcję względem $ k $. Dla $ k=1 $ udowodniliśmy to już w Twierdzeniu [link]. Jeśli $ f\in C^k $ i wiemy z założenia, że dowodzona własność zachodzi dla $ k-1 $, to pierwsze odwzorowanie w trzyfunkcje jest klasy $ C^{k-1} $ na mocy założenia indukcyjnego, drugie - też jest klasy $ C^{k-1} $, gdyż $ Df\in C^{k-1} $, trzecie zaś jest klasy $ C^\infty $ (wyrazy macierzy $ A^{-1} $ wyrażają się przez funkcje wymierne od wyrazów macierzy $ A $). Podobnie, jeśli w Twierdzeniu [link] o funkcji uwikłanej założymy, że $ F\in C^k $, to funkcja uwikłana $ h $, o której mowa w tezie, też jest klasy $ C^k $.□

Podamy teraz inne przykłady zastosowania twierdzenia o funkcji uwikłanej.

Przykład (#) Niech $ F(\xx)=\|\xx\|^2-1 = x_1^2+\cdots+x_n^2-1 $. Zbiór $ M=\{\xx\in\R^n\colon F(\xx)=0\} $ jest sferą $ \S^{n-1} $. Różniczka

\[ 	DF(\xx)=\big(F_{x_1}(\xx),\ldots F_{x_n}(\xx)\big) 	= 2(x_1,\ldots,x_n) =2\xx 	\]

nie znika w żadnym punkcie sfery. Dlatego w otoczeniu każdego punktu $ \pp=(p_1,\ldots,p_n)\in \S^{n-1} $ sferę $ \S^{n-1} $ można przedstawić jako wykres funkcji $ (n-1) $ zmiennych,

\[ x_i=\pm \biggl(1-\sum_{{\scriptsize 1\le j\le n}\atop{ \scriptsize j\not=i}} x_j^2\biggr)^{1/2}\, . \]

Jeśli $ p_i\not=0 $, to w pewnym otoczeniu $ \pp $ z równania sfery możemy wyznaczyć zmienną $ x_i $, dobierając odpowiednio znak w powyższym wzorze.

Przykład [torus jako poziomica pewnej funkcji](#) Niech $ R>r>0 $. Połóżmy

\[ 	F(x,y,z) = \Big(\sqrt{x^2+y^2}-R\Big)^2+z^2-r^2, \qquad  x^2+y^2>0,\ z\in \R. 	\]

Wtedy

\[ F_z(x,y,z)=2z, \qquad F_x(x,y,z)=2  \Big(\sqrt{x^2+y^2}-R\Big)\cdot \frac{x}{\sqrt{x^2+y^2}}, \]

a $ F_y $ otrzymujemy, zamieniając role $ x $ i $ y $. Zbiór $ M=\{(x,y,z)\in \R^3\colon F(x,y,z)=0\} $ jest domknięty, gdyż $ F $ jest ciągła; żaden punkt $ (0,0,z) $ nie należy do $ M $, gdyż $ R^2+z^2-r^2\ge R^2-r^2>0 $. Zatem $ M\subset \Omega=\{(x,y,z)\in \R^3\colon x^2+y^2>0\} $. Zbiór $ \Omega $ jest otwarty, a funkcja $ F\in C^1(\Omega,\R) $.

Sprawdzimy, że w każdym punkcie zbioru $ M $ różniczka funkcji $ F $ ma rząd równy $ 1 $. Niech $ (x,y,z)\in M $. Jeśli $ z\not=0 $, to $ F_z\not= 0 $. Jeśli $ z=0 $, ale $ x\not=0 $, to $ \sqrt{x^2+y^2}-R=\pm r\not =0 $ i $ F_x\not =0 $. Jeśli wreszcie $ z=x=0 $, to $ |y|=\sqrt{x^2+y^2}=R\pm r $ i wtedy $ F_y\not= 0 $. Zatem, w otoczeniu każdego punktu $ (x,y,z)\in M $ zbiór $ M $ można przedstawić jako wykres pewnej funkcji dwóch zmiennych, klasy $ C^1 $ (ustaliwszy $ (x,y,z)\in M $, łatwo jest rozwikłać równanie $ F=0 $ w sposób jawny - Czytelnik może to robić sam).

Zbiór $ M $ jest torusem obrotowym: %w płaszczyźnie $ (x,y) $ we współrzędnych biegunowych $ x= t\cos\theta $, $ y=t\sin\theta $ równanie $ F=0 $ zmienia się w $ (t-R)^2+z^2=r^2 $. Dla każdego kąta $ \theta\in [0,2\pi) $ przekrój $ M $ pionową półpłaszczyzną $ \{(t\cos\theta,t\sin\theta,z)\colon t>0, z\in \R\} $ jest więc okręgiem.

     Wskażemy jeszcze prosty przykład zastosowania Twierdzenia [link] dla $ n=1 $, $ m=2 $.

Przykład (#) Niech $ F\colon \R^3\to \R^2 $,

\[ 	F(x,y,z)= (x^2+2y^2+3z^2-6,x+y+z). 	\]

Zbiór $ M=\{(x,y,z)\in \R^3\colon F(x,y,z)=(0,0)\} $ jest częścią wspólną zbiorów $ M_i $ opisanych równaniami $ F_i=0 $, gdzie $ F_1 $ i $ F_2 $ są współrzędnymi $ F $, tzn. jest przecięciem elipsoidy trójosiowej i płaszczyzny. Minory $ 2\times 2 $ macierzy

\[ DF(x,y,z)=\begin{pmatrix} 2x & 4y & 6z \\ 1 & 1 & 1 \end{pmatrix} \]

znikają jednocześnie tylko wtedy, gdy $ x=2y=3z $. Na płaszczyźnie $ x+y+z=0 $ równości $ x=2y=3z $ zachodzą jedynie w punkcie $ (0,0,0)\not\in M $, a więc w każdym punkcie $ M $ co najmniej jeden z minorów macierzy $ DF $ nie znika. Wobec Twierdzenia [link], każdy punkt zbioru $ M $ ma takie otoczenie, w którym dwie spośród zmiennych $ (x,y,z) $ można wyznaczyć jako funkcję trzeciej zmiennej.