Twierdzenie Banacha o punkcie stałym

W tym podrozdziale $ (X,\varrho) $ oznacza przestrzeń metryczną.

Definicja [warunek Cauchy'ego] Mówimy, że ciąg $ (x_n)\subset X $ spełnia warunek Cauchy'ego wtedy i tylko wtedy, gdy dla każdej liczby $ \eps>0 $ istnieje $ n_0\in \N $ takie, że dla wszystkich $ n,m>n_0 $ jest $ \varrho(x_n,x_m)<\eps $.

Łatwo wykazać, że każdy ciąg spełniający warunek Cauchy'ego jest ograniczony.

Definicja [zupełność] Przestrzeń metryczna $ (X,\varrho) $ nazywa się zupełna wtedy ityl\-ko wtedy, gdy każdy ciąg $ (x_n)\subset X $ spełniający warunek Cauchy'ego jest zbieżny w $ X $.

Przykład

  1. Przestrzeń $ \R $ z metryką $ \varrho(x,y)=|x-y| $ jest zupełna. Podobnie, $ \R^n $ z metryką zadaną przez (jakąkolwiek) normę jest przestrzenią zupełną.
  2. $ Y=[0,1] $ z metryką $ \varrho(x,y)=|x-y| $ jest przestrzenią zupełną. Ogólnie, każdy domknięty podzbiór $ Y $ przestrzeni metrycznej zupełnej $ (X,\varrho) $, z odziedziczoną metryką $ \varrho $, jest przestrzenią metryczną zupełną. Natomiast podzbiór przestrzeni metrycznej zupełnej, który nie jest domknięty, nie jest zupełny (są w $ Y $ ciągi zbieżne, których granice nie należą do $ Y $).
  3. Przestrzeń funkcji ciągłych $ C([0,1],\R) $ z metryką
    \[ 	\varrho(f,g)=\sup_{x\in I} |f(x)-g(x)| 	\]

    jest zupełna. Zbieżność w metryce $ \varrho $ to zbieżność jednostajna; jeśli ciąg funkcji ciągłych spełnia jednostajny warunek Cauchy'ego, to jest jednostajnie zbieżny, a jego granica też jest funkcją ciągłą. (Patrz skrypt z Analizy Matematycznej I, rozdział 7.)

  4. Przestrzeń $ C^1_b(\R) $ tych funkcji $ f\colon \R\to\R $ klasy $ C^1 $, które są ograniczone i mają ograniczoną pochodną, wyposażona w metrykę
    \[ \varrho_1(f,g)=\sup_{x\in \R} |f(x)-g(x)| + \sup_{x\in \R} |f'(x)-g'(x)|\, , \]

    jest zupełna. Zbieżność ciągu funkcji $ (f_m) $ w metryce $ \varrho_1 $ to zbieżność jednostajna wraz z pochodnymi. Dowód zupełności $ C^1_b(\R) $ (wskazówka: skorzystać z twierdzenia o różniczkowaniu ciągów funkcyjnych) pozostawiamy Czytelnikowi jako ćwiczenie.

  5. Niech $ r>0 $ i $ B=B(\zero,r)\subset \R^n $. Przestrzeń $ C(\overline B, \R^m) $ wszystkich funkcji ciągłych $ f\colon \overline B\to \R^m $ z metryką
    \[ \varrho(f,g)=\sup_{\mxx\in \overline B} \|f(\xx)-g(\xx)\| \]

    jest zupełna. Formalny dowód tego faktu wymaga określenia zbieżności jednostajnej funkcji wielu zmiennych i powtórzenia dowodów twierdzeń, które poznaliśmy na I roku studiów. Jednak rozumowania są identyczne: zupełność prostej zastępuje się zupełnością $ \R^n $, a nierówność trójkąta dla modułu - nierównością trójkąta dla normy. Dlatego ten przykład nie różni się szczególnie od podanego w punkcie3.

Definicja Niech $ (X,\varrho) $ będzie przestrzenią metryczną i niech $ T\colon X\to X $. Mówimy, że odwzorowanie $ T $ jest zwężające (albo inaczej: jest kontrakcją) wtedy i tylko wtedy, gdy istnieje stała $ \lambda\in (0,1) $ taka, że

\[ 	\varrho\big(T(\xx), T(\yy)\big) \le \lambda \varrho(\xx,\yy) \qquad\mbox{dla wszystkich $\xx,\yy\in X$.} 	\]
Uwaga Każda kontrakcja jest ciągła na $ X $, gdyż spełnia warunek Lipschitza.
Definicja Punkt $ \xx\in X $ nazywa się punktem stałym odwzorowania $ T\colon X\to X $ wtedy i tylko wtedy, gdy $ T(\xx)=\xx $.
Twierdzenie [Banacha o punkcie stałym] Jeśli $ (X,\varrho) $ jest przestrzenią metryczną zupełną, zaś $ T\colon X\to X $ jest kontrakcją, to $ T $ ma dokładnie jeden punkt stały $ \xx\in X $. (#)

Dowód tego twierdzenia, nazywanego także zasadą odwzorowań zwężających, jest krótki i nietrudny, a samo twierdzenie -- opublikowane w wersji abstrakcyjnej w roku 1922, w pracy doktorskiej Banacha (Fundamenta Math., tom 3, rok 1922, str. 133-181.) -- ma mimo swojej prostoty wiele zastosowań, w których $ X $ bywa zwykle jakąś przestrzenią funkcyjną, a równanie $ T(\xx)=\xx $ -- równaniem różniczkowym lub całkowym.

Podamy jeszcze poglądową interpretacją twierdzenia Banacha: jeśli rozłożony plan miasta upuścimy na jednej z ulic w tym mieście, to jest dokładnie jeden taki punkt planu, który znalazł się idealnie wtym miejscu, które przedstawia. Czytelnik zechce zastanowić się nad prawdziwością tego zdania i dopiero później przeczytać poniższy dowód.

Dowód: Odwzorowanie zwężające nie może mieć dwóch różnych punktów stałych: gdyby $ T(\xx)=\xx $ i $ T(\yy)=\yy $, to mielibyśmy

\[ \varrho(\xx,\yy)=\varrho\big(T(\xx), T(\yy)\big) \le \lambda \varrho(\xx,\yy). \]

Ponieważ $ \lambda \in (0,1) $, więc musi zachodzić równość $ \varrho(\xx,\yy)=0 $, tzn. $ \xx=\yy $.

Pozostaje wykazać istnienie punktu stałego. Niech $ \xx_0\in X $ będzie dowolnym punktem. Rozpatrzmy zdefiniowany rekurencyjnie ciąg $ \xx_{n+1}=T(\xx_n) $, gdzie $ n=0,1,2,\ldots $. Ponieważ $ T $ jest kontrakcją, więc

\[ \begin{eqnarray} \varrho(\xx_{n+1},\xx_n)=  \varrho\big(T(\xx_n),T(\xx_{n-1})\big)& \le &  \lambda \varrho(\xx_n,x_{n-1})\\ &\le & \lambda^2 \varrho(\xx_{n-1},\xx_{n-2})\le \ldots \le \lambda^n \varrho(\xx_1,\xx_0)\, \nonumber  \end{eqnarray} \]

dla pewnej liczby $ \lambda\in (0,1) $. Jeśli $ m>n $, to na mocy nierówności trójkąta

\[ \begin{eqnarray*} \varrho(\xx_m,\xx_n) & \le & \varrho(\xx_m,\xx_{m-1})	+\cdots +\varrho(\xx_{n+1},\xx_n)\\ & \le & \sum_{j=n}^{m-1}\lambda^j \varrho (\xx_1,\xx_0) \le \sum_{j=n}^{\infty}\lambda^j \varrho (\xx_1,\xx_0) =\lambda^n  \frac{\varrho (\xx_1,\xx_0) }{1-\lambda}=C\lambda^n\, , \end{eqnarray*} \]

gdzie stała $ C $ nie zależy od $ n $. Zatem ciąg $ (\xx_n) $ spełnia warunek Cauchy'ego, a więc jest zbieżny, gdyż przestrzeń $ (X,\varrho) $ jest zupełna. Niech $ \xx=\lim \xx_n $. Wobec ciągłości $ T $,

\[ T(\xx)=T(\lim \xx_n) =\lim T(\xx_n) = \lim \xx_{n+1}=\xx. \]

Dowód jest zakończony. □

Okazuje się, że jeśli dwie kontrakcje są bliskie, to ich punkty stałe są bliskie. Z poniższego faktu skorzystamy w następnym podrozdziale.

Lemat (#) Jeśli $ (X,\varrho) $ jest przestrzenią metryczną zupełną, a $ T_1,T_2\colon X\to X $ spełniają warunek Lipschitza ze stałą $ \lambda<1 $ i ponadto

\[ 	\sup_{\mxx\in X}\varrho(T_1(\xx),T_2(\xx))< \eps 	\]

to punkty stałe $ \xx_j $ kontrakcji $ T_j $, gdzie $ j=1,2 $, spełniają nierówność $ \varrho(\xx_1,\xx_2)<\eps/(1-\lambda) $.

Dowód: Na mocy nierówności trójkąta,

\[ \varrho(\xx_1,\xx_2)=\varrho(T_1(\xx_1),T_2(\xx_2))\le   \varrho(T_1(\xx_1),T_1(\xx_2))+\varrho(T_1(\xx_2),T_2(\xx_2)) < \lambda \varrho(\xx_1,\xx_2) + \eps. \]

Przenosząc pierwszy składnik na lewą stronę, łatwo otrzymujemy tezę.□