Analiza Matematyczna I

Czym zajmuje się Analiza Matematyczna?

Jedna z możliwych ogólnych odpowiedzi na to pytanie jest następująca: badaniem odpowiednio regularnych funkcji, określonych zwykle na podzbiorach przestrzeni wektorowych (Z pojęciem przestrzeni wektorowej Czytelnik tych notatek zetknie się na wykładach Geometrii z Algebrą Liniową.). Do najważniejszych zagadnień w Analizie należą zatem:

  • sposoby definiowania tych funkcji oraz opis ich własności;
  • badanie różnych typów procesów, które wiążą się z matematycznym opisem ciągłych zmian (przejścia graniczne, różniczkowanie, całkowanie);
  • badanie wielu zastosowań powyższej teorii w innych obszarach, np. w geometrii, fizyce, ekonomii, biologii.

W najprostszym przypadku chodzi o funkcje jednej zmiennej rzeczywistej. Podczas pierwszego roku studiów matematycznych praktycznie nie będziemy się stykać z istotnie bardziej zaawansowanymi działami Analizy.

A jak powstaje typowa teoria matematyczna?

We współczesnej matematyce typowa teoria ma budowę aksjomatyczną. To znaczy, że wprowadzamy pewne pojęcia pierwotne, których nie definiujemy; zakładamy natomiast, że między tymi pojęciami zachodzą pewne określone związki, wyrażone za pomocą aksjomatów (inaczej nazywanych pewnikami). Na tej podstawie budujemy resztę teorii.

Ponieważ mamy zajmować się funkcjami zmiennej rzeczywistej, więc rozpoczniemy cały wykład od podania pojęć pierwotnych i aksjomatów teorii liczb rzeczywistych, oraz omówienia ich najważniejszych konsekwencji.

Liczby rzeczywiste

Czym zajmuje się Analiza Matematyczna?

Jedna z możliwych ogólnych odpowiedzi na to pytanie jest następująca: badaniem odpowiednio regularnych funkcji, określonych zwykle na podzbiorach przestrzeni wektorowych (Z pojęciem przestrzeni wektorowej Czytelnik tych notatek zetknie się na wykładach Geometrii z Algebrą Liniową.). Do najważniejszych zagadnień w Analizie należą zatem:

  • sposoby definiowania tych funkcji oraz opis ich własności;
  • badanie różnych typów procesów, które wiążą się z matematycznym opisem ciągłych zmian (przejścia graniczne, różniczkowanie, całkowanie);
  • badanie wielu zastosowań powyższej teorii w innych obszarach, np. w geometrii, fizyce, ekonomii, biologii.

W najprostszym przypadku chodzi o funkcje jednej zmiennej rzeczywistej. Podczas pierwszego roku studiów matematycznych praktycznie nie będziemy się stykać z istotnie bardziej zaawansowanymi działami Analizy.

A jak powstaje typowa teoria matematyczna?

We współczesnej matematyce typowa teoria ma budowę aksjomatyczną. To znaczy, że wprowadzamy pewne pojęcia pierwotne, których nie definiujemy; zakładamy natomiast, że między tymi pojęciami zachodzą pewne określone związki, wyrażone za pomocą aksjomatów (inaczej nazywanych pewnikami). Na tej podstawie budujemy resztę teorii.

Ponieważ mamy zajmować się funkcjami zmiennej rzeczywistej, więc rozpoczniemy cały wykład od podania pojęć pierwotnych i aksjomatów teorii liczb rzeczywistych, oraz omówienia ich najważniejszych konsekwencji.

Aksjomatyka liczb rzeczywistych

Pojęcia pierwotne teorii liczb rzeczywistych są następujące: dany jest zbiór liczb rzeczywistych $ \R $ z dwoma wyróżnionymi elementami, $ 0 $ i $ 1 $ (przy czym $ 0\not= 1 $), relacja nierówności $ {}<{} $, oraz dwa działania, dodawanie i mnożenie, przypisujące każdej parze liczb $ x,y\in \R $ ich sumę $ x+y $ oraz iloczyn $ x\cdot y=xy $.      Uwaga. Czytelnik, jeśli tylko chce, może sobie wyobrażać jako $ \R $ zbiór punktów osi liczbowej, o której uczono go w szkole. Relacja nierówności, zero i jedynka, suma i iloczyn też nieprzypadkowo są oznaczane tak, jak w szkole. Zamiast mówić liczba $ x\in\R $, będziemy czasem mówić punkt $ x\in\R $

Aksjomaty teorii liczb rzeczywistych wygodnie jest podzielić na trzy grupy: aksjomaty ciała przemiennego, aksjomaty porządku, oraz aksjomat ciągłości.

Aksjomaty ciała przemiennego

Pierwsza grupa aksjomatów orzeka, że liczby rzeczywiste tworzą ciało przemienne. Chodzi o opis kluczowych własności dodawania i mnożenia.

Oto własności dodawania:

  • [A.1 (Przemienność dodawania).] Dla wszystkich $ x,y\in \R $ zachodzi równość $ x+y=y+x $.
  • [A.2 (Łączność dodawania).] Dla wszystkich $ x,y,z\in \R $ zachodzi równość $ (x+y)+z=x+(y+z) $.
  • [A.3 (Charakteryzacja zera).] Dla wszystkich $ x\in \R $ jest $ x+0=x $.
  • [A.4 (Istnienie elementów przeciwnych).] Dla każdego $ x\in \R $ istnieje element $ -x\in \R $, taki, że $ x+(-x)=0 $.

Mnożenie ma podobną listę własności:

  • [A.5 (Przemienność mnożenia).] Dla wszystkich $ x,y\in \R $ zachodzi równość $ xy=yx $.
  • [A.6 (Łączność mnożenia).] Dla wszystkich $ x,y,z\in \R $ zachodzi równość $ (xy)z=x(yz) $.
  • [A.7 (Charakteryzacja jedynki).] Dla wszystkich $ x\in \R $ jest $ x\cdot 1=x $.
  • [A.8 (Istnienie elementów odwrotnych).] Dla każdego $ x\in \R $, $ x\not= 0 $, istnieje element $ x^{-1}\in \R $, taki, że $ x\cdot x^{-1}=1 $.

Ostatni aksjomat z tej grupy mówi o tym, jaki jest związek dodawania z mnożeniem.

  • [A.9 (Rozdzielność mnożenia względem dodawania).] Dla wszystkich $ x,y,z\in \R $ zachodzi równość $ x(y+z)=xy+xz $.

Aksjomaty porządku

  • [N.1 (Prawo trichotomii).] Dla wszystkich $ x,y\in \R $ zachodzi dokładnie jedna z trzech możliwości:
    \[ x < y, \qquad x=y, \qquad y<x. \]
  • [N.2 (Przechodniość).] Dla wszystkich $ x,y, z\in \R $, jeśli $ x<y $ i $ y<z $, to $ x<z $.
  • [N.3 (Związki nierówności z działaniami).] Dla wszystkich $ x,y,z\in \R $:
    1. jeśli $ x<y $, to $ x+z<y+z $;
    2. jeśli $ x<y $ i $ 0<z $, to $ xz<yz $.

Z tych dwóch grup aksjomatów można wyprowadzić wszystkie szkolne reguły arytmetyki, definiując po drodze dwa pozostałe działania, odejmowanie i dzielenie (przez liczbę różną od zera). Są wśród tych reguł m.in. następujące:

  1. (#) Elementy przeciwne i odwrotne są określone jednoznacznie. Ponadto, $ -(-x)=x $ dla każdego $ x\in\R $, a $ (x^{-1})^{-1}=x $ dla każdego $ x\in \R $, $ x\not= 0 $.
  2. Dla dowolnych $ a,b\in \R $ istnieje dokładnie jeden element $ x\in \R  $ taki, że $ a+x=b $.
  3. Jeśli $ xy=x $ i $ x\not=0 $, to $ y=1 $.
  4. Dla wszystkich $ x,y\in \R $ z równości $ xy=0 $ wynika, że $ x=0 $ lub $ y=0 $.
  5. Dla każdego $ x\in \R $ mamy $ x\cdot 0=0 $.(#)
  6. Dla dowolnych $ a,b\in \R $, $ a\not=0 $, istnieje dokładnie jeden element $ x\in \R  $ taki, że $ ax=b $.
  7. Dla wszystkich liczb rzeczywistych $ a,b $ zachodzą równości $ (-a)b=a(-b)=-ab $.
  8. Dla każdego $ x\in \R $ mamy $ 0\le x^2 $; przy tym $ x^2=0 $ wtedy i tylko wtedy, gdy $ x=0 $. W szczególności, (#)
    \[ 	  1=1\cdot 1 = 1^2 > 0 	\]

    Uwaga notacyjna. Czytelnik zauważył może, że w ostatniej własności pojawił się symbol $ \le $, dotychczas niezdefiniowany, ani nie wymieniony wśród pojęć pierwotnych. Zgodnie z~naturalnym oczekiwaniem, przyjmujemy dla wszystkich liczb rzeczywistych $ a,b $, że

  1. $ a\le b $ wtedy i tylko wtedy, gdy $ a=b $ lub $ a<b $;
  2. $ a\ge b $ wtedy i tylko wtedy, gdy $ b\le a $;
  3. $ a>b $ wtedy i tylko wtedy, gdy $ b<a $.

Dla przykładu przeprowadzimy

     Dowód własności (W5). Ustalmy dowolną liczbę $ x\in\R $. Z aksjomatu A.3 wynika, że $ 1+0=1 $. Mnożąc obie strony przez $ x $ i stosując wskazane aksjomaty, otrzymujemy

\[ \begin{equation} 	\label{xxplus0} 	x\stackrel{\text{A.7}}{=} x\cdot 1 = x(1+0) 	\stackrel{\text A.9}{=}x\cdot 1 + x\cdot 0 	\stackrel{\text A.7}{=} x+ x\cdot 0, \end{equation} \]

a zatem

\[ \begin{eqnarray*} x\cdot 0  & \stackrel{\text A.3}{=} & x\cdot 0 + 0  \stackrel{\text A.4}{=} x\cdot 0 + (x+(-x))  \stackrel{\text{A.1 i A.2}}{=} x+ x\cdot0 + (-x)\\ & \stackrel{\eqref{xxplus0}}{=} & x+(-x)  \qquad\mbox{(wiemy już, patrz \eqref{xxplus0}, że $x+x\cdot 0=x$)} \\ & \stackrel{\text A.4}{=} & 0\, , \end{eqnarray*} \]

co było do udowodnienia.      $ \Box $

 

Nie będziemy przeprowadzać dowodów wszystkich własności z listy (W1)-(W [link]). Dowody nie są zbyt skomplikowane, a treść tych własności powinna być Czytelnikowi dobrze znana. Przykładowe dowody takich własności pojawią się na ćwiczeniach. Podkreślmy inną rzecz: warto i należy zdawać sobie sprawę, że podana lista aksjomatów A.1-A.9 i N.1-N.3, wystarcza, by wyprowadzić z niej wszystkie pozostałe reguły arytmetyki, zdefiniowawszy wcześniej odejmowanie $ x-y:=x+(-y) $ i dzielenie $ x/y:=x\cdot y^{-1} $ dla $ y\not=0 $. To oznacza, że reguły z listy (W [link])-(W [link]) czy np. szkolne prawo rozdzielności dzielenia względem odejmowania nie są już, jak aksjomaty, kwestią umowy, a tym bardziej opinii nauczyciela, zapisanej w kolorowych ramkach. Są konieczną konsekwencją aksjomatów.

Pojęcie kresu górnego i aksjomat ciągłości

Ostatni aksjomat, który jest nam potrzebny, ma inny charakter od aksjomatów ciała i porządku. Dotyczy nie pojedynczych liczb rzeczywistych, ani ich par czy trójek, tylko podzbiorów zbioru liczb rzeczywistych. Sformułowanie tego aksjomatu poprzedzimy definicjami ograniczenia górnego i kresu górnego.

Definicja Liczba $ M\in \R $ jest ograniczeniem górnym zbioru $ A\subset\R $ wtedy i tylko wtedy, gdy dla każdego $ x\in A $ jest $ x\le M $.

Mówimy, że zbiór $ A\subset \R $ jest ograniczony z góry, gdy ma choć jedno ograniczenie górne. Na przykład przedział domknięty $ [0,1] $ jest ograniczony z góry. Jego ograniczeniami górnymi są m.in. liczby $ 1 $, $ 10 $, $ 2010 $ i $ 2010^{2010} $.

Definicja Liczba $ M\in \R $ jest kresem górnym niepustego zbioru $ A\subset \R $ wtedy i tylko wtedy, gdy spełnione są dwa warunki:

  1. $ M $ jest ograniczeniem górnym $ A $,
  2. jeśli $ M' $ jest ograniczeniem górnym $ A $, to $ M\le M' $.

Kres górny zbioru oznaczamy symbolem `sup' (od łacińskiego supremum) i piszemy $ M=\sup A $. Definicję kresu górnego niepustego zbioru liczb rzeczywistych można sformułować na inne, równoważne sposoby:

  • $ M=\sup A $ wtedy i tylko wtedy, gdy $ M $ jest najmniejszym ograniczeniem górnym zbioru $ A $;
  • $ M=\sup A $ wtedy i tylko wtedy, gdy $ M $ jest ograniczeniem górnym zbioru $ A $ i dla każdego $ \eps >0  $ istnieje $ x\in A $ taki, że $ M-\eps <x $.

Sprawdzenie równoważności tych definicji pozostawiamy jako proste ćwiczenie. Podobnie, łatwo jest sprawdzić, posługując się tylko definicją, że

\[ \sup \{a\} = a \quad\mbox{dla każdego $a\in R$,} \qquad \sup \bigl([a,b]\bigr) = b\quad\mbox{dla wszystkich $a,b\in \R$, $a<b$.} \]

Teraz możemy już sformułować zapowiedziany aksjomat ciągłości.

     Aksjomat ciągłości (Dedekinda). Każdy niepusty, ograniczony z góry podzbiór $ A\subset \R $ ma kres górny $ M=\sup A\in \R $.

    Uwaga. Analogicznie do ograniczenia górnego i kresu górnego definiuje się ograniczenie dolne zbioru liczb i kres dolny niepustego zbioru liczb $ A\subset \R $. Kres dolny oznaczamy symbolem `inf', od łacińskiego infimum. Liczba $ \inf A $ jest największym ograniczeniem dolnym niepustego zbioru $ A\subset \R $. Sformułowanie ścisłych definicji pozostawiamy jako ćwiczenie.

Zbiór, który ma ograniczenie dolne, nazywa się ograniczny z dołu. Mówimy, że zbiór jest ograniczony, gdy jest ograniczony z góry i z dołu.

Wygodnie jest przyjąć następującą dodatkową umowę, która w wielu sytuacjach jest naturalna: $ \sup A = +\infty $, gdy $ A $ nie jest ograniczony z góry, oraz $ \inf A = -\infty $, gdy $ A $ nie jest ograniczony z dołu. Ponadto,

\[ \sup\emptyset = -\infty, \qquad \inf\emptyset=+\infty, \]

gdzie symbol $ \emptyset $ oznacza zbiór pusty.

Podzbiory $ \R $

Wielokrotnie będziemy spotykać następujące podzbiory zbioru liczb rzeczywistych, skądinąd dobrze Czytelnikowi znane: zbiór liczb naturalnych,

\[ \N = \{1,2,3,4,5,\ldots\}, \]

zbiór liczb całkowitych (Symbol $ \Z $, na ogół nie używany w polskiej szkole, za to powszechnie używany przez matematyków na całym świecie, pochodzi od niemieckiego słowa Zahlen), liczby.,

\[ \Z = \{0, \pm 1, \pm 2, \pm 3, \pm 4, \ldots\} = \N \cup \{0\} \cup (-\N), \]

oraz zbiór liczb wymiernych

\[ \Q = \{p/q \ \colon \ p,q\in \Z, \ q\not=0\}\, . \]

O kluczowych własnościach zbioru $ \N $ i jednym z możliwych sposobów aksjomatycznego wprowadzenia tego zbioru opowiemy w następnym podrozdziale. Teraz sformułujemy twierdzenie, z którego wynika, że zbiór liczb wymiernych $ \Q $ jest istotnie mniejszy, niż zbiór liczb rzeczywistych. Zbiór $ \Q $, z naturalnymi działaniami ``na ułamkach'' i szkolną relacją mniejszości, spełnia wprawdzie (jak nietrudno sprawdzić, choć nie jest to zajęcie szczególnie pasjonujące) wszystkie aksjomaty ciała i porządku. Jednak $ \Q $ nie spełnia aksjomatu ciągłości: nie każdy ograniczony z góry zbiór liczb wymiernych ma kres górny, który jest liczbą wymierną.

Twierdzenie Zbiór liczb niewymiernych, $ \R\setminus\Q $, jest niepusty.

Dowód podamy już teraz, choć niektóre występujące w nim liczby nie zostały jeszcze w sposób ścisły zdefiniowane. Czytelnik zna je jednak pewnie ze szkoły, a ich ścisłe określenia pozna w ciągu najbliższych tygodni na wykładzie.      {\sc Dowód 1.} Wykażemy, że $ \sqrt{2} $ nie jest liczbą wymierną. Przypuśćmy na chwilę, że jest przeciwnie i $ \sqrt{2}=p/q $, gdzie $ p $ i $ q $ są całkowite, $ q\not= $. Ponieważ $ \sqrt 2 $ jest dodatni, więc możemy bez zmniejszenia ogólności założyć, że $ p $ i $ q $ są liczbami naturalnymi. Możemy także założyć, w razie potrzeby skracając licznik i mianownik ułamka $ p/q $, że $ p $ i $ q $ są względnie pierwsze, tzn. nie mają żadnego wspólnego dzielnika większego niż 1.

Jeśli $ \sqrt{2}=p/q $, to $ 2=p^2/q^2 $, a więc $ 2q^2=p^2 $. Liczby $ p^2 $ i $ 2q^2 $, zapisane w systemie dziesiątkowym, muszą więc mieć tę samą ostatnią cyfrę. Zbadajmy, jakie są wszystkie możliwości, wypisując ostatnią cyfrę każdej z liczb $ q $, $ q^2 $ i $ 2q^2 $ w tabelce:

 \begin{center} \begin{tabular}{r|l|l|l|l|l|l|l|l|l|l} $q \pmod {10}$     & 0 & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9\\   \hline $q^2 \pmod {10}$   & 0 & 1 & 4 & 9 & 6 & 5 & 6 & 9 & 4 & 1\\        \hline $2q^2 \pmod {10}$  & 0 & 2 & 8 & 8 & 2 & 0 & 2 & 8 & 8 & 2 \end{tabular}    \end{center} (Symbol $ k \pmod{10} $ oznacza resztę z dzielenia $ k $ przez $ 10 $, czyli właśnie ostatnią cyfrę liczby $ k $ w zapisie dziesiątkowym. Każdy, kto zna szkolny algorytm mnożenia pisemnego, może sam sprawdzić, dlaczego tabelka jest taka, a nie inna).

Ale ostatnia cyfra liczby $ p^2 $ musi być jedną z cyfr środkowego wiersza tej tabelki. I musi być taka sama, jak ostatnia cyfra $ 2q^2 $. Jedyna możliwość to

\[ p^2 \equiv 2q^2 \equiv 0 \pmod{10}. \]

Nietrudno jednak stwierdzić, że wtedy zarówno $ p $, jak i $ q $, dzielą się przez 5. Jest to sprzeczność, gdyż wiemy, że $ p $ i $ q $ nie mają wspólnych dzielników większych od 1. Uzyskana sprzeczność oznacza, że $ \sqrt 2 $ nie może być liczbą wymierną, co kończy dowód.      $ \Box $      {\sc Dowód (W pradawnych czasach Rzeczypospolitej Drugiej i Pół ten dowód poznawali wszyscy uczniowie ósmej klasy szkoły podstawowej.) 2.} Początek rozumowania jest taki sam, jak w pierwszym dowodzie. Zakładamy, że $ \sqrt 2 = p/q $ jest liczbą wymierną, gdzie $ p $ i $ q $ są naturalne i nie mają wspólnych dzielników większych od 1.

Jak wcześniej, z równości $ \sqrt 2=p/q $ wynika, że $ 2q^2=p^2 $. Dalszy ciąg rozumowania jest nieco inny. Lewa strona tej równości jest parzysta, więc prawa też. Skoro $ p^2 $ jest liczbą parzystą, to i $ p $ jest parzyste (gdyby bowiem $ p $ było nieparzyste, to $ p^2 $ także byłoby nieparzyste: przecież jeśli $ p=2k+1 $, to $ p^2=4k^2+4k+1 $). Zatem $ p=2k $ dla pewnego $ k $ naturalnego. W takim razie,

\[ 2q^2=p^2=(2k)^2=4k^2, \]

to zaś oznacza, że $ q^2=2k^2 $. Liczba $ q^2 $ jest więc parzysta. Zatem $ q $ jest liczbą parzystą, $ q=2l $ dla pewnego $ l $ naturalnego. Stwierdziliśmy więc, że $ p $ i $ q $ dzielą się przez 2, a to jest sprzeczność. Sprzeczność wzięła się z założenia, że $ \sqrt 2\in \Q $, więc ostatecznie $ \sqrt 2\not\in \Q $.      $ \Box $

     {\sc Dowód 3.} Wykażemy, że liczba $ x=\log 2 $ (gdzie logarytm bierzemy przy podstawie $ 10 $), czyli taka liczba dodatnia $ x $, która spełnia równość $ 10^x =2 $, nie jest wymierna. (Czytelnik być może uczył się o logarytmach w szkole; za kilka tygodni zobaczymy, jak zdefiniować logarytm w sposób ścisły.)

Przypuśćmy, że $ x=\log 2=p/q $, gdzie $ p $ i $ q $ są naturalne. Wtedy $ 10^{p/q}=2 $. Podnosząc obie strony do potęgi $ q $, dostaniemy $ 10^p=2^q $ dla pewnych $ p,q\in \N $. To jednak jest oczywista sprzeczność, gdyż jedna z tych liczb dzieli się przez $ 5 $, a druga nie.

Liczby naturalne i zasada indukcji zupełnej

Niech $ \mathcal{A} $ będzie rodziną wszystkich takich podzbiorów $ A\subset \R $, które spełniają jednocześnie dwa warunki:

  1. $ 1\in A $;
  2. Jeśli liczba rzeczywista $ x\in A $, to $ x+1\in A $.

Nietrudno sprawdzić, że np. zbiór wszystkich liczb rzeczywistych $ \R $, a także zbiór $ \R_+ $, należą do rodziny $ \mathcal{A} $. Nietrudno sobie także wyobrazić wiele - nieskończenie wiele! - innych zbiorów, należących do tej rodziny: bierzemy liczbę $ 1 $ i dowolną ``chmurkę'' punktów z przedziału $ (1,2) $, a następnie tworzymy sumę przesuniętych kopii takiego zbioru. Innymi słowy, bierzemy zbiór

\[ B\subset [1,2) \quad\mbox{taki, że $1\in B$,} \]

i kładziemy

\[ A= B\cup (1+B)\cup (2+B) \cup \ldots, \]

gdzie $ k+B=\{k+x\ \colon \ x\in B\} $.

Znany skądinąd zbiór liczb naturalnych można, uprawiając aksjomatyczną teorię liczb rzeczywistych, określić następująco.

Definicja $ \N=\{x\in \R\ \colon \ x\in A \mbox{ dla każdego zbioru } A\in \mathcal{A}\} $.

Inaczej mówiąc, zbiór liczb naturalnych to część wspólna wszystkich zbiorów należących do rodziny $ \mathcal{A} $.

Stwierdzenie Zbiór $ \N $ nie jest ograniczony z góry.

    Dowód. Liczba $ 1\in \N $, więc $ \N $ jest niepusty. Postawmy hipotezę, przeczącą tezie, tzn. przypuśćmy, że $ \N $ jest ograniczony z góry. Zgodnie z aksjomatem ciągłości, zbiór $ \N $ ma wtedy kres górny $ b=\sup\N\in \R $.

Z definicji kresu, $ b\ge n $ dla każdego $ n\in \N $. Z drugiej własności wszystkich zbiorów rodziny $ \mathcal{A} $ wynika, że $ b\ge n+1 $ dla wszystkich $ n\in \N $. Stąd jednak $ b-1\ge n $ dla wszystkich $ n\in \N $, więc $ b-1 $ jest ograniczeniem górnym $ \N $. Ponownie korzystając z definicji kresu górnego - z drugiego podanego w niej warunku - stwierdzamy, że

\[ b-1\ge \sup \N = b, \]

a zatem $ -1 \ge 0 $, czyli $ 0\ge 1 $. To jest sprzeczność, więc przyjęta hipoteza musiała być fałszywa. Zbiór $ \N $ nie jest zatem ograniczony z góry.      $ \Box $

Wniosek [aksjomat Archimedesa] Dla dowolnych liczb dodatnich $ a,b\in \R $ istnieje taka liczba naturalna $ n $, że $ an>b $.

    Dowód. Gdyby $ an\le b $ dla wszystkich $ n\in \N $, to liczba $ b/a $ byłaby ograniczeniem górnym $ \N $. Wiemy już jednak, że zbiór $ \N $ nie jest ograniczony z góry.      $ \Box $

Omówimy teraz ważną metodę dowodzenia twierdzeń o liczbach naturalnych, tak zwaną zasadę indukcji matematycznej (zwaną także zasadą indukcji zupełnej).

Twierdzenie Przypuśćmy, że pewna własność $ W $ przysługuje pewnym liczbom naturalnym, przy czym spełnione są dwa warunki:

  1. $ W(1) $, tzn. własność $ W $ przysługuje liczbie $ 1 $;
  2. Jeśli $ W(n) $, to także $ W(n+1) $.

Wówczas własność $ W $ przysługuje wszystkim liczbom naturalnym.

    Dowód. Niech $ A $ będzie zbiorem wszystkich tych liczb naturalnych, którym przysługuje własność $ W $, tzn.

\[ A=\{n\in \N \ \colon\ W(n)\}\, . \]

Oczywiście $ A\subset \N $. Pokażemy teraz, że $ A $ należy do rodziny $ \mathcal{A} $.

Z założenia (i) mamy $ 1\in A $, tzn. spełniony jest pierwszy z warunków z definicji rodziny $ \mathcal{A} $. Ponadto, jeśli $ x\in A $, to zachodzi $ W(x) $, więc na mocy założenia (ii) zachodzi także $ W(x+1) $, a to znaczy, że $ x+1\in A $. Spełniony jest więc również drugi warunek z definicji rodziny $ \mathcal{A} $.

Zatem $ A\in \mathcal{A} $. Ponieważ $ \N $ jest częścią wspólną wszystkich zbiorów rodziny $ \mathcal{A} $, więc $ \N\subset A $.

Otrzymaliśmy więc dwie inkluzje: $ A\subset \N $ i $ \N \subset A $. To oznacza, że $ A=\N $.      $ \Box $

Spójrzmy teraz na przykłady zastosowań zasady indukcji zupełnej w konkretnych dowodach. Pierwszy z nich będzie bardzo prosty, dwa pozostałe - wyraźnie trudniejsze.

Stwierdzenie [nierówność Bernoulliego] Dla każdej liczby rzeczywistej $ a\ge -1 $ i dla każdej liczby $ n\in \N $ zachodzi nierówność

\[ 	(1+a)^n\ge 1+na\, . 	\]

    Dowód. Ustalmy dowolne $ a\ge -1 $.

     Etap 1 (baza indukcji). Sprawdzamy, co się dzieje dla $ n=1 $. Zarówno lewa, jak i prawa strona są wtedy równe $ 1+a $, więc nierówność Bernoulliego zachodzi dla $ n=1 $.

     Etap 2 (krok indukcyjny). Załóżmy, że $ (1+a)^n\ge 1+na $. Wykażemy, że wtedy $ (1+a)^{n+1}\ge 1+(n+1)a $.

Z aksjomatu N.3(b) i własności $ x\cdot 0=0 $ wynika, że obie strony nierówności nieostrej wolno pomnożyć przez liczbę nieujemną. Ponieważ $ 1+a\ge 0 $, więc z założenia indukcyjnego otrzymujemy

\[ \begin{eqnarray*} 	(1+a)^{n+1}=(1+a)^n(1+a) &\ge & (1+na) (1+a) \\ 	& = & 1+ na + a + na^2 \\ 	& \ge & 1 + na + a \qquad\mbox{gdyż $na^2\ge 0$ dla wszystkich $n$ i $a$} \\ 	&= & 1 + (n+1)a. \end{eqnarray*} \]

     Etap 3 (konkluzja). Stwierdziliśmy, że nierówność Bernoulliego zachodzi dla liczby $ n=1 $, a także, że jeśli zachodzi dla liczby $ n $, to zachodzi i dla $ n+1 $. Zatem, zgodnie z zasadą indukcji zupełnej, nierówność Bernoulli'ego zachodzi dla każdej liczby naturalnej $ n $. Teza stwierdzenia wynika z dowolności $ a\ge -1 $.      $ \Box $

    Uwaga. Proszę sprawdzić, że równość w nierówności Bernoulliego zachodzi wtedy i tylko wtedy, gdy $ n=1 $ lub $ a=0 $.

Dla potrzeb drugiego przykładu zdefiniujemy najpierw średnią arytmetyczną i geometryczną $ n $ liczb rzeczywistych nieujemnych. Jeśli $ a_1,a_2,\ldots a_n\ge 0 $, to kładziemy

\[ A_n = \frac{a_1+a_2+\cdots+a_n}n, \qquad G_n=\sqrt[n]{a_1a_2\ldots a_n} = (a_1a_2\ldots a_n)^{1/n}\, . \]

$ A_n $ to średnia arytmetyczna liczb $ a_1,\ldots,a_n $ (tu założenie o nieujemności nie jest potrzebne; definicja średniej arytmetycznej ma sens dla dowolnych liczb rzeczywistych, niekoniecznie nieujemnych), natomiast $ G_n $ jest średnią geometryczną liczb nieujemnych $ a_1,\ldots, a_n $.

(Pierwiastki dowolnego stopnia z liczb nieujemnych zdefiniujemy ściśle po omówieniu przykładów dowodów indukcyjnych. Teraz wystarczy nam wiedza, że $ \sqrt[n]0=0 $, a dla $ x> 0 $ liczba $ y=\sqrt[n] x $ jest dodatnia i ma tę własność, że $ y^n=x $).

Twierdzenie [nierówność między średnimi] Dla każdej liczby $ n\in \N $ i dowolnych nieujemnych liczb rzeczywistych $ a_1,a_2,\ldots, a_n $ zachodzi nierówność

\[ A_n = \frac{a_1+a_2+\cdots+a_n}n\ge   (a_1a_2\ldots a_n)^{1/n} = G_n\, . \]

    Dowód. Wystarczy rozważyć przypadek nietrywialny, gdy wszystkie $ a_i $ są dodatnie. (Gdy choćby jedna z liczb $ a_i $ jest zerem, to oczywiście $ G_n=0\le A_n $).

     Baza indukcji. Dla $ n=1 $ mamy jedną liczbę nieujemną $ a_1 $. Teza jest prawdziwa, gdyż wtedy $ A_1=a_1=G_1 $.

     Krok indukcyjny. Załóżmy, że dla pewnego $ m $ naturalnego nierówność

\[ \frac{b_1+\cdots+b_m}{m}\ge (b_1\ldots b_m)^{1/m} \]

zachodzi dla dowolnych liczb rzeczywistych dodatnich $ b_1,b_2,\ldots, b_m $. Wykażemy, że przy takim założeniu dla dowolnych liczb dodatnich $ a_1,a_2,\ldots, a_m, a_{m+1} $ jest $ A_{m+1}\ge G_{m+1} $.

Będziemy dowodzić równoważnej nierówności $ A_{m+1}^{m+1}\ge G_{m+1}^{m+1} $. Skorzystamy z nierówności Bernoulliego, ale nie zrobimy tego od razu.

Z uwagi na przemienność dodawania i mnożenia mamy prawo założyć, że $ 0<a_1\le a_2\le \ldots \le a_m \le a_{m+1} $. Wtedy, ponieważ średnia arytmetyczna $ m $ składników nie przekracza największego z tych składników, mamy

\[ \begin{equation} 	\label{pre-B} A_m = \frac{a_1+\cdots+a_m}m\le \frac {ma_m}m = a_m \le a_{m+1}\, . \end{equation} \]

Zapiszmy teraz średnią $ A_{m+1} $ w nieco innej postaci:

\[ \begin{eqnarray*} 	A_{m+1}& = & \frac{mA_m+a_{m+1}}{m+1} \\ 	       & = & A_m + \frac{a_{m+1}-A_m}{m+1}, \qquad \mbox{gdyż $\frac{m}{m+1}=1-\frac {1}{m+1}$,} \\ 	       & = & A_m\biggl(\, 1+\underbrace{\frac{a_{m+1}-A_m}{(m+1)A_m}}_a\, \biggr) 	\end{eqnarray*} \]

(wypisując ostatnią linijkę, po prostu wyłączyliśmy $ A_m $ przed nawias).

Z nierówności pre-B wynika, że

\[ a=\frac{a_{m+1}-A_m}{(m+1)A_m} \ge 0\ge -1, \]

a to znaczy, że nierówność Bernoulliego można stosować do szacowania potęg sumy $ (1+a) $ z dołu. Piszemy teraz

\[ \begin{eqnarray*} A_{m+1}^{m+1} & \ge & A_m^{m+1}(1+a)^{m+1} \\ & \ge & A_m^{m+1} (1+(m+1)a) \qquad\mbox{(tu użyliśmy nierówności Bernoulliego)} \\ & = & A_m^{m+1} \left(1 + \frac{a_{m+1}-A_m}{A_m}\right) = A_m^m a_{m+1} \\ & \ge & G_m^m a_{m+1} \qquad\mbox{(tu użyliśmy założenia indukcyjnego)}\\ & = & (a_1a_2\ldots a_{m})a_{m+1}= G_{m+1}^{m+1}. \end{eqnarray*} \]

Zatem, $ A_{m+1}\ge G_{m+1} $. Stąd, na mocy zasady indukcji zupełnej, wynika już teza twierdzenia.      $ \Box $

    Uwaga. Czytelnik może się zastanawiać: skąd było wiadomo, że aby wykazać nierówność między średnimi, trzeba rozumować akurat tak? Na takie pytania często nie ma łatwych odpowiedzi. Tu akurat można było zauważyć, że dla dużych $ a_1=a_2=\ldots  $ lewa strona nierówności $ A_m^m\ge G_m^m $ rośnie wykładniczo wraz z $ m $ i spróbować szacowania (z dołu) czegoś rosnącego wykładniczo przez coś, co rośnie zaledwie liniowo - do tego służy nierówność Bernoulliego. Reszta powyższego dowodu polega na stosunkowo prostych przekształceniach, potrzebnych, by $ A_{m+1}^{m+1} $ przekształcić do odpowiedniej postaci.

Podamy teraz drugi dowód nierówności między średnimi, po to, żeby zilustrować, że rozumowania indukcyjne mogą mieć bardzo różny charakter. Dla zobrazowania zasady indukcji zupełnej używa się często porównania z kostkami domina: jeśli wiadomo, że kostki domina są ustawione w rzędzie, na tyle blisko, że każda z nich, upadając, przewróci następną, to przewrócenie pierwszej kostki spowoduje przewrócenie wszystkich. W następnym dowodzie ustawienie kostek będzie bardzo fantazyjne: takie, że dla każdego $ n $ kostka $ n $-ta przewraca kostkę o numerze $ 2n $, a kostka $ k $-ta przewraca kostkę z numerem $ (k-1) $.

    Dowód. Jak wcześniej, założymy, że wszystkie $ a_i $ są dodatnie. Dowód ma trzy cześci.

Po pierwsze, sprawdzamy, że $ A_1\ge G_1 $ (to oczywiste) i $ A_2\ge G_2 $. Druga nierówność jest równoważna innej, $ (\sqrt{a_1}-\sqrt{a_2})^2\ge 0 $.

  Po drugie, wykażemy, że jeśli nierówność między średnimi zachodzi dla dowolnych liczb $ b_1,\ldots, b_n >0  $, to zachodzi także dla dowolnych liczb $ a_1,\ldots, a_{2n}>0 $. Istotnie, korzystając najpierw (dwukrotnie) z nierówności między średnimi dla $ n $ liczb, a potem z nierówności $ A_2\ge G_2 $, otrzymujemy

\[ \begin{eqnarray*} 	A_{2n} & = &\frac 12\left( {\displaystyle\frac{a_1+\cdots +a_n}n + \displaystyle\frac{a_{n+1}+\cdots +a_{2n}}n} \right)\\ 	&\ge & \frac{(a_1\ldots a_n)^{1/n}+(a_{n+1}\ldots a_{2n})^{1/n}}2 \\ 	& \ge & \sqrt{(a_1\ldots a_n)^{1/n}(a_{n+1}\ldots a_{2n})^{1/n}} \\ 	& = & G_{2n}. \end{eqnarray*} \]

(Komentarz: teraz wiemy, że nierówność między średnimi zachodzi dla $ n $ liczb, gdy $ n\in \{1,2,4,8,16,\ldots\} $. Te wartości $ n $ stanowią zdobyte przyczółki.)

  Po trzecie, dowodzimy, że jeśli nierówność między średnimi zachodzi dla $ n+1 $ liczb dodatnich, to zachodzi także dla $ n $ liczb dodatnich. Piszemy

\[ \begin{eqnarray*} A_n & = & \frac{n}{n+1}A_n + \frac 1{n+1}A_{n} \\ & = & \frac{a_1+a_2+\cdots+ a_n + A_n}{n+1} \qquad\mbox{w liczniku jest $n+1$ liczb}\\ & \ge & (a_1\cdot\ldots \cdot a_n\cdot A_n)^{1/(n+1)}, \qquad\mbox{z nierówności dla $n+1$ liczb,} \\ & = & G_n^{n/(n+1)}A_n^{1/{n+1}}. \end{eqnarray*} \]

Dzielimy obie strony przez $ A_n^{1/{n+1}} $, podnosimy do potęgi $ (n+1) $ i otrzymujemy $ A_n^n\ge G_n^n $.

(Komentarz: teraz wiemy, że z każdego zdobytego wcześniej przyczółka, tzn. od każdej z wartości $ n=1,2,4,8,16,\ldots $, można cofać się jednostkowymi krokami.)

Z trzech części dowodu wynika już teza twierdzenia.      $ \Box $

Zadanie Analizując wybrany dowód nierówności między średnimi, wykazać, że $ A_n=G_n $ wtedy i tylko wtedy, gdy $ n=1 $ lub $ a_1=a_2=\ldots = a_n $.

Pierwiastki $ n $-tego stopnia

Posługiwaliśmy się już pierwiastkami $ n $-tego stopnia z liczb nieujemnych. Aby mieć pewność, że wolno było tak postępować, udowodnimy następujące twierdzenie.

Twierdzenie (#) Dla każdej liczby $ a\ge 0 $ i każdego $ n\in \N $ istnieje dokładnie jedna liczba $ b\ge 0 $ taka, że $ b^n=a $.

Dowód twierdzenia poprzedzimy sformułowaniem pomocniczego faktu.

Lemat [wzór na różnicę $ n $-tych potęg] (#) Dla każdej liczby naturalnej $ n\ge 2 $ i wszystkich $ x,y\in \R $ zachodzi równość

\[ \begin{equation} 		\label{xn-yn} 		x^n-y^n=(x-y)(x^{n-1}+x^{n-2}y+\cdots + xy^{n-2}+y^{n-1})\, . 	\end{equation} \]

    Szkic dowodu. To jest nieznacznie przekształcony wzór na sumę skończonego postępu geometrycznego. Gdy $ y=0 $, nie ma czego dowodzić; obie strony są równe $ x^n $. Jeśli $ y\not=0 $, to dzieląc obie strony xn-yn przez $ y^n $ i kładąc $ q=x/y $, otrzymujemy równoważny tezie lematu wzór

\[ q^n-1 = (q-1)(q^{n-1}+q^{n-2}+\cdots +q^2+1)\, . \]

Nietrudno jest udowodnić go przez indukcję. Można także po prostu ``otworzyć nawiasy'' i zaobserwować, że prawa strona jest równa

\[ q^n + {}\underbrace{(- q^{n-1}) + q^{n-1}}_{=0} + {}\underbrace{(- q^{n-2}) + q^{n-2}}_{=0} + \cdots + \underbrace{(-q)+q}_{=0} - 1, \]

czyli po prostu $ q^n-1 $, gdyż każda ze wskazanych par składników ma sumę zero.

    Dowód Twierdzenia [link] Zaczniemy od wykazania jednoznaczności pierwiastków $ n $-tego stopnia. Gdyby dla pewnego $ a\ge 0 $ było $ b^n=b_1^n=a $, gdzie $ b,b_1\ge 0 $, to byłoby wtedy

\[ 0=b^n-b_1^n=(b-b_1)(\underbrace{b^{n-1}+b^{n-2}b_1+\cdots+b_1^n}_{=\text{(ozn.)\ } M}) \]

Zatem, $ b-b_1=0 $ lub $ M=0 $ (jeden z czynników musi znikać). W pierwszym przypadku mamy $ b=b_1 $. W drugim przypadku, ponieważ $ b,b_1\ge 0 $, liczba $ M $ jest sumą $ n $ nieujemnych składników. Równość $ M=0 $ może zachodzić jedynie wtedy, gdy każdy z tych składników jest zerem, czyli jedynie wtedy, gdy $ b=b_1=0 $.

W obu przypadkach mamy więc $ b=b_1 $. Dla każdego $ a\ge 0 $ istnieje zatem co najwyżej jedna liczba $ b\ge 0 $ taka, że $ b^n=a $.

Teraz zajmiemy się istnieniem. Dla $ a=1 $ wystarczy wziąć $ b=1 $, a dla $ a=0 $ - $ b=0 $. Jeśli już udowodnimy twierdzenie dla wszystkich liczb $ a>1 $, to dla $ a\in (0,1) $ będzie można postąpić następująco: jeśli $ a\in (0,1) $, to $ a^{-1}>1 $, więc istnieje pierwiastek $ n $-tego stopnia z $ a^{-1} $, tzn. liczba $ b_1 $ taka, że $ b_1^n=a^{-1} $. Wtedy jednak liczba $ b=b_1^{-1} $ spełnia równość

\[ b^n= \left(b_1^{-1}\right)^n = (b_1^n)^{-1} = (a^{-1})^{-1} = a, \]

tzn. jest pierwiastkiem $ n $-tego stopnia z $ a $.

Wystarczy więc rozważyć przypadek $ a>1 $. Tym się teraz zajmiemy. Niech

\[ S=\{x\in \R\ \colon \ x^n \le a\}\, . \]

Jeśli $ x\in S $, to $ x\le a $, bowiem w przeciwnym przypadku mielibyśmy $ x^n>a^n > a> 1 $, a to jest sprzeczność z definicją zbioru $ S $. Liczba $ a $ jest więc ograniczeniem górnym zbioru $ S $, a ponadto $ 1\in S $, bo $ 1=1^n<a $.

Z aksjomatu ciągłości wynika, że zbiór $ S $ ma kres górny $ b=\sup S $. Musi zachodzić jeden z trzech przypadków,

\[ b^n < a, \qquad b^n > a, \qquad b^n= a. \]

Pokażemy, że pierwsza i druga możliwość prowadzą do sprzeczności.

Przypuśćmy, że $ b^n<a $. Rozważmy liczbę $ b+\eps $; niewielką liczbę dodatnią $ \eps\in (0,a) $ dobierzemy za chwilę. Z lematu otrzymujemy

\[ \begin{eqnarray*} 	(b+\eps)^n-b^n & = & \eps \left((b+\eps)^{n-1}+(b+\eps)^{n-2}b+\cdots + b^{n-1}\right) \\ 	& < &  \eps\cdot n(b+a)^{n-1} \end{eqnarray*} \]

(każdy z $ n $ składników w nawiasie szacujemy z góry przez $ (b+a)^{n-1} $). Biorąc dowolną liczbę

\[ 0<\eps < \frac{a-b^n}{n(b+a)^{n-1}}\, , \]

przekonujemy się, że $ (b+\eps)^n-b^n< a-b^n $, tzn. $ (b+\eps)^n < a $, a więc $ b+\eps\in S $. Stąd $ b+\eps\le \sup S=b $, czyli $ \eps\le 0 $, sprzeczność.

Przypuśćmy zatem, że $ b^n>a $. Rozważając tym razem $ b-\delta $, gdzie $ \delta $ jest małą liczbą dodatnią, otrzymujemy, ponownie stosując Lemat,

\[ b^n-(b-\delta)^n=\delta\left(b^{n-1}+b^{n-2}(b-\delta)+\cdots+(b-\delta)^{n-1}\right) < \delta\cdot n b^{n-1} < b^n-a, \]

o ile tylko $ 0<\delta< (b^n-a)/nb^{n-1} $ (wtedy mamy prawo napisać ostatnią nierówność). To jednak oznacza, że

\[ (b-\delta)^n > a. \]

Z definicji zbioru $ S $ mamy więc $ (b-\delta)^n> x^n $ dla każdego $ x\in S $, czyli $ b-\delta\ge \sup S=b $. Stąd $ -\delta\ge 0 $, jednak liczbę $ \delta $ wybraliśmy wcześniej dodatnią! Ta sprzeczność oznacza, że przypadek $ b^n>a $ także nie może zachodzić.

 

Została tylko jedna możliwość: $ b^n=a $.      $ \Box $

    Uwaga. Wygodnie jest przyjąć następującą dodatkową umowę: jeśli $ a<0 $, natomiast $ n=2k+1 $ jest liczbą naturalną nieparzystą, to kładziemy

\[ a^{1/n} = -(-a)^{1/n}. \]

Wtedy rzeczywiście $ (a^{1/n})^n=a $, co wynika z przemienności mnożenia i stąd, że $ (-1)^n=(-1)^{2k+1}=-1 $. Nietrudno zauważyć, że dla $ n=2k $ analogiczna umowa nie miałaby sensu: parzysta potęga liczby rzeczywistej $ b $, $ b^{2k}=(b^k)^2 $ jest nieujemna, co wynika z własności (W [link]), patrz strona~\pageref{wlasostR}.

Liczby całkowite. Entier. Gęstość zbioru liczb wymiernych i niewymiernych

Jak już wiemy, zbiór liczb całkowitych jest określony następująco

\[ \Z = \{0, \pm 1, \pm 2, \pm 3, \pm 4, \ldots\} = \N \cup \{0\} \cup (-\N). \]

Przytoczymy bez dowodu dwa twierdzenia, opisujące własności zbioru $ \Z $.

Twierdzenie Jeśli $ k\in \Z $, to w przedziale otwartym $ (k,k+1) $ nie ma żadnej liczby całkowitej, tzn. $ (k,k+1)\cap \Z=\emptyset $.
Twierdzenie (#) Jeśli zbiór niepusty $ A\subset \Z  $ jest ograniczony z góry (odpowiednio: z dołu), to w $ A $ istnieje element największy (odpowiednio: najmniejszy).

Każde z tych twierdzeń (Nawiasem: ze szkolnego, a także zdroworozsądkowego punktu widzenia oba twierdzenia są, praktycznie biorąc, oczywiste - tzn. wyrażają nasze bardzo naturalne intuicje związane z wyglądem) zbioru liczb całkowitych. można sprowadzić do odpowiednich własności zbioru liczb naturalnych, których dowodzi się, stosując zasadę indukcji zupełnej. Nie będziemy tego robić; szczegóły pozostawiamy zainteresowanemu Czytelnikowi.

Definicja [Entier, czyli część całkowita liczby rzeczywistej] Dla każdej liczby $ x\in \R $ określamy

\[ \begin{equation} 	\label{entier} 	[x]=\sup\{ k\in \Z\ \colon\ k\le x\}\, . \end{equation} \]

Zatem, na przykład, $ [7]=7=-[-7] $, $ [\frac 13]=0 $, $ [\sqrt 2]=1 $, ale $ [-\sqrt 2] = -2 $, gdyż największą liczbą całkowitą nie przekraczającą $ -1,\! 4142\ldots=-\sqrt{2} $ jest właśnie $ -2. $

Stwierdzenie Dla każdego $ x\in \R $ liczba $ [x] $ jest całkowita i spełnia nierówności

\[ \begin{equation} 		\label{entierxx1} 		[x]\le x< [x]+1\, . 	\end{equation} \]

    Dowód. Odpowiednie własności $ [x] $ widać na załączonym rysunku.

entier-wykres.png {\footnotesize\baselineskip 11pt

Funkcja entier i funkcja $ f(x)=x $. Lewy koniec każdego z poziomych odcinków wykresu $ [x] $ należy do tego wykresu, a prawy - nie.

}

Oto niedługi dowód, dla zainteresowanych formalizacją. To, że $ [x]\in \Z $, wynika z definicji cześci całkowitej i własności zbioru $ \Z $, wyrażonej w Twierdzeniu~ [link]: zbiór

$$K=\{k\in \Z\ \colon k\le x\}$$

jest ograniczony z góry przez $ x $, a liczba $ [x] $ jest największym elementem $ K $. Mamy $ [x]\le x $ wprost z definicji supremum. Gdyby $ [x]+1\le x $, to byłoby

\[ \sup K = [x] < [x]+1\in K, \]

a to jest sprzeczność z definicją supremum.      $ \Box $     

Wiemy już zatem (z grubsza), co to są liczby rzeczywiste, naturalne, całkowite i wymierne. Wiemy też, że istnieją liczby niewymierne; jedną z nich jest $ \sqrt 2 $. Sformułujmy jeszcze jedną ważną własność, którą ma zarówno zbiór $ \Q $ liczb wymiernych, jak i zbiór $ \R\setminus \Q $ liczb niewymiernych.

Definicja Zbiór $ A\subset \R $ nazywa się gęsty, jeśli dla wszystkich $ x,y\in\R $, $ x<y $, istnieje element $ a\in A $ taki, że $ x<a<y $.
Twierdzenie Zarówno zbiór $ \Q $ liczb wymiernych, jak i zbiór $ \R\setminus\Q $ liczb niewymiernych, są gęste w $ \R $.(#)

Mówiąc inaczej, w każdym przedziale otwartym prostej rzeczywistej jest jakaś liczba wymierna i jakaś liczba niewymierna.

    Dowód. Ustalmy dowolne $ x,y\in\R $ takie, że $ x<y $. Najpierw wskażemy liczbę wymierną $ w $, która należy do przedziału $ (x,y) $.

Wiemy, że $ [nx]\le nx < [nx]+1 $ dla każdego $ n\in\N $. Stąd

\[ \frac{[nx]}n \le x < \frac{[nx]}n +\frac 1n =: w\, . \]

Ponieważ $ [nx]\in \Z $, więc $ w\in \Q $. Pozostaje dobrać $ n $ tak, żeby $ w<y $, ale to nietrudne: mamy $ [nx]/n\le x $, a zatem

\[ w=  \frac{[nx]}n +\frac 1n \le x+\frac 1n\, . \]

Wystarczy więc, gdy $ x+\frac 1n<y $, a tak jest dla dowolnej liczby $ n>1/(y-x) $ (proszę zauważyć, że korzystamy tu z dwóch faktów: $ y-x>0 $, więc $ 1/(y-x)>0 $, a ponadto zachodzi aksjomat Archimedesa).

    Uwaga. Ta część dowodu wyraża prostą intuicję: jeśli wyruszamy z punktu $ 0\in\R $ i idziemy krokami długości $ 1/n $, to stąpamy tylko po liczbach wymiernych i nie możemy ominąć żadnej ``dziury'' dłuższej niż $ 1/n $.

Teraz wskażemy liczbę niewymierną $ z $ taką, że $ x<w<z<y $. Połóżmy

\[ z=w+\frac{\sqrt{2}}m, \qquad\mbox{gdzie $m\in \N$.} \]

Dla każdego $ m\in\N $ mamy $ z>w $ (to oczywiste), a ponadto $ z\not\in \Q $, bowiem w przeciwnym przypadku mielibyśmy $ \sqrt 2 = m(z-w)\in \Q $, a wiemy, że $ \sqrt 2 $ jest niewymierny. Pozostaje tylko dobrać $ m $ tak, żeby $ z<y $, ale to nietrudne: ponieważ $ w<y $, więc $ z<y $ wtedy i tylko wtedy, gdy $ \sqrt 2 /(y-w)<m $. Bierzemy więc jako $ m $ dowolną liczbę naturalną, która jest większa od $ \sqrt 2/ (y-w) $.      $ \Box $

    Uwaga. Z Twierdzenia~ [link] wynika, że w każdym przedziale otwartym prostej rzeczywistej jest nieskończenie wiele liczb wymiernych i nieskończenie wiele liczb niewymiernych (Czytelnik zechce się zastanowić, dlaczego tak jest). W istocie, jeśli $ A\subset \R $ jest dowolnym zbiorem gęstym, to do każdego przedziału otwartego należy nieskończenie wiele elementów zbioru $ A $.

Na zakończenie tej partii wykładu podamy jeszcze jeden dowód istnienia liczb niewymiernych - dowód Dedekinda niewymierności pierwiastków niecałkowitych. To ilustracja, jak wiele można wywnioskować z najprostszych reguł arytmetyki i jednej własności zbioru $ \N $: w każdym niepustym zbiorze $ A\subset \N $ istnieje element najmniejszy.

Twierdzenie Jeśli $ n,k\in \N $ i $ k\ge 2 $, to $ x=n^{1/k} $ jest albo liczbą naturalną, albo liczbą niewymierną.

    Dowód. Aby lepiej zilustrować najważniejszy pomysł dowodu, rozpatrzymy najpierw przypadek $ k=2 $.

Przypuśćmy, że $ 0<x=\sqrt n\not \in \N $, ale jednak $ x\in \Q $. Wtedy zbiór

\[ A=\{m\in \N\ \colon\ mx\in \N\} \]

jest niepusty; to wynika wprost z definicji zbioru liczb wymiernych $ \Q $. Niech $ m_0 $ będzie najmniejszym elementem $ A $; wtedy oczywiście $ m_0x = l\in \N $.

Połóżmy $ m_1=m_0(x-[x]) $. Z nierówności $ 0<x-[x]<1 $ (pamiętajmy: $ x $ nie jest liczbą całkowitą) wynika, że $ 0<m_1<m_0 $. Ponadto,

\[ m_1=m_0x-m_0[x] = l - m_0[x] \in \Z\, , \]

a więc $ m_1 $ jest liczbą naturalną, bo $ m_1>0 $. Wreszcie, mamy

\[ 0< m_1x=m_0x^2-m_0x[x]=m_0n -l[x] \in \Z\, , \]

a więc liczba $ m_1x $ też jest naturalna. To oznacza, że $ m_1\in A $ i $ m_1<m_0 $, a przy tym $ m_0 $ jest najmniejszym elementem w zbiorze $ A $. Otrzymaliśmy sprzeczność, która oznacza, że $ x=\sqrt n $ nie może być liczbą wymierną. To kończy dowód twierdzenia w przypadku $ k=2 $.

 

Pokażemy teraz, jak rozważyć przypadek ogólny. Załóżmy, że $ x=n^{1/k}\not\in \N $. Przypuśćmy, że $ x\in \Q $; pokażemy, że to założenie prowadzi do sprzeczności. Niech

\[ B=\{ s\in \N\ \colon \ x^s\in \N\}\, . \]

Zbiór $ B\subset \N $ jest niepusty ($ k\in B $, bowiem $ x^k=n $), więc zawiera element najmniejszy $ s_0 $; przy tym $ s_0>1 $, gdyż $ 1\not\in B $. Oznaczmy

\[ \begin{equation} 	\label{xs0n0} 	x^{s_0}=n_0\, . \end{equation} \]

Rozważmy zbiór

\[ A=\{m\in \N\ \colon\ \mbox{wszystkie liczby } mx, mx^2, \ldots, mx^{s_0-1}\mbox{ są naturalne}\}. \]

Jest to zbiór niepusty, gdyż $ x, x^2,\ldots, x^{s_0-1} $ są liczbami wymiernymi. Niech $ m_0 $ będzie najmniejszym elementem zbioru $ A $. Dla wygody oznaczmy

\[ m_0x=l_1\in \N, \quad m_0x^2=l_2\in \N, \quad\ldots, \quad m_0x^{s_0-1}=l_{s_0-1}\in \N\, . \]

Ponieważ $ s_0 $ to najmniejszy element zbioru $ B $, więc

\[ 0< \eps:=x^{s_0-1}-\left[x^{s_0-1}\right] < 1 \]

(liczba $ x^{s_0-1} $ nie jest naturalna, gdyż wtedy $ s_0-1 $ należałoby do $ B $). Połóżmy $ m_1=\eps m_0 $. Wtedy $ 0<m_1<m_0 $. Ponadto,

\[ 0<m_1= m_0\eps= m_0x^{s_0-1}- m_0\left[x^{s_0-1}\right] = l_{s_0-1}- m_0\left[x^{s_0-1}\right] \in \Z\, , \]

więc $ m_1 $ jest liczbą naturalną. Wreszcie, nietrudno sprawdzić, że

\[ m_1x\in \N, \quad m_1x^2\in \N, \quad\ldots, \quad m_1x^{s_0-1}\in \N\, . \]

Istotnie, niech $ j $ będzie dowolną z liczb $ 1,2,\ldots,s_0-1 $. Wtedy

\[ \begin{eqnarray*} m_1x^j = m_0\eps x^j & = & m_0x^{j-1}x^{s_0} - m_0x^j \left[x^{s_0-1}\right] \\ & \stackrel{\eqref{xs0n0}}= & m_0x^{j-1}n_0 - l_j \left[x^{s_0-1}\right] \\ & = &  \left\{ \begin{array}{ll} m_0n_0 - l_1 \left[x^{s_0-1}\right]  \qquad &\mbox{gdy $j=1$,}\\ l_{j-1}n_0 - l_j \left[x^{s_0-1}\right] \quad &\mbox{gdy $j>1$,} \end{array} \right. \end{eqnarray*} \]

a więc $ m_1x^j $ jest liczbą całkowitą. Do tego oczywiście $ m_1x^j>0 $, więc $ m_1x^j $ jest liczbą naturalną. Zatem, z definicji zbioru $ A $ i dowolności $ j $, liczba $ m_1\in A $.

Otrzymaliśmy więc

\[ m_0=\inf A > m_1 \in A\, . \]

Jest to sprzeczność, która kończy dowód.      $ \Box $

Ktoś, komu powyższy dowód wydaje się nie tylko pomysłowy, ale i trudny, powinien pamiętać, że o niewymierności $ \sqrt 2 $ wiadomo od dwóch i pół tysiąca lat, a Dedekind swój artykuł Was sind und was sollen die Zahlen? publikował, jako pięćdziesięcioparolatek, w roku 1888.

Nie należy się dziwić, jeśli nie rozumiemy w ciągu pół godziny czegoś, na co inni potrzebowali wielu lat.

Ciągi. Pojęcie granicy ciągu.

Definicja Ciąg jest to funkcja określona na zbiorze liczb naturalnych.

Będziemy rozważać ciągi o wyrazach rzeczywistych, czyli - zgodnie z powyższą definicją - funkcje $ a\colon \N\to\R $. Wartości takiej funkcji w kolejnych liczbach naturalnych nazywa się wyrazami ciągu i oznacza

\[ a_1, \quad a_2, \quad a_3, \quad \ldots \]

Zarówno na wykładzie, jak i na ćwiczeniach spotkamy wielokrotnie ciągi zdefiniowane w różny sposób: przez podanie ogólnego wzoru na $ n $-ty wyraz, np. $ a_n=1/n $ dla $ n\in\N $, albo przez określenie rekurencyjnej reguły, która pozwala obliczyć następny wyraz ciągu, gdy znane są wyrazy o wcześniejszych numerach, np.

\[ F_1=F_2=1, \qquad F_{n+2}=F_{n+1}+F_n \quad\mbox{dla $n=0,1,2,\ldots$} \]

(nawiasem: ciąg $ (F_n) $ nazywa się ciągiem Fibonacci'ego).

Ciągi służą matematykowi m.in. do tego, żeby nowe, nieznane jeszcze liczby rzeczywiste przybliżać liczbami prostszymi, już oswojonymi - np. liczbami wymiernymi. Bywa i na odwrót: znamy jakiś ciąg liczb, wyrażony skomplikowanym wzorem lub regułą, a chcemy powiedzieć coś względnie prostego i jasnego o zachowaniu dalekich wyrazów ciągu. Aby robić jedno i drugie w sposób możliwie ścisły, wprowadza się fundamentalne w całej Analizie pojęcie granicy ciągu. Zanim je wprowadzimy, przypomnijmy definicję wartości bezwzględnej.

Definicja [wartość bezwględna liczby rzeczywistej] Dla $ x\in\R $ kładziemy

\[ 	|x|=\left\{ 	\begin{array}{rl} 	x,  &\quad\mbox{gdy $x\ge 0$,}\\ 	-x, &\quad\mbox{gdy $x< 0$.} 	\end{array} 	\right. 	\]

Interpretacja wartości bezwzględnej, z którą będziemy nieustannie mieć do czynienia, jest następująca: $ |x| $ to odległość liczby (punktu) $ x $ od $ 0 $ na prostej rzeczywistej, a $ |x-a| $ to odległość punktów $ x\in\R $ i $ a\in\R $.

Stwierdzenie [nierówność trójkąta] Dla wszystkich $ x,y\in \R $ zachodzi nierówność

\[ \begin{equation} 		\label{nt} 	|x+y|\le |x|+|y| \end{equation} \]

Dowód:
Sprawdzenie przypadków, gdy obie liczby są tego samo znaku lub co najmniej jedna z nich jest zerem, jest łatwe. W nierówności trójkąta zachodzi wtedy równość. Szczegóły pozostawiamy Czytelnikowi.

Pozostaje wykazać nierówność dla $ x<0<y $ (przypadek $ y<0<x $ jest w pełni analogiczny, wystarczy zamienić $ x $ i $ y $ rolami). Prawa strona nt, którą oznaczymy $ P $, jest wtedy równa $ |x|+|y|=y-x $. Lewa strona, $ L $, jest równa $ x+y $ lub $ -x-y $.

Jeśli $ L=x+y $, to nierówność $ L\le P $ jest równoważna temu, że $ x+y\le y-x $, czyli temu, że $ 2x\le 0 $, a wiemy, że ostatnia nierówność jest spełniona, gdyż $ x<0 $.

Jeśli natomiast $ L=-x-y $, to nierówność $ L\le P $ jest równoważna temu, że $ -x-y\le y-x $, czyli temu, że $ 0\le 2y $, a wiemy, że ostatnia nierówność jest spełniona, gdyż $ y>0 $.     $ \Box $

Granica ciągu i jej podstawowe własności

Definicja Ciąg $ (a_n) $ liczb rzeczywistych jest zbieżny do granicy $ g\in \R $ (inaczej: ma granicę $ g\in\R $) wtedy i tylko wtedy, gdy dla każdej liczby $ \eps>0 $ istnieje $ n_\eps\in\N $ takie, że dla wszystkich numerów $ m>n_\eps $ zachodzi nierówność

\[ 	|a_m-g|<\eps\, . 	\]

Pozwólmy sobie na nieformalny komentarz. Warunek z definicji należy rozumieć tak: jakkolwiek małą liczbę $ \eps>0 $ weźmiemy, można będzie wskazać taką liczbę $ n_\eps $, odpowiednio dobraną do $ \eps $, że wszystkie wyrazy ciągu $ (a_n) $ o numerach większych od $ n_\eps $ będą się różnić od liczby $ g $ - granicy ciągu - mniej niż o $ \eps $. Mówiąc inaczej, liczba $ \eps $ określa żądany poziom dokładności przybliżenia $ a_m\approx g $, natomiast $ n_\eps $ wskazuje moment, od którego jesteśmy w stanie taką dokładność zapewnić.

    Oznaczenia i terminologia. Ciąg, który ma granicę, nazywa się zbieżny. Ciąg rozbieżny to taki ciąg, który nie ma granicy $ g\in \R $. Jeśli $ (a_n) $ ma granicę, która jest równa liczbie $ g\in\R $, to piszemy

\[ \lim_{n\to\infty} a_n=g \]

(skrót lim pochodzi od łacińskiego limes), lub czasem po prostu: $ a_n\to g $ dla $ n\to \infty $. Proszę pamiętać,

Przykład Ciąg stały, $ a_n=a\in\R $ dla wszystkich $ n\in\N $, ma granicę równą $ a $.

Przykład Ciąg $ a_n=\frac 1n $ dla $ n=1,2,\ldots $ ma granicę równą zero, tzn. $ \lim_{n\to\infty} \frac 1n =0 $. Sprawdzimy to, posługując się definicją. Weźmy dowolne $ \eps>0 $. Mamy wskazać $ n_\eps $ tak, żeby $ |a_m-g|<\eps $ dla wszystkich $ m>n_\eps $. Zobaczmy więc, kiedy nierówność $ |a_m-g|<\eps $ jest spełniona. Mamy

\[ 	|a_m-g|=\left|\frac 1m - 0\right| = \frac 1m <\eps 	\]

wtedy i tylko wtedy, gdy $ m>1/\eps $. Można więc wybrać np. $ n_\eps=\left[\frac 1\eps\right]+1>1/\eps $; wtedy dla $ m>n_\eps $ jest $ m>1/\eps $, a więc $ \frac 1m = |a_m-g|<\eps $, zgodnie z warunkiem podanym w definicji granicy.     Uwaga (banalna, ale nie pozbawiona pewnego sensu). W tym przykładzie równie dobrze moglibyśmy użyć jako $ n_\eps $ dowolnej liczby naturalnej większej od $ 1/\eps $, np. wziąć

\[ 	n_\eps' = \left(\left[\frac 1\eps\right]+7\right)^3+ 2010^{2010}\, . 	\]

Z implikacji $ m> n_\eps' $ wynika przecież, że $ m>1/\eps $, a więc $ \frac 1m = |a_m-g|<\eps $. W definicji granicy nie ma mowy o tym, że powinniśmy liczbę $ n_\eps $ wybrać najlepiej, jak tylko się da.

Spójrzmy teraz na kolejny przykład, gdzie powyższa banalna uwaga ma pewne znaczenie.

Przykład Niech $ n!=1\cdot 2\cdot \ldots \cdot n $. Wykażemy, że $ \lim_{n\to\infty} \frac 1{n!} =0 $. Postępujemy podobnie, jak w poprzednim przykładzie. Ustalmy dowolne $ \eps > 0 $. Warunek

\[ 	|a_m-g|=\left|\frac 1{m!} - 0\right| = \frac 1{m!} <\eps 	\]

jest równoważny innemu, $ m!>1/\eps $. W przeciwieństwie do poprzedniego przykładu, tej nierówności nie potrafimy łatwo rozwiązać, tzn. wyznaczyć wszystkich liczb $ m $, które ją spełniają. Możemy jednak skorzystać z oczywistej nierówności $ m!\ge m $ i zauważyć, że jeśli $ m>n_\eps=[\frac 1 \eps]+1 $, to

\[ 	m!\ge m > \left[\frac 1 \eps\right]+1 > \frac 1\eps, 	\]

a zatem warunek $ |a_m-g|<\eps $ jest spełniony. Zatem, wprost z definicji $ \lim_{n\to\infty} \frac 1{n!} =0 $.

W obu powyższych przykładach było rzeczą względnie jasną, jaka liczba powinna być granicą ciągu. Nie zawsze tak jest.

Przykład Znajdziemy granicę ciągu $ a_n=\sqrt[n]n $. Ktoś, kto nie dowiedział się wcześniej, że jest to ciąg zbieżny, ma prawo tego nie wiedzieć; ma także prawo mieć wątpliwość: jaka właściwie liczba powinna być granicą tego ciągu? Aby wskazać możliwą odpowiedź na to pytanie, użyjemy brutalnej siły, tzn. przyjrzymy się odpowiednio dużej liczbie wyrazów ciągu. Odpowiedni eksperyment można przeprowadzić z użyciem dowolnego pakietu do obliczeń symbolicznych, np. pakietu Mathematica, dostępnego dla każdego użytkownika w laboratorium komputerowym Wydziału MIM. Krótki program \begin{center} 	\begin{verbatim} 	      Do[Print[{n, N[n^{1/n}, 8]}], {n, 1, 10000}] \end{verbatim} \end{center} pozwala wypisać przybliżone wartości wyrazów $ a_1 $, $ a_2 $, \ldots, $ a_{10000} $ z dokładnością do 8 miejsc znaczących. Jego wykonanie nie trwa szczególnie długo. Oględziny wyników eksperymentu wskazują, że

\[ \begin{gather*} 	a_2 = 1,\! 414\ldots, \quad a_3 = 1,\! 442\ldots, \quad a_4=a_2, \quad a_5< a_4, \\ 	a_{10} = 1,\! 258\ldots, \quad a_{100}=1,\! 047\ldots, \quad a_{1000}=1,\! 0069\ldots, \quad a_{10000}=1,\! 0009\ldots\, . \end{gather*} \]

Naturalna, nawet temu, kto wątpi, że programy komputerowe robią naprawdę to, co im każemy, wydaje się więc hipoteza: $ \lim_{n\to\infty} \sqrt[n] n = 1 $. Aby sprawdzić, że tak rzeczywiście jest, oznaczymy różnicę $ \sqrt[n] n -1 $ symbolem $ \delta_n $. Użyjemy dwumianu Newtona

\[ (a+b)^n = \binom n0 a^n + \binom n1 a^{n-1}b + \binom n2 a^{n-2} b^2 +\cdots + \binom nn b^n\, , \]

gdzie tzw. symbol Newtona dany jest wzorem

\[ \binom nk = \frac{n!}{k!(n-k)!}. \]

(Umowa: $ 0!=1 $.) Podstawiając $ a=1 $ i $ b=\delta_n $, otrzymujemy

\[ \begin{eqnarray*} 	n=\bigl(\sqrt[n] n\bigr)^n =(1+\delta_n)^n & = & \binom n0 + \binom n1 \delta_n + \binom n2 \delta_n^2 +\mbox{[cała reszta składników]} \\ 	& = & 1 + n\delta_n + \frac{n(n-1)}2 \delta_n^2 + \cdots \end{eqnarray*} \]

Stąd $ n> \frac{n(n-1)}2 \delta_n^2   $ dla $ n>1 $, gdyż suma składników dodatnich jest większa od każdego z nich; równoważnie,

\[ \begin{equation} 	\label{sqrtn-deltan} \delta_n < \sqrt{\frac 2{n-1}}\qquad \mbox{dla $n>1$.} \end{equation} \]

Ponieważ w tym przykładzie $ |a_n-g|=|\sqrt[n]n -1|= \delta_n $, więc wystarczy sprawdzić, dla jakich $ n $ zachodzi nierówność

\[ \sqrt{\frac 2{n-1}} < \eps\, . \]

Nietrudno się przekonać, że spełniają ją wszystkie liczby $ n>1+ (2/\eps^2) $. Zatem, dla wszystkich $ n>n_\eps:= 2+[2/\eps^2] $ mamy

\[ |\sqrt[n]n-1|=\delta_n \stackrel{\eqref{sqrtn-deltan}}< \sqrt{\frac 2{n-1}} <\eps, \]

a to, zgodnie z definicją granicy, oznacza, że $ \sqrt[n] n\to 1 $ dla $ n\to \infty $.

Przykład Ciąg $ a_n=(-1)^n $, czyli ciąg liczb $ -1,1,-1,1,-1,1,\ldots $ jest rozbieżny. Gdyby liczba $ g\in\R $ była jego granicą, to biorąc w warunku z definicji granicy $ \eps=1/2 $ otrzymalibyśmy

\[ 	g-\frac 12 <a_n< g+ \frac 12 \qquad\mbox{dla wszystkich $n>n_\eps=n_{1/2}$.} \]

To jednak jest niemożliwe: przedział $ (g-1/2,g+1/2) $ ma długość 1, więc punkty $ 1 $ i $ -1 $ (odległe o 2) nie mogą do niego jednocześnie należeć, niezależnie od tego, jaką weźmiemy liczbę $ g $.

Podobnie pokazuje się, że jeśli $ a\not=b $, to ciąg $ a,b,a,b,a,b,\ldots $ jest rozbieżny.

Posługiwanie się bezpośrednio definicją granicy ciągu za każdym razem, gdy chcemy wykazać, że jakiś ciąg jest zbieżny, i obliczyć jego granicę, byłoby rzeczą niewygodną. Bardzo pożyteczne jest następujące twierdzenie.

Twierdzenie [arytmetyczne własności granicy] (#) Załóżmy, że ciągi liczb rzeczywistych $ (a_n) $ i $ (b_n) $ są zbieżne odpowiednio do $ a $ i $ b $, tzn.

\[ 	\lim_{n\to\infty} a_n = a , \qquad \lim_{n\to\infty} b_n = b. 	\]

Wówczas

\[ \begin{eqnarray} 		\lim_{n\to\infty} (a_n+b_n) & = & a + b, 	\label{lim-suma}		\\ 		\lim_{n\to\infty} (a_n-b_n) & = & a - b, 	\label{lim-roznica}			\\ 		\lim_{n\to\infty} (a_nb_n) & = & ab. \label{lim-iloczyn} 	\end{eqnarray} \]

Ponadto, jeśli $ b\not=0 $ i $ b_n\not=0 $ dla wszystkich $ n\in\N $, to

\[ \begin{equation} \lim_{n\to\infty} \frac{a_n}{b_n}=\frac ab\, . \end{equation} \]

Dowód tego nietrudnego, ale ważnego twierdzenia wygodnie będzie poprzedzić pewnym przygotowaniem.

Definicja Ciąg $ (a_n) $ nazywa się ograniczony wtedy i tylko wtedy, gdy zbiór $ A=\{a_n\ \colon \ n\in \N\} $ jest ograniczonym podzbiorem $ \R $.

Analogicznie definiuje się ciągi ograniczone z góry i z dołu. Nietrudno zobaczyć, że np. ciąg $ a_n=n^2 $ nie jest ograniczony z góry, choć jest ograniczony z dołu. Ciąg $ a_n=(-1)^n n $ nie jest ograniczony ani z góry, ani z dołu.

Stwierdzenie Każdy zbieżny ciąg liczb rzeczywistych jest ograniczony.

Dowód:
Niech $ a_n\to g $ dla $ n\to \infty $. Weźmy w definicji granicy $ \eps=1 $. Istnieje taka liczba $ n_1 $, że

\[ \begin{equation} 	\label{gn1} g-1 < a_n< g+1 \qquad\mbox{dla wszystkich $n>n_1$.} \end{equation} \]

Połóżmy teraz

\[ M=\max(g+1,\max(a_1, \ldots, a_{n_1}))\, , \qquad m=\min(g-1,\min(a_1, \ldots, a_{n_1}))\, , \]

gdzie symbol $ \max(x_1,\ldots, x_m) $ oznacza największą z liczb rzeczywistych $ x_1,\ldots, x_m $, a symbol $ \min(x_1,\ldots, x_m) $ - najmniejszą z tych liczb. Nietrudno zobaczyć, że $ m\le a_n\le M $ dla wszystkich $ n\in M $. Dla $ n>n_1 $ wynika to z doboru $ n_1 $, tzn. z warunku gn1, i z nierówności

\[ m\le g-1\le g+1\le M \]

Dla $ n\le n_1 $ nierówność $ m\le a_n\le M $ wynika wprost z definicji liczb $ m $, $ M $.

Stwierdzenie [o szacowaniu granic] (#) Załóżmy, że $ (a_n) $ i $ (b_n) $ są zbieżnymi ciągami liczb rzeczywistych. Zachodzą wtedy następujące implikacje:

  1. Jeśli $ \displaystyle\lim_{n\to\infty} a_n >a  $, to istnieje takie $ n_1\in \N $, że $ a_n>a $ dla wszystkich $ n>n_1 $.
  2. Jeśli $ \displaystyle\lim_{n\to\infty} b_n <b  $, to istnieje takie $ n_1\in \N $, że $ b_n<b $ dla wszystkich $ n>n_1 $.
  3. Jeśli $ \displaystyle\lim_{n\to\infty} a_n >\displaystyle\lim_{n\to\infty} b_n \,  $, to istnieje takie $ n_1\in \N $, że $ a_n>b_n $ dla wszystkich $ n>n_1 $.
  4. Jeśli istnieje takie $ n_1\in \N $, że $ a_n\le b_n $ dla wszystkich $ n>n_1 $, to wówczas
    \[ 	\lim_{n\to\infty} a_n \le \lim_{n\to\infty} b_n 	\]

Dowód:
Zacznijmy od własności (i). Biorąc w definicji granicy $ \eps=\displaystyle\lim_{n\to\infty} a_n -a >0 $, a następnie dobierając doń $ n_\eps $, otrzymujemy

\[ a_n > \lim_{n\to\infty} a_n -\eps = \lim_{n\to\infty} a_n - (\lim_{n\to\infty} a_n-a) = a \quad\mbox{dla wszystkich $n_\eps$.} \]

Dowód własności (ii) jest analogiczny; Czytelnik może przeprowadzić go samodzielnie, lub skorzystać z własności

\[ \lim_{n\to\infty} b_n = b \quad\Leftrightarrow \lim_{n\to\infty} (-b_n) = (-b), \]

która pozwala wyprowadzić (ii) z udowodnionej już (i).

Aby sprawdzić (iii), bierzemy dowolną liczbę rzeczywistą $ x $ taką, że

\[ \displaystyle\lim_{n\to\infty} a_n> x >\displaystyle\lim_{n\to\infty} b_n \]

Istnieje wtedy takie $ n_1 $, że $ a_n > x $ dla wszystkich $ n>n_1 $; to wynika z punktu (i). Podobnie, istnieje wtedy takie $ n_2 $, że $ x>b_n $ dla wszystkich $ n>n_2 $; to wynika z punktu (ii). Dla $ n> \max(n_1,n_2) $ obie nierówności zachodzą jednocześnie, a więc, dzięki przechodniości, $ a_n>b_n $.

Wreszcie, własność (iv) wynika z (iii) przez zaprzeczenie. Istotnie, gdyby nie zachodziła teza (iv), to dysponowalibyśmy założeniem (iii), a więc zgodnie z (iii) byłoby $ a_n>b_n $ dla wszystkich $ n>n_1 $, co przeczyłoby założeniu (iv).

Wróćmy teraz do arytmetycznych własności granicy.

    Dowód Twierdzenia~ [link]. 1. Granica sumy ciągów. Ustalmy $ \eps>0 $. Korzystając z definicji granicy dla liczby $ \eps/2 $ (można tak zrobić, bowiem warunek z definicji ma zachodzić dla każdej liczby dodatniej, a $ \eps/2>0 $) dobierzmy liczby $ n_1 $ i $ n_2 $ tak, żeby

\[ |a_n-a|< \frac \eps2 \quad\mbox{dla wszystkich } n>n_1, \qquad  |b_n-b|< \frac \eps2 \quad\mbox{dla wszystkich } n>n_2\, . \]

Wówczas, dla $ n>n_3=\max(n_1,n_2) $, zachodzi nierówność

\[ \begin{eqnarray*} 	|(a_n+b_n) -(a+b)| & = & |(a_n-a)+(b_n-b)| \\ 	&\le & |a_n-a| + |b_n-b| \qquad\mbox{z nierówności trójkąta}\\ 	& < & \frac \eps 2 + \frac \eps 2 = \eps. \end{eqnarray*} \]

Wykazaliśmy więc, że liczba $ g=a+b $ jest granicą ciągu $ a_n+b_n $.

Przerwijmy dowód na chwilę i skomentujmy całe rozumowanie.

     Komentarz (dla początkujących). Czytelnik, który po raz pierwszy styka się z podobnym dowodem, może zapytać: skąd było wiadomo, że trzeba skorzystać z definicji granicy ciągu $ a_n $ i ciągu $ b_n $, biorąc w nich $ \eps/2 $ zamiast $ \eps $? Po pierwsze, akurat w tym przypadku rachunki są na tyle krótkie, że można je przemyśleć w pamięci (lub szybko wykonać na brudno) i odgadnąć, że tak będzie wygodnie, bo na końcu otrzymamy wynik $ \eps $. Można jednak postąpić inaczej, i to co najmniej na dwa różne sposoby:

  1. Użyć obu definicji, biorąc w nich $ \eps $, a nie $ \eps/2 $; otrzymujemy wtedy, dla $ n> n_3 $,
    \[ 	|(a_n+b_n) -(a+b)| \le |a_n-a| + |b_n-b| < \eps+\eps = 2\eps, 	\]

    ale przecież $ 2\eps $ jest dowolną liczbą dodatnią, więc otrzymaliśmy warunek z definicji granicy, tylko dla liczby o innej nazwie.

  2. Użyć obu definicji, biorąc w nich ostrożnie $ \eta>0 $ zamiast $ \eps>0 $, bowiem a priori nie mamy pewności, jaki będzie wynik; otrzymujemy wtedy, dla $ n> n_3 $,
    \[ |(a_n+b_n) -(a+b)| \le |a_n-a| + |b_n-b| < \eta+\eta = 2\eta. \]

    Teraz nietrudno już powiedzieć: niech $ \eta=\eps/2 $; w dodatku, mogliśmy tak rozumować od samego początku. W dłuższych dowodach, uzasadniających, że jakaś granica ma tę, a nie inną wartość, taki sposób postępowania bywa wygodny.

     2. Granica różnicy ciągów. Postępujemy tak samo, jak w poprzedniej części dowodu. Ustalmy $ \eps>0 $; liczby $ n_1 $ i $ n_2 $ dobierzmy tak, żeby

\[ |a_n-a|< \frac \eps2 \quad\mbox{dla wszystkich } n>n_1, \qquad  |b_n-b|< \frac \eps2 \quad\mbox{dla wszystkich } n>n_2\, . \]

Wówczas, dla $ n>n_3=\max(n_1,n_2) $,

\[ \begin{eqnarray*} 	|(a_n-b_n) -(a-b)| & = & |(a_n-a)+(b-b_n)| \\ 	&\le & |a_n-a| + |b-b_n| \qquad\mbox{z nierówności trójkąta}\\ 	& < & \frac \eps 2 + \frac \eps 2 = \eps. \end{eqnarray*} \]

Wykazaliśmy więc, że różnica liczb $ a $ i $ b $ jest granicą różnicy ciągów $ a_n $ i $ b_n $.

     3. Granica iloczynu ciągów. Dowód jest podobny do poprzednich, jednak nieco dłuższy. Najpierw trzeba zapisać różnicę $ a_nb_n-ab $ tak, żeby zobaczyć wyrażenia $ a_n-a $ i $ b_n-b $. Oto odpowiedni rachunek

\[ \begin{eqnarray*} 		|a_nb_n -ab| & = & |(a_n-a)b_n+a(b_n-b)| \\ 		&\le & |b_n|\, |a_n-a| + |a|\,|b_n-b| \qquad\mbox{z nierówności trójkąta}\\ 		& =: & W_n. 	\end{eqnarray*} \]

Ciąg $ b_n $ jest ograniczony, więc istnieje taka dodatnia liczba $ M $, że $ |b_n|\le M $ dla wszystkich $ n\in \N $. Ponadto, dla ustalonej liczby $ \eps >0  $ istnieją takie $ n_1,n_2\in \N $, że

\[ |a_n-a|< \frac \eps{2M} \quad\mbox{dla wszystkich } n>n_1, \qquad  |b_n-b|< \frac \eps{2|a|+1} \quad\mbox{dla wszystkich } n>n_2\, . \]

Zatem, dla $ n>n_3=\max(n_1,n_2) $ możemy oszacować

\[ W_n < M  \frac \eps{2M} + |a| \frac \eps{2|a|+1} < \frac \eps 2 + \frac \eps 2 = \eps, \]

gdyż $ |a|/(2|a|+1)< \frac 12 $ dla każdego $ a\in\R $. Otrzymaliśmy $ |a_nb_n-ab|\le W_n< \eps $ dla wszystkich $ n>n_3 $; dzięki dowolności $ \eps>0 $ wynika stąd, że $ a_nb_n\to ab $ dla $ n\to \infty $.

     3. Granica ilorazu ciągów. Wystarczy wykazać, że $ \frac 1{b_n}\to \frac{1}{b} $ dla $ n\to\infty $, a następnie skorzystać z poprzedniego punktu twierdzenia, gdyż $ a_n/b_n= a_n\cdot \frac 1{b_n}  $.

Ponieważ $ b\not =0 $, więc istnieje taki przedział otwarty $ (c,d)\subset \R $, że $ b\in (c,d) $, ale $ 0\not\in (c,d) $. Posługując się dwukrotnie Stwierdzeniem~ [link], przekonujemy się, że

\[ b_n \in (c,d)\qquad\mbox{dla wszystkich $n$ większych od pewnego $n_1\in \N$.} \]

Zatem

\[ \left|\frac 1{b_n}-\frac{1}{b}\right|=\frac{|b-b_n|}{|b|\, |b_n|}\le  \frac{|b-b_n|}{\min (|c|,|d|)^2}. \]

Ustalamy teraz $ \eps>0 $ i wybieramy liczbę $ n_2\in\N $ tak, żeby mieć $ |b-b_n|\le \eps \min (|c|,|d|)^2 $ dla $ n>n_2 $. Dla $ n>\max(n_1,n_2) $ mamy wtedy

\[ \left|\frac 1{b_n}-\frac{1}{b}\right|< \frac{|b-b_n|}{\min (|c|,|d|)^2} < \eps, \]

czyli istotnie $ \frac 1{b_n}\to \frac{1}{b} $ dla $ n\to\infty $. Dowód całego twierdzenia jest zakończony.

Podamy teraz dwa inne twierdzenia. W połączeniu z Twierdzeniem~ [link] tworzą one wygodny zestaw narzędzi do badania zbieżności wielu ciągów o wyrazach rzeczywistych. Zobaczymy też pewne przykłady zastosowań tych twierdzeń.

Oto pierwsze z zapowiedzianych twierdzeń.

Twierdzenie [o trzech ciągach] Załóżmy, że $ (a_n),(b_n),(c_n)\subset \R $, a ponadto

\[ 	\lim_{n\to\infty} a_n=\lim_{n\to\infty}b_n=g 	\]

i istnieje takie $ n_1\in\N $, że dla wszystkich $ n> n_1 $ zachodzą nierówności

\[ 	a_n\le c_n\le b_n\, . 	\]

Wówczas $ \lim_{n\to\infty} c_n=g $.

Dowód:
To twierdzenie jest stosunkowo prostym wnioskiem ze Stwierdzenia~ [link]. Ustalmy liczbę $ \eps>0 $. Ponieważ $ g=\lim a_n > g-\eps $, więc istnieje takie $ n_2\in\N $, że $ a_n>g-\eps $ dla $ n>n_2 $. Podobnie, $ g=\lim b_n<g+\eps $, więc istnieje takie $ n_3\in\N $, że $ b_n<g+\eps $ dla $ n>n_3 $.

Dla $ n>\max(n_1,n_2,n_3) $ możemy skorzystać ze wszystkich nierówności, w których występują $ a_n,b_n $ i $ c_n $. Zatem, dla takich $ n $,

\[ g-\eps < a_n\le c_n\le b_n < g+\eps\, , \]

stąd zaś wynika, że $ |c_n-g|<\eps $ dla wszystkich $ n>\max(n_1,n_2,n_3) $.

Twierdzenie o trzech ciągach jest bardzo wygodnym narzędziem. Popatrzmy na przykłady jego zastosowań.

Przykład Niech $ x\in (0,1) $. Obliczymy granicę ciągu $ c_n=\sqrt[n] x $. Załóżmy najpierw, że $ x\ge 1 $. Wtedy dla wszystkich $ n>n_1=[x]+1>x $ zachodzą nierówności

\[  1\le c_n=\sqrt[n]{x} <\sqrt[n]n\, . 	\]

Wiemy już jednak, że $ b_n=\sqrt[n]n\to 1 $ dla $ n\to\infty $, a ciąg stały $ a_n\equiv1 $ też ma granicę $ 1 $. Zatem, z twierdzenia o trzech ciągach wynika, że

\[ \begin{equation} 	\label{vaueniks} \lim_{n\to\infty}\sqrt[n] x = 1\, . \end{equation} \]

Jeśli $ x\in (0,1) $, to $ \sqrt[n]x = 1/\sqrt[n] y $ dla $ y= 1/x >1 $, a więc wzór vaueniks także zachodzi.

Przykład Niech $ q\in\R $, $ |q|<1 $. Wtedy

\[ \lim_{n\to\infty} q^n = 0\, . \]

Ponieważ $ |q^n-0| = |q^n|=\bigl||q|^n-0\bigr| $, więc wystarczy ograniczyć się do przypadku $ q\in [0,1) $. Dla $ q=0 $ mamy do czynienia z ciągiem stałym, $ q^n\equiv 0 $; wtedy nie ma czego dowodzić.

Niech więc $ q\in (0,1) $; oznaczmy $ a=\frac 1 q -1 $. Wtedy $ a>0 $, $ 1/q = 1 +a $ i z nierówności Bernoulliego mamy

\[ \frac{1}{q^n} = (1+a)^n \ge 1 + na > na\quad\mbox{dla $n\in\N$.} \]

Zatem,

\[ 0\ \longleftarrow\ 0< q^n < \frac{1}{a}\cdot \frac{1}{n} \ \longrightarrow 0, \]

gdyż $ \frac 1n \to 0 $, i dla dowolnej liczby rzeczywistej $ c $ z twierdzenia o iloczynie granicy ciągów wynika, że $ c \cdot \frac 1n \to 0 $. Z twierdzenia o trzech ciągach wnioskujemy teraz, że $ q^n\to 0 $ dla $ n\to \infty $.

Przykład Wykażemy, że

\[ \begin{equation} 		\label{vau-34} 	\lim_{n\to \infty} \sqrt[n]{3^n+4^n} = 4. \end{equation} \]

Wskażemy w tym celu odpowiednie oszacowania $ \sqrt[n]{3^n+4^n} $ z góry i z dołu. Ponieważ $ 0<3^n<4^n $ dla wszystkich $ n\in\N $, więc

\[ 	4=\sqrt[n]{4^n}<  \sqrt[n]{3^n+4^n} < \sqrt[n]{2\cdot 4^n}= 4\sqrt[n] 2\, . 	\]

Jednak $ 4\sqrt[n]2\to 1 $, gdy $ n\to\infty $; to wynika z udowodnionego wcześniej wzoru vaueniks. Oszacowaliśmy więc $ \sqrt[n]{3^n+4^n} $ z góry i z dołu przez wyrazy ciągów zbieżnych do liczby 4; można zastosować twierdzenie o trzech ciągach i stwierdzić, że wzór vau-34 rzeczywiście zachodzi.

W istocie, prawdziwy jest wzór nieco ogólniejszy od vau-34.

Przykład Jeśli $ k $ jest liczbą naturalną i $ 0\le x_1\le x_2\le \ldots\le x_k $, to

\[ \begin{equation} 	\label{vau-sumak} \lim_{n\to\infty}\sqrt[n]{x_1^n+x_2^n+\cdots +x_k^n} = x_k\, . \end{equation} \]

Istotnie, możemy wypisać oczywiste nierówności

\[ x_k=\sqrt[n]{x_k^n}\le \sqrt[n]{x_1^n+x_2^n+\cdots +x_k^n}\le  \sqrt[n]{k\cdot x_k^n} = x_k\sqrt[n]k\, . \]

Wiemy już jednak, że $ \sqrt[n] k \to 1 $, zatem, podobnie jak w poprzednim przykładzie, wzór vau-sumak wynika z twierdzenia o trzech ciągach.

Uważny Czytelnik spostrzegł zapewne, że praktycznie we wszystkich sytuacjach posługiwaliśmy się w istocie prostym wnioskiem z twierdzenia o trzech ciągach.

Wniosek Jeśli $ b\le c_n\le b_n $ dla wszystkich $ n>n_1 $, a ponadto $ \lim_{n\to\infty} b_n=b $, to wtedy także $ \lim_{n\to\infty} c_n=b $.

Drugie z zapowiedzianych twierdzeń zasługuje na osobny podrozdział.

Ciągi monotoniczne.

Definicja Ciąg liczb rzeczywistych $ (a_n) $ jest:

  1. malejący, gdy $ a_n>a_{n+1} $ dla wszystkich $ n\in \N $;
  2. niemalejący, gdy $ a_n\le a_{n+1} $ dla wszystkich $ n\in \N $;
  3. rosnący, gdy $ a_n<a_{n+1} $ dla wszystkich $ n\in \N $;
  4. nierosnący, gdy $ a_n\ge a_{n+1} $ dla wszystkich $ n\in \N $.
Definicja Ciąg $ (a_n) $ jest monotoniczny, gdy spełnia któryś z warunków (i)-(iv) poprzedniej definicji. Ciąg $ (a_n) $ jest ściśle monotoniczny, gdy jest rosnący albo malejący.
Twierdzenie (#) Załóżmy, że ciąg $ (a_n)\subset \R $ jest niemalejący i ograniczony z góry. Wówczas ciąg $ (a_n) $ jest zbieżny. Jego granicą jest liczba

\[ M= \sup\{a_n \mid n\in \N\}\, . \]

Dowód:
Zauważmy najpierw, że zbiór wyrazów ciągu, $ A=\{a_n \mid n\in \N\} $, jest ograniczony z góry, więc liczba $ M=\sup A\in \R $ istnieje.

Ustalmy $ \eps>0 $. Ponieważ $ M-\eps<M $, więc $ M-\eps $ nie jest ograniczeniem górnym zbioru $ A $. Zatem, znajdziemy takie $ n_1 $, że

\[ M-\eps< a_{n_1} \le M\, . \]

Ciąg $ (a_n) $ jest niemalejący; dlatego $ a_m\ge a_{n_1} $ dla wszystkich $ m>n_1 $. Jednak oczywiście mamy też $ a_m\le M $, gdyż $ M $ jest ograniczeniem górnym zbioru wyrazów ciągu. Podsumowując, mamy

\[ M-\eps< a_{n_1} \le a_m\le M< M+\eps \qquad\mbox{dla wszystkich } m>n_1, \]

tzn. $ |a_m-M|< \eps $ dla $ m>n_1 $. Przeto, zgodnie z definicją granicy ciągu, $ \lim_{n\to\infty} a_n=M $.

Ponieważ ciąg $ (a_n) $ jest niemalejący wtedy i tylko wtedy, gdy ciąg $ (-a_n) $ jest nierosnący, a $ \sup \{a_n \mid n\in \N\}=-\inf\{(-a_n) \mid n\in \N\} $, więc zachodzi oczywiście następujący, bliźniaczy fakt.

Wniosek (#) Załóżmy, że ciąg $ (a_n)\subset \R $ jest nierosnący i ograniczony z dołu. Wówczas ciąg $ (a_n) $ jest zbieżny. Jego granicą jest liczba

\[ M= \inf\{a_n \mid n\in \N\}\, . \]

Przykład Niech $ a_1=\sqrt{6} $ i $ a_{n+1}=\sqrt{6+a_n} $ dla wszystkich $ n\in \N $, tzn.

\[ 	a_2=\sqrt{6+\sqrt{6}}\, ,\quad a_3=\sqrt{6+\sqrt{6+\sqrt 6}}, \quad a_4=\sqrt{6+\sqrt{6+\sqrt{6+\sqrt 6}}}, \quad\ldots 	\]

Sprawdzimy, że ciąg $ a_n $ jest rosnący i ograniczony. Niech $ x>0 $. Zauważmy, że dla takich $ x $ nierówność $ \sqrt{x+6}>x $ jest równoważna innej, $ x^2-x-6<0 $. Ponieważ $ x^2-x-6=(x+2)(x-3) $, więc ostatecznie

\[ \begin{equation} 	\label{sqrtx6x} 	x> 0 \mbox{ i } \sqrt{x+6}>x\quad \Leftrightarrow\quad x\in (0,3)\, . \end{equation} \]

Zauważmy też, że

\[ \begin{equation} \label{xin03} x\in (0,3) \quad \Rightarrow \quad 0< x+6 < 9 \quad \Rightarrow \quad \sqrt{x+6} \in (0,3)\, . \end{equation} \]

Wyrazy ciągu $ a_n $ są oczywiście dodatnie. Ponieważ $ a_1=\sqrt{6}\in (2,3) $, więc z implikacji xin03 wynika, na mocy zasady indukcji matematycznej, że $ a_n\in (0,3) $ dla wszystkich $ n\in \N $; ciąg $ (a_n) $ jest więc ograniczony. Ponadto,

\[ a_{n+1} = \sqrt{a_n+6} \stackrel{\eqref{sqrtx6x}} > a_n, \qquad \mbox{bowiem wiemy już, że $a_n\in(0,3)$.} \]

Zatem ciąg $ a_n $ jest rosnący. Z Twierdzenia~ [link] wynika, że istnieje granica tego ciągu.

Nietrudno tę granicę znaleźć: ponieważ

\[ a_{n+1}^2 = 6 + a_n, \]

więc z Twierdzenia~ [link] wynika, że $ a=\lim a_n $ spełnia równość $ a^2=6+a $, a przy tym $ a\ge 0 $, gdyż $ a_n>0 $ dla wszystkich $ n $. Przeto $ a=3 $.

     Uwaga. Ostatni fragmemt rozumowania wolno przeprowadzić dopiero wtedy, gdy wiadomo już, że liczba $ a=\lim a_n $ istnieje. Wcześniej można stąd jedynie wywnioskować, że jeśli $ a=\lim a_n $ istnieje i $ a\ge 0 $, to wtedy $ a=3 $.

Przykład Niech $ a_1=\sqrt 3 $ i $ a_{n+1}=12 + \frac{a_n}7 $ dla wszystkich $ n\in\N $. Podobnie jak w poprzednim przykładzie, mamy $ a_n>0 $ dla wszystkich $ n\in \N $, a także $ a_n>12 $ dla wszystkich $ n>1 $. Przez indukcję łatwo wykazać, że $ a_n<14 $ dla wszystkich $ n\in \N $ (tzn. ciąg $ a_n $ jest ograniczony, z dołu przez 0, a z góry przez $ 14 $). Zatem,

\[ 	a_{n+1}-a_n=12+\frac{ a_n}{7}-a_n=12-\frac{6 a_n}{7}> 12-\frac{6\cdot 14} 7 = 0, 	\]

tzn. ciąg $ a_n $ jest rosnący. Z Twierdzenia~ [link] wynika teraz, że istnieje granica $ a=\displaystyle\lim_{n\to\infty} a_n $ tego ciągu. Mamy także $ a=12+a/7 $, stąd zaś $ a=14 $.

Granice niewłaściwe

Wśród wszystkich ciągów rozbieżnych wygodnie jest wyróżnić osobno ciągi rozbieżne do plus nieskończoności i ciągi rozbieżne do minus nieskończoności

Definicja Mówimy, że ciąg liczb rzeczywistych $ a_n $ jest rozbieżny do plus nieskończoności, i piszemy

\[ \lim_{n\to\infty} a_n=+\infty, \]

wtedy i tylko wtedy, gdy dla każdej liczby dodatniej $ t $ istnieje $ n_1\in \N $ takie, że $ a_n>t $ dla wszystkich $ n>n_1 $.

Definicja Mówimy, że ciąg liczb rzeczywistych $ a_n $ jest rozbieżny do minus nieskończoności, i piszemy

\[ \lim_{n\to\infty} a_n=-\infty, \]

wtedy i tylko wtedy, gdy dla każdej liczby dodatniej $ t $ istnieje $ n_1\in \N $ takie, że $ a_n<-t $ dla wszystkich $ n>n_1 $.

Oto proste przykłady: ciąg $ a_n=n $ jest rozbieżny do $ +\infty $, ciąg $ b_n=-n^2 $ jest rozbieżny do $ -\infty $, natomiast ciąg $ c_n=(-1)^n n^2 $ jest rozbieżny, ale nie jest rozbieżny ani do $ +\infty $, ani do $ -\infty $. Czytelnik sam zechce się zastanowić, dlaczego tak jest.

Posługując się pojęciem granicy nieskończonej, łatwo jest podać nieco ogólniejszą wersję Twierdzenia~ [link].

Twierdzenie (#) Każdy ciąg niemalejący $ (a_n)\subset\R $ jest albo zbieżny, albo rozbieżny do $ +\infty $. Zbieżność $ (a_n) $ jest równoważna jego ograniczoności.

Dowód:
Gdy ciąg jest ograniczony, to korzystamy po prostu z Twierdzenia~ [link]. Gdy $ (a_n) $ jest nieograniczony z góry, to dla każdej liczby $ t>0 $ można wskazać takie $ n_1\in\N $, że $ a_{n_1}>t $. Dla $ m\ge n_1 $ mamy $ a_m\ge a_{n_1}>t $, gdyż ciąg $ (a_n) $ jest niemalejący. Zatem, wprost z definicji, $ \lim_{n\to\infty} a_n=+\infty $.

Można wykazać, że przy naturalnej umowie

\[ \begin{gather*} a+(+\infty) = +\infty\quad\mbox{dla $a\in \R$}, \qquad -(-\infty) = +\infty, \qquad +\infty+\infty = +\infty \\ 	a\cdot(\pm\infty) = \pm\infty\quad\mbox{dla $a>0$},\qquad (+\infty)\cdot(\pm\infty)=\pm\infty\, \\ (-\infty)\cdot	(\pm\infty)=\mp\infty\qquad\mbox{oraz}\qquad \frac 1{\pm \infty }=0 \end{gather*} \]

twierdzenie o arytmetycznych własnościach granicy (Twierdzenie~ [link]) zachodzi także dla granic nieskończonych. Szczegółowe sprawdzenie tego faktu pozostawiamy zainteresowanym Czytelnikom (patrz też przykład, zamieszczony niżej). Nie można go jednak używać w innych przypadkach, tzn. do obliczania granic postaci

\[ 0\cdot\infty, \qquad \infty-\infty, \qquad \frac\infty\infty\, . \]
Ćwiczenie Dla dowolnego $ a\in \R_+\cup\{0,+\infty\} $ podać przykład takich dwóch ciągów $ x_n,y_n $ rozbieżnych do $ +\infty $, żeby $ x_n/y_n\to a $ dla $ n\to\infty $.

Przykład Załóżmy, że $ a_n\to a\in \R $, natomiast $ b_n\to +\infty $. Sprawdzimy, że wtedy $ a_n+b_n\to +\infty $. Niech $ M>0 $ będzie dużą liczbą dodatnią. Dla wszystkich dostatecznie dużych $ n $ mamy

\[ 	a_n> a-1\qquad \mbox{oraz}\qquad b_n> M-a+1\, . 	\]

(Pierwszą nierówność otrzymujemy, biorąc $ \eps=1 $ w definicji granicy ciągu, a drugą - biorąc $ t=M-a+1 $ w definicji granicy niewłaściwej). Dodając obie nierówności stronami, sprawdzamy, że dla wszystkich dostatecznie dużych $ n $ zachodzi nierówność $ a_n+b_n>M $.

Podciągi. Twierdzenie Bolzano-Weierstrassa.

Definicja Jeśli $ (x_n)_{n\in\N} $ jest dowolnym ciągiem, a $ k_1,k_2,k_3,\ldots $ rosnącym ciągiem liczb naturalnych, to ciąg $ (y_n) $, określony wzorem

\[ 	y_n= x_{k_n}, \qquad n=1,2,\ldots 	\]

nazywamy podciągiem ciągu $ (x_n) $.

Mówiąc potocznie, chodzi o wybranie nieskończenie wielu wyrazów ciągu, ale bez zmiany kolejności.

Pojęcie podciągu jest ważne m.in. z następującego powodu.

Stwierdzenie Jeśli ciąg $ (a_n)\subset \R $ jest zbieżny do $ g $, to każdy podciąg ciągu $ (a_n) $ też jest zbieżny do $ g $.

Łatwy dowód pozostawiamy jako ćwiczenie.

Lemat [W. Sierpiński] (#) Każdy ciąg liczb rzeczywistych ma podciąg monotoniczny.

Co więcej, można wskazać, jak taki podciąg należy wybierać.

Dowód:
Połóżmy, dla wszystkich $ n\in \N $,

\[ A_n =\{a_m \ \colon \ m\ge n\} = \{a_n,\ a_{n+1},\ a_{n+2}, \ \ldots\}\, . \]

Rozważymy osobno dwa przypadki:

  1. W każdym ze zbiorów $ A_n $ istnieje element największy.
  2. W którymś ze zbiorów $ A_n $ nie ma elementu największego.

W pierwszym przypadku z $ (a_n) $ można wybrać podciąg nierosnący. Pokażemy, jak to zrobić. Niech $ a_{k_1} $ będzie największym elementem $ A_1 $. W $ A_{k_1+1} $ jest element największy, $ a_{k_2} $; oczywiście $ k_2\ge k_1+1> k_1 $, a przy tym $ a_{k_2}\le a_{k_1} $, bo $ a_{k_2}\in A_{1} $, $ a_{k_1}=\sup A_1 $. Jeśli wyrazy $ a_{k_1}\ge a_{k_2}\ge \ldots \ge a_{k_n} $, gdzie $ k_1<k_2<\ldots< k_{n} $, zostały już wybrane, to dobieramy $ k_{n+1}\ge k_n+1 $ tak, aby

\[ a_{k_{n+1}}:=\sup A_m \quad\mbox{dla }{m=k_n+1}\, . \]

Definicja jest poprawna, gdyż w każdym zbiorze $ A_m $ istnieje element największy. Mamy, jak w pierwszym kroku rozumowania, $ k_{n+1}>k_n $ i $ a_{k_{n+1}}\le a_{k_n} $.

W drugim przypadku można wybrać z $ (a_n) $ podciąg rosnący. Przypuśćmy, że w $ A_m $ nie ma elementu największego. Bierzemy wtedy $ k_1=m $. Zgodnie z założeniem, istnieje $ k_2>m $ takie, że $ a_{k_2}>a_{k_1}=a_m $. Gdyby dalej, dla $ n>k_2 $, nie byłoby już wyrazów większych od $ a_{k_2} $, to wtedy w $ A_m $ byłby element największy, wbrew założeniu. Zatem można znaleźć $ a_{k_3}> a_{k_2}, $ gdzie $ k_3>k_2 $. To rozumowanie można powtórzyć dowolnie wiele razy (Czytelnik zechce sam uzupełnić szczegóły).

Twierdzenie [Bolzano-Weierstrassa] Każdy ciąg ograniczony $ (a_n)\subset \R $ zawiera podciąg zbieżny.

Dowód:
Zgodnie z poprzednim lematem, ciąg $ (a_n) $ ma podciąg monotoniczny $ (a_{k_n}) $. Oczywiście każdy podciąg ciągu ograniczonego jest ograniczony. Z Twierdzenia~ [link] wynika więc, że podciąg $ (a_{k_n}) $ jest zbieżny.

Ponieważ to naprawdę istotne twierdzenie, obejrzyjmy jeszcze jeden dowód.

    Dowód drugi. Można bez zmniejszenia ogólności założyć, że $ (a_n)\subset [0,1] $ -- gdyby tak nie było, możemy rozpatrzeć ciąg $ \lambda(a_n + C) $ dla odpowiednio wybranych $ C $ oraz $ \lambda $; jego podciągom zbieżnym odpowiadają zbieżne podciągi ciągu $ (a_n) $.

Podzielmy odcinek $ [0,1] $ na 10 równych części, o długości $ 1/10 $. W jednej z nich, powiedzmy $ [l_1,r_1] $, jest nieskończenie wiele wyrazów ciągu. Wybierzmy jeden z nich, $ a_{k_1} $. Teraz podzielmy odcinek $ [l_1,r_1] $ na 10 równych części, o długości $ 1/10^2 $. W jednej z nich, powiedzmy $ [l_2,r_2] $ jest nieskończenie wiele wyrazów ciągu o numerach większych od $ k_1 $; niech $ a_{k_2} $ będzie jednym z tych wyrazów.

Przeprowadziwszy $ m $ kroków takiego rozumowania, skonstruujemy

  • Przedziały domknięte $ [0,1]\supset [l_1,r_1]\supset[l_2,r_2]\supset \ldots \supset [l_m,r_m] $ takie, że
    \[ 	|l_j-r_j|= \frac 1{10^j}, \qquad{j=1,2,\ldots, m,} 	\]

    i w każdym z nich jest nieskończenie wiele wyrazów ciągu $ (a_n) $;

  • Wyrazy $ a_{k_1} $, $ a_{k_2} $, \ldots, $ a_{k_m} $ takie, że
    \[ 	a_{k_j}\in [l_j,r_j] \quad\mbox{dla $j=1,\ldots, m$}; \qquad 	\]

W $ (m+1) $-szym kroku dzielimy odcinek $ [l_m,r_m] $ na 10 równych części. W jednej z nich jest nieskończenie wiele wyrazów ciągu o numerach większych od $ k_m $. Nazywamy tę część $ [l_{m+1},r_{m+1}] $ i wybieramy numer $ k_{m+1}=s>k_m $ tak, żeby $ a_s\in [l_{m+1},r_{m+1}] $.

W efekcie otrzymujemy nieskończony, zstępujący ciąg przedziałów $ [l_{m},r_{m}] $ i podciąg $ (a_{k_m}) $ taki, że $ a_{k_m}\in [l_{m},r_{m}] $. Ciąg $ (l_m) $ jest niemalejący i ograniczony z góry przez 1, a ciąg $ (r_m) $ nierosnący i ograniczony z dołu przez 0, zatem oba są zbieżne. Ponadto,

\[ \lim_{m\to\infty} l_m = \lim_{m\to\infty} r_m, \qquad\mbox{gdyż}\quad r_m-l_m=\frac 1{10^m}\to 0. \]

Nietrudno wreszcie zauważyć, że

\[ \lim_{m\to\infty} l_m = \lim_{m\to\infty} a_{k_m} = \lim_{m\to\infty} r_m \]

- to wynika z twierdzenia o trzech ciągach.

    Uwaga. Czytelnik-koneser zechce zauważyć, że w drugim dowodzie tak naprawdę dobieramy kolejne wyrazy ciągu, próbując stabilizować coraz dłuższe początkowe fragmenty rozwinięć dziesiętnych. Oczywiście, liczbę 10 można zastąpić w rozumowaniu liczbą 2, i nie trzeba od początku zakładać, że wyrazy ciągu są akurat w przedziale jednostkowym, ale wtedy analogia związana z rozwinięciami dziesiętnymi nie jest widoczna.

Wniosek (#) Ciąg ograniczony ma granicę wtedy i tylko wtedy, gdy granice wszystkich jego podciągów są równe.

Dowód:
Jest rzeczą praktycznie oczywistą, że jeśli ciąg $ a_n $ ma granicę, to wszystkie jego podciągi są zbieżne do tej samej granicy. Jeśli $ (a_n) $ jest rozbieżny (ale ograniczony), to wobec Tw. Bolzano-Weierstrassa ma zbieżny podciąg, $ a_{n_k}\to g $. Ponieważ $ g $ nie jest granicą ciągu $ (a_n) $, to dla pewnego $ \eps_0>0 $ poza przedziałem $ (g-\eps_0,g+\eps_0) $ jest nieskończenie wiele wyrazów ciągu; z nich wybieramy inny podciąg zbieżny, którego granica $ g' $ - zgodnie ze stwierdzeniem~ [link] - różni się od $ g $ co najmniej o $ \eps_0 $.

 

Czasem bywa tak, że umiemy wykazać zbieżność kilku różnych podciągów danego ciągu (np. niektóre są rosnące, a inne malejące, a wszystkie są ograniczone), dobranych tak, że każdy wyraz ciągu należy do jednego z tych podciągów. Wtedy przydaje się następujący prosty fakt.

Stwierdzenie (#) Jeśli ciąg $ (a_n)\subset \R $ ma $ k $ różnych podciągów zbieżnych do tej samej granicy $ g $, i każdy wyraz ciągu $ (a_n) $ jest wyrazem któregoś z tych podciągów (tzn. zbiór $ \{a_n\ \colon\ n\in\N\} $ jest sumą zbiorów wyrazów rozważanych podciągów), to $ a_n\to g $ dla $ n\to \infty $.

Dowód:
Ustalmy $ \eps>0 $. Wybierzmy liczby $ l_1,\ldots, l_k\in \N $ tak, aby spełniony był warunek: \begin{quote} \it Jeśli $ a_m\  $ jest wyrazem $ j $-tego z rozważanych podciągów (gdzie $ j=1,\ldots, k $) \newline i numer~$ m>l_j $, to $ |a_m-g|<\eps $. \end{quote} (Innymi słowy, liczbę $ l_j $ dobieramy do $ \eps, $ korzystając ze zbieżności $ j $-tego podciągu). Połóżmy $ l_0=\max(l_1,\ldots, l_k) $. Ponieważ każdy wyraz ciągu $ (a_n) $ jest wyrazem któregoś z $ k $ rozważanych podciągów, więc dla każdego $ m>l_0 $ z pewnością $ |a_m-g|<\eps $.

Podamy teraz ważne twierdzenie, które podaje warunek równoważny zbieżności ciągu.

Twierdzenie [warunek Cauchy'ego]{}(#) Ciąg $ (a_n)\subset \R\,  $ jest zbieżny wtedy i tylko wtedy, gdy spełnia następujący warunek Cauchy'ego:

    \setcounter{enumi}{2}

  1. Dla każdej liczby $ \eps>0 $ istnieje $ n_\eps\in\N $ takie, że dla wszystkich $ m,k>n_\eps $ zachodzi nierówność $ |a_m-a_k|<\eps $.

Dowód:
Część I. ($ \Rightarrow $) Niech $ \eps>0 $. Jeśli $ g=\lim_{n\to\infty} a_n $, to istnieje $ n_\eps\in\N $ takie, że $ |a_n-g|<\eps/2 $ dla wszystkich $ n>n_\eps $. Weźmy teraz dwie liczby $ m,k>n_\eps $. Wówczas

\[ |a_m-a_k|=\bigl|(a_m-g)+(g-a_k)\bigr|\le |a_m-g|+|a_k-g|< \frac \eps 2 + \frac \eps 2 =\eps\, . \]

Zatem ciąg $ (a_n) $ spełnia warunek (C) - właśnie pokazaliśmy, jak dobrać $ n_\eps $ do liczby $ \eps>0 $.

  Część II. ($ \Leftarrow $) Łatwo sprawdzić, że każdy ciąg spełniający (C) jest ograniczony: stosujemy warunek Cauchy'ego dla $ \eps=1 $ i widzimy, że dostatecznie duże wyrazy różnią się o mniej niż 1, a więc muszą zawierać się w pewnym przedziale, np. przedziale $ (a_{n_1+1}-1,a_{n_1+1}+1) $; skończony zbiór wyrazów $ a_1,\ldots, a_{n_1} $ też jest ograniczony.

Stosujemy zatem twierdzenie Bolzano-Weierstrassa i wybieramy z $ (a_n) $ podciąg $ a_{n_k}\to g\in\R $ dla $ k\to\infty $. Pokażemy, że $ g $ jest granicą całego ciągu $ (a_n) $. Niech $ \eps>0 $. Istnieje takie $ l_1\in\N $, że

\[ |a_{n_k}-g|<\frac \eps 2 \qquad\mbox{dla $n_k>l_1$}, \]

a ponadto istnieje takie $ l_2\in\N $,że $ |a_m-a_k|<\eps/2 $ dla $ m,k>l_2 $. Niech $ l_3=\max(l_1,l_2) $. Ustalając jakikolwiek numer $ n_k>l_3\ge l_1 $ i biorąc dowolne $ m>l_3\ge l_2 $, możemy oszacować

\[ |a_m-g|=|a_m-a_{n_k}+ a_{n_k}-g|\le |a_m-a_{n_k}|+ |a_{n_k}-g|  < \frac \eps 2 + \frac \eps 2 =\eps\, .                               \]

To kończy dowód twierdzenia.

Warunek Cauchy'ego odgrywa ważną rolę z kilku powodów. Po pierwsze, pozwala stwierdzić zbieżność ciągu bez wskazywania konkretnej granicy, a także pozwala stwierdzić, że jakiś ciąg jest rozbieżny. Proszę zauważyć, że wcześniej, sprawdzając rozbieżność ciągu $ a_n=(-1)^n $, sprawdziliśmy tak naprawdę, że warunek Cauchy'ego nie zachodzi dla $ \eps=1 $. Po drugie, można posłużyć się warunkiem Cauchy'ego, żeby skonstruować liczby rzeczywiste, mając do dyspozycji liczby wymierne; jest to konstrukcja na tyle ogólna, że używa się jej w wielu działach matematyki - do tej sprawy wrócimy jeszcze przy innej okazji.

Stwierdzenie [kryterium spełniania warunku Cauchy'ego] Załóżmy, że $ a_1,a_2,\ldots $ są dodatnie, a ponadto istnieje taka stała $ C\in \R $, że

\[ s_n=a_1+a_2+\cdots +a_n \le C \quad\mbox{dla wszystkich $n\in\N$.} \]

Jeśli ciąg $ (x_n)\subset \R $ spełnia warunek

\[ |x_{n+1}- x_n|\le a_n \qquad \mbox{dla dostatecznie dużych $n\in\N$,} \]

to $ (x_n) $ spełnia warunek Cauchy'ego.

Dowód:
Ciąg $ s_n=a_1+a_2+\cdots +a_n $ jest rosnący (bo $ a_j $ są dodatnie) i ograniczony z góry przez $ C $. Zatem $ (s_n) $ jest zbieżny i spełnia warunek Cauchy'ego.

Niech $ m>k $ będą dostatecznie duże. Piszemy, korzystając z nierówności trójkąta, założeń i monotoniczności ciągu $ s_n $,

\[ \begin{eqnarray*} |x_m-x_k | &\le& |x_{m}-x_{m-1}| +|x_{m-1}-x_{m-2}|+\cdots+|x_{k+1}-x_k| \\ & \le & a_{m-1}+a_{m-2}+\cdots+a_k \\ & = & s_{m-1} - s_{k-1} = |  s_{m-1} - s_{k-1}|\, . \end{eqnarray*} \]

Niech $ \eps>0 $. Dla wszystkich dostatecznie dużych $ m,k $ mamy $ |x_m-x_k| \le |s_{m-1} - s_{k-1}|<\eps $, gdyż $ (s_n) $ spełnia warunek Cauchy'ego. Zatem $ (x_n) $ też spełnia warunek Cauchy'ego.

Przykład Nietrudno zauważyć, że jeśli dla danego ciągu $ (x_n) $ umiemy wskazać taką stałą $ M>0 $ i taką liczbę $ q\in (0,1) $, że

\[ 	 |x_{n+1}-x_n| \le Mq^n  \qquad \mbox{dla dostatecznie dużych $n\in\N$,} 	\]

to założenia powyższego stwierdzenia są spełnione. Istotnie, biorąc wtedy $ a_n=Mq^n $ mamy

\[ 	s_n=Mq+Mq^2+\cdots + Mq^n = Mq\frac{1-q^n}{1-q}\le \frac{Mq}{1-q}\quad \mbox{dla wszystkich $n\in\N$.} 	\]

To wynika ze szkolnego wzoru na sumę skończonego postępu geometrycznego; patrz także Lemat~ [link] i szkic jego dowodu.

Ćwiczenie [wzór na sumę szeregu geometrycznego] Proszę wykazać, że jeśli $ |q|<1 $, to

\[ 	\lim_{n\to\infty} (1+q+\cdots +q^{n-1}) = \frac{1}{1-q}   	\, . 	\]

Funkcja wykładnicza i logarytm

Potrafimy już definiować potęgi liczb dodatnich o wykładniku wymiernym: jeśli $ a>0 $ i $ x=p/q\in\Q $ dla $ p,q\in \N $, to naturalnie jest przyjąć

\[ a^x= \left(a^{1/q}\right)^p= \underbrace{a^{1/q}\cdot \ldots a^{1/q}}_{p\ \text{razy}}\, , \qquad a^{-x}=\frac{1}{a^x}  \, . \]

Zasdadniczym celem tego rozdziału jest wskazanie, jak można określać potęgę $ a^x $ liczby $ a>0 $ o dowolnym wykładniku rzeczywistym $ x $ - także niewymiernym, i jak określić logarytm, to znaczy funkcję, która dla danych liczb dodatnich $ y,a $, $ a\not=1 $, wskazuje taką liczbę $ x\in\R $, że $ a^x=y $.

Poznamy przy okazji cały szereg fundamentalnych własności tych funkcji. Jak Czytelnik być może zauważy, w nazwach niektórych z tych własności figurują takie słowa jak ciągłość i różniczkowalność. Na razie to tylko terminy; pełną treść nadamy im wtedy, gdy zajmiemy się bliżej systematycznym badaniem własności funkcji ciągłych i funkcji różniczkowalnych.

    Uwaga. W jednym z późniejszych rozdziałów zajmiemy się wprowadzeniem funkcji wykładniczej w dziedzinie zespolonej. Do tego jednak przyda się nam nieco więcej narzędzi.

Funkcja wykładnicza

Lemat [o ciągach szybko zbieżnych do 1] (#) Załóżmy, że $ (a_n) $ jest ciągiem liczb rzeczywistych takim, że $ na_n\to 0 $ dla $ n\to \infty $. Wtedy

\[ \lim_{n\to\infty} (1+a_n)^n=1\, . \]

Dowód:
Ponieważ $ na_n\to 0 $, więc $ |a_n|\le |na_n|<1/2 $ i $ |a_n|<\frac 12 <|1+a_n| $ dla dostatecznie dużych $ n $; dla takich $ n $ skorzystamy dwukrotnie z nierówności Bernoulliego. (Czytelnik zechce sprawdzić, że dzięki poprzedniemu zdaniu wszystkie założenia tej nierówności są spełnione). Po pierwsze,

\[ \frac{1}{(1+a_n)^n} = \left(1-\frac{a_n}{1+a_n}\right)^n  \ge 1-   \frac{na_n}{1+a_n}\, . \]

Po drugie,

\[ (1+a_n)^n\ge 1+na_n>0, \qquad \mbox{więc}\qquad  \frac 1{(1+a_n)^n} \le \frac 1{1+na_n}\, . \]

Zatem, dla wszystkich dostatecznie dużych $ n $,

\[ 1-   \frac{na_n}{1+a_n}\le  \frac 1{(1+a_n)^n} \le \frac 1{1+na_n} \]

Ponieważ $ na_n\to 0 $ (i oczywiście tym bardziej $ a_n\to 0 $) dla $ n\to \infty $, więc teza lematu łatwo wynika z twierdzenia o 3 ciągach.

Twierdzenie [własności funkcji wykładniczej](#) Dla każdego $ x\in \R $ ciąg

\[ 	a_n(x)=\left(1+\frac xn\right)^n \, , \qquad n\in \N \, , 	 \]

jest zbieżny do granicy $ a(x)\in \R $, która ma następujące własności:

  1. $ a(x)>0 $ dla każdego $ x\in\R $ i $ a(0)=1 $;
  2. $ a(x)a(y)=a(x+y) $ dla wszystkich $ x,y\in \R $;
  3. $ a(x)\ge 1+x $ dla każdego $ x\in \R $;
  4. (Monotoniczność): $ a(x)>a(y) $ dla wszystkich $ x>y $;
  5. $ a(x) \le 1/(1-x) $ dla każdego $ x<1 $;
  6. $ |a(x)-1-x|\le 2|x|^2 $ dla każdego $ |x|\le\frac 12 $;
  7. (Ciągłość): jeśli $ x_n\to x\in\R $, to $ a(x_n)\to a(x) $;
  8. (Różniczkowalność): jeśli $ h_n\to 0 $ i $ h_n\not=0 $ dla $ n\in \N $, to
    \[ \lim_{n\to\infty} \frac{a(x+h_n)-a(x)}{h_n}=a(x) \]

Dowód:
Plan postępowania jest taki: wykażemy, że granica $ a(x) $ ciągu $ a_n(x) $ istnieje dla każdego $ x $, a potem stopniowo będziemy dowodzić jej własności.

Krok 1. Najpierw sprawdzimy, że ciąg $ a_n(x) $ jest monotoniczny od pewnego miejsca. Ustalmy $ x\in\R $. Rozpatrujemy odtąd tylko $ n>|x| $; wtedy $ (n+x)/n=1+\frac xn> 0 $ i $ a_n(x)>0 $, zatem

\[ a_{n+1}\ge a_n \quad\Leftrightarrow \quad \frac{a_{n+1}}{a_n}\ge 1                   \quad\Leftrightarrow \quad \frac{\left(1+\displaystyle\frac x{n+1}\right)^{n+1} }{\left(1+\displaystyle\frac xn\right)^{n+1}}\ge \frac 1{1+\frac xn} = \frac n{n+x} \, . \]

Zapiszmy iloraz potęg, występujący w ostatnim wyrażeniu, w postaci $ (1+\cdots)^{n+1} $ i skorzystajmy wtedy z nierówności Bernoulliego:

\[ \begin{eqnarray*} \frac{\left(1+\displaystyle\frac x{n+1}\right)^{n+1} }{\left(1+\displaystyle\frac xn\right)^{n+1}}  &=& \left(\frac{(n+1+x)n}{(n+1)(n+x)}\right)^{n+1} \ =\  \left(1-\frac{x}{(n+1)(n+x)}\right)^{n+1}  \\ & & {}\qquad\mbox{gdyż ${(n+1)(n+x)}-x = (n+1+x)n$}  \\[5pt] & \ge & 1- \frac{x}{(n+x)} = \frac n{n+x}\, .     \end{eqnarray*} \]

(Dla $ x<0 $ oczywiście wolno było nierówność Bernoulli'ego stosować; dla $ x\ge 0 $ jest $ |\frac{x}{(n+1)(n+x)}|\le \frac{x}{(n+x)}\le 1 $). Zatem istotnie ciąg $ a_n(x) $ jest niemalejący dla $ n>|x| $.

Krok 2. Niech $ x<0 $. Wtedy dla $ n>|x| $ zachodzą nierówności

\[ 0< 1+\frac{x}{n} < 1, \qquad 0< a_n(x)=\left(1+\frac{x}{n}\right)^n < 1,  \]

a to znaczy, że ciąg $ a_n(x) $ jest ograniczony. Ponieważ jest niemalejący od pewnego miejsca, więc jest zbieżny, a jego granica $ a(x)>0 $, bo dzięki monotoniczności $ a(x)\ge a_m(x)>0 $ dla $ m>|x| $.

Krok 3. Dla $ x> 0 $ posłużymy się sztuczką. Mianowicie, $ 1-\frac{x^2}{n^2}=(1-\frac xn)(1+\frac xn) $, a zatem dla $ n>|x| $ możemy napisać

\[ a_n(x) = \frac{\left(1-\displaystyle \frac{x^2}{n^2}\right)^n}{a_n(-x)} \, . \]

Z lematu o ciągach szybko zbieżnych do 1 wiemy, że licznik jest zbieżny do 1, a z poprzedniego kroku dowodu - że mianownik jest zbieżny do $ a(-x)>0 $. Zatem, z twierdzenia o granicy ilorazu ciągów, $ a_n(x)\to a(x) = 1/a(-x)>0 $. Dla $ x=0 $ oczywiście $ a_n(0)\equiv 1\to 1 $. To daje istnienie $ a(x) $ dla każdego $ x $ i własność (E1).

Krok 4. Teraz udowodnimy, że własności (E2)-(E6) istotnie przysługują $ a(x) $.

Z twierdzenia o granicy ilorazu

\[ \frac{a(x)a(y)}{a(x+y)}= \lim_{n\to\infty} \frac{ \left( 1+ \displaystyle\frac{x+y}n + \displaystyle\frac{xy}{n^2} \right)^n} {\left( 1+ \displaystyle\frac{x+y}n \right)^n}=\lim_{n\to\infty}   \Biggl(1+ \underbrace{   \frac{\frac{xy}{n^2}}{\, 1+ \frac{x+y}n}\, }_{= \text{\ (ozn.)\ } a_n}\,\,\Biggr)^n \]

Łatwo zauważyć, że $ na_n\to 0 $, więc z lematu o ciągach szybko zbieżnych do 1 otrzymujemy $ a(x)a(y)/a(x+y)=1 $, czyli własność (E2). Ponieważ, dzięki nierówności Bernoulliego, $ a_n(x)\ge 1+x $ dla wszystkich $ n>|x| $ i wszystkich $ x\in\R $, więc na mocy stwierdzenia o szacowaniu granic także $ a(x)\ge 1+x $. To daje własność (E3). Sprawdzimy monotoniczność, czyli własność (E4). Niech $ x>y $. Korzystając z (E1)-(E3) piszemy

\[                              a(x)-a(y)\ \stackrel{\text{(E2)}}= \ a(y)a(x-y)-a(y) \ = \ a(y)(a(x-y)-1) \ \stackrel{\text{(E1), \ (E3)}} \ge a(y) (x-y) > 0 \]

gdyż $ a(y)>0 $ i $ x-y>0 $. Zatem $ a(x)>a(y) $ dla $ x>y $.

Własność (E5) łatwo wynika z (E3) i (E2). Istotnie, $ a(-x)\ge 1-x>0 $ dla $ x<1 $, a więc dla takich $ x $ jest

\[                       a(x)=\frac{1}{a(-x)}\le \frac 1{1-x}\, . \]

Aby wykazać (E6), stosujemy dla $ |x|\le 1/2<1 $ własności (E3) i (E5):

\[ 0\ \stackrel{\text{(E3)}}\le \ a(x)-1-x \ \stackrel{\text{(E5)}}\le \frac 1{1-x} -1 - x = \frac{1-1+x-x+x^2}{1-x}= \frac{x^2}{1-x}\le 2|x|^2\,  \]

(w ostatniej nierówności używamy warunku $ |x|\le \frac 12 $).

Krok 5. Na koniec wykażemy własności (E7) i (E8). Jeśli $ x_n\to x $, to wówczas $ |x_n-x|^2<|x_n-x|<1/2 $ dla dostatecznie dużych $ n $, więc oznaczając dla krótkości $ r_n=x_n-x $, otrzymujemy z nierówności trójkąta

\[ |a(r_n)-1|   \le |a(r_n)-1-r_n|+|r_n|\ \stackrel{\text{(E6)}}\le \  2r_n^2+ |r_n|\le 3|r_n|=3|x_n-x|\, .             \]

Zatem, posługując się twierdzeniem o 3 ciągach, łatwo wnioskujemy, że $ a(x_n-x)=a(r_n)\to 1 $ dla $ n\to \infty $. Ponadto,

\[                                                      0\le |a(x_n)-a(x)|  \ \stackrel{\text{(E2)}}= \ |a(x)|\,\cdot\, |a(x_n-x) - 1| ,  \]

więc także $ a(x_n)\to a(x) $.

Została nam ostatnia własność, (E8). Piszemy

\[  \frac{a(x+h_n)-a(x)}{h_n}\ \stackrel{\text{(E2)}}=\ \frac{a(x)a(h_n)-a(x)}{h_n}   = a(x)  \cdot \underbrace{\frac{a(h_n)-1}{h_n}}_{= \text{\ (ozn.)\ } U_n}\equiv a(x)\cdot U_n\, . \]

Skoro $ h_n\to 0 $, to dla dostatecznie dużych $ n $ jest $ |h_n|<1/2 $ i wtedy

\[ 0\le |U_n-1| = \left|\frac{a(h_n)-1}{h_n}-1\right|=\left| \frac{a(h_n)-1-h_n}{h_n}    \right| \ \stackrel{\text{(E6)}}\le \  \frac{2|h_n|^2}{|h_n|}   =2|h_n|\to 0, \]

a więc $ U_n\to 1 $ dla $ n\to \infty $. Zatem, $ a(x)U_n\to a(x) $ dla $ n\to \infty $, a to właśnie należało udowodnić.

Dowód całego twierdzenia jest teraz zakończony.

Definicja [liczba $ e $ i funkcja $ \exp $] Kładziemy

\[ 	e=a(1)=\lim_{n\to\infty} \left( 1+ \frac 1n\right)^n = 2,\! 718281828459045\ldots     \]

Dla $ x\in \R $ piszemy także $ \exp(x)=a(x) $, gdzie $ a(x)=\lim_{n\to\infty}(1+\frac xn)^n $. Funkcja $ \exp $ nazywa się funkcją wykładniczą (zmiennej rzeczywistej).

Zatem,

\[ e=\exp(1) \, . \]

(Warto zauważyć, że wszystkie przytoczone wyżej cyfry rozwinięcia dziesiętnego $ e $ znał Leonhard Euler przed 1750 rokiem!)

Wiemy już o funkcji wykładniczej bardzo wiele. Udowodnimy jeszcze jedną jej własność: każda liczba dodatnia jest wartością tej funkcji.

Stwierdzenie Dla każdego $ y>0 $ istnieje dokładnie jedna liczba $ x\in \R $ taka, że $ y=\exp(x) $.

Dowód:
Wystarczy przeprowadzić dowód dla $ y\in (0,1) $, gdyż $ 1=\exp(0) $ i jeśli $ z>1 $, to $ 1/z=y\in (0,1) $, więc z równości $ y=\exp(x) $ i $ \exp(x)\exp(-x)=1 $ wynika, że $ \exp(-x)=z $.

Niech przeto $ y\in (0,1) $. Połóżmy $ A=\{t\in \R\colon \exp(t)\le y\} $. Jeśli $ t\ge 0 $, to dzięki (E3) jest $  \exp(t)\ge 1+t \ge 1 >y,  $ a więc $ t\not \in A $, tzn. $ A\subset (-\infty,0) $. Ponadto, dla $ n\in \N $ mamy, z własności (E5) użytej dla $ x=-n $,

\[ \exp(-n)\le \frac{1}{1+n}, \]

a więc $ -n\in A $ dla wszystkich $ n $ dostatecznie dużych (wystarczy, by $ 1/(1+n)<\exp(y) $, tzn. aby $ n+1>\exp(-y) $). Zatem zbiór $ A $ jest niepusty i ograniczony z góry, a więc istnieje $ x=\sup A\in \R $. A priori, są trzy możliwości:

\[ \exp(x) > y, \qquad \exp(x) < y, \qquad\exp(x)=y\, . \]

Wykażemy, że pierwsze dwie prowadzą do sprzeczności. Przypuśćmy więc, że $ \exp(x)<y $. Z własności (E7) wynika, że dla $ n\to \infty $ ciąg $ \exp(x+\frac 1n)\to \exp(x) <y $, a więc, dzięki Stwierdzeniu~ [link], $ \exp(x+\frac 1n)<y $ dla wszystkich dostatecznie dużych $ n $. Innymi słowy, $ \sup A=x< x+\frac 1n\in A $, to zaś jest sprzeczność. Nie może więc być $ \exp(x)<y $.

Gdyby $ \exp(x)>y $, to, podobnie jak przed chwilą, mielibyśmy $ \exp(x-\frac 1n)\to\exp(x)>y $, tzn. dla wszystkich dostatecznie dużych $ n $ byłoby

\[ \exp \bigl(x-\frac 1n\bigr) > y\ge \exp t \qquad\mbox{dla każdego $t\in A$.} \]

Z monotoniczności, patrz własność (E4), otrzymalibyśmy $ x-\frac 1n>t $ dla każdego $ t\in A $, ale $ x-\frac 1n<x=\sup A $, więc byłaby to sprzeczność z definicją kresu górnego.

Musi zatem być $ \exp(x)=y $. Jednoznaczność wynika z monotoniczności $ \exp $.

Definicja [logarytm naturalny] Dla liczby $ y>0 $ definiujemy: $ \ln y=x $, gdzie $ x\in\R $ jest jedyną liczbą taką, że $ \exp(x)=y $.

Własności funkcji wykładniczej nietrudno przełożyć na odpowiednie własności logarytmu naturalnego.

Twierdzenie [własności logarytmu naturalnego] (#) Logarytm naturalny $ \ln y $ jest określony dla wszystkich liczb $ y>0 $ i ma następujące własności:

    {(L\arabic{enumi)}}

  1. Dla wszystkich $ x,y>0 $ jest $ \ln (xy)=\ln x + \ln y $; $ \ln e =1 $ i $ \ln 1 = 0 $.
  2. (Monotoniczność logarytmu) Dla wszystkich $ y_1>y_2>0 $ mamy $ \ln y_1>\ln y_2 $.
  3. Dla wszystkich $ y>0 $ zachodzą nierówności
    \[ 1-\frac 1y \le\ln y \le y-1\, . \]

    Równoważnie,

    \[ \frac{t}{t+1} \le \ln (1+t) \le t \qquad \mbox{dla wszystkich $t>-1$.} \]
  4. Jeśli $ t_n>-1 $ dla wszystkich $ n\in N $ i $ t_n\to 0 $, to $ \ln(1+t_n)\to 0=\ln 1 $.
  5. (Ciągłość logarytmu) Jeśli $ y_n>0 $ dla wszystkich $ n\in \N $ i $ y_n\to y>0 $ dla $ n\to\infty $, to wówczas $ \ln y_n\to\ln y $ dla $ n\to \infty $.
  6. (Różniczkowalność logarytmu) Jeśli $ h_n\to 0 $ dla $ n\to\infty $, a także $ y>0 $ i $ y+h_n>0 $ dla wszystkich $ n\in\N $, to wówczas
    \[ \lim_{n\to \infty}\frac{\ln (y+h_n)-\ln y}{h_n} = \frac 1y\, . \]

Dowód:
Udowodnimy (L1). Ponieważ $ x,y>0 $, więc istnieją $ t,w\in \R $ takie, że $ \exp (t)=x $, $ \exp w = y $ (czyli: $ t=\ln x $, $ w=\ln y $). Z własności (E2) funkcji $ \exp $ otrzymujemy

\[ xy=\exp(t)\exp(w)=\exp(t+w), \]

tzn. wprost z definicji logarytmu $ \ln xy= t+w=\ln x+\ln y $. Równości $ \ln e = 1 $, $ \ln 1 =0 $ wynikają stąd, że $ \exp(1)=e $, $ \exp(0)=1 $. Nietrudno zauważyć, że logarytm jest monotoniczny: gdyby $ x_1=\ln y_1\le \ln y_2=x_2 $ dla pewnych $ y_1>y_2>0 $, to byłoby, dzięki monotoniczności funkcji wykładniczej, $ y_1 = \exp (x_1) \le \exp(x_2) = y_2 $, a to jest sprzeczność.

Teraz sprawdzimy, że zachodzą nierówności podane w punkcie (L3). Niech $ x=\ln y $. Mamy $ \exp (x)\ge 1 + x  $, tzn. $  \ln y = x\le \exp (x) - 1  = y-1  $. Ponieważ $ \exp(x)< 1/(1-x) $ dla $ x<1 $, a z monotoniczności wynika, że $ \ln y<1 $ wtedy i tylko wtedy, gdy $ y<e $, więc przy dodatkowym założeniu $ x=\ln y <1 $, $ y>0 $, jest

\[ y=\exp(x)\le \frac{1}{1-x}=\frac{1}{1-\ln y}  \quad\Leftrightarrow\quad \frac 1y\ge 1-\ln y   \quad\Leftrightarrow\quad \ln y \ge 1-\frac 1y\, . \]

Gdy $ x=\ln y\ge 1 $, to nierówność jest banalna, gdyż $ 1-1/y< 1 $ dla $ y>0 $. To kończy dowód pierwszej wersji (L3); drugą otrzymujemy, podstawiając $ y=1+t $ (zauważmy: $ y>0 $ wtedy i tylko wtedy, gdy $ t>-1 $). Własność (L4) jest bardzo prosta. Otrzymujemy ją, stosując nierówności z punktu (L3) i twierdzenie o trzech ciągach.

Przejdźmy do dowodu ciągłości, tzn. do własności (L5). Ponieważ logarytm iloczynu jest sumą logarytmów, więc

\[ \ln y_n-\ln y =  \ln \left(y\cdot \Bigl(1+\frac{y_n-y}{y}\Bigr)\right) - \ln y = \ln \Bigl(1+\underbrace{\frac{y_n-y}{y}}_{=\ \text{(ozn.)}\ t_n} \Bigr), \]

gdzie $ -1<t_n=(y_n-y)/y=-1+\frac{y_n}{y}\to 0 $, gdy $ y_n\to y $. Wiemy już jednak, że $ \ln (1+t_n)\to 0 $ dla każdego ciągu $ t_n \to 0 $, $ t_n>-1 $; zatem $ \ln y_n\to \ln y $, gdy $ y_n,y>0 $ i $ y_n\to y $ dla $ n\to\infty $. To kończy dowód własności (L4).

Na koniec wykażemy różniczkowalność logarytmu. Zauważmy, że

\[ \frac{\ln(y+h_n)-\ln y}{h_n} = \frac{\ln y+ \ln\Bigl(1 + \displaystyle \frac{h_n}{y}\Bigr)-\ln y}{h_n} = \frac{\ln(1+t_n)}{t_n}\cdot \frac 1 y \qquad \mbox{dla }t_n=\frac{h_n}y\not=0, \]

Wystarczy więc wykazać, że dla każdego ciągu $ t_n\to 0 $, gdzie $ t_n\not=0 $ i $ t_n>-1 $ dla wszystkich $ n\in\N $, mamy $ \frac 1 {t_n}\ln(1+t_n)\to 1 $. Oznaczmy $ s_n=\ln(1+t_n) $; wtedy $ \exp(s_n)-1=t_n $ i $ s_n\not=0 $. Zatem

\[ \frac{\ln (1+t_n)}{t_n}=\frac{s_n}{\exp(s_n)-1}. \]

Sprawdziliśmy przed chwilą, dowodząc własności (L4), że $ s_n=\ln(1+t_n)\to 0 $. Korzystając z różniczkowalności funkcji wykładniczej, patrz własność (E8), wnioskujemy, że $ s_n/(\exp (s_n)-1)\to 1 $ dla $ n\to \infty $. Zatem także $ \frac 1 {t_n}\ln(1+t_n)\to 1 $.

Dysponując już funkcją wykładniczą i logarytmem, nietrudno jest zdefiniować potęgę dowolnej liczby dodatniej o dowolnym wykładniku rzeczywistym.

Definicja Dla wszystkich $ a>0 $ i wszystkich $ x\in\R $ przyjmujemy

\[ 	a^x=\exp(x\ln a)\, . 	\]

W szczególności, dla liczby $ e $ przyjęta definicja daje, zgodnie z naturalnym oczekiwaniem, $ e^x=\exp(x\ln e)=\exp(x) $, gdyż $ \ln e=1  $. Zauważmy też od razu, że dla $ n\in \N $ jest, dzięki własności (L1) logarytmu,

\[ a^n=\exp(n\ln a) = \exp\bigl(\underbrace{\ln a+ \ln a+\cdots +\ln a}_{n\ \text{razy}})  =\exp(\ln(a\cdot a\cdot \ldots \cdot a)) = \underbrace{a\cdot a\cdot\ldots\cdot a}_{n\ \text{razy}},              \]

co zgadza się ze zwykłą definicją potęgi o wykładniku naturalnym. Nietrudno podać listę własności potęg, podawaną na ogół w szkole (Odbywa się to zwykle bez wyjaśnienia, jak należy rozumieć napis $ a^x $, gdy liczba $ x $ nie jest wymierna, i dlaczego wtedy odpowiednie równości mają sens - prawda jest taka, że nie da się wtedy uniknąć jakiejś wersji przejść granicznych\ldots)

Ćwiczenie Niech $ a,b>0 $, $ x,y\in\R $. Proszę samodzielnie, korzystając z (E1)-(E8) oraz (L1)-(L5), udowodnić następujące własności potęg:

  1. $ a^{x+y}=a^xa^y $, a ponadto $ a^{-x}=1/a^x $ i $ a^0=1 $.
  2. $ \bigl(a^x\bigr)^y=a^{xy} $ i $ a^xb^x=(ab)^x $.
  3. Jeśli $ a>1 $, to $ a^x<a^y $ dla wszystkich $ x<y $, a jeśli $ a\in (0,1) $, to $ a^x>a^y $ dla wszystkich $ x<y $.
  4. Jeśli ciąg $ x_n\to x $ dla $ n\to \infty $, to wówczas $ a^{x_n}\to a^x $ dla $ n\to\infty $.
  5. Jeśli $ a<b $, to $ a^x<b^x $ dla wszystkich $ x>0 $ oraz $ a^x>b^x $ dla wszystkich $ x<0 $.

Możemy także zdefiniować logarytm przy dowolnej podstawie $ a>0 $, $ a\not=1 $.

Definicja Jeśli $ a>0 $ i $ a\not =1 $, to dla wszystkich $ y>0 $ przyjmujemy

\[ 	\log_a y = x \quad\Leftrightarrow \quad a^x = y\, . 	\]
Ćwiczenie Posługując się udowodnionymi już własnościami funkcji wykładniczej i logarytmu, sprawdzić, że powyższa definicja jest poprawna (tzn. przy podanych założeniach o $ a $ i $ y $ liczba $ \log_a y $ istnieje i jest określona jednoznacznie). Dlaczego przyjmujemy, że $ a\not=1 $?
Ćwiczenie Posługując się znanymi własnościami potęg i logarytmu naturalnego, wykazać, że logarytm przy dowolnej podstawie $ a>0,a\not=1 $ ma następujące własności:

    {\arabic{enumi})}

  1. $ \log_a y $ = $ (\ln y)/(\ln a) $ dla wszystkich $ y>0 $.
  2. Jeśli $ b>0,b\not=1 $, to $ \log_a y=(\log_b y )/(\log_b a) $ dla wszystkich $ y>0 $.
  3. $ \log_a(xy)=\log_a x+ \log_a y $ dla wszystkich $ x,y>0 $.
  4. $ \log_a (y^x) = x \log_a y $ dla wszystkich $ y>0 $, $ x\in\R $.

Warunek 2) bywa nazywany wzorem na zamianę podstawy logarytmu.

Charakteryzacja funkcji wykładniczej

Co ciekawe, niewielka część własności funkcji wykładniczej i logarytmu określa każdą z tych funkcji jednoznacznie. Oto odpowiednie twierdzenia.

Twierdzenie [charakteryzacja funkcji $ \exp $] (#) Jeśli funkcja $ f\colon \R\to \R $ spełnia trzy warunki:

  1. Dla wszystkich $ x,y\in \R $ jest $ f(x+y)=f(x)f(y) $,
  2. $ f(1)=e $,
  3. Dla każdego $ x\in\R $ i każdego ciągu $ x_n\to x $ ciąg $ f(x_n) $ jest zbieżny do $ f(x) $,

to wówczas

\[ \begin{equation}   f(x) =\exp(x)\qquad\mbox{dla wszystkich $x\in\R$.} \label{f-exp} \end{equation} \]

Dowód:
Plan dowodu jest bardzo prosty. Korzystając z dwóch pierwszych założeń, dowodzi się, że $ f(x)>0 $ dla wszystkich $ x\in\R $ i sprawdza się równość f-exp dla wszystkich $ x\in\Q $ (niezbyt trudna indukcja). Następnie, korzystając z trzeciego założenia i gęstości $ \Q $ w $ \R $, dowodzi się f-exp dla wszystkich $ x\in\R\setminus\Q $. Oto szczegóły:

Krok 1. Z pierwszego założenia otrzymujemy $ f(x)=f(x/2+x/2)=f(x)^2\ge 0 $ i $ f(0)^2=f(0) $. Liczba $ f(0) $ jest więc zerem lub jedynką. Nie może być jednak $ f(0)=0 $, bo wtedy mielibyśmy $ f(x)=f(x+0)=f(x)f(0)=0 $ dla wszystkich $ x $, a wiemy, że $ f(1)=e $. Zatem $ f(0)=1 $, co oznacza, że $ f(x)f(-x)=f(0)=1 $ dla każdego $ x\in\R $. Innymi słowy, liczba $ f(x) $ jest różna od zera i nieujemna.

Stwierdziliśmy więc, że $ f(x)>0 $ dla wszystkich $ x\in \R $ i $ f(-x)= 1/ f(x) $.

Krok 2. Wiemy, że $ f(1)=e $. Jeśli przyjąć, że $ f(m)=e^m $, to $ f(m+1)=f(m)f(1)=e^me=e^{m+1} $. Przez indukcję wnioskujemy, że $ f(m)=e^m $ dla wszystkich $ m\in N $. Ponadto, dla $ m\in \N $ mamy $ f(-m)e^m=f(-m)f(m)=1 $, tzn. $ f(-m)=e^{-m} $. Zatem

\[ f(m)=e^m =\exp(m) \qquad\mbox{dla wszystkich $m\in \Z$.} \]

Krok 3. Niech $ m,n\in \N $. Wtedy

\[ f\Bigl(\frac 1n\Bigr)^n=f\Bigl(\underbrace{\frac 1n +\cdots +\frac 1n}_{n\ \text{razy}}\Bigr)= f(1) = e, \]

stąd zaś $ f(1/n)=e^{1/n} $. Przez indukcję, podobnie jak w poprzednim kroku stosując własność $ f(x+y)=f(x)f(y) $, dowodzimy teraz, że $ f(m/n)=e^{m/n} $. Wreszcie, ponieważ $ f(-x)=1/f(x) $, więc

\[ f(x)=e^{x} =\exp(x) \qquad\mbox{dla wszystkich $x=p/q\in \Q$.} \]

Krok 4. Niech $ x\in \R\setminus\Q $. Istnieje wtedy (patrz Twierdzenie~ [link]) ciąg liczb wymiernych $ x_n $ zbieżny do $ x $. Z założenia (iii) oraz ciągłości funkcji wykładniczej wnioskujemy, że

\[ f(x)=\lim_{n\to\infty} f(x_n)=\lim_{n\to\infty} \exp(x_n) =\exp(x)\, . \]

Sprawdziliśmy więc, że $ f(x)=\exp(x) $ dla wszystkich $ x\in\R $.

     Uwaga. Drugie założenie Twierdzenia~ [link] ma charakter normalizujący: gdyby przyjąć, że $ f(1)=a>0 $, to byłoby $ f(x)=a^x $. Zamiast zakładać, że $ f(1)=e $, można też przyjąć warunek

    \setcounter{enumi}{1} {(\roman{enumi})'}

  1. Dla każdego ciągu różnych od zera liczb $ x_n\to 0 $ mamy
    \[   \lim_{n\to\infty} \frac{f(x_n)-f(0)}{x_n}=1\, . \]
Zadanie [dla zainteresowanych rozumieniem teorii] Wykazać, że teza Twierdzenia~ [link] zachodzi, gdy założenie (ii) zastąpimy powyższym warunkiem (ii)'. Zastanowić się, czy założenie (iii) można wtedy ominąć.

     Wskazówka: co trzeba zmienić w pierwszym kroku dowodu? Jak wykazać, że $ f(1)=e $? (Wolno używać wszystkich udowonionych własności funkcji wykładniczej).

Zadanie [łatwiejsze od poprzedniego] Naśladując dowód ostatniego twierdzenia, wykazać, że jeśli funkcja $ g\colon (0,\infty)\to \R $ spełnia następujące warunki:

  1. Dla wszystkich $ x,y>0 $ jest $ g(xy)=g(x)+g(y) $,
  2. $ g(e)=1 $,
  3. Dla każdego $ x>0 $ i każdego ciągu liczb dodatnich $ x_n\to x $ ciąg $ g(x_n) $ jest zbieżny do granicy $ g(x) $,

to wówczas

\[   g(x) =\ln(x)\qquad\mbox{dla wszystkich $x\in\R$.} \]

Przekonamy się za pewien czas, że funkcję wykładniczą i logarytm naturalny można określić także dla zespolonych wartości zmiennej. Trzeba to jednak zrobić nieco inaczej (Czytelnik zauważył zapewne, że w dowodach w tym rozdziale wielokrotnie korzystaliśmy z własności ciągów monotonicznych i nierówności Bernoulliego, a tych narzędzi trudno używać w $ \C $). Wygodnie będzie zająć się najpierw szeregami.

Szeregi. Funkcja wykładnicza zmiennej zespolonej.

Pojęcie szeregu wprowadza się po to, żeby można było ściśle mówić o sumach nieskończenie wielu składników. Z takimi sumami spotkaliśmy się już, mówiąc o ciągach. Np. dla $ |q|<1 $ jest

\[ \begin{equation} 	\label{szergeom} 1+q+q^2 +q^3+\cdots = \lim_{n\to\infty}(1+q+\cdots +q^n) =  \lim_{n\to\infty}\frac{1-q^{n+1}}{1-q} =\frac 1{1-q}\, . \end{equation} \]

Pierwszą równość traktujemy jako definicję napisu, występującego z lewej strony; druga równość wynika ze wzoru na różnicę $ (n+1) $-szych potęg, a trzecia - z twierdzenia o arytmetycznych własnościach granicy i stąd, że $ q^n\to 0 $ dla $ n\to \infty $, gdy $ |q|<1 $.

Nieskończone sumowanie wymaga ostrożności: nie wolno w tym przypadku bezkarnie korzystać z przemienności i łączności dodawania. Gdyby np. suma $ -1+1-1+1-1+1-\cdots $ miała skończoną wartość $ S $ i gdyby nieskończone dodawanie było przemienne i łączne, to mielibyśmy

\[ \begin{eqnarray*} S & = & (-1+1)+(-1+1)+(-1+1)+\cdots = 0+0+0+\cdots  \\   & = & -1 + (1-1) + (1-1) +\cdots = -1 + 0 + 0 +\cdots  \\   & = & -1 -\Bigl((-1+1) + (-1+1) +\cdots\Bigr) \end{eqnarray*} \]

tzn. przy, jak się wydaje, naturalnej i sensownej umowie $ 0+0+0+\cdots =0 $, byłoby $ S=0=-1=-1- S $, co pokazuje, że $ S $ byłaby jednocześnie każdą z liczb $ 0,-1,-\frac 1 2 $, tak zaś oczywiście nie może być!

Dlatego zaczniemy od definicji, służących ustaleniu, kiedy można mówić o sumie nieskończenie wielu składników.

Definicja Szereg (liczb rzeczywistych) $ \sum_{n=1}^\infty a_n $ to para ciągów, $ (a_n)\subset \R $ i $ s_n=a_1+\cdots+a_n=\sum_{k=1}^n a_k $ dla $ n\in \N $. Ciąg $ (s_n) $ nazywamy ciągiem sum częściowych szeregu. Liczby $ a_n $ to wyrazy szeregu.
Definicja Mówimy, że szereg $  \sum_{n=1}^\infty a_n\,  $ jest zbieżny wtedy i tylko wtedy, gdy ciąg jego sum częściowych jest zbieżny do skończonej granicy. Jeśli szereg $  \sum_{n=1}^\infty a_n $ jest zbieżny, to liczbę

\[ s=\lim_{n\to\infty} s_n=\lim_{n\to\infty}    \sum_{k=1}^n a_k  \]

nazywamy jego sumą i piszemy (Nadużywamy tu lekko oznaczeń, ale jest to przyjęty i w tym przypadku niegroźny obyczaj; nie będziemy się nadmiernie obawiać pomylenia szeregu z jego sumą.)

\[ s=\sum_{n=1}^\infty a_n\, . \]

Szereg, który nie jest zbieżny, nazywa się rozbieżny.

(Czasem wygodnie jest numerować ciąg wyrazów szeregu za pomocą liczb całkowitych większych od pewnej ustalonej liczby $ n_0\in\Z $; będziemy to robić bez wahania.)

Przykład [szereg geometryczny] Jeśli $ q\in\R $ i $ |q|<1 $, to wtedy szereg geometryczny

\[ 	\sum_{n=0}^\infty q^n 	\]

jest zbieżny, a jego suma jest równa $ 1/(1-q) $. To wynika ze wzoru na sumę skończonego postępu geometrycznego i zostało wyjaśnione, gdy podaliśmy wzór szergeom.

Stwierdzenie [warunek Cauchy'ego] (#) Szereg liczb rzeczywistych $ \sum_{n=1}^\infty a_n\, $ jest zbieżny wtedy i tylko wtedy, gdy spełniony jest następujący warunek Cauchy'ego dla szeregów:

    {(CS)}

  1. Dla każdego $ \eps>0 $ istnieje $ n_\eps\in \N $ takie, że dla wszystkich $ m>k>n_\eps $ jest
    \[ 		|a_{k+1}+a_{k+2}+\cdots+a_m|<\eps\, . 		\]

Dowód:
Mamy $ a_{k+1}+a_{k+2}+\cdots+a_m=s_m-s_k $, więc (CS) to po prostu warunek Cauchy'ego dla ciągu $ (s_n) $, równoważny (jak wiemy) zbieżności $ (s_n) $, czyli - wprost z definicji - zbieżności szeregu.

Dla porządku odnotujmy jeszcze jeden prosty fakt. (Jego sens jest jasny: analizując zbieżność szeregu, wolno odrzucić ustaloną liczbę początkowych wyrazów.)

Stwierdzenie (#) Jeśli $ k_0\in \N $, to szeregi

\[ \sum_{n=1}^\infty a_n \qquad\mbox{oraz}\qquad \sum_{n=k_0}^\infty a_n \]

są albo jednocześnie zbieżne, albo jednocześnie rozbieżne.

Dowód:
Nietrudno zauważyć, że warunek Cauchy'ego albo jednocześnie zachodzi dla obu szeregów, albo nie zachodzi dla żadnego z nich: dla dużych $ m>k>k_0 $ wartości sum $ a_{k+1}+a_{k+2}+\cdots+a_m $ są przecież te same.

Stwierdzenie [suma szeregów] Jeśli szeregi $ \sum a_n $ i $ \sum b_n $ są zbieżne, to szereg $ \sum (a_n+b_n) $ jest zbieżny i

\[ 	 \sum_{n=1}^\infty (a_n+b_n) = \sum_{n=1}^\infty a_n + \sum_{n=1}^\infty b_n\, . 	\]

(#)

Dowód:
To wynika natychmiast z twierdzenia o granicy sumy ciągów zbieżnych.

Stwierdzenie [warunek konieczny zbieżności szeregu] (#) Jeśli szereg liczb rzeczywistych $ \sum_{n=1}^\infty a_n\, $ jest zbieżny, to

\[ 	\lim_{n\to\infty}{a_n} = 0\, . 	\]

Dowód:
Jeśli $ s_n=a_1+\cdots + a_n\to s\in \R $, to $ a_n=s_n-s_{n-1}\to s-s=0 $, gdy $ n\to\infty $.

Przykład Jeśli $ |q|\ge 1 $, to szereg geometryczny

\[ 	\sum_{n=1}^\infty q^n 	\]

jest rozbieżny, gdyż $ a_n=q^n\not\to 0 $ dla $ n\to\infty $, a więc nie jest spełniony warunek konieczny zbieżności szeregu.

    Przestroga. Należy pamiętać, że podany wyżej warunek konieczny zbieżności szeregu nie jest warunkiem dostatecznym: ze zbieżności $ a_n\to 0 $ nie wynika wcale zbieżność szeregu $ \sum a_n $. Istotna jest nie sama zbieżność $ a_n $ do zera, ale tempo tej zbieżności.

Przykład [rozbieżność szeregu harmonicznego] Szereg harmoniczny, tzn. szereg o wyrazach $ a_n=1/n $, gdzie $ n=1,2,\ldots $, jest rozbieżny. Jest to na tyle ważny fakt, że obejrzymy kilka jego dowodów.

    Dowód pierwszy. Dla szeregu harmonicznego nie jest spełniony warunek Cauchy'ego; sumy dalekich wyrazów nie muszą być małe. Istotnie, biorąc $ \eps=1/2 $ i dowolną liczbę $ n $, otrzymujemy

\[ |a_{n+1}+a_{n+2}+\cdots +a_{2n}|= \underbrace{\frac {1}{n+1}+\frac{1}{n+2}+\cdots +\frac{1}{2n}}_{n \ \text{składników}}> n\cdot \frac 1{2n} = \frac 12 = \eps\, . \]

    Dowód drugi. Wiemy już, że dla $ t> -1 $ zachodzą nierówności $ t/(t+1)\le \ln (1+t)\le t $. Podstawiając w nich $ t=1/k $, gdzie $ k\in\N $, otrzymujemy

\[ \frac{1}{k+1}=\frac{\frac 1k}{1+ \frac 1k} \le \ln\left(1+\frac 1k\right) \le \frac 1k. \]

Sumując te nierówności dla $ k=1,2,\ldots, n $, sprawdzamy, że

\[ \frac 12 +\frac 13 + \cdots +\frac 1{n+1}\le \sum_{k=1}^n \ln \left(1+\frac 1k\right) \le 1 +\frac 12 +\frac 13 +\cdots +\frac 1n\, . \]

Jednak $ \ln\left(1+\frac 1k\right)=\ln ((k+1)\cdot \frac 1k) = \ln (k+1)-\ln k $, zatem sumę logarytmów w poprzednim wzorze łatwo jest obliczyć: jest ona równa $ \ln (n+1)-\ln 1 = \ln (n+1) $. Otrzymujemy stąd, oznaczając dla krótkości $ n $-tą sumę częściową szeregu harmonicznego przez $ s_n $,

\[ \begin{equation} \label{sn-harm} s_{n+1} - 1 \le \ln (n+1)\le s_n\, . \end{equation} \]

Ponieważ $ \ln (n+1)\to\infty $ dla $ n\to\infty $, więc $ s_n $ nie ma skończonej granicy, gdy $ n\to\infty $.

Przykład (#) Szereg $ \sum_{n=1}^\infty \frac{1}{n^2} $ jest zbieżny. Istotnie, dla każdej liczby $ n\ge 2 $ mamy

\[ 	\frac{1}{n^2} < \frac 1{(n-1)n} = \frac 1{n-1}-\frac 1n, 	\]

a zatem

\[ s_n=1+\frac{1}{2^2} + \frac 1{3^2}\cdots +\frac 1{n^2} < 1 + \left(1-\frac 12\right) + \left(\frac 12-\frac 13\right) +\cdots + \left(\frac{1}{n-1}-\frac 1n\right) = 2 -\frac 1n < 2. \]

Ciąg $ (s_n) $ sum częściowych tego szeregu jest rosnący (bo wyrazy szeregu są dodatnie) i ograniczony z góry przez liczbę 2, jest więc zbieżny.

Szeregi o wyrazach dodatnich

Badanie zbieżności szeregów o wyrazach dodatnich jest łatwiejsze od badania zbieżności szeregów o dowolnych wyrazach rzeczywistych. W podręcznikach Analizy można znaleźć bardzo wiele tzw. kryteriów zbieżności szeregów, tzn. twierdzeń, podających warunki dostateczne zbieżności (lub rozbieżności) szeregu. Nie będziemy podawać długiej listy takich twierdzeń (Zainteresowanych odsyłam do podręcznika Fichtenholza i książki Knoppa o szeregach nieskończonych.); zadowolimy się skromnym zestawem, który do wielu celów w zupełności wystarcza.

Zacznijmy od banalnej obserwacji.

Stwierdzenie (#) Jeśli $ a_n>0 $ dla wszystkich $ n\in\N $, to szereg

\[ 	\sum_{n=1}^\infty a_n 	\]

jest zbieżny wtedy i tylko wtedy, gdy ciąg sum częściowych $ s_n=a_1+a_2+\cdots+a_n $ jest ograniczony z góry.

Dowód:
Ciąg $ (s_n) $ jest niemalejący, gdyż $ a_n>0 $ dla wszystkich $ n $. Dlatego zbieżność $ s_n $ do granicy skończonej jest równoważna ograniczoności $ s_n $, patrz Twierdzenie~ [link]. Ponieważ $ s_n>0 $, więc trzeba (i wystarcza) sprawdzać tylko ograniczoność z góry.

 

Najprostszy zestaw kryteriów zbieżności szeregów o wyrazach dodatnich w gruncie rzeczy można ograniczyć do dwóch faktów: kryterium porównawczego i kryterium zagęszczeniowego. Każde z nich wykorzystuje jasną, intuicyjną ideę. Sens kryterium porównawczego jest taki, że jeśli można określić sumę pewnego nieskończonego zestawu liczb dodatnich, to można także określić sumę liczb mniejszych (która będzie mniejsza). Kryterium zagęszczeniowe można opisać tak: grupując dodatnie wyrazy, łatwiej jest dostrzec, jak szybko (lub wolno) rosną sumy częściowe szeregu.

Stwierdzenie [kryterium porównawcze, wersja I] Załóżmy, że $ a_n,b_n>0 $ i istnieją takie liczby $ c>0 $ i $ n_0\in\N $, że $ a_n\le c\cdot b_n $ dla wszystkich $ n\ge n_0 $. Wtedy

  1. Ze zbieżności szeregu $ \displaystyle \sum_{n=1}^\infty b_n $ wynika zbieżność szeregu $ \displaystyle \sum_{n=1}^\infty a_n $;
  2. Z rozbieżności szeregu $ \displaystyle \sum_{n=1}^\infty a_n $ wynika rozbieżność szeregu $ \displaystyle \sum_{n=1}^\infty b_n $.

Dowód:
Jeśli $ n_1\ge n_0 $, to dla wszystkich $ m>k>n_1 $ jest, dzięki dodatniości wyrazów obu szeregów,

\[  |a_k+a_{k+1}+\cdots +a_m| \le c |b_k+b_{k+1}+\cdots+ b_m|  \]

(moduły można po prostu pominąć). Jeśli więc warunek Cauchy'ego dla szeregów jest spełniony dla szeregu o wyrazach $ b_n $, to jest spełniony także dla szeregu o wyrazach $ a_n $. Trzeba po prostu ustalić $ \eps>0 $, wziąć dla szeregu o wyrazach $ b_n $ liczbę dodatnią $ \eps'=\eps/c $, dobrać do niej $ n_{\eps'} $ (nie mniejsze od $ n_0 $) i zobaczyć, że dla $ m>k>n_{\eps'} $ będzie wtedy $ |a_k+a_{k+1}\cdots+a_m|<c\eps'=\eps $.

Tak samo sprawdzamy, że jeśli warunek Cauchy'ego nie zachodzi dla szeregu o wyrazach $ a_n $, to nie zachodzi także dla szeregu o wyrazach $ b_n $.

     Uwaga. Jeśli komuś nie podoba się rozumowanie, w którym w sposób jawny korzysta się z warunku Cauchy'ego, może postępować w dowodzie tak: skorzystać ze Stwierdzenia~ [link], odrzucić wyrazy o numerach mniejszych od $ n_0 $ i stwierdzić, że liczba $ M>0 $ jest ograniczeniem górnym zbioru wszystkich sum częściowych szeregu $ \sum_{n\ge n_0} a_n $ wtedy i tylko wtedy, gdy $ M/c $ jest ograniczeniem górnym zbioru sum częściowych szeregu $ \sum_{n\ge n_0} b_n $. To wynika z nierówności $ a_n\le c\cdot b_n $ i dodatniości wyrazów $ a_n,b_n $. Zastosowanie Stwierdzenia~ [link] pozwala zakończyć inny, alternatywny dowód kryterium porównawczego.

Stwierdzenie [kryterium porównawcze, wersja II] Jeśli $ a_n,b_n>0 $ dla wszystkich $ n\ge n_0 $ i istnieje skończona, dodatnia granica $ \lim_{n\to\infty} (a_n/b_n) $, to wówczas szeregi $ \sum a_n $ i $ \sum b_n $ są albo jednocześnie zbieżne, albo jednocześnie rozbieżne.

Dowód:
Można bez zmniejszenia ogólności założyć, że $ n_0=1 $. Wybierzmy liczbę $ C>0 $ tak, aby

\[ \frac 1C < \lim_{n\to\infty} \frac{a_n}{b_n} < C\, . \]

Na mocy Stwierdzenia~ [link] (o szacowaniu granic) istnieje wtedy $ n_1\in\N $ takie, że

\[ a_n < C b_n\quad\mbox{i}\quad b_n < Ca_n \qquad\mbox{dla wszystkich $n>n_1$.} \]

Teza wynika teraz z poprzedniej wersji kryterium porównawczego.

Stwierdzenie [kryterium porównawcze, wersja ilorazowa] (#) Załóżmy, że dla $ n\ge n_0 $ jest $ a_n,b_n>0 $ oraz

\[ \begin{equation}  \label{ilorazy-ab} \frac{a_{n+1}}{a_n}\le \frac{b_{n+1}}{b_n}  \, .  \end{equation} \]

Wtedy

  1. Ze zbieżności szeregu $ \displaystyle \sum_{n=1}^\infty b_n $ wynika zbieżność szeregu $ \displaystyle \sum_{n=1}^\infty a_n $;
  2. Z rozbieżności szeregu $ \displaystyle \sum_{n=1}^\infty a_n $ wynika rozbieżność szeregu $ \displaystyle \sum_{n=1}^\infty b_n $.

Dowód:
Można bez zmniejszenia ogólności założyć, że $ n_0=1 $. Mnożąc nierówności ilorazy-ab stronami dla $ n=1,2,\ldots, N-1 $ otrzymujemy

\[ \frac{a_{N}}{a_1}=\frac{a_{N}}{a_{N-1}}\cdot\ldots \cdot\frac{a_3}{a_2}\cdot \frac{a_2}{a_1}\le  \frac{b_{N}}{b_{N-1}}\cdot\ldots \cdot\frac{b_3}{b_2}\cdot \frac{b_2}{b_1} = \frac{b_{N+1}}{b_1}, \]

a więc $ a_N\le c\cdot b_N $, gdzie $ c=a_1/b_1 $. Są to założenia pierwszej wersji kryterium porównawczego; stosując je, kończymy dowód.

Przykład (#) Jeśli $ q\in (0,1) $, to szereg o wyrazach $ a_n=nq^n $ jest zbieżny. Istotnie, weźmy dowolne $ s\in (q,1) $. Ponieważ $ (n+1)/n\to 1 $, więc dla wszystkich dostatecznie dużych $ n $ jest

\[ \frac{a_{n+1}}{a_n}= \frac{n+1}n q < s= \frac{b_{n+1}}{b_n}, \qquad\mbox{gdzie $b_n=s^n$.} \]

Ponieważ dla każdego $ s\in (0,1) $ szereg geometryczny $ \sum s^n $ jest zbieżny, więc szereg $ \sum nq^n $ jest zbieżny. To wynika z punktu (a) ostatniego kryterium.

Przykład (#) Postępując praktycznie tak samo, jak w poprzednim przykładzie, można stwierdzić, że szereg $ \sum_{n=1}^\infty n^kq^n $, gdzie $ k $ jest ustaloną liczbą naturalną i $ q\in (0,1) $, jest zbieżny.

Przykład Obliczymy sumę szeregu $ \sum_{n=1}nq^n $, posługując się wzorem na sumę postępu geometrycznego. Otóż, zauważając, że $ kq^k $ jest sumą $ k $ składników równych $ q^k $, i grupując wyrazy, otrzymujemy

\[ \begin{eqnarray*} s_n:=q+2q^2+3q^3 + \cdots + nq^n & = & q+q^2+q^3 + \cdots + q^n \qquad\mbox{(w każdym wierszu}\\ & & \phantom{q}     +q^2+q^3 + \cdots + q^n\qquad\mbox{trójkątnej `tabelki' obok} \\     & & \phantom{q     +q^2}+q^3 + \cdots + q^n\qquad\mbox{widać postęp geometryczny!)} \\       [5pt]  & & \phantom{q     +q^2+q^3} + \cdots + \\    [5pt]  & & \phantom{q     +q^2+q^3 + \cdots }+ q^n \\ [5pt] &= & \frac{q-q^{n+1}}{1-q}+ \frac{q^2-q^{n+1}}{1-q} + \frac{q^3-q^{n+1}}{1-q} +\cdots + \frac{q^n-q^{n+1}}{1-q} \\ & = & \frac{1}{1-q}\bigl(q+q^2+\cdots+q^n-nq^{n+1}\bigr) \\ & = & \frac{q-q^{n+1}-nq^{n+1}(1-q)}{(1-q)^2}\ \stackrel{n\to\infty}\longrightarrow \ \frac  {q}{(1-q)^2}, \end{eqnarray*} \]

gdyż $ q^n\to 0 $ i $ nq^n\to 0 $ (można stwierdzić to na wiele sposobów - my w tej chwili możemy już powiedzieć, że wynika to np. ze zbieżności szeregu $ \sum nq^n $, udowodnionej we wcześniejszym przykładzie!). Zatem

\[ \begin{equation} \sum_{n=1}^\infty nq^n = \frac	 {q}{(1-q)^2}\qquad \mbox{dla $q\in (0,1)$.} \end{equation} \]

Czytelnik może sam sprawdzić, że taki sam wzór ma miejsce dla $ q\in (-1,0] $.

Stwierdzenie [kryterium zagęszczeniowe] Jeśli $ (a_n) $ jest malejącym ciągiem liczb dodatnich, to szeregi

\[ 	\sum_{n=1}^\infty a_n \qquad \mbox{oraz} \qquad \sum_{n=1}^\infty b_n\, , \qquad\mbox{gdzie}\quad b_n=2^na_{{2^n}}\, , 	\]

są albo jednocześnie zbieżne, albo jednocześnie rozbieżne.

Dowód:
Niech $ s_n=a_1+a_2+\cdots a_n $, $ t_n=b_1+b_2+\cdots +b_n $. Zauważmy, że dzięki monotoniczności ciągu $ (a_k) $ i równości $ 2^k+2^k=2^{k+1} $ jest  \begin{multline*}  \underbrace{a_{2^{n}+1}+a_{2^{n}+2}+ \cdots + a_{2^{n+1}}}_{ 2^{n} \ \text{składników; każdy jest } \ \le \ a_{2^n}} \,    \le  2^na_{{2^n}}  =   b_n \\  =  2 \cdot 2^{n-1}a_{2^n}\le 2\cdot \biggl(\, \underbrace{a_{2^{n-1}+1}+a_{2^{n-1}+2}+ \cdots + a_{2^n}}_{ 2^{n-1} \ \text{składników; każdy jest } \ \ge \ a_{2^n}} \,    \biggr)\, . \end{multline*}   Sumując te nierówności dla $ n=1,2,\ldots, N $, otrzymujemy

\[  s_{2^{N+1}}-a_1-a_2 \le t_N=\sum_{n=1}^N b_n \le 2 s_{2^N} \]

(proszę zauważyć, że zaczynamy od $ a_3+a_4\le b_1= 2a_2 $, stąd kosmetyczny dodatek $ -a_1-a_2 $ po lewej stronie wyżej). Zatem, ciągi monotoniczne $ (t_N) $ i $ (s_m) $ są albo jednocześnie ograniczone, albo jednocześnie nieograniczone. Teza kryterium zagęszczeniowego wynika więc ze Stwierdzenia~ [link].

Zaleta tego kryterium jest taka, że (dzięki dodatkowemu założeniu o monotoniczności ciągu $ a_n $) szereg o wyrazach $ b_n $ zachowuje się - używając przenośni - tak samo, co szereg o wyrazach $ a_n $, tylko w sposób bardziej oczywisty, łatwiejszy do zauważenia. Najlepiej zobaczyć to na przykładach.

Przykład Oto trzeci dowód rozbieżności szeregu harmonicznego: jeśli $ a_n=1/n $, to

\[ b_n=2^na_{{2^n}} = 2^n\cdot\frac{1}{2^n} = 1, \]

a szereg z samych jedynek jest oczywiście rozbieżny.

Przykład Szereg

\[ 	\sum_{n=2}^\infty \frac{1}{n\ln n} 	\]

jest rozbieżny. Istotnie, dla $ a_n=1/(n\ln n) $ otrzymujemy

\[ b_n=2^na_{{2^n}} = 2^n\cdot\frac{1}{2^n\ln 2^n} = \frac{1}{n \ln 2}, \]

więc rozbieżność rozważanego szeregu wynika z rozbieżności szeregu harmonicznego i kryterium zagęszczeniowego.

Proszę zauważyć, że dla dużych $ n $ liczba $ 1/(n\ln n) $ jest dużo mniejsza od $ 1/n $ (iloraz tych liczb dąży do 0 dla $ n\to \infty $), więc sumy częściowe ostatniego szeregu rosną wolniej niż sumy częściowe szeregu harmonicznego. Jednak dzięki zastosowaniu kryterium zagęszczeniowego, tzn. dzięki odpowiedniemu grupowaniu wyrazów, potrafimy łatwo wykazać rozbieżność.

Przykład (#) Szereg (Suma tego szeregu odgrywa bardzo ważną rolę w teorii liczb i jest nazywana funkcją dzeta Riemanna).

\[ \begin{equation} 			\label{defzeta} 			\zeta(s)=\sum_{n=1}^\infty \frac{1}{n^s} 		\end{equation} \]

jest zbieżny wtedy i tylko wtedy, gdy $ s>1 $. Dla $ s\le 0 $ rozbieżność jest oczywista: nie jest spełniony warunek konieczny zbieżności, gdyż dla takich $ s $ mamy $ a_n=n^{-s}\to+\infty $. Niech więc $ s>0 $. Wyrazy $ a_n=n^{-s} $ maleją do zera; zastosujmy kryterium zagęszczeniowe. Otóż

\[ 	b_n=2^na_{{2^n}} = 2^n\cdot\frac{1}{\bigl(2^n\bigr)^s} = \frac{1}{\bigl(2^{s-1}\bigr)^n} = q^n, \qquad\mbox{gdzie $q=2^{1-s}$,} 	\]

a więc zagęszczenie prowadzi do szeregu geometrycznego $ \sum b_n=\sum q^n $, który (jak już wiemy) jest zbieżny wtedy i tylko wtedy, gdy $ |q|=2^{1-s}<1=2^0 $, tzn. wtedy i tylko wtedy, gdy $ 1-s<0 $.

Przykład Jeśli $ a_n=1/\bigl(n(\ln n)^s\bigr) $, gdzie $ s\in\R  $, to $ \sum a_n $ jest zbieżny wtedy i tylko wtedy, gdy $ s>1 $. Kryterium zagęszczeniowe daje:

\[  b_n=2^na_{{2^n}} = 2^n\cdot\frac{1}{2^n \bigl(\ln (2^n)\bigr)^s} = c\cdot \frac{1}{n^s}, \qquad\mbox{gdzie $c=1/(\ln 2)^s$.} \]

Wystarczy teraz spojrzeć na poprzedni przykład.

Dla porządku odnotujmy też nieco ogólniejszą wersję kryterium zagęszczeniowego.

Stwierdzenie [kryterium zagęszczeniowe, wariant ogólny] Jeśli $ (a_n) $ jest malejącym ciągiem liczb dodatnich, a $ k\in \N $, $ k\ge 2 $, to szeregi

\[ 	\sum_{n=1}^\infty a_n \qquad \mbox{oraz} \qquad \sum_{n=1}^\infty b_n\, , \qquad\mbox{gdzie}\quad b_n=k^na_{{k^n}}\, , 	\]

są albo jednocześnie zbieżne, albo jednocześnie rozbieżne.

Dowód:
Niezbyt trudne ćwiczenie dla zainteresowanych.

Warto zdawać sobie sprawę, że istnieją przykłady, które wymagają nieco subtelniejszej analizy, nie polegającej na szybkim stosowaniu gotowych kryteriów. Popatrzmy na dwa z nich.

Przykład Niech $ p_n $ oznacza $ n $-tą z kolei liczbę pierwszą, tzn. $ p_1=2 $, $ p_2=3 $, $ p_3=5 $, $ p_4=7 $, $ p_5=11 $, \ldots Wykażemy, że szereg

\[ \begin{equation} \sum_{n=1}^\infty \frac 1{p_n} \label{1przezp} \end{equation} \]

jest rozbieżny. Ustalmy liczbę $ N $. Niech $ {\mathcal P}_N=\{p\ \colon p\mbox{ pierwsza, }p\le N\} $. Wtedy

\[ \begin{eqnarray*} 	\exp\biggl(\sum_{p\in {\mathcal P}_N}\frac 1p\biggr) & = & \prod_{p\in {\mathcal P}_N} \exp(1/p) \\ 	&\ge &       \prod_{p\in {\mathcal P}_N} \left(1+\frac 1p\right) \qquad\mbox{gdyż $\exp(x)\ge 1+x$}\\   	&\ge & \sum_{{1\le n \le N} \atop{ n \ \text{bezkwadr.}}}\frac 1n \, . \end{eqnarray*} \]

W ostatniej linijce występuje suma odwrotności wszystkich liczb bezkwadratowych (Mówimy, że $ n $ jest liczbą bezkwadratową, jeśli $ n $ nie dzieli się przez żaden pełny kwadrat różny od 1; równoważnie, $ n $ jest liczbą bezkwadratową, gdy jest iloczynem różnych liczb pierwszych.) $ n $, $ n\le N $; nietrudno zauważyć, że mnożąc wszystkie nawiasy $ (1+\frac 1p) $ szkolną metodą `każdy z każdym', otrzymamy tylko odwrotności liczb bezkwadratowych: wszystkich liczb bezkwadratowych $ {}\le N $ i niektórych liczb bezkwadratowych $ {}>N $.

Wiemy już, że $ 2> \sum_{1\le n\le N} \frac 1{n^2} $ dla każdego $ N $ (patrz Przykład~ [link]); mnożąc tę nierówność przez poprzednią, otrzymujemy

\[ \begin{eqnarray*}    2 \exp\biggl(\sum_{p\in {\mathcal P}_N}\frac 1p\biggr)  & \ge & \biggl(\sum_{{1\le n \le N} \atop{ n \ \text{bezkwadr.}}}\frac 1n \biggr)\cdot \biggl(\sum_{1\le n \le N}\frac{1}{n^2}\biggr) \\     & \ge & \sum_{n=1}^N \frac 1n \ \stackrel{\eqref{sn-harm}}\ge \ \ln (N+1)\, . \end{eqnarray*} \]

Zatem

\[ \sum_{p\in {\mathcal P}_N}\frac 1p \ge \ln\ln(N+1) -\ln 2, \]

a więc sumy częściowe szeregu 1przezp nie są ograniczone. (Rozbieżność szeregu odwrotności liczb pierwszych wykazał L. Euler w 1737 roku, w nieco inny sposób od zaprezentowanego tutaj.)

Przykład [szereg Kempnera] Niech $ {\mathcal A} $ będzie zbiorem tych liczb naturalnych, w których zapisie dziesiętnym w ogóle nie występuje cyfra 9. Wtedy szereg

\[ \sum_{n\in {\mathcal A}} \frac 1n \]

jest zbieżny, a jego suma $ S $ nie przekracza liczby 80. Aby się o tym przekonać, oznaczmy

\[ {\mathcal A}_N = {\mathcal A}\cap [10^{N-1},10^{N}-1] \]

(jak widać, $ {\mathcal A}_N $ to podzbiór $ {\mathcal A} $ złożony z liczb $ N $-cyfrowych). Liczba elementów $ {\mathcal A}_N $ jest równa

\[ \#{} {\mathcal A}_N  = 8\cdot 9^{N-1}, \]

gdyż pierwszą cyfrę różną od dziewiątki, niezerową, można wybrać na 8 sposobów, a każdą z $ N-1 $ kolejnych na 9 sposobów. Zatem

\[ \sum_{n\in {\mathcal A}_N}  \frac 1n \le   8\cdot 9^{N-1} \cdot \frac{1}{10^{N-1}} = 8 \left(\frac 9{10}\right)^{N-1}\, . \]

Sumując te nierówności, nietrudno stwierdzić, że $ S\le 80= 8\sum q^j $, gdzie $ q=9/10\in (0,1) $, a indeks $ j=N-1 $ przybiera wartości $ 0,1,2,\ldots $

Podamy, na zakończenie tego podrozdziału, jeszcze jedno bardzo ogólne kryterium zbieżności szeregów o wyrazach dodatnich.

Stwierdzenie [kryterium Kummera] Załóżmy, że $ a_n>0 $ dla wszystkich $ n>n_1 $. Wówczas szereg $ \sum a_n $ jest zbieżny wtedy i tylko wtedy, gdy istnieje taka liczba $ \theta>0 $ oraz liczby nieujemne $ b_n $, że

\[ \begin{equation} 	\label{kummer} 	b_n\cdot\frac{a_n}{a_{n+1}} -b_{n+1}\ge \theta\qquad\mbox{dla wszystkich $n\ge n_0$.}  \end{equation} \]

Dowód:
Jeśli szereg $ \sum a_n $ jest zbieżny, to przyjmujemy $ b_n=(1/a_n)\cdot\sum_{k=n+1}^\infty a_k $ dla $ n>n_1 $. Wtedy

\[ b_n\cdot  \frac{a_n}{a_{n+1}} -b_{n+1} = \frac{1\cdot a_n}{a_n\cdot a_{n+1}} \sum_{k=n+1}^\infty a_k -  \frac{1}{a_{n+1}}\sum_{k=n+2}^\infty a_k = \frac{a_{n+1}}{a_{n+1}} = 1, \]

więc warunek kummer zachodzi dla $ \theta=1 $ i $ n\ge n_1 $. Na odwrót, stosując kummer dla $ n\ge n_2=\max(n_0,n_1) $, otrzymujemy

\[ \begin{equation} a_nb_n-a_{n+1}b_{n+1} \ge \theta a_{n+1} > 0 \label{kummer-przekszt} \end{equation} \]

więc począwszy od miejsca $ n_2 $ ciąg $ a_nb_n $ jest malejący i ma wyrazy dodatnie, tzn. ma granicę skończoną. Przeto szereg o wyrazach $ \theta^{-1}(a_nb_n-a_{n+1}b_{n+1}) $ jest zbieżny: jego sumy częściowe to $ s_N=\theta^{-1}(a_1b_1-a_Nb_N) $. Z kryterium porównawczego i nierowności kummer-przekszt wynika teraz zbieżność szeregu $ \sum a_n $.

Przykład Kładąc w kummer $ b_n=n $, otrzymujemy łatwo tzw. kryterium Raabego: (A raczej: tę jego cześć, która służy do uzasadniania zbieżności) szeregów, patrz np. książka Fichtenholza. \begin{quote} Jeśli $ a_n>0 $ i istnieje taka liczba $ s>1 $, że

\[ \begin{equation} 	 n  \left(\frac{a_n}{a_{n+1}}-1\right) \ge s \qquad\mbox{dla wszystkich $n\ge n_0$,} 	\label{raabe} 	\end{equation} \]

to szereg $ \sum a_n $ jest zbieżny. \end{quote} (Uwaga: Czytelnik może sprawdzić, że wykorzystując warunek raabe i własności funkcji wykładniczej, można wykazać, że dla $ r\in (1,s) $ i wszystkich dostatecznie dużych $ n $ jest $ a_{n+1}/a_n\le b_{n+1}/b_n $, gdzie $ b_n=1/n^r $. Szereg $ \sum 1/n^r $ jest zbieżny dla $ r>1 $. Zatem, niezależnie od kryterium Kummera, każdy szereg $ \sum a_n $ spełniający warunek raabe jest zbieżny na mocy ilorazowej wersji kryterium porównawczego, patrz Stw.~ [link].)

Ćwiczenie Proszę sprawdzić, jaki wniosek otrzymamy, biorąc w kryterium Kummera $ b_n\equiv 1 $ dla wszystkich $ n $.

Czytelnik, który zetknął się z powyższymi kryteriami i przykładami, a także samodzielnie rozwiązał pewną liczbę zadań, może zadać sobie pytanie: czy istnieje jakiś idealny, wzorcowy szereg, którego zawsze można byłoby używać w kryterium porównawczym? Odpowiedź jest negatywna: dla każdego szeregu zbieżnego istnieje szereg, który jest zbieżny wolniej\ldots

Przykład Załóżmy, że $ b_n>0 $ dla $ n\in \N $ i szereg $ \sum b_n $ jest zbieżny. Niech

\[ R_n= \sum_{j=n+1}^\infty b_j \]

oznacza różnicę między sumą szeregu $ \sum b_n $ i jego $ n $-tą sumą częściową. Wtedy oczywiście $ R_n $ maleje do $ 0 $, gdy $ n\to\infty $. Przyjmijmy $ a_n=\sqrt{R_{n-1}}-\sqrt{R_n} $ dla $ n\ge 2 $. Mamy

\[ a_2+a_3+\cdots +a_n= \sqrt{R_1} - \sqrt{R_n} \]

(suma liczb $ a_j $ jest teleskopowa), a więc szereg $ \sum_{n\ge 2} a_n $ jest zbieżny i ma sumę równą $ \sqrt{R_1} $. Jednak

\[ \frac{a_n}{b_n}=\frac{\sqrt{R_{n-1}}-\sqrt{R_n}}{{R_{n-1}} - {R_n}}=    \frac 1{\sqrt{R_{n-1}}+\sqrt{R_n}}  \longrightarrow +\infty, \]

czyli zbieżności szeregu $ \sum a_n $ nie można wywnioskować ze zbieżności $ \sum b_n $ i kryterium porównawczego!

Interludium: zbieżność ciągów i szeregów zespolonych

Do tej pory mówiliśmy wyłącznie o ciągach i szeregach w $ \R $. Wiele obserwacji i wniosków, dotyczących takich ciągów i szeregów, można przenieść na ciągi i szeregi liczb zespolonych. (Użycie takich ciągów i szeregów jest rzeczą wygodną, nawet wtedy, gdy koniec końców interesują nas wyłącznie obliczenia mające fizyczny lub praktyczny sens. Podczas studiów matematycznych Czytelnik przekona się wielokrotnie, że liczby zespolone są niezwykle użytecznym narzędziem obliczeniowym; często bywa tak, że najkrótsza droga do nietrywialnego wzoru czy twierdzenia dotyczącego liczb rzeczywistych prowadzi przez dziedzinę zespoloną.) Nam w najbliższym czasie takie ciągi i szeregi przydadzą się do trzech rzeczy:

  • określenia $ \exp(z) $ dla $ z\in\C $,
  • ścisłego wprowadzenia funkcji trygonometrycznych,
  • wskazania jasnego związku funkcji trygonometrycznych z funkcją wykładniczą.

Zacznijmy ponownie od definicji. Są one prostym uogólnieniem tego, co już znamy. Założymy, że Czytelnik zna (np. z wykładów algebry liniowej) pojęcie liczby zespolonej i jej modułu.

Definicja Ciąg $ (z_n)\subset \C $ jest zbieżny do granicy $ z\in\C $ wtedy i tylko wtedy, gdy dla każdego $ \eps>0 $ istnieje $ n_0\in \N $ takie, że $ |z_n-z|<\eps $ dla wszystkich $ n>n_0 $.

Intuicja związana z tą definicją jest prosta i w gruncie rzeczy taka sama, jak w $ \R $: do każdej, choćby i bardzo małej, liczby dodatniej $ \eps $ potrafimy dobrać taki moment $ n_\eps $, że począwszy od tego momentu wszystkie wyrazy ciągu $ (z_n) $ będą oddalone od $ z $ mniej niż o $ \eps $ -- tzn. znajdą się wewnątrz dysku $ D(z,\eps)=\{w\in\C\colon |w-z|<\eps\} $.

 

Podobnie określa się zbieżne szeregi liczb zespolonych.

Definicja Niech $ (z_n)\subset \C $. Szereg $ \sum z_n $ jest zbieżny wtedy i tylko wtedy, gdy ciąg sum częściowych $ s_n=z_1+z_2+\cdots +z_n $ ma granicę $ s\in\C $.

Zauważmy, że jeśli $ w=a+ib\in\C $, gdzie $ a,b\in\R $, to

\[ \begin{equation} \max (|a|,|b|) \le |w| \le |a|+|b|.   \label{zesp-rzecz} \end{equation} \]

Interpreacja geometryczna tej nierówności jest oczywista: przeciwprostokątna trójkąta o wierzchołkach $ 0,a,w=a+ib\in\C $ jest dłuższa, niż każda przyprostokątna z osobna, ale krótsza od sumy przyprostokątnych. Z tej łatwej nierówności otrzymujemy szybko następujące użyteczne wnioski.

Stwierdzenie (#) Ciąg liczb $ z_n=x_n+iy_n\in \C $, gdzie $ x_n,y_n\in \R $, jest zbieżny do granicy $ z=x+iy $ ($ x,y\in\R $) wtedy i tylko wtedy, gdy

\[ \lim_{n\to \infty} x_n=x, \qquad  \lim_{n\to \infty} y_n=y. \ \]

Dowód:
Zapisujemy zesp-rzecz dla $ w=z_n-z $, $ a=x_n-x $ i $ b=y_n-y $, a następnie korzystamy z definicji granicy i twierdzenia o trzech ciągach.

Stwierdzenie Szereg $ \sum z_n $, gdzie $ z_n=x_n+iy_n $ dla pewnych $ x_n,y_n\in \R $, jest zbieżny wtedy i tylko wtedy, gdy zbieżne są oba szeregi $ \sum x_n $, $ \sum y_n $.

Stwierdzenie Ciąg $ (z_n)\subset \C $ jest zbieżny wtedy i tylko wtedy, gdy spełnia warunek Cauchy'ego:

    \setcounter{enumi}{2}

  1. Dla każdej liczby $ \eps>0 $ istnieje $ n_\eps\in\N $ takie, że dla wszystkich $ m,k>n_\eps $ zachodzi nierówność $ |z_m-z_k|<\eps $.

Dowód:
Ze Stwierdzenia~ [link] i Twierdzenia~ [link] wynika, że zbieżność $ (z_n) $ jest równoważna koniunkcji warunków Cauchy'ego dla ciągów $ (x_n)=(\mathrm{Re}\, z_n) $ i $ (y_n)=(\mathrm{Im}\, z_n) $. Wobec nierówności zesp-rzecz, $ (x_n) $ i $ (y_n) $ spełniają warunek Caychy'ego (w $ \R $) wtedy i tylko wtedy, gdy $ (z_n) $ spełnia warunek Cauchy'ego.

Stwierdzenie Szereg liczb zespolonych $ \sum z_n $ jest zbieżny wtedy i tylko wtedy, gdy

    \setcounter{enumi}{18}

  1. Dla każdej liczby $ \eps>0 $ istnieje $ n_\eps\in\N $ takie, że
    \[ |z_k+z_{k+1}+\cdots+z_m|< \eps \qquad\mbox{dla wszystkich $m>k>n_\eps$.} \]

Dowód:
To wynika z definicji szeregu zbieżnego i poprzedniego stwierdzenia.

Szeregi o wyrazach dowolnych

Zbieżność bezwzględna i warunkowa

Definicja Szereg $ \sum z_n $ jest bezwzględnie zbieżny wtedy i tylko wtedy, gdy szereg $ \sum |z_n| $ jest zbieżny.

Szereg, który jest zbieżny, ale nie bezwzględnie, nazywa się warunkowo zbieżny. Przykłady takich szeregów zobaczymy później; jednym z nich jest $ \sum_{n=1}^\infty (-1)^{n+1}/n $ (który nie jest bezwzględnie zbieżny, gdyż $ \sum 1/n=\infty $).

Stwierdzenie Jeśli szereg $ \sum z_n $ jest bezwzględnie zbieżny, to $ \sum z_n $ jest zbieżny.

Dowód:
Jeśli szereg $ \sum z_n $ jest bezwzględnie zbieżny, to, z definicji, szereg liczb nieujemnych $ \sum |z_n| $ jest zbieżny, a więc spełnia warunek Cauchy'ego dla szeregów. Mamy jednak

\[ |z_k+z_{k+1}+\cdots+z_m| \le |z_k|+|z_{k+1}|+\cdots+|z_m| \]

dla wszystkich $ m>k $, więc skoro $ \sum |z_n| $ spełnia warunek Cauchy'ego, to i $ \sum z_n $ spełnia ten warunek. To zaś oznacza, że $ \sum z_n $ jest zbieżny.

Pojęcie zbieżności bezwzględnej jest ważne z uwagi na następujące twierdzenie.

Twierdzenie Załóżmy, że szereg $ \sum_{n=1}^\infty z_n $ jest bezwzględnie zbieżny, a $ \sigma\colon\N\to\N $ jest dowolną bijekcją. Wtedy szereg $ \sum_{n=1}^\infty z_{\sigma(n)} $ jest zbieżny, a ponadto

\[ \sum_{n=1}^\infty z_{\sigma(n)} = \sum_{n=1}^\infty z_{n} \]

Innymi słowy, wyrazy szeregu bezwzględnie zbieżnego można dowolnie przestawiać; nie wpływa to ani na jego zbieżność, ani na wartość jego sumy.

Dowód:
Ustalmy $ \eps>0 $. Dobierzmy $ n_0\in\N $ tak, aby

\[ |z_k|+|z_{k+1}|+\cdots+|z_m|<\frac \eps 2 \qquad\mbox{dla wszystkich $m>k\ge n_0$}  \]

(istnienie takiej liczby $ n_0 $ wynika z bezwzględnej zbieżności $ \sum z_n $ i warunku Cauchy'ego). Biorąc $ k=n_0 $ i przechodząc do granicy $ m\to\infty $, otrzymujemy

\[ \sum_{j=n_0}^\infty |z_j| \le \frac \eps 2 < \eps. \]

Niech $ m_j\in \N $ będzie taką liczbą, że $ \sigma(m_j)= j $, gdzie $ j=1,2,\ldots $, tzn. $ m_j:=\sigma^{-1}(j) $. Dla $ n\in \N $ połóżmy $ k(n)=n+\max(m_1,m_2,\ldots, m_n) $. Wtedy $ k(n) $ jest ciągiem rosnącym.

Zauważmy, że dla numerów $ l>k(n_0) $ mamy $ \sigma(l)>n_0 $, gdyż $ \sigma $ jest bijekcją i wartości $ 1,2,\ldots, n_0 $ przymuje w liczbach nie większych od $ k(n_0) $. Zatem, dla wszystkich $ m>k>n_1=\max(n_0,k(n_0)) $ spełniona jest nierówność

\[ \begin{eqnarray*} |z_{\sigma(k)}+z_{\sigma(k+1)} +\cdots + z_{\sigma(m)}| & \le &  |z_{\sigma(k)}|+|z_{\sigma(k+1)}| +\cdots + |z_{\sigma(m)}| \\ &\le & \sum_{j=n_0}^\infty |z_j| < \eps\, .  \end{eqnarray*} \]

Szereg $ \sum_{n=1}^\infty z_{\sigma(n)} $ spełnia więc warunek Cauchy'ego, tzn. jest zbieżny.

Ponadto, dla wszystkich $ n\ge n_0 $ jest

\[ \biggl|\,\sum_{j=1}^n z_j - \sum_{j=1}^{k(n)} z_{\sigma(j)}\, \biggr| \le \sum_{j\ge n_0} |z_n| < \eps  \]

a więc granica ciągu $ s_n=z_1+\cdots + z_n $ i granica wskazanego wyżej podciągu (o numerach $ k(n) $) sum częściowych szeregu $ \sum z_{\sigma(n)} $ różnią się co najwyżej o $ \eps $. Z dowolności $ \eps $ wynika zatem, że obie wspomniane granice są równe, a więc sumy obu szeregów są równe. To kończy cały dowód.

Założenie bezwzględnej zbieżności w ostatnim twierdzeniu jest istotne. Bez niego teza nie zachodzi. Co więcej, ma miejsce następujący zaskakujący fakt.

Twierdzenie [Riemann] Jeśli $ (a_n)\subset\R $ i szereg $ \sum a_n $ jest warunkowo (ale nie bezwzględnie!) zbieżny, to dla każdej liczby rzeczywistej $ x $ istnieje taka bijekcja $ \sigma\colon\N\to\N $, że

\[ 	 \sum_{n=1}^\infty a_{\sigma(n)} = x 	\]

Dowód:
Opiszemy dowód słowami, gdyż dzięki temu będzie bardziej zrozumiały. Zainteresowany Czytelnik zdoła samodzielnie uzupełnić drobne szczegóły.

Nietrudno zauważyć, że szereg $ \sum a_n $ ma nieskończenie wiele wyrazów dodatnich i nieskończenie wiele wyrazów ujemnych, gdyż w przeciwnym razie wszystkie wyrazy o dostatecznie dużych numerach byłyby tego samego znaku, a więc $ \sum a_n $ byłby nie tylko zbieżny, ale i bezwzględnie zbieżny.

Niech $ n_1<n_2<n_3<\ldots $ będą kolejnymi numerami wyrazów ujemnych, a $ k_1<k_2<k_3<\ldots $ -- kolejnymi numerami wyrazów dodatnich szeregu $ \sum a_n $. (Bez zmniejszenia ogólności załóżmy, że żadna z liczb $ a_n $ nie jest zerem.) Zauważmy, że

\[ \sum_{j=1}^\infty a_{n_j} = -\infty, \qquad \sum_{j=1}^\infty a_{k_j} = +\infty\, . \]

Gdyby tak nie było, to oba powyższe szeregi byłyby zbieżne, a cały szereg $ \sum a_n $ byłby zbieżny bezwzględnie.

Bijekcję $ \sigma $ budujemy indukcyjnie. Oto pierwsze dwa kroki konstrukcji.

Wybieramy najmniejszą liczbę $ m $ taką, że $ a_{k_1}+\cdots +a_{k_m}>x $. Kładziemy $ \sigma(1)=k_1 $, $ \sigma(2)=k_2 $, \ldots, $ \sigma(m)=k_m $. Następnie zmniejszamy uzyskaną sumę, korzystając z ujemnych wyrazów szeregu: wybieramy najmniejszą liczbę $ s $ taką, że

\[ a_{k_1}+\cdots +a_{k_m} + a_{n_1}+\cdots+a_{n_s} < x \]

Przyjmujemy teraz $ \sigma(m+1)=n_1, $ $ \sigma(m+2)=n_2 $, \ldots, $ \sigma(m+s)=k_s $. Zarówno $ m $, jak i $ s $, są dobrze określone, gdyż szeregi wyrazów dodatnich i wyrazów ujemnych są rozbieżne. Niech $ m_1=m $, $ m_2=m+s $.

Załóżmy teraz, że wykonaliśmy $ N $ podobnych kroków, definiując $ \sigma(j) $ dla wszystkich $ j\le m_N $, gdzie $ m_N\ge N $. Wyrazy o numerach $ \le m_N $ są już wykorzystane, a wyrazy o numerach $ >m_N $ -- jeszcze dostępne. Załóżmy także, że (1) jeśli $ N $ jest nieparzyste, to

\[ S_{m_N} = \sum_{j\le m_N} a_{\sigma(j)} > x , \]

a także: (2) jeśli $ N $ jest parzyste, to

\[ S_{m_N} = \sum_{j\le m_N} a_{\sigma(j)} < x \]

W kolejnym kroku w przypadku (1) dobieramy kolejne dostępne jeszcze (tzn. niewykorzystane wcześniej) ujemne wyrazy $ a_{k_j} $ szeregu, aż do momentu, gdy uzyskamy sumę częściową mniejszą od $ x $. Można to osiągnąć, gdyż szereg wyrazów ujemnych jest rozbieżny. Natomiast w przypadku (2) dobieramy kolejne dostępne jeszcze wyrazy dodatnie, aż do momentu, gdy uzyskamy sumę częściową większą od $ x $. Numery wyrazów, które wybieramy w $ (N+1) $-szym kroku, to wartości $ \sigma $ w liczbach $ m_N+1, \ldots, m_{N+1} $.

Postępując indukcyjnie, definiujemy $ \sigma\colon N\to N $. Jest to bijekcja, gdyż każdy wyraz wykorzystujemy tylko raz i każdy wyraz zostaje kiedyś wykorzystany. Łatwo zauważyć, że $ \sigma(n)\to\infty $, gdy $ n\to \infty $. Sumy częściowe $ S_n $ szeregu $ \sum a_{\sigma(n)} $ oscylują wokół liczby $ x $, gdyż tak były wybierane. W dodatku różnice między tymi sumami i liczbą $ x $ są coraz mniejsze, gdyż $ a_n\to 0 $ dla $ n\to \infty $ (to jest warunek konieczny zbieżności szeregu $ \sum a_n $).

\'{S}ciślej, nie jest trudno sprawdzić, że ciąg $ S_n $ spełnia warunek Cauchy'ego. To wynika z konstrukcji $ \sigma $ i zbieżności $ a_n\to 0 $. Ponadto, ciąg $ S_{m_N} $ jest zbieżny do $ x $. Zatem, cały ciąg $ S_n $ też jest zbieżny do $ x $.

    Uwaga. Nietrudno sprawdzić, że jeśli $ \sum a_n $ jest tylko warunkowo zbieżny, to można tak przestawić wyrazy, żeby po przestawieniu ciąg sum częściowych był rozbieżny do $ +\infty $ (albo do $ -\infty $). Czytelnik, po zapoznaniu się z dowodem twierdzenia Riemanna, bez większego trudu wskaże odpowiednie permutacje wyrazów.

    Uwaga. Jeśli szereg liczb zespolonych $ \sum z_n $ jest zbieżny warunkowo, ale nie bezwzględnie, to na płaszczyźnie zespolonej $ \C $ istnieje taka prosta $ \ell $, że dla każdej liczby $ w\in\ell $

\[ \sum_{n=1}^\infty z_{\sigma(n)} = w  \]

dla pewnej bijekcji $ \sigma\colon\N\to\N $.

Przekształcenie Abela

W tym podrozdziale zajmiemy się opisem warunków, które pozwalają wnioskować, że szereg $ \sum a_nb_n $ jest zbieżny. Wygodnie będzie przyjąć następującą konwencję: jeśli wyrazy szeregu oznaczamy jakąś małą literą (np. $ a,b,\ldots $), to sumy częściowe tego szeregu oznaczamy odpowiednią wielką literą ($ A,B,\ldots $).

Twierdzenie [Abel] Niech $ (a_n),(b_n)\subset \C $. Załóżmy, że istnieje taka liczba $ M>0 $, że $ |A_n|=|a_1+a_2+\cdots+a_n|\le M $ dla wszsytkich $ n $, a ponadto

\[ \sum_{n=1}^\infty |b_n-b_{n+1}| < +\infty \qquad\mbox{oraz}\qquad b_n\to 0 \quad\mbox{dla $n\to\infty$,} \]

to wtedy szereg $ \sum a_nb_n $ jest zbieżny.

Dowód:
Najpierw zapiszmy pomocniczy

    Lemat. Jeśli $ (\alpha_n) $ jest ograniczonym ciągiem w $ \C $, a szereg $ \sum \beta_n $ jest bezwgzlędnie zbieżny, to szereg $ \sum \alpha_n\beta_n $ jest bezwględnie zbieżny.

(Dla dowodu wystarczy zauważyć, że jeśli $ |\alpha_n|\le M $ dla wszystkich $ n $, to wtedy $ |\alpha_n\beta_n|\le M|\beta_n| $, a więc ze zbieżności szeregu $ \sum |\beta_n| $ i kryterium porównawczego wynika zbieżność szeregu $ \sum |\alpha_n\beta_n| $).

Teraz wykonujemy przekształcenie Abela, tzn. zapisujemy sumy częściowe szeregu $ \sum a_nb_n $ w innej postaci, korzystając z równości $ a_k=A_k-A_{k-1} $:

\[ \begin{eqnarray} 	\label{transabel} S_n & = & \sum_{k=1}^n a_kb_k = b_1 A_1 + \sum_{k=2}^n b_k(A_k-A_{k-1}) \\ & = & \underbrace{A_1 (b_1-b_2) + A_2 (b_2-b_3) + \cdots +A_{n-1} (b_{n-1}-b_n)}_{\text{patrz Lemat!}} + A_nb_n. \nonumber \end{eqnarray} \]

Ostatni składnik, $ A_nb_n $, jest zbieżny do zera, gdyż $ |A_n|\le M $ i $ b_n\to 0 $. Pozostała, oznaczona klamrą, część sumy $ S_n $, tzn.

\[ A_1 (b_1-b_2)+A_2 (b_2-b_3) + \cdots + A_{n-1} (b_{n-1}-b_n) \]

też ma granicę dla $ n\to\infty $. To wynika z lematu, zastosowanego dla $ \alpha_n=A_n $ oraz dla $ \beta_n=b_n-b_{n+1} $.

Wniosek [kryterium Dirichleta] Jeśli ciąg liczb rzeczywistych $ b_n $ maleje do zera, a sumy częściowe $ A_n $ szeregu $ \sum a_n $ tworzą ciąg ograniczony, to szereg $ \sum a_nb_n $ jest zbieżny.

Dowód:
Ponieważ $ b_n\ge b_{n+1}>0 $ i $ b_n\to 0 $, więc

\[ \sum_{n=1}^N |b_n- b_{n+1}|= \sum_{n=1}^N \bigl(b_n- b_{n+1}\bigr) = b_1-b_{n+1}\to b_1 \qquad\mbox{dla $N\to\infty$.} \]

Można więc stosować twierdzenie Abela: spełnione są wszystkie jego założenia.

Wniosek [kryterium Leibniza](#) Jeśli ciąg liczb rzeczywistych $ b_n $ maleje do zera, to szereg naprzemienny

\[ \sum_{n=1}^\infty (-1)^{n+1} b_n \]

jest zbieżny.

Dowód:
Przyjmujemy w kryterium Dirichleta $ a_n=(-1)^{n+1} $; wtedy $ |A_n|\le 1 $ dla wszystkich $ n $.

Przykład Szereg naprzemienny $ \sum_{n=1}^\infty (-1)^{n+1}\cdot \frac {1}{n}= 1-\frac 12 +\frac 13 -\frac 14+\cdots $ jest zbieżny (ale oczywiście nie jest bezwgzlędnie zbieżny).

Przykład (#) Jeśli $ z\in \C $, $ |z|=1 $, $ z\not=1 $, to szereg $ \sum z^n/n $ jest zbieżny. To wynika z kryterium Dirichleta zastosowanego do $ a_n=z^n $ i $ b_n=1/n $. Ciąg $ b_n=1/n $ maleje do zera, natomiast wartości bezwzględne sum częściowych

\[ 	z+z^2+\cdots + z^n = z\cdot \frac{1-z^n}{1-z} 	\]

są, niezależnie od $ n $, ograniczone przez liczbę $ M=2/|1-z| $, gdyż $ |1-z^n|\le 1+|z|^n=2 $. Ponieważ $ |z^n/n|=1/n $, więc rozpatrywany szereg nie jest bezwzględnie zbieżny.

W tym przykładzie można zamiast $ 1/n $ użyć dowolnego ciągu $ b_n $ malejącego do zera i takiego, że $ b_n\ge 1/n $ -- żadna konkluzja nie ulegnie zmianie.

Zadanie Udowodnić kryterium Leibniza bezpośrednio, nie posługując się twierdzeniem Abela. (Wskazówka: zbadać monotoniczność i ograniczoność ciągów $ (s_{2k}) $ i $ (s_{2k+1}) $, gdzie $ s_n $ oznacza $ n $-tą sumę częściową rozważanego szeregu.)
Zadanie Udowodnić następujące twierdzenie, nazywane czasem kryterium Abela: \begin{quote}Jeśli $ b_n $ jest malejącym ciągiem liczb dodatnich, a szereg $ \sum a_n $ jest zbieżny, to szereg $ \sum a_nb_n $ jest zbieżny. \end{quote}     Wskazówka. Wykorzystać pierwszą linijkę transabel i wykazać, że ciąg $ S_n $ sum częściowych szeregu $ \sum a_nb_n $ spełnia warunek Cauchy'ego.

Mnożenie szeregów i twierdzenie Mertensa

Ze zdroworozsądkowego punktu widzenia, mnożenie szeregów $ \sum a_n $ i $ \sum b_n $ powinno polegać na próbie sprawdzenia, czy zbieżny będzie szereg, który (w jakimś porządku) zawiera wszystkie składniki $ a_ib_j $, które uzyskalibyśmy, mnożąc formalnie jedną sumę przez drugą. Czytelnik rozumie już, że zbieżność takiego szeregu może zależeć od tego, jak uporządkujemy liczby $ a_ib_j $.

Definicja Jeśli $ (a_n),(b_n)\subset \C $, to iloczynem Cauchy'ego szeregów $ \sum_{n=0}^\infty a_n $ i $ \sum_{n=0}^\infty b_n $ nazywamy szereg o wyrazach

\[ c_n= \sum_{j=0}^n a_jb_{n-j}\, . \]

Innymi słowy, w iloczynie Cauchy'ego grupujemy $ a_ib_j $ tak, aby w każdej grupie suma $ i+j $ miała stałą wartość -- tzn. postępujemy tak, jak przy mnożeniu wielomianów w szkole, gdzie nauczono nas grupować składniki z tą samą potęgą zmiennej $ x $.

Twierdzenie [F. Mertens] Jeśli szereg $ A=\sum_{n=0}^\infty a_n $ jest zbieżny, a szereg $ B=\sum_{n=0}^\infty b_n $ jest zbieżny bezwzględnie, to ich iloczyn Cauchy'ego, tzn. szereg

\[ C=\sum_{n=0}^\infty c_n = \sum_{n=0}^\infty \biggl(\sum_{j=0}^n a_jb_{n-j}\biggr) \]

jest zbieżny. Ponadto, jeśli szereg $ A $ jest zbieżny bezwzględnie, to i szereg $ C $ jest zbieżny bezwzględnie.

Dowód:
Niech, dla $ n\ge 0 $, zgodnie z przyjętą wcześniej konwencją, $ C_n=c_0+c_1+\cdots +c_n $ oznacza $ n $-tą sumę częściową szeregu $ C $. Wykorzystując definicję $ c_n $, porządkujemy $ C_N $, grupując wyrazy zawierające wspólny czynnik $ b_j $:

\[ \begin{eqnarray*} C_N & = & a_0b_0 + (a_0b_1+a_1b_0) + \cdots +(a_0b_N+a_1b_{N-1}+\cdots +a_Nb_0)\\ & = & b_0 (a_0+a_1+\cdots+a_N) + b_1(a_0+a_1+\cdots+a_{N-1}) +\cdots + b_N a_0\\ & = & \sum_{j=0}^N b_j A_{N-j}  \, , \end{eqnarray*} \]

gdzie $ A_k=a_0+\cdots+a_k $ dla $ k\ge 0 $. Wykażemy, że $ \lim C_N=AB $. Ustalmy $ \eps>0 $ i liczbę $ \eta>0 $, którą dopasujemy do $ \eps $ później.

Mamy

\[ \begin{equation}        	\label{CNAB} |C_N-AB|=|C_N-AB_r + AB_r-AB|\le |C_N-AB_r| + |A||B_r-B|\, . \end{equation} \]

Każdy ze składników prawej strony oszacujemy osobno, odpowiednio dobierając $ r $.

Istnieje takie $ n_1 $, że dla wszystkich $ r>n_1 $ jest $ |B_r-B|<\eta $ i $ |A||B_r-B| \le |A|\eta $, bo $ \lim_{r\to\infty} B_r=B $. Ustalmy jedną z takich liczb $ r $, wybierając ją tak, żeby spełniony był również warunek: $ |A_n-A|< \eta $ dla wszystkich $ n>r $.

Teraz oszacujemy składnik $ |C_N-AB_r| $. Niech

\[ \beta=\sum_{n=0}^\infty |b_n|, \]

i niech $ M=\sup_n |A_n| $ ($ M<\infty $, bo ciąg $ A_n $ jest zbieżny do $ A $, a więc ograniczony). Wobec wykonanych wcześniej obliczeń i równości $ B_r=b_0+\cdots +b_r $, dla wszystkich $ N>2r $ mamy

\[ \begin{eqnarray*} |C_N - AB_r |& = &   \biggl|\sum_{j=0}^N b_j A_{N-j} - A \sum_{j=0}^r b_j \biggr| \\ & = & \biggl|\sum_{j=0}^r b_j(A_{N-j}-A) + \sum_{j=r+1}^N b_j A_{N-j}\biggr| \\ &\le &  \sup_{0\le j\le r} |A_{N-j}-A|\, \cdot\,  \sum_{j=0}^r   |b_j| + \sup_{n\in \N} |A_n| \cdot \biggl| \sum_{j=r+1}^\infty b_j\biggr|  \\ & \le & \eta \cdot \beta + M |B_r-B| \qquad\mbox{bo $N>2r$, a więc $n=N-j>r$}\\ & \le & \eta (\beta + M)\, . \end{eqnarray*} \]

Wracając teraz do CNAB i dodając uzyskane oszacowania obu składników prawej strony, otrzymujemy

\[ |C_N-AB| \le \eta (\beta + M +|A|)  < \eta(\beta + M +|A|+1) \qquad\mbox{dla wszystkich $N>2r$.} \]

Wybierając $ \eta = \eps (\beta + M +|A|+1)^{-1}  $, kończymy dowód zbieżności $ C_N $ do $ AB $.

Aby wykazać ostatnią część twierdzenia, tzn. zbieżność bezwzględną szeregu $ C $ przy założeniu bezwzględnej zbieżności obu szeregów $ A $ i $ B $, zauważamy, że

\[ |c_n|\le \sum_{j=0}^n |a_j|\cdot |b_{n-j}| \]

i stosujemy pierwszą część twierdzenia do iloczynu zbieżnych bezwzględnie szeregów $ \sum |a_n|, $ $ \sum |b_n| $, otrzymując zbieżność szeregu $ \sum |c_n| $ z kryterium porównawczego.

Założenie zbieżności bezwzględnej jednego z szeregów $ A,B $ jest w twierdzeniu Mertensa istotne.

Przykład Niech $ a_n=b_n=(-1)^n/\sqrt{n+1} $. Szeregi $ A=\sum a_n $ i $ B= \sum b_n $ są wtedy zbieżne. To wynika z kryterium Leibniza. Jednak

\[ \begin{eqnarray*} |c_n|= \biggl|\sum_{j=0}^n a_jb_{n-j}\biggr| & = & |(-1)^n| \sum_{j=0}^n\frac{1}{\sqrt{j+1}\, \cdot\, \sqrt{n-j+1}} \\   & \ge   & \sum_{j=0}^n\frac{2}{n+2}= \frac{2(n+1)}{n+2}\ge 1\, . \end{eqnarray*} \]

Zatem $ c_n\not\to 0 $, więc szereg $ C=\sum c_n $ jest rozbieżny. (Aby uzyskać środkową nierówność, zastosowaliśmy nierówność między średnimi: $ \sqrt{j+1}\, \cdot\, \sqrt{n-j+1}\le \frac{(j+1)+(n-j+1)}2 = \frac{n+2}2 $.)

Na zakończenie tego podrozdziału sformułujemy jeszcze jedno twierdzenie, które uzupełnia twierdzenie Mertensa.

Twierdzenie [E. Ces\`{a}ro] Jeśli szeregi $ A=\sum_{n=0}^\infty a_n $ oraz $ B=\sum_{n=0}^\infty b_n $ są zbieżne, to ich iloczyn Cauchy'ego, tzn. szereg

\[ C=\sum_{n=0}^\infty c_n = \sum_{n=0}^\infty \biggl(\sum_{j=0}^n a_jb_{n-j}\biggr) \]

ma następującą własność:

\[ \lim_{N\to \infty}\frac{C_0+C_1+C_2+\cdots + C_N}{N+1} = AB, \]

gdzie

\[ C_k  = \sum_{j=0}^k a_jb_{k-j} \, . \]

     Szkic dowodu. Jak w dowodzie twierdzenia Mertensa, sprawdzamy, że

\[ C_k= b_0A_k + b_1A_{k-1} + \cdots + b_k A_0\, . \]

Sumując takie równości dla $ k=0,1,\ldots, N, $ otrzymujemy

\[ C_0+C_1+C_2+\cdots + C_N = B_0A_N+ B_1 A_{N-1} + \cdots + B_N A_0 = \sum_{j=0}^N B_jA_{N-j}\, . \]

Dlatego

\[ \frac{C_0+C_1+C_2+\cdots + C_N}{N+1} - AB  = \frac 1{N+1}    \sum_{j=0}^N (B_jA_{N-j}-AB) \equiv (\ast)\, . \]

Jeśli zarówno $ j $, jak i $ N-j $ są odpowiednio duże, to składnik $ B_jA_{N-j}-AB $ jest mały. Trzeba jednak uporać się z oszacowaniem wielu takich składników, oraz uwzględnić inne! Dlatego weźmiemy $ N>3k\gg 1 $ i podzielimy ostatnią sumę $ (\ast) $ na trzy części:

  • ogon lewy, tzn. $ k $ składników o numerach $ j=0,1,\ldots, k-1 $;
  • środek, tzn. $ (N+1)-2k $ składników takich, gdzie zarówno $ j $, jak i $ N-j $ są równe co najmniej $ k $;
  • ogon prawy, tzn. $ k $ składników o numerach $ j $ takich, że $ N-j=0,1,\ldots, k-1 $.

Ustalmy $ \eps>0  $ i $ \eta>0 $. Ciągi $ A_s,B_s $ są ograniczone, gdyż są zbieżne. Niech

\[ M > 1+ \sup_{s\in \N} |A_s| + \sup_{s\in \N} |B_s| + |A| + |B|  > 0\, . \]

Każdy składnik lewego ogona jest nie większy od $ 2M^2 $ (brutalne użycie nierówności trójkąta pozwala oszacować różnicę iloczynów przez sumę modułów iloczynów), a zatem cały lewy ogon ma sumę równą co najwyżej $ 2M^2\cdot k / (N+1) $. Podobnie, suma prawego ogona nie przekracza $ 2M^2\cdot k / (N+1) $. Ustalmy teraz $ k=k(\eta) $ tak, aby

\[ \max(|A_j-A|,|B_j-B|) < \eta \qquad\mbox{dla wszystkich $j\ge k$.} \]

Nietrudno sprawdzić, że przy takim warunku środek ma sumę nie większą niż

\[ \frac{N+1-2k}{N+1} \, \cdot \, 2 M \cdot \eta  < 2 M\eta \]

(liczba składników środka razy oszacowanie składnika z góry (Bardzo uważny Czytelnik zechce sprawdzić, że można zamiast $ 2M $ napisać $ M $; to i tak nie ma szczególnego znaczenia.)). Dlatego

\[ |(\ast)|\le |\text{ogon lewy}|+ |\text{środek}| + |\text{ogon prawy}| \le \frac{2M^2 k}{N+1} + 2M\eta + \frac{2M^2 k}{N+1} \, . \]

Biorąc $ \eta =\eps /4M $ i $ N> N_1=\max\bigl(3k,(8M^2k)/\eps\bigr) $, otrzymamy powyżej prawą stronę mniejszą od $ \frac \eps 4 + \frac \eps 2 + \frac \eps 4 = \eps $.

Zadanie Korzystając z twierdzenia Ces\`{a}ro, wykazać, że jeśli iloczyn Cauchy'ego szeregów $ A=\sum a_n $ i $ B=\sum b_n $ jest zbieżny, to jego suma $ C $ jest równa $ AB $.     Wskazówka: skorzystać z twierdzenia Stolza i Przykładu~ [link].

Funkcja wykładnicza zmiennej zespolonej

Zaczniemy, jak w przypadku zmiennej rzeczywistej, od twierdzenia, które mówi o istnieniu pewnej granicy.

Twierdzenie (#) Dla każdej liczby zespolonej $ z\in \C $ ciąg $ a_n(z)=(1+\frac zn)^n $ i ciąg $ b_n(z) $ sum częściowych szeregu

\[ b(z)=\sum_{n=0}^\infty \frac {z^n}{n!} \]

są zbieżne do tej samej granicy. Szereg $ b(z) $ jest zbieżny bezwzględnie dla każdego $ z\in \C $.

Dowód:
Krok 1. Ponieważ dla wszystkich $ n>2|z| $ jest

\[ \left|\frac{z^{n+1}/(n+1)!}{z^n/n!} \right|=\frac{|z|}{n+1} < \frac{1}{2}=\frac{(1/2)^{n+1}}{(1/2)^n}, \]

więc z ilorazowej wersji kryterium porównawczego wynika, że szereg $ b(z) $ jest zbieżny bezwzględnie dla każdej liczby $ z\in \C $.

Krok 2. Wykażemy, że $ \lim_{n\to\infty} a_n(z)=b(z) $. Mamy

\[ |a_n(z)-b(z)|\le |a_n(z)-b_k(z)|+|b_k(z)-b(z)|. \]

Każdy składnik oszacujemy osobno, dobierając najpierw dużą liczbę $ k $, a potem dostatecznie duże $ n> k $ . Z dwumianu Newtona otrzymujemy

\[ \begin{eqnarray*}    a_n(z)-b_k(z)= \left(1+\frac zn\right)^n  -\sum_{j=0}^k\frac{z^j}{j!}&= &\sum_{j=0}^n \binom nj \frac{z^j}{n^j} -\sum_{j=0}^k\frac{z^j}{j!}\\ & = & 1+ z+\sum_{j=2}^n \frac{z^j}{j!} \cdot   \frac{n(n-1)\ldots(n-j+1)}{n^j} -\sum_{j=0}^k\frac{z^j}{j!} \\    & = &  \alpha_{k,n}(z) + \beta_{k,n}(z), \end{eqnarray*} \]

gdzie

\[ \begin{gather*} \alpha_{k,n}(z)=\sum_{j=2}^k  \frac{z^j}{j!}\left[\left(1-\frac 1n\right)\cdot  \left(1-\frac 2n\right)\cdot \ldots\cdot\left(1-\frac{j-1}{n}\right) -1\right]\,  \\ \beta_{k,n}(z)=\sum_{j=k+1}^n \frac{z^j}{j!}  \left(1-\frac 1n\right)\cdot  \left(1-\frac 2n\right)\cdot \ldots\cdot\left(1-\frac{j-1}{n}\right) \end{gather*} \]

Stąd

\[ \begin{equation} |a_n(z)-b(z)|\le |\alpha_{k,n}(z)| + |\beta_{k,n}(z) |   +|b_k(z)-b(z)|\, .   \label{exp-3skl} \end{equation} \]

Ustalmy $ \eps>0 $ i rozpatrzmy składniki prawej strony exp-3skl. Po pierwsze,

\[ \begin{eqnarray*} |\alpha_{k,n}(z)|             & \le &    \sum_{j=2}^k\frac{|z|^j}{j!} \cdot\max_{2\le j\le k} \left[1-\left(1-\frac 1n\right)\cdot  \left(1-\frac 2n\right)\cdot \ldots\cdot\left(1-\frac{j-1}{n}\right)\right] \\ & \le & b(|z|)\cdot \left(1-\left(1-\frac kn\right)^k\right)\qquad\mbox{(i sumę, i maksimum szacujemy osobno)}    \\ &\le & b(|z|)\cdot \frac{k^2}{n}\, . \end{eqnarray*} \]

Aby napisać ostatnią linijkę, skorzystaliśmy dla liczb $ k $ oraz $ n>k $ z nierówności Bernoulli'ego $ (1-k/n)^k\ge 1-k^2/n $.

Po drugie, z nierówności trójkąta,

\[  |\beta_{k,n}(z) |   \le \sum_{j=k+1}^n \frac{|z|^j}{j!} = b_n(|z|)-b_k(|z|)=\Bigl|b_n(|z|)-b_k(|z|) \Bigr|<\frac{\eps}3\,  \]

dla wszystkich $ n>k>n_0 $, gdyż ciąg $ b_n(|z|) $ jest zbieżny jako ciąg sum częściowych zbieżnego szeregu $ b(|z|) $, a więc spełnia warunek Cauchy'ego.

Ustalmy teraz jakiekolwiek konkretne $ k>n_0 $, tak, aby prócz powyższej nierówności na $ \bigl|\beta_{k,n}(|z|)\bigr| $ mieć także $ |b_k(z)-b(z)|<\eps/3 $. Jest to możliwe, gdyż $ b_k(z)\to b(z) $ dla $ k\to\infty $.

Na koniec wybierzmy $ n_1>k $, tak, aby dla wszystkich $ n>n_1 $ mieć

\[ |\alpha_{k,n}(z)|\le b(|z|) \frac {k^2}n < \frac \eps 3\, . \]

Widać, że wystarczy wziąć $ n_1> 3k^2 b(|z|)/\eps $. Przy takim doborze $ n_1 $ każdy z trzech składników prawej strony nierówności exp-3skl będzie mniejszy od $ \eps /3 $. Zatem, wprost z definicji granicy, $ \lim_{n\to\infty} a_n(z) = b(z) $.

Definicja Dla każdej liczby zespolonej $ z\in \C $ kładziemy

\[ 	\exp (z) = \lim_{n\to\infty} \left(1+\frac zn\right)^n =   \sum_{n=0}^\infty \frac {z^n}{n!}\, . 	\]

Jak widać, dla rzeczywistych $ z $ określamy tę samą funkcję, co w poprzednim rozdziale.

Twierdzenie [własności $ \exp $ w dziedzinie zespolonej] Funkcja $ \exp\colon\C\to\C $ ma następujące własności:

  1. $ \exp(z+w)=\exp z \, \cdot \, \exp w $ dla wszystkich $ z,w\in \C $;
  2. Dla wszystkich $ z\in  \C $ jest $ \exp z \not = 0 $, $ \exp (-z) = (\exp z)^{-1}   $.
  3. Dla $ z=iy $, gdzie $ y\in\R $, mamy $ \overline{\exp (iy)}=\exp(-iy) $ oraz $ |\exp(iy)|=1 $.
  4. Dla wszystkich $ z\in  \C $ jest $ |\exp(z)|=\exp (\mathrm{Re}\, z) $.
  5. Dla każdego zbieżnego do zera ciągu $ (z_n)\subset \C $ ($ z_n\not=0 $ dla wszystkich $ n $) i~dla każdego $ w\in \C $ zachodzi równość
    \[ \begin{equation} 		\label{pochodna-expz} 	\lim_{n\to\infty}  	\frac{\exp(w+z_n)-\exp(w)}{z_n} =\exp(w)  \, . 	\end{equation} \]

(#)

Dowód:
Własność (i) udowodnimy, posługując się twierdzeniem Mertensa i równością

\[ \exp(z)=b(z) =\sum_{n=0}^\infty \frac {z^n}{n!}\, . \]

Ponieważ szereg $ b(z) $ jest zbieżny bezwzględnie dla wszystkich $ z $, więc $ b(z)b(w) $ jest, wobec twierdzenia Mertensa, sumą iloczynu Cauchy'ego (szeregu $ b(z) $ i szeregu $ b(w) $). Inaczej mówiąc, iloczyn $ \exp(z)\exp(w) $ to

\[ \begin{eqnarray*} b(z)b(w)& = & \sum_{n=0}^\infty \biggl(\sum_{j=0}^n\frac {z^j}{j!}\cdot \frac{w^{n-j}}{(n-j)!} \biggr)\qquad\mbox{(z definicji iloczynu Cauchy'ego i tw. Mertensa)}\\ & = & \sum_{n=0}^\infty \frac{1}{n!}\biggl(\sum_{j=0}^n\binom nj {z^j}\cdot w^{n-j}\biggr)\qquad\mbox{(dopisujemy $n!$ w liczniku i mianowniku)}\\ &=&\sum_{n=0}^\infty \frac{1}{n!} (z+w)^n \qquad \mbox{(korzystamy z dwumianu Newtona)}\\ & = & b(z+w)=\exp(z+w)\, . \end{eqnarray*} \]

  Własność (ii) wynika z równości $ \exp(0)=1+\frac{0}{1!}+\frac{0^2}{2!}+\cdots = 1 $ i własności (i), gdyż $ \exp(z)\exp(-z)=\exp\bigl(z+(-z)\bigr)=\exp(0)=1 $.

  Aby sprawdzić (iii), korzystamy z równości $ \displaystyle\lim_{k\to\infty} \overline{z_k}=\overline{\lim_{k\to\infty} z_k} $, która łatwo wynika ze Stwierdzenia~ [link]. Piszemy

\[ \overline{\exp (iy)} =\lim_{k\to\infty} \overline{\left(1+\frac{iy}k\right)^k} = \lim_{k\to\infty} \left(1-\frac{iy}k\right)^k = \exp(-iy)\, . \]

Stąd

\[ |\exp(iy)|^2=\exp(iy)\cdot \overline{\exp (iy)} =\exp(iy)\exp(-iy)=\exp\bigl(iy+(-iy)\bigr)=1\, . \]

  Własność (iv) jest prostą konsekwencją (iii) oraz (i). Jeśli $ z=x+iy $, gdzie $ x,y\in \R $, to

\[ |\exp(z)|=|\exp(x)|\,\cdot\, |\exp(iy)| =|\exp(x)|\, \cdot \,    1=\exp(x)  \, . \]

Ostatnią równość piszemy bez wahania, gdyż dla $ x\in \R $ jest $ \exp(x)=\bigl(\exp(x/2)\bigr)^2>0 $.

Została nam do udowodnienia własność (v). Podobnie jak w przypadku funkcji wykładniczej zmiennej rzeczywistej, nietrudno zauważyć, że wystarczy wykazać, iż

\[ \begin{equation} 	\lim_{n\to\infty}  	\frac{\exp(z_n)-1}{z_n} = 1  \label{expwzerze}  \end{equation} \]

dla każdego ciągu $ (z_n)\subset \C\setminus \{0\} $, $ z_n\to 0 $ dla $ n\to\infty $. Dla wszystkich liczb $ z $ takich, że $ |z|\le 1 $, mamy (Uwaga: formalnie biorąc, zaprezentowany tu rachunek jest oczywisty. Korzystamy w nim jednak z ciągłości modułu:) jeśli $ w_k\to w $, to $ |w_k|\to |w| $ dla $ k\to\infty $.

\[ \begin{eqnarray*} |\exp(z)-1-z| & = & \biggl|\frac{z^2}{2!}+\frac{z^3}{3!}+\frac{z^4}{4!}+\cdots \biggr|\\  & \le & \frac{|z|^2}{2!}+\frac{|z|^3}{3!}+\frac{|z|^4}{4!}+\cdots \\ & \le & |z|^2 \biggl(\frac{1}{2!}+\frac{1}{3!}+\frac{1}{4!}+\cdots \biggr) \qquad\mbox{(bo $1\ge |z|^2\ge |z|^3\ge |z|^4\ge \ldots $})\\ & = & |z|^2(e-2)\, . \end{eqnarray*} \]

Zatem, jeśli $ z_n\to 0 $, $ z_n\not=0 $, to dla wszystkich dostatecznie dużych $ n $ jest

\[ 0\le \biggl|\frac{\exp(z_n)-1}{z_n} -1\biggr|   = \biggl|\frac{\exp(z_n)-1-z_n}{z_n} \biggr| \le |z_n|(e-2)\, . \]

Równość expwzerze wynika teraz z twierdzenia o trzech ciągach.

Wniosek [ciągłość funkcji $ \exp $ na $ \C $] Jeśli $ (\xi_n)\subset \C $ i $ \xi_n\to \xi $ dla $ n\to \infty $, to wówczas $ \exp (\xi_n)\to \exp(\xi) $ dla $ n\to \infty $. (#)

Dowód:
Niech najpierw $ \xi_n\to 0 $. Wtedy, wobec własności (v) z poprzedniego twierdzenia oraz arytmetycznych własności granicy,

\[ \exp(\xi_n)=\xi_n \cdot \underbrace{\frac{\exp(\xi_n)-1}{\xi _n}}_{\to 1, \text{ własność (v)}} + 1\longrightarrow 0 \cdot 1 + 1 = 1=\exp(0)\, . \]

Korzystając z tej równości i z własności grupowej $ \exp(z+w)=\exp(z)\exp(w) $, w przypadku ogólnym piszemy

\[ \exp(\xi_n)=\exp(\xi_n-\xi)\cdot \exp(\xi) \stackrel{}\to 1 \cdot \exp (\xi) = \exp(\xi)\, , \]

gdyż $ \xi_n-\xi\to 0 $. Dowód jest zakończony.

     Uwaga. Czytelnik zechce zauważyć, że schemat dowodu jest w gruncie rzeczy taki sam, jak w przypadku rzeczywistym: dowodzimy najpierw różniczkowalności $ \exp $, a potem ciągłości $ \exp $. Kluczem do obu własności jest oszacowanie modułu różnicy $ \exp(z)-1-z $ dla małych $ z $. W przypadku rzeczywistym najpierw dowodziliśmy oszacowania (E6) w Twierdzeniu~ [link], a z niego wynikała i różniczkowalność, i ciągłość funkcji wykładniczej. ExpPlot-1.png

{\footnotesize\baselineskip 11pt Portret $ \exp $, I. Wykres funkcji $ f(x,y)=\mathrm{Re}\, (\exp(x+iy)) $ nad prostokątem $ -2\le x\le 1.5 $, $ 0\le y\le 12.56 $; innymi słowy, wysokość punktu powierzchni nad dolnym dnem pudełka jest równa $ \mathrm{Re}\, (\exp(x+iy)) $. Szare linie to poziomice (jak na mapie: wysokość na poziomicy ma jedną, ustaloną wartość. Kolory powierzchni zależą liniowo od części urojonej liczby $ \exp(x+iy) $. Przednia krawędź powierzchni odpowiada wartości $ y=\mathrm{Im}\, z = 0 $: widzimy wykres $ \exp $ na $ \R $.

}

    

Na zakończenie tego podrozdziału wykażemy, że funkcja wykładnicza jest jednoznacznie wyznaczona przez dwie swoje własności.

Twierdzenie [charakteryzacja $ \exp $](#) Załóżmy, że funkcja $ f\colon \C\to\C $ spełnia dwa warunki:

  1. Dla wszystkich $ z,w\in \C $ jest $ f(z+w)=f(z)f(w) $;
  2. Dla każdego zbieżnego do zera ciągu liczb zespolonych $ z_n $ ($ z_n\not=0 $ dla wszystkich $ n $) zachodzi równość
    \[ 	\lim_{n\to\infty} \frac{f(z_n)-1}{z_n} =1  \, . 	\]

Wówczas $ f(z)=\exp(z) $ dla każdego $ z\in \C $.

Zanim podamy dowód tego twierdzenia, sformułujemy zespolony odpowiednik lematu o ciągach szybko zbieżnych do $ 1 $.

Lemat (#) Jeśli $ \eps_n $ jest ciągiem liczb zespolonych takim, że $ n\eps_n\to 0 $ dla $ n\to \infty $, to wówczas

\[ \lim_{n\to\infty} \left(1+\eps_n\right)^n = 1, \qquad  \lim_{n\to\infty} \left(1+\frac z n + \eps_n\right)^n = \exp z \]

dla każdego $ z\in \C $.

    Dowód Lematu~ [link]. Najpierw udowodnimy pierwszą równość. Z nierówności trójkąta, zastosowanej do sumy, którą otrzymujemy, rozpisując $ (1+\eps_n)^n-1 $ z użyciem dwumianu Newtona, wynika, że

\[ 0\le \bigl|(1+\eps_n)^n -1\bigr| \le (1+|\eps_n|)^n-1  \]

Jednak z Lematu~ [link] wynika, że ciąg $ (1+|\eps_n|)^n-1 $ jest zbieżny do 0, więc na mocy twierdzenia o trzech ciągach $ (1+\eps_n)^n\to 1 $.

Druga podana w lemacie równość wynika łatwo z twierdzenia o granicy iloczynu ciągów i definicji funkcji wykładniczej, gdyż

\[ \left(1+\frac z n + \eps_n\right)^n= \left(1+\frac z n\right)^n\, \cdot \, \left(1+\eps_n'\right)^n \]

dla $ \eps_n'=\eps_n/(1+\frac z n) $. Oczywiście $ n\eps'_n\to 0 $, więc z pierwszej cześci lematu $ (1+\eps_n')^n\to 1, $ a zatem każda ze stron powyższej równości ma dla $ n\to\infty $ granicę równą $ \exp(z) $.

ExpPlot-2.png

{\footnotesize\baselineskip 11pt Portret $ \exp $, II. Wykres funkcji $ f(x,y)=\mathrm{Re}\, (\exp(x+iy)) $ nad prostokątem $ -2\le x\le 1.5 $, $ 0\le y\le 12.56 $. Widok z innej strony. Przednia krawędź nie bez powodu wygląda tak, jak sinusoida. Związek funkcji wykładniczej z trygonometrycznymi poznamy w następnym podrozdziale. Tu widać, że zarówno wysokości, jak i kolory powtarzają się w kierunku osi urojonej. Wykażemy później, że funkcja wykładnicza jest okresowa -- w kierunku osi urojonej!

}

    Dowód Twierdzenia~ [link]. Ustalmy dowolny punkt $ z\in \C $, $ z\not=0 $. Oznaczmy

\[ \delta_n = \frac{f(z/n)-1}{z/n}- 1, \qquad n=1,2,\ldots \]

Z założenia (ii) wynika, że $ \lim_{n\to\infty}\delta_n=1-1=0 $. Używając wzoru definiującego $ \delta_n $ do wyznaczenia wartości $ f(z/n) $, otrzymujemy

\[ f\Bigl(\frac z n\Bigr) = 1 + \frac{z+z\delta_n}n = 1 + \frac z n   + \eps_n\, , \]

gdzie $ \eps_n= z \delta_n/n $ jest ciągiem liczb zespolonych takim, że $ n\eps_n\to 0 $ dla $ n\to \infty $. Z Lematu~ [link] otrzymujemy i założenia (i) otrzymujemy teraz

\[ f(z)=f\Bigl(\frac z n+\cdots+\frac z n\Bigr)= f\Bigl(\frac z n\Bigr)^n  = \left(1 + \frac z n   + \eps_n \right)^n\to \exp(z) \qquad\mbox{dla $n\to\infty$.} \]

Lewa strona nie zależy w ogóle od $ n $, więc mamy po prostu $ f(z)=\exp(z) $. Teza wynika z dowolności $ z $; wprawdzie pominęliśmy w rozważaniach $ z=0 $, ale $ f(0)=f(0+0)=f(0)^2 $, tzn. $ f(0)=0 $ lub $ 1 $ -- pierwszą możliwość odrzucamy, gdyż prowadziłaby do $ f\equiv 0 $, co jest sprzeczne z założeniem (ii).

 

Dla zainteresowanych przytoczymy jeszcze kilkanaście linijek kodu, które posłużyły do narysowania powyższych wykresów w programie Mathematica (jest on dostępny w laboratorium komputerowym MIM). Różne widoki powierzchni można było uzyskać, obracając gotowy rysunek myszką na ekranie.

 Plot3D[Re[Exp[x + I*y]], {x, -2, 1.5}, {y, 0, 4*Pi},  		PlotPoints -> {100, 100},  		BoxRatios -> {1, 2, 1.3}, PlotRange -> All,  			TicksStyle -> Directive[Black, Thick, 24],  		PlotStyle -> Directive[Opacity[0.5]],  		ColorFunction -> (Hue[(Arg[Exp[#1 + I*#2]])/(2*Pi)] &),  		ColorFunctionScaling -> False,  		MeshFunctions -> (#3 &),  		MeshStyle -> {Gray, Thick},  		Mesh -> 20, ImageSize -> 700,  		PerformanceGoal -> "Quality",  		AxesLabel  				    -> (Style[#, 24] & /@ {"Re(z)", "Im(z)", "Re(exp(z))"})  ] 

Funkcje trygonometryczne

Istnieje wiele równoważnych sposobów ścisłego definiowania funkcji trygonometrycznych. Jeden z nich polega na wykorzystaniu ich związku z funkcją wykładniczą zmiennej zespolonej.

Definicja (#) Dla każdej liczby zespolonej $ z\in\C $ przyjmujemy

\[ \cos z = \frac{\exp(iz)+\exp(-iz)}{2}\, , \qquad \sin z = \frac{\exp(iz)-\exp(-iz)}{2i}\, . \]

Wzory użyte w tej definicji będziemy nazywać wzorami Eulera.

Twierdzenie [własności funkcji trygonometrycznych](#) Dla każdego $ z\in \C $ zachodzą równości:

    {(T\arabic{enumi)}}

  1. $ (\sin z)^2+(\cos z)^2=1 $.
  2. $ \exp (iz)  = \cos z + i\sin z $, a ponadto
    \[ \begin{eqnarray}  	\label{szereg-cos} \cos z &= &\sum_{k=0}^\infty (-1)^k\frac{z^{2k}}{(2k)!} = 1 -\frac{z^2}{2!} +\frac{z^4}{4!} - \frac{z^6}{6!}+\cdots,\\   \label{szereg-sin}  \sin z &= &\sum_{k=0}^\infty (-1)^{k}\frac{z^{2k+1}}{(2k+1)!} = z -\frac{z^3}{3!} +\frac{z^5}{5!} -\frac{z^7}{7!} + \cdots \end{eqnarray} \]

    (i oba szeregi są bezwzględnie zbieżne).

Wreszcie,

    \setcounter{enumi}{2} {(T\arabic{enumi)}}

  1. dla każdego ciągu $ (z_n)\subset\C\setminus\{0\} $, który jest zbieżny do zera, zachodzą równości
    $$\displaystyle\lim_{n\to\infty} \frac{\sin z_n}{z_n}=1, \qquad \lim _{n\to\infty} \frac{\cos z_n-1}{z_n}=0 .$$

Dowód:
Wprost z definicji funkcji trygonometrycznych i równości

$$\exp(z)\exp(w)=\exp(z+w)$$

otrzymujemy

\[ \begin{eqnarray*} (\cos z)^2 + (\sin z)^2 & = & \left(\frac{\exp(iz)+\exp(-iz)}{2}\right)^2+ \left(\frac{\exp(iz)-\exp(-iz)}{2i}\right)^2 \\ & =  &  \frac{\exp(2iz)+2+\exp(-2iz)}{4}+\frac{\exp(2iz)-2+\exp(-2iz)}{-4}  \\  & = & \frac 4 4 \ = \ 1, \end{eqnarray*} \]

tzn. własność (T1). Mamy także

\[ \cos z + i \sin z =   \frac{\exp(iz)+\exp(-iz)}{2}+ i \,    \frac{\exp(iz)-\exp(-iz)}{2i} = \exp(i z)\, . \]

Z definicji cosinusa,

\[ 2 \cos z = \exp (iz) + \exp(-iz)  =  \lim_{n\to\infty} \biggl( \sum_{k=0}^{n} \frac{i^kz^k}{k!} + \frac{(-i)^kz^k}{k!}  \biggr)=  \lim_{n\to\infty} \sum_{k=0}^{n} \frac{z^k}{k!} \left(i^k+(-i)^k\right) \, . \]

Ponieważ

\[ i^k+ (-i)^k = \left(1+(-1)^k\right) i^k =\left\{ \begin{array}{rl} 0, \quad & \mbox{gdy $k$ jest nieparzyste,}      \\ 2, \quad & \mbox{gdy $k$ jest podzielne przez $4$,} \\   -2,\quad & \mbox{gdy $k=4l-2$ dla pewnego $l\in \N$,} \end{array}\right. \]

więc łatwo wynika stąd wzór szereg-cos (zostają tylko składniki o parzystych numerach, ze znakami na przemian). Zbieżność bezwzględna szeregu szereg-cos, tzn. zbieżność szeregu

\[ 1 + \frac{|z|^2}{2!} +\frac{|z|^4}{4!} + \frac{|z|^6}{6!}+\cdots \]

wynika stąd, że $ j $-ta suma częściowa nie przekracza $ (2j-1) $-szej sumy cześciowej szeregu

\[ 1+|z|+ \frac{|z|^2}{2!} +\frac{|z|^3}{3!}+\frac{|z|^4}{4!} + \frac{|z|^5}{5!}+\cdots = \exp(|z|)\, . \]

Podobnie dowodzimy wzoru szereg-sin i bezwzględnej zbieżności występującego w nim szeregu. To kończy dowód własności (T2).

Dla dowodu (T3) ustalmy ciąg $ z_n\to 0 $ ($ z_n\not=0 $ dla wszystkich $ n\in \N $) i napiszmy

\[ \frac{\sin z_n}{z_n} = \frac{\exp(iz_n)-\exp(-iz_n)}{2iz_n} =\frac{1}{2}\left(\frac{\exp(iz_n)-1}{iz_n}+\frac{\exp(-iz_n)-1}{-iz_n}\right)\, . \]

Z własności (v) zespolonej funkcji wykładniczej wynika, że każdy ze składników w nawiasie ma dla $ n\to\infty $ granicę równą 1, więc z twierdzenia o arytmetycznych własnościach granic otrzymujemy $ (\sin z_n)/z_n\to 1 $. Podobnie radzimy sobie z cosinusem, pisząc

\[ \frac{\cos z_n-1}{z_n}= \frac{\exp(iz_n)+\exp(-iz_n)-2}{2z_n}= \frac{i}{2} \left(\frac{\exp(iz_n)-1}{iz_n}+\frac{\exp(-iz_n)-1}{iz_n}\right) \, . \]

Tym razem dla $ n\to \infty $ pierwszy składnik w nawiasie ma granicę równą 1, a drugi granicę równą $ -1 $. Dlatego ich suma ma granicę 0.

Ze wzorów szereg-cos, szereg-sin otrzymujemy natychmiast

Wniosek Dla każdego $ z\in \C $ jest $ \cos(-z)=\cos z $, $ \sin(-z)=-\sin z $.

Wniosek Jeśli $ x\in \R $, to $ \sin x,\cos x\in \R\cap [-1,1] $. Ponadto, $ \cos 0 =1 $, $ \sin 0 = 0 $.

Dowód:
Sumy szeregów szereg-cos i szereg-sin są, rzecz jasna, liczbami rzeczywistymi, gdy $ z=x\in \R $. To, że $ \sin x $ oraz $ \cos x $ należą do przedziału $ [-1,1] $, wynika z własności (T1). Wartości sinusa i cosinusa w zerze obliczamy, wstawiając $ z=0 $ we wzorach szereg-sin i szereg-cos.

Wniosek [ciągłość funkcji trygonometrycznych](#) Dla każdego ciągu $ (z_n)\subset \C $ takiego, że $ \lim z_n=z\in \C $, mamy

\[ 	\lim_{n\to\infty} \sin z_n = \sin z\, , \qquad   	\lim_{n\to\infty} \cos z_n = \cos z\, . 	\]

Dowód:
To wynika ze wzorów Eulera i Wniosku~ [link] (ciągłości funkcji wykładniczej).

Stwierdzenie (#) Dla dowolnych liczb zespolonych $ z,w\in C $ zachodzą równości

\[ \begin{eqnarray*}  	\cos z - \cos w  	& = & -2 \sin \frac{z-w}2 \sin \frac{z+w}2 \, , \\ 	\sin z - \sin w & = & 2 \sin \frac{z-w}2 \cos \frac{z+w}2 \, .  	\end{eqnarray*} \]

Dowód:
Oba wzory uzyskujemy z czysto szkolnych rachunków, stosując definicję sinusa i cosinusa oraz własność $ \exp(z+w)=\exp(z)\exp(w) $. Sprawdźmy dla przykładu wzór na różnicę cosinusów. Jego prawa strona to

\[ \begin{eqnarray*}  -2 \sin \frac{z-w}2 \sin \frac{z+w}2 & = & \frac{-2}{2i\cdot 2i}  \left(e^{i(z-w)/2}-e^{-i(z-w)/2}\right) \left(e^{i(z+w)/2}-e^{-i(z-w)/2}\right)  \\ & = & \frac 12 \left(e^{iz}-e^{iw}-e^{-iw}+e^{iz}\right) \\ & = & \cos z - \cos w\, . \end{eqnarray*} \]

Wzór na różnicę sinusów uzyskujemy podobnie. Szczegóły pozostawiamy Czytelnikowi.

Liczba $ \pi $

Czytelnik, który zna funkcje trygonometryczne ze szkoły, zauważył zapewne, że dotychczas nie dysponujemy formalnym opisem miejsc zerowych tych funkcji. Aby ten opis uzyskać i przy okazji zdefiniować liczbę $ \pi $, udowodnimy następujące twierdzenie.

Twierdzenie (#)W przedziale $ (0,2) $ funkcja $ \cos $ ma dokładnie jedno miejsce zerowe.

Dowód tego twierdzenia poprzedzimy serią nieskomplikowanych lematów, które komuś, kto myśli: przecież widziałem już kiedyś wykresy sinusa i cosinusa, a ponadto wiem, że jedyne miejsce zerowe cosinusa w przedziale $ (0,2) $ to $ \pi/2=1,\!57\ldots $, mogą się wydawać oczywiste, ale pamiętajmy: funkcje trygonometryczne to dla nas obiekty zdefiniowane wzorami Eulera! Chcemy sprawdzić ich własności, odwołując się wyłącznie do definicji i~do tego, co już wykazaliśmy w sposób ścisły.

Lemat Dla każdego $ y\in (0,2] $ zachodzą nierówności $ y>\sin y >0 $.

Dowód:
Dzięki szereg-sin mamy

\[ \sin y = y - \lim_{n\to\infty} s_n(y), \]

gdzie

\[ s_n(y)=\left(\frac{y^3}{3!}-\frac{y^5}{5!}\right) + \left(\frac{y^7}{7!}-\frac{y^9}{9!}\right) +\cdots+\left(\frac{y^{4n-1}}{(4n-1)!}-\frac{y^{4n+1}}{(4n+1)!} \right)\, . \]

Każdy z nawiasów jest dodatni dla $ y\in (0,2] $, gdyż dla $ n\in \N $ mamy $ 4n+1> 3 $ i $ 4n> 2 $, a więc

\[ 1>\frac{2^2}{2\cdot 3} \ge \frac{y^2}{4n(4n+1)}>0 \quad\Rightarrow\quad    \frac{y^{4n-1}}{(4n-1)!} > \frac{y^{4n+1}}{(4n+1)!}\,. \]

Zatem $ s_n(y) $ rośnie i ma wyrazy dodatnie. Dlatego $ \lim s_n(y) >0 $ i $ \sin y < y $ dla $ y\in (0,2] $. Podobnie sprawdzamy, że $ \sin y > 0 $ dla $ y\in (0,2] $: to wynika stąd, że każdy składnik po prawej stronie równości

\[ \sin z = \left(y-\frac{y^3}{3!}\right)+\left(\frac{y^5}{5!}-\frac{y^7}{7!}\right) + \cdots \]

jest dodatni, gdy $ y\in (0,2] $.

Lemat (#) Cosinus jest malejący na przedziale $ [0,2] $, tzn.

\[ \begin{equation} \label{monot-cos} x_1,x_2 \in [0,2],\quad x_2>x_1 \qquad\Rightarrow\qquad \cos x_2 < \cos x_1\, .	 \end{equation} \]

Ponadto, dla wszystkich $ x_1,x_2\in [0,2] $ jest

\[ |\cos x_2 - \cos x_1  |\le |x_2-x_1|\, . \]

Dowód:
Korzystając ze wzoru na różnicę cosinusów (patrz Stwierdzenie~ [link]), piszemy dla $ x_1<x_2, x_1,x_2\in [0,2] $

\[ \cos x_2 - \cos x_1  = - 2\sin \frac{x_2-x_1} 2 \sin \frac{x_2+x_1} 2\, \qquad\mbox{ dla $x_1<x_2,\ x_1,x_2\in [0,2]$.} \]

Jednak $ y=\frac{x_2-x_1} 2\in (0,1] $, więc zgodnie z poprzednim Lematem jest $ \sin y >0 $. Podobnie, $ \sin \frac{x_2+x_1} 2>0 $, gdyż $ (x_1+x_2)/2\in (0,2] $. Oba sinusy w powyższej równości są więc dodatnie, a stąd $ \cos x_2 - \cos x_1<0 $.

Ponadto, przy założeniu $ 2\ge x_2> x_1 \ge 0 $ jest

\[ |\cos x_2 - \cos x_1| = 2 \biggl|\sin \frac{x_2-x_1} 2 \sin \frac{x_2+x_1} 2\biggr| \le  2 \biggl|\sin \frac{x_2-x_1} 2\biggr| =  2\sin \frac{x_2-x_1} 2 \le x_2-x_1. \]

W ostatniej nierówności skorzystaliśmy z tego, że $ \sin y \le  y $ na $ (0,2] $.

Lemat Dla każdej liczby $ x\in [0,1) $ jest $ \cos x > 0 $, a dla każdej liczby $ y\in [\frac{40}{23},2] $ jest $ \cos y < 0 $. (#)

Dowód:
Po pierwsze, dla każdej liczby $ x\in [0,1) $ mamy wobec nierówności z poprzedniego Lematu: \( |1-\cos x|=|\cos 0 - \cos x|\le |0-x| =x < 1, \) a więc $ \cos x > 0 $. Oszacujemy teraz liczbę $ \cos 2 $. Mamy

\[ \begin{eqnarray*} \cos 2 & = & 1-\frac {2^2}{2!} +\left(\frac{2^4}{4!}-\frac{2^6}{6!}\right) +                                                  \left(\frac{2^8}{8!}-\frac{2^{10}}{10!}\right) + \cdots\\ & = & -1  +\left(\frac{2^4}{4!}-\frac{2^6}{6!}\right) +                                                  \left(\frac{2^8}{8!}-\frac{2^{10}}{10!}\right) +\cdots \\ & \le & - 1 +  \frac{2^4}{4!} + \frac{2^8}{8!} + \cdots   \qquad\mbox{(opuszczamy ujemne składniki w nawiasach)} \\ & < & -1 + \frac{2^4}{4!} \left(1+ \frac{2^4}{5^4}+\frac{2^8}{5^8}+\cdots\right) \\ & = & -1 + \frac{16}{24}\cdot \frac{1}{1-\left(\frac{2}{5}\right)^4} < -1 +   \frac{16}{24}\cdot \frac{1}{1-\frac{1}{24}} = -\frac{7}{23}\, , \qquad\mbox{gdyż} \quad\left(\frac{2}{5}\right)^4< \frac{1}{24}\, . \end{eqnarray*} \]

Jeśli $ y\in [\frac{40}{23},2] $, to $ |y-2|\le \frac 6{23} $, a więc, dzięki nierówności $ |\cos 2-\cos y|\le |2-y|\le \frac 6{23} $ (z~poprzedniego Lematu) i powyższemu oszacowaniu liczby $ \cos 2 $, z pewnością jest

\[ \cos y \le -\frac{7}{23} + \frac{6}{23}=-\frac{1}{23} < 0. \]

Dowód Lematu~ [link] jest zakończony.

    Dowód Twierdzenia~ [link]. Ponieważ $ \cos x $ maleje na $ [0,2] $, więc ma w tym przedziale co najwyżej jedno miejsce zerowe. Niech

\[ A=\{x\in [0,2]\colon \cos x > 0\}\, . \]

Z monotoniczności cosinusa wynika, że ten zbiór jest przedziałem. Z ostatniego lematu wynika ponadto, że

\[ [0,1) \subset A, \qquad A\subset [0,40/23], \]

a więc kres górny $ x_0 $ przedziału $ A $ jest pewną liczbą z przedziału $ [1,40/23]\subset [1,7/4) $.

Ponadto, $ \cos x_0 = 0 $. Istotnie, liczba $ x_0 $ jest granicą ciągu $ x_n=x_0(1-\frac 1n ) \in A $ i dlatego z ciągłości cosinusa $ \cos x_0=\lim \cos x_n \ge 0 $. Gdyby $ \cos x_0>0 $, to wobec równości

\[ 0< \cos x_0 = \lim_{m\to \infty}\cos (x_0+m^{-1}) \]

byłoby $ \cos (x_0+\frac 1m)>0 $ dla wszystkich dostatecznie dużych $ m $, tzn.

\[ x_0+\frac 1m \in A, \qquad x_0+\frac 1m > x_0=\sup A, \]

to zaś jest sprzeczność.

Definicja [liczba $ \boldmath\pi $] Liczba $ \pi $ to liczba rzeczywista równa $ 2x_0 $, gdzie $ x_0\in (0,2) $ jest jedyną w przedziale $ (0,2) $ liczbą taką, że $ \cos x_0=0 $.
Twierdzenie Zachodzą wzory

\[ 	e^{i\pi/2}=i, \qquad e^{i\pi} + 1 = 0. 	\]

Dowód:
Wiemy już, że $ \cos \frac \pi 2 = 0 $. Zatem, z równości

\[ \left(\cos \frac \pi 2 \right)^2 + \left(\sin \frac \pi 2 \right)^2  =1 \]

wynika, że $ \sin \frac\pi 2=\pm 1=1 $, bo wiemy już, że $ \sin x>0 $ na $ (0,2) $. Zatem $ \exp(i\frac\pi 2)= 0 + 1 \cdot i = i $. Stąd wynika, że

\[ e^{\pi i}=\left(e^{\frac \pi 2 \cdot i}\right)^2 = i^2 = -1\, . \]

To kończy dowód.

Definicja Liczba $ T\not=0 $ jest okresem funkcji $ f\colon \C\to\C $ (odpowiednio: funkcji $ f\colon \R\to\R $) wtedy i tylko wtedy, gdy $ f(z+T)=f(z) $ dla każdego $ z\in \C $ (odpowiednio: dla każdego $ z\in\R $).
Twierdzenie [okresowość $ \exp $ na $ \C $] Dla każdej liczby $ z\in \C $ i każdego $ k\in \Z\setminus\{0\} $ zachodzi równość

\[ \exp(2\pi i k + z) = \exp(z)\, , \]

tzn. $ 2\pi i k $ jest okresem funkcji wykładniczej. Ponadto, jeśli liczba $ T $ jest okresem funkcji wykładniczej, to $ T=2\pi i k $ dla pewnego $ k\in \Z $.

Dowód:
Jeśli $ T=2\pi i k $, gdzie jest całkowite, to wtedy dla każdej liczby zespolonej $ z $ mamy

\[ \exp(z+T)=\exp(z)\exp (T)=\exp(z)\exp(2\pi i)^{k} = \exp(z)\, ,  \]

gdyż $ \exp(2\pi i)=\exp(\pi i)^2 =(-1)^2=1. $ Dlatego każda liczba $ T=2\pi i k $, gdzie $ k\in \Z $, jest okresem funkcji wykładniczej.

Pozostaje wykazać, że innych okresów nie ma. Jeśli $ \exp(z+T)=\exp(z) $ dla wszystkich $ z\in \C $, to z pewnością $ \exp T=1 $. Niech $ T=t+is $, gdzie $ t,s\in \R $. Wtedy

\[ 1=|\exp T|=|\exp(t+is)|=\exp t, \]

a zatem $ t=0 $ i $ T=is $ dla pewnego $ s\in \R\setminus\{0\} $.

Przypuśćmy, że $ s $ nie jest całkowitą wielokrotnością $ 2\pi $. Ponieważ suma okresów funkcji jest okresem tej funkcji, więc z pierwszej części dowodu wynika, że dla każdego $ k\in \Z $ liczba $ i(s+2\pi k) $ też jest okresem $ \exp $. Dobierzmy $ k\in  \Z $ tak, aby $ s'=(s+2k\pi)\in (0,2\pi) $. Oczywiście,

\[                                                    \exp (is') = \cos s' + i\sin s' = 1\, . \]

Stąd

\[ \cos(s'/4)+i\sin(s'/4)=\exp(is'/4) \in \{1,-1,i,-i\} , \]

gdyż innych pierwiastków czwartego stopnia z jedynki nie ma. Ponieważ jednak $ 0<s'/4<\frac \pi 2<2 $, więc $ 1>\cos (s'/4)>0 $ i $ \sin (s'/4) > 0 $. To jest sprzeczność, bo w $  \{1,-1,i,-i\} $ nie ma żadnej liczby, która spełniałaby naraz obie nierówności $ \mathrm{Re}\, z>0 $ $ \mathrm{Im}\, z>0 $.

Uzyskana sprzeczność dowodzi, że $ s $ musi być całkowitą wielokrotnością $ 2\pi $. To kończy dowód całego twierdzenia.

Zauważmy, że dowodząc ostatniego twierdzenia, wykazaliśmy także następujący fakt.

Wniosek (#) Równość

\[ 	\exp(i\xi)=1, \qquad \xi \in \C 	\]

zachodzi wtedy i tylko wtedy, gdy $ \xi=2\pi k $ dla pewnego $ k\in \Z $.

Wniosek [okresowość funkcji trygonometrycznych] Jeśli $ T=2\pi k $, gdzie $ k\in \Z\setminus\{0\} $, to $ T $ jest okresem obu funkcji

\[ \sin,\cos\colon \C\to \C. \]

Ponadto, jeśli $ T $ jest okresem cosinusa (lub sinusa), to $ T $ jest całkowitą wielokrotnością $ 2\pi $.

Dowód:
To, że każda liczba $ T=2\pi k $, gdzie $ k\in \Z\setminus\{0\} $, jest okresem zarówno sinusa, jak i cosinusa, wynika z poprzedniego twierdzenia i wzorów Eulera.

Wykażemy drugą część twierdzenia. Niech $ T $ będzie okresem cosinusa (lub, odpowiednio, sinusa). Ponieważ $ \exp (\pm i\pi/2)=\pm i $, więc ze wzorów Eulera otrzymujemy

\[ \begin{equation}    \label{wzor-red1} \cos (z+\pi /2)  =\frac{e^{i(z+\pi/2)}+e^{-i(z+\pi/2)}}{2} = \frac{i e^{iz}-i e^{-iz}}{2} =-\sin z \quad\mbox{dla każdego $z\in \C$}\, . \end{equation} \]

Podobnie sprawdzamy, że

\[ \begin{equation}   \label{wzor-red2} \sin(z+\pi/2)=\cos z \quad\mbox{dla każdego $z\in \C$.} \end{equation} \]

Z obu tych wzorów (Wzory wzor-red1), \eqref{wzor-red2 bywają nazwywane wzorami redukcyjnymi.}wynika, że $ T $ jest także okresem sinusa (lub, odpowiednio, cosinusa). Zatem dla dowolnego $ z\in \C $ jest

\[ \exp(i(z+T)) = \cos (z+T)+i\sin (z+T)=\cos z + i\sin z = \exp(iz),    \]

tzn. liczba $ iT $ jest okresem $ \exp\colon \C\to\C $. Na mocy poprzedniego twierdzenia, $ iT $ jest całkowitą wielokrotnością $ 2\pi i $, tzn. $ T=2\pi k $ dla pewnego $ k\in \Z $.

Wniosek

  1. Jedynymi zespolonymi rozwiązaniami równania $ \sin z = 0 $ są liczby $ z=k\pi $, gdzie $ k\in \Z $.
  2. Jedynymi zespolonymi rozwiązaniami równania $ \cos z = 0 $ są liczby $ z=(k+\frac 12)\pi $, gdzie $ k\in \Z $.

Dowód:
Jeśli $ \sin z  = 0 $, to $ \cos z=\pm 1 $, więc $ \exp (iz)=\pm 1 + i \cdot = \pm 1 $, a stąd $ \exp(2iz)=1 $. Na mocy Wniosku~ [link] otrzymujemy

\[ 2z = 2k\pi, \qquad\mbox{gdzie $k\in\Z$.} \]

Zatem tylko liczby $ z=k\pi $, gdzie $ k\in \Z $, mogą być rozwiązaniami równania $ \sin z = 0 $. Na odwrót, jeśli $ z=k\pi $ i $ k\in \Z $ jest dowolne, to

\[ \exp(i k\pi) = \bigl(\exp(i\pi)\bigr)^k = (-1)^k=(-1)^k + 0\cdot i= \cos k\pi + i \sin k\pi,                                                          \]

więc $ \sin z = 0 $. To kończy dowód pierwszej części wniosku. Druga część wynika z pierwszej i z tożsamości $ \cos (z+\pi/2)=-\sin z $.

Wzór de Moivre'a

Odnotujmy prostą konsekwencję związków między funkcją wykładniczą i funkcjami trygonometrycznymi.

Stwierdzenie [wzór de Moivre'a] Jeśli $ \alpha \in \R $, to wówczas dla każdego $ n\in \N $

\[ 	 \cos n\alpha + i \sin n\alpha = (\cos\alpha + i\sin\alpha)^n  	\]

Dowód:
Z własności $ \exp $ i wzorów Eulera wynika, że lewa strona to, inaczej, $ \exp(in\alpha)=\exp(i\alpha)^n=(\cos\alpha + i\sin n\alpha)^n $.

Wniosek Jeśli $ \alpha\in \R $ i $ n\in \N $, to

\[ \cos n\alpha  =\mathrm{Re}\, \bigl(e^{i\alpha}\bigr)^n\, ,  \qquad \sin n\alpha = \mathrm{Im}\, \bigl(e^{i\alpha}\bigr)^n\, . \]

 

Znając wzór de Moivre'a (i dwumian Newtona) można bez trudu wyrażać $ \cos n\alpha $ oraz $ \sin n\alpha $ przez $ \cos\alpha $ i $ \sin\alpha $. Ciekawsze, i ważniejsze jest zastosowanie do wyznaczania sum sinusów oraz cosinusów kolejnych wielokrotności $ \alpha $ -- aby takie sumy obliczać, wystarczy umieć sumować postęp geometryczny, bowiem

\[ \sum_{n=k_1}^{{k_2}} \cos n \alpha = \sum_{n=k_1}^{{k_2}} \mathrm{Re}\,   \bigl(e^{i\alpha}\bigr)^n  =  \mathrm{Re}\, \biggl(   \sum_{n=k_1}^{{k_2}}    \bigl(e^{i\alpha}\bigr)^n  \biggl)\, .  \]

(Dla sum sinusów trzeba użyć części urojonej.)

Zadanie Sprawdzić, że jeśli $ x\in\R $ i $ \exp (ix)\not =1 $, to

\[ 	\sum_{n=0}^N \sin n x =  \frac{\sin\bigl(Nx/2\bigr)\sin \bigl((N+1)x/2 \bigr)}{\sin(x/2)}\, . 	\]

Znaleźć analogiczny wzór na sumę cosinusów. Jak zmienią się oba wzory, gdy przestaniemy zakładać, że $ \exp(ix)\not=1 $?

    

Na tym zakończymy pierwsze spotkanie z szeregami. Chciałbym, żeby Czytelnik tego tekstu nie tylko uważał szeregi za pewne obiekty matematyczne, które (być może) warto poznawać i badać same w sobie, ale widział w nich przede wszystkim narzędzie, służące m.in. do definiowania różnych funkcji, systematycznego badania ich własności, oraz obliczania ich wartości. To ma szczególne znaczenie praktyczne wtedy, gdy - mówiąc nieprecyzyjnie - szeregi są zbieżne szybko. Tak właśnie jest w przypadku szeregów $ \exp $, $ \sin $ i $ \cos $, z uwagi na błyskawiczne tempo wzrostu silni. Dopóki obliczamy np. wartości $ e^x $ dla niezbyt dużych $ x $, możemy w praktyce traktować funkcję $ \exp $ jako wielomian, złożony z pewnej liczby składników szeregu $ \sum (x^n/n!) $; np. $ e^3 $ różni się od $ \sum_{n=0}^{50}3^n/n! $ naprawdę niewiele: około $ 10^{-42} $.

\begin{center} \begin{verbatim}	 	In[1]:= N[Exp[3], 44]</p>
<p>	Out[1]= 20.085536923187667740928529654581717896987908</p>
<p>	In[2]:= N[Sum[3^n/n!, {n, 0, 50}], 44]</p>
<p>	Out[2]= 20.085536923187667740928529654581717896987906 	\end{verbatim}</p>
<p>\end{center}

Gdybyśmy chcieli z taką dokładnością określić odległość Ziemi od Słońca, nanometry byłyby zdecydowanie za dużymi jednostkami. Jeśli ktoś woli myśleć o wielkościach związanych z ekonomią, a nie z astronomią czy fizyką, może sprawdzić, jakie jest zadłużenie budżetu USA. Strona

  http://www.brillig.com/debt_clock/  

podaje je z dokładnością do 1 centa, aktualizując wartości co parę sekund. Taka precyzja z praktycznego punktu widzenia graniczy z absurdem, ale dokładność przybliżenia

\[ \sum_{n=0}^{50}\frac{3^n}{n!} \approx e^3 \]

jest i tak o 25 rzędów wielkości lepsza.

Takie uwagi mogą kogoś zaciekawić, jednak - aby lepiej rozumieć, co się naprawdę za nimi kryje - musimy w miarę systematycznie poznać takie pojęcia, jak ciągłość, różniczkowalność i zbieżność jednostajna. Ich ścisłe definicje oraz własności poznamy w kolejnych rozdziałach.

Rachunek różniczkowy

Bardzo ważnym działem Analizy Matematycznej jest rachunek różniczkowy. Poznając go, opanujemy narzędzia, umożiwiające systematyczne badanie zachowania odpowiednio regularnych funkcji jednej zmiennej. Nauczymy się, jak określać tempo wzrostu funkcji i~jak znajdować przedziały, na których funkcja rośnie (lub maleje), jest wypukła (lub wklęsła). Poznamy także dodatkowe wygodne narzędzia, służące do przybliżania funkcji za pomocą wielomianów i obliczania granic.

Pojęcie pochodnej

Pojęcie pochodnej, obok pojęcia granicy, jest jednym z najważniejszych pojęć całej analizy.

Definicja Niech $ A\subset \R $ i niech $ a\in A $ będzie punktem skupienia zbioru $ A $. Powiemy, że funkcja $ f\colon A\to \R $ jest różniczkowalna w punkcie $ a $ wtedy i tylko wtedy, gdy istnieje skończona granica

\[ \begin{equation} 	\label{defpochodnej} 	\lim_{h\to 0}\frac{f(a+h)-f(a)}{h}=\lim_{x\to a}\frac{f(x)-f(a)}{x-a} = f'(a)\, . \end{equation} \]

Liczbę $ f'(a) $ nazywamy pochodną funkcji $ f $ w punkcie $ a $. Stosunek $ \frac{f(x)-f(a)}{x-a} $ nazywamy ilorazem różnicowym funkcji $ f $.

W różnych źródłach można także spotkać oznaczenia

\[ f'(a)=\biggl.\frac{\mathrm{d}f}{\mathrm{d}x}\biggr|_{x=a}, \qquad f'(a)= \frac{\mathrm{d}f}{\mathrm{d}x} (a), \]

którymi będziemy się posługiwać rzadko.

Uwaga (#) Wzoru defpochodnej można użyć, by zdefiniować (w taki sam sposób):

  1. Pochodną funkcji zespolonej $ f\colon \C\supset A\to \C $ w punkcie skupienia $ a\in A $ zbioru $ A $; $ f'(a) $ (o ile istnieje) jest wtedy liczbą zespoloną.
  2. Pochodną funkcji wektorowej $ f\colon \R\supset A\to \K^N $ w punkcie skupienia $ a\in A $ zbioru $ A $, gdzie $ \K $ jest ciałem $ \R $ liczb rzeczywistych lub ciałem $ \C $ liczb zespolonych; $ f'(a) $ (o ile istnieje) jest wtedy pewnym wektorem z przestrzeni $ \K^N $.

W obu powyższych przypadkach ma sens dzielenie przez $ x-a $, czyli mnożenie przez $ (x-a)^{-1} $. Czytelnik powinien jednak rozumieć, że takie postępowanie straciłoby sens, gdybyśmy rozpatrywali funkcje wielu zmiennych rzeczywistych (lub zespolonych). Wtedy pojęcie pochodnej trzeba definiować inaczej. Wrócimy do tej sprawy na początku drugiego roku studiów.

Związek różniczkowalności z ciągłością

Różniczkowalność, zarówno w dziedzinie rzeczywistej, jak i zespolonej, jest warunkiem silniejszym od ciągłości.

Stwierdzenie (#) Jeśli funkcja $ f\colon \K\supset A\to \K $ (gdzie $ \K=\R $ lub $ \K=\C $) jest różniczkowalna w punkcie $ a\in A $, to jest ciągła w punkcie $ a $.

Dowód:
Piszemy

\[ f(x)-f(a)= \frac{f(x)-f(a)}{x-a} \cdot (x-a) \]

i przechodzimy do granicy przy $ x\to a $, korzystając z twierdzenia o granicy iloczynu. Ponieważ $ f $ jest różniczkowalna w $ a $, otrzymujemy

\[ \lim_{x\to a} \bigl( f(x)-f(a)\bigr) = f'(a) \cdot \lim_{x\to a} (x-a) = f'(a)\cdot 0 = 0. \]

Zatem $ f $ jest ciągła w punkcie $ a $.

Nie wszystkie funkcje ciągłe są jednak różniczkowalne.

Przykład Funkcja $ f(x)=|x| $ dla $ x\in \R $ nie jest różniczkowalna w punkcie $ a=0 $. Istotnie, granica we wzorze defpochodnej nie istnieje dla $ a=0 $, gdyż różne są wtedy granice jednostronne ilorazów różnicowych:

\[ 	\lim_{h\to 0^+} \frac{f(0+h)-f(0)}h =	\lim_{h\to 0^+}\frac {|h|}h = 1 \not= - 1 = 	\lim_{h\to 0^-} \frac{|h|}{h}= \lim_{h\to 0^-} \frac{f(0+h)-f(0)}h\, . 	\]
Zadanie Niech $ f(z)=\overline{z} $ dla $ z\in \C $. Wykazać, że jeśli pochodną zespoloną definiujemy tak, jak w Uwadze~ [link] (a), to $ f $ nie ma pochodnej zespolonej w żadnym punkcie $ a\in \C $.      Wskazówka. Zbadać ilorazy różnicowe $ f $ dla ciągu przyrostów $ h_n=i^n/n $, gdzie $ i^2=-1 $.

Istnieją także funkcje ciągłe $ f\colon \R\to \R $, które nie mają pochodnej w żadnym punkcie. Konstrukcja przykładów takich funkcji jest jednak trudniejsza i wymaga albo bardziej zaawansowanej wiedzy matematycznej (np. z zakresu topologii), albo subtelnej analizy funkcji, określonych za pomocą szeregów. Tą sprawą zajmiemy się przy okazji omawiania tzw. zbieżności jednostajnej w następnym rozdziale.

Interpretacja pochodnej funkcji zmiennej rzeczywistej

    Interpretacja geometryczna pochodnej. Niech $ f\colon I\to \R $ będzie różniczkowalna w punkcie $ a\in I $ i niech $ I $ będzie przedziałem. Rozważmy wykres $ f $, tzn. zbiór punktów

\[ \{(x,y)\in \R^2\ \colon \ x\in I, \ y=f(x)\}\ . \]

Iloraz różnicowy $ \frac{f(x)-f(a)}{x-a} $ jest tangensem kąta nachylenia siecznej, przechodzącej przez punkty $ \bigl(a,f(a)\bigr) $ i $ \bigl(x,f(x)\bigr) $, do osi $ x $-ów. Intuicja podpowiada, że gdy funkcja $ f $ jest odpowiednio ``porządna'', to dla $ x $ bliskich $ a $ taka sieczna powinna być przybliżeniem stycznej do wykresu funkcji. Istnienie pochodnej w punkcie $ a $, a więc granicy ilorazów różnicowych, oznacza istnienie stycznej do wykresu $ f $ w punkcie $ \bigl(a,f(a)\bigr) $. Liczba $ f'(a) $ jest współczynnikiem kierunkowym tej stycznej. Styczna to prosta, opisana równaniem

\[ y-f(a)=f'(a)(x-a)\, . \]

\begin{figure}[!t] \begin{center}  \hfill \includegraphics*[totalheight=6cm]{inter-poch.png}\hfill \includegraphics*[totalheight=6cm]{sqrt3.png}  \hfill{}      </p>
<p>\end{center}

{\footnotesize\baselineskip 11pt Po lewej: styczna do wykresu funkcji. Po prawej: przypadek, gdy granica ilorazów różnicowych jest nieskończona. Nie mówimy wtedy, że funkcja jest różniczkowalna, ale styczna do wykresu istnieje i jest prostą pionową.

} \end{figure}

Uwaga [pochodne nieskończone] Definiując pochodną, wpisaliśmy w definicję warunek skończoności granicy ilorazów różnicowych. Może się zdarzyć, że ilorazy różnicowe mają w jakimś punkcie granicę nieskończoną. Jest tak np. dla funkcji $ f(x)=\sqrt[3]{x} $, gdzie $ x\in \R $, w punkcie $ x=0 $, gdyż

\[ \lim_{h\to 0}\frac{f(h)-f(0)}h = \lim_{h\to 0}\frac{\sqrt[3]h}h =  \lim_{h\to 0}\frac 1{\sqrt[3]{h^2}} = + \infty\, . \]

Zgodnie z naszą definicją, funkcja $ f $ nie jest różniczkowalna w zerze, bo nie ma tam skończonej granicy ilorazów różnicowych. Mówi się czasem w takich przypadkach, że $ f $ ma pochodną nieskończoną (dla odróżnienia tej sytuacji od takiej, gdy granica ilorazów różnicowych w ogóle nie istnieje). Geometryczna interpretacja tego, że granica ilorazów różnicowych jest w jakimś punkcie dziedziny funkcji nieskończona, jest nietrudna: styczna do wykresu $ f $ istnieje i jest pionowa.

    Interpretacja kinematyczna pochodnej. Załóżmy, że pewien punkt porusza się w sposób ciągły, tzn. dla każdej chwili czasu $ t\ge 0 $ określona jest droga $ s(t)\in [0,\infty) $, przebyta od chwili początkowej $ t_0=0 $ do chwili $ t $, i $ s(t) $ jest ciągłą funkcją $ t $. Różniczkowalność funkcji $ s $ w punkcie $ t_1 $, tzn. istnienie granicy ilorazów różnicowych $ (s(t_2)-s(t_1))/(t_2-t_1) $ dla $ t_2\to t_1 $, oznacza, że w tym ruchu można określić prędkość chwilową, tzn. granicę stosunku przebytej drogi do czasu, w jakim została przebyta, gdy ów czas dąży do zera.

\begin{wrapfigure}[14]{l}[0cm]{6cm}

\includegraphics*[totalheight=6.5cm]{Krzywa3D.png}

\end{wrapfigure}

     Mówiąc nieco dokładniej, gdy funkcja

$$s\colon [0,\infty)\to \R^3$$

jest torem ruchu punktu materialnego w przestrzeni (patrz rysunek obok), to wektor

$$s'(t)=(s_1'(t),s_2'(t),s_3'(t))\in \R^3$$

jest wektorem prędkości chwilowej w chwili $ t $. Zwrot tego wektora jest wyznaczony przez chwilowy kierunek ruchu, a długość jest równa szybkości chwilowej. Z taką interpretacją można spotkać się zarówno w mechanice, jak i w geometrii.

Arytmetyczne własności pochodnej

Stwierdzenie [pochodna sumy] Jeśli $ f,g\colon \R\supset A\to \R $ są różniczkowalne w punkcie skupienia $ a\in A $ zbioru $ A $, to istnieje pochodna $ (f+g)'(a)=f'(a)+g'(a) $.

Dowód:
Obliczymy pochodną sumy wprost z definicji. Piszemy

\[ \frac{(f(x)+g(x))-(f(a)+g(a))}{x-a} = \frac{f(x)-f(a)}{x-a} +\frac{g(x)-g(a)}{x-a} \]

i przechodzimy do granicy przy $ x\to a $. Prawa strona ma granicę $ f'(a)+ g'(a) $, więc pochodna $ (f+g)'(a) $ istnieje i jest równa właśnie $ f'(a)+ g'(a) $.

Stwierdzenie [pochodna iloczynu] Jeśli $ f,g\colon \R\supset A\to \R $ są różniczkowalne w punkcie skupienia $ a\in A $ zbioru $ A $, to istnieje pochodna

$$(f\cdot g)'(a)=f'(a)g(a) + f(a)g'(a).$$

Dowód:
Obliczymy pochodną sumy wprost z definicji. Postępujemy podobnie, jak w rozdziale 2, w dowodzie twierdzenia o granicy iloczynu ciągów. Piszemy

\[ \begin{eqnarray*} \frac{f(x)g(x)-f(a)g(a)}{x-a} & =&  \frac{\bigl(f(x)g(x)-f(a)g(x)\bigr)+\bigl(f(a)g(x)-f(a)g(a)\bigr)}{x-a}\\& =& \frac{f(x)-f(a)}{x-a}\cdot g(x) +f(a)\cdot \frac{g(x)-g(a)}{x-a} \end{eqnarray*} \]

i przechodzimy do granicy przy $ x\to a $. Ze Stwierdzenia~ [link] wynika ciągłość $ g $ w $ a $. Zatem, z twierdzenia o granicy sumy i iloczynu, prawa strona ostatniej równości ma granicę równą

\[ \lim_{x\to a} \frac{f(x)-f(a)}{x-a}\cdot \lim_{x\to a} g(x) +f(a)\cdot \lim_{x\to a} \frac{g(x)-g(a)}{x-a}= f'(a)g(a) + f(a)g'(a). \]

Dowód został zakończony.

Stwierdzenie Jeśli $ g\colon \R\supset A\to \R $ jest różniczkowalna w punkcie skupienia $ a\in A $ zbioru $ A $ oraz $ g(x)\not=0 $ dla $ x\in A $, to istnieje pochodna

$$\left(\frac 1 g\right)'(a)=\frac{-g'(a)}{\bigl(g(a)\bigr)^2}.$$

Dowód:
Ponownie, spójrzmy na iloraz różnicowy

\[ \frac{\displaystyle \frac{1}{g(x)}-\displaystyle \frac{1}{g(a)}}{x-a} = \frac{g(a)-g(x)}{g(a)g(x)\cdot (x-a)}\, . \]

Jak w poprzednim dowodzie, możemy skorzystać ze Stwierdzenia~ [link] i stwierdzić, że ponieważ $ g $ jest ciągła w punkcie $ a $, to na mocy twierdzenia o iloczynie granic, prawa strona ostatniej równości ma dla $ x\to a $ granicę równą

\[ \lim_{x\to a} \frac{g(a)-g(x)}{g(a)g(x)\cdot (x-a)} = \frac 1{g(a)} \cdot \lim_{x\to a} \frac{1}{g(x)} \cdot \lim_{x\to a} \frac{g(a)-g(x)}{x-a} = \frac{-g'(a)}{g(a)^2}\, . \]

Zatem, funkcja $ (1/g) $ jest różniczkowalna w $ a $ i zachodzi równość podana w tezie tego stwierdzenia.

Wniosek [pochodna ilorazu] Jeśli $ f,g\colon \R\supset A\to \R $ są różniczkowalne w punkcie skupienia $ a\in A $ zbioru $ A $ i $ g(x)\not=0 $ dla $ x\in A $, to istnieje pochodna

$$\left(\frac f g\right)'(a)=\frac{f'(a)g(a) - f(a)g'(a)}{g(a)^2}.$$

Dowód:
Korzystamy z równości $ f/g = f\cdot (1/g) $ i poprzednich stwierdzeń. Czytelnik zechce sam sprawdzić rachunki.

Uwaga Wzory na pochodną sumy, iloczynu i ilorazu można stosować, gdy $ f,g $ są funkcjami różniczkowalnymi zmiennej zespolonej o wartościach zespolonych, gdyż w dowodach nie korzystamy nigdzie w sposób istotny z tego, że wartości i argumenty funkcji są rzeczywiste, a nie zespolone. Ponadto, wzór na pochodną sumy zachodzi dla funkcji wektorowych $ f,g\colon R\supset A\to \R^N $, a wzór na pochodną iloczynu - dla funkcji wektorowej $ f\colon R\supset A\to \R^N $ i funkcji $ g\colon \R\supset A\to \R $, której wartości są skalarami, tzn. liczbami rzeczywistymi (trzeba tylko odpowiednio rozumieć prawą i lewą stronę - mamy wtedy do czynienia z mnożeniem wektorów przez liczby).

Pochodna złożenia i funkcji odwrotnej

Aby wyprowadzić znany wzór na pochodną złożenia dwóch funkcji różniczkowalnych, podamy najpierw ważną charakteryzację pochodnej. Można się nią posługiwać zarówno dla funkcji zmiennej rzeczywistej, jak i zmiennej zespolonej, więc wszystkie fakty tego podrozdziału sformułujemy ogólnie (każdy z nich ma dwie wersje: jedną dla $ \K=\R $, drugą dla $ \K=\C $).

Lemat (#) Niech $ A\subset \K $ i niech $ a\in A $ będzie punktem skupienia zbioru $ A $. Funkcja $ f\colon A\to \K $ jest różniczkowalna w punkcie $ a $ wtedy i tylko wtedy, gdy istnieje liczba $ k\in \K $ oraz funkcja $ r_a\colon A\to \K $ taka, że

\[ 	f(x)= f(a)+k\cdot (x-a) + r_a(x)\cdot (x-a) \quad \mbox{dla $x\in A$}, \qquad \lim_{x\to a}r_a(x)=0. 	\]

Mamy wtedy $ k=f'(a) $.

Sens tego lematu jest następujący: różniczkowalność funkcji $ f $ w punkcie $ a $ oznacza tyle, że funkcję $ f $ można przybliżać funkcją liniową $ l(x)=f(a)+f'(a)(x-a) $, a błąd $ b(x)=r_a(x)(x-a) $ tego przybliżenia spełnia warunek

\[ \lim_{x\to a}\frac{b(x)}{x-a} = \lim_{x\to a}r_a(x)=0. \]

Innymi słowy, dla $ x $ bliskich $ a $ błąd $ b(x) $ jest mniejszego rzędu, niż różnica $ x-a $. Istnienie pochodnej $ f'(a) $ jest równoważne istnieniu najlepszego przybliżenia liniowego funkcji $ f $ w~pobliżu punktu $ a $.

Dowód:
Jeśli $ f'(a) $ istnieje, to funkcja

\[ r_a(x) := \frac{f(x)-f(a)}{x-a} -f'(a) \]

spełnia oba warunki podane w tezie lematu, gdy weźmiemy $ k=f'(a) $. Na odwrót, jeśli odpowiednia funkcja $ r_a $ istnieje, to istnieje także

\[ f'(a)=\lim_{x\to a}\frac{f(x)-f(a)}{x-a} = \lim_{x\to a} (k+r_a(x)) = k\, . \]

To spostrzeżenie kończy dowód lematu.

    Uwaga. Lemat~ [link] wygląda na fakt niepozorny i dość oczywisty, jednak zdecydowanie warto go zapamiętać: ukryty jest w nim pomysł, dzięki któremu można zdefiniować pochodną funkcji wielu zmiennych.

Stwierdzenie (#) Niech $ g\colon \K\supset A\to \K $ i $ f\colon \K\supset B\to \K $, gdzie $ B\supset g(A) $. Załóżmy, że $ a\in K $ jest punktem skupienia zbioru $ A $ i $ b=g(a) $ jest punktem skupienia zbioru $ K $. Jeśli $ g $ jest różniczkowalna w punkcie $ a $ i $ f $ jest różniczkowalna w $ b=g(a) $, to wtedy złożenie $ f\circ g $ jest funkcją różniczkowalną w punkcie $ a $ i ma pochodną

\[ 	 (f\circ g)'(a) = f'(g(a))\cdot g'(a). 	\]

Dowód:
Niech $ y=g(x) $, $ b=g(a) $. Z poprzedniego lematu wynika, że

\[ f(y)=f(b)+f'(b)\cdot (y-b)+ r_b(y)\cdot (y-b) \]

dla pewnej funkcji $ r_b\colon B\to \K $, która ma granicę równą zero, gdy $ y\to b $. Zatem

\[ \begin{eqnarray} \frac{f(g(x))-f(g(a))}{x-a} & = & \frac{f(y)-f(b)}{x-a} \nonumber\\ & = & \frac{f'(b)\cdot (y-b)+ r_b(y)\cdot (y-b)} {x-a} \label{deltazloz}\\ & = & f'(b)\cdot \frac{ g(x)-g(a)}{x-a}+ r_b(y)\cdot \frac{g(x)-g(a)}{x-a}.  \nonumber \end{eqnarray} \]

Na mocy Stwierdzenia~ [link] funkcja $ g $ jest ciągła w $ a $, tzn. $ y=g(x)\to g(a)=b $, gdy $ x\to a $. Dlatego $ \lim_{x\to a} r_b(g(x))=0 $. Zatem, przechodząc w równości deltazloz do granicy przy $ x\to a $, otrzymujemy

\[ \begin{eqnarray*} \lim_{x\to a} \frac{f(g(x))-f(g(a))}{x-a} & = & f'(b)\cdot  \lim_{x\to a} \frac{g(x)-g(a)}{x-a} + \lim_{x\to a} r_b(g(x)) \cdot \lim_{x\to a}  \frac{g(x)-g(a)}{x-a}\\ & = & f'(b)g'(a)\ =\ f'(g(a))g'(a)\, , \end{eqnarray*} \]

co dowodzi różniczkowalności $ f\circ g $ w punkcie $ a $ i równości, podanej w tezie.

     Uwaga. Czytelnik zechce się zastanowić, dlaczego właściwie posłużyliśmy się w tym dowodzie poprzednim lematem, zamiast operować tylko ilorazami różnicowymi funkcji $ f $ i funkcji $ g $, jak w dowodach wzorów na pochodną sumy czy iloczynu funkcji różniczkowalnych.

Stwierdzenie (#) Niech $ f\colon \K\supset A\to B=f(A)\subset \K $ będzie funkcją różnowartościową, różniczkowalną w punkcie $ a\in A $ skupienia zbioru $ A $. Jeśli $ f'(a)\not =0 $ i funkcja $ g=f^{-1} $ odwrotna do $ f $ jest ciągła w punkcie $ b=f(a) $, to $ g $ jest różniczkowalna w $ b\in B $ i zachodzi wzór

\[ 	g'(b)=\frac{1}{f'(a)}\, . 	\]

Dowód:
Niech $ (y_n)\subset B\setminus\{b\} $, $ b=f(a) $. Ponieważ $ f $ jest bijekcją z $ A $ na $ B $, więc znajdziemy punkty $ x_n\in A $, $ x_n\not = a $, takie, że $ y_n=f(x_n) $, tzn. $ x_n=g(y_n) $. Z ciągłości $ g $ w $ b $ wynika, że $ x_n\to g(b)=f^{-1}(b)=a $. Zatem

\[ \frac{g(y_n)-g(b)}{y_n-b}= \frac{1}{\displaystyle\frac{y_n-b}{g(y_n)-g(b)}} = \frac{1}{\displaystyle\frac{f(x_n)-f(a)}{x-a}} \]

(wszystkie ułamki mają sens, gdyż funkcje $ f $ i $ g=f^{-1} $ są różnowartościowe). Biorąc $ n\to \infty $ i posługując się definicją Heinego granicy funkcji, otrzymujemy równość

\[ g'(b)=\lim_{y\to b} \frac{g(y)-g(b)}{y-b}= \frac{1}{f'(a)}\, . \]

To kończy dowód.

Uwaga Założenia ostatniego twierdzenia mają skomplikowaną postać, gdyż z ciągłości i różniczkowalności $ f $ w jednym punkcie nie wynika ciągłość funkcji odwrotnej do $ f $. (Czytelnik może się zastanowić nad odpowiednim przykładem - to nie jest szczególnie łatwe, gdyż przykład nie jest naturalny). Gdyby mówić tylko o funkcjach $ f $ różniczkowalnych w każdym punkcie przedziału $ A $, to założenie ciągłości $ g $ można byłoby oczywiście pominąć, patrz Twierdzenie~ [link] o ciągłości funkcji odwrotnej.

Czytelnik może się zastanowić nad (nietrudną) interpretacją geometryczną ostatniego stwierdzenia dla funkcji zmiennej rzeczywistej.

Pochodne funkcji elementarnych

(#)

Poświęcimy teraz nieco miejsca, aby wyprowadzić konkretne wzory na pochodne funkcji elementarnych.

Stwierdzenie Jeśli $ \K=\R $ lub $ \C $ i $ f\colon \K\supset A\to \K $ jest funkcją stałą, to $ f'(a)=0 $ w każdym punkcie skupienia zbioru $ A $.

Dowód:
Wszystkie ilorazy różnicowe funkcji stałej są równe zero.

Stwierdzenie (#) Jeśli $ f(x)=x $ dla $ x\in \R $, to $ f'(a)=1 $ dla każdego $ a\in \R $.

Dowód:
Wszystkie ilorazy różnicowe funkcji $ f(x)=x $ są równe 1.

Stwierdzenie (#) Jeśli $ n\in \N $ i $ f(x)=x^n $ dla $ x\in \R $, to $ f'(x)=nx^{n-1} $ dla każdego $ x\in \R $.

Dowód:
Można postąpić na dwa sposoby: udowodnić ten fakt przez indukcję, korzystając z poprzedniego stwierdzenia i wzoru na pochodną iloczynu, albo obliczyć pochodną funkcji $ f $ wprost z definicji, stosując wzór xn-yn na różnicę $ n $-tych potęg w celu uproszczenia ilorazów różnicowych. Czytelnik zechce samodzielnie uzupełnić szczegóły jednego z tych dowodów.

Wniosek (#) Jeśli $ f=a_0+a_1x+\cdots + a_nx^n $ jest wielomianem, to

\[ 	f'(x)=a_1+2a_2x +\cdots + na_nx^{n-1}  	\]

(wzór zachodzi zarówno dla wielomianów zmiennej rzeczywistej, jak i dla wielomianów zmiennej zespolonej.)

Dowód:
Dla każdego $ k $ jest $ (a_kx^k)'=ka_kx^{k-1} $, zatem teza wynika z twierdzenia o pochodnej sumy funkcji.

Uwaga Stwierdzenie~ [link] zachodzi nie tylko w dziedzinie rzeczywistej, ale także dla funkcji identycznościowej na $ \C $: jej pochodna istnieje w każdym punkcie płaszczyzny i jest równa 1. Dlatego Wniosek~ [link] zachodzi zarówno w dziedzinie rzeczywistej, jak i w dziedzinie zespolonej.

\newcommand{\ddz}{\frac{\mathrm{d}}{\mathrm{d}z}}

Stwierdzenie (#) Dla każdej liczby $ w\in \C $ zachodzi wzór

\[ \ddz \bigl(\exp z\bigr)_{z=w} = \exp w \]

Dowód:
To wynika wprost ze wzoru pochodna-expz, który udowodniliśmy, opisując w Twierdzeniu~ [link] własności funkcji wykładniczej.

Stwierdzenie (#) Dla każdej liczby $ w\in \C $ zachodzą wzory

\[ \ddz \bigl(\sin z\bigr)_{z=w} = \cos w,           \qquad \ddz \bigl(\cos z\bigr)_{z=w} = - \sin w, \]

Dowód:
Skorzystamy ze wzorów Eulera i wzoru na pochodną funkcji wykładniczej, oraz wzoru na pochodną złożenia. Mamy

\[ \ddz \bigl( \exp(\pm iz)\bigr)_{z=w} = \pm i\cdot \exp(\pm iw) \]

na mocy Stwierdzenia~ [link]. Zatem, dzięki wzorowi na pochodną sumy i iloczynu,

\[ \ddz \bigl(\sin z\bigr)_{z=w}  = \ddz \bigl(\frac{e^{iz}-e^{-iz}}{2i}\bigr)_{z=w} = \frac{ie^{iw}-(-i)e^{-iw}}{2i} =  \frac{e^{iw}+e^{-iw}}{2} = \cos w\, .  \]

Tak samo dowodzimy wzoru na pochodną cosinusa:

\[ \ddz \bigl(\cos z\bigr)_{z=w}  = \ddz \bigl(\frac{e^{iz}+e^{-iz}}{2}\bigr)_{z=w} = \frac{ie^{iw}+(-i)e^{-iw}}{2} =  -\frac{e^{iw}-e^{-iw}}{2i} = -\sin w\,   \]

(pisząc przedostatnią rowność, skorzystaliśmy z tego, że $ i=-1/i $).

    Uwaga. Znając pochodną sinusa, wzór na pochodną cosinusa można wyprowadzić ze wzorów redukcyjnych. Można także obliczyć obie pochodne wprost, korzystając z definicji, ze ze wzorów na różnicę sinusów i różnicę cosinusów (patrz Stwierdzenie~ [link]), istnienia granicy

\[ \lim_{z\to 0}\frac{\sin z}{z}= 1, \]

oraz ciągłości sinusa i cosinusa.

Stwierdzenie Funkcja $ f(x)=\tg x $ ma pochodną w każdym punkcie $ x\in \R\setminus\{\frac \pi 2+k\pi\mid k\in \Z\} $. Zachodzi wzór

\[ f'(x)=\frac{1}{\cos^2 x} = 1+\tg^2 x, \qquad x\in \R\setminus \left\{\frac \pi 2+k\pi\mid k\in \Z\right\}\, . \]

Dowód:
Korzystając ze wzoru na pochodną ilorazu oraz znanych już wzorów na pochodne sinusa i cosinusa, otrzymujemy we wszystkich punktach dziedziny tangensa równość

\[ (\tg x)' = \left(\frac{\sin x}{\cos x}\right)'=\frac{(\sin x)'\cos x-\sin x (\cos x)'}{\cos^2 x} =  \frac{\cos^2 x+\sin^2 x}{\cos^2 x} = \frac{1}{\cos^2 x}\, . \]

Oczywiście, $ 1/\cos^2 x=1+\tg^2 x $ na mocy `jedynki trygonometrycznej'.

Zadanie Udowodnić, że funkcja cotangents jest różniczkowalna we wszystkich punktach swojej dziedziny i ma pochodną równą $ -1-\ctg^2 x $.
Stwierdzenie (#) Funkcja $ \ln\colon (0,\infty)\to \R $ jest różniczkowalna w każdym punkcie $ y\in (0,\infty) $ i zachodzi wzór

\[ 	(\ln)'(y) = \frac 1y, \qquad y>0. 	\]

Dowód:
Granicę ilorazów różnicowych logarytmu naturalnego obliczyliśmy już wcześniej, opisując w Twierdzeniu~ [link] własności logarytmu naturalnego.

    Uwaga. Można także posłużyć się wzorem na pochodną funkcji odwrotnej: jeśli $ y\in (0,\infty) $ jest ustalonym punktem i $ \ln y = x $, tzn. $ e^x=y $, to wobec Stwierdzenia~ [link] zachodzą równości

\[ (\ln)'(y)=\frac{1}{e^x}=\frac{1}{y}\, . \]
Stwierdzenie Niech $ a>0 $ i $ a^z:=\exp(z\ln a) $. Wtedy

\[ \ddz (a^z)_{z=w} = \ln a \cdot a^w\, , \qquad w\in \C. \]

Dowód:
Mamy $ a^z=\exp(z\cdot \ln a) $. Wystarczy posłużyć się wzorem na pochodną funkcji wykładniczej i pochodną złożenia.

Zadanie Posługując się definicją logarytmu o dowolnej podstawie i wzorem na zamianę podstawy logarytmu, udowodnić, że

\[ 	(\log_a x)'= \frac 1{x\ln a}, \qquad x>0      \]

dla każdej podstawy $ a>0, $ $ a\not=1 $.

Stwierdzenie Funkcja potęgowa $ g(x)=x^\omega $, gdzie $ x>0 $, a $ \omega\in \R $ jest ustaloną liczbą, ma w każdym punkcie $ x\in (0,\infty) $ pochodną

\[ 	g'(x)=\omega x^{\omega-1}. 	\]

Dowód:
Piszemy $ x^\omega=\exp(\omega \ln x) $ i stosując wzór na pochodną złożenia, otrzymujemy

\[ (x^\omega)'= \bigl(\exp(\omega \ln x)\bigr)'= \exp(\omega \ln x) \cdot \omega\cdot (\ln x)' = x^\omega \cdot \omega \cdot \frac 1x = \omega x^{\omega-1}\, . \]

Wniosek Dla każdego $ n\in \N $ zachodzi wzór

\[ 	(\sqrt[n]{x})'= \frac{1}{n\sqrt[n]{x^{n-1}}}, \qquad x>0\, .      	\]

Dowód:
Stosujemy poprzednie stwierdzenie dla $ \omega=1/n $.

Uwaga Czytelnik sprawdzi samodzielnie, że gdy $ n $ jest liczbą nieparzystą (i można definiować pierwiastek stopnia $ n $ z dowolnej liczby rzeczywistej), to wzór podany w ostatnim wniosku zachodzi w istocie dla wszystkich $ x\not =0 $. To wynika np. z nieparzystości funkcji $ f(x)=\sqrt[n]{x} $ dla nieparzystych stopni pierwiastka $ n $.
Stwierdzenie Funkcje $ F(y)=\arcsin y $ i $ G(y)=\arccos y $ są różniczkowalne w każdym punkcie przedziału $ (-1,1) $; zachodzą wzory

\[ F'(y_0)=\frac{1}{\sqrt{1-y_0^2}}, \qquad G'(y_0)= \frac{-1}{\sqrt{1-y_0^2}}, \qquad y_0\in (-1,1). \]

Dowód:
Określając arcus sinus i arcus cosinus, sprawdziliśmy, że sinus jest funkcją rosnącą na $ [-\pi/2,\pi/2] $, a cosinus jest funkcją malejącą na $ [0,\pi] $.

Aby zastosować twierdzenie o pochodnej funkcji odwrotnej do obliczenia pochodnej $ F(y)=\arcsin y $ w punkcie $ y_0=\sin x_0 $ , musimy sprawdzić, że pochodna sinusa nie znika w $ x_0 $. Tak jednak jest, gdyż $ \cos x_0\not=0 $ dla każdego $ x_0\in (-\pi/2,\pi/2) $. Zatem, na mocy Stwierdzenia~ [link] zastosowanego do $ f=\sin $ i $ g=f^{-1}=F $ w punktach $ a=x_0, $ $ b=y_0 $, otrzymujemy

\[ F'(y_0) =g'(y_0)=\frac{1}{f'(x_0)}=\frac{1}{\cos x_0}= \frac{1}{\sqrt{1-(\sin x_0)^2}}= \frac{1}{\sqrt{1-y_0^2}}\, . \]

Zauważmy: skorzystaliśmy w powyższym rachunku z tego, że cosinus jest dodatni na przedziale $ (-\pi/2,\pi/2) $.

Podobnie obliczmy pochodną funkcji $ G(y)=\arccos y $. Tym razem stosujemy Stwierdzenie~ [link] (Proszę samodzielnie sprawdzić, że spełnione są założenia tego stwierdzenia!) do $ f=\cos $ i $ g=f^{-1}=G $ w punktach $ a=x_0, $ $ b=y_0=\cos x_0 $, gdzie $ y_0\in (-1,1) $ i $ x_0\in (0,\pi) $. Otrzymujemy

\[ G'(y_0) =g'(y_0)=\frac{1}{f'(x_0)}=\frac{-1}{\sin x_0}= \frac{-1}{\sqrt{1-(\cos x_0)^2}}= \frac{-1}{\sqrt{1-y_0^2}}\, . \]

Korzystaliśmy z tego, że $ \sin x_0>0 $ dla $ x_0\in (0,\pi) $.

Stwierdzenie Funkcja $ H(y)=\arctg y $ jest różniczkowalna w każdym punkcie $ y\in \R $; mamy

\[ H'(y)=\frac{1}{1+y^2} \qquad y\in \R. \]

Dowód:
Jak poprzednio, stosujemy twierdzenie o pochodnej funkcji odwrotnej -- tym razem do pary funkcji $ f(x)=\tg x $, $ x\in (-\pi /2, \pi/ 2) $, oraz $ g(y)=f^{-1}(y)=H(y) $, $ y\in \R $, biorąc punkty $ y,x $ powiązane zależnością $ y=\tg x $. Wolno to zrobić: pochodna tangensa, tzn. $ 1+\tg^2 x $, jest zawsze liczbą większą od 1, a więc różną od zera. Otrzymujemy

\[ H'(y)=g'(y)=\frac{1}{f'(x)} = \frac{1}{1+(\tg x)^2}=   \frac{1}{1+y^2} \]

dla każdego $ y\in \R $.

Stosując powyższe wzory i twierdzenia o pochodnej sumy, iloczynu, ilorazu i złożenia funkcji, można obliczać pochodne dowolnych funkcji elementarnych. Zakończmy ten podrozdział przykładem, ilustrującym sposób obliczania pochodnych w jeszcze jednej sytuacji.

Przykład Niech $ f(x)=x^x $ dla $ x>0 $. Wtedy, ze wzorów na pochodną złożenia i pochodną iloczynu,

\[ f'(x)= \Bigl(e^{x\ln x}\Bigr)'=   e^{x\ln x}\cdot (x\ln x)' =  e^{x\ln x}\cdot (1+ \ln x ) \, . \]

(Ważne jest to, że nie stosujemy bezpośrednio ani wzoru na pochodną funkcji wykładniczej, ani wzoru na pochodną funkcji potęgowej. Nie wolno tego robić, bo ani podstawa, ani wykładnik potęgi nie są w tym przykładzie stałymi).

Najważniejsze własności funkcji różniczkowalnych

W tym podrozdziale zajmiemy się opisem własności funkcji różniczkowalnych i związkiem pochodnej z monotonicznością oraz ekstremami. Będziemy zajmować się funkcjami określonymi na przedziałach prostej rzeczywistej. Termin funkcja różniczkowalna będzie oznaczał funkcję, która jest różniczkowalna w każdym punkcie swojej dziedziny.

Definicja [ekstremum lokalne] Niech $ f\colon I\to \R $, gdzie $ I $ jest przedziałem w $ \R $. Mówimy, że funkcja $ f $ ma w punkcie $ a\in I $ maksimum lokalne (odpowiednio: minimum lokalne), jeśli istnieje taka liczba $ \delta >0 $, że dla wszystkich $ x\in I $, $ |x-a|<\delta $, zachodzi nierówność $ f(a)\ge f(x) $ (odpowiednio: $ f(a)\le f(x) $).

Jeśli dla wszystkich $ x\in I $, $ 0<|x-a|<\delta $, nierówności są ostre, to mówimy wtedy, że $ f $ ma w punkcie $ a $ maksimum (lub minimum) właściwe.

Słowo ekstremum jest wspólną nazwą minimum i maksimum: w zależności od kontekstu i potrzeby może oznaczać jedno lub drugie. Z definicji wynika, że funkcja może mieć ekstremum lokalne także w końcu przedziału. Czytelnik powinien pamiętać, że wartość funkcji w punkcie ekstremum lokalnego nie musi być najmniejszą ani największą wartością funkcji na danym przedziale. Ekstremów może być wiele, a ponadto jeśli przedział jest otwarty, to funkcja w ogóle nie musi przyjmować swoich kresów. \begin{figure}[!h] \begin{center}  \includegraphics*[totalheight=5cm]{ekstr.png}</p>
<p>\end{center}

{\footnotesize\baselineskip 11pt Funkcja $ f\colon (a,b)\to \R $, która ma dużo ekstremów lokalnych wewnątrz $ (a,b) $, jednak w żadnym z nich nie jest osiągany kres dolny ani górny zbioru $ f\bigl((a,b)\bigr) $.

} \end{figure}

Lemat [lemat Fermata] Jeśli $ I $ jest odcinkiem otwartym, $ a\in I $, $ f\colon I\to \R $ jest różniczkowalna w punkcie $ a $ i $ f $ ma w $ a $ ekstremum lokalne, to $ f'(a)=0 $.

Geometryczna interpretacja lematu Fermata jest prosta: styczna do wykresu funkcji różniczkowalnej w punkcie ekstremum lokalnego jest pozioma.

Dowód:
Dla ustalenia uwagi załóżmy, że $ f $ ma w $ a $ maksimum lokalne (w drugim przypadku dowód jest taki sam; można także rozważyć funkcję $ -f $, która ma maksima tam, gdzie $ f $ ma minima). Wybierzmy $ \delta>0 $ tak, aby przedział $ J:=(a-\delta,a+\delta) $ był zawarty w $ I $ i aby $ f(x)\le f(a) $ dla wszystkich $ x\in J $.

Dla $ 0<|h|<\delta $ mamy wtedy $ f(a+h)-f(a)\le 0 $. Dlatego iloraz różnicowy $ (f(a+h)-f(a))/h $ jest nieujemny dla $ -\delta<h<0 $ i niedodatni dla $ 0<h<\delta $. Nierówności nieostre zachowują się w granicy, a pochodna $ f'(a) $ istnieje, więc

\[ 0\le \lim_{h\to 0^-}\frac{f(a+h)-f(a)}h = f'(a) = \lim_{h\to 0^+}\frac{f(a+h)-f(a)}h \le 0\, . \]

Stąd już wynika, że $ f'(a)=0 $.

Uwaga Podkreślmy bardzo ważny fakt: lematu Fermata nie można odwrócić: z faktu, że funkcja różniczkowalna $ f $ ma w pewnym punkcie pochodną równą zero, nie wynika, że $ f $ ma w tym punkcie ekstremum lokalne. Najprostszym przykładem jest $ f(x)=x^3 $, różniczkowalna na całej prostej $ \R $. Mamy $ f'(x)=3x^2 $, a więc $ f'(0)=0 $, jednak $ f $ jest rosnąca i nie ma ekstremum w zerze. Pochodna funkcji ciągłej, rosnącej, może znikać na zbiorze nieskończonym, a nawet na zbiorze gęstym. (Samodzielna konstrukcja odpowiednich przykładów może być ciekawym zadaniem dla ambitnych Czytelników.)
Twierdzenie [Rolle'a](#) Załóżmy, że $ a<b $, zaś funkcja $ f\colon [a,b]\to \R $ jest ciągła na $ [a,b] $ i różniczkowalna w każdym punkcie $ x\in (a,b) $. Jeśli $ f(a)=f(b) $, to istnieje taki punkt $ x_0\in (a,b) $, że $ f'(x_0)=0 $.

Dowód:
Jeśli $ f $ jest funkcją stałą, to $ f' $ znika w każdym punkcie $ x\in (a,b) $ i nie ma czego dowodzić. Załóżmy więc, że $ f $ nie jest funkcją stałą. Połóżmy

\[ m:= \inf_{[a,b]} f\, , \qquad M:= \sup_{[a,b]} f\, . \]

Ponieważ $ f $ nie jest stała i $ f(a)=f(b) $, to musi być $ m<f(a)=f(b) $ lub $ M>f(a)=f(b) $. Z twierdzenia Weierstrassa (patrz Tw.~ [link] w rozdziale~5) wiemy, że $ m $ i $ M $ są wartościami $ f $, zatem przynajmniej jedna z tych wartości jest przyjmowana w punkcie wewnętrznym $ x_0 $, należącym do przedziału otwartego $ (a,b) $. Funkcja $ f $ ma oczywiście w tym punkcie ekstremum lokalne. Z lematu Fermata wynika, że $ f'(x_0)=0 $.

Twierdzenie [Cauchy'ego] (#) Niech $ a<b $ i niech $ f,g\colon [a,b]\to \R $ będą funkcjami ciągłymi na $ [a,b] $, różniczkowalnymi w każdym punkcie przedziału $ (a,b) $. Załóżmy ponadto, że $ g'(x)\not=0 $ dla $ x\in (a,b) $. Wówczas istnieje taki punkt $ \xi\in (a,b) $, że

\[ \frac{f'(\xi)}{g'(\xi)} = \frac{f(b)-f(a)}{g(b)-g(a)}. \]

Dowód:
Zauważmy najpierw, że $ g(a)\not=g(b) $, gdyż w przeciwnym przypadku na mocy twierdzenia Rolle'a istniałby punkt, w którym $ g' $ znika, a zakładamy, że $ g'\not=0 $ na $ (a,b) $. Dlatego prawa strona wzoru z tezy twierdzenia ma sens.

Rozpatrzmy teraz funkcję pomocniczą

\[ h(x)=f(x)-\frac{f(b)-f(a)}{g(b)-g(a)} \Bigl(g(x)-g(a)\Bigr)\, . \]

Z założeń o $ f $ i $ g $ wynika, że $ h $ jest funkcją ciągłą na $ [a,b] $ i różniczkowalną wewnątrz tego przedziału. Ponadto, $  h(b) = f(b)- (f(b)-f(a)) = f(a)= h(a)\, .  $ Zatem, $ h $ spełnia wszystkie założenia twierdzenia Rolle'a. Istnieje więc punkt $ \xi \in (a,b) $ taki, że $ h'(\xi)=0 $. Mamy jednak

\[ h'(x)= f'(x)-   \frac{f(b)-f(a)}{g(b)-g(a)} g'(x)\, . \]

Dlatego równość $ h'(\xi)=0 $ jest równoważna tezie twierdzenia.

Odnotujmy bardzo ważny wniosek z twierdzenia Cauchy'ego.

Wniosek [twierdzenie Lagrange'a o wartości średniej] Załóżmy, że $ a<b $, zaś funkcja $ f\colon [a,b]\to \R $ jest ciągła na $ [a,b] $ i różniczkowalna w każdym punkcie $ x\in (a,b) $. Wówczas istnieje taki punkt $ \xi\in (a,b) $, że

\[ 	{f'(\xi)} = \frac{f(b)-f(a)}{b-a}. 	\]

Dowód:
Stosujemy twierdzenie Cauchy'ego do $ f $ i do funkcji $ g(x)=x $, $ x\in [a,b] $.

Zadanie Podać przykład, świadczący o tym, że jeśli $ f $ jest ciągła na $ [a,b] $, ale $ f' $ nie istnieje choćby w jednym punkcie, to teza twierdzenia Lagrange'a nie musi zachodzić.

Przykład (#) Twierdzenie Lagrange'a o wartości średniej nie zachodzi (w powyższej postaci) dla funkcji o wartościach wektorowych, np. zespolonych. Oto banalny przykład: niech $ f(t)=\exp(2\pi i t) $ dla $ t\in [0,1] $. Wtedy, dla każdego $ c\in (0,1) $, mamy $ 0=f(1)-f(0)\not= f'(c)=2\pi i\cdot \exp (2\pi i c) $.

Twierdzenie Lagrange'a ma bardzo prostą interpretację geometryczną: w przedziale $ (a,b) $ istnieje taki punkt, w którym styczna do wykresu $ f $ jest równoległa do siecznej, poprowadzonej przez dwa końce łuku wykresu.

\begin{figure}[!h] \begin{center}  \includegraphics*[totalheight=6cm]{lagrange.png}</p>
<p>\end{center}

{\footnotesize\baselineskip 11pt Interpretacja geometryczna twierdzenia Lagrange'a: Istnieje co najmniej jeden punkt, w którym styczna do wykresu funkcji jest równoległa do siecznej. (Może się zdarzyć, że takich punktów jest więcej).

} \end{figure}

Wniosek (#) Załóżmy, że $ A\subset \R $, $ [c,d]\subset A $, $ c<d $, a funkcja $ f\colon A\to \R $ jest ciągła na $ [c,d] $ i różniczkowalna w $ (c,d) $. Zachodzą wówczas następujące implikacje:

  1. Jeśli $ f'(x)\ge 0 $ dla każdego $ x\in (c,d) $, to $ f $ jest niemalejąca na $ [c,d] $.
  2. Jeśli $ f'(x)> 0 $ dla każdego $ x\in (c,d) $, to $ f $ jest rosnąca na $ [c,d] $.
  3. Jeśli $ f'(x)< 0 $ dla każdego $ x\in (c,d) $, to $ f $ jest malejąca na $ [c,d] $.
  4. Jeśli $ f'(x)\le 0 $ dla każdego $ x\in (c,d) $, to $ f $ jest nierosnąca na $ [c,d] $.

Dowód:
Wystarczy zapisać tezę twierdzenia Lagrange'a w postaci

\[ f(b)=f(a)+ f'(\xi) (b-a)\qquad\mbox{dla pewnego $\xi\in (a,b)$,} \]

a następnie podstawiać za $ a $ i $ b $ dowolne pary punktów przedziału $ [c,d] $.

Wniosek Jeśli funkcja $ f\colon [a,b]\to \R $ spełnia warunek: $ f'(\xi)=0 $ dla każdego $ \xi\in (a,b) $, to $ f $ jest funkcją stałą. (#)

Dowód:
Stosując twierdzenie Lagrange'a dla $ f $ na dowolnym przedziału $ [a,x]\subset [a,b] $, stwierdzamy, że $ f(a)=f(x) $ dla każdego $ x\in [a,b] $.

Twierdzenie Załóżmy, że $ c<d $, zaś funkcja $ f\colon [c,d]\to \R $ jest ciągła na $ [c,d] $ i różniczkowalna w każdym punkcie $ x\in (c,d) $. Następujące warunki są równoważne:

  1. Funkcja $ f $ spełnia warunek Lipschitza ze stałą $ M $;
  2. Dla każdego $ x\in (c,d) $ zachodzi nierówność $ |f'(x)|\le M $

Dowód:
Jeśli $ f $ spełnia warunek Lipschitza ze stałą $ M $, to dla dowolnych $ y,x\in (c,d) $, $ y\not=x $ zachodzi nierówność

\[ \frac{|f(y)-f(x)|}{|y-x|}\le M. \]

Wykonując przejście graniczne $ y\to x $, otrzymujemy $ |f'(x)|\le M $.

Na odwrót, jeśli $ f $ spełnia warunek (ii), to dla dowolnych $ a,b\in [c,d] $, $ a\not=b $, dobierając do $ a $ i $ b $ punkt $ \xi\in (a,b) $ tak, jak w tezie twierdzenia Lagrange'a, możemy napisać

\[ |f(b)-f(a)|=|f'(\xi)|\cdot |b-a|\ \stackrel{\text{(ii)}}\le\  M\, |b-a|\, . \]

Funkcja $ f $ spełnia więc warunek Lipschitza ze stałą $ M $.

Uwaga Funkcja ciągła na odcinku $ [a,b] $ (a więc jednostajnie ciągła na tym odcinku) i różniczkowalna w $ (a,b) $ może mieć nieograniczoną pochodną. Przykład: $ f(x)=\sqrt{x} $ dla $ x\in [0,1] $; wtedy $ f'(x)=1/2\sqrt{x} $ dla $ x\in (0,1] $ i $ f' $ nie jest ograniczona w żadnym otoczeniu zera.

Na zakończenie tego podrozdziału spróbujemy udzielić częściowych odpowiedzi na dwa pytania: jakie funkcje mogą być pochodnymi, i czy pochodna funkcji różniczkowalnej musi być funkcją ciągłą. Odpowiedź na drugie pytanie jest prosta: pochodna nie musi być funkcją ciągłą.

Przykład (#) Niech

\[ f(x)=\left\{\begin{array}{ll} x^2 \bigl(2+ \sin(1/x)\bigr)\, , \qquad & x\not=0\, ,\\ 0, & x=0\, . \end{array} \right. \]

Dla $ x\not=0 $ otrzymujemy, stosując wzory na pochodną iloczynu i pochodną złożenia,

\[ \begin{equation} \label{fprimniec} f'(x)= 2x \cdot \left(2+ \sin\frac 1x\right) + x^2 \cdot \cos\frac 1x \cdot (-x^{-2})=  2x \left(2+ \sin\frac 1x\right)- \cos \frac1x\, . \end{equation} \]

Zatem na $ \R\setminus\{0\} $ pochodna $ f $ istnieje i jest tam funkcją ciągłą.

Ponieważ sinus na $ \R $ przyjmuje tylko wartości z przedziału $ [-1,1] $, więc $ |f(x)|\le 3x^2 $ dla wszystkich $ x\in \R $. Dlatego

\[ 0\le \left|\frac{f(h)-f(0)}h\right|= \left|\frac{f(h)}h\right|\le 3|h| \to 0 \qquad\mbox{dla $h\to 0$.} \]

Z twierdzenia o trzech funkcjach wynika zatem, że $ f'(0)=0 $. Jednak $ f' $ nie jest ciągła w zerze. To wynika stąd, że pierwszy składnik po prawej stronie fprimniec dąży do zera dla $ x\to 0 $ (moduł tego składnika nie przekracza $ 6|x| $), jednak drugi składnik, $ -\cos 1/x $, nie ma granicy dla $ x\to 0 $ (patrz Przykład~ [link]). Dlatego granica $ f' $ w zerze nie istnieje.

\begin{figure}[!t] \begin{center}  \includegraphics*[totalheight=5cm]{fprim-nieciagla1.png}</p>
<p>\end{center}

{\footnotesize\baselineskip 11pt Funkcja z Przykładu~ [link] w otoczeniu zera (dla nieco większej czytelności rysunku, oś $ y $ została liniowo rozciągnięta). Wykres oscyluje między dwiema parabolami, $ y=x^2 $ i $ y=3x^2 $. Pochodna istnieje w każdym punkcie, jednak nie jest ciągła w zerze i zmienia znak nieskończenie wiele razy w każdym przedziale wokół zera.

} \end{figure}

Nietrudno zauważyć jeszcze jedno: $ f(x)=0 $ tylko dla $ x=0 $, a dla $ x\not=0 $ jest $ f(x)\ge x^2 > 0 $. Zatem $ f $ ma w zerze minimum lokalne właściwe (a nawet osiąga w zerze swój kres dolny). Jednak dla dowolnej liczby $ \delta>0 $ funkcja $ f' $ zmienia znak nieskończenie wiele razy w przedziale $ (0,\delta) $. Podobnie jest w przedziale $ (-\delta, 0) $: tam też $ f' $ zmienia znak nieskończenie wiele razy. (Czytelnik zechce, naśladując rozumowanie z Przykładu~ [link] Zatem prawdziwy jest następujący fakt, dla kogoś być może lekko zaskakujący i przeczący naiwnej intuicji. \begin{quote} Może się zdarzyć, że $ f $ jest ciągła na $ \R $ i ma w punkcie $ x_0\in \R $ ekstremum lokalne właściwe, jednak nie jest monotoniczna na żadnym przedziale $ (x_0,x_0+\delta) $, ani na żadnym przedziale $ (x_0-\delta,x_0) $, gdzie $ \delta>0 $.

\end{quote}

Twierdzenie [własność Darboux dla pochodnej] Załóżmy, że $ a<b $, zaś funkcja $ f\colon [a,b]\to \R $ jest ciągła i różniczkowalna na $ [a,b] $. Dla każdej liczby $ c\in [f'(a),f'(b)] $ istnieje punkt $ x\in [a,b] $ taki, że $ f'(x)=c $.

Uwaga: nie zakładamy, że $ f'(a)<f'(b) $. Napis $ [f'(a),f'(b)] $ oznacza przedział o końcach $ f'(a) $ i $ f'(b) $, być może zdegenerowany do jednego punktu. Podkreślmy też wyraźnie: nie zakładamy tu ciągłości $ f' $.

Dowód:
Bez zmniejszenia ogólności przyjmijmy $ f'(a)<f'(b) $. Rozpatrzmy funkcję pomocniczą (Nietrudno zobaczyć, że $ \phi $ dobieramy tak, aby mieć $ \phi'=0\ \Leftrightarrow f'=c $.) $ \phi(x)=f(x)-cx $. Spełnia ona warunki:

\[ \phi'(a)=f'(a)-c \le 0, \qquad \phi'(b)=f'(b)-c\ge 0\, . \]

Jeśli $ \phi'(a)=0 $ lub $ \phi'(b)=0 $, to teza twierdzenia zachodzi (można wziąć $ x=a $ lub $ x=b $). Załóżmy więc odtąd, że $ \phi'(a)<0<\phi'(b) $.

Funkcja $ \phi $ jest ciągła na $ [a,b] $, zatem, z Twierdzenia~ [link] wynika, że istnieje punkt $ x\in [a,b] $ taki, że

\[ \phi(x) = \inf_{[a,b]} \phi\, . \]

Zauważmy, że gdyby $ x=a $, to mielibyśmy dla małych $ h>0 $

\[ \frac{\phi(a+h)-\phi(a)}{h}\ge 0, \qquad\mbox{a zatem}\quad \phi'(a)\ge 0\, . \]

Ponieważ jednak $ \phi'(a)<0 $, więc $ x\not=a $. Tak samo pokazujemy, że $ x\not = b $. Z lematu Fermata otrzymujemy teraz $ \phi'(x)=f'(x)-c=0 $.

Odpowiedź na inne naturalne pytanie: czy każda funkcja ciągła jest pochodną pewnej funkcji? jest też twierdząca, ale na jej uzasadnienie Czytelnik będzie musiał poczekać.

Pochodne wyższych rzędów. Wzór Taylora

Definicja pochodnych wyższych rzędów

Jeśli funkcja $ f\colon A\to \R $, gdzie $ A\subset \R $, jest różniczkowalna w każdym punkcie zbioru $ A $, to funkcję $ g\colon A\to \R $ taką, że $ g(a)=f'(a) $ dla każdego $ a\in A $, nazywamy pierwszą pochodną funkcji $ f $. Pochodne wyższych rzędów definiuje się indukcyjnie. Służą one, jak się przekonamy, do aproksymacji funkcji wielomianami, do badania ekstremów, a także (druga pochodna) do określania wypukłości. Zacznijmy od definicji.

Definicja [pochodne wyższych rzędów] Niech $ n\in \N $ i niech $ P $ będzie przedziałem otwartym w $ \R $, $ a\in P $. Jeśli w każdym punkcie przedziału $ P $ funkcja $ \colon P\to \R $ ma pochodne do rzędu $ (n-1) $ włącznie, to mówimy, że $ f $ ma $ n $-tą pochodną w $ a $ (lub: pochodną rzędu $ n $ w $ a $) wtedy i tylko wtedy, gdy $ f^{(n-1)} $ jest różniczkowalna w punkcie $ a $. Przyjmujemy

\[ 	 f^{(n)}(a)=\lim_{x\to a} \frac{f^{(n-1)}(x)-f^{(n-1)}(a)}{x-a}\, . 	\]

Krótko mówiąc, górny indeks w nawiasie oznacza liczbę wykonanych różnoczkowań. Zatem, $ f^{(0)}=f $, $ f^{(1)}=f' $, $ f^{(2)}=f''=(f')' $, $ f^{(3)}=(f^{(2)})'=(f'')'=f''' $. Primów nie używamy do oznaczania pochodnych rzędu wyższego niż trzeci. Ogólna, indukcyjna reguła podana w definicji orzeka, iż $ f^{(n)}= \bigl(f^{(n-1)}\bigr)' $ w tych punktach, w których funkcja $ f^{(n-1)} $ jest różniczkowalna.

Przykład (#)

  1. Jeśli $ f(x)=\exp (x) $ dla $ x\in \R $, to - jak już wiemy - $ f'(x)=\exp(x)=f(x) $. Nietrudno stąd wywnioskować, że $ f $ ma pochodne wszystkich rzędów: $ f''=(f')'=f'=f $, $ f'''=(f'')'=f'=f $ i ogólnie $ f^{(n)}=f $ dla każdego $ n\in \N $.
  2. Posługując się wzorami na pochodne sinusa i cosinusa (patrz Stwierdzenie~ [link]), łatwo sprawdzamy, że
    \[ \begin{gather} 	(\sin x)^{(2n)} = (-1)^{n+1} \sin x, \qquad     (\sin x)^{(2n-1)} = (-1)^{n+1} \cos x, \qquad n=1,2,\ldots, \label{dn-sin}\\   	(\cos x)^{(2n)} = (-1)^{n} \cos x, \qquad     (\cos x)^{(2n-1)} = (-1)^{n} \sin x, \qquad n=1,2,\ldots. \label{dn-cos}   \end{gather*} \]
  3. Ze wzoru na pochodną logarytmu naturalnego (patrz Stwierdzenie~ [link]) i pochodną funkcji potęgowej otrzymujemy dla $ n\ge 1 $
    \[ \begin{gather} (\ln y)^{(n)} = \bigl(y^{-1}\bigr)^{(n-1)} = \bigl(-y^{-2}\bigr)^{(n-2)} = \ldots = (-1)^{n-1} (n-1)! y^{-n},\qquad y>0,\label{dn-log} \\ \bigl(\ln(1+x)\bigr)^{(n)}=(-1)^{n-1} (n-1)! (1+x)^{-n}, \qquad x>-1\, . \label{dn-log1x}  \end{gather*} \]

    (Obu wzorów dowodzi się tak samo, przez łatwą indukcję.)

  4. Jeśli $ m,k\in \Z $ są nieujemne, to wówczas
    \[ \begin{equation}  \bigl(x^m\bigr)^{(k)} = \left\{ \begin{array}{ll}   m(m-1)\cdot \ldots \cdot(m-k+1)x^{m-k}, \quad & 0\le k\le m \, ,\\ 0, & k>m\, . \end{array}  \label{dkxm} \right. \end{equation} \]

Pochodna $ n $-tego rzędu sumy dwóch funkcji $ n $-krotnie różniczkowalnych jest sumą $ n $-tych pochodnych składników, tzn. $ (f+g)^{(n)}=f^{(n)}+g^{(n)} $. Dowód jest oczywisty i wynika ze wzoru na pochodną sumy. Wzory na wyższe pochodne złożenia funkcji i funkcji odwrotnej są dość zawiłe, ale w razie potrzeby można je wyprowadzić, wykonując czysto mechaniczną pracę. Odnotujmy natomiast wzór Leibniza na $ n $-tą pochodną iloczynu. Z mnemotechnicznego punktu widzenia jest on ``taki sam'', jak dwumian Newtona.

Stwierdzenie [wzór Leibniza] Jeśli $ P\subset \R $ jest przedziałem, $ a\in P $ i $ f,g\colon P\to \R $$ n $-krotnie różniczkowalne w $ a $, to wówczas

\[ 	(fg)^{(n)}(a)=\sum_{j=0}^n \binom{n}{j} f^{(j)}(a)g^{(n-j)}(a). 	\]

(#)

    Szkic dowodu. Dowód jest łatwy; prowadzi się go przez indukcję, korzystając ze wzoru na pochodną iloczynu i tożsamości $ \binom n{j-1}+\binom nj = \binom {n+1}j $. Sprawdzimy tylko wzór na $ (fg)'' $:

\[ (fg)''= \bigl((fg)'\bigr)'=  \bigl(f'g + fg'\bigr)'= f''g+f'g' + f'g' + fg'' =  f''g+ 2 f'g' +  fg''\, , \]

pozostawiając resztę szczegółów zainteresowanym.

Wzór Taylora

Najważniejszym wzorem w Analizie, wykorzystującym pochodne wyższych rzędów, jest tak zwany wzór Taylora. Służy on do przybliżania funkcji $ n $-krotnie różniczkowalnych wielomianami, z pewną kontrolą błędu przybliżenia (jakość i stopień tej kontroli zależą od tego, ile wiemy o danej funkcji). W najprostszym przypadku, dla wielomianów, wynika on ze związku między współczynnikami wielomianu i wartościami pochodnych wielomianu w zerze, który z kolei łatwo otrzymać ze wzoru dkxm.

Prześledźmy odpowiedni rachunek. Niech

\[ P(x)=\sum_{j=0}^n a_jx^j = a_0 +a_1x+a_2x^2+\cdots + a_nx^n \]

będzie wielomianem stopnia $ n $ o współczynnikach rzeczywistych. Wówczas

\[ \begin{eqnarray*} P'(x) & = & a_1+2a_2x+ \cdots + na_nx^{n-1}=\sum_{j=1}^n     ja_jx^{j-1}, \\ P''(x) & = & 2a_2+ \cdots + n(n-1)a_nx^{n-2}=\sum_{j=2}^n     j(j-1)a_jx^{j-2}, \\   &\vdots & \\[8pt] P^{(k)}(x) & = & \sum_{j=k}^n j(j-1)\cdot\ldots \cdot (j-k+1)a_j x^{j-k}     \qquad \mbox{dla {$k\le n$}.}  \end{eqnarray*} \]

W szczególności, $ P^{(n)}(x)=n! a_n $ dla każdego $ x\in \R $, a ponadto

\[ \begin{equation}   \label{dkP0} P^{(k)}(0)= k!a_k, \qquad k=0,1,\ldots, n.	 \end{equation} \]
Stwierdzenie [Wzór Taylora dla wielomianów] Jeśli $ P $ jest wielomianem stopnia $ n $, to wówczas

\[ \begin{eqnarray} 		P(x) & = & P(0)+ \frac{P^{(1)}(0)}{1!} x + \cdots + \frac{P^{(n)}(0)}{n!} x^n= \sum_{j=0}^{n} \frac{P^{(j)}(0)}{j!} x^j;\label{TayP0}\\ 	   P(w) & = & P(x_0)+ \frac{P^{(1)}(x_0)}{1!} (w-x_0) + \cdots + \frac{P^{(n)}(x_0)}{n!} (w-x_0)^n\\ 	&= & \sum_{j=0}^{n} \frac{P^{(j)}(x_0)}{j!} (w-x_0)^j.\label{TayPx_0}    	\end{eqnarray} \]

Dowód:
Pierwszy wzór wynika z relacji dkP0 między współczynnikami wielomianu $ P $ i jego pochodnymi w zerze. Aby otrzymać drugi wzór, wystarczy zastosować pierwszy do wielomianu $ Q $, gdzie $ Q(w-x_0)=P(w) $. Wtedy $ Q^{(k)}(0)=P^{(k)}(x_0) $ dla dowolnego $ k $.

Jeśli $ k>n $, to oczywiście $ (a_0 +a_1x+a_2x^2+\cdots + a_nx^n)^{(k)}=0 $ dla wszystkich $ x $. Okazuje się, że taki warunek spełniają na prostej tylko wielomiany odpowiedniego stopnia. Odnotujmy ten fakt.

Stwierdzenie Jeśli $ f\colon \R\supset P\to \R $, gdzie $ P $ jest przedziałem, jest $ k $-krotnie różniczkowalna i $ f^{(k)}\equiv 0 $, to $ f $ jest wielomianem stopnia co najwyżej $ k-1 $.

Dowód:
Dowodzimy przez indukcję względem $ k $. Jeśli $ k=1 $, to z Wniosku~ [link] wynika, że $ f=\mathrm{const} $, a więc $ f $ jest wielomianem stopnia 0 i teza zachodzi.

Załóżmy prawdziwość stwierdzenia dla liczby $ k $. Niech $ f $ będzie $ (k+1) $-krotnie różniczkowalna i $ f^{(k+1)}\equiv 0 $. Wówczas $ f^{(k)}(x)\equiv c\in \R $ na mocy Wniosku~ [link]. Rozpatrzmy $ \varphi(x)=f(x)-cx^k/k! $. Oczywiście,

\[ \varphi^{(k)}(x)=f^{(k)}(x)- k!\cdot c/k!= 0\, . \]

a więc na mocy założenia indukcyjnego $ \varphi $ jest wielomianem stopnia co najwyżej $ k-1 $. Zatem, $ f(x)=\varphi(x)+a_kx^k $, gdzie $ a_k=c/k! $, jest wielomianem stopnia co najwyżej $ k $.

Twierdzenie [wzór Maclaurina z resztą w postaci Peano] Niech $ P\subset \R $ będzie przedziałem, $ 0\in P $. Załóżmy, że $ f\colon P\to \R $ ma $ (k-1) $ pochodnych w przedziale $ P $ i $ k $-tą pochodną w punkcie $ 0 $. Wtedy

\[ \begin{equation} \label{MCL-Peano}  f(x)=\sum_{j=0}^k \frac{f^{(j)}(0)}{j!} x^j + r(x),  \end{equation} \]

gdzie reszta $ r(x) $ spełnia warunek

\[ \begin{equation} \label{rjesto} 	\lim_{x\to 0} \frac{r(x)}{x^k}  = 0. \end{equation} \]

Intuicyjny sens tego twierdzenia jest jasny: funkcję, która ma $ (k-1) $ pochodnych w~pewnym przedziale i $ k $-tą pochodną w pewnym ustalonym punkcie (jak zobaczymy później, zero nie odgrywa tu żadnej szczególnej roli), to w pobliżu tego punktu można tę funkcję przybliżać wielomianami stopnia $ k $, przy czym błąd przybliżenia ma, dla małych $ x $-ów, mniejszy rząd niż $ x^k $.

Liczne przykłady zastosowań tego twierdzenia Czytelnik zobaczy później (także na ćwiczeniach). Najpierw przytoczymy

Dowód:
Krok 1. Niech najpierw $ k=1 $. Wtedy wzór Maclaurina przybiera postać $ f(x)=f(0)+f'(0)x+r(x) $, a równość

\[ \lim_{x\to 0}\frac{r(x)}x = \lim_{x\to 0}\left(\frac{f(x)-f(0)}x - f'(0)\right) = 0 \]

wynika wprost z definicji pochodnej.      Krok 2. Rozpatrzymy teraz przypadek szczególny: niech funkcja $ \phi \colon P\to \R $ spełnia warunek

\[ \begin{equation} 	\phi^{(j)}(0)=0 \qquad\mbox{dla $j=0,1,\ldots, k$.}  	\label{phiplaskak} \end{equation} \]

Dla takiej $ \phi $ prawa strona MCL-Peano składa się z samej `reszty', tzn. wzór Maclaurina przybiera postać $ \phi(x)=r(x) $. Trzeba więc wykazać, że dla każdej takiej funkcji zachodzi równość

\[ \begin{equation} 	\lim_{x\to 0}\frac{\phi(x)}{x^k}=0. \label{limrxk}  \end{equation} \]

Udowodnimy to przez indukcję względem $ k $. Przypadek $ k=1 $ już rozpatrzyliśmy.

Niech $ \phi $ spełnia warunek phiplaskak dla $ k=q+1 $. Wtedy $ \psi=\phi' $ spełnia ten sam warunek dla $ k=q $. Piszemy, stosując do $ \phi $ twierdzenie Lagrange'a o wartości średniej na odcinku o końcach $ 0 $ i $ x $,

\[ \begin{eqnarray*} \frac{\phi(x)}{x^{q+1}} & = & \frac{\phi(x)}{x}    \cdot \frac{1}{x^q} = \phi'(tx) \cdot \frac{1}{x^q}  \qquad\mbox{dla pewnego $t\in (0,1)$} \\ & = & \psi(tx) \cdot \frac{1}{(tx)^q} \cdot t^q \   \longrightarrow \ 0 \qquad\mbox{dla $x\to 0$} \end{eqnarray*} \]

na mocy założenia indukcyjnego, zastosowanego do funkcji $ \psi $. To kończy dowód wzoru Maclaurina dla funkcji $ \phi $, spełniających dodatkowy warunek phiplaskak.

     Krok 3. Przypadek ogólny. Dla $ f $ spełniającej założenia twierdzenia kładziemy

\[ \phi(x)=f(x)- \sum_{j=0}^k \frac{f^{(j)}(0)}{j!} x^j, \]

tzn. po prostu $ \phi (x)=r(x) $. Nietrudno sprawdzić, że $ \phi^{(j)}(0)=f^{(j)}(0)-f^{(j)}(0)=0 $, więc $ \phi $ spełnia założenie phiplaskak. Zgodnie z poprzednim krokiem dowodu, zachodzi więc warunek limrxk, tzn. $ \phi(x)/x^k=r(x)/x^k\to 0 $ dla $ x\to 0 $.

Podkreślmy: w całym twierdzeniu chodziło tylko o zbadanie zachowania reszty $ r(x) $ dla małych $ x $. To był kluczowy problem. Otrzymany wzór Maclaurina można ``przesunąć'' na dowolny inny przedział $ P\subset \R $, z wyróżnionym punktem $ x_0 $. Jeśli $ f(x)=\varphi(x-x_0) $, to $ f^{(j)}(x_0)=\varphi^{(j)}(0) $ dla wszystkich $ j $, dla których pochodne rzędu $ j $ istnieją. Zachodzi więc także następujący fakt.

Wniosek [wzór Taylora z resztą w postaci Peano] Niech $ P\subset \R $ będzie przedziałem otwartym, $ x_0\in P $. Załóżmy, że $ f\colon P\to \R $ ma $ (k-1) $ pochodnych na $ P $ i $ k $-tą pochodną w punkcie $ x_0 $. Wówczas

\[ f(x)=\sum_{j=0}^k \frac{f^{(j)}(x_0)}{j!} (x-x_0)^j + r(x), \qquad \lim_{x\to x_0} \frac{r(x)}{(x-x_0)^k}=0\, .           \]
Uwaga [terminologia] Wielomian

\[ \sum_{j=0}^k \frac{f^{(j)}(x_0)}{j!} (x-x_0)^j        \]

nazywa się $ k $-tym wielomianem Taylora funkcji $ f $ w punkcie $ x_0 $ (gdy $ x_0=0 $, używamy nazwy wielomian Maclaurina). Zamiast podawać warunek rjesto, pisze się czasem $ r(x)=o(x^k) $ dla $ x\to 0 $. Symbol po prawej stronie to tzw.``o małe''; napis

\[ f(x)=o(g(x))\qquad \mbox{dla $x\to a$} \]

oznacza po prostu, że granica $ \lim_{x\to a}(f(x)/g(x))=0 $. Taki język jest czasem bardzo wygodny, co zobaczymy w konkretnych przykładach.

\begin{figure}[!t] \begin{center}  \includegraphics*[totalheight=4.85cm]{T1f.png}\hfill \includegraphics*[totalheight=4.85cm]{T5f.png} </p>
<p>\smallskip                  \includegraphics*[totalheight=4.85cm]{T15f.png}\hfill \includegraphics*[totalheight=4.85cm]{T40f.png}   \smallskip             \includegraphics*[totalheight=4.85cm]{T52f.png}\hfill \includegraphics*[totalheight=4.85cm]{T82f.png}</p>
<p>\end{center}

{\footnotesize\baselineskip 11pt Funkcja $ f(x)=6 - x + \frac 32 \cos x + \frac 12 \cos (2\pi x) $ i jej wielomiany Taylora-Maclaurina w punkcie $ x_0=0 $ dla $ n=1 $ (styczna do wykresu), dla $ n=5 $ (górne rysunki), dla $ n=15 $ i $ n=40 $ (środkowe rysunki), i wreszcie dla $ n=52 $ i $ n=82 $ (dolne rysunki). Jak widać, wykresy $ f $ i $ T_{82} $ na przedziale $ [-4,4] $ pokrywają się praktycznie idealnie. Jednak dla $ |x|\to\infty  $ funkcja $ g=|f-T_{82}| $ ma oczywiście granicę $ +\infty $. Przybliżenie, jakie zapewnia wzór Taylora, ma charakter lokalny.

} \end{figure}

Z praktycznego punktu widzenia, przybliżenie, jakie zapewnia wzór Taylora, jest wystarczające do wielu celów praktycznych, np. choćby do obliczania wartości funkcji. Nawet ktoś zupełnie niezainteresowany teorią może zobaczyć to na rysunkach. Te, które widać w skrypcie, zostały wykonane dla konkretnej funkcji (wybranej tak, aby uzyskać rozsądną ilość przedziałów monotoniczności i wykres, który w otoczeniu zera wygląda dość przypadkowo)

\[ \begin{equation}  f(x) = 6 - x + \frac 32 \cos x + \frac 12 \cos (2\pi x); \end{equation} \]

jej wykres jest zaznaczony kolorem czarnym. Kolorem niebieskim zaznaczono wykresy wielomianów Taylora-Maclaurina,

\[ T_n(x)=\sum_{k=0}^n \frac{f^{(k)}(0)} k! \cdot x^k , \]

dla różnych $ n $. Jak widać, im wyższy stopień wielomianu Taylora, tym (w danym przypadku) większa długość przedziału, na którym przybliżenie jest dokładne, i tym mniejszy błąd przybliżenia. Zobaczymy później, jakie są teoretyczne oszacowania reszty we wzorze Taylora. (Zobaczymy też, niestety, że istnieją tak `złośliwe' funkcje, dla których prawa strona wzoru Taylora w pewnych punktach składa się, dla dowolnego $ n $, z samej reszty) - wtedy przybliżanie wielomianami Taylora nie wnosi żadnej informacji.

Oto fragment kodu, który zainteresowanym pozwoli na prowadzenie w wydziałowym Laboratorium własnych eksperymentów z wielomianami Taylora. Można samodzielnie zmieniać funkcję i dwoma suwakami zmieniać rozmiar przedziału oraz stopień wielomianu Taylora:

              Manipulate[    Plot[       Evaluate[         {1.5 Cos[x] + .5 Cos[2 * Pi * x] - x + 6,          Normal[Series[1.5 Cos[x] + .5 Cos[2 * Pi * x] - x + 6, {x, 0, n}]]            }], {x, -x0, x0},       PlotRange -> {-.5, 12.5}, PlotPoints -> 120, MaxRecursion -> 3,       PlotStyle -> {{Black, Thick}, {Blue, Thick}},       TicksStyle -> Directive[Black, 26],       Ticks -> {{-4, -3, -2, -1, 1, 2, 3, 4}, {2, 6, 10}},      Filling -> {2}, FillingStyle -> Directive[Opacity[.15], Gray],       ImageSize -> {800, 500}, ImagePadding -> 20    ],  {{n, 5, "stopień wielomianu"}, 1, 80, 1},    {{x0, 5, "wielkość przedziału"}, .5, 8} ]    

Przejdziemy teraz do konkretnych przykładów, wskazujących m.in., jak przydatny jest wzór Taylora przy obliczaniu granic.

Przykład (#) Posługując się wzorami na pochodne wyższych rzędów funkcji wykładniczej i funkcji trygonometrycznych, podanymi w Przykładzie~ [link], możemy teraz łatwo wypisać wzory MacLaurina dla tych funkcji. Można to zrobić dla dowolnej liczby $ n $, gdyż rozpatrywane funkcje mają pochodne wszystkich rzędów na całej prostej.

  1. Niech $ f(x)=\exp(x) $. Wówczas $ f^{(n)}(0)=\exp(0)=1 $ dla dowolnego $ n\in \N\cup\{0\} $, więc wzór MCL-Peano dla funkcji wykładniczej przybiera postać
    \[ 	\exp(x)=1+\frac{1}{1!}\, x + \frac{1}{2!}\, x^2  + \cdots +    \frac{1}{n!}\, x^n + o(x^n) \quad\mbox{dla $x\to 0$}. 	\]
  2. Dla $ f(x)=\sin x $ mamy $ f^{(2n)}(0)=(-1)^n\sin 0=0 $ (tzn. w MCL-Peano nie ma w ogóle składników o numerach parzystych), natomiast $ f^{(2n+1)}(0)=(-1)^{n+1}\cos 0 = (-1)^{n} $ dla $ n=0,1,\ldots $. Wzór MacLaurina dla sinusa jest więc następujący:
    \[ 	\sin x = x- \frac{x^3}{3!}+\frac{x^5}{5!} +\cdots + (-1)^n \frac{x^{2n+1}}{(2n+1)!} + r(x), 	\]

    gdzie $ r(x)=o(x^{2n+1}) $ dla $ x\to 0 $, gdyż skończyliśmy wypisywanie wielomianu Maclaurina na pochodnej rzędu $ (2n+1) $. Zauważmy, że w tym przypadku można w istocie twierdzić, że $ r(x)=o(x^{2n+2}) $ dla $ x\to 0 $, gdyż kolejny, parzysty, składnik w rozwinięciu Maclaurina jest zerem (parzyste pochodne sinusa znikają w zerze).

  3. Dla $ f(x)=\cos x $ mamy $ f^{(2n+1)}(0)=0 $ dla każdego $ n=0,1,\ldots $, natomiast $ f^{(2n)}(0)= (-1)^n \cos 0 = (-1)^n $ i dlatego
    \[ \cos x = 1- \frac{x^2}{2!}+\frac{x^4}{4!} +\cdots + (-1)^n \frac{x^{2n}}{(2n)!} + r(x),  \]

    gdzie $ r(x)=o(x^{2n}) $ dla $ x\to 0 $ (i, jak w poprzednim podpunkcie, można zauważyć, że w istocie mamy nawet $ r(x)=o(x^{2n+1}) $, gdyż kolejny, nieparzysty, składnik rozwinięcia Maclaurina jest zerem).

    Uwaga. Czytelnik zauważył zapewne, że wielomiany Maclaurina w ostatnim przykładzie wyglądają tak samo, jak odpowiednie sumy częściowe szeregów, którymi posługiwaliśmy się w rozdziale 4. To nie jest przypadkowy fakt: jak zobaczymy za jakiś czas, jeśli funkcja $ f $ jest sumą szeregu, $ f(x)=\sum_{n=0}^\infty a_n x^n $, zbieżnego na pewnym przedziale otwartym wokół zera, to wówczas $ f $ ma pochodne wszystkich rzędów i $ f^{(k)}(0)=k! a_k $ dla każdego $ k $.

Przykład Niech $ f(x)=\ln x $ i $ x_0=1 $. Tym razem zastosujemy wzór Taylora w punkcie $ x_0=1 $. Mamy $ f^{(n)}(x_0)=(-1)^{n-1}(n-1)! $ (patrz Przykład~ [link]), a więc

\[ 	\ln x = (x-1) - \frac{(x-1)^2}{2} + \cdots + (-1)^{n-1} \frac{(x-1)^n}{n} + r(x)\, , \quad \mbox{gdzie}\quad \lim_{x\to 1} \frac{r(x)}{(x-1)^n}=0\, . 	\]

Podstawiając $ x-1=t $, otrzymamy

\[ \ln(1+t)= t-\frac{t^2}{2}+\frac{t^3}{3}+\cdots +(-1)^{n-1}\frac{t^n}n + o (t^n) \qquad\mbox{dla $t\to 0$.}     \]

Tym wzorem też można się posługiwać dla dowolnej liczby $ n\in \N $, gdyż logarytm naturalny ma na $ (0,\infty) $ pochodne wszystkich rzędów.

Przykład Obliczymy granicę

\[ \lim_{x\to 0} \frac {\sin x -\sin (\sin x)}{\ln (1+x^3)}.   \]

Mamy $ \ln (1+t)=t+o(t) $; biorąc $ t=x^3 $ stwierdzamy, że mianownik jest równy $ x^3 $ z dokładnością do wyrazów niższego rzędu. Dlatego znajdziemy rozwinięcie Taylora licznika też z dokładnością do wyrazów z $ x^3 $. Wiemy, że $ \sin x= x-x^3/6 + o(x^3) $ dla $ x\to 0 $. Zatem

\[ \begin{eqnarray*} \sin (\sin x) & = & \sin x - \frac{(\sin x)^3}6 + o ((\sin x)^3) \\ & = & x-\frac{x^3}{6}+o(x^3) - \frac{x^3+ o(x^3)}6 + o(x^3)   \ =\  x-\frac{x^3}3 + o(x^3)\, \qquad\mbox{dla $x\to 0$.} \end{eqnarray*} \]

Skomentujmy ten prosty skądinąd rachunek. Po pierwsze, nie musieliśmy wcale różniczkować złożenia $ \sin \circ \sin $. Podstawialiśmy jeden wzór Taylora do drugiego, kontrolując błąd. Po drugie, napis `$ o(x^3) $' oznaczał w różnych miejscach różne wyrażenia! Wiemy tylko, że `$ o(x^3) $ dla $ x\to 0 $' to funkcja, która po podzieleniu przez $ x^3 $ ma w zerze granicę 0. Dlatego (To jeden z powodów, dla których tej symboliki trzeba używać z wyczuciem i ostrożnie!) $ o(x^3)+o(x^3)= o(x^3) $ oraz $ o((\sin x)^3)=o(x^3) $, gdyż $ \frac{\sin x}{x} $ ma zerze granicę 1. Ostatecznie,

\[ \frac {\sin x -\sin (\sin x)}{\ln (1+x^3)}=\frac{x-\frac{x^3}6 + o(x^3)- \left(x-\frac{x^3}3 + o(x^3)\right)}{x^3+ o(x^3)}= \frac{\frac{x^3}6 + o(x^3)}{x^3+o(x^3)}=\frac{\frac 16 + \frac{o(x^3)}{x^3}}{1+\frac{o(x^3)}{x^3}}\, ,  \]

a więc szukana granica wynosi $ 1/6 $. Podkreślmy ponownie: w liczniku i mianowniku ostatniego ułamka pod tym samym symbolem $ o(x^3) $ kryją się różne wyrażenia - reszty ze wzoru Maclaurina dla różnych funkcji! Ich wspólną własnością jest jednak to, że po podzieleniu przez $ x^3 $ dążą do zera. Dlatego umiemy udzielić odpowiedzi.

Podamy teraz ogólne twierdzenie, pozwalające dokładniej szacować resztę we wzorze Taylora.

Twierdzenie [wzór Taylora z resztą Schl\"{omilcha-Roche'a}] (#) Niech $ f\colon (a,b)\to\R $ ma w przedziale $ (a,b) $ pochodne do rzędu $ (k+1) $ włącznie. Załóżmy, że $ x_0,x_0+d\in (a,b) $, $ d>0 $. Oznaczmy

\[ 	r_k(x)=f(x)-\sum_{j=0}^k \frac{f^{(j)}(x_0)}{j!} (x-x_0)^j\, . 	\]

Wówczas dla każdego $ x\in (x_0,x_0+d) $ i każdego $ p>0 $ istnieje liczba $ \theta\in (0,1) $ taka, że

\[ \begin{equation} \label{resztaSR} r_k(x)= \frac{f^{(k+1)}(x_0+\theta(x-x_0))}{k!\cdot p} (1-\theta)^{k+1-p} (x-x_0)^{k+1}\, .   \end{equation} \]

Dowód:
Ustalmy $ x\in (x_0,x_0+d) $ i rozważmy funkcję pomocniczą

\[ \varphi(y)  =  f(x)-\sum_{j=0}^k \frac{f^{(j)}(y)}{j!} (x-y)^j , \qquad\mbox{gdzie $x_0\le y\le x$.} \]

Wtedy $ \varphi(x)=0 $ i $ \varphi(x_0)=r_k(x) $; ponadto, $ \varphi $ jest różniczkowalna w $ [x_0,x] $, gdyż $ f $ ma $ k+1 $ pochodnych na większym przedziale. Obliczmy

\[ \begin{eqnarray*} \varphi'(y)& =& 0-f'(y)- \left(\frac{f^{(2)}(y)}{1!} (x-y)-\frac{f^{(1)}(y)}{1!}\right)   - \left(\frac{f^{(3)}(y)}{2!} (x-y)^2-\frac{f^{(2)}(y)}{1!}(x-y)\right)\\& &{}  - \ldots - \left(\frac{f^{(k+1)}(y)}{k!} (x-y)^k-\frac{f^{(k)}(y)}{(k-1)!}(x-y)^{k-1}\right) \, . \end{eqnarray*} \]

Opuszczając nawiasy, otrzymujemy po dokonaniu redukcji

\[ \begin{equation} \label{fiprim} \varphi'(y)=- \frac{f^{(k+1)}(y)}{k!} (x-y)^k\, .      \end{equation} \]

Niech teraz $ \psi $ będzie funkcją ciągłą w $ [x_0,x] $, różniczkowalną w $ (x_0,x) $, której pochodna nie znika nigdzie w $ (x_0,x) $. Stosując Twierdzenie Cauchy'ego (patrz Tw.~ [link]; proszę samodzielnie sprawdzić, że spełnione są wszystkie założenia), otrzymujemy

\[ \frac{\varphi(x)-\varphi(x_0)}{\psi(x)-\psi(x_0)}=\frac{\varphi'(c)}{\psi'(c)} \qquad\mbox{dla pewnego $c\in (x_0,x)$.} \]

Korzystając z tej równości, obliczamy

\[ \begin{eqnarray} r_k(x)=\varphi(x_0)&=&  \underbrace{\varphi(x)}_{=0}-(\psi(x)-\psi(x_0))\frac{\varphi'(c)}{\psi'(c)} \nonumber \\ & \stackrel{\eqref{fiprim}}= &   \frac{f^{(k+1)}(c)}{k!} (x-c)^k \, \cdot \, \frac{\psi(x)-\psi(x_0)}{\psi'(c)}   \label{prereszta} \end{eqnarray} \]

Aby zakończyć dowód, pozostaje odpowiednio dobrać funkcję $ \psi $ i użyć powyższego wzoru dla niej. Weźmy $ \psi(y)=(x-y)^p $. Wtedy $ \psi $ jest ciągła na $ [x_0,x] $ i $ \psi'(y)=-p(x-y)^{p-1} $ nie znika w $ (x_0,x) $. Ponadto, $ \psi(x)=0 $ i $ \psi(x_0)=(x-x_0)^p $. Niech $ \theta\in (0,1) $ będzie takie, że $ c=x_0+\theta(x-x_0) $. Wzór prereszta przepisujemy teraz w postaci

\[ \begin{eqnarray*} r_k(x) & = &   \frac{f^{(k+1)}(x_0+\theta(x-x_0))}{k!} (x-x_0-\theta(x-x_0))^k \, \cdot \, \frac{-(x-x_0)^p}{-p(x-x_0-\theta(x-x_0))^{p-1}} \\           & = &   \frac{f^{(k+1)}(x_0+\theta(x-x_0))}{k!\cdot p} (x-x_0)^k(1-\theta)^k \, \cdot \, \frac{(x-x_0)^p}{(x-x_0)^{p-1}(1-\theta)^{p-1}} \\ & = &   \frac{f^{(k+1)}(x_0+\theta(x-x_0))}{k!\cdot p} (x-x_0)^{k+1}(1-\theta)^{k+1-p}\, .  \end{eqnarray*} \]

To jest właśnie szukana postać reszty, resztaSR. Dowód jest zakończony.

Dobierając różne wartości $ p $, można otrzymać różne konkretne postacie reszty. Bardzo znana jest tzw. reszta Lagrange'a, którą otrzymujemy dla $ p=k+1 $. Wtedy $ k+1-p=0 $, a $ k!\cdot p=(k+1)! $. Dlatego zachodzi następujący fakt.

Wniosek [wzór Taylora z resztą Lagrange'a] (#) Załóżmy, że funkcja $ f\colon (a,b)\to \R $ ma w~przedziale $ (a,b) $ pochodne do rzędu $ (k+1) $ włącznie. Wówczas, dla każdego $ x_0\in (a,b) $ i każdego $ x\in (a,b) $ istnieje taki punkt $ c $, pośredni między $ x_0  $ i $ x $, że

\[ f(x)= \sum_{j=0}^k \frac{f^{(j)}(x_0)}{j!} (x-x_0)^j \ + \  \frac{f^{({k+1})}(c)}{(k+1)!} (x-x_0)^{k+1} \, . \]

Warunki dostateczne istnienia ekstremów lokalnych

Posługując się wzorem Taylora, nietrudno sformułować warunki dostateczne istnienia ekstremów lokalnych, wyrażone za pomocą pochodnych wyższych rzędów. Wiemy już, że zerowanie pierwszej pochodnej funkcji nie jest warunkiem dostatecznym istnienia ekstremum lokalnego (przykład: $ f(x)=x^3 $ jest ściśle rosnąca, ale $ f'(0)=0 $). Jeśli jednak wiadomo, które pochodne wyższych rzędów danej funkcji znikają, a które nie, to można łatwo określić, czy w danym punkcie jest ekstremum lokalne, czy nie. Służy do tego wzór Taylora.

Stwierdzenie Załóżmy, że $ f\colon (a,b)\to \R $ ma w $ (a,b) $ pochodne do rzędu $ (2k-1) $ włącznie, a ponadto istnieje $ f^{(2k)}(x_0) $. Jeśli

\[ 	f^{(j)}(x_0)=0 \quad\mbox{dla $j=1,\ldots, 2k-1$,} \qquad \mbox{zaś $f^{(2k)}(x_0)\not = 0$,} 	\]

to $ f $ ma w $ x_0 $ ekstremum lokalne właściwe. Dokładniej, jeśli $ f^{(2k)}(x_0)>0 $, to $ f $ ma w $ x_0 $ minimum lokalne właściwe, a jeśli $ f^{(2k)}(x_0)<0 $, to $ f $ ma w $ x_0 $ maksimum lokalne właściwe.

Dowód:
Rozpatrzymy tylko przypadek $ f^{(2k)}(x_0)>0 $; w drugim przypadku dowód jest analogiczny. Ze wzoru Taylora z resztą w postaci Peano otrzymujemy, uwzględniając założenie o znikaniu pochodnych $ f^{(j)}(x_0) $ dla $ j=1,\ldots,2k-1 $,

\[ f(x)-f(x_0)=\sum_{j=1}^{2k} \frac{f^{(j)}(x_0)}{j!} (x-x_0)^j + r(x) =  \frac{f^{(2k)}(x_0)}{(2k)!} (x-x_0)^{2k} + r(x)\,   , \]

gdzie $ r(x)=o((x-x_0)^{2k}) $ dla $ x\to x_0 $. Dobierzmy liczbę $ \delta>0 $ tak, aby

\[ \left|\frac{r(x)}{(x-x_0)^{2k}}\right| < \frac 12    \cdot \frac{f^{(2k)}(x_0)}{(2k)!} \qquad\mbox{dla $0<|x-x_0|<\delta$;} \]

można to zrobić, posługując się wprost definicją granicy, gdyż $ \eps = f^{(2k)}(x_0)/(2\cdot (2k)!)>0 $. Zatem, z nierówności trójkąta,

\[ f(x)-f(x_0)= \left( \frac{f^{(2k)}(x_0)}{(2k)!}+\frac{r(x)}{(x-x_0)^{2k}}\right) (x-x_0)^{2k}>  \frac 12    \cdot \frac{f^{(2k)}(x_0)}{(2k)!} (x-x_0)^{2k} >0 \]

dla wszystkich $ x\in (x_0-\delta,x_0+\delta)\setminus\{x_0\} $. Dowód jest zakończony.

Stwierdzenie (#) Załóżmy, że $ f\colon (a,b)\to \R $ ma w $ (a,b) $ pochodne do rzędu $ 2k $ włącznie, a ponadto istnieje $ f^{(2k+1)}(x_0) $. Jeśli

\[ 	f^{(j)}(x_0)=0 \quad\mbox{dla $j=1,\ldots, 2k$,} \qquad \mbox{ale $f^{(2k+1)}(x_0)\not = 0$,} 	\]

to $ f $ nie ekstremum w punkcie $ x_0 $.

     Szkic dowodu. Postępując tak, jak w poprzednim dowodzie, otrzymujemy

\[ f(x)-f(x_0) =\frac{f^{(2k+1)}(x_0)}{(2k)!} (x-x_0)^{2k+1} + r(x)\,   , \]

przy czym dla pewnej liczby $ \delta>0 $ jest

\[ \left|\frac{r(x)}{(x-x_0)^{2k+1}}\right| < \frac 12    \cdot \left|\frac{f^{(2k+1)}(x_0)}{(2k+1)!}\right| \qquad\mbox{dla $0<|x-x_0|<\delta$.} \]

Ponieważ wyrażenie $ (x-x_0)^{2k+1} $ nie ma stałego znaku, więc łatwo jest stąd wywnioskować, że i różnica $ f(x)-f(x_0) $ nie ma stałego znaku dla $ x $ bliskich $ x_0 $.

Warunki dostateczne wypukłości. Punkty przegięcia.

W ostatniej części tego podrozdziału powiemy o związkach pochodnej z wypukłością.

Twierdzenie Załóżmy, że $ f\colon P=(a,b)\to\R $ jest różniczkowalna. Wówczas $ f $ jest wypukła na $ P $ (odpowiednio: ściśle wypukła na $ P $) wtedy i tylko wtedy, gdy $ f' $ jest niemalejąca na $ P $ (odpowiednio: rosnąca na $ P $).

Dowód:
Znamy już Twierdzenie~ [link], które podaje równoważne warunki wypukłości. Trzeci warunek w tym twierdzeniu orzeka, że $ f $ jest wypukła na $ P=(a,b) $ wtedy i tylko wtedy, gdy dla wszystkich $ x<y<z $ należących do $ P $ zachodzą nierówności

\[ \frac{f(y)-f(x)}{y-x}\le \frac{f(z)-f(y)}{z-y}\, . \]

Jeśli $ f $ jest ściśle wypukła, to dla każdej trójki punktów nierówności są ostre.

Ustalmy teraz dowolne $ x<y<z\in P $ i załóżmy, że $ f $ jest różniczkowalna, a $ f' $ jest funkcją niemalejącą. Z twierdzenia Lagrange'a o wartości średniej wynika, że istnieją $ c_1\in (x,y) $ oraz $ c_2\in (y,z) $ takie, że

\[ \frac{f(y)-f(x)}{y-x}= f'(c_1)\le f'(c_2) =\frac{f(z)-f(y)}{z-y}\, , \]

gdzie środkowa nierówność zachodzi, gdyż $ f' $ jest niemalejąca i $ c_1<y<c_2 $. Jeśli ponadto $ f' $ jest rosnąca, to $ f'(c_1)<f'(c_2) $. To kończy dowód w jedną stronę.

Pokażemy teraz, że jeśli $ f $ jest wypukła i $ f' $ istnieje, to $ f'(x)\le f'(z) $ dla $ x<z\in P $. Z Twierdzenia~ [link] wynika, że dla $ 0<h<y-x $, gdzie $ y=\frac{x+z}2 $ jest środkiem odcinka $ (x,z) $, zachodzą nierówności

\[ \frac{f(x+h)-f(x)}h\le \frac{f(y)-f(x)}{y-x}\le \frac{f(z)-f(y)}{z-y}\le \frac{f(z)-f(z-h)}h\, .  \]

Ponieważ nierówności nieostre zachowują się w granicy, więc wykonując przejście graniczne $ h\to 0 $, otrzymujemy

\[ \begin{equation} f'(x)\le  \frac{f(y)-f(x)}{y-x}\le \frac{f(z)-f(y)}{z-y}\le f'(z)\, . \label{monofprim} \end{equation} \]

Zatem $ f' $ jest niemalejąca. Jeśli ponadto $ f $ jest ściśle wypukła, to środkowa nierówność jest ostra, co oznacza, że wtedy $ f'(x)<f'(z) $.

    Uwaga. Aby sprawdzić, że monotoniczność $ f' $ jest warunkiem dostatecznym wypukłości $ f $, można też postąpić inaczej. Niech $ x_1\le x\le y=x_2\in P $, $ t\in (0,1) $. Funkcja

\[ \psi(x)=f((1-t)x+ty) -(1-t)f(x)-tf(y) \]

ma pochodną $ \psi'(x)=(1-t)\bigl(f'((1-t)x+ty) -f'(x)\bigr) $. Zauważmy, że $ (1-t)x+ty=x+t(y-x)>x $, gdy $ x<y $ i $ t>0 $. Dlatego, jeśli $ f' $ jest niemalejąca, to $ \psi'\ge 0 $ na $ [x_1,x_2] $. Stąd $ \psi(x_1)\le \psi (x_2)=0 $, a warunek $ \psi(x_1)\le 0 $ jest po prostu nierównością Jensena. Zauważmy, że gdy $ f' $ jest rosnąca, to nierówności w ostatnim zdaniu można zmienić na ostre.

Wniosek Załóżmy, że $ f\colon P=(a,b)\to\R $ jest dwukrotnie różniczkowalna. Wówczas:

  1. Jeśli $ f''>0 $ na $ P $, to $ f $ jest ściśle wypukła na $ P $;
  2. Jeśli $ f''\ge 0 $ na $ P $, to $ f $ jest wypukła na $ P $;
  3. Jeśli $ f''<0 $ na $ P $, to $ f $ jest ściśle wklęsła na $ P $;
  4. Jeśli $ f''\le 0 $ na $ P $, to $ f $ jest wklęsła na $ P $.

Dowód:
Wystarczy zastosować poprzednie twierdzenie i Wniosek~ [link], podający warunki dostateczne monotoniczności funkcji różniczkowalnej.

    Uwaga. Należy pamiętać, że mówimy tu tylko o dostatecznych warunkach wypukłości. Funkcja wypukła może przecież w pewnych punktach nie mieć nawet pierwszej pochodnej (przykład: $ f(x)=|x| $ dla $ x\in \R $), a tym bardziej drugiej. Stosując Twierdzenie~ [link], można dość łatwo wykazać, że funkcja wypukła ma w każdym punkcie pochodne jednostronne i jest różniczkowalna poza zbiorem co najwyżej przeliczalnym. Szczegóły pozostawiamy w charakterze zadania.

Definicja [punkty przegięcia](#) Niech $ f\colon P=(a,b)\to \R $ będzie ciągła i niech ma w punkcie $ x_0\in P $ skończoną lub nieskończoną pochodną. Załóżmy, że istnieje taka liczba $ \delta>0 $, że $ f $ nie jest liniowa na żadnym z przedziałów $ (x_0,x_0-\delta) $ i $ (x_0,x_0+\delta) $, a ponadto na jednym z nich jest wypukła, zaś na drugim - wklęsła. Mówimy wtedy (i tylko wtedy), że $ f $ ma punkt przegięcia w $ x_0 $.

Można spotkać w literaturze inne, nierównoważne powyższej, definicje punktów przegięcia - np. taką: \begin{quote} {\it Niech $ f\colon (a,b)\to \R $ będzie różniczkowalna w $ x_0\in (a,b) $ i niech $ y(x)=f(x_0)+f'(x_0)(x-x_0) $ będzie styczną do wykresu $ f $ w punkcie $ (x_0,f(x_0)) $. Mówimy, że $ f $ ma w $ x_0 $ punkt przegięcia, gdy funkcja $ f(x)-y(x) $ zmienia znak w punkcie $ x_0 $.} \end{quote} Geometrycznie biorąc, powyższe określenie oznacza, że wykres $ f $ przechodzi z jednej strony stycznej na drugą. Nie wymagamy, żeby na ustalonym przedziale z jednej strony $ x_0 $ funkcja była wklęsła, a z drugiej wypukła.

Zadanie (#) Niech

\[ f(x)=\left\{\begin{array}{ll} x^2 \bigl(2+ \sin(1/x)\bigr)\, , \qquad & x\not=0\, ,\\ 0, & x=0\,  \end{array} \right. \]

będzie funkcją z Przykładu~ [link] i niech $ g(x)=f(x) $ dla $ x\ge 0 $, $ g(x)=-f(x) $ dla $ x<0 $. Sprawdzić, że $ g $ nie ma w $ x_0=0 $ punktu przegięcia w sensie Definicji~ [link], ale funkcja

\[ g(x)-\Bigl(g(x_0)+g'(x-x_0)(x-x_0)\Bigr) \]

jest dodatnia dla $ x>x_0=0 $ i ujemna dla $ x<x_0=0 $, tzn. wykres $ g $ przechodzi w zerze z jednej strony stycznej na drugą. (#)

Stwierdzenie Załóżmy, że $ f\colon (a,b)\to \R $ jest dwukrotnie różniczkowalna na $ (a,b) $ i trzykrotnie różniczkowalna w $ x_0\in (a,b) $, przy czym $ f^{(3)}(x_0)\not=0=f''(x_0) $. Wtedy $ f $ ma w $ x_0 $ punkt przegięcia. (#)

Dowód:
Bez zmiany ogólności załóżmy, że $ f^{(3)}(x_0)>0 $. Ponieważ

\[ 0< f^{(3)}(x_0)=\lim_{h\to 0}\frac{f''(x_0+h)-f''(x_0)}h =  \lim_{h\to 0}\frac{f''(x_0+h)}h\, , \]

więc dla wszystkich dostatecznie małych $ h>0 $ jest $ f''(x_0+h)>0>f''(x_0-h) $. Zatem $ f $ jest ściśle wypukła na pewnym przedziale $ x_0,x_0+\delta) $ i ściśle wklęsła na pewnym przedziale $ (x_0-\delta,x_0) $. Na żadnym z tych przedziałów $ f $ oczywiście nie jest liniowa, a ponadto $ f'(x_0) $ istnieje, gdyż $ f $ jest dwukrotnie różniczkowalna. Spełnione są więc wszystkie warunki Definicji~ [link].

\begin{figure}[!t] \begin{center}  \includegraphics*[totalheight=5cm]{pp.png}</p>
<p>\includegraphics*[totalheight=7.2cm]{pp-a-styczna.png} </p>
<p>\end{center}

{\footnotesize\baselineskip 11pt U góry: punkt przegięcia. U dołu: wykres funkcji przechodzi na drugą stronę stycznej, jednak w dowolnie małym przedziale $ (a,a+\delta) $ są zarówno odcinki, na których funkcja jest wklęsła, jak i odcinki, na których funkcja jest wypukła. Konkretny przykład takiej sytuacji można znaleźć w Zadaniu~ [link].

} \end{figure}

Uwaga Przy założeniach ostatniego stwierdzenia funkcja

\[ 	h(x)=f(x)-\Bigl(f(x_0)+f'(x-x_0)(x-x_0)\Bigr)   	\]

zmienia znak w punkcie $ x_0 $, gdyż ze wzoru Taylora z resztą w postaci Peano wynika, że

\[ \begin{eqnarray*} h(x)&=&\frac{f''(x_0)}{2!}(x-x_0)^2 +  \frac{f^{(3)}(x_0)}{3!}(x-x_0)^3 + o \bigl((x-x_0)^3\bigr) \\ &= &\frac{f^{(3)}(x_0)}{3!}(x-x_0)^3 + o \bigl((x-x_0)^3\bigr) \quad\mbox{dla $x\to x_0$;} \end{eqnarray*} \]

znak prawej strony określamy tak samo, jak w dowodzie Stwierdzenia~ [link]. Z intuicyjnego punktu widzenia, przy założeniach $ f^{(3)}(x_0)\not=0=f''(x_0) $ różnica $ h $ między $ f $ i styczną do wykresu $ f $ zachowuje się w otoczeniu punktu $ x_0 $ - z dokładnością do zaniedbywalnego błędu - tak, jak pewna wielokrotność $ (x-x_0)^3 $. Widać, że przy takich założeniach oba przytoczone określenia punktu przegięcia są równoważne (a patologie takie, jak w Zadaniu~ [link], są wykluczone).

Zadanie Sprawdzić, że przy założeniach Stwierdzenia~ [link] $ f $ ma w $ x_0 $ punkt przegięcia.      Wskazówka. Spróbować naśladować dowód Stwierdzenia~ [link].

Reguła de l'Hospitala

Sformułujemy teraz kilka wariantów tak zwanej reguły de l'Hospitala, która ułatwia obliczanie granice wyrażeń nieoznaczonych typu $ \frac 00 $ i $ \frac \infty\infty $. Jest to narzędzie wygodne i warto je znać. Zobaczymy jednak przykłady sytuacji, gdy reguła de l'Hospitala prowadzi do koszmarnych rachunków i z kretesem przegrywa konkurencję z wzorem Taylora.

Twierdzenie (#) Załóżmy, że $ f,g\colon \R\supset P \to\R $ są różniczkowalne w punkcie skupienia $ a\in P $ zbioru $ P\subset \R $, a ponadto $ f(a)=g(a)=0\not= g'(a) $. Wtedy granica

\[ 	\lim_{x\to a} \frac{f(x)}{g(x)} 	\]

istnieje i jest równa $ f'(a)/g'(a) $.

Dowód:
Z założeń $ f(a)=g(a)=0\not= g'(a) $ wynika, że

\[ \frac{f(x)}{g(x)}=  \frac{f(x)-f(a)}{g(x)-g(a)} = \frac{f(x)-f(a)}{x-a}\cdot \frac{x-a}{g(x)-g(a)} \]

(ostatni ułamek ma sens: blisko punktu $ a $ jest $ g(x)\not=g(a) $, gdyż $ g'(a)\not= 0 $). Z twierdzenia o granicy iloczynu i definicji pochodnej wynika natychmiast, że

\[ \frac{f(x)}{g(x)}=   \frac{f(x)-f(a)}{x-a}\cdot \frac{x-a}{g(x)-g(a)} \to f'(a)\cdot \frac{1}{g'(a)} \qquad\mbox{gdy $x\to a$. <p style="text-align: right">&square;</p>} \]
Twierdzenie (#) Załóżmy, że $ f,g\colon \R\supset P \to\R $$ (k-1) $-krotnie różniczkowalne w przedziale $ P\subset \R $. Jeśli $ a $ jest punktem wewnętrznym $ P $ i

\[ f^{(j)}(a)=g^{(j)}(a)=0 \quad\mbox{dla $j=0,1,\ldots, k-1$,} \qquad \mbox{ale } g^{(k)}(a)\not=0, \]

to granica

\[ \lim_{x\to a} \frac{f(x)}{g(x)} \]

istnieje i jest równa $ f^{(k)}(a)/g^{(k)}(a) $.

Dowód:
Posługując się wzorem Taylora z resztą Peano i założeniem o znikaniu odpowiednich pochodnych $ f $ i $ g $, możemy napisać:

\[ \frac{f(x)}{g(x)} =\frac{ \frac{f^{(k)}(a)}{k!} (x-a)^k + o ((x-a)^k) } { \frac{g^{(k)}(a)}{k!} (x-a)^k + o ((x-a)^k) }= \frac{ f^{(k)}(a)  + \frac{o ((x-a)^k)}{(x-a)^k} } { g^{(k)}(a)  + \frac{o ((x-a)^k)}{(x-a)^k} } \quad\mbox{dla $x\to a$.} \]

(Zauważmy, że w otoczeniu punktu $ a $ mianownik nie będzie się zerował, gdyż $ g^{(k)}(a)\not =0 $.) Stąd natychmiast wynika teza.

Kolejny wariant od dwóch poprzednich różni się tym, że nie zakładamy różniczkowalności obu funkcji w punkcie $ a $.

Twierdzenie (#) Załóżmy, że $ f,g\colon [a,a+ d ) \to\R $, gdzie $  d >0 $, są różniczkowalne w przedziale otwartym $ (a,a+ d ) $, $ g'(x)\not = 0 $ na $ (a,a+ d ) $ i $ f(a)=g(a)=0 $. Jeśli istnieje granica $ \lim_{x\to a} \bigl(f'(x)/g'(x)\bigr)=A $, to istnieje granica $ \lim_{x\to a} \bigl(f(x)/g(x)\bigr) $ i też jest równa $ A $.

    Szkic dowodu. Tym razem skorzystamy z twierdzenia Cauchy'ego i napiszemy

\[ \begin{equation} 	\label{C-H3} \frac{f(x)}{g(x)}=  \frac{f(x)-f(a)}{g(x)-g(a)} = \frac{f'(\xi_x)}{g'(\xi_x)}, \qquad\mbox{gdzie $a<\xi_x<x$.} \end{equation} \]

Posługując się wprost definicją granicy (wg. Cauchy'ego), nietrudno stwierdzić, że dla $ x\to a $ prawa strona dąży do $ A $, a więc i lewa strona dąży do $ A $. Czytelnik zechce uzupełnić wszystkie szczegóły rozumowania.

Uwaga (#) Regułę de l'Hospitala w wersji podanej w Twierdzeniu~ [link] wolno stosować nie tylko dla $ A\in \R $, ale także w przypadku $ A=\pm\infty $. Jeśli np. $ A=+\infty $, to dla dowolnej liczby $ M>0 $ znajdziemy $ \eta>0 $ takie, że $ f'(\xi)/g'(\xi)>M $ na przedziale $ (a,a+\eta) $. Jeśli $ x\in (a,a+\eta) $, to $ \xi_x $ we wzorze C-H3 też jest punktem przedziału $ (a,a+\eta) $ i dlatego dla $ x\in (a,a+\eta) $ lewa strona C-H3 jest większa od $ M $.
Uwaga W Twierdzeniu~ [link] punkt $ a\in\R $ można zastąpić przez $ \pm\infty $. Uzasadnienie nie jest skomplikowane. Wystarczy przyjąć, że

\[ 	F(t)=f(1/t)\, , \qquad G(t)=g(1/t)\, ; 	\]

wtedy (powiedzmy, że $ a=+\infty $)

\[ \lim_{x\to +\infty} \frac{f(x)}{g(x)}= \lim_{t\to 0^+} \frac{F(t)}{G(t)}\, . \]

Mamy też, dzięki wzorowi na pochodną złożenia,

\[ \lim_{t\to 0} \frac{F(t)}{G(t)} =   \lim_{t\to 0} \frac{F'(t)}{G'(t)}= \lim_{t\to 0} \frac{-t^{-2}f'(1/t)}{-t^{-2}g'(1/t)} =  \lim_{t\to 0} \frac{f'(1/t)}{g'(1/t)} = \lim_{x\to +\infty} \frac{f'(x)}{g'(x)}\, . \quad\mbox{<p style="text-align: right">&square;</p>} \]

W ostatniej wersji reguła de l'Hospitala przenosi się na nieoznaczoności typu $ \frac\infty\infty $.

Twierdzenie (#) Niech $ f,g $ będą różniczkowalne w przedziale $ (a,a+ d ) $, $ g'(x)\not = 0 $ na $ (a,a+ d ) $ i $ \lim_{x\to a} f(x)=\lim_{x\to a} g(x)=\pm\infty $. Jeśli istnieje granica $ \lim_{x\to a} \bigl(f'(x)/g'(x)\bigr)=A $, to istnieje granica $ \lim_{x\to a} \bigl(f(x)/g(x)\bigr) $ i też jest równa $ A $.

Dowód:
Dla ustalenia uwagi rozpatrzymy przypadek $ \lim_{x\to a} f(x)=\lim_{x\to a} g(x)=+\infty $ i $ A\in \R $. Niech $ a<x<x_0<a+ d  $. Wtedy

\[ \frac{f(x)-f(x_0)}{g(x)-g(x_0)}= \frac{f(x)}{g(x)} \cdot \frac{1-(f(x_0)/f(x))}{1-(g(x_0)/g(x))}\, . \]

Dla ustalonego $ x_0 $, ułamek

\[ U(x_0,x)= \frac{1-(g(x_0)/g(x))}{1-(f(x_0)/f(x))} \]

ma dla $ x\to a $ granicę równą $ 1 $, gdyż $ f,g\to +\infty $ dla $ x\to a $. Posługując się twierdzeniem Cauchy'ego, by wyrazić stosunek przyrostów funkcji $ f $ i $ g $, piszemy

\[ \begin{equation} 	\label{pre-dowH} \frac{f(x)}{g(x)} =  \frac{f(x)-f(x_0)}{g(x)-g(x_0)}\cdot {U(x_0,x)} = \frac{f'(\xi_x)}{g'(\xi_x)}\cdot   {U(x_0,x)}, \qquad\mbox{gdzie $a<x<\xi_x<x_0$}\, . \end{equation} \]

Dlatego

\[ \begin{eqnarray} \left|\frac{f(x)}{g(x)} - A\right|&= &\left|\frac{f(x)}{g(x)} - \frac{f'(\xi_x)}{g'(\xi_x)} + \frac{f'(\xi_x)}{g(\xi_x)}-  A\right| \nonumber  \\   &\stackrel{\eqref{pre-dowH}}=&   \left| \frac{f'(\xi_x)}{g'(\xi_x)} \bigl(U(x_0,x)-1\bigr)+ \frac{f'(\xi_x)}{g(\xi_x)}-  A\right| \nonumber  \\   &\le &    \left|\frac{f'(\xi_x)}{g'(\xi_x)}\right|\cdot \bigl|U(x_0,x)-1\bigr| + \left|  \frac{f'(\xi_x)}{g(\xi_x)}-  A\right|\, .                         \label{dowH}  \end{eqnarray} \]

Ustalmy $ \eps>0 $ i liczbę $ \eta\in (0,1) $, którą dobierzemy do $ \eps $ później. Korzystając z założenia o istnieniu granicy ilorazu pochodnych, weźmy taki punkt $ x_0\in (a,a+ d ) $, aby $ |\frac{f'(t)}{g'(t)}-A|<\eta $ dla wszystkich $ t\in (a,x_0) $. Wreszcie, ustaliwszy już $ x_0 $, wybierzmy liczbę $ \delta\in (0,|x_0-a|) $ tak, aby $ \bigl|U(x_0,x)-1\bigr|<\eta $ dla wszystkich $ x\in (a,a+\delta) $. Szacując prawą stronę dowH, otrzymujemy teraz

\[  \left|\frac{f(x)}{g(x)} - A\right|\le    \left|\frac{f'(\xi_x)}{g'(\xi_x)}\right|\cdot \eta + \eta\le (|A|+\eta)\eta + \eta< (|A|+1+1)\eta< \eps \]

dla wszystkich liczb $ x\in (a,a+\delta) $; aby zachodziła ostatnia nierówność, wystarczy wziąć np. $ \eta=\eps/(|A|+3) $.

Zadanie Przeprowadzić dowód ostatniego twierdzenia dla $ A=\pm\infty $.

Założenie o istnieniu granicy ilorazu $ f'/g' $ jest istotnie i nie można go pominąć.

Przykład Oczywiście,

\[ 	\lim_{x\to +\infty} \frac{2x+\sin x}{2x-\sin x} 	=\lim_{x\to +\infty} \frac{1+\displaystyle\frac{\sin x}{2x}}{1-\displaystyle\frac{\sin x}{2x}}= 1\, .    	\]

Jednak, oznaczając $ f(x)={2x+\sin x} $, $ g(x)={2x-\sin x} $, otrzymujemy

\[ \frac{f'(x)}{g'(x)} = \frac{2+\cos x}{2-\cos x}\, , \]

a ten iloraz nie ma granicy dla $ x\to \infty $. (Można wykazać, że każda liczba $ z\in [\frac 13, 3] $ jest granicą ciągu $ f'(x_n)/g'(x_n) $ dla pewnego ciągu $ (x_n) $, który dąży do nieskończoności).

Teraz omówimy kilka przykładów zastosowań reguły de l'Hospitala.

Przykład Zacznijmy od nieoznaczoności typu $ \frac 00 $. Obliczmy granicę $ \lim_{x\to 0^+} \frac{f(x)}{g(x)} $, gdzie $  f(x)=e^x-e^{-x}-x $ i $ g(x) =\sin x-2x $. Mamy $ f(0)=g(0)=0 $. Jest $ f'(x)=e^x+e^{-x}-1 $ i $ g'(x)=\cos x - 2 $, więc $ f'(0)/g'(0)= 1/(-1)=-1 $. Dlatego granica

\[ \lim_{x\to 0^+}\frac{e^x-e^{-x}-x}{\sin x-2x} \]

istnieje i jest równa $ -1. $ (Posłużyliśmy się Twierdzeniem~ [link]).

Przykład Obliczmy granicę $ \lim_{x\to 0^+} \frac{f(x)}{g(x)} $, gdzie $  f(x)=e^x-e^{-x}-x $ i $ g(x) =\sin x-x $. Mamy $ f(0)=g(0)=0 $. Jest $ f'(x)=e^x+e^{-x}-1 $ i $ g'(x)=\cos x - 1 $, więc wartości $ f'(0)/g'(0) $ nie można określić. Iloraz $ f'(x)/g'(x)\to -\infty $ dla $ x\to 0^+ $ ilatego granica

\[ \lim_{x\to 0^+}\frac{e^x-e^{-x}-x}{\sin x-x} \]

istnieje i jest równa $ -\infty. $ (Tym razem posłużyliśmy się Twierdzeniem~ [link] i Uwagą~ [link]).

Przykład Obliczmy granicę $ \lim_{x\to 0^+} \frac{f(x)}{g(x)} $, gdzie tym razem $  f(x)=e^x-e^{-x}-2x $ i $ g(x) =\sin x-x $. Łatwo sprawdzić, że

\[ f(0)=f'(0)=f''(0)=g(0)=g'(0)=g''(0)=0, \qquad\mbox{ale }g'''(0)= - \cos 0 = - 1. \]

Ponieważ $ f'''(0)=e^0+e^{-0}=2 $, więc na mocy Twierdzenia~ [link]

\[ \lim_{x\to 0^+}\frac{e^x-e^{-x}-2x}{\sin x-x}= \lim _{x\to 0^+} \frac{f(x)}{g(x)}=\frac{f'''(0)}{g'''(0)}=-2\, . \]

Przykład Ten przykład jest nieco bardziej skomplikowany. Obliczymy granicę

\[ \lim_{x\to 0^+}\frac{\bigl(1+x\bigr)^{1/x}-e}{x}\, . \]

Niech $ f(x)=\bigl(1+x\bigr)^{1/x}-e $ dla $ x>0 $. W punkcie $ x=0 $ kładziemy $ f(0)=0 $. Ponieważ $ \bigl(1+x\bigr)^{1/x}\to e $ dla $ x\to 0^+ $ (to można sprawdzić, obliczając granicę prawostronną w zerze funkcji $ \ln\bigl((1+x)^{1/x}\bigr)=\frac{\ln(1+x)}x $, a następnie korzystając z ciągłości funkcji wykładniczej), więc otrzymamy w ten sposób funkcję ciągłą $ f\colon [0,+\infty)\to \R $, różniczkowalną dla $ x>0 $.

Ponadto, niech $ g(x)=x $. Wtedy $ g(0)=0 $ i $ g'(x)=1 $ dla wszystkich $ x $. Aby zastosować Twierdzenie~ [link], obliczamy

\[ \begin{eqnarray} 	f'(x) & = &\left(\exp\Bigl(\frac{\ln(1+x)}x\Bigr)\right)' \nonumber \\ 	      & = & \exp\Bigl(\frac{\ln(1+x)}x\Bigr)\, \cdot \,   \left(\frac{1}{x(x+1)}-\frac{\ln(1+x)}{x^2}\right)\nonumber \\ & = & \bigl(1+x\bigr)^{1/x}  \cdot  \left(\frac{1}{x(x+1)}-\frac{\ln(1+x)}{x^2}\right)\, . \label{preexp1n}      \end{eqnarray} \]

Twierdzenie~ [link] pozwala teraz sprowadzić istnienie granicy $ f/g $ do istnienia granicy

\[ \begin{equation}  \label{preexp2n}                    \lim_{x\to 0^+} \left(\frac{1}{x(x+1)}-\frac{\ln(1+x)}{x^2}\right)= \lim_{x\to 0^+} \frac{x-(x+1)\ln(1+x)}{x^2(x+1)}\, .  \end{equation} \]

Niech teraz $ F(x)=x-(x+1)\ln(1+x) $, $ G(x)=x^2(x+1)=x^3+x^2 $. Mamy

\[ F'(x)=1-\ln(1+x)-1=-\ln(1+x), \qquad G'(x)= 3x^2+2x, \]

więc $ F(0)=G(0)=F'(0)=G'(0)=0 $, natomiast

\[ F''(x)=-\frac{1}{1+x}, \qquad G''(x)=6x +2, \]

tzn. $ F''(0)=-1 $, $ G''(0)=2 $ i na mocy Twierdzenia~ [link] otrzymujemy

\[ \lim_{x\to 0^+}\left(\frac{1}{x(x+1)}-\frac{\ln(1+x)}{x^2}\right)\  \stackrel{\eqref{preexp2n}}= \ \lim_{x\to 0^+} \frac{F(x)}{G(x)}\ \stackrel{\text{Tw.~\ref{regH2}}}=\ \frac{F''(0)}{G''(0)}= -\frac 12. \]

Podstawiając ten wynik do preexp1n i korzystając z równości $ \lim_{x\to 0+}(1+x)^{1/x}=e $, otrzymujemy teraz, stosując Twierdzenie~ [link],

\[ \lim_{x\to 0^+}\frac{\bigl(1+x\bigr)^{1/x}-e}{x}= \lim_{x\to 0^+}\frac{f(x)}{g(x)}=  \lim_{x\to 0^+}  \frac{f'(x)}{g'(x)}=  \lim_{x\to 0^+} {f'(x)} = -\frac{e}{2}\, . \]

Ponieważ $ -e/2<-1 $, więc otrzymujemy z ostatniego przykładu następujący wniosek.

Wniosek Dla wszystkich dostatecznie dużych $ n $ zachodzi nierówność

\[ 	\left(1+\frac 1n\right)^n < e-\frac 1n 	\]

Dowód:
Dla ciągu $ x_n=\frac 1n $, przy oznaczeniach z ostatniego przykładu, z pewnością zachodzi warunek: $ f(x_n)/g(x_n)<-1 $ dla wszystkich dostatecznie dużych $ n $ (posługujemy się definicją Heinego granicy funkcji i Stwierdzeniem~ [link]). Równoważnie,

\[ \left(1+\frac 1n\right)^n =f(x_n)+e<e-g(x_n)=e-\frac 1n\, , \]

a to jest teza wniosku.

Widzimy zatem, że ciąg $ a_n=(1+\frac 1n)^n $ jest zbieżny do swojej granicy, liczby $ e $, dość wolno: odstęp $ e-a_n $ jest większy od $ \frac 1n $. Do wszelkich celów związanych z praktycznymi obliczeniami używa się rozwinięcia funkcji wykładniczej w szereg, które poznaliśmy w Rozdziale~4.

Przykład Logarytm rośnie w nieskończoności wolniej, niż dowolna funkcja potęgowa o wykładniku dodatnim. Innymi słowy, dla każdego $ \omega>0 $ jest

\[ \lim_{x\to +\infty}\frac{\ln x}{x^\omega} = 0, \]

gdyż dla $ f(x)=\ln x $ i $ g(x)=x^\omega $ mamy

\[ \frac{f'(x)}{g'(x)}=\frac {1/x}{\omega x^{\omega-1}}= \frac{1}{\omega x^\omega}\to 0 \qquad\mbox{dla $x\to \infty$.} \]

Zauważmy: tym razem chodziło o nieoznaczoność typu $ \frac\infty\infty $ i skorzystaliśmy z Twierdzenia~ [link].

Zadanie Proszę samodzielnie wykazać, używając metody z ostatniego przykładu, że dla dowolnych liczb $ \omega>0 $ i $ a>1 $ jest

\[ 	\lim_{x\to +\infty}\frac{x^\omega}{a^x}=0\, . 	\]

Ile razy trzeba zastosować regułę de l'Hospitala, żeby uzyskać odpowiedź?

Z ostatniego zadania i ostatniego przykładu wynika ponownie morał, który skądinąd Czytelnik miał szansę poznać wcześniej, rozwiązując elementarnymi metodami wiele konkretnych zadań o granicach ciągów:

\begin{framed} \begin{quote}

Dla $ x\to +\infty $:

  1. Logarytm naturalny dąży do nieskończoności wolniej, niż dowolna funkcja potęgowa o wykładniku dodatnim;
  2. Funkcja wykładnicza dąży do nieskończoności szybciej, niż dowolny wielomian.

\end{quote} \end{framed}

Przykład (#) W ostatnim przykładzie wskażemy granicę, którą można względnie łatwo określić, stosując wzór Taylora, natomiast używanie reguły de l'Hospitala jest raczej skazane na porażkę. Obliczymy

\[ \lim_{x\to 0}\frac{(\arcsin x - \sin x)^{4/3}\ln (1/\cos x)} {\bigl(\exp(x-\sin x)-1\bigr)^2}\, . \]

Korzystając z rozwinięć Taylora-Maclaurina funkcji trygonometrycznych, $ \exp t $ i $ \ln (1+t) $, które poznaliśmy w poprzednim podrozdziale, możemy dla $ x\to 0 $ napisać

\[ \begin{gather*} \ln (1/\cos x)=-\ln \cos x = - \ln \left(1-\frac{x^2}2 + o(x^2)\right)= \frac{x^2}2+ o(x^2);\\  \exp(x-\sin x)-1 = \exp \left(x-\Bigl(x-\frac{x^3}{6}+ o(x^3)\Bigr)\right)-1 =\frac{x^3}{6}+ o(x^3)\, . \end{gather*} \]

Funkcja $ h(x)=\arcsin x $ ma pochodne

\[ \begin{gather*}      h'(x)=\frac{1}{\sqrt{1-x^2}}=(1-x^2)^{-1/2}, \\ h''(x)=-\frac 12  (1-x^2)^{-3/2}\cdot (-2x)= x (1-x^2)^{-3/2},\\ h'''(x)= (1-x^2)^{-3/2} - x\cdot \frac 32  (1-x^2)^{-5/2}\cdot(-2x)=(1-x^2)^{-3/2}+3x^2 (1-x^2)^{-5/2}. \end{gather*} \]

Zatem $ h(0)=h''(0)=0 $, $ h'(0)=h'''(0)=1 $, i ze wzoru Maclaurina z resztą Peano otrzymujemy

\[ \arcsin x = h(x) = x+ \frac{x^3}6+o(x^3)\qquad\mbox{dla $x\to 0$.} \]

Stąd, ponieważ $ \sin x=x- \frac{x^3}6+o(x^3) $ dla $ x\to 0 $,

\[ \arcsin x-\sin x = \frac{x^3}3 + o (x^3). \]

\begin{figure}[!t] \begin{center}  \includegraphics*[totalheight=7.5cm]{RGH1.png}</p>
<p>\end{center}

{\footnotesize\baselineskip 11pt Stosowanie reguły de l'Hospitala nie zawsze jest dobrym pomysłem. Trzecią pochodną funkcji

$$ (\arcsin x - \sin x)^{4/3} \cdot \ln\Bigl(\frac{1}{\cos x}\Bigr) $$

można obliczyć, ułatwiając sobie pracę: załączony zrzut ekranu pokazuje wynik obliczeń symbolicznych, wykonanych przez komputer. Czytelnik powinien sobie teraz wyobrazić, że przedstawiony wynik ma trzykrotnie zróżniczkować za pomocą kartki i ołówka. Obliczanie granicy z Przykładu~ [link] tylko przy użyciu reguły de l'Hospitala jest zajęciem dość absurdalnym.

}

\end{figure} Teraz możemy zakończyć rachunki. Otóż,

\[ \begin{eqnarray*} \frac{(\arcsin x - \sin x)^{4/3}\ln (1/\cos x)} {\bigl(\exp(x-\sin x)-1\bigr)^2}&=&\frac{\biggl(\displaystyle\frac{x^3}3+ o(x^3)\biggr)^{4/3}\cdot \biggl(\frac{x^2}2+ o(x^2)\biggr)} {\biggl(\displaystyle\frac{x^3}{6}+ o(x^3)\biggr)^2}\\ & =&    \frac{\biggl(\displaystyle\frac{1}3+ \frac{o(x^3)}{x^3}\biggr)^{4/3}\cdot \biggl(\frac{1}2+ \frac{o(x^2)}{x^2}\biggr)} {\biggl(\displaystyle\frac{1}{6}+ \frac{o(x^3)}{x^3}\biggr)^2} \, \qquad\mbox{dla $x\to 0$} \end{eqnarray*} \]

(pisząc drugą równość, po prostu skróciliśmy ułamek przez $ x^6 $). Dlatego

\[ \lim_{x\to 0}\frac{(\arcsin x - \sin x)^{4/3}\ln (1/\cos x)} {\bigl(\exp(x-\sin x)-1\bigr)^2}=  \frac{\biggl(\displaystyle\frac{1}3\biggr)^{4/3}\cdot \frac{1}2} {\biggl(\displaystyle\frac{1}{6}\biggr)^2} =  6^2\cdot 3^{-4/3} 2^{-1} = 2\cdot 3^{2/3}\, . \]

Proszę zauważyć: o wartości granicy wnioskowaliśmy, dzieląc licznik i mianownik przez $ x^6 $. To oznacza, że ważne były wartości szóstych pochodnych licznika i mianownika w zerze! Jednak różniczkując licznik i mianownik, otrzymujemy coraz bardziej skomplikowane wyrażenia; nic się wtedy nie upraszcza\ldots

Warto zatem pamiętać, że wzór Taylora jest znacznie bardziej uniwersalnym narzędziem niż reguła de l'Hospitala.

Przykład (#) Wskażemy funkcję, dla której prawa strona wzoru Taylora-Maclaurina zawsze składa się tylko z reszty; wszystkie inne składniki są zerami. Niech

\[ f(x)=\left\{ \begin{array}{ll} \exp(-1/x^2),\  & x\not= 0, \\ 0, & x=0.  \end{array}\right. \]

Łatwo sprawdzić, że $ f $ jest ciągła w zerze. Nietrudno też zauważyć, a następnie wykazać przez indukcję, że dla $ x\not=0 $ zachodzi wzór

\[ f^{(n)}(x) = \exp(-1/x^2)\cdot W_n(1/x), \]

gdzie $ W_n(t) $ jest pewnym wielomianem zmiennej $ t $ o współczynnikach całkowitych. Korzystając z tej własności, nietrudno udowodnić, że $ f^{(n)}(0)=0 $ dla wszystkich $ n\in \N\cup  \{0\} $. Istotnie, dla $ n=0 $ wynika to wprost z definicji $ f $, a jeśli wiemy już, że $ f^{(n)}(0)=0 $, to

\[ f^{(n+1)}(0)=\lim_{x\to 0}\frac{f^{(n)}(x)-f^{(n)}(0)}{x}=\lim_{x\to 0}\frac{\exp(-1/x^2)\cdot W_n(1/x)}{x} =\lim_{t\to\infty}\frac{tW_n(t)}{e^t}=0 \]

na mocy reguły de l'Hospitala. Dla tej funkcji używanie wzoru Taylora-Maclaurina do jej przybliżania nic nie daje!

Zbieżność jednostajna

Kilkakrotnie mieliśmy już do czynienia z granicami ciągów, zależnych od dodatkowego parametru, który mógł być liczbą rzeczywistą lub zespoloną. Przyjęliśmy np. definicję funkcji wykładniczej

\[ \exp(z)=\lim_{n\to\infty} \left(1+\frac zn \right)^n = \lim_{n\to\infty }\sum_{k=0}^n \frac{z^k}{k!}\, . \]

Dla każdego $ z\in \C $ wartość $ \exp(z) $ funkcji wykładniczej jest więc granicą wartości konkretnych wielomianów. Można zadać naturalne pytania: jeśli, ogólnie, $ f(z)=\lim_n f_n(z) $ dla wszystkich $ z $ z pewnego podzbioru prostej lub płaszczyzny, to które własności wszystkich funkcji $ f_n $ (ciągłość? różniczkowalność? \ldots ) dziedziczy graniczna funkcja $ f $? Czy dziedziczy je w każdym przypadku, czy może potrzebne są dodatkowe założenia?

W tym rozdziale postaramy się przynajmniej częściowo wyjaśnić te kwestie.

Definicje i przykłady

Niech $ f_n,f\colon X\to \R $, gdzie $ n=1,2,\ldots $, a $ X $ oznacza (na razie) zupełnie dowolny zbiór.

Definicja [zbieżność punktowa](#) Powiemy, że ciąg funkcji $ (f_n) $ jest zbieżny punktowo do $ f $ na zbiorze $ X $\/ wtedy i tylko wtedy, gdy dla każdego punktu $ x\in X $ zachodzi równość

\[ 	f(x)=\lim_{n\to\infty} f_n(x)\, . 	\]

Piszemy wtedy: $ f_n\to f $ na $ X $.

Definicja [zbieżność jednostajna] (#) Powiemy, że ciąg funkcji $ (f_n) $ jest zbieżny jednostajnie do $ f $ na zbiorze $ X $\/ wtedy i tylko wtedy, gdy zachodzi warunek: dla każdego $ \eps >0 $ istnieje $ n_0=n_0(\eps)\in \N $ takie, że dla wszystkich $ x\in X $ i wszystkich $ n>n_0 $ jest

\[ 		|f(x)-f_n(x)|<\eps\, . 		\]

Piszemy wtedy: $ f_n\rightrightarrows f $ na $ X $.

    Uwaga. Mówimy, że szereg funkcji $ \sum_{k=k_0}^\infty f_k(x) $ jest zbieżny punktowo (odpowiednio: jednostajnie) do funkcji $ f(x) $ na zbiorze $ X $ wtedy i tylko wtedy, gdy ciąg sum częściowych $ S_n=\sum_{k=k_0}^n f_k $ tego szeregu jest zbieżny do $ f $ punktowo (odpowiednio: jednostajnie) na zbiorze $ X $. Zwykle będziemy mieć do czynienia z sytuacją $ k_0=0 $ lub $ k_0=1 $.

Aby ostro uwidocznić różnicę między oboma pojęciami, zapiszemy Definicje~ [link] i ~ [link], używając kwantyfikatorów, potrzebnych do określenia granicy:  \begin{center} \begin{tabular}{ll}   %	 \textbf{Zbieżność punktowa $f_n\to f$ na $X$:} &  \framebox{\textcolor{red}{$\forall x\in X$}} \ \ $\forall \eps>0$\ \  \textcolor{blue}{$\exists n_0=n_0({x,\eps})>0$}\ \  $\forall n>n_0 $   \\ [10pt] \multicolumn{2}{c}{zachodzi warunek $\displaystyle |f(x)-f_n(x)|<\eps$.}\\[20pt] \textbf{Zbieżność jednostajna $f_n\rightrightarrows f$ na $X$:} &  $\forall \eps>0$\ \ {}      \textcolor{blue}{$\exists n_0= n_0(\eps)>0$}\ \ {}  \framebox{\textcolor{red}{$\forall x\in X$}}\ \ {} $\forall n>n_0\ \ {}  $   \\[10pt] \multicolumn{2}{c}{zachodzi warunek $\displaystyle |f(x)-f_n(x)|<\eps$.}\\[20pt] \end{tabular}  \end{center} Różnica polega na tym, że liczbę $ n_0 $ w pierwszym przypadku wybieramy, ustaliwszy wcześniej zarówno $ x\in X $, jak i $ \eps>0 $. Dlatego $ n_0 $ może zależeć zarówno od $ \eps $, jak i od punktu $ x\in X $. Natomiast w drugim przypadku najpierw ustalamy $ \eps>0 $, a potem wybieramy liczbę $ n_0 $ niezależną od $ x\in X $, tak, aby warunek $ |f_n(x)-f(x)|<\eps $ zachodził dla wszystkich $ n>n_0 $ i wszystkich $ x\in X $ jednocześnie. (Z podobnym rozróżnieniem spotkaliśmy się już, definiując ciągłość jednostajną.)

Zacznijmy od standardowego przykładu, wskazującego, że różnica między obiema definicjami jest istotna.

Przykład Niech $ X=[0,1]\subset \R $ i niech $ f_n\colon [0,1]\to\R $ będzie dana wzorem $ f_n(x)=x^n $. Wtedy

\[ 	\lim_{n\to \infty} f_n(x)=  \lim_{n\to \infty} x^n=f(x)\colon=\left\{ 	\begin{array}{ll} 		0, \quad &x\in [0,1),  \\ 		1,       & x=1. 	 \end{array}\right. 	\]

Innymi słowy, ciąg $ f_n $ jest zbieżny punktowo na $ [0,1] $ do funkcji $ f $. Nie jest to jednak zbieżność jednostajna: dla każdego $ n\in \N $ jest

\[ f_n(2^{-1/n})- f(2^{-1/n}) = \frac 12 - 0 = \frac 12\, , \]

a zatem warunek z definicji zbieżności jednostajnej z pewnością nie zachodzi dla żadnej liczby dodatniej $ \eps<\frac 12 $.

Przykład Jak poprzednio, niech $ X=[0,1]\subset \R $. Połóżmy

\[ f(x)= \exp(x), \qquad f_n(x)=  \sum_{k=0}^n \frac{x^k}{k!}, \qquad x\in [0,1], \ n=1,2,\ldots \]

Z Twierdzenia~ [link] wynika, że $ f_n\to f $ na $ [0,1] $, tzn. dla każdego $ x\in [0,1] $ szereg $ \sum_{k=0}^\infty x^k/k! $ jest zbieżny do $ \exp (x) $. Mamy ponadto

\[ \begin{eqnarray*} |f(x)-f_n(x)| & = & \sum_{k=n+1}^\infty \frac{x^k}{k!}  \le \sum_{k=n+1}^\infty \frac{1}{k!}  \\ & = & \frac{1}{(n+1)!}\left(1+ \frac 1{n+2}+\frac{1}{(n+2)(n+3)}+\cdots {}\, \right)  \\ & < &  \frac{1}{(n+1)!}\left(1+ \frac 1{n+2}+\frac{1}{(n+2)^2}+\cdots {}\, \right) = \frac{1}{(n+1)!}\cdot \frac{n+2}{n+1} < \frac{2}{n!}\, . \end{eqnarray*} \]

Uzyskaliśmy oszacowanie niezależne od liczby $ x\in [0,1] $. Jeśli $ \eps>0 $, to biorąc $ n_0=[2/\eps]+1>2/\eps $, otrzymujemy

\[ |f(x)-f_n(x)| < \frac{2}{n!}< \frac 2n < \frac 2{n_0} < \eps \qquad\mbox{dla wszystkich $x\in [0,1]$ i $n>n_0$.} \]

Dlatego tym razem $ f_n\rightrightarrows f $ na $ [0,1] $.

Zauważmy jeszcze, że do podobnego oszacowania można dojść, posługując się wzorem Taylora-MacLaurina z resztą Lagrange'a:

\[ \exp(x)=f(x)=   \sum_{j=0}^n \frac{f^{(j)}(0)}{j!} x^j \ + \  \frac{f^{({n+1})}(c_n)}{(n+1)!} x^{n+1} \qquad\mbox{dla pewnego $c_n\in (0,x)\subset (0,1)$,} \]

a zatem, ponieważ w tym przykładzie $ f^{(j)}\equiv f $ dla wszystkich $ j $,

\[ f(x)=f_n(x) + r_n, \qquad\mbox{gdzie} \qquad |r_n|=\frac{e^{c_n}}{(n+1)!} x^{n+1}\le \frac{e}{(n+1)!}\, , \]
Zadanie Wykazać, że ciąg funkcji

\[ 	f_n(z)=  \sum_{k=0}^n \frac{z^k}{k!} 	\]

jest zbieżny jednostajnie do $ f(z)=\exp z $

    {(\alph{enumi})}

  1. na każdym ograniczonym przedziale $ [-M,M]\subset \R $;
  2. na każdym kole domkniętym $ K_M=\{z\in \C\colon |z|\le M\subset \C $.

To, że w poprzednim przykładzie, a także w ostatnim zadaniu, mamy do czynienia ze zbiorami ograniczonymi, jest rzeczą istotną.

Przykład Na zbiorze $ X=\R $ ciąg

\[  	f_n(x)=  \sum_{k=0}^n \frac{x^k}{k!}, \qquad x\in \R, \ n=1,2,\ldots 	\]

nie jest zbieżny jednostajnie do funkcji wykładniczej. Udowodnimy to przez zaprzeczenie.

Załóżmy przez chwilę, że dla $ \eps=1>0 $ istnieje $ n_0 $ takie, że $ |f_n(x)-f(x)|<1=\eps $ dla wszystkich $ n>n_0 $ i $ x\in\R $. Ustalmy $ n>n_0 $. Dla $ x>0 $ jest

\[ |f(x)-f_n(x)|=\sum_{k=n+1}^\infty\frac{x^k}{k!}>\frac{x^{n+1}}{(n+1)!}\, . \]

Wstawiając do tego oszacowania $ x_n=\bigl((n+1)!\bigr)^{1/(n+1)} $, otrzymujemy

\[ |f(x_n)-f_n(x_n)| > \frac{x^{n+1}}{(n+1)!}= \frac{(n+1)!}{(n+1)!}=1, \]

to zaś jest sprzeczność, bo dla wszystkich $ x\in \R $, a więc także dla $ x=x_n $, powinna zgodnie z założeniem zachodzić nierówność przeciwna. Warunek z definicji jednostajnej zbieżności nie jest więc w tym przypadku spełniony. □

Norma jednostajna. Interpretacja geometryczna zbieżności jednostajnej

Nietrudno zauważyć, że Definicja~ [link] jest równoważna następującej:

\begin{quote} {\it Ciąg $ f_n\rightrightarrows f $ na $ X $ wtedy i tylko wtedy, gdy ciąg liczbowy

\[ d_n\equiv d(f_n,f)\colon=\sup_{x\in X} |f_n(x) - f(x)| \]

jest zbieżny do zera dla $ n\to \infty $. } \end{quote} Wprowadza się czasem oznaczenie

\[ \|g\|_{\infty,X} = \sup_{x\in X} |g(x)| \]

(indeks $ X $ opuszczamy, gdy wiadomo dobrze, o jaki zbiór chodzi). Liczbę $ \|g\|_{\infty,X} $ nazywamy normą jednostajną funkcji $ g $ (na zbiorze $ X $). (Oczywiście $ \|g\|_{\infty,X}<\infty $ wtedy i tylko wtedy, gdy $ g $ jest funkcją ograniczoną. ) Przy takich oznaczeniach,

$$d_n\equiv d(f_n,f)=\|f_n-f\|_{\infty,X}.$$

Tę liczbę można traktować jak - abstrakcyjnie zdefiniowaną! - odległość funkcji $ f_n $ i $ f $. Jeśli bowiem $ Y=\R^X $ jest zbiorem wszystkich funkcji $ f\colon X\to \R $, to funkcja

\[ Y\times Y\ni (f,g)\longmapsto d(f,g)=\|f-g\|_{\infty,X} \in \R_+\cup\{0\} \]

spełnia trzy naturalne warunki, które spełnia np. zwykła odległość punktów na płaszczyźnie czy w przestrzeni:

  1. Dla wszystkich $ f,g\in Y $ warunek $ d(f,g)=0 $ zachodzi wtedy i tylko wtedy, gdy $ f=g $;
  2. Dla wszystkich $ f,g\in Y $ jest $ d(f,g)= d(g,f) $.
  3. Dla wszystkich $ f,g,h\in Y $ zachodzi nierówność trójkąta
    \[                                          d(f,g)\le d(f,h)+d(h,g)\, . \]

Pierwsze dwa warunki są oczywiste. Trzeci wynika z nierówności trójkąta w $ \R $ i definicji kresu górnego: dla każdego $ x\in X $ jest

\[ \begin{eqnarray*} |f(x)-g(x)| & \le & |f(x)-h(x)|+|h(x)-g(x)|\\ &\le & \sup_{t\in X} |f(t)-h(t)|+  \sup_{t\in X} |h(t)-g(t)| = d(f,h)+d(h,g); \end{eqnarray*} \]

biorąc teraz supremum lewej strony względem $ x\in X $, otrzymujemy

\[ d(f,g)=\sup_{x\in X} |f(x)-g(x)|\le d(f,h)+d(h,g)\, . \]

Mówi się krótko, że $ d $ jest metryką\/ na zbiorze $ Y $. Z ogólnym pojęciem przestrzeni metrycznej i metryki Czytelnik zapozna się bliżej na II roku studiów, na zajęciach z Topologii i z Analizy. Podkreślmy jednak już teraz dwie rzeczy:

  1. Zbieżność jednostajna $ f_n\rightrightarrows f $ na $ X $ jest równoważna temu, że odległość
    \[ 	d(f_n,f)=\|f_n-f\|_{\infty,X} \to 0 \qquad\mbox{dla $n\to\infty$.} 	\]

    Traktujemy zatem funkcje tak jak punkty zbioru $ Y=\R^X $; zbieżność jednostajna $ f_n\rightrightarrows f $ to zbieżność (odpowiednio określonej) odległości punktów $ f_n $ i $ f $ w zbiorze $ Y=\R^X $ do zera.

  2. Warunek
    \[ d(f,g)=\|f-g\|_{\infty,X} =\sup_{x\in X}|f(x)-g(x)|\le \eps \]

    jest oczywiście równoważny następującemu:

    \[ f(x)-\eps \le g(x)\le f(x)+\eps \qquad\mbox{dla wszystkich $x\in X$.} \]

    Oznacza to, że $ d(f,g)\le \eps $, gdy wykres $ g $ zawiera się w krzywoliniowym pasku o wysokości $ 2\eps $, narysowanym wokół wykresu funkcji $ f $ (patrz rysunek).

\begin{figure}[!t]

\includegraphics*[totalheight=9.5cm]{zbjedn1.png}

{\footnotesize\baselineskip 11pt Warunek $ d(f,g)=\|f-g\|_\infty<\eps $ oznacza, że wykres $ g $ mieści się w ``pasku o wysokości $ 2\eps $'' wokół wykresu $ f $.

}

\end{figure}

\subsubsection*{Ciągłość granicy jednostajnie zbieżnego ciągu funkcyjnego} Zakończymy ten wstępny podrozdział prostym, ale ważnym twierdzeniem, które wyjaśnia jeden z powodów wprowadzenia pojęcia jednostajnej zbieżności ciągów funkcyjnych.

Twierdzenie (#) Załóżmy, że $ P\subset \R $ jest dowolnym przedziałem. Niech $ f_n\colon P\to \R $ będą funkcjami ciągłymi na $ P $. Jeśli $ f_n\rightrightarrows f $ na $ P $, to $ f $ jest ciągła na $ P $.
Dowód: Ustalmy $ x\in P $ oraz dowolną liczbę $ \eps>0 $, a także liczbę $ \eta>0 $, którą dobierzemy do $ \eps $ pod koniec dowodu. Wskażemy liczbę $ \delta >0 $ taką, że

\[ \begin{equation} \label{cel-jzb} |f(x)-f(y)|<\eps \qquad\mbox{dla $y\in P$, $|y-x|<\delta$.} \end{equation} \]

(Na mocy Stwierdzenia~ [link], wyniknie stąd ciągłość $ f $ w punkcie $ x\in P $.)

Ponieważ $ f_n\rightrightarrows f $, więc istnieje $ n_0\in \N $ takie, że $ |f_n(t)-f(t)|<\eta $ dla wszystkich $ t\in P $. Ustalmy jakąkolwiek liczbę $ n>n_0 $. Z nierówności trójkąta,

\[ \begin{eqnarray*} |f(x)-f(y)| & \le & |f(x)-f_n(x)|+|f_n(x)-f_n(y)|+|f_n(y)-f(y)|\\ & < & \eta +  |f_n(x)-f_n(y)|+   \eta = 2\eta +  |f_n(x)-f_n(y)|\, . \end{eqnarray*} \]

Funkcja $ f_n  $ jest ciągła w $ x\in P $. Istnieje zatem liczba $ \delta>0 $ taka, że $ |f_n(x)-f_n(y)|<\eta $ dla wszystkich $ y\in P $, spełniających nierówność $ |x-y|<\delta $. Dlatego

\[ |f(x)-f(y)| <   2\eta +  |f_n(x)-f_n(y)|< 3\eta\, . \]

dla $ y\in P $ takich, że $ |y-x|<\delta $. Wybierając $ \eta=\frac \eps 3 $, otrzymujemy warunek cel-jzb i kończymy dowód. □

Uwaga Udowodniliśmy w istocie nieco więcej: jeśli $ f_n\rightrightarrows f $ na przedziale $ P $ i wszystkie funkcje $ f_n $ są ciągłe w $ x_0\in P $, to $ f $ jest ciągła w $ x_0 $.
Uwaga Omówiony wcześniej przykład ciągu $ f_n(x)=x^n $, zbieżnego na $ [0,1] $ punktowo (ale nie jednostajnie!) do funkcji $ f=\chi_{[0,1)} $ nieciągłej w $ x_0=1 $ wskazuje, że założenie jednostajnej zbieżności jest w tym twierdzeniu istotne.
Uwaga Może się zdarzyć, że ciąg funkcji $ f_n\colon \R\to \R $ jest zbieżny punktowo (ale nie jednostajnie) do funkcji ciągłej $ f\colon \R\to\R $. Oto przykład takiej sytuacji: $ f(x)=1 $ jest funkcją stałą. Wybieramy $ g\colon \R\to\R $ ciągłą i taką, że

\[ 	g(x)=0 \quad\mbox{dla $x\in (-\infty,-1]\cup [1,\infty)$},   \qquad  g(x)>0 \quad\mbox{dla $x\in (-1,1)$}, \qquad \sup g=1\, .   	\]

Następnie, kładziemy $ f_n(x)=1+g(x-n) $ dla $ x\in \R $ i $ n\in \N $. Wykresy funkcji $ f_n $ wyglądają jak garby, przesuwające się w równym tempie w stronę $ +\infty $ (patrz rysunek). Przy ustalonym $ x\in \R $ mamy po prostu $ f_n(x)=1=f(x) $ dla $ n>x+1 $. Nietrudno sprawdzić, że w tej sytuacji oczywiście $ f_n\to f $ na $ \R $, ale $ \|f_n-f\|_{\infty,\R}=\sup g=1 $, czyli $ f_n\not\rightrightarrows f $.

\begin{figure}[!t]

\includegraphics*[totalheight=4.65cm]{Garbik.png}

{\footnotesize\baselineskip 11pt ``Wędrujący garb'': ciąg funkcji $ g_n\to f $ punktowo, ale $ d(g_n,f)=\|g_n-f\|_{\infty}=\mathrm{const}>0 $ dla wszystkich $ n $.

}

\end{figure}

Uwaga Tak samo definiuje się zbieżność jednostajną ciągów funkcji $ f_n\colon X\to \C $ (moduł oznacza wtedy wszędzie po prostu moduł liczby zespolonej). Prawdziwe jest następujące twierdzenie: \begin{quote} Jeśli ciąg funkcji ciągłych $ f_n\colon C\subset X\to \C $ jest zbieżny jednostajnie do funkcji $ f\colon X\to \C $, to $ f $ jest ciągła na $ X $. \end{quote} Dowód jest taki sam, jak w przypadku rzeczywistym.

Najprostsze kryteria zbieżności jednostajnej

Stwierdzenie (#) Niech $ f_n\colon X\to \R $ dla $ n=1,2,\ldots $. Następujące warunki są równoważne:

    {(\alph{enumi})}

  1. Ciąg $ (f_n) $ jest zbieżny jednostajnie na $ X $ do pewnej funkcji $ f\colon X\to \R $;
  2. Ciąg $ (f_n) $ spełnia jednostajny warunek Cauchy'ego: dla każdego $ \eps>0 $ istnieje $ n_0\in \N $ takie, że dla wszystkich $ m,n>n_0 $ i wszystkich $ x\in X $ zachodzi nierówność
    $$|f_n(x)-f_m(x)|<\eps\, .$$
Dowód: Całe rozumowanie polega na zastosowaniu warunku Cauchy'ego dla ciągów liczbowych (patrz Twierdzenie~ [link]) i uważnej lekturze definicji. Oto szczegóły.

  Część I. (a) $ \Rightarrow $ (b). Ustalmy liczbę $ \eps>0 $. Ponieważ $ f_n\rightrightarrows f $ na $ X $, więc istnieje $ n_0\in N $ takie, że $ |f_n(x)-f(x)|<\frac\eps 2 $ dla wszystkich $ n>n_0 $ i $ x\in X $. Zatem, dla wszystkich $ m,n>n_0 $ i wszystkich $ x\in X $ otrzymujemy z nierówności trójkąta

\[ |f_n(x)-f_m(x)|\le |f_n(x)-f(x)|+|f(x)-f_m(x)|< \frac\eps 2+\frac \eps 2= \eps\, . \]

  Część I. (b) $ \Rightarrow $ (a). Załóżmy, że $ (f_n) $ spełnia jednostajny warunek Cauchy'ego $ b $. Wtedy dla każdego $ x\in X $ ciąg liczbowy $ (f_n(x))_{n=1,2,\ldots} $ spełnia warunek Cauchy'ego, a więc na mocy Twierdzenia~ [link] ma granicę w $ \R $. Oznaczmy tę granicę $ f(x) $. Ustalmy liczbę $ \eps>0 $ i zastosujmy (b) do liczby $ \eps/2 $: istnieje takie $ n_0 $ (zależne tylko od $ \eps<img class="teximage" src="/sites/default/files/tex/8c806612206b3e6835f471e661e9bf5c21bc70a9.png" alt="833d82de4bc7d51d007f78566899ab2f:4061:" />m,n>n_0 $ i $ x\in X $ jest $  |f_n(x)-f_m(x)|<\frac\eps 2 \, .  $ Ustalmy teraz liczbę $ n $ i przejdźmy do granicy $ m\to \infty $. Ponieważ w granicy zachowują się nierówności nieostre, więc otrzymamy

\[ |f_n(x)-f(x)|\le \frac\eps 2 <\eps\, \qquad\mbox{dla wszystkich $n>n_0$ i $x\in X$.} \]

Zatem istotnie $ f_n\rightrightarrows f $ na $ X $. □

Stwierdzenie [kryterium Weierstrassa] (#) Niech $ f_n\colon X\to \R $ dla $ n=1,2,\ldots $. Jeśli

\[ 	|f_n(x)|\le a_n \quad\mbox{dla $n\in \N$,} 	\]

a szereg liczbowy $ \sum_{n=1}^\infty a_n $ jest zbieżny, to wówczas szeregi funkcyjne

$$\sum_{n=1}^\infty f_n(x)\qquad\mbox{oraz}\qquad \sum_{n=1}^\infty |f_n(x)|$$

są zbieżne jednostajnie na $ X $.

    Uwaga terminologiczna. W takiej sytuacji mówimy, że szereg $ \sum f_n(x) $ jest zbieżny jednostajnie i bezwzględnie.

Dowód: Niech

\[ S_m(x)= \sum_{n=1}^m |f_n(x)| \]

oznacza $ m $-tą sumę częściową szeregu $ \sum |f_n| $. Z założenia $ |f_n(x)|\le a_n $, a więc gdy $ m,k\in \N $ i~$ m>k $, to

\[ |S_{m}(x)-S_{k}(x)|=S_{m}(x)-S_{k}(x)\le a_{k+1}+a_{k+2}+\cdots+a_m\, \qquad\mbox{dla wszystkich $x\in X$.} \]

Szereg liczbowy zbieżny $ \sum a_n $ spełnia warunek Cauchy'ego dla szeregów, patrz Stwierdzenie~ [link]. Zatem dla ustalonego $ \eps>0 $ istnieje $ n_0=n_0(\eps) $ takie, że

\[ a_{k+1}+a_{k+2}+\cdots+a_m=|a_{k+1}+a_{k+2}+\cdots+a_m|<\eps  \]

dla wszystkich $ m>k>n_0 $. Stąd

\[ |S_{m}(x)-S_{k}(x)|\le a_{k+1}+a_{k+2}+\cdots+a_m<\eps\, \qquad\mbox{dla wszystkich $x\in X$ i $m>k>n_0$.} \]

Ciąg funkcyjny $ (S_m) $ spełnia więc jednostajny warunek Cauchy'ego na $ X $, tzn. na mocy poprzedniego stwierdzenia jest jednostajnie zbieżny. Z definicji, oznacza to zbieżność jednostajną szeregu $ \sum_{n=1}^\infty |f_n(x)| $ na zbiorze $ X $.

Dowód jednostajnej zbieżności szeregu $ \sum_{n=1}^\infty f_n(x) $ jest analogiczny. Trzeba tylko zauważyć, że dla $ m>k $ jest

\[ \biggl|\sum_{n=1}^m f_n(x) - \sum_{n=1}^k f_n(x)\biggr| =  \biggl|\sum_{n=k+1}^m f_n(x) \biggr| \le \sum_{n=k+1}^m |f_n(x)| \le  a_{k+1}+a_{k+2}+\cdots+a_m\, . \]

Łatwo stąd (podobnie, jak w pierwszej części dowodu) wywnioskować, że ciąg sum częściowych szeregu $ \sum f_n $ spełnia jednostajny warunek Cauchy'ego na $ X $. □

Uwaga Oba stwierdzenia przenoszą się bez zmian na przypadek funkcji o wartościach zespolonych.

Twierdzenia Weierstrassa i Diniego

Oznaczenia. Niech $ P\subset \R $. W dalszym ciągu symbolem $ C(P) $ będziemy oznaczali zbiór wszystkich funkcji ciągłych $ f\colon P\to \R $.

  Udowodnimy teraz fundamentalne twierdzenie, które ma liczne zastosowania w Analizie Matematycznej. Niektóre z nich poznamy wkrótce.

Twierdzenie [Weierstrass] Jeśli $ a,b\in \R $ i $ f\in C([a,b]) $, to istnieje ciąg wielomianów $ P_n $ o współczynnikach rzeczywistych taki, że $ P_n\rightrightarrows f $ na $ [a,b] $. (#)

Zauważmy najpierw, że wystarczy udowodnić twierdzenie w szczególnym przypadku: dla $ a=0 $ i $ b=1 $. Dla innych przedziałów uzyskamy wtedy tezę, składając odpowiednie funkcje z funkcjami liniowymi

\[ [0,1]\ni t\longmapsto x= a+t(b-a)\in [a,b]\, . \]

Istotnie, przypuśćmy, że dla dowolnej $ f\in C([0,1]) $ istnieją wielomiany $ P_n $ takie, że $ P_n\rightrightarrows f $ na $ [0,1] $. Dla ustalonej $ g\in C([a,b]) $ niech $ f(t)=g\bigl(a+t(b-a)\bigr) $, gdzie $ t\in [0,1] $; $ f $ jest funkcją ciągłą na $ [0,1] $. Wybierzmy ciąg wielomianów $ P_n\rightrightarrows f $ na $ [0,1] $ i połóżmy

\[ Q_n(x):= P_n\Bigl(\frac{x-a}{b-a}\Bigr)    \qquad \mbox{dla $x\in [a,b]$.} \]

Wtedy $ Q_n $ są wielomianami i $ Q_n\rightrightarrows g $ na $ [a,b] $, gdyż $ \|Q_n-g\|_{\infty,[a,b]}=\|P_n-f\|_{\infty,[0,1]} $.

Dlatego ograniczymy się do dowodu następującego twierdzenia.

Twierdzenie [S.N. Bernstein] Niech $ f\in C\bigl([0,1]\bigr) $. Połóżmy

\[ 	B_n(f)(x)=\sum_{k=0}^n f\Bigl(\frac kn\Bigr)\binom nk x^k(1-x)^{n-k} \, , \qquad x\in [0,1], \quad n=1,2,\ldots  	\]

Wówczas $ B_n(f)\rightrightarrows f $ na $ [0,1] $.

    Uwaga terminologiczna. Wielomian $ B_n(f) $ nazywa się $ n $-tym wielomianem Bernsteina funkcji $ f $.

Dowód: Najpierw udowodnimy trzy pomocnicze fakty:

    {(\alph{enumi})}

  1. Jeśli $ f_1(x)\equiv 1 $ na $ [0,1] $, to $ B_n(f_1)\equiv 1 $ na $ [0,1] $ dla każdego $ n\in \N $.
  2. Jeśli $ f_2(x)=x $ na $ [0,1] $, to $ B_n(f_2)(x)=x $ na $ [0,1] $ dla każdego $ n\in \N $.
  3. Jeśli $ f_3(x)=x^2 $ na $ [0,1] $, to $ B_n(f_3)(x)=x^2-\frac{x^2}{n}+\frac{x}{n} $ na $ [0,1] $ dla każdego $ n\in \N $.

Własność (a) wynika natychmiast z dwumianu Newtona. Istotnie, jeśli $ f_1\equiv 1 $, to

\[ B_n(f_1)(x)= \sum_{k=0}^n \binom nk x^k(1-x)^{n-k} = \bigl(x+(1-x)\bigr)^n = 1^n = 1\, . \]

Dla dowodu (b) zauważmy, że $ \frac kn\cdot  \binom nk= \frac{(n-1)!}{(k-1)!(n-k)!}=\binom{n-1}{k-1} $ dla $ k\ge 1 $ (a dla $ k=0 $ lewa strona jest zerem). Dlatego dla funkcji $ f_2(x)=x $ otrzymujemy

\[ \begin{eqnarray*} B_n(f_2)(x) & = & \sum_{k=0}^n \frac kn \binom nk x^k(1-x)^{n-k}=    \sum_{k=1}^n \frac kn \binom nk x^k(1-x)^{n-k}\\ & = &\sum_{k=1}^n \binom {n-1}{k-1} x^k(1-x)^{n-k}  = x \sum_{k=1}^n \frac kn \binom nk x^{k-1}(1-x)^{n-1-(k-1)} \\ & = &x \sum_{j=0}^{n-1} \binom {n-1}{j} x^j(1-x)^{n-1-j}\ = \ x.  \end{eqnarray*} \]

(Przechodząc do trzeciej linijki, podstawiliśmy $ j=k-1 $). Aby sprawdzić (c), piszemy

\[ \frac{k^2}{n^2}=\frac{k^2-k}{n^2}+\frac{k}{n^2}= \frac{k(k-1)}{n(n-1)}\cdot \frac{n-1}{n} + \frac{k}n \cdot \frac 1n \]

i rachujemy

\[ \begin{eqnarray*} B_n(f_3)(x) & = & \sum_{k=0}^n \frac {k^2}{n^2} \binom nk x^k(1-x)^{n-k}  \\ & = & \frac{n-1}{n} \sum_{k=2}^n \frac {k(k-1)}{n(n-1)} \binom nk x^k(1-x)^{n-k} + \frac 1n  \sum_{k=1}^n \frac kn \binom nk x^k(1-x)^{n-k}   \\   & = & \frac{n-1}{n} \sum_{k=2}^n  \binom {n-2}{k-2} x^{k-2}\cdot x^2\cdot (1-x)^{n-k} + \frac 1n B_n(f_2)(x)\\   & = & \frac{n-1}{n} x^2 \underbrace{\sum_{j=0}^{n-2} \binom {n-2}{j} x^{j}\cdot (1-x)^{n-2-j}}_{\text{= 1, z dwumianu Newtona}} + \frac x n = x^2-\frac{x^2}{n}+\frac{x}{n}\, . \end{eqnarray*} \]

Teraz przejdziemy do zasadniczej części dowodu. Ustalmy $ \eps>0 $. Ponieważ $ f $ jest jednostajnie ciągła na $ [0,1] $, więc istnieje $ \delta>0 $ takie, że $ |f(x)-f(\frac kn)|<\frac \eps 2 $, gdy $ |x-\frac{k}{n}|<\delta $. Różnicę między $ f $ i jej $ n $-tym wielomianem Bernsteina szacujemy następująco:

\[ \begin{eqnarray}  	|f(x)-B_n(f)(x)| &= &  \biggl|f(x)-\sum_{k=0}^n f\Bigl(\frac kn\Bigr)\binom nk x^k(1-x)^{n-k}\biggr|   \nonumber  \\      &= &  \biggl|\sum_{k=0}^n \biggl(f(x)- f\Bigl(\frac kn\Bigr)\biggr)\binom nk x^k(1-x)^{n-k}\biggr|   \label{Bnf-S1S2}\\ & \le & \sum_{k=0}^n \biggl|f(x)- f\Bigl(\frac kn\Bigr)\biggr|\binom nk x^k(1-x)^{n-k}  =: S_1(n) + S_2(n)\, ,   \nonumber \end{eqnarray} \]

gdzie

\[ S_i(n)=\sum_{k\in A_i}  \biggl|f(x)- f\Bigl(\frac kn\Bigr)\biggr|\binom nk x^k(1-x)^{n-k}, \qquad i=1,2, \]

dla

\[ A_1=\Bigl\{k=0,1,\ldots, n\colon \Bigl|x-\frac kn\Bigr|<\delta\Bigr\}  \quad\mbox{oraz}\quad A_2=\Bigl\{k=0,1,\ldots, n\colon \Bigl|x-\frac kn\Bigr|\ge\delta\Bigr\}\, . \]

(po prostu dzielimy całą sumę na dwie inne, odpowiednio dobrane). Oszacowanie sumy $ S_1(n) $ jest łatwe: gdy $ |\frac kn-x|<\delta $, to $ |f(x)-f(\frac kn)|<\frac\eps 2 $ i dlatego

\[ \begin{equation} 	  S_1(n)\le   \sum_{k\in A_1} \frac\eps 2 \cdot \binom nk x^k(1-x)^{n-k} \le \frac\eps 2 \sum_{k=0}^n        \binom nk x^k(1-x)^{n-k}\ \stackrel{\text{(a)}}= \ \frac\eps 2\, . \label{Bnf-oszacS1} \end{equation} \]

Kluczowy krok to szacowanie sumy $ S_2 $. Niech $ M=\sup_{[0,1]} |f| $. Zauważmy, że

\[ \delta\le  \Bigl|x-\frac kn\Bigr|, \qquad\mbox{stąd zaś}\qquad 1\le\left(\frac{k-nx}{n\delta}\right)^2\, \quad\mbox{dla $k\in A_2$.} \]

Ponadto, oczywiście $ |f(x)-f(\frac kn)|\le |f(x)|+|f(\frac kn)|\le 2M=2\sup |f| $. Dlatego

\[ \begin{eqnarray*} S_2(n)& \le & 2M \sum_{k\in A_2} \left(\frac{k-nx}{n\delta}\right)^2  \binom nk x^k(1-x)^{n-k} \\ & \le &  \frac{2M}{\delta^2}\sum_{k=0}^n \left(\frac{k^2}{n^2}-2x\frac{k}{n}+x^2\right) \binom nk x^k(1-x)^{n-k} = S_3(n) \end{eqnarray*} \]

(zwiększamy zakres sumowania z $ k\in A_2 $ do wszystkich $ 0\le k\le n $). Ostatnią sumę można łatwo wyrazić przez wielomiany Bernsteina funkcji $ f_1(x)=1 $, $ f_2(x)=x $ i $ f_3(x)=x^2 $, a następnie obliczyć, korzystając z pomocniczych faktów (a)-(c); prowadzi to do oszacowania

\[ \begin{eqnarray}   S_2(n)\le S_3(n) & = &\frac{2M}{\delta^2}\Bigl(B_n(f_3)(x)-2x\cdot B_n(f_2)(x)+ x^2 B_n(f_1)(x)\Bigr)  \nonumber\\ & = & \frac{2M}{\delta^2} \Bigl(  x^2-\frac{x^2}{n}+\frac{x}{n}-2x^2 + x^2\Bigr)\nonumber \\ &= &     \frac{2M}{\delta^2}\cdot  \frac{x(1-x)}{n} \le \frac{M}{2n\delta^2}, \label{Bnf-oszacS2} \end{eqnarray} \]

gdyż $ x(1-x)\le \frac 14 $ na $ \R $.

Wstawiając oszacowania Bnf-oszacS1 i Bnf-oszacS2 do Bnf-S1S2, otrzymujemy

\[  |f(x)-B_n(f)(x)|\le \frac\eps 2 +   \frac{M}{2n\delta^2} < \eps \qquad\mbox{dla wszystkich $x\in [0,1]$} \]

i dla $ n>n_0:=\bigl[M/(\eps\delta^2)\bigr]+1 $. To kończy dowód. □

Jedno z zastosowań twierdzenia Weierstrassa zobaczymy nieco później w tym rozdziale, w dowodzie twierdzenia, orzekającego, że każda funkcja ciągła $ f\colon P\to \R $ na przedziale $ P\subset \R $ jest pochodną pewnej funkcji $ F\colon P\to \R $. Jest to jeden z podstawowych faktów, wykorzystywanych w rachunku całkowym.

Podamy teraz dwa niezbyt trudne twierdzenia, ilustrujące związek zbieżności jednostajnej z monotonicznością.

Twierdzenie [pierwsze twierdzenie Dini'ego] Przypuśćmy, że funkcje $ f, f_n\colon K\to\R $, gdzie $ n\in \N $ i $ K\subset \R $ jest zbiorem zwartym, są ciągłe. Jeśli $ f_n\to f $ punktowo na $ K $, a ponadto

\[ 	f_1\le f_2 \le f_3 \le \ldots \le f_n\le \ldots \qquad\mbox{na } K, 	\]

to wówczas $ f_n\rightrightarrows f $ na $ K $

Dowód: Przypuśćmy, że zbieżność $ f_n\to f $ nie jest jednostajna. Istnieje wtedy $ \eps>0 $ takie, że dla każdego $ n\in \N $ znajdziemy $ m>n $ i punkt $ x_m\in K $, dla których

\[ \begin{equation} 	\label{din1-aa}           	|f(x_m)-f_m(x_m)|=f(x_m)-f(x_m) \ge \eps >0\, .     \end{equation} \]

Opuszczając moduł, skorzystaliśmy z założenia o monotoniczności ciągu $ (f_m) $.

Zbiór $ K $ jest zwarty, więc ciąg $ (x_m) $ ma podciąg zbieżny do pewnego $ x\in K $. Przechodząc do tego podciągu, możemy bez zmniejszenia ogólności rozważań założyć, że po prostu $ x_m\to x $ dla $ m\to \infty $. Weźmy teraz dowolne $ k\in \N $. Dla $ m>k $ zachodzą nierówności

\[ f_k(x_m)\le f_m(x_m)\stackrel{\eqref{din1-aa}}\le f(x_m)-\eps   \]

i dlatego, dzięki ciągłości $ f $,

\[ f_k (x)=\lim_{m\to\infty} f_k(x_m) \le \lim_{m\to\infty } f(x_m)-\eps = f(x)- \eps. \]

To jednak przeczy punktowej zbieżności $ f_k\to f $: granica ciągu liczbowego $ (f_k(x)) $ powinna być równa $ f(x) $. □

Twierdzenie [drugie twierdzenie Dini'ego] Jeśli funkcje $ f_n\colon [a,b]\to \R $ są niemalejące i ciąg $ (f_n) $ jest punktowo zbieżny na $ [a,b] $ do funkcji ciągłej $ f $, to wówczas $ f_n\rightrightarrows f $.
Dowód: Niech $ \eps>0 $ i $ \eta>0 $. Ponieważ na mocy Twierdzenia~ [link] $ f $ jest jednostajnie ciągła na $ [a,b] $, więc istnieje $ \delta>0 $ takie, że $ |f(x)-f(y)|<\eta $, gdy $ |x-y|<\delta $. Podzielmy $ [a,b] $ na $ N $ przedziałów o równych długościach $ \frac{b-a}N<\delta $. Niech $ x_0,x_1,\ldots, x_N $ oznaczają końce tych przedziałów. Wybierzmy teraz $ n_0 $ tak, aby

\[ \begin{equation} 	\label{kpkt}    	|f_n(x_k)-f(x_k)|<\eta \qquad \mbox{dla wszystkich $n>n_0$ i $k=0,1,\ldots, N$.}     \end{equation} \]

Niech $ x\in [a,b] $. Wtedy $ x\in [x_k,x_{k+1}] $ dla pewnego $ k=0,1,\ldots, N-1 $. Funkcja $ f $ jest niemalejąca jako ciągu granica funkcji niemalejących, więc dzięki kpkt otrzymujemy dla $ n>n_0 $ nierówności

\[ \underbrace{f(x_k)\le f(x)\le f(x_{k+1})}_{\text{monotoniczność \mbox{$f$}}}, \qquad  f(x_k)-\eta\stackrel{\eqref{kpkt}}<  \underbrace{f_n(x_k)\le f_n(x)\le f_n(x_{k+1})}_{\text{monotoniczność \mbox{$f_n$}}} \stackrel{\eqref{kpkt}}<f(x_{k+1})+\eta\, .  \]

Stąd już wynika, że zarówno $ f(x) $, jak i $ f_n(x) $, należą do przedziału $ I $ o końcach $ f(x_k)-\eta $ i $ f(x_{k+1})+\eta $. Odstępy między punktami $ x_k $ są mniejsze od $ \delta $, więc dzięki doborowi $ \delta $ do $ \eta $ długość przedziału $ I $ jest mniejsza od $ 3\eta $. Biorąc teraz $ \eta = \eps/3 $ otrzymujemy

\[ |f(x)-f_n(x)|<3\eta =\eps \qquad\mbox{dla wszystkich $x\in [a,b]$ i $n>n_0$,} \]

co kończy dowód. □

Zauważmy, że w dowodzie nie było potrzebne założenie o ciągłości $ f_n $. Istotna jest oczywiście ciągłość funkcji $ f $ oraz monotoniczność wszystkich rozpatrywanych funkcji.

Twierdzenie o różniczkowaniu ciągów funkcyjnych

Udowodnimy teraz ważne twierdzenie, które w wielu sytuacjach pozwala wnioskować, że funkcja, określona jako granica ciągu (lub suma szeregu) funkcyjnego, ma pochodną.

Przypadek rzeczywisty

Twierdzenie (#) Załóżmy, że $ f_n\colon \R\supset [a,b]\to \R $, gdzie $ n=1,2,\ldots  $, są różniczkowalne. Jeśli ciąg $ f_n'\rightrightarrows g $ na $ [a,b] $, a ponadto istnieje taki punkt $ x_0\in [a,b] $, że ciąg $ \bigl(f_n(x_0)\bigr) $ jest zbieżny, to wówczas:

    {(\alph{enumi})}

  1. Ciąg $ f_n $ jest zbieżny jednostajnie do pewnej funkcji ciągłej $ f\colon [a,b]\to \R $;
  2. Funkcja $ f $ jest różniczkowalna na $ [a,b] $ i $ f'=g $.
Dowód: Najpierw sprawdzimy, że ciąg $ (f_n) $ spełnia na przedziale $ [a,b] $ jednostajny warunek Cauchy'ego.

Lemat (#) Niech $ \Delta_{n,m}=f_n-f_m\colon [a,b]\to \R $. Załóżmy, że spełnione są założenia Twierdzenia~ [link]. Wówczas dla każdej liczby $ \eta>0 $ istnieje takie $ n_0\in N $, że dla wszystkich $ n,m>n_0 $ i wszystkich $ x,y\in [a,b] $ zachodzi nierówność

\[ 	|\Delta_{n,m}(x)-\Delta_{n,m}(y)|<\eta |x-y|\, . 	\]

    Dowód Lematu~ [link] Ustalmy $ \eta>0 $. Funkcja $ \Delta_{n,m} $ jest różniczkowalna na $ [a,b] $ i $ \Delta_{n,m}'=f_n'-f_m' $. Z twierdzenia Lagrange'a o wartości średniej wynika, że

\[ |\Delta_{n,m}(x)-\Delta_{n,m}(y)|=|f_n'(\theta_{x,y})-f_m'(\theta_{x,y})|\cdot |x-y| \qquad\mbox{dla pewnego $\theta_{x,y}\in (x,y)$} \]

(zakładamy bez zmiany ogólności, że $ x<y $). Jednak ciąg $ (f_n') $ jest jednostajnie zbieżny, a więc na mocy Stwierdzenia~ [link] istnieje takie $ n_0\in \N $, że

\[ |f_n'(t)-f_m'(t)|<\eta \qquad\mbox{dla wszystkich $t\in [a,b]$ i $m,n>n_0$.} \]

Wstawiając to oszacowanie do poprzedniego, kończymy dowód lematu.□

Przejdźmy teraz do zasadniczej części dowodu twierdzenia.

     Krok 1. Zbieżność ciągu $ (f_n) $. Niech $ \eps>0 $ i $ \eta=\eps/2(b-a) $. Dobierzmy do $ \eta $ liczbę $ n_0 $ z Lematu~ [link]. Z nierówności trójkąta otrzymujemy

\[ \begin{eqnarray*} 	|f_n(x)-f_m(x)| & \le & |f_n(x_0)-f_m(x_0)| + \bigl|f_n(x)-f_m(x)-\bigl(f_n(x_0)-f_m(x_0)\bigr)\bigr| \\ 	& = &    |f_n(x_0)-f_m(x_0)| + \bigl|\Delta_{n,m}(x)-\Delta_{n,m}(x_0)\bigr|  \\ 	& < &  |f_n(x_0)-f_m(x_0)| + \frac{\eps}{2(b-a)} \cdot |x-x_0| \\ 	& \le &  |f_n(x_0)-f_m(x_0)| + \frac\eps 2\, . \end{eqnarray*} \]

Pierwszy składnik jest niegroźny: ciąg $ (f_n(x_0)) $ jest zbieżny, a zatem istnieje $ n_1 $ takie, że $ |f_n(x_0)-f_m(x_0)|<\frac \eps 2 $ dla wszystkich $ m,n>n_1 $. Dlatego dla $ m,n >\max(n_0,n_1) $ i dla wszystkich $ x\in [a,b] $ zachodzi nierówność

\[   |f_n(x)-f_m(x)| < |f_n(x_0)-f_m(x_0)| + \frac\eps 2 < \eps\, , \]

co oznacza, że ciąg $ (f_n) $ spełnia jednostajny warunek Cauchy'ego, a więc na mocy Stwierdzenia~ [link] jest jednostajnie zbieżny do pewnej funkcji $ f\colon [a,b]\to \R $, która oczywiście jest ciągła (patrz Twierdzenie $ C0-granica $).

     Krok 2. Różniczkowalność funkcji $ f $. Wykażemy, że

\[ \lim_{h\to 0}\frac{f(x+h)-f(x)}h = g(x)\qquad\mbox{dla $x\in [a,b]$.} \]

Ustalmy w tym celu $ x\in [a,b] $ i liczby $ \eta, \eps>0 $; znajdziemy $ \delta>0 $ takie, że

\[ \begin{equation}  \label{cel-rcfR} \left|\frac{f(x+h)-f(x)}h - g(x)\right|< \eps \qquad\mbox{dla $|h|<\delta$.}    \end{equation} \]

Przekształcimy prawą stronę nierówności cel-rcfR, próbując przybliżyć $ f $ przez $ f_n $ i $ g $ przez $ f_n' $. Mamy

\[ \begin{eqnarray*} \lefteqn{  \left|\frac{f(x+h)-f(x)}h - g(x)\right|}\\ & = &  \left|\frac{f(x+h)-f(x)}h -\frac{f_n(x+h)-f(x)}h +\frac{f_n(x+h)-f_n(x)}h- g(x)\right|\\ & \le &             \left|\frac{f(x+h)-f_n(x+h)-\bigl(f(x)-f_n(x)\bigr)}h \right|   +\left|\frac{f_n(x+h)-f_n(x)}h- g(x)\right| \\ & =: & A + B\, . \end{eqnarray*} \]

Każdy ze składników oszacujemy osobno.

     Oszacowanie składnika $ A $. Z Lematu~ [link] wynika, że dla $ m,n >n_0=n_0(\eta) $ jest

\[ |f_m(x+h)-f_n(x+h)-(f_m(x)-f_n(x))|=|\Delta_{m,n}(x+h)-\Delta_{n,m}(x)|< \eta |h|\, . \]

Ponieważ $ f_m(t)\to f(t) $ dla każdego $ t\in [a,b] $, więc przechodząc do granicy $ m\to \infty $, a następnie dzieląc obie strony przez $ |h| $ otrzymujemy

\[ A=\left|\frac{f(x+h)-f_n(x+h)-\bigl(f(x)-f_n(x)\bigr)}h \right|\le \eta \]

dla wszystkich $ |h|>0 $ i $ n>n_0 $.

     Oszacowanie składnika $ B $. Z nierówności trójkąta, \begin{multline*} B= \left|\frac{f_n(x+h)-f_n(x)}h- g(x)\right|= \left|\frac{f_n(x+h)-f_n(x)}h- f_n'(x)+f_n'(x)-g(x)\right|\\ \le \left|\frac{f_n(x+h)-f_n(x)}h- f_n'(x)\right|+\left|f_n'(x)-g(x)\right| < \eta + \eta=2\eta\, , \end{multline*} o ile $ n $ jest ustalone i dostatecznie duże, a $ |h| $ dostatecznie małe. Aby się o tym przekonać, ustalmy najpierw liczbę $ n>n_0 $ tak, aby $ |f_n'(x)-g(x)|<\eta $ dla wszystkich $ x\in[a,b] $; możemy to zrobić, gdyż $ f_n'\rightrightarrows g $. Następnie, korzystając z różniczkowalności $ f_n $ w punkcie $ x $, wybierzmy $ \delta>0 $ takie, by

\[ \left|\frac{f_n(x+h)-f_n(x)}h- f_n'(x)\right|< \eta \qquad\mbox{dla $|h|<\delta$.} \]

Wtedy istotnie $ B<2\eta $.

Ostatecznie, kładąc $ \eta=\eps/3 $ i używając obu oszacowań, otrzymujemy dla $ 0<|h|<\delta $ nierówność

\[  \left|\frac{f(x+h)-f(x)}h - g(x)\right|\le A+B < \eta + 2\eta = 3\eta = \eps\, . \]

Zachodzi więc warunek cel-rcfR. To kończy dowód całego twierdzenia. □

Oczywiście, odpowiednik tego twierdzenia zachodzi dla szeregów funkcyjnych: to tylko kwestia zmiany języka.

Wniosek (#) Załóżmy, że $ f_n\colon \R\supset [a,b]\to \R $, gdzie $ n=1,2,\ldots  $, są różniczkowalne. Jeśli szereg funkcyjny $ \sum_{n=1}^\infty f_n'\  $ jest zbieżny jednostajnie na $ [a,b] $ do funkcji $ g $, a ponadto istnieje taki punkt $ x_0\in [a,b] $, że szereg liczbowy $ \sum_{n=1}^\infty f_n(x_0) $ jest zbieżny, to wówczas:

    {(\alph{enumi})}

  1. Szereg $ \sum_{n=1}^\infty f_n $ jest zbieżny jednostajnie do pewnej funkcji ciągłej $ f\colon [a,b]\to \R $;
  2. Funkcja $ f $ jest różniczkowalna na $ [a,b] $ i $ f'=g $.

Przykład (#) Niech $ g(x)=1/(1-x) $, gdzie $ |x|\le q <1 $. Ze wzoru na sumę szeregu geometrycznego,

\[ 	g(x)= \frac 1{1-x} = 1 + x + x^2 +x^3+\cdots = \sum_{n=0}^\infty x^n\, . 	\]

Powyższy szereg jest na przedziale $ [-q,q] $ zbieżny jednostajnie. To wynika z kryterium Weierstrassa (patrz Stwierdzenie~ [link]), gdyż $ |x^n|\le q^n $ na $ [-q,q] $, a $ \sum q^n $ jest zbieżnym szeregiem liczb dodatnich. Połóżmy $ f_n(x)=x^{n+1}/({n+1}) $, $ n=0,1,\ldots $, $ x\in [-q,q] $. Wtedy $ f_n'(x)=x^n $. Stwierdziliśmy już, że szereg $ \sum f_n'=\sum x^n $ jest na $ [-q,q] $ zbieżny jednostajnie. Szereg $ \sum f_n $ jest zbieżny (co najmniej) w jednym punkcie: dla $ x_0=0 $ wszystkie składniki są zerami. Dlatego, na mocy Wniosku~ [link],

\[ \left(\sum_{n=0}^\infty \frac{x^{n+1}}{n+1} \right)' = \sum_{n=0}^\infty x^n=\frac{1}{1-x}\qquad\mbox{dla wszystkich $|x|\le q$.} \]

Innymi słowy, nieskończoną sumę $ \sum \frac{x^{n+1}}{n+1}  $ wolno na tym przedziale różniczkować tak samo, jak sumę skończoną: pochodna sumy jest sumą pochodnych. Należy jednak pamiętać, że bez założenia zbieżności jednostajnej szeregu pochodnych to nie musi być prawdą! Przykład takiej sytuacji zobaczymy w następnym podrozdziale.

Zauważmy jeszcze, że funkcje $ f(x)=\sum f_n(x)=\sum \frac{x^{n+1}}{n+1} $ oraz $ \varphi (x)=-\ln(1-x) $ mają na przedziale $ [-q,q] $ tę samą pochodną, równą $ 1/(1-x) $. Dlatego $ (f-\varphi)'=0 $ na $ [-q,q] $, więc $ f-\varphi = \mathrm{const}=f(0)-\varphi(0)=0-0=0. $ Ostatecznie,

\[  \sum_{n=0}^\infty \frac{x^{n+1}}{n+1}= -\ln (1-x) \qquad\mbox{dla wszystkich $|x|<1$,} \]

gdyż całe rozumowanie można przeprowadzić, używając dowolnej liczby $ q<1 $. □

Przykład Niech $ f_n(x)=n^{-1}\arctg (x/n) $, $ x\in \R $, $ n=1,2,\ldots $. Dla $ x_0=0 $ mamy $ f_n(x_0)=0 $ dla każdego $ n $, więc szereg funkcyjny $ \sum f_n $ jest zbieżny w $ x_0 $. Pochodna $ f_n' $ spełnia nierówności

\[ 	0<f_n'(x)=\frac 1n \cdot \frac 1{1+(x/n)^2}\cdot \frac 1n = \frac{1}{n^2+x^2}\le \frac{1}{n^2}\, . 	\]

Ponieważ szereg liczbowy $ \sum 1/n^2 $ jest zbieżny, więc z kryterium Weierstrassa wynika, że szereg $ \sum f_n' $ jest zbieżny jednostajnie na każdym przedziale $ [a,b]\subset \R $. Dlatego szereg

\[ f(x)=\sum_{n=1}^\infty \frac 1n \arctg \frac xn \]

jest zbieżny jednostajnie na każdym przedziale $ [a,b]\in \R $ i dla każdej liczby $ x\in \R $ zachodzi wzór

\[ f'(x)=  \sum_{n=1}^\infty \frac{1}{n^2+x^2}\, . \]
Uwaga Jeśli ciąg (lub szereg) funkcyjny jest zbieżny jednostajnie na wszystkich zwartych podzbiorach pewnego ustalonego podzbioru $ P\subset \R $ (bądź $ P\subset \C $), to mówimy, że jest zbieżny niemal jednostajnie na $ P $. W ostatnim przykładzie mieliśmy do czynienia właśnie z taką sytuacją.

Przypadek zespolony

Uważny Czytelnik spostrzegł być może, że w dowodzie Twierdzenia~ [link] posłużyliśmy się twierdzeniem Lagrange'a o wartości średniej, które nie zachodzi dla funkcji o wartościach zespolonych, patrz Przykład~ [link]. Dlatego zespolona wersja twierdzenia o różniczkowaniu ciągów funkcyjnych wymaga nieco innego dowodu, który pokrótce naszkicujemy.

Ustalmy najpierw terminologię.

Definicja Zbiór $ Z\subset C $ nazywa się domknięty wtedy i tylko wtedy, gdy dla każdego ciągu zbieżnego $ (z_n)\subset Z $ jest $ z=\lim z_n\in Z $.

Przykład: koło domknięte $ \{z\in \C \colon |z|\le R\} $ jest zbiorem domkniętym (nierówności nieostre zachowują się po przejściu granicznym), a koło otwarte $ \{z\in \C \colon |z|< R\} $ nie jest zbiorem domknietym (nierówności ostre mogą po przejściu granicznym zmienić się w nieostre).

Definicja Zbiór $ Z\subset C $ nazywa się ograniczony wtedy i tylko wtedy, gdy $ Z $ zawiera się w pewnym kole.
Twierdzenie (#) Załóżmy, że $ W $ jest domkniętym, wypukłym i ograniczonym podzbiorem $ \C $, a funkcje $ f_n\colon \C\supset W \to \C $, gdzie $ n=1,2,\ldots  $, są różniczkowalne (w sensie zespolonym). Jeśli ciąg $ f_n'\rightrightarrows g $ na $ W $, a ponadto istnieje taki punkt $ z_0\in W $, że ciąg $ \bigl(f_n(z_0)\bigr) $ jest zbieżny, to wówczas:

    {(\alph{enumi})}

  1. Ciąg $ f_n $ jest zbieżny jednostajnie do pewnej funkcji ciągłej $ f\colon W\to \R $;
  2. Funkcja $ f $ jest różniczkowalna na $ W $ i $ f'=g $.

    Szkic dowodu. Jedynym miejscem w dowodzie Twierdzenia~ [link], gdzie skorzystaliśmy z faktu, że mamy do czynienia z funkcjami zmiennej rzeczywistej o wartościach rzeczywistych, był Lemat~ [link] (w jego dowodzie skorzystaliśmy z twierdzenia Lagrange'a o wartości średniej). Podamy ``zespolony'' odpowiednik tego fragmentu rozumowania. Sformułowanie zespolonej wersji twierdzenia o wartości średniej poprzedzimy technicznym lematem.

Lemat Niech $ \varphi,\psi\colon [0,1]\to \R $ będą ciągłe na $ [0,1] $ i różniczkowalne w $ (0,1) $. Jeśli $ a>1 $, to funkcja

\[ 	\Phi_a(t)=\left(\varphi^2(t)+\psi^2(t)\right)^{a/2} 	\]

jest różniczkowalna w $ (0,1) $ i zachodzi nierówność

\[ |\Phi_a'(t)|\le a  \left(\varphi^2(t)+\psi^2(t)\right)^{(a-1)/2} \cdot \left(\bigl(\varphi'(t)\bigr)^2+\bigl(\psi'(t)\bigr)^2\right)^{1/2}\, . \]
Dowód: Przypadek 1. Jeśli $ \varphi^2(t)+\psi^2(t)>0 $, to różniczkowalność $ \Phi_a $ w punkcie $ t $ wynika z twierdzenia o pochodnej funkcji złożonej. Ponieważ

\[ |\varphi \varphi'+\psi\psi'|\le   \left(\varphi^2+\psi^2\right)^{1/2}  \left((\varphi')^2+(\psi')^2\right)^{1/2} \]

z nierówności Schwarza, więc mamy w takim punkcie

\[ \begin{eqnarray*} |\Phi_a'| & = & \frac{a}2  \left(\varphi^2+\psi^2\right)^{\frac a2 -1} \cdot 2|\varphi \varphi'+\psi\psi'|\\ & \le & a \left(\varphi^2+\psi^2\right)^{\frac a2 -1}  \left(\varphi^2+\psi^2\right)^{1/2}  \left((\varphi')^2+(\psi')^2\right)^{1/2}\\ & = & a  \left(\varphi^2+\psi^2\right)^{(a-1)/2} \cdot \left(\bigl(\varphi'\bigr)^2+\bigl(\psi'\bigr)^2\right)^{1/2}\, .     \end{eqnarray*} \]

To jest szukana nierówność.

 Przypadek 2. Jeśli $ \varphi^2(t)+\psi^2(t)=0 $, to $ \Phi_a'(t)=0 $. Wykażemy to, posługując się definicją pochodnej. W takim punkcie $ t $ jest $ \Phi_a(t)=0 $, a ponadto

\[ (\varphi^2+\psi^2)^{1/2}\le |\varphi|+|\psi|, \]

więc dla wszystkich dostatecznie małych $ h $ zachodzi nierówność

\[ \begin{eqnarray*} \left|\frac{\Phi_a(t+h)-\Phi_a(t)}h\right| & = &   \left|\frac{\Phi_a(t+h)}h\right| \\ & \le & \frac{|\varphi({t+h})|+|\psi(t+h)|}{|h|}\cdot  \left(\varphi^2(t+h)+\psi^2(t+h)\right)^{(a-1)/2}  \\ & \le & (|\varphi'(t)|+|\psi'(t)|+2)\cdot  \left(\varphi^2(t+h)+\psi^2(t+h)\right)^{(a-1)/2}\, .  \end{eqnarray*} \]

Pisząc ostatnią linijkę, skorzystaliśmy z nierówności $ |\varphi(t+h)|/ |h| < |\varphi'(t)|+1 $, która zachodzi dla wszystkich małych $ |h| $, oraz z analogicznej nierówności dla $ \psi $. Przechodząc do granicy $ h\to 0 $, otrzymujemy $ \Phi_a'(t)=0 $, gdyż czynnik

\[ \left(\varphi^2(t+h)+\psi^2(t+h)\right)^{(a-1)/2}   \to 0, \]

bowiem $ \varphi^2(t+h)+\psi^2(t+h)   \to \varphi^2(t)+\psi^2(t)=0 $ dla $ h\to 0 $, a mamy $ a>1 $. □

    Uwaga: w ostatnim kroku jest istotne, że $ a>1<img class="teximage" src="/sites/default/files/tex/cbe00d5eca0295287334a73c27f78b5f0545c268.png" alt="833d82de4bc7d51d007f78566899ab2f:4062:" />\varphi,\psi\colon [0,1]\to \R $ będą ciągłe na $ [0,1] $ i różniczkowalne w $ (0,1) $. Jeśli $ \varphi (0)=\psi (0)=0 $ oraz $ h(t)=\varphi(t)+i\psi(t) $ dla $ t\in [0,1] $, to wówczas

\[ 	|h(1)|\le \sup_{t\in (0,1)} |h'(t)|\, . 	\]
Dowód: Przyjmijmy takie oznaczenia, jak w poprzednim lemacie. Ponieważ $ \psi(0)=\varphi(0)=0 $, więc

\[ |h(1)|^a=|\Phi_a(1)|=|\Phi_a(1)-\Phi_a(0)| = |\Phi_a'(c)| \]

dla pewnego $ c\in (0,1) $. Wiemy jednak, że

\[ \begin{eqnarray*} |\Phi_a'(c)| & \le  & a  \left(\varphi^2(c)+\psi^2(c)\right)^{(a-1)/2} \cdot \left(\bigl(\varphi'(c)\bigr)^2+\bigl(\psi'(c)\bigr)^2\right)^{1/2}    \\ & \le & a \cdot \left(\sup_{t\in [0,1]} |h(t)|\right)^{(a-1)/2}\cdot  \sup_{t\in (0,1)} |h'(t)|\, . \end{eqnarray*} \]

Dlatego

\[ |h(1)|^a \le      a \cdot \left(\sup_{t\in [0,1]} |h(t)|\right)^{(a-1)/2}\cdot  \sup_{t\in (0,1)} |h'(t)| \, ; \]

przechodząc do granicy $ a\to 1^+ $, otrzymujemy tezę wniosku.□

Wniosek [twierdzenie o wartości średniej, wariant zespolony] Załóżmy, że $ W\subset \C $ jest zbiorem wypukłym, a $ H\colon W\to \C $ funkcją różniczkowalną na $ W $. Wówczas dla wszystkich punktów $ z,w\in W $ zachodzi nierówność

\[  |H(z)-H(w)|\le |z-w|\cdot \sup_{\zeta\in W} |H'(\zeta)|. \]
Dowód: Gdy $ w=z $, nierówność jest banalna: $ 0\le 0 $. Załóżmy, że $ z\not=w $. Połóżmy

\[ h(t)=H(w+t(z-w))-H(w)\quad\mbox{dla $t\in [0,1]$,} \qquad \varphi=\mathrm{Re}\, h, \quad\psi =\mathrm{Im}\, h\, . \]

Wtedy $ \varphi,\psi $ i $ h $ spełniają wszystkie założenia poprzedniego wniosku. Otrzymujemy zatem

\[ \begin{eqnarray*} |H(z)-H(w)|=|h(1)|& \le &  \sup_{t\in (0,1)} |h'(t)|=\sup  _{t\in (0,1)} |H'(w+t(z-w))|\cdot |z-w|\\ &\le & |z-w|\sup_{\zeta\in W} |H'(\zeta)|\, ,   \end{eqnarray*} \]

gdyż $ I=\{z+t(w-z)\colon t\in [0,1] \}\subset W $. □

Wniosek (#) Załóżmy, że spełnione są założenia Twierdzenia~ [link]. Niech $ \Delta_{n,m}=f_n-f_m\colon W\to \C $. Wówczas dla każdej liczby $ \eta>0 $ istnieje takie $ n_0\in N $, że dla wszystkich $ n,m>n_0 $ i wszystkich $ z,w\in W $ zachodzi nierówność

\[ 	|\Delta_{n,m}(z)-\Delta_{n,m}(w)|<\eta |z-w|\, . 	\]

    Dowód Wniosku~ [link] Stosujemy poprzedni wniosek do funkcji $ H=\Delta_{n,m} $. Wtedy $ H'=\Delta_{n,m}'=f_n'-f_m' $. Otrzymujemy

\[ |\Delta_{n,m}(z)-\Delta_{n,m}(w)|\le |z-w|\cdot \sup_{\zeta\in W} |f_n'(\zeta) -f_m'(\zeta)| \, . \]

Ponieważ ciąg $ (f_n') $ jest jednostajnie zbieżny na $ W $, więc dla ustalonego $ \eta $, posługując się jednostajnym warunkiem Cauchy'ego, znajdziemy $ n_0\in \N $ takie, że

$$\sup_{\zeta\in W} |f_n'(\zeta) -f_m'(\zeta)| <\eta\qquad\mbox{  dla wszystkich $m,n>n_0$. } $$

To kończy dowód wniosku. □

Dalszy ciąg dowodu twierdzenia o różniczkowaniu ciągów funkcyjnych w przypadku zespolonym jest, począwszy od tego miejsca, taki sam, jak w przypadku rzeczywistym. Czytelnik, zainteresowany rozumieniem teorii, zechce samodzielnie sprawdzić wszystkie szczegóły.

Istnienie funkcji pierwotnej

Udowodnimy teraz zapowiedziane wcześniej twierdzenie: każda funkcja ciągła jest pochodną pewnej funkcji. Najpierw wprowadzimy tradycyjną terminologię.

Definicja Niech $ P\subset \R $ będzie przedziałem, a $ f\colon P\to\R $ dowolną funkcją. Funkcja różniczkowalna $ F\colon P\to\R $ nazywa się funkcją pierwotną $ f $ wtedy i tylko wtedy, gdy $ F'(x)=f(x) $ dla każdego $ x\in P $.
Stwierdzenie Jeśli $ P\subset \R $ jest przedziałem, a $ F_1,F_2\colon P\to \R $ są funkcjami pierwotnymi tej samej funkcji $ f\colon P\to\R $, to wówczas $ F_1-F_2 $ jest funkcją stałą na $ P $. (#)
Dowód: Wprost z definicji wynika, że $ (F_1-F_2)'=F_1'-F_2'=f-f=0 $. Zatem, na mocy Wniosku~ [link], funkcja $ F_1-F_2 $ jest stała na $ P $. □
Twierdzenie Niech $ P\subset \R $ będzie (dowolnym) przedziałem Każda funkcja ciągła $ f\colon P\to \R $ ma funkcję pierwotną. (#)
Dowód: Przedstawmy przedział $ P $ jako sumę wstępującego ciągu przedziałów domkniętych $ [a_k,b_k] $, tzn. niech

\[ P=\bigcup_{k=1}^\infty [a_k,b_k]\, , \qquad\mbox{gdzie}\quad a_1\ge a_2\ge a_3\ge \ldots, \quad b_1\le b_2\le b_3\ldots . \]

Bez zmniejszenia ogólności założymy, że $ 0 $ jest punktem wspólnym wszystkich przedziałów $ [a_k,b_k] $. Z Twierdzenia~ [link] wynika, że istnieje ciąg wielomianów $ P_k\colon \R\to\R $ taki, że

\[ \begin{equation} 	\label{Pk-f} 	\sup_{x\in[a_k,b_k]} |P_k(x)-f(x)| <\frac 1k\, , \qquad k=1,2, \ldots \end{equation} \]

Dla każdego $ k $ znajdziemy wielomian $ Q_k $ taki, że $ Q_k'(x)=P_k(x) $ dla wszystkich $ x\in \R $ i $ Q_k(0)=0 $. Istotnie, jeśli $ P_k(x)=a_0+a_1x+a_2x^2+\cdots+a_nx^n $, to podane warunki spełnia

\[ Q_k(x)=a_0x+\frac{a_1x^2}{2}+\frac{a_2x^3}3+\cdots+\frac{a_nx^n}n\, . \]

Ustalmy teraz $ k $. Zauważmy, że ciąg liczbowy $ (Q_n(0))_{n\ge k} $ jest zbieżny (bo składa się z samych zer), natomiast wobec Pk-f ciąg $ (P_n)_{n\ge k} $, tzn. ciąg pochodnych wielomianów $ Q_n $, jest zbieżny jednostajnie do $ f $ na $ [a_k,b_k] $. Spełnione są więc założenia Twierdzenia~ [link]; wynika zeń, że ciąg $ (Q_n)_{n\ge k} $ jest zbieżny jednostajnie na $ [a_k,b_k] $ do funkcji $ F_k\colon [a_k,b_k]\to\R $ takiej, że $ F_k'=f $ na $ [a_k,b_k] $ i $ F_k(0)=\lim_{n\to \infty} Q_n(0)=0 $.

Zauważmy, że dla $ m>k $ uzyskane w ten sposób funkcje $ F_m $ i $ F_k $ pokrywają się na $ [a_m,b_m]\cap [a_k,b_k]=[a_k,b_k] $. Istotnie,

\[ F_m'(x)-F_k'(x)=f(x)-f(x)=0 \qquad\mbox{dla $x\in [a_k,b_k]$,} \]

więc $ F_m-F_k= \text{const}, $ ale $ F_m(0)=F_k(0)=0 $. Dlatego $ F_m=F_k $ na $ [a_k,b_k] $. Można więc określić funkcję $ F\colon P=\bigcup [a_k,b_k]\to\R $ wzorem

\[ F(x):=F_k(x) \qquad\mbox{dla $x\in [a_k,b_k]$.} \]

Sprawdziliśmy, że prawa strona nie zależy od wyboru liczby $ k $, a zatem definicja jest poprawna. Ponieważ dla wszystkich $ k $ jest $ F_k'=f $ na $ [a_k,b_k] $, więc $ F'=f $. □

Inne przykłady

Podamy teraz przykłady dwóch funkcji ciągłych. Każda z nich jest określona jako suma pewnego szeregu funkcyjnego. Jedna z nich nie ma pochodnej w żadnym punkcie, druga natomiast ma pochodne wszystkich rzędów.

Przykład [van der Waerden; funkcja ciągła nigdzie nieróżniczkowalna] Niech

\[ 	d(x)=\inf\{|x-m|\colon m\in \Z\}\, , \qquad x\in\R\, .  	\]

Innymi słowy, $ d(x) $ jest odległością $ x $ od najbliższej liczby całkowitej. Można sprawdzić, że $ d(x)=\frac 12 - |x-\frac 12| $ dla $ x\in [0,1] $ i $ d $ jest ciągłą, kawałkami liniową, funkcją okresową o okresie 1. Pochodna funkcji $ d $ istnieje w punktach $ x\not=k/2 $, gdzie $ z\in \Z $, i jest w nich równa $ \pm 1 $. Wykres funkcji $ d $ jest przedstawiony na rysunku. Mamy $ \inf d=0 $, $ \sup d=\frac 12 $.

Połóżmy

\[ d_n(x)=\frac{d(4^nx)}{4^n}\, , \qquad W(x)=\sum_{n=0}^\infty d_n(x)\, , \qquad x\in \R\, . \]

Ponieważ $ |d_n(x)|=|4^{-n}d(4^n x)|\le 4^{-n}\cdot \frac 12 $, a szereg geometryczny $ \sum 4^{-n} $ jest zbieżny, więc z kryterium Weierstrassa wynika, że szereg definiujący funkcję $ W $ jest jednostajnie i bezwzględnie zbieżny na $ \R $. Dlatego $ W\colon \R\to\R $ jest funkcją ciągłą.

\begin{figure}[!h]

\includegraphics*[totalheight=3.65cm]{Pila4.png}

{\footnotesize\baselineskip 11pt Funkcje $ d=d_0 $ (środkowy zygzak), $ d_1 $ (drobniejszy, dolny zygzak) oraz $ d_0+d_1+\cdots +d_7 $ (nieregularna, czarna krzywa). W żargonie Mathematiki użyto definicji \verb|d[x_]:=Abs[x-Round[x]]|.

}

\end{figure}

Wykażemy, że $ W $ nie ma skończonej pochodnej w żadnym punkcie. Ustalmy dowolne $ x\in\R $ i $ m\in \N $. Funkcja $ 4^{-m}d(4^mx) $ jest liniowa na przedziałach długości $ 4^{-m}\cdot \frac 12 $; wybierzmy taki z nich, do którego należy punkt $ x $. Dobierzmy teraz liczbę $ h_m $ tak, żeby spełnione były dwa warunki:

  • $ |h_m|=4^{-m-1} $;
  • W przedziale $ I $ o końcach $ x $ i $ x+h_m $ funkcja $ d_m(x)=4^{-m}d(4^mx) $ jest liniowa.

Obliczymy teraz iloraz różnicowy $ \bigl(W(x+h_m)-W(x)\bigr)/h_m $.

Otóż, $ d_m(x+h_m)-d_m(x)=\pm h_m $ dzięki doborowi $ h_m $ do $ x $. Podobnie, dla wszystkich $ n<m $ jest $ d_n(x+h_m)-d_n(x)=\pm h_m $, gdyż dla $ n<m $ funkcja $ d_n $ jest liniowa na przedziale $ I $, na którym liniowa jest funkcja $ d_m $. Dlatego

\[ \begin{equation} 	\frac{d_n(x+h_m)-d_n(x)}{h_m}=\pm 1\, , \qquad n=0, 1, \ldots, m. 	\label{dolne-ilr} \end{equation} \]

Natomiast dla $ n>m $ funkcja $ d_n $ ma okres $ 4^-n $. Liczba $ |h_m|=4^{-m-1}=4^{-n}\cdot 4^{n-m-1} $ jest wtedy wielokrotnością $ 4^{-n} $, więc także jest okresem $ d_n $. Dlatego w tym przypadku $ d_n(x+h_m)=d_n(x) $. Zatem

\[ \begin{equation} 	\frac{d_n(x+h_m)-d_n(x)}{h_m}=0\, ,  \qquad n=m+1, \,  m+2, \, m+3, \, \ldots . 	\label{gorne-ilr} \end{equation} \]

Z bezwzględnej zbieżności szeregu definiującego $ W(x) $ wynika, że

\[ \frac{W(x+h_m)-W(x)}{h_m}=\sum_{n=0}^\infty \frac{d_n(x+h_m)-d_n(x)}{h_m}\stackrel{\eqref{gorne-ilr}}= \sum_{n=0}^m \frac{d_n(x+h_m)-d_n(x)}{h_m}\stackrel{\eqref{dolne-ilr}}=\sum_{n=0}^m \pm 1\, . \]

Jednak suma parzystej liczby składników $ \pm 1 $ jest parzystą liczbą całkowitą, a suma nieparzystej liczby $ \pm 1 $ jest nieparzystą liczbą całkowitą. Dlatego ciąg $ \bigl(W(x+h_m)-W(x)\bigr)/h_m $ ma na przemian wyrazy parzyste i nieparzyste i z pewnością nie spełnia warunku Cauchy'ego, a więc nie może być zbieżny do granicy skończonej. □

Przykład Niech (W późniejszym okresie studiów matematycznych Czytelnik zobaczy, że podobne szeregi pojawiają się we wzorach na rozwiązania równań różniczkowych, opisujących proces rozchodzenia się ciepła.)

\[ \begin{equation} 	\label{szerciep} 	f(t)=\sum_{n=1}^\infty \exp(-n^2 t)\, , \qquad t>0\, . \end{equation} \]

Wówczas funkcja $ f $ ma na $ (0,\infty) $ ciągłe pochodne wszystkich rzędów. Wykażemy przez indukcję, że

\[ \begin{equation} 	\label{szerciep-k} f^{(k)}(x)=\sum_{n=1}^\infty (-1)^k n^{2k} \exp(-n^2t), \, \qquad t>0\, ,\quad k=0,1,2,\ldots . \end{equation} \]

Niech $ 0<\eps<M<\infty $ będą dowolne. Wystarczy sprawdzić, że wzór szerciep-k zachodzi na $ [\eps, M] $. Dla $ k=0 $ mamy na tym przedziale $ 0<\exp(-n^2t)\le (e^{-\eps}\bigr)^n=q^n $. Liczba $ q=e^{-\eps}\in (0,1) $, więc na mocy kryterium Weierstrassa szereg szerciep-k jest dla $ k=0 $ jednostajnie zbieżny na $ [\eps,M] $, a jego suma $ f $ jest funkcją ciągłą.

Załóżmy teraz, że szerciep-k zachodzi dla pewnej liczby $ k $. Różniczkując kolejno składniki prawej strony, otrzymujemy szereg o wyrazach

\[ \begin{equation} 	\label{skladnikk+1} \frac{d}{dt}\Bigl((-1)^k n^{2k} \exp(-n^2t)\Bigr)=(-1)^{k+1} n^{2(k+1)} \exp(-n^2t)\, .	 \end{equation} \]

Na przedziale $ [\eps, M] $ jest

\[ \left|\frac{d}{dt}\Bigl((-1)^k n^{2k} \exp(-n^2t)\Bigr)\right|= n^{2(k+1)} \exp(-n^2t)\le n^{2(k+1)}\bigl(e^{-\eps}\bigr)^n \]

i dlatego szereg zbudowany ze składników skladnikk+1, tzn. pochodnych składników szeregu szerciep-k, jest, na mocy kryterium Weierstrassa (Czytelnik zechce przypomnieć sobie Przykłady~ [link], gdzie była mowa o zbieżności szeregów liczbowych $ \sum n^kq^n $, gdzie $ k\in \N $ jest ustalone, a $ q\in (0,1) $.}, jednostajnie zbieżny na $ [\eps, M] $. Sam szereg szerciep-k też jest zbieżny na całym przedziale $ [\eps, M] $; to jest założenie indukcyjne. Z twierdzenia o różniczkowaniu ciągów i szeregów funkcyjnych wynika teraz, że wzór szerciep-k zachodzi także dla liczby $ k+1 $.

Na mocy zasady indukcji zupełnej, szerciep-k zachodzi dla wszystkich $ k\in\N $.□

Twierdzenie Arzeli-Ascoliego

Udowodnimy w tym podrozdziale ważne twierdzenie, określające warunki konieczne i~dostateczne na to, aby z każdego ciągu funkcyjnego, zawartego w pewnej rodzinie funkcji ciągłych $ \mathscr{F} $ można było wybrać podciąg jednostajnie zbieżny, którego granica też należy do rodziny $ \mathscr{F} $. Najpierw wprowadzimy kilka definicji.

Definicja [$ \delta $-sieć] Niech $ \delta>0 $. Powiemy, że podzbiór $ A_1 $ zbioru $ A\subset \R $ jest $ \delta $-siecią\/ w $ A $ wtedy i tylko wtedy, gdy dla każdego $ x\in A $ istnieje $ y\in A_1 $ takie, że $ |x-y|<\delta $.

Przykład Zbiór $ A_1=\{k/2\colon k\in \Z\} $ jest $ \delta $-siecią w $ A=\R $ dla każdej liczby $ \delta>\frac 14 $. Zbiór liczb wymiernych $ A_1=\Q $ jest $ \delta $-siecią w $ A=\R $ dla każdej liczby $ \delta>0 $.
Definicja Zbiór niepusty $ A\subset \R $ nazywa się całkowicie ograniczony wtedy i tylko wtedy, gdy dla każdej liczby $ \delta>0 $ w $ A $ istnieje skończona $ \delta $-sieć.
Lemat (#) Każdy niepusty zbiór zwarty $ K\subset \R $ jest całkowicie ograniczony.
Dowód: Przypuśćmy, że lemat jest fałszywy. Niech $ K\subset \R $ będzie niepustym zbiorem zwartym, w którym dla pewnego $ \delta>0 $ nie ma skończonej $ \delta $-sieci. Weźmy dowolne $ x_1\in K $. Zbiór $ \{x_1\} $ nie jest $ \delta $-siecią w $ K $, więc istnieje $ x_2\in K $ takie, że $ |x_2-x_1|\ge \delta $. Zbiór $ \{x_1,x_2\} $ nie jest $ \delta $-siecią w $ K $, więc istnieje $ x_3\in K $ takie, że $ |x_3-x_j|\ge \delta $ dla $ j=1,2 $. Postępując dalej w taki sposób, znajdziemy ciąg punktów $ (x_n)\subset K $ taki, że $ |x_i-x_j|\ge \delta $ dla wszystkich $ i\not=j $. Żaden podciąg ciągu $ (x_n) $ nie spełnia warunku Cauchy'ego, więc żaden podciąg ciągu $ (x_n) $ nie jest zbieżny. To jest sprzeczność: każdy ciąg $ (x_n)\subset K $ powinien zawierać podciąg zbieżny, gdyż $ K $ jest zwarty. □

Wprowadzimy teraz kilka określeń, opisujących własności rodzin funkcji. Zanim podamy twierdzenie Arzeli-Ascoliego, zilustrujemy te własności prostymi przykładami.

Definicja Rodzina $ \mathscr{F}\subset C(K) $ nazywa się zwarta wtedy i tylko wtedy, gdy z dowolnego ciągu funkcji $ (f_n)\subset\mathscr{F} $ można wybrać podciąg $ (f_{n_j}) $ zbieżny jednostajnie na $ K $ do pewnej funkcji $ f\in \mathscr{F} $.

Okazuje się, że jeśli $ K\subset \R $ jest zbiorem zwartym, to zwartość dowolnej rodziny funkcji $ \mathscr{F} \subset C(K) $ można dość łatwo scharakteryzować. Kluczowym pojęciem, służącym do tego celu, jest równociągłość.

Definicja Powiemy, że rodzina $ \mathscr{F} \subset C(K) $ jest równociągła (Mówi się też zamiennie: jednakowo ciągła). wtedy i tylko wtedy, gdy dla każdego $ \eps>0 $ istnieje takie $ \delta>0 $, że dla każdej funkcji $ f\in\mathscr{F} $ i wszystkich punktów $ x,y\in K $, $ |x-y|<\delta $, zachodzi nierówność $ |f(x)-f(y)|<\eps $.

Czytelnik zechce zwrócić uwagę na kolejność kwantyfikatorów w definicji. Chodzi o to, że liczbę $ \delta>0 $ można wybrać jednocześnie dla wszystkich funkcji $ f\in \mathscr{F} $.

Przykład Rodzina $ \mathscr{F} \subset C([0,1]) $ wszystkich funkcji, spełniających warunek Lipschitza ze stałą $ 2011 $, jest równociągła: dla każdego $ \eps>0 $ warunek podany w definicji spełnia liczba $ \delta=\eps/2011 $. Jeśli bowiem $ |x-y|\in [0,1] $, $ |x-y|<\delta=\eps/2011 $ i $ f $ jest jakąkolwiek funkcją, spełniającą na $ [0,1] $ warunek Lipschitza ze stałą $ 2011 $, to

\[ 	|f(x)-f(y)| \le 2011|x-y|<2011\delta=\eps\, . 	\]

Przykład Rodzina funkcji $ f_n(x)=\sin n x $, gdzie $ x\in [0,2\pi] $ i $ n=1,2,\ldots $, nie jest równociągła na $ [0,2\pi] $. Istotnie, niech $ \eps=1/2 $. Jeśli $ \delta>0 $, a $ n $ wybierzemy tak, żeby $ \pi/2n<\delta $, to $ |f_n(0)- f_n(\pi/2n)|=|\sin 0-\sin \frac \pi 2|=1>\eps $
Definicja Powiemy, że rodzina $ \mathscr{F} \subset C(K) $ jest wspólnie ograniczona wtedy i tylko wtedy, gdy istnieje stała $ M>0 $ taka, że $ \|f\|_{\infty, K}\le M $ dla każdej funkcji $ f\in \mathscr{F} $.

Przykład Rodzina wszystkich wielomianów na $ [0,1] $ nie jest wspólnie ograniczona, gdyż zawiera dowolnie duże funkcje stałe. Rodzina $ f_n(x)=\sin n x $, gdzie $ x\in [0,2\pi] $ i $ n=1,2,\ldots, $ jest wspólnie ograniczona przez liczbę $ M=1 $.
Definicja Powiemy, że rodzina $ \mathscr{F} \subset C(K) $ jest domknięta wtedy i tylko wtedy, gdy granica każdego jednostajnie zbieżnego ciągu funkcji z rodziny $ \mathscr{F} $ też należy do $ \mathscr{F} $.

Przykład Rodzina $ \mathscr{W} $ wszystkich wielomianów na $ [0,1] $ nie jest domknięta. Istnieje bowiem ciąg wielomianów zbieżny jednostajnie na $ [0,1] $ do $ f(x)=\exp (x) $, tzn. do funkcji, nie należącej do $ \mathscr{W} $.
Twierdzenie [Arzela, Ascoli] Niech $ K\subset \R $ będzie zbiorem zwartym i niech $ \mathscr{F}\subset C(K) $. Następujące warunki są wówczas równoważne:

  1. $ \mathscr{F} $ jest zwarta;
  2. $ \mathscr{F} $ jest domknięta, wspólnie ograniczona i równociągła.
Dowód: Najpierw wykażemy nieco łatwiejszą implikację (i) $ \Rightarrow $ (ii). Niech $ \mathscr{F}\subset C(K) $ będzie rodziną zwartą. Domkniętość rodziny $ \mathscr{F} $ jest oczywista: jeśli $ (f_n)\subset \mathscr{F} $ jest jednostajnie zbieżnym ciągiem funkcji, to jego granica $ f $ z pewnością należy do $ \mathscr{F} $, gdyż $ f $ jest granicą każdego podciągu ciągu $ (f_n) $.

Udowodnimy teraz, że $ \mathscr{F} $ jest wspólnie ograniczona. Przypuśćmy, że jest przeciwnie. Wtedy dla każdego $ m\in \N $ istnieje $ f_m\in \mathscr{F} $ taka, że $ \|f_m\|_\infty>m $, tzn., z definicji normy jednostajnej, $ |f_m(x_m)|>m $ dla pewnego $ x_m\in K $. Z ciągu $ (f_m) $ można, dzięki zwartości rodziny $ \mathscr{F} $, wybrać podciąg $ f_{m_j}\rightrightarrows f $ na $ K $. Funkcja $ f $ jest ciągła, a więc jest ograniczona na $ K $; niech $ M=\sup |f|+1 $. Jeśli $ m_j>M $ jest dostatecznie duże, to $ |f-f_{m_j}|<1 $ na $ K $ z definicji jednostajnej zbieżności. Zatem, z nierówności trójkąta,

\[ |f(x_{m_j})|\ge |f_{m_j}(x_{m_j})|- |f_{m_j}(x_{m_j})-f(x_{m_j})|> m_j - 1>M-1 =\sup |f|, \]

a to jest oczywista sprzeczność. Rodzina $ \mathscr{F} $ musi więc być wspólnie ograniczona.

Wreszcie, sprawdzimy, że $ \mathscr{F} $ jest równociągła. Jeszcze raz będziemy rozumować przez zaprzeczenie. Przypuśćmy, że rodzina $ \mathscr{F} $ nie jest równociągła. Istnieje wtedy liczba $ \eps_0>0 $ taka, że dla każdej liczby $ \delta_n=\frac 1n $ istnieje funkcja $ f_n\in \mathscr{F} $ i punkty $ x_n,y_n\in K $ takie, że $ |x_n-y_n|<\frac 1n $, ale $ |f_n(x_n)-f_n(y_n)|\ge\eps_0 $. Z twierdzenia o trzech ciągach wynika, że $ x_n-y_n\to 0 $.

Ponieważ rodzina $ \mathscr{F}  $ jest zwarta, więc - przechodząc w razie potrzeby do podciągu zbieżnego - ,ożemy bez zmniejszenia ogólności przyjąć, że ciąg $ (f_n)\subset \mathscr{F} $ jest jednostajnie zbieżny. Funkcja $ f=\lim f_n $ jest ciągła na $ K $, a więc na mocy twierdzenia Cantora jest jednostajnie ciągła. Wybierzmy teraz $ n_0 $ tak, żeby $ \|f_n-f\|_\infty<\eps_0/3 $ dla wszystkich $ n>n_0 $. Wtedy, z nierówności trójkąta,

\[ \begin{eqnarray*} |f(x_n)-f(y_n)|& \ge & |f_n(x_n)-f_n(y_n)|-|f_n(x_n)-f(x_n)|-|f_n(y_n)-f(y_n)| \\  &\ge &  {\eps_0} - 2\|f_n-f\|_\infty > \frac{\eps_0}3\, . \end{eqnarray*} \]

Zatem $ x_n-y_n\to 0 $, ale $ f_n(x_n)-f(y_n)\not \to 0 $. To przeczy jednostajnej ciągłości $ f $ na $ K $. Dowód implikacji (i) $ \Rightarrow $ (ii) jest zakończony.

    

Przejdziemy teraz do dowodu ciekawszej i ważniejszej implikacji (ii) $ \Rightarrow $ (i). Udowodnimy najpierw następujący fakt: \begin{quote} \it Jeśli rodzina $ \mathscr{F}\subset C(K) $ jest wspólnie ograniczona i równociągła, to z każdego ciągu $ (f_n)\subset \mathscr{F} $ można wybrać podciąg jednostajnie zbieżny. \end{quote} Z Lematu~ [link] wynika, że dla każdego $ m\in\N $ w $ K $ istnieje skończona $ \frac 1m $-sieć. Suma $ P $ tych wszystkich sieci jest zbiorem przeliczalnym. Ponumerujmy punkty poszczególnych sieci tak, aby $ P=\{x_1,x_2,x_3,x_4,\ldots\} $.

Ustalmy ciąg $ (f_n)\subset \mathscr{F} $. Wykażemy, że z $ (f_n) $ można wybrać taki podciąg $ g_k=f_{n_k} $, że ciąg liczbowy $ \bigl(g_{k}(x_m)\bigr)_{k=1,2,\ldots} $ jest zbieżny dla każdego ustalonego $ m\in \N $. (Wykorzystamy w tym celu metodę przekątniową). Następnie udowodnimy, że wybrany podciąg funkcji jest nie tylko zbieżny w każdym z punktów $ x_m $, ale także jednostajnie zbieżny na $ K $.

Rodzina $ \mathscr{F} $ jest wspólnie ograniczona, więc ciąg liczb $ f_n(x_1) $ jest ograniczony. Posługując się twierdzeniem Bolzano-Weierstrassa, można zeń wybrać podciąg zbieżny. Oznaczmy go $ f_{1,n}(x_1) $. Aby wybrać następny podciąg, zauważmy, że ciąg $ f_{1,n}(x_2) $ jest ograniczony, a więc zawiera podciąg zbieżny $ f_{2,n}(x_2) $. Odnotujmy, że ciąg $ f_{2,n}(x_1) $ też jest zbieżny, gdyż jest podciągiem zbieżnego ciągu $ f_{1,n}(x_1) $. Załóżmy teraz, że dla pewnej liczby $ k $ wybraliśmy już podciągi $ f_{i,n} $, gdzie $ i=1,\ldots, k $, o następujących własnościach:

  • Gdy $ j>i $, to $ (f_{j,n}) $ jest podciągiem $ (f_{i,n}) $;
  • Ciągi liczbowe $ \bigl(f_{k,n}(x_i)\bigr)_{n=1,2,\ldots} $, gdzie $ i=1,2,\ldots, k $, są zbieżne.

Rozpatrzmy teraz ciąg $ \bigl(f_{k,n}(x_{k+1})\bigr)_{n=1,2,\ldots} $. Jest on ograniczony, więc ma podciąg zbieżny $ \bigl(f_{k+1,n}(x_{k+1})\bigr)_{n=1,2,\ldots} $. Podciąg $ f_{k+1,n} $ jest oczywiście podciągiem każdego z ciągów $ f_{i,n} $ dla $ i\le k $, więc wszystkie ciągi liczbowe $ \bigl(f_{k+1,n}(x_{i})\bigr)_{n=1,2,\ldots} $, gdzie $ i=1,2,\ldots, k+1 $, są zbieżne. Kontynuując tę procedurę, otrzymamy nieskończenie wiele podciągów $ f_{k,n} $ wyjściowego ciągu $ (f_n) $; $ k $-ty z tych podciągów, $ f_{k,n} $, jest zbieżny w punktach $ x_1,\ldots, x_k $. Wygodnie jest zapisać te podciągi w nieskończonej tabeli

\[ \begin{center} \begin{tabular}{lcccc} 	$k$ & $1$ 	& $2$ 	& $3$ 	& 	$\ldots$\\[2pt] 	\hline 	    & \textcolor{red}{$f_{1,1}$} & $f_{2,1}$ & $f_{3,1}$ & $\ldots$\\[4pt] 	    & $f_{1,2}$ & \textcolor{red}{$f_{2,2}$} & $f_{3,2}$ & $\ldots$\\[4pt] 	    & $f_{1,3}$ & $f_{2,3}$ & \textcolor{red}{$f_{3,3}$} & $\ldots$\\[4pt] 	    & $\vdots $ & $\vdots $ & $\vdots $ & \textcolor{red}{$\ddots$} 	\end{tabular} \end{center} \]

Ciąg w $ k $-tej kolumnie jest podciągiem każdej z wcześniejszych kolumn i jest zbieżny w punktach $ x_1,\ldots, x_k $. Połóżmy teraz $ \textcolor{red}{g_n=f_{n,n}} $. (Jest to ciąg funkcji, wypisanych na głównej przekątnej powyższej tabeli). Zauważmy, że dla każdego ustalonego $ m $ ciąg $ g_n(x_m) $ jest, począwszy od $ m $-tego miejsca, podciągiem $ f_{m,n}(x_m) $. Dlatego granica $ \lim_{n}g_n(x_m) $ istnieje dla każdego $ m\in \N $.

Wykażemy teraz, że ciąg $ g_n $ jest jednostajnie zbieżny na $ K $. W tym celu udowodnimy, że $ (g_n) $ spełnia na $ K $ jednostajny warunek Cauchy'ego. Ustalmy $ \eps>0 $. Dobierzmy do $ \eps/3>0 $ liczbę $ \delta>0 $, korzystając z definicji równociągłości. Ustalmy teraz $ N $ tak duże, aby wśród punktów $ x_1,\ldots, x_N $ zbioru $ P $ znalazła się pewna $ \delta $-sieć w zbiorze $ K $. Jest to możliwe, gdyż zbiór przeliczalny $ P $ był sumą skończonych $ \frac 1n $-sieci dla $ K $.

Ponieważ ciągi $ g_n(x_j) $ są zbieżne dla każdego $ j=1,\ldots, N $, więc - na mocy warunku Cauchy'ego dla ciągów liczbowych - istnieje $ n_0 $ takie, że

\[ \begin{equation} |g_n(x_j)-g_m(x_j)|<\frac \eps 3 \qquad \mbox{dla wszystkich $m,n>n_0$ i wszystkich $j=1,\ldots, N$.} \label{zbiez-siatka} \end{equation} \]

Niech $ x\in K $. Istnieje $ j\in \{1,\ldots, N\} $ takie, że $ |x-x_j|<\delta $. Zatem, dla $ n,m>n_0 $,

\[ \begin{eqnarray*} |g_n(x)-g_m(x)|& \le & |g_n(x)-g_n(x_j)|+|g_n(x_j)-g_m(x_j)|+|g_m(x_j)-g_m(x)|\\ & < & \frac \eps 3 +\frac \eps 3+\frac \eps 3 =\eps. \end{eqnarray*} \]

Dwa skrajne składniki oszacowaliśmy, korzystając z równociągłości i doboru $ \delta $ do $ \eps/3 $, środkowy zaś - korzystając z zbiez-siatka. Otrzymujemy ostatecznie $ |g_n-g_m|<\eps $ na $ K $ dla wszystkich $ m,n>n_0 $, więc ciąg $ g_n $, tzn. podciąg $ f_n $ wybrany metodą przekątniową, jest zbieżny jednostajnie na $ K $.

Z domkniętości rodziny $ \mathscr{F} $ wynika, że granica ciągu $ g_n $ też należy do $ \mathscr{F} $. □

Bardzo często jest w analizie używany natychmiastowy wniosek z powyższego dowodu.

Wniosek Załóżmy, że $ K $ jest zbiorem zwartym w $ \R $, a rodzina funkcji $ \mathscr{F} \subset C(K) $ jest wspólnie ograniczona i równociągła. Wówczas każdy ciąg $ (f_n)\subset \mathscr{F} $ zawiera podciąg jednostajnie zbieżny.

Szeregi potęgowe

Szeregiem potęgowym o środku w punkcie $ z_0\in \C $ i współczynnikach $ a_n\in \C $ nazywamy szereg

\[ \begin{equation} 	\label{szerpot} 	\sum_{n=0}^\infty a_n(z-z_0)^n\, , \end{equation} \]

gdzie $ z\in \C $. Z szeregami tego typu mieliśmy już do czynienia, omawiając funkcję wykładniczą, sinus i cosinus.

W tym rozdziale, wyposażeni w wiedzę o zbieżności jednostajnej, omówimy ogólne własności funkcji, które można definiować wzorami typu szerpot.

Dygresja: granica górna i dolna

Niech $ (b_n) $ będzie ciągiem liczb rzeczywistych.

Definicja (#) Granicą górną ciągu $ (b_n) $ nazywamy element zbioru $ \R\cup\{\pm\infty\} $, określony następująco:

\[ 	\limsup_{n\to\infty} b_n := \inf_{n\in \N} \left(\sup_{m\ge n} b_m\right)\, . 	\]

Granicą dolną ciągu $ (b_n) $ nazywamy element zbioru $ \R\cup\{\pm\infty\} $, określony następująco:

\[ \liminf_{n\to\infty} b_n := \sup_{n\in \N} \left(\inf_{m\ge n} b_m\right)\, . \]

Symbole `lim sup' i `lim inf' pochodzą od łacińskich nazw limes superior oraz limes inferior.

    Uwaga. Nietrudno sprawdzić, że zachodzą równości

\[ \begin{gather} \limsup_{n\to\infty} b_n=\inf_{n\in \N} \left(\sup_{m\ge n} b_m\right)= \lim_{n\to\infty} \left(\sup_{m\ge n} b_m\right)\, ,\label{ls2}\\ \liminf_{n\to\infty} b_n = \sup_{n\in \N} \left(\inf_{m\ge n} b_m\right)=\lim_{n\to\infty} \left(\inf_{m\ge n}b_m\right)\, .\label{li2} \end{gather*} \]

Istotnie, ciąg $ B_n=\sup_{m\ge n} b_m $ jest nierosnący (zwiększając $ n $, obliczamy kres górny mniejszego lub tego samego zbioru). Dlatego ciąg $ B_n $ ma granicę (właściwą lub niewłaściwą: nie wiemy wszak, czy $ B_n $ jest ograniczony), która zarazem jest kresem dolnym wszystkich liczb $ B_n $. (Patrz Twierdzenie~ [link], Wniosek~ [link] i Twiredzenie~ [link]). To dowodzi pierwszej z podanych równości; drugą można sprawdzić analogicznie.

\subsubsection*{Inna definicja granicy górnej i dolnej. Granice częściowe}

Równoważna definicja granicy górnej i dolnej jest następująca. Oznaczmy literą $ \mathcal{B} $ zbiór wszystkich tych podciągów ciągu $ (b_n) $, które są zbieżne do granicy właściwej lub niewłaściwej. Niech $ \Gamma $ oznacza zbiór wszystkich granic podciągów $ (b_{n_k})\in \mathcal{B} $. Inaczej mówiąc, element $ c\in\overline\R $ należy do $ \Gamma $ wtedy i tylko wtedy, gdy $ c=\lim b_{n_k} $ dla pewnego podciągu $ (b_{n_k}) $ ciągu $ (b_n) $.

Tak określony zbiór $ \Gamma $ nazywamy zbiorem granic częściowych ciągu $ (b_n) $. Zachodzą równości

\[ \begin{equation} 	\label{limsupliminf2} \limsup_{n\to\infty} b_n = \sup \Gamma\, , \qquad \liminf_{n\to\infty} b_n=\inf \Gamma\, . \end{equation} \]

Ich sprawdzenie w oparciu o Definicję~ [link] pozostawimy jako nietrudne zadanie dla Czytelnika.

Przykład Ciąg $ b_n=(-1)^n $ ma granicę górną $ 1 $ i granicę dolną $ -1 $. Zbiór granic częściowych tego ciągu to zbiór dwuelementowy $ \{-1,1\} $. Ciąg

$$0, \quad 1, \quad \frac 12, \quad \frac 13, \quad \frac 23, \quad \frac 14, \quad \frac 24,\quad  \frac 34, \quad \frac 15, \quad \frac 25, \quad \frac 35,\quad  \frac 45, \quad \ldots$$

ma granicę górną $ 1 $ i granicę dolną $ 0 $. Zbiór granic częściowych tego ciągu to przedział $ [0,1] $.

Zadanie Niech $ (b_n) $ będzie ciągiem liczb rzeczywistych, a $ \Gamma $ zbiorem granic częściowych tego ciągu. Wykazać, że jeśli ciąg $ (g_n)\subset \Gamma $ ma granicę (właściwą lub niewłaściwą) $ g $, to $ g\in \Gamma $.

Posługując się wnioskiem~ [link], nietrudno udowodnić, że ciąg liczb rzeczywistych jest zbieżny (do granicy właściwej lub niewłaściwej) wtedy i tylko wtedy, gdy jego granica górna i dolna są równe.

Zanotujmy jeszcze jedną własność granicy górnej, którą wykorzystamy w tym rozdziale.

Stwierdzenie Jeśli $ \limsup_{n\to\infty} b_n=b $, to dla każdego $ b'>b $ istnieje $ n_0\in \N $ takie, że $ b_n<b' $ dla wszystkich $ n>n_0 $.(#)