Dygresje: dodatkowy materiał, omawiany na wykładzie

Twierdzenie Stolza

Poniższe twierdzenie pozwala w wielu przypadkach obliczać granice ciągów $ a_n/b_n $, gdy $ a_n,b_n\to +\infty $, i stanowi dla ciągów odpowiednik tak zwanej reguły de l'Hospitala. (Jeśli Czytelnik nie zna tej nazwy, niech się nie martwi; jeśli zaś zna ją ze słyszenia, to niech nie stosuje bezmyślnie nieodpowiednich narzędzi, szczególnie wtedy, gdy nie jest pewien, skąd się one właściwie wzięły.)

Twierdzenie [Twierdzenie Stolza] Załóżmy, że ciąg $ (b_n) $ jest ściśle monotoniczny oraz $ b_n\not=0 $ dla $ n\in \N $. Jeśli $ (a_n)\subset \R $ i istnieje granica

\[ \lim_{n\to\infty}\frac{a_{n+1}-a_n}{b_{n+1}-b_n}=g, \]

a ponadto zachodzi któryś z następujących warunków:

  1. $ \displaystyle\lim_{n\to\infty} a_n=\lim_{n\to\infty} b_n=0 $,
  2. $ \displaystyle\lim_{n\to\infty} b_n=+\infty $,

to wówczas ciąg $ (a_n/b_n) $ jest zbieżny, a ponadto

\[ \lim_{n\to\infty}\frac{a_n}{b_n}=g. \]

Dowód:
Bez zmniejszenia ogólności założymy, że ciąg $ b_n $ jest rosnący (zawsze można rozpatrzeć $ -a_n $ i $ -b_n $). Niech $ \eps>0 $ i niech $ \eta\in (0,1/2] $; konkretną wartość $ \eta $ dobierzemy do $ \eps $ później. Ustalmy $ k\in\N $ tak, aby

\[ g-\eta < \frac{a_{s+1}-a_s}{b_{s+1}-b_s}   < g+\eta   \qquad\mbox{dla wszystkich } s\ge k. \]

Ciąg $ (b_n) $ jest rosnący, więc $ b_{s+1}-b_s>0 $. Mnożąc obie nierówności przez tę liczbę, otrzymujemy

\[ ({b_{s+1}-b_s})(g-\eta) < {a_{s+1}-a_s}   < ({b_{s+1}-b_s})(g+\eta), \qquad s\ge k. \]

Niech $ n>m\ge k $. Dodając powyższe nierówności dla $ s=m,m+1,\ldots,n-1 $, a następnie dzieląc wynik przez liczbę dodatnią $ b_n-b_m $, sprawdzamy, że

\[ \begin{equation} 	\label{an-ak} g-\eta < \frac{a_{n}-a_m}{b_{n}-b_m}   < g+\eta   \qquad\mbox{dla wszystkich } n> m\ge k. \end{equation} \]

Od tego momentu rozumowanie jest nieco inne w każdym z dwóch przypadków.

    Przypadek (i): $ \lim_{n\to\infty} a_n=\lim_{n\to\infty} b_n=0 $. Ustalmy w nierównościach an-ak liczbę $ m\ge k $ i przejdźmy do granicy $ n\to\infty $. Korzystając ze Stwierdzenia~ [link] i arytmetycznych własności granicy, otrzymujemy

\[ g-\eta \le \lim_{n\to\infty} \frac{a_{n}-a_m}{b_{n}-b_m} = \frac {a_m}{b_m} \le g+\eta. \]

Jeśli więc $ \eta>0 $ jest jakąkolwiek liczbą z przedziału $ (0,\eps) $, powiedzmy $ \eta=\eps/2 $, to

\[ \left|\frac {a_m}{b_m}-g\right|\le \eta < \eps \qquad \mbox{dla wszystkich $m\ge k$,} \]

co kończy dowód twierdzenia Stolza w przypadku (i).

    Przypadek (ii): $ \lim_{n\to\infty} b_n=+\infty $. Ustalmy w nierównościach an-ak liczbę $ m= k $

     Uwaga. Cała reszta dowodu w tym przypadku jest formalizacją następującego intuicyjnego i nieścisłego spostrzeżenia: $ (a_{n+1}-a_n)/(b_{n+1}-b_n)\approx g $ dla dużych $ n $, więc przyrosty ciągu $ a_n $ są z grubsza, z dokładnością do stałego czynnika, takie, jak przyrosty ciągu $ b_n $. Zatem ułamek $ a_n/b_n $, który dopiero chcemy zbadać, powinien różnić się mało od ułamka $ ({a_{n}-a_k})/({b_{n}-b_k}) $; spodziewamy się, że dla $ n $ znacznie większych od $ k $ liczby $ a_k $ i $ b_k $ są mało istotnymi dodatkami do $ a_n $ i $ b_n $.

 

Spróbujmy tę intuicję doprecyzować. Obliczmy w tym celu różnicę liczb $ a_n/b_n $ oraz $ (a_n-a_k)/(b_n-b_k) $. Prosty rachunek daje

\[ \begin{eqnarray} \biggl|\frac{a_n}{b_n}- \frac{a_{n}-a_k}{b_{n}-b_k}\biggr|  & = & \biggl| \frac{a_{n}(b_n-b_k)-b_n(a_n-a_k)}{b_n(b_{n}-b_k)} \biggr| \ = \ \biggl| \frac{-a_{n}b_k+b_na_k}{b_n(b_{n}-b_k)} \biggr|    \nonumber \\ & = & \biggl| \frac{a_{n}}{b_n}\biggr|\,\cdot\,\biggl|\frac{b_k}{b_{n}-b_k} \biggr|    +  \biggl|\frac{a_k}{b_{n}-b_k}  \biggr|\label{ananak} \\ & \le &    \biggl| \frac{a_{n}}{b_n}\biggr|\eta + \eta \qquad\mbox{dla $n>n_1=n_1(k,\eta)>k$.} \nonumber \end{eqnarray} \]

(Proszę zauważyć: $ b_n\to+\infty $, więc przy ustalonym $ k $ mamy $ b_k/(b_n-b_k), a_k/(b_n-b_k)\to 0 $ dla $ n\to\infty $, zatem wartości bezwzględne obu tych ułamków są małe, gdy $ n $ jest dostatecznie duże). Zatem dla dostatecznie dużych $ n $

\[  \biggl| \frac{a_{n}}{b_n}\biggr|  \le \biggl|\frac{a_n}{b_n}- \frac{a_{n}-a_k}{b_{n}-b_k}\biggr| +\biggl| \frac{a_{n}-a_k}{b_{n}-b_k}\biggr|  \le   \biggl| \frac{a_{n}}{b_n}\biggr|\eta + \eta + |g|+\eta, \]

stąd zaś

\[ \biggl| \frac{a_{n}}{b_n}\biggr| \le  \frac{|g|+2\eta}{1-\eta}\le 2|g|+4\eta \le 2|g|+2=:M, \qquad n>n_1. \]

Możemy więc nierówność ananak przepisać w postaci

\[ \biggl|\frac{a_n}{b_n}- \frac{a_{n}-a_k}{b_{n}-b_k}\biggr|\le (M+1)\eta, \qquad n>n_1. \]

Zatem, dzięki warunkowi an-ak, dla $ n>n_1 $ jest

\[ \biggl| \frac{a_{n}}{b_n}-g\biggr| \le  \biggl|\frac{a_n}{b_n}- \frac{a_{n}-a_k}{b_{n}-b_k}\biggr|+\biggl| \frac{a_{n}-a_k}{b_{n}-b_k} - g\biggr| \le (M+1)\eta +\eta =(2|g|+4)\eta. \]

Wystarczy teraz dobrać $ \eta < \min\bigl(\frac 12, \eps/(2|g|+4)\bigr) $; otrzymamy wtedy $ |(a_n/b_n)-g|<\eps $ dla wszystkich $ n>n_1 $.

Ćwiczenie Analizując starannie powyższe rozumowanie, sprawdzić, że ostatnie twierdzenie wolno stosować także wtedy, gdy $ g=\pm\infty $ (tzn. do obliczania granic niewłaściwych).

Przykład Wykażemy, że dla każdego $ k\in\N $ jest

\[ \lim_{n\to\infty} \frac{1^k+2^k+\cdots+ n^k}{n^{k+1}} = \frac{1}{k+1}\, . \]

Zastosujemy Twierdzenie Stolza dla $ a_n=1^k+2^k+\cdots+ n^k $ i $ b_n=n^{k+1} $. Ciąg $ b_n $ jest rosnący i rozbieżny do $ +\infty $; to połowa założeń twierdzenia. Sprawdźmy więc jeszcze, że $ (a_{n+1}-{a_{n}})/(b_{n+1}-b_n)\to 1/(k+1) $, gdy $ n\to \infty $. Mamy

\[ \frac  {a_{n+1}-{a_{n}}}{b_{n+1}-b_n }=\frac{(n+1)^k}{(n+1)^{k+1}-n^{k+1}} \]

Korzystając ze wzoru na różnicę $ (k+1) $-szych potęg, a następnie dzieląc licznik i mianownik przez $ n^k $, otrzymujemy

\[ \frac  {a_{n+1}-{a_{n}}}{b_{n+1}-b_n }=\frac{(n+1)^k}{(n+1)^k+(n+1)^{k-1}n+\cdots + n^k}   =\frac{\Bigl(1+\frac 1n\Bigr)^k}{\Bigl(1+\frac 1n\Bigr)^k +\Bigl(1+\frac 1n\Bigr)^{k-1}+\cdots +1 }\, . \]

Z twierdzenia o arytmetycznych własnościach granicy nietrudno wywnioskować, że dla $ n\to\infty $ licznik ostatniego ułamka jest zbieżny do 1, a mianownik (w którym jest $ k+1 $ składników) do $ k+1 $.

Przykład (#) Jeśli ciąg $ x_n $ jest zbieżny do granicy $ x $, to ciąg średnich arytmetycznych

\[ 	A_n=\frac{x_1+x_2+\cdots+x_n}n  	\]

też jest zbieżny do granicy $ x $. Istotnie, biorąc w twierdzeniu Stolza $ a_n=x_1+x_2+\cdots+x_n $, $ b_n=n $, otrzymujemy

\[  \frac  {a_{n+1}-{a_{n}}}{b_{n+1}-b_n }=\frac{x_{n+1}}{(n+1)-n} = x_{n+1}\to x, \]

a zatem także

\[ A_n=\frac{a_n}{b_n}\to x\, . \]

Przykład (#) Jeśli ciąg liczb dodatnich $ x_n $ jest zbieżny do granicy $ x\ge 0 $, to ciąg średnich geometrycznych

\[ 	G_n=\sqrt[n]{x_1x_2\ldots x_n}  	\]

też jest zbieżny do granicy $ x $. Szczegóły dowodu, który można przeprowadzić, korzystając z poprzedniego przykładu oraz ciągłości funkcji wykładniczej i logarytmu, pozostawimy Czytelnikom.

Zadanie (#) Wykazać, że

\[ \lim_{n\to\infty} \frac{(n!)^{1/n}}{n} =\frac 1e\, . \]

Wskazówka. Zauważyć, że $ x_n=n^n/(1+n)^n $ ma granicę $ 1/e $ i skorzystać z poprzedniego przykładu.

Przykład Implikacji, która jest treścią twierdzenia Stolza, nie można odwrócić. Jeśli np. $ a_n=3n-(-1)^n $, $ b_n=3n+(-1)^n $, to łatwo zauważyć, że $ b_n $ rośnie monotonicznie do $ +\infty $ i, oczywiście,

\[                                                    \frac{a_n}{b_n}=\frac{3-\frac{(-1)^n}n}{3+\frac{(-1)^n}n} 	\to  \frac{3}3=1, 	\]

ale nietrudno sprawdzić, że $ a_{n+1}-a_n=3+2\cdot (-1)^n $, $ b_{n+1}-b_n=3-2\cdot (-1)^n $, więc ciąg $ (a_{n+1}-a_n)/(b_{n+1}-b_n) $ ma na przemian wyrazy równe $ 1/5 $ i $ 5 $, a to znaczy, że jest rozbieżny. Nie należy więc bez zastanowienia pisać $ \lim\frac{a_n}{b_n}=\lim\frac{a_n-a_{n-1}}{b_n-b_{n-1}}=\ldots $, gdyż może się okazać, że pierwsza granica istnieje, a druga - nie.

Zasadnicze twierdzenie algebry

Bardzo ważnym twierdzeniem, wykorzystywanym w różnych działach matematyki, jest następujący wynik.

Twierdzenie [zasadnicze twierdzenie algebry] Każdy różny od stałej wielomian zmiennej zespolonej o współczynnikach zespolonych ma w ciele $ \C $ co najmniej jeden pierwiastek.

Podamy tu -- opowiedziany we współczesnym języku - dowód tego twierdzenia, wykorzystujący własności funkcji ciągłych i podany przez C.F. Gaussa na przełomie XVIII i XIX wieku. Dowód wykorzystuje dwa lematy. Pierwszy z nich orzeka, że każdy wielomian zespolony osiąga kres dolny swojego modułu. To nie jest fakt całkowicie oczywisty, gdyż płaszczyzna $ \C $ nie jest zbiorem zwartym.

Lemat (#) Jeśli $ P(z)=a_0+a_1z+\cdots + a_nz^n $ dla $ z\in \C $, gdzie $ n\ge 1 $, $ a_0,a_1,\ldots, a_n\in \C $ i $ a_n\not=0 $, to istnieje punkt $ z_0\in \C $ taki, że

\[ 	|P(z_0)| = \inf_{z\in \C} |P(z)| 	\]

    Dowód Lematu~ [link] Bez zmniejszenia ogólności, mnożąc w razie potrzeby wielomian przez stałą, przyjmiemy, że $ a_n=1 $. Niech $ R>1 $ będzie dużą liczbą, której konkretną wartość dobierzemy za chwilę. Niech $ M=1+n\max_{j=0,\ldots,n-1} |a_j| $. Dla wszystkich $ |z|\ge R $ otrzymujemy po prostym rachunku, korzystając z nierówności trójkąta,

\[ \begin{eqnarray*} |P(z)| & = & |z|^n \left| 1 +\frac{a_{n-1}}{z}+\cdots +\frac{a_0}{z^n} \right| \ge |z|^n\left(1-\frac{|a_{n-1}|}{|z|}-\cdots - \frac{|a_0|}{|z|^n}\right) \\ &\ge & |z|^n \left(1-\frac{|a_{n-1}|+\cdots + |a_0|}{R}\right) \quad\mbox{gdyż $|z|^{n}> |z|^{n-1}> \ldots > |z|\ge R>1$}  \\ &> &  R^n \left(1-\frac MR\right) \quad\mbox{gdyż $|z|\ge R$ i $M>|a_{n-1}|+\cdots + |a_0|$}\\  & > & \frac{R^n}2 > |a_0|+1 = |P(0)|+1, \end{eqnarray*} \]

pod warunkiem, że liczba $ R>1 $ została wybrana tak, aby

\[ \frac{M}{R}<\frac 12 \quad\mbox{oraz}\quad R> \sqrt[n]{2(|a_0|+1)}\, , \]

co łatwo można zagwarantować. Zatem, poza kołem domkniętym $ K_R=\{z\in \C \colon |z|\le R\} $ funkcja $ |P| $ przyjmuje wartości większe od liczby $ |P(0)|+1 $. Ponieważ $ 0\in K_R $, więc

\[ \inf_{z\in K_R} |P(z)| \le |P(0)|< |P(0)|+1\le \inf_{z\in \C\setminus K_R} |P(z)| \]

i dlatego

\[ \inf_{z\in K_R} |P(z)| =   \inf_{z\in \C} |P(z)|\, .   \]

Koło domknięte $ K_R $ jest zbiorem zwartym, a $ |P|\colon K_R\to \R $ jest funkcją ciągłą. Z twierdzenia Weierstrassa o przyjmowaniu kresów (patrz Twierdzenie~ [link] i Uwaga~ [link]) wynika, że istnieje taki punkt $ z_0\in K_R $, iż

\[ |P(z_0)|= \inf_{z\in K_R} |P(z)| =   \inf_{z\in \C} |P(z)|\, .\qquad \mbox{<p style="text-align: right">&square;</p>}  \]
Lemat (#) Jeśli $ P(z)=a_0+a_1z+\cdots + a_nz^n $ dla $ z\in \C $, gdzie $ n\ge 1 $, $ a_0,a_1,\ldots, a_n\in \C $ i $ a_n\not=0 $, a $ z_0\in \C $ jest punktem takim, że

\[ 	|P(z_0)| = \inf_{z\in \C} |P(z)|\, , 	\]

to wówczas $ P(z_0)=0 $.

    Dowód Lematu~ [link] Dla wielomianów stopnia 1 lemat jest oczywisty: każdy taki wielomian ma pierwiastek $ z_0 $ i w nim osiąga kres dolny swojego modułu.

Niech więc $ P $ będzie wielomianem zespolonym stopnia $ n>1 $. Przypuśćmy, że

\[ |P(z_0)| = \inf_{z\in \C} |P(z)|>0 \]

Rozpatrzmy wielomian pomocniczy $ Q(z)=P(z+z_0)\cdot\overline{P(z_0)} $ (przesuwamy wielomian $ P $ i mnożymy go przez stałą). Mamy $ Q(0)=P(z_0)\cdot\overline{P(z_0)}=|P(z_0)|^2>0 $, więc $ Q $ spełnia zależność

\[ \begin{equation} 	\label{Q0} |Q(0)|=Q(0) = \inf_{z\in \C} |Q(z)| > 0.  \end{equation} \]

Wyróżnijmy teraz najniższą dodatnią potęgę $ z $, która w $ Q $ występuje ze współczynnikiem różnym od zera, tzn. wybierzmy $ k\in \{1,2,\ldots, n\} $ tak, aby

\[ Q(z)=b_0+b_kz^k +b_{k+1}z^{k+1}+\cdots +b_nz^n = b_0+ b_kz^k + z^kq(z), \]

gdzie $ b_0=Q(0)>0 $ i $ q(z)=b_{k+1}z+b_{k+2}z^2+\cdots +b_nz^{n-k} $. Gdy $ k=n $, to po prostu $ q(z)=0 $.

Oszacujemy $ |Q(z)| $, starając się wskazać punkt $ z $ tak, aby otrzymać $ |Q(z)|< |Q(0)|= Q(0)=b_0 $ i uzyskać sprzeczność, która zakończy dowód. Na mocy nierówności trójkąta

\[ |Q(z)|\le |b_0+b_kz^k| + |z|^k |q(z)|\, . \]

Niech $ z=re^{it} $, gdzie $ r=|z|>0 $ i $ t=\mathrm{arg}\, z\in \R $. Ustalmy małą liczbę $ \eps>0 $, której wartość dobierzemy później.

Ponieważ $ q $ jest (jak każdy wielomian) funkcją ciągłą i $ q(0)=0 $, więc istnieje $ \delta>0 $ takie, że dla wszystkich $ |z|=r\in (0,\delta) $ jest $ |q(z)|<\eps $. Wtedy

\[ Q(z)|< |b_0+b_kz^k| + r^k \eps \, . \]

Argument $ t $ liczby $ z $ wybierzemy tak, aby $ b_kz^k=b_kr^k\exp(itk) $ było liczbą rzeczywistą ujemną. Zapiszmy $ b_k $ w postaci $ b_k=|b_k|\exp(is) $, gdzie $ s=\mathrm{arg}\, b_k $. Wtedy

\[ b_kz^k=|b_k|\exp(is)\cdot r^k\exp(itk)=|b_k|r^k\exp\bigl(i(s+tk)\bigr) = -|b_k|r^k < 0 \]

np. dla $ s+tk=\pi $, tzn. dla

\[ t=\frac{\pi-s}{k}=\frac{\pi - \mathrm{arg}\, b_k}{k}\, . \]

Zatem, dla $ z=re^{it} $, gdzie $ r\in (0,\delta) $ i $ t=\frac{\pi - \mathrm{arg}\, b_k}{k} $, jest

\[ \begin{eqnarray*} |Q(z)| & < &\left|b_0-|b_k|r^k \right| +r^k\eps\\ & = & b_0-|b_k|r^k + r^k\eps \qquad\mbox{gdy } r< \delta_1:=\min\left(\frac{b_0}{\sqrt[k]{|b_k|}},\delta\right)\\ & = & b_0-\frac{|b_k|}2 r^k  \qquad\mbox{gdy } r< \delta_1 \mbox{ oraz } \eps=\frac{|b_k|}2\\ &<& b_0=Q(0)=|Q(0)|\, . \end{eqnarray*} \]

To jest sprzeczność, gdyż $ |Q(0)|=\inf |Q| $. Musi więc być $ Q(0)=|P(z_0)|^2=0 $.

Czytelnik-koneser zauważył być może, że w ostatnim dowodzie posługiwaliśmy się w gruncie rzeczy rozwinięciem Taylora-Maclaurina wielomianu $ Q $ w zerze, wyodrębniwszy zeń najważniejszy składnik $ b_kz^k $. Wielomian $ q(z) $ to wynik dzielenia reszty przez $ z^k $.

    Dowód zasadniczego twierdzenia algebry. Niech $ P $ będzie różnym od stałej wielomianem zespolonym. Na mocy Lematu~ [link], istnieje $ z_0\in \C $ takie, że

\[ |P(z_0)| = \inf_{z\in \C} |P(z)|\, . \]

Z Lematu~ [link] wynika, że $ P(z_0)=0 $.

Definicja Niech $ k\in \N $. Liczba $ z_0 $ nazywa się $ k $-krotnym pierwiastkiem wielomianu $ P $ wtedy i tylko wtedy, gdy $ P $ jest podzielny przez jednomian $ (z-z_0)^k $, ale nie jest podzielny przez $ (z-z_0)^{k+1} $.
Wniosek [rozkład wielomianu zespolonego na czynniki liniowe] Jeśli $ P $ jest wielomianem zespolonym stopnia $ n\ge 1 $, $ P(z)=a_0+a_1z+\cdots+a_nz^n $, $ a_n\not=0 $, to istnieją liczby $ z_1,\ldots,z_m\in \C $ takie, że $ z_j $ jest $ k_j $-krotnym pierwiastkiem $ P $ dla $ j=1,\ldots,m $ oraz

\[ 	k_1+k_2+\cdots+k_m=n\, . 	\]

Zachodzi równość

\[ P(z)=a_n\cdot \prod_{j=1}^m (z-z_j)^{k_j}\, , \qquad z\in \C\, . \]

Dowód:
Dla $ n=1 $ teza wniosku jest oczywista. Dla $ n>1 $ tezy dowodzimy przez indukcję, posługując się zasadniczym twierdzeniem algebry.

Wniosek [rozkład wielomianu rzeczywistego na czynniki](#) Każdy wielomian rzeczywisty $ P $ stopnia $ n\ge 1 $, $ P(x)=a_0+a_1x+\cdots+a_nx^n $ (gdzie $ a_j\in \R $ dla $ j=0,1,\ldots, n $ i~$ a_n\not=0 $) jest iloczynem czynników liniowych i takich trójmianów kwadratowych o współczynnikach rzeczywistych, które nie mają pierwiastków rzeczywistych. Niektóre z~tych czynników mogą być równe.

Dowód:
Na mocy poprzedniego wniosku,

\[ \begin{equation} \label{wielrzecz} P(x)=a_n\cdot \prod_{j=1}^m (x-z_j)^{k_j}\, , \qquad x\in \R\, . \end{equation} \]

gdzie $ z_j $zespolonymi pierwiastkami wielomianu $ P $. Ponieważ wszystkie współczynniki wielomianu są rzeczywiste, więc mamy także

\[ P(x)=\overline{P(x)} =  a_n\cdot \prod_{j=1}^m (x-\overline{z_j})^{k_j}\, , \qquad x\in \R\, . \]

Zatem: jeśli $ z_j\in \C\setminus \R $ jest pierwiastkiem $ P $, to i $ \overline{z_j} $ jest pierwiastkiem $ P $. Ponieważ

\[ (x-z_j)(x-\overline{z_j})= x^2-2\mathrm{Re}\, z_j \cdot x + |z_j|^2 \]

jest trójmianem kwadratowym o współczynnikach rzeczywistych, którego nie można w $ \R $ rozłożyć na czynniki liniowe (bo pierwiastki są w $ \C\setminus\R!) $), więc łącząc w pary odpowiednie czynniki prawej strony wielrzecz, rozłożymy $ P $ na pewną liczbę czynników liniowych (odpowiadających rzeczywistym pierwiastkom $ P $, liczonym z krotnościami) i pewną liczbę czynników kwadratowych (odpowiadającym parom pierwiastków $ z_j,\overline{z_j}\in \C\setminus \R $ wielomianu $ P $, również liczonym z krotnościami). Żaden czynnik kwadratowy nie ma pierwiastków w $ \R $.

Zadanie Wykazać, że $ x_0\in\R $ jest $ k $-krotnym pierwiastkiem wielomianu $ P $ o współczynnikach rzeczywistych wtedy i tylko wtedy, gdy

\[ P(x_0)=P'(x_0)=\ldots = P^{(k-1)}(x_0), \qquad P^{(k)}(x_0)\not= 0\, . \]

     Wskazówka. Posłużyć się definicją, twierdzeniem Bezout (znanym ze szkolnego kursu matematyki) i~wzorem Leibniza na wyższe pochodne iloczynu dwóch funkcji.

Zadanie Niech

\[ Q(z_1,\ldots,z_m)= \sum_{\text{skończ.}} a_{k_1k_2\ldots k_m} z^{k_1}\cdot z^{k_2}\cdot \ldots\cdot z^{k_m} \]

będzie różnym od stałej wielomianem $ m>1 $ zmiennych zespolonych o współczynnikach $ a_{k_1k_2\ldots k_m}\in \C $. Wykazać, że $ Q $ ma co najmniej jeden pierwiastek. Czy zbiór pierwiastków takiego wielomianu może być skończony?

Metoda stycznych (Newtona)

Omówimy w tym podrozdziale prostą wersję tak zwanej metody stycznych Newtona, służącej do przybliżonego rozwiązywania równań typu $ f(x)=0 $.

Zacznijmy od przytoczenia zadania, które w połowie lat 90-tych dwudziestego wieku pojawiło się na zawodach drugiego etapu Olimpiady Matematycznej.

Zadanie (#) Dane są dwa ciągi liczb rzeczywistych, $ x_1=y_1=1 $ oraz

\[ y_{n+1} =  \frac{y_n+2}{y_n+1},  \qquad x_{n+1} =  \frac{x_n^2+2}{2x_n} \qquad\mbox{dla $n=1,2,3,\ldots$. }        \]

Wykazać, że $ x_{n+1} = y_{\kern0.5pt\lower2pt\hbox{{ $\scriptstyle{2^n}$ }}}  $ dla wszystkich $ n=1,2,3,\ldots $.

Zadanie ma kilka rozwiązań. To, które przedstawimy, nie jest najkrótsze, ale ma tę zaletę, że pozwala głębiej zrozumieć, skąd pochodzi problem i co jest w nim istotne.

    Rozwiązanie. Wypiszmy tabelkę z początkowymi wyrazami obu ciągów. \begin{center} 	\begin{tabular}{lccccc} 	$n$ & 1 & 2 & 3 & 4 & 5 \\  	$y_n\qquad $ & 1 & $1,\! 5$ & $1,\! 4$ & $1,\! 416\ldots$ & $1,\! 41379\ldots$  \\[5pt] 	$y_n^2\qquad$ & 1 & $2,\! 25$ & $1,\! 96$ & $2,\! 006\ldots$ & $1,\! 9988\ldots$ \\[5pt] 	$x_n$ & 1 & $1,\! 5$ & $1,\! 416\ldots $ & $1,\! 4142\ldots$ 	& $1,\! 4142135\ldots$ \\[5pt] 	$x_n^2$ & 1 & $2,\! 25$ & $2,\! 006\ldots$ & $2,\! 000006\ldots$ & $2,\! 000000000004\ldots$ 	\end{tabular} \end{center} Widać, że kwadraty liczb $ x_n $ są coraz bliższe $ 2 $ (podobnie zresztą jak kwadraty liczb $ y_n $). Łatwo jest zauważyć, że gdyby ciąg $ x_n $ był zbieżny, to jego granicą byłaby liczba $ g=\sqrt{2} $. Dlaczego? Jeśli $ \lim x_n=g $ istnieje, to musi spełniać równość (Mnożymy obie strony wzoru rekurencyjnego przez $ 2x_n $ i przechodzimy do granicy, korzystając z twierdzenia o granicy sumy i iloczynu ciągów zbieżnych) $ 2g\cdot g=g^2+2 $, lub równoważnie $ g^2=2 $. Ponieważ wszystkie $ x_n $ są dodatnie, więc możliwość $ g=-\sqrt 2 $ odrzucamy.

Podobne rozumowanie można przeprowadzić dla ciągu $ y_n $. Jeśli $ \lim y_n=g $, to liczba $ g $ spełniałaby równość $ g=(g+2)/(g+1) $ i była nieujemna, więc byłoby $ g=\sqrt 2 $.

Pokażemy, że oba ciągi są zbieżne do $ \sqrt{2} $. W tym celu wyrazimy zarówno $ x_n $, jak i $ y_n $, jawnymi wzorami.

Zbadajmy, jak zmieniają się różnice $ y_n-\sqrt{2} $ i $ x_n-\sqrt{2} $, gdy zmienia się liczba $ n $. Ze wzoru na $ y_{n+1} $ wynika, że

\[ \begin{eqnarray*} y_{n+1}-\sqrt{2} &  = & \frac{y_n+2}{y_n+1}-\sqrt{2} \ =\ \frac{y_n+2- y_n\sqrt{2}-\sqrt{2}}{y_n+1}  \\ [5pt] & = & \frac{y_n-\sqrt{2}}{y_n+1}\, (1-\sqrt{2})\, . \end{eqnarray*} \]

Gdy do $ y_{n+1} $ dodamy pierwiastek z dwóch, otrzymamy

\[ y_{n+1}+\sqrt{2}  =  \frac{y_n+\sqrt{2}}{y_n+1}\, (1+\sqrt{2})\, . \]

(Wystarczy przepisać poprzedni rachunek, zastępując wszystkie minusy plusami). Krótko mówiąc,

\[ y_{n+1} \pm \sqrt{2}  =  \frac{y_n \pm \sqrt{2}}{y_n+1}\, (1 \pm \sqrt{2})\, . \]

Można te dwa równania podzielić stronami,

\[ \frac{y_{n+1}-\sqrt{2}}{y_{n+1}+\sqrt{2}}  = \frac{y_n-\sqrt{2}}{y_n+\sqrt{2}} \, \cdot\, \frac{1-\sqrt{2}}{1+\sqrt{2}}\, , \]

i wywioskować stąd, że ciąg

\[z_n = \frac{y_n-\sqrt{2}}{y_n+\sqrt{2}}\]

jest geometryczny, a jego iloraz jest równy $ a=(1-\sqrt{2})/(1+\sqrt{2}) $; dlatego

\[ z_{n+1}= a \cdot {z_n}  = a \cdot ({a\cdot z_{n-1}})  = \ldots  = a^n \cdot z_1  = a^{n+1}\, . \]

Stąd łatwo wyliczamy (rozwiązując równanie z jedną niewiadomą):

\[ \begin{equation} \label{y-n-stycz}	   	y_n = \sqrt{2}\, \cdot\, \frac{1+a^n}{1-a^n}\, , 	\qquad\mbox{gdzie } a= \frac{1-\sqrt 2}{1+\sqrt 2}\, . \end{equation} \]

Ponieważ $ |a|<1 $, więc $ a^n\to 0 $, a zatem $ y_n\to \sqrt 2 $.

Z ciągiem $ x_n $ postępujemy tak samo: obliczamy $ x_{n+1}\pm \sqrt 2 $, posługując się w tym celu zależnością $ x_{n+1} $ od $ x_n $. Otrzymujemy tym razem

\[ \begin{eqnarray*} x_{n+1} \pm \sqrt{2} & = & \frac{x_n^2-2x_n\cdot\sqrt{2} + 2}{2x_n} \\ [5pt] & = & \frac{(x_n\pm \sqrt 2)^2}{2x_n}\, . \end{eqnarray*} \]

Jak wcześniej, dzielimy te dwa równania stronami, żeby pozbyć się niewygodnego mianownika:

\[ \frac{x_{n+1}-\sqrt{2}}{x_{n+1}+\sqrt{2}} = \left(\, \frac{x_n-\sqrt{2}}{x_n+\sqrt{2}}\, \right)^2\, . \]

Krótko mówiąc, jeśli $ w_n= ({x_n-\sqrt{2}})/({x_n+\sqrt{2}}) $, to

\[ w_{n+1} \ = \ w_n^2  \ = \ (w_{n-1}^2)^2  = \ldots  = w_1^{2^n}\, . \]

Zachodzi więc równość

\[ \frac{x_{n+1}-\sqrt{2}}{x_{n+1}+\sqrt{2}} = w_1^{2^n} = a^{2^n}. \]

Stąd

\[ \begin{equation} \label{x-n-stycz}  x_{n+1}= \sqrt{2}\, \cdot\, \frac{1+a^{2^n}}{1-a^{2^n}}\, , \qquad\mbox{gdzie } a= \frac{1-\sqrt 2}{1+\sqrt 2}\, .   \end{equation} \]

Teza zadania jest prostym wnioskiem z otrzymanych wzorów y-n-stycz, x-n-stycz.

Wykazaliśmy więcej, niż wymagał autor zadania. Zanleźliśmy konkretne wzory na $ x_n $ i $ y_n $. Sprawdziliśmy też, że każdy z tych ciągów składa się z wymiernych przybliżeń $ \sqrt{2} $. Które przybliżenia są lepsze? Oczywiście te, które daje ciąg $ x_n $. Wszak $ x_{n+1}= y_{\kern0.5pt\lower2pt\hbox{{ $\scriptstyle{2^n}$ }}} $. Z równości $ w_{n+1}=w_n^2 $, którą spełniają liczby $ w_n= ({x_n-\sqrt{2}})/({x_n+\sqrt{2}}) $, można wywnioskować, że liczba cyfr znaczących przybliżenia $ x_n\approx \sqrt 2 $ ulega z grubsza podwojeniu, gdy zwiększamy $ n $ o 1. (Intuicyjnie biorąc, powód jest taki: $ w_n\approx 0 $ z dużą dozą dokładności; przechodząc do $ w_{n+1} $, błąd przybliżenia podnosimy do kwadratu. Proszę sprawdzić, jak zmienia się przy takiej operacji liczba zer po przecinku.) Postawmy teraz naturalne pytanie: no dobrze, ale skąd właściwie wzięły się oba ciągi? Czy to tylko przypadkowy temat jakiegoś olimpijskiego zadania?

Otóż nie. Ciąg $ y_n $ to kolejne przybliżenia $ \sqrt{2} $ za pomocą ułamków łańcuchowych. Co to znaczy? Ponieważ $ (\sqrt 2 -1) (\sqrt 2 + 1)=2-1=1 $, więc

\[ \sqrt{2}-1 =\frac{1}{\sqrt{2}+1} = \frac{1}{2+ (\sqrt{2}-1)}. \]

Postępując dalej podobnie, tzn. zastępując różnicę $ \sqrt 2 -1  $ ułamkiem $ 1/(2+(\sqrt 2 -1)) $, otrzymamy coraz bardziej fantazyjne piętrowe ułamki: \begin{equation*} \frac{1}{2+\displaystyle\frac{1}{2+ (\sqrt{2}-1)}}\, , \qquad \frac{1}{2+\displaystyle\frac{1}{2+ \displaystyle\frac{1}{2+ (\sqrt{2}-1)}}}\, , \qquad \frac{1}{2+\displaystyle\frac{1}{2+ \displaystyle\frac{1}{2+ \displaystyle\frac{1}{2+ (\sqrt{2}-1)}}}}\, , \qquad \ldots \end{equation*} \] Gdybyśmy usunęli nawiasy $ (\sqrt 2 -1) $ i zostawili tylko jedynki w kolejnych licznikach, dwójki, plusy i kreski ułamkowe, otrzymalibyśmy liczby $ y_n-1 $ (z przesunięciem numeracji i zapisane w niewygodnej postaci). Można to udowodnić przez indukcję.

Natomiast ciąg $ x_n $ to kolejne przybliżenia $ \sqrt{2} $ otrzymywane metodą stycznych. (Wg. historyków matematyki, metodę stycznych Newton obmyślił ok. roku 1670.) Jest to bardzo użyteczny sposób, który pozwala szybko i wygodnie znajdować przybliżone rozwiązania bardzo wielu równań - także i takich, których nie potrafimy rozwiązać jawnie.

Sformułujmy teraz precyzyjny, ogólny wynik.

Twierdzenie [metoda stycznych] (#) Załóżmy, że $ f\colon [a,b]\to \R $ jest funkcją ciągłą na $ [a,b] $ i dwukrotnie różniczkowalną w $ (a,b) $. Załóżmy także, że $ f(a)<0<f(b) $ oraz istnieją stałe $ m_1>0 $ i $ M_2>0 $ takie, że

\[ \begin{equation} \label{zal-stycz} f'(x)>m_1>0, \quad 0<f''(x)< M_2 \qquad\mbox{dla wszystkich $x\in (a,b)$.} \end{equation} \]

Wówczas ciąg rekurencyjny

\[ x_1=b, \quad x_{n+1}=x_n-\frac{f(x_n)}{f'(x_n)} \]

jest malejący, a jego granica $ c=\lim x_n $ jest jedynym punktem przedziału $ [a,b] $ takim, że $ f(c)=0 $. Ponadto, zachodzi oszacowanie

\[ \begin{equation}   	\label{oszac-stycz} |c-x_{n+1}|\le \frac{M_2}{2m_1}|c-x_n|^2, \qquad n=1,2,\ldots . \end{equation} \]

\begin{figure}[!h] \begin{center}             \includegraphics*[totalheight=10.3cm]{styczne.png} </p>
<p>\end{center}

{\footnotesize\baselineskip 11pt

Metoda stycznych: $ f $ jest rosnąca i wypukła na $ (a,b) $, wewnątrz tego przedziału ma jedno miejsce zerowe.

} \end{figure}

Uwaga Nietrudno zauważyć, że $ x_{n+1} $ jest miejscem zerowym stycznej do wykresu $ f $, poprowadzonej w punkcie $ (x_n,f(x_n)) $; ma ona równanie

\[ 	y=f(x_n)+f'(x_n)(x-x_n), 	\]

a zatem $ y=0 $ wtedy i tylko wtedy, gdy $ x-x_n=-f(x_n)/f'(x_n) $, a więc wtedy i tylko wtedy, gdy $ x=x_{n+1} $. (Patrz także zamieszczony rysunek, który ułatwia zrozumienie całej sytuacji).

Dowód:
Z założeń wynika, że $ f $ jest rosnąca i ściśle wypukła na $ [a,b] $. Ponieważ $ f(b)>0>f(a) $, więc $ f $ ma w $ (a,b) $ dokładnie jedno miejsce zerowe $ c $ (jedyność wynika z monotoniczności, a istnienie z własności Darboux).

Funkcja $ f $ jest ściśle wypukła, więc jej wykres leży nad dowolną swoją styczną. Korzystając z tej obserwacji i z założenia $ f(x_1)=f(b)>0 $, łatwo dowodzimy przez indukcję, że $ f(x_n)>0 $ $ c<x_n+1<x_n\le b $ dla wszystkich $ n\in \N $. Istotnie, $ b=x_1 $, więc $ f(x_1)>0 $, a stąd $ x_2=x_1-f(x_1)/f'(x_1)<x_1 $, gdyż $ f'>0 $. Wykres $ f $ leży nad styczną poprowadzoną w punkcie $ (x_1,f(x_1)) $, a $ x_2 $ jest miejscem zerowym tej stycznej, zatem $ f(x_2)>0 $ i $ c<x_2 $. To jest początek indukcji; krok indukcyjny wygląda praktycznie tak samo - szczegóły pozostawiamy Czytelnikowi.

Ponieważ $ (x_n) $ jest malejący i ograniczony z dołu (przez $ c $), więc ma granicę. Z ciągłości $ f $ i $ f' $ (zagwarantowanej przez istnienie $ f'' $) wynika, że $ g=\lim x_n $ spełnia równość $ g=g-f(g)/f'(g) $. Stąd $ f(g)=0 $, tzn. $ g=c $, gdyż wiemy, że $ c $ jest jedynym miejscem zerowym funkcji $ f $ w przedziale $ (a,b) $.

Pozostaje wykazać nierówność oszac-stycz. Wykorzystamy w tym celu wzór Taylora z resztą Lagrange 'a (patrz Wniosek~ [link]). Wynika z niego, że

\[ 0=f(c)=f(x_n)+f'(x_n)(c-x_n)+\frac{f''(\xi_n)}{2}(c-x_n)^2 \qquad\mbox{dla pewnego $\xi_n \in (c,x_n)$.} \]

Dzieląc przez $ f'(x_n) $, otrzymujemy

\[ 0=\frac{f(x_n)}{f'(x_n)} + c- x_n + \frac{f''(\xi_n)}{2f'(x_n)}(c-x_n)^2 \, , \]

lub równoważnie

\[ c-x_{n+1}=c-x_n+\frac{f(x_n)}{f'(x_n)} =  -\frac{f''(\xi_n)}{2f'(x_n)}(c-x_n)^2 \, . \]

Ponieważ prawa strona jest ujemna, więc

\[ |c-x_{n+1}|=  \frac{f''(\xi_n)}{2f'(x_n)}(c-x_n)^2<   \frac{M_2}{2m_1}|c-x_n|^2\, . \]

(Skorzystaliśmy z oszacowań $ 0<f''<M_2 $ i $ f'>m_1>0 $). Dowód jest zakończony.

Uwaga Ciąg $ x_n $ jest nie tylko zbieżny do $ c $, ale spełnia zależność

\[ 	|c-x_{n+1}|\le A\cdot |c-x_n|^2\, , \qquad n\in \N\, , 	\]

gdzie $ A $ jest stałą; dlatego tempo zbieżności jest bardzo szybkie. Aby to zrozumieć, przypuśćmy na chwilę bez zmniejszenia ogólności, że $ A>1 $. Gdy już wiemy, że dla pewnego $ n $ jest $ |c-x_n|<1/A^2 $, to wówczas

\[ |c-x_{n+1}|<\frac 1{A^3}, \quad |c-x_{n+2}|<\frac 1{A^5},  \quad |c-x_{n+3}|<\frac 1{A^9}, \quad\ldots\quad, |c-x_{n+k}|<\frac 1{A^{2{k}+1}},  \quad \ldots \]

Zatem od pewnego momentu $ n=n_0 $ odstęp $ |c-x_{n+k}| $ maleje wraz ze wzrostem $ k $ w takim tempie, jak $ 1/A^{2^k+1} $, czyli znacznie szybciej, niż np. ciąg geometryczy $ 1/A^k $.

Przykład Niech $ f(x)=x^2-2 $ dla $ x\in [a,b] $, gdzie $ a=1 $ i $ b=2 $. Mamy $ f'(x)=2x>2 $ na $ (a,b) $ i $ f''(x)\equiv 2 $, a ponadto $ f(a)=-1<0<f(b)=2 $, więc $ f $ spełnia wszystkie założenia Twierdzenia~ [link]. W tym przypadku mamy

\[          	x_{n+1}=x_n-\frac{f(x_n)}{f'(x_n)}=\frac{2x_n^2-(x_n^2-2)}{2x_n}= \frac{x_n^2+2}{2x_n}, \qquad x_1=2, \quad x_2=\frac{3}{2}. 	\]

Zatem, począwszy od $ x_2 $, otrzymujemy właśnie ciąg $ (x_n) $ z Zadania~ [link]. Tylko pierwszy wyraz jest inny, wszystkie następne są identyczne

\begin{figure}[!t] \begin{center}             \includegraphics*[totalheight=7cm]{styczne-bad.png} </p>
<p>\end{center}

{\footnotesize\baselineskip 11pt

Metoda stycznych: $ f $ ma kilka minimów i maksimów, nie jest ani wklęsła, ani wypukła.

} \end{figure}

Uwaga Założenie o monotoniczności i wypukłości $ f $ jest niezwykle istotne. Analogiczne twierdzenia można sformułować i udowodnić dla funkcji rosnących i wklęsłych, malejącychi wypukłych, oraz malejących i wklęsłych. Czytelnik zechce zastanowić się nad sformułowaniami i zmianami w dowodzie. Ważna jest ogólna reguła: ``rysowanie stycznych należy zaczynać od tego końca przedziału, gdzie $ |f'| $ jest większy (tzn. wykres ma większe nachylenie''. Jeśli $ f $ ma minima i maksima, a także przedziały wklęsłości i wypukłości, to nie ma żadnej gwarancji, że ciąg wyprodukowany metodą stycznych (1) w ogóle będzie zbieżny, (2) będzie zbieżny akurat do tego pierwiastka równania $ f(c)=0 $, który leży najbliżej punktu $ x_1 $. Jeden z możliwych prostych przykładów takiej sytuacji przedstawiony jest na rysunku. Pełna i kompletna analiza zachowań takich ciągów dla różnych wyborów $ x_1 $ i dowolnych funkcji $ f $ dwukrotnie różniczkowalnych jest, w ogólności, zagadnieniem wykraczającym poza możliwości współczesnej matematyki. Takimi problemami zajmuje się dziedzina, nazywana teorią układów dynamicznych.