Całka

W tym rozdziale zajmujemy się całkowaniem. Jest to, obok różniczkowania i znajdowania wszelakich granic, jedna z najważniejszych operacji w całej analizie matematycznej.

Mówiąc niezbyt precyzyjnie, całkowanie jest operacją odwrotną do różniczkowania. Dlatego wiele reguł i twierdzeń, opisujących własności różniczkowania, można natychmiast, bez żadnego trudu, przełożyć na odpowiednie własności całkowania. Jednak, o ile różniczkowanie funkcji elementarnych jest zajęciem mechanicznym (wystarczy nauczyć się pewnej liczby wzorów i uwaznie je stosować), o tyle całkowanie funkcji elementarnych wymaga większej biegłości i wiąże się (czasem) z różnymi utrudnieniami, o których jeszcze wspomnimy.

Zobaczymy, że obliczanie całki (oznaczonej) polega w istocie na uśrednianiu wartości funkcji (na pewnym przedziale). Taki jest podstawowy sens operacji całkowania. Dzięku temu całkowanie przydaje się m.in. w geometrii, do obliczania długości krzywych oraz pól i objętości różnych figur i brył, a także wszędzie tam - np. w fizyce i matematycznych metodach finansów i ekonomii - gdzie trzeba znaleźć średnią wartość jakiejś wielkości, która zmienia się np. wraz z biegiem czasu.

Całka nieoznaczona

Definicja Niech $ f\colon P\to \R $, gdzie $ P\subset \R $ jest dowolnym przedziałem. Całką nieoznaczoną funkcji $ f $ nazywamy rodzinę wszystkich funkcji pierwotnych funkcji $ f $.

Przypomnijmy, że $ F $ jest funkcją pierwotną $ f $ na $ P $, gdy $ F'=f $ na $ P $. Wiemy już, że każda funkcja ciągła $ f\colon P\to \R $ ma funkcję pierwotną (patrz Twierdzenie~ [link]) i że dowolne dwie funkcje pierwotne $ F_1,F_2\colon P\to \R $ tej samej funkcji $ f $ różnią się o stałą (patrz Stwierdzenie~ [link]). Używa się zwykle zapisu

\[ \begin{equation} \label{symbolcalki}	 \int f(x)\, dx = F(x) +\mathrm{const}, \end{equation} \]

gdzie $ F $ jest dowolnie wybraną funkcją pierwotną $ f $ na danym przedziale.

Uwaga (#) Jeśli naturalną dziedziną $ f $ nie jest przedział, tylko suma dwóch lub więcej rozłącznych przedziałów, to wtedy różnica dwóch funkcji pierwotnych $ f $ nie musi być stała. Niech np. $ f(x)=-1/\sin^2 x $ dla $ x\in U=\R\setminus\{k\pi\colon k\in \Z\} $. Wiemy, że $ F_1(x)=\ctg x $ jest na zbiorze $ U $ funkcją pierwotną $ f $, bo $ (\ctg x)'=-1/\sin^2 x $. Niech

\[ 	F_2(x) = \ctg x + k\quad\mbox{dla $x\in \bigl(k\pi, (k+1)\pi\bigr)$}, \quad k\in \Z. 	\]

(Na każdym z przedziałów $ \bigl(k\pi, (k+1)\pi\bigr) $ przesuwamy wykres cotangensa o inną stałą). Wtedy także $ F_2'(x)=-1/\sin^2 x $, ale $ F_2-F_1 $ nie jest funkcją stałą na dziedzinie cotangensa, tylko funkcją stałą na każdym przedziale zawartym w dziedzinie cotangensa. O takich funkcjach mówi się czasem, że są lokalnie stałe.

Warto zatem interpretować literę $ C $ we wzorze symbolcalki jako funkcję lokalnie stałą. Jeśli dziedzina $ f $ jest przedziałem, chodzi po prostu o stałą.

Przykład Dzięki wzorom na pochodne wybranych funkcji elementarnych otrzymujemy natychmiast długą listę wzorów na całki nieoznaczone:

\[ \begin{eqnarray} \int x^a\, dx & = & \frac{x^{a+1}}{a+1} + C, \qquad a\not=-1;  \label{intxa}\\ \int \frac{1}{x}\, dx & = &  \ln |x| + C, \label{int1przezx}\\ \int e^x\, dx & = & e^x + C, \\ \int \sin x\, dx & = & -\cos x + C,\\ \int \cos x\, dx & = & \sin x + C,\\ \int \frac{dx}{\cos^2 x} & = & \tg x + C, \label{int1przezcos2}\\ \int \frac{dx}{\sqrt{1-x^2}} & = & \arcsin x + C,\\ \int \frac{dx}{1+x^2} & = & \arctg x + C. \end{eqnarray} \]

Wzór intxa wolno stosować na każdym przedziale, na którym można określić funkcję $ x^a $ - w szczególności, dla wymiernych $ a=p/q $, gdzie $ p\in Z $ i $ q\in N $, $ q=2k+1 $ dla pewnego $ k\in \N $, wzór ten ma sens na całej prostej.

Posługując się wzorami int1przezx i int1przezcos2, należy pamiętać, że litera $ C $ może oznaczać inną stałą na każdym z przedziałów, których suma stanowi dziedzinę całkowanej funkcji. Mamy tu do czynienia z tym samym zjawiskiem, o którym była mowa w Uwadze~ [link].

Powyższa lista wzorów nie jest kompletna. Nie ma na niej np. wzoru na całkę z tangensa czy z logarytmu naturalnego, bo $ \tg $ i $ \ln $ nie znalazły się wśród wyników wzorów na pochodne w podrozdziale~ [link]. Aby obliczyć takie całki, trzeba nauczyć się kilku dodatkowych reguł. Wspomnijmy jednak, że bywa i tak, że całki z funkcji elementarnej nie można wyrazić przez funkcje elementarne (choć wiadomo z Twierdzenia~ [link]). Najważniejszy przykład takiej sytuacji to $ \int \exp(-x^2)\, dx $, która nie wyraża się przez funkcje elementarne, tzn. przez skończoną liczbę operacji algebraicznych i składania na wielomianach, funkcji wykładniczej, funkcjach trygonometrycznych i funkcjach odwrotnych do nich.

Własności całek nieoznaczonych

(#)

Stwierdzenie [liniowość całki] Jeśli $ f,g\colon P\to \R $ są ciągłe, zaś $ a,b\in \R $, to

\[ \int \bigl( a f(x)+bg(x)\bigr)\, dx = a \int f(x)\, dx + b \int g(x)\, dx\, . \]

(Dzięki powyższemu wzorowi można obliczać np. całki wszystkich wielomianów.)

Dowód:
Stosujemy wzór na pochodną sumy: jeśli $ F'=f $ i $ G'=g $, to dla wszystkich stałych $ a,b\in \R $ jest $ (aF+bG)'=af+bg $.

Stwierdzenie [wzór na całkowanie przez części] Jeśli $ f,g\colon P\to \R $ są różniczkowalne, to

\[ \int f(x)\cdot g'(x)\, dx = f(x)g(x)- \int f'(x)\cdot g(x)\, dx\, . \]

Dowód:
Całkujemy obie strony wzoru na pochodną iloczynu, $ (fg)'=fg'+f'g $, a następnie jedną z całek przerzucamy z prawej strony na lewą.

Przykład (#)

  1. Obliczymy $ \int \ln x\, dx $. Niech $ g'(x)=1 $, $ f(x)=\ln x $, $ g(x)=x $ (uwaga w nawiasie: funkcja $ g $ nie jest określona jednoznacznie przez wybór $ g' $; ustalamy $ g $ w sposób najwygodniejszy z możliwych) oraz $ f'(x)=1/x $. Zatem
    \[ \begin{equation} 	\int \ln x\, dx = x\ln x - \int \frac{1}{x} \, x\, dx = x\ln x-\int 1\, dx = x\ln x - x + C. 	\label{intln} 	\end{equation} \]
  2. Obliczymy całki $ I=\int \sin^2 x\, dx $ oraz $ J=\int \cos^2 x\, dx $. Zastosujmy wzór na całkowanie przez części do $ I $. Biorąc $ f(x)=\sin x $ i $ g(x)=-\cos x $, otrzymamy
    \[ 	\int \sin^2 x\, dx = \int f(x)\cdot g'(x)\, dx = f(x)g(x)- \int f'(x)\cdot g(x)\, dx = -\sin x \cos x +\int \cos^2 \, dx, 	\]

    tzn. $ I-J=-\sin x\cos x =-\frac 12 \sin 2x $. Natomiast

    \[ 	I+J =\int (\sin^2 x+\cos^2 x)\, dx = \int 1\, dx = x + C. 	\]

    Dodając otrzymane równania stronami, otrzymujemy $ 2I=x-\frac 12 \sin 2x + C $. Zatem

    \[ \int \sin^2 x\, dx= \frac{x}{2}-\frac{\sin 2x} 4 + C\, , \qquad \int \cos^2 x\, dx= \frac{x}{2}+\frac{\sin 2x} 4 + C\, . \]

    (Zmieniliśmy oznaczenie stałej, ale to przecież nam wolno.)

Inne zastosowania wzoru na całkowanie przez części będziemy widywać regularnie.

Stwierdzenie [wzór na całkowanie przez podstawienie] Niech $ f,g' $ będą ciągłe i niech $ F $ będzie funkcją pierwotną $ f $. Wtedy

\[ 	\int f(g(x))g'(x)\, dx = F(g(x)) +C\, . 	\]
Uwaga Dla pełnej precyzji, należałoby zakładać, że $ g,g' $ są ciągłe na pewnym przedziale $ I $, zaś $ f=F' $ i $ F $ są ciągłe na przedziale $ J=g(I) $.

Dowód:
Stosujemy wzór na pochodną złożenia: $ (F\circ g)'=(F'\circ g) \cdot g' = (f\circ g) \cdot g' $.

Przykład Niech $ f(y)=1/y $, $ g(x)=\cos x $ oraz $ F(y)=\ln |y| $. Otrzymujemy

\[ 	\int \tg x\, dx= \int \frac{\sin x}{\cos x} \, dx = -\int f(g(x)) g'(x)\, dx = F(g(x)) +C = \ln |\cos x|+C\, . \]

Łatwo sprawdzić, że taką samą metodą otrzymamy nieco ogólniejszy wzór

\[ \begin{equation} 	\label{int1f} 	\int\frac{f'(x)}{f(x)}\, dx = \ln |f(x)|+ C\, . \end{equation} \]

(Dla dowodu, można też po prostu zróżniczkować obie strony).

Zanim omówimy kolejne przykłady zastosowań wzoru na całkowanie przez części i~całkowanie przez podstawienie, wspomnimy o tradycyjnych obyczajach, związanych z roboczym zapisem rachunków takich, jak w ostatnim przykładzie.

Uwaga [tradycyjny sposób manewrowania symbolami $ dx $, $ dy $] Nie wyjaśniliśmy dotąd znaczenia symbolu $ dx $. Samo oznaczenie pochodzi jeszcze z czasów Newtona i Leibniza i wiąże się z geometryczną interpretacją całek oznaczonych, którą poznamy niedługo. Jeśli $ y=g(x) $, gdzie $ g\colon I\to g(I)\subset \R $ jest różniczkowalna na przedziale $ I $, to będziemy pisać $ dy=g'(x)\, dx $. Zauważmy, że jeśli funkcja $ g $ jest różnowartościowa, a jej pochodna $ g' $ nie znika, to wtedy $ x=g^{-1}(y) $ i zgodnie z przyjętą przed chwilą konwencją

$$dx = \bigl(g^{-1}(y)\bigr)' dy \ \stackrel{\text{Stw.~\ref{pochodwr}}}=\ \frac{1}{g'(x)}\, dy\,  $$

dzięki wzorowi na pochodną funkcji odwrotnej. Jest więc tak, jakby wzór $ dy=g'(x)\, dx $ można było przekształcać tak, jak równość dotyczącą liczb rzeczywistych.

Wzór na całkowanie przez podstawienie zapisuje się czasem

\[ \int f\bigl(\, \underbrace{g(x)}_{=y}\, \bigr)\, \underbrace{g'(x)\, dx}_{=dy}=\int f(y) \, dy = F(y) + C = F(g(x))+ C\, . \]

Taki zapis być może lepiej wyjaśnia nazwę całkowanie przez podstawienie.

Przykład Aby obliczyć całkę $ \int x\exp(-x^2)\, dx $ podstawiamy $ y=x^2 $, $ dy=2x\, dx $ i rachujemy:

\[ 	\int x\exp(-x^2)\, dx =\frac 12 \int \exp(-y)\, dy= -\frac 12 \exp(-y)+C = -\frac{1}{2}\exp(-x^2) +C. 	\]

Całkowanie funkcji wymiernych

Funkcją wymierną nazywamy każdą funkcję $ W(x)=P(x)/Q(x) $, gdzie $ P $ i $ Q $ są wielomianami. Będziemy zakładać, że $ P $ i $ Q $ mają współczynniki rzeczywiste, oraz mówić, że $ W $ jest funkcją wymierną zmiennej rzeczywistej. Za dziedzinę $ W $ uznajemy - przy założeniu, że ilorazu $ P/Q $ nie można skrócić przez żaden czynnik liniowy $ (x-a) $, gdzie $ a\in \R $ - zbiór $ \R $ z usuniętymi pierwiastkami wielomianu $ Q $.

Najwygodniej jest od razu zakładać, że wielomiany $ P $ i $ Q $względnie pierwsze, tzn. nie mają żadnego wspólnego dzielnika $ D $, który byłby wielomianem dodatniego stopnia.

Okazuje się, że całkę z każdej funkcji wymiernej $ W $ można wyrazić prez funkcje elementarne, rozkładając $ W $ na sumę odpowiednich składników.

Definicja [ułamki proste pierwszego rodzaju] Każdą funkcję wymierną

\[ 	\frac{A}{(x-a)^k}\, , 	\]

gdzie $ a,A\in \R $ i $ k\in \N $, nazywamy ułamkiem prostym pierwszego rodzaju.

Definicja [ułamki proste drugiego rodzaju] Każdą funkcję wymierną

\[ 	\frac{Cx+D}{(x^2+cx+d)^k}\, , 	\]

gdzie $ c,d,C,D\in \R $, $ c^2-4d<0 $ i $ k\in \N $, nazywamy ułamkiem prostym drugiego rodzaju.

Algorytm całkowania funkcji wymiernych oparty jest na następującym twierdzeniu.

Twierdzenie [rozkład funkcji wymiernej na ułamki proste] Każda funkcja wymierna $ W(x)=P(x)/Q(x) $ jest sumą pewnego wielomianu i skończonej liczby ułamków prostych pierwszego i drugiego rodzaju. Mianowniki tych ułamków prostych są dzielnikami wielomianu $ Q $. (#)
Uwaga Rozkład funkcji wymiernej na ułamki proste jest jednoznaczny (z dokładnością do kolejności składników), jeśli założyć, że składnik o danym mianowniku może występować tylko jeden raz.

Twierdzenie o rozkładzie na ułamki proste należy bardziej do algebry, niż do analizy. Dlatego nie będziemy przedstawiać jego kompletnego, szczegółowego dowodu.

    Szkic dowodu Twierdzenia~ [link] Krok 1. Wykonując dzielenie $ P $ przez $ Q $ z resztą, można zapisać $ W=P_1+(P_2/Q) $, gdzie $ P_1 $ i $ P_2 $ są wielomianami i stopień $ P_2 $ jest mniejszy, niż stopień $ Q $. Wystarczy zatem rozpatrzeć przypadek $ W=P/Q $, gdzie $ \mathrm{deg}\, P<\mathrm{deg}\, Q $. Najważniejszym narzędziem jest prosty fakt z algebry, który sformułujemy tu jako zadanie.

Zadanie Jeśli wielomiany $ Q_1, Q_2 $ są względnie pierwsze, to istnieją wielomiany $ V_1,V_2 $ o współczynnikach z $ \R $ takie, że $ V_1(x)Q_1(x)+V_2(x)Q_2(x)=1 $ dla każdego $ x\in \R $.     Wskazówka. Niech $ \mathcal{W} $ oznacza zbiór wszystkich wielomianów $ V_1(x)Q_1(x)+V_2(x)Q_2(x) $ (dla różnych $ V_1,V_2 $). Sprawdzić, że $ Q_1,Q_2\in \mathcal{W} $. Oznaczyć przez $ D $ taki wielomian w zbiorze $ \mathcal{W} $, który ma najmniejszy stopień (W każdym niepustym podzbiorze $ \N $ istnieje element najmniejszy.) i współczynnik $ 1 $ przy najstarszej potędze $ x $. Posługując się twierdzeniem Bezouta, wykazać, że $ D $ dzieli $ Q_1 $ i $ Q_2 $. Wywnioskować, że $ D\equiv 1 $.

Dalszy ciąg dowodu Twierdzenia~ [link] jest następujący: jeśli $ Q=Q_1Q_2 $, gdzie $ Q_i $ są względnie pierwsze, to dobieramy $ V_1,V_2 $, o których mówi powyższe zadanie, i piszemy

\[ \frac PQ=\frac{P\cdot 1}{Q}=\frac{P(V_1Q_1+V_2Q_2)}{Q_1Q_2}= \frac{PV_1}{Q_2} +\frac{PV_2}{Q_1}\, . \]

Następnie powtarzamy krok 1 dla każdego z tych ułamków. Cały zabieg kontynuujemy dopóty, dopóki mianowniki można rozkładać na czynniki, które są względnie pierwsze. (Patrz Wniosek~ [link]). Po skończonej liczbie kroków dojdziemy do przedstawienia

\[ \begin{equation} 	\label{preproste} W(x)= P_N(x) + \sum_{j=1}^{M_1} \frac{L_{1,j}(x)}{(x-a_j)^{k_j}} +\sum_{j=1}^{M_2} 	\frac{L_{2,j}(x)}{(x^2+c_jx+d_j)^{n_j}}\,  \end{equation} \]

gdzie $ \deg L_{1,j}<k_j $ i $ \deg L_{2,j}<2n_j $.

Dzieląc liczniki $ L_{1,j} $ przez $ (x-a_j) $, a $ L_{2,j} $ przez $ (x^2+c_jx+d_j) $, można po skończonej liczbie kroków (Jeśli $ L(x)=K(x)(x-a)+R $, gdzie $ \deg K<\deg L $, to $ L(x)/(x-a)^k=R/(x-a)^k+K(x)/(x-a)^{k-1} $. Potem dzielimy $ K(x) $ przez $ x-a $ itd. Podobnie robimy ze składnikami drugiej sumy w preproste)., ewentualnie zwiększając liczbę składników po prawej stronie preproste, dojść do sytuacji, gdy wszystkie liczniki $ L_{1,j} $ są stałymi, a wszystkie liczniki $ L_{2,j} $ - wielomianami liniowymi.

Aby scałkować funkcję wymierną, wystarczy rozłożyć ją na ułamki proste i scałkować każdy z nich. Popatrzmy na konkretne przykłady.

Przykład Obliczymy całkę

\[ 	I=\int \frac{x^6}{(x-1)(x+1)^2}\, dx\, . 	\]

Dzieląc licznik $ x^6 $ przez $ (x-1)(x+1)^2=(x^2-1)(x+1)=x^3+x^2-x-1 $, otrzymujemy wynik $ x^3-x^2+2x-2 $ i resztę $ 3x^2-2 $. Dlatego

\[ \begin{eqnarray*} I & = & \int (x^3-x^2+2x-2)\, dx + \int \frac{3x^2-2}{(x-1)(x+1)^2}\, dx\\ & = & \frac{x^4}4-\frac{x^3}{3}+x^2-2x + \int \frac{3(x^2-1)+1}{(x-1)(x+1)^2}\, dx\\ & = & \frac{x^4}4-\frac{x^3}{3}+x^2-2x + 3\int\frac{dx}{x+1} + \int \frac{dx}{(x-1)(x+1)^2}\\ & = & \frac{x^4}4-\frac{x^3}{3}+x^2-2x + 3\ln |x+1| + \underbrace{\int \frac{dx}{(x-1)(x+1)^2}}_{=\text{ (ozn.) } J}\, . \end{eqnarray*} \]

Pozostaje obliczyć całkę $ J $. Znajdziemy w tym celu stałe $ a,b,c\in \R $ takie, że

\[ \frac{a}{x-1} + \frac{b}{x+1} + \frac{c}{(x+1)^2}= \frac{1}{(x-1)(x+1)^2}\, . \]

(Ogólnie, jeśli $ (x-a)^k $ dzieli mianownik funkcji wymiernej, to przewidujemy, że w rozkładzie na ułamki proste znajdą się $ A_j/(x-a)^j $ dla wszystkich $ j=1,2,\ldots, k $). Sprowadzając składniki lewej strony do wspólnego mianownika $ (x-1)(x+1)^2 $, dodając ułamki i przyrównując otrzymany licznik do licznika prawej strony, otrzymujemy - z porównania współczynników przy $ x^2 $, $ x $ i $ x^0=1 $ - układ równań:

\[ a+b = 0, \qquad 2a +c = 0, \qquad a-b-c=1. \]

Stąd $ a=-b $ (pierwsze równanie) i $ 3a-b=1 $ (suma drugiego i trzeciego równania), tzn. $ a=\frac 14 $, $ b=-\frac 14 $, $ c=-2a=-\frac 12 $. Zatem

\[ J=\frac 14 \int\frac{dx}{x-1}-\frac{1}{4}\int\frac{dx}{x+1} - \frac{1}{2}\int\frac{dx}{(x+1)^2}\ \stackrel{\eqref{intxa},\ \eqref{int1przezx}}= \ \frac 14\ln \frac{|x-1|}{|x+1|}+\frac 12\cdot \frac{1}{x+1} + C\, . \]

Ostatecznie więc

\[ \begin{eqnarray*} I & = & \frac{x^4}4-\frac{x^3}{3}+x^2-2x + 3\ln |x+1| + J\\ & = & \frac{x^4}4-\frac{x^3}{3}+x^2-2x + \frac{11}{4}\ln |x+1| + \frac 14\ln |x-1|+\frac 12\cdot \frac{1}{x+1} + C\, . \end{eqnarray*} \]

Przykład Znajdziemy całkę nieoznaczoną funkcji $ 1/(1+x^4) $. Rozłóżmy mianownik na czynniki. Otóż, $ x^4+1= (x^2+1)^2-2x^2=(x^2-x\sqrt 2 + 1)(x^2+x\sqrt 2 + 1) $. (Czytelnik może także rozwiązać równanie $ x^4+1 $ w $ \C $ i pogrupować w pary liczb sprzężonych jego pierwiastki, żeby wyznaczyć ten rozkład nieco inną metodą). Spodziewamy się zatem, że

\[ \frac{1}{1+x^4}=\frac{Ax+B}{x^2-x\sqrt 2 + 1}+\frac{Cx + D}{x^2+x\sqrt 2 + 1}\, . \]

Jak w poprzednim przykładzie, dodając ułamki i porównując współczynniki liczników obu stron przy $ x^k $ dla $ k=3,2,1,0 $, otrzymujemy układ równań

\[ A+C=0,\qquad B+D + \sqrt{2}(A-C)=0, \qquad A+C+\sqrt{2}(B-D)=0, \qquad B+D=1\, . \]

Z pierwszego i trzeciego równania otrzymujemy $ B-D=0 $, więc dzięki czwartemu równaniu jest $ B=D=\frac 12 $. Dalej, $ A=-C $ i z równania drugiego $ 1+\sqrt 2 \cdot (-2C)=0, $ a więc $ C=\frac{1}{2\sqrt 2}=-A $. Zatem

\[ \begin{equation} 	\label{rozklad1x4} 	\frac{1}{1+x^4}=\frac{-\frac{1}{2\sqrt 2} x+\frac 12}{x^2-x\sqrt 2 + 1}+\frac{\frac{1}{2\sqrt 2}x + \frac 12}{x^2+x\sqrt 2 + 1}\, . \end{equation} \]

Scałkujemy drugi ułamek. Sprowadzając trójmian w mianowniku do postaci kanonicznej, a następnie zapisując licznik jako kombinację pochodnej mianownika i stałej, otrzymujemy

\[ \begin{eqnarray*} \int \frac{\frac{1}{2\sqrt 2}x + \frac 12}{x^2+x\sqrt 2 + 1}\, dx & = & \frac{1}{2\sqrt 2}\int \frac{x+\sqrt{2}}{\bigl(x+\frac{\sqrt{2}}2\bigr)^2+\frac 12}\, dx\\ & = & \frac{1}{4\sqrt 2}\int \frac{(2x+\sqrt{2})+\sqrt{2}}{\bigl(x+\frac{\sqrt{2}}2\bigr)^2+\frac 12}\, dx\\ & = & \frac{1}{4\sqrt 2}\ln \Bigl( \bigl(x+\frac{\sqrt{2}}2\bigr)^2+\frac 12 \Bigr) + \frac 14\underbrace{\int \frac{dx}{\bigl(x+\frac{\sqrt{2}}2\bigr)^2+\frac 12}}_{=J}\, . \end{eqnarray*} \]

Ostatnią całkę łatwo obliczamy przez podstawienie, pisząc

\[ J=2\int\frac{dx}{\Bigl( \underbrace{\sqrt{2}\bigl(x+\frac{\sqrt{2}}2\bigr)}_{=  t} \Bigr)^2+1} = \frac{2}{\sqrt{2}}\int \frac{dt}{t^2+1} = {\sqrt 2}\cdot \arctg t+C = {\sqrt 2}\cdot \arctg \bigl(x\sqrt 2+1\bigr) + C\, . \]

Dodając otrzymane wyrażenia, otrzymujemy

\[ \int \frac{\frac{1}{2\sqrt 2}x + \frac 12}{x^2+x\sqrt 2 + 1}\, dx= \frac 1{4\sqrt 2}\ln (x^2+x+1) + \frac{\sqrt 2}4  \arctg \bigl(x\sqrt 2+1\bigr) + C\, . \]

Drugi z ułamków w rozklad1x4 można albo scałkować tak samo, albo (lepiej!) zauważając, że podstawienie $ -x=y $, $ -dx=dy $ pozwoli skorzystać z już wykonanych rachunków:

\[ \begin{eqnarray*} \int \frac{-\frac{1}{2\sqrt 2} x+\frac 12}{x^2-x\sqrt 2 + 1}\, dx & =& -\int\frac{\frac{1}{2\sqrt 2} y+\frac 12}{y^2+y\sqrt 2 + 1}\, dy\\ & = & -\frac 1{4\sqrt 2}\ln (y^2+y\sqrt 2+1) - \frac{\sqrt 2}4  \arctg \bigl(y\sqrt 2+1\bigr) + C\\ &=& -\frac 1{4\sqrt 2}\ln (x^2-x\sqrt 2+1) - \frac{\sqrt 2}4  \arctg \bigl(-x\sqrt 2+1\bigr) + C\, . \end{eqnarray*} \]

Dodając całki z obu ułamków prostych i korzystając z nieparzystości arcus tangensa, otrzymujemy wynik

\[ \begin{equation} 	\label{1x4-wynik1} 	\int\frac{dx}{1+x^4}=\frac1{4\sqrt 2} \ \ln\frac{x^2+x\sqrt 2+1}{x^2-x\sqrt 2+1}+ \frac{\sqrt 2} 4\Bigl(\arctg (x\sqrt 2+1)+\arctg (x\sqrt 2-1)\Bigr) + C. \end{equation} \]

Oto drugi, nieco inny sposób obliczenia tej samej całki. Mamy

\[ \frac{2}{1+x^4}=\frac{1-x^2}{1+x^4}+\frac{1+x^2}{1+x^4}\, . \]

Zajmijmy się drugim składnikiem. Jest

\[ \frac{1+x^2}{1+x^4}=\frac{x^{-2}+1}{x^{-2}+x^2}=\frac{(x-x^{-1})'}{(x-x^{-1})^2+2}\, . \]

Dlatego, stosując podstawienie $ y=x-x^{-1} $, $ dy=(x-x^{-1})'\, dx $, otrzymujemy

\[ \int\frac{1+x^2}{1+x^4}\, dx=\int \frac{dy}{y^2+2} =: J\, . \]

Teraz, podstawiając $ y=t \sqrt2 $, znajdujemy

\[ J=\frac{\sqrt{2}}{2}\int\frac{dt}{t^2+1}=\frac{\sqrt{2}}{2}\arctg t + C= \frac{\sqrt{2}}{2}\arctg \frac{y}{\sqrt 2} + C\, , \]

co, po powrocie do zmiennej $ x $, daje wynik

\[ \int\frac{1+x^2}{1+x^4}\, dx = \frac{\sqrt{2}}{2}\arctg \Bigl(\frac{x}{\sqrt{2}}-\frac{1}{x\sqrt2}\Bigr) + C\, . \]

Podobnie można obliczyć całkę funkcji $ (1-x^2)/(1+x^4) $. Tym razem warto skorzystać z podstawienia $ y=x+x^{-1} $, $ dy=(1-x^{-2})\, dx $. Stosując je, dostaniemy

\[ \int\frac{1-x^2}{1+x^4}\, dx=-\int\frac{dy}{y^2-2}= \frac{1}{2\sqrt 2}\ln \left|\frac{y+\sqrt 2}{y-\sqrt 2}\right| + C= \frac{1}{2\sqrt 2}\ln\frac{x^2+x\sqrt 2+1}{x^2-x\sqrt 2+1} + C\, . \]

(Środkową równość otrzymujemy, rozkładając $ 1/(y^2-2) $ na sumę ułamków prostych o mianownikach $ y\pm \sqrt 2 $). Dodając oba wyniki, otrzymamy tym razem

\[ \begin{equation} 	\label{1x4-wynik2} 	2\int\frac{dx}{1+x^4}= \frac{1}{2\sqrt 2}\ln\frac{x^2+x\sqrt 2+1}{x^2-x\sqrt 2+1}+ \frac{\sqrt{2}}{2}\arctg \Bigl(\frac{x}{\sqrt{2}}-\frac{1}{x\sqrt2}\Bigr) + C\, . \end{equation} \]

Na pierwszy rzut oka, ten wzór różni się od 1x4-wynik1. Formalnie biorąc, prawa strona nie jest określona dla $ x=0 $, choć wyjściowa funkcja była ciągła na $ \R $, a więc powinna mieć na całej prostej funkcję pierwotną.

Zadanie Udowodnić tożsamość

\[ 	\arctg t + \arctg s= \arctg \biggl(\frac{t+s}{1-ts}\biggr)\, , \qquad t,s\in \R, \quad t\cdot s\not=1. 	\]

Sprawdzić, że wzory 1x4-wynik1 i 1x4-wynik2 dają w istocie ten sam wynik. Jak należy intepretować wzór 1x4-wynik2 w punkcie $ x=0 $?

Pokażemy jeszcze, jak oblicza się całki z ułamków prostych drugiego rodzaju, których mianownik jest $ k $-tą potęgą trójmianu kwadratowego dla jakiegoś $ k>1 $. Można to zrobić rekurencyjnie, w następujący sposób.

Po pierwsze, całkując przez podstawienie $ (y=1+x^2) $ otrzymujemy

\[ \begin{equation} \label{pomocn-2rodz} 	J_k=\int\frac{2x\, dx}{\bigl(1+x^2\bigr)^k} = \int\frac{dy}{y^k}=\frac{1}{(1-k)} y^{1-k} + C = \frac{1}{(1-k)}\cdot \frac 1 {\bigl(1+x^2\bigr)^{k-1}} + C\, . \end{equation} \]

Jest

\[ \int\frac{Ax+B}{\bigl(1+x^2\bigr)^k}=\frac A2 J_k + BI_k, \qquad\mbox{gdzie}\qquad I_k=\int\frac{ dx}{\bigl(1+x^2\bigr)^k}\, . \]

Pozostaje zobaczyć, jak się oblicza $ I_k $. Piszemy, całkując przy przejściu do drugiej linijki przez części, z wykorzystaniem wzoru pomocn-2rodz,

\[ \begin{eqnarray*} I_k & = & \int\frac{1+x^2-x^2}{\bigl(1+x^2\bigr)^k}\, dx = I_{k-1}- \int\underbrace{\frac x2}_{=f}\cdot \underbrace{\frac{2x}{\bigl(1+x^2\bigr)^k}}_{=g'}\, dx\\ & = & I_{k-1} -  \underbrace{\frac{x}{2(1-k)}\cdot \frac 1 {\bigl(1+x^2\bigr)^{k-1}}}_{=f\cdot g} +\frac{1}{2}\int \frac{1}{(1-k)}\cdot \frac 1 {\bigl(1+x^2\bigr)^{k-1}}\, dx\\ & = & \left(1+\frac{1}{2-2k}\right) I_{k-1} - \frac{x}{2(1-k)}\cdot \frac 1 {\bigl(1+x^2\bigr)^{k-1}}\, . \end{eqnarray*} \]

Po skończonej liczbie takich kroków dojdziemy do całki $ I_1 $, tzn. do całki z pochodnej arcus tangensa. Całkowanie ułamków prostych drugiego rodzaju z mianownikiem innym, niż $ x^2+1 $, można sprowadzić do powyższego, zapisując trójmian z mianownika w postaci kanonicznej i dokonując liniowych zamian zmiennych. Właśnie tak postępowaliśmy, całkując wzór rozklad1x4.

Uwaga Jak widzieliśmy, nie zawsze warto rozkładać funkcję wymierną na ułamki proste. Czasem całkowanie przez podstawienie szybciej prowadzi do wyniku. Oto jeszcze jeden przykład takiej sytuacji:

\[ 	I=\int\frac{6x^5}{1+x^6}\, dx =\int \frac{dy}{1+y}=\ln |1+y| +C = \ln (1+x^6) + C\, . 	\]

Zastosowaliśmy podstawienie $ x^6=y $, $ 6x^5\, dx = dy $.

Podstawienia Eulera, podstawienia trygonometryczne

Szereg całek można za pomocą odpowiednich podstawień sprowadzić do całkowania funkcji wymiernych.

Definicja Wielomianem dwóch zmiennych o współczynnikach rzeczywistych nazywamy funkcję

\[ 	P(x,y)=\sum_{{\scriptstyle 0\le i\le n}\atop{\scriptstyle 0\le j\le m}} a_{ij}x^iy^j\, , \qquad x,y\in \R\, . 	\]

(Przyjmujemy umowę $ x^0\equiv 1\equiv y^0 $.) Funkcją wymierną dwóch zmiennych nazywamy funkcję $ R(x,y)=P(x,y)/Q(x,y) $, gdzie $ P $ i $ Q $ są wielomianami dwóch zmiennych.

Okazuje się, że jeśli $ R $ jest funkcją wymierną dwóch zmiennych, to obliczenie każdej z następujących całek:

\[ \begin{gather} \int R\left(x, \sqrt{\frac{Ax+B}{Cx+D}}\right)\, dx\, , \qquad \mbox{gdzie $AD-BC\not=0$},\label{pierwhomo} \\  \int R\Bigl(x,\sqrt{ax^2+bx+c}\, \Bigr)\, dx\, \label{calkaeuler}, \\ \int R(\cos x, \sin x)\, dx \label{calkaunitryg} \end{gather*} \]

można za pomocą odpowiednich podstawień sprowadzić do całkowania funkcji wymiernych jednej zmiennej.

    Całka pierwhomo. Wykonujemy podstawienie

\[ \begin{equation} 	\label{x-pierw1} \sqrt{\frac{Ax+B}{Cx+D}}=t\, . \end{equation} \]

Stąd $ t^2(Cx+D)=(Ax+B) $, więc

\[ \begin{equation} 	x=\frac{Dt^2-B}{A-Ct^2}\, ; 	\label{x-pierw2} \end{equation} \]

różniczkując, otrzymujemy

\[ \begin{equation} 	\label{dx-pierw} 	dx=\frac{2Dt(A-Ct^2)+2Ct(Dt^2-B)}{\bigl(A-Ct^2\bigr)^2}\, dt=\frac{2t(AD-BC)}{\bigl(A-Ct^2\bigl)^2}\, dt\, . \end{equation} \]

Wstawiając x-pierw1- dx-pierw do całki pierwhomo, otrzymujemy całkę z funkcji wymiernej, którą można obliczyć, stosując algorytm opisany w poprzednim podrozdziale.

    Całka calkaeuler. Do tej całki można zastosować wiele podstawień. Najpierw opiszemy tak zwane podstawienia Eulera.

     Pierwsze podstawienie Eulera. Jeśli $ a>0 $, to podstawiamy

\[ \begin{equation} 	\label{euler-p1} t\pm x\sqrt{a}= \sqrt{ax^2+bx+c} \end{equation} \]

(można użyć zarówno plusa, jak i minusa). Po podniesieniu obu stron równania do kwadratu zredukuje się składnik $ ax^2 $ i wyznaczymy

\[ \begin{equation} \label{euler-p1a} 	x=\frac{t^2-c}{b\mp 2t\sqrt{a}}\, , \qquad \sqrt{ax^2+bx+c}=t\pm \sqrt{a}\cdot \frac{t^2-c}{b\mp 2t\sqrt{a}}\, . \end{equation} \]

Widać, że zarówno $ x $, jak i pierwiastek z trójmianu kwadratowego $ ax^2+bx+c $ wyrażają się przez funkcje wymierne zmiennej $ t $; ponadto, różniczkując prawą stronę pierwszego z równań euler-p1a, otrzymujemy

\[ \begin{equation} 	\label{euler-p1b} 	dx = \frac{2t\bigl(b\mp 2t\sqrt{a}\bigr)\pm 2\sqrt{a} (t^2-c)}{\bigl(b\mp 2t\sqrt{a}\bigr)^2}\, dt = \frac{ \mp 2t^2\sqrt{a} + 2tb \mp 2c\sqrt{a}}{\bigl(b\mp 2t\sqrt{a}\bigr)^2}\, dt\, . \end{equation} \]

Wstawiając euler-p1a i euler-p1b, otrzymamy całkę z funkcji wymiernej jednej zmiennej.

     Drugie podstawienie Eulera. Jeśli $ c>0 $, to podstawiamy

\[ \begin{equation} 	\label{euler-p2} tx- \sqrt{c}= \sqrt{ax^2+bx+c} \end{equation} \]

Tym razem po podniesieniu obu stron równania do kwadratu zredukuje się wyraz wolny $ c $, a następnie obie strony będzie można skrócić przez $ x $. Otrzymamy po takim zabiegu

\[ \begin{equation} 	\label{euler-p2a} t^2x - 2t\sqrt{c}=ax+b, \qquad\mbox{tzn.} \qquad x=\frac{b+2t\sqrt{c}}{t^2-a}\, . \end{equation} \]

Dalej postępujemy tak, jak w poprzednim przypadku: widzimy, że $ dx=W(t)\, dt $, gdzie $ W $ jest funkcją wymierną, która jest pochodną prawej strony drugiego równania euler-p2a. Czytelnik zechce sam uzupełnić szczegóły.

     Trzecie podstawienie Eulera. Jeśli trójmian $ ax^2+bx+c $ ma pierwiastki rzeczywiste $ r,s $, to

\[ \sqrt{ax^2+bx+c}= \pm (x-r)\sqrt{a\cdot\frac{x-s}{x-r}} \]

(znak zależy od przedziału). Zatem, jak już widzieliśmy, można skorzystać z podstawienia

\[ \begin{equation} 	\label{euler-p3} t=\sqrt{a\cdot\frac{x-s}{x-r}}\, . \end{equation} \]

Dla porządku dodajmy, że wszystkich szczegółów rachunków euler-p1- euler-p3, związanych z podstawieniami Eulera, nie warto pamiętać. Dobrze jest wiedzieć, na jakiej sztuczce oparte jest działanie każdego z tych podstawień, tzn. znać wzory euler-p1, euler-p2 i euler-p3 i rozumieć, że każdy z nich pozwala wyznaczyć $ x $ jako pewną funkcję wymierną zmiennej $ t $. Resztę rachunków i tak zwykle wykonuje się w razie potrzeby dla konkretnych danych liczbowych.

    Całka calkaeuler, inna metoda. Zapisując trójmian kwadratowy pod pierwiastkiem w postaci kanonicznej i używając liniowych zamian zmiennych $ y=\alpha x + \beta $, można sprowadzić całkę calkaeuler do postaci

\[ \int R_1\bigl(y,\sqrt{\phantom{a}\ldots\phantom{a}}\, \bigr)\, dy \]

gdzie $ R_1 $ jest funkcją wymierną, a drugim argumentem jest (w zależności od $ a,b $ i $ c $) jeden z pierwiastków: (1) $ \sqrt{1+y^2} $, (2) $ \sqrt{1-y^2} $, lub wreszcie (3) $ \sqrt{y^2-1} $. Można wtedy użyć funkcji trygonometrycznych, a także tzw. funkcji hiperbolicznych, zdefiniowanych następująco:

\[ \begin{eqnarray} 	\label{cosh}\cosh x &=& \cos (ix)\ = \ \frac{e^x+e^{-x}}2\, ,\\ 	\label{sinh}\sinh x &=& -i\sin (ix)\ = \ \frac{e^x-e^{-x}}2\, . \end{eqnarray} \]

Jak łatwo sprawdzić,

\[ \begin{equation} 	\label{jedynkahip} \cosh^2 x-\sinh^2 x=1 \qquad \mbox{dla wszystkich $x\in \R$.} \end{equation} \]

Dzięki tej tożsamości, dla $ y=\sinh w $ jest $ \sqrt{1+y^2}=\cosh w $. Zachodzą też wzory na pochodne

\[ (\cosh w)'=\sinh w\, , \qquad (\sinh w)'=\cosh w\, , \]

z których otrzymujemy $ dy = \cosh w\, dw $. Zatem

\[ I=\int R_1\bigl(y,\sqrt{1+y^2}\, \bigr)\, dy=\int R_1(\sinh w, \cosh w)\cosh w\, dw =\int R_2(e^w)\, dw, \]

gdzie $ R_2 $ jest pewną funkcją wymierną jednej zmiennej. Podstawiając teraz $ z=e^w $, otrzymujemy $ dz=e^w\, dw =z\, dw $, co daje wynik

\[ I=\int R_2(z)\, \frac{dz}{z}\, . \]

Teraz można np. zastosować wiadomy algorytm całkowania funkcji wymiernych.

Zadanie Podstawiając $ y=\tg \varphi $, sprowadzić $ \int R_1(y,\sqrt{1+y^2})\, dy $ do całki typu calkaunitryg.

Aby pozbyć się pierwiastka $ \sqrt{y^2-1} $, stosujemy podstawienie $ y=\cosh w $. Reszta rachunków jest podobna; Czytelnik może wypisać je samodzielnie. Można także użyć podstawienia $ y=1/\cos\varphi $, które sprowadzi całkę $ \int R_1\bigl(y,\sqrt{y^2-1}\, \bigr)\, dy $ do postaci calkaunitryg.

 

W ostatnim z trzech przypadków, gdy mamy do czynienia z pierwiastkiem $ \sqrt{1-y^2} $, można stosować podstawienie $ y=\sin \varphi $. Pokażemy jego działanie na przykładzie.

Przykład (#) Obliczymy całkę

\[ 	\int \sqrt{1-x^2}\, dx\, . \]

Dla wygody ustalmy, że funkcję podcałkową rozpatrujemy na przedziale $ [0,1] $. Niech $ x=\sin \theta $, gdzie $ \theta\in [0,\pi/2] $. Wtedy $ dx=\cos\theta\, d\theta $ i $ \sqrt{1-x^2}=\cos\theta $. Zatem, ze wzoru na całkowanie przez podstawienie i tożsamości $ \cos 2\theta =2\cos^2\theta -1 $,

\[ \begin{eqnarray*} 	\int \sqrt{1-x^2}\, dx&=&\int \cos^2\theta \, d\theta =\int \frac{1+\cos 2\theta}2\, d\theta = \frac\theta2+ \frac{\sin 2\theta}4 + C\\ 	&=& \frac{\arcsin x}2 + \frac{\sin (2\arc\sin x)}4 + C\, \\ 	&=& \frac 12\left( {\arcsin x} + x\sqrt{1-x^2}\right) + C\, . \end{eqnarray*} \]

(Wyznaczając $ \int \cos^2\theta\, d\theta $, można też użyć Przykładu~ [link], tzn. całkować przez części).

Czytelnik może spróbować zastosować do obliczenia tej całki trzecie lub drugie podstawienie Eulera. Oba prowadzą do znacznie gorszych rachunków i wyniku zapisanego w innej postaci.

\newcommand{\omitted}[1]{}

\omitted{ Teraz spróbujmy zastosować drugie podstawienie Eulera ($ c=1>0 $), tzn. niech

\[ xt-1=\sqrt{1-x^2} \]

Otrzymamy stąd $ xt^2-2t=-x $, tzn. $ x=2t/(1+t^2) $, a zatem

\[ \sqrt{1-x^2} = xt-1 =\frac{2t^2}{1+t^2}-1=\frac{t^2-1}{t^2+1} \]

Mamy też

\[ dx=\frac{2(1+t^2)-2t\cdot 2t}{\bigl(1+t^2\bigr)^2}\, dt=2\cdot \frac{1-t^2}{\bigl(1+t^2\bigr)^2}\, dt\, . \]

Po podstawieniu obu tych wzorów do całki $ \int \sqrt{1-x^2}\, dx $ otrzymamy całkę z funkcji wymiernej szóstego stopnia, której obliczanie nie należałoby do zadań przyjemnych. Prościej byłoby, gdyby pierwiastek znalazł się w mianowniku, prawda? W tym celu warto najpierw wykonać całkowanie przez części. Piszemy

\[ \int  1\cdot \sqrt{1-x^2}\, dx  =  \sqrt{1-x^2}+\underbrace{\int\frac{x^2}{\sqrt{1-x^2}}\, dx}_{=J}\, ,  \]

i dopiero teraz, do całki $ J $, stosujemy podstawienie Eulera:

\[ J=\int \left(\frac{2t}{1+t^2}\right)^2\cdot \frac{t^2+1}{t^2-1}\cdot 2 \frac{1-t^2}{\bigl(1+t^2\bigr)^2}\, dt\, . \]

}

    Całka calkaunitryg i uniwersalne podstawienie trygonometryczne. Całkę z funkcji wymiernej dwóch zmiennych $ \cos x $ i $ \sin x $ można zawsze sprowadzić do całki z funkcji wymiernej jednej zmiennej $ t $, podstawiając $ t=\tg (x/2) $. Zauważmy, że wtedy

\[ \cos x = \frac{\cos^2 \frac x2 - \sin^2 \frac x2}{\cos^2 \frac x2 + \sin^2 \frac x2}= \frac{1-t^2}{1+t^2}, \qquad \sin x = \frac{2\,\cos\frac x2\,\sin\frac x2}{\cos^2 \frac x2 + \sin^2 \frac x2}= \frac{2t}{1+t^2}, \]

a ponadto

\[ dt=\frac12\Bigl(1+\tg^2\frac x2\Bigr)\, dx = \frac{1+t^2}2\, dx\, , \]

tzn. $ dx=2(1+t^2)^{-1}\, dt $. Podstawiając te zależności do całki calkaunitryg, rzeczywiście otrzymamy całkę z funkcji wymiernej jednej zmiennej. Więcej przykładów można znaleźć w drugim tomie książki Fichtenholza.

    

Na tym zakończymy przegląd metod obliczania całek nieoznaczonych. Więcej przykładów Czytelnik zobaczy z pewnością na ćwiczeniach.

Całka Newtona

Definicja Niech $ f\colon [a,b]\to \R $ będzie funkcją ciągłą. Całką oznaczoną funkcji $ f $ na przedziale $ [a,b] $ nazywamy liczbę

\[ \begin{equation} 		\label{defcozn} 		\int_a^b f(x)\, dx = F(b)-F(a)\, , 	\end{equation} \]

gdzie $ F $ jest dowolną funkcją pierwotną funkcji $ f $.

Uwaga Definicja jest poprawna, tzn. nie zależy od wyboru funkcji $ F $ pierwotnej dla $ f $: jeśli $ F_1 $ jest inną funkcją pierwotną $ f $, to $ F_1=F+\mathrm{const} $ (Stwierdzenie~ [link]) i dlatego $ F_1(b)-F_1(a)=F(b)-F(a) $. Zgodnie z rozpowszechnioną konwencją, wzór defcozn będziemy uznawać za definicję całki oznaczonej także w przypadku $ b<a $.

Ze znanych już własności całek nieoznaczonych natychmiast otrzymujemy następujące stwierdzenia. Łatwe dowody (por. podrozdział~ [link]) pominiemy.

Stwierdzenie [liniowość całki oznaczonej] Jeśli $ f,g\colon [a,b]\to \R $ są ciągłe, zaś $ \alpha,\beta\in \R $, to

\[ \int_a^b \bigl( \alpha f(x)+\beta g(x)\bigr)\, dx = \alpha \int_a^b f(x)\, dx + \beta \int_a^b g(x)\, dx\, . \]
Stwierdzenie [wzór na całkowanie przez części dla całek oznaczonych] Jeśli $ f,g\colon [a,b]\to \R $ są klasy $ C^1 $, to

\[ \int_a^b f(x)\cdot g'(x)\, dx = f(b)g(b)-f(a)g(a) - \int_a^b f'(x)\cdot g(x)\, dx\, . \]

    Oznaczenia. Stosując ten wzór i definicję całki oznaczonej, będziemy czasem pisać

\[ \Bigl.F\Bigr|_a^b=F(b)-F(a)\, , \qquad \Bigl. fg\Bigr|_a^b\ =\ f(b)g(b)-f(a)g(a)\, . \]
Stwierdzenie [wzór na całkowanie przez podstawienie dla całek oznaczonych] Niech $ g\colon [a,b]\to [g(a),g(b)] $ będzie funkcją klasy $ C^1 $ i niech $ f $ będzie ciągła na przedziale $ [g(a),g(b)] $. Wówczas

\[ 	\int_a^b f(g(x))g'(x)\, dx = \int_{g(a)}^{g(b)} f(t)\, dt = F(g(b))-F(g(a))\, , 	\]

gdzie $ F $ oznacza dowolną funkcję pierwotną $ f $.

Całka oznaczona jest szczególnie ważna z uwagi na swoją interpretację geometryczną. Zanim o niej powiemy, udowodnimy ściśle kilka kolejnych prostych własności całki.

Stwierdzenie [addytywność całki jako funkcji przedziału] Załóżmy, że $ f $ jest ciągła na przedziale $ I\subset \R $ i niech $ a,b,c\in I $. Wtedy

\[ \begin{gather} 		\int_a^b f(x)\, dx = -\int_b^a\, f(x)\, dx\, ,\label{addyt1}\\ 		\int_a^b f(x)\, dx +\int_b^c f(x)\, dx = \int_a^c f(x)\, dx\, .\label{addyt2} 	\end{gather*} \]

Dowód:
Niech $ F $ będzie funkcją pierwotną $ f $ na $ I $. Wzór addyt2 wynika z równości

$$ F(b)-F(a)+F(c)-F(b)=F(c)-F(a) \, ,$$

natomiast addyt1 to kwestia interpretacji definicji całki oznaczonej.

Stwierdzenie [monotoniczność całki] Jeśli $ f,g\colon [a,b]\to \R $ są ciągłe i $ f\ge g $ na $ [a,b] $, to

\[ 	\int_a^b f(x)\, dx\ge \int_a^b g(x)\, dx\, . 	\]

Jeśli dodatkowo $ f>g $ na $ (a,b) $, to $ \int_a^bf(x)\, dx> \int_a^b g(x)\, dx $. (#)

Dowód:
Niech $ \Psi $ będzie funkcją pierwotną $ f-g $ na $ [a,b] $. Ponieważ $ \Psi'=f-g\ge 0 $, więc $ \Psi $ jest niemalejąca. Dlatego

\[ 0\le \Psi(b)-\Psi(a)=\int_a^b\bigl(f(x)-g(x)\bigr)\, dx  =\int_a^bf(x)\, dx -\int_a^bg(x)\, dx\, . \]

Jeśli dodatkowo $ f>g $ na $ (a,b) $, to z twierdzenia Lagrange'a o wartości średniej wnioskujemy, że $ \Psi $ jest (ściśle) rosnąca na $ [a,b] $; dlatego w tym przypadku nierówność między całkami jest ostra.

Wniosek Niech $ f\colon [a,b]\to \R $ będzie ciągła. Wówczas

\[ \begin{equation} 		\label{infcalkasup} 		(b-a)\inf_{[a,b]} f\le \int_a^bf(x)\, dx \le (b-a)\sup_{[a,b]} f\, , 	\end{equation} \]

a ponadto, dla pewnego punktu $ \xi\in (a,b) $, jest

\[ f(\xi)=\frac{1}{b-a}\int_a^bf(x)\, dx\, . \]

(#)

Dowód:
Nierówności infcalkasup otrzymujemy, stosując dwukrotnie poprzednie twierdzenie do $ f $ i funkcji stałych $ g_1=\inf f\le f $ oraz $ g_2=\sup f\ge f $. Trzeba tylko zauważyć, że dla dowolnej stałej $ m\in\R $ jest $ \int_a^b m\, dx= \bigl. mx\bigr|_a^b=m(b-a) $.

Drugą część wniosku otrzymujemy, zauważając, że

\[ \frac{1}{b-a}\int_a^bf(x)\, dx=\frac{F(b)-F(a)}{b-a} \]

gdzie $ F $ jest funkcją pierwotną $ f $. Z twierdzenia Lagrange'a o wartości średniej wynika, że prawa strona jest równa $ f(\xi) $ dla pewnego $ \xi \in (a,b) $.

Wniosek Niech $ f\colon [a,b]\to \R $ będzie ciągła. Wówczas(#)

\[ \begin{equation} 		\label{modpodcalke} 	\biggl|\int_a^bf(x)\, dx\biggr| \le \int_a^b\bigl|f(x)\bigr|\, dx\, . \end{equation} \]

Dowód:
Ponieważ $ f\le |f| $, więc $ \int_a^b f(x)\, dx\le \int_a^b |f(x)|\, dx $ (Stwierdzenie~ [link]). Podobnie,

$$-\int_a^b f(x)\, dx=\int_a^b (-f(x))\, dx\le \int_a^b |f(x)|\, dx\, .$$

Stąd już wynika teza.

Twierdzenie [przybliżanie całki sumami całkowymi] (#) Niech $ f\colon [a,b]\to \R $ będzie ciągła i niech $ \eps>0 $. Istnieje taka liczba $ \delta>0 $, że jeśli

\[ 	a=x_0<x_1<x_2<\ldots <x_n=b, \qquad x_i-x_{i-1}<\delta \quad\mbox{dla wszystkich $i=1,2,\ldots, n$}, 	\]

oraz $ t_i\in [x_{i-1},x_i] $ dla $ i=1,2,\ldots, n $, to

\[ \begin{equation} 	\label{calsuma} 	\biggl|\int_a^bf(x)\, dx - \sum_{i=1}^n f(t_i)(x_i-x_{i-1})\biggr|<\eps\, . \end{equation} \]

Dowód:
Ze wzoru addyt2 przez indukcję otrzymujemy

\[ \int_a^bf(x)\, dx =\sum_{i=1}^n\int_{x_{i-1}}^{x_i}f(x)\, dx\, . \]

Zatem, z nierówności trójkąta,

\[ \begin{eqnarray*} 	\biggl|\int_a^bf(x)\, dx - \sum_{i=1}^n f(t_i)(x_i-x_{i-1})\biggr|& = & 	\biggl|\sum_{i=1}^n\int_{x_{i-1}}^{x_i}f(x)\, dx- \sum_{i=1}^n f(t_i)(x_i-x_{i-1})\biggr|\\ 	&\le & \sum_{i=1}^n\biggl|\int_{x_{i-1}}^{x_i}f(x)\, dx-f(t_i)(x_i-x_{i-1})\biggr| = \Delta. \end{eqnarray*} \]

Aby oszacować $ \Delta $, skorzystajmy z jednostajnej ciągłości $ f $ na $ [a,b] $ i wybierzmy liczbę $ \delta>0 $ tak, aby $ |f(s)-f(t)|<\eta=\eps/(b-a) $, gdy $ |s-t|<\delta $. Z Wniosku~ [link] wynika, że

\[ \int_{x_{i-1}}^{x_i}f(x)\, dx=f(\xi_i) (x_i-x_{i-1})\qquad\mbox{dla pewnego $\xi \in  (x_{i-1},x_i)$.} \]

Ponieważ przedział $ [x_{i-1},x_i] $ jest krótszy, niż $ \delta $, więc dla dowolnego $ t_i\in [x_{i-1},x_i] $ mamy

\[ \biggl|f(t_i)(x_{i}-x_{i-1})-\int_{x_{i-1}}^{x_i}f(x)\, dx\biggr|=|f(t_i)-f(\xi_i)|(x_i-x_{i-1})<\eta\cdot (x_i-x_{i-1})\, . \]

Przeto

\[ \Delta=\sum_{i=1}^n\biggl|\int_{x_{i-1}}^{x_i}f(x)\, dx-f(t_i)(x_i-x_{i-1})\biggr|< \eta \sum_{i=1}^n (x_i-x_{i-1}) = \eta(b-a)=\eps. \]

Uzyskana nierówność kończy cały dowód.

\subsubsection*{Interpretacja geometryczna całki jako pola}

W udowodnionym twierdzeniu kryje się istota geometrycznej interpretacji całki oznaczonej jako pola pod wykresem funkcji. Przypuśćmy, że $ f $ jest ciągła i dodatnia na $ [a,b] $. Suma $ \sum f(t_i)(x_{i}-x_{i-1}) $ to suma pól prostokątów, które mają wysokości równe $ f(t_i) $ i odcinki $ [x_{i-1},x_i] $ za podstawy. Gdy podział odcinka $ [a,b] $ punktami $ x_i $ jest odpowiednio `drobny', to intuicja podpowiada, że suma pól takich prostokątów powinna z dobrym przybliżeniem dawać pole pod wykresem $ f $, tzn. pole figury, ograniczonej osią $ x $-ów, prostymi $ x=a $ i $ x=b $ oraz wykresem funkcji (patrz rysunek).

\begin{figure}[!t] \begin{center} \includegraphics*[totalheight=9.6cm]{slupki.png}</p>
<p>\end{center}

{\footnotesize\baselineskip 11pt

Suma $ \sum_{i=1}^n f(t_i) (x_{i}-x_{i-1}) $ to suma pól prostokątów. Dla dużych $ n $, gdy podstawy wszystkich prostokątów są małe, wartość tej sumy jest dobrym przybliżeniem całki $ \int_a^b f(x)\, dx $, tzn. pola zacieniowanego obszaru.

} \end{figure}

Najpoważniejszy kłopot z pełnym uściśleniem tej intuicji jest następujący: nie dysponujemy ścisłą definicją pola figury. Jednak w świetle powyższych wyjaśnień można zdefiniować pole pod wykresem funkcji (ciągłej, dodatniej) jako całkę z tej funkcji po odpowiednim przedziale.

Można też postąpić odwrotnie i zdefiniować całkę oznaczoną jako granicę odpowiednich sum całkowych $ \sum f(t_i)(x_{i}-x_{i-1}) $, otrzymanych dla coraz drobniejszych podziałów odcinka $ [a,b] $ punktami $ x_i $. W taki sposób określa się tzw. całkę Riemanna. Dla funkcji ciągłych pokrywa się ona z całką Newtona, ale nad nią pewną przewagę. Dla całki Riemanna obszerniejsza jest klasa funkcji całkowalnych; można wygodnie całkować także i (niektóre) takie funkcje, które nie mają funkcji pierwotnej, np. funkcje schodkowe. (Funkcja schodkowa, tzn. funkcja przedziałami stała, nie ma oczywiście własności Darboux (chyba, że w ogóle jest stała), a więc nie jest pochodną żadnej funkcji.) Powiemy o tym więcej w podrozdziale~ [link].

Przykład [pole koła] Posłużymy się geometryczną interpretacją całki i obliczymy pole $ P $ koła jednostkowego. Ćwiartka tego koła stanowi obszar pod wykresem funkcji $ y=\sqrt{1-x^2} $ na przedziale $ [0,1] $. Zatem

\[ 	P=4\int_0^1\sqrt{1-x^2}\, dx = 4 \cdot \biggl. \frac 12\left( {\arcsin x} + x\sqrt{1-x^2}\right)\biggr|_0^1 = 2(\arcsin 1-\arcsin 0)=\pi. 	\]

(Posłużyliśmy się wzorem na całkę nieoznaczoną funkcji $ y=\sqrt{1-x^2} $, znalezionym wcześniej, w Przykładzie~ [link]).

Zapiszmy jeszcze wniosek, który łatwo wynika z Twierdzenia~ [link].

Wniosek (#) Niech $ f\colon [a,b]\to \R $ będzie funkcją ciągłą. Wówczas

\[ \lim_{n\to\infty} \frac{b-a}n \sum_{k=1}^n f\Bigl(a+k\frac{b-a}n\Bigr) = \int_a^b f(x)\, dx\, . \]

Dowód:
Punkty $ x_k=a+k\frac{b-a}n $, gdzie $ k=0,1,\ldots, n $, dzielą $ [a,b] $ na $ n $ równych części. Wystarczy skorzystać z definicji granicy ciągu i zastosować Twierdzenie~ [link] właśnie dla tych konkretnych $ x_k $, przyjmując ponadto $ t_k=x_k $.

Przykład Korzystając z ostatniego wniosku, można (czasem) obliczać granice ciągów, których $ n $-ty wyraz jest sumą $ n $ składników $ s_k=f(k/n) $, gdzie $ 1\le k\le n $.

  1. Niech
    \[ 	c_n=\frac{1}{n+1}+\frac{1}{n+2}+\cdots+\frac1{n+n}\, . 	\]

    Nietrudno zauważyć, że $ c_n $ jest ograniczony (z góry przez $ 1 $, z dołu przez $ \frac 12 $) i rosnący, więc jest zbieżny. Możemy zapisać

    \[ c_n=\frac 1n \biggl(\frac 1{1+\frac 1n}+\frac 1{1+\frac 2n}+\cdots +\frac 1{1+\frac nn}\biggr)=\frac 1n\sum_{k=1}^n f\Bigl(\frac kn \Bigr)\, , \]

    gdzie $ f(x)=1/(1+x) $. Na mocy Wniosku~ [link],

    \[ \lim_{n\to \infty} c_n = \int_0^1\frac{dx}{1+x} = \biggl. \ln (1+x)\biggr|_0^1=\ln 2\, . \]
  2. Niech
    \[ 	d_n=\frac{n}{n^2+1^2}+\frac{n}{n^2+2^2}+\cdots+\frac n{n^2+n^2}\, . 	\]

    Tym razem, skracając liczniki i mianowniki przez $ n^2 $, otrzymujemy

    \[ d_n=\frac 1n \biggl(\frac 1{1+\frac{1^2}{n^2}}+\frac 1{1+\frac {2^2}{n^2}}+\cdots +\frac 1{1+\frac{n^2}{n^2}}\biggr)=\frac 1n\sum_{k=1}^n f\Bigl(\frac kn \Bigr)\, , \]

    gdzie $ f(x)=1/(1+x^2) $. Na mocy Wniosku~ [link],

    \[ \lim_{n\to \infty} d_n = \int_0^1\frac{dx}{1+x^2} = \biggl. \arctg x \biggr|_0^1=\frac\pi 4\, . \]

Całka Newtona a zbieżność jednostajna

Poniższe twierdzenie ma zarówno znaczenie teoretyczne, jak i praktyczne (pozwala przybliżać całki oznaczone z dowolnych funkcji ciągłych np. całkami oznaczonymi z wielomianów, albo z funkcji kawałkami liniowych).

Twierdzenie [o przejściu do granicy pod znakiem całki](#) Załóżmy, że funkcje $ f_n\colon [a,b]\to\R $ są ciągłe i $ f_n\rightrightarrows f $ na przedziale $ [a,b] $. Wtedy

\[ \lim_{n\to\infty} \int_a^b f_n(x)\, dx = \int_a^b f(x)\, dx\, . \]

    Dowód pierwszy. Dla $ n=1,2,\ldots $ wybierzmy funkcje pierwotne $ F_n,F $ funkcji $ f_n,f $ tak, aby $ F_n(a)=F(a)=0 $ dla każdego $ n $. Ponieważ ciąg pochodnych $ (f_n)=(F_n') $ jest zbieżny jednostajnie na $ [a,b] $, a ciąg funkcji $ F_n $ jest zbieżny w jednym punkcie $ x_0=a $, więc - na mocy Twierdzenia~ [link] o różniczkowaniu ciągów funkcyjnych - ciąg $ F_n $ jest zbieżny jednostajnie na $ [a,b] $ do funkcji $ G $, której pochodna jest równa $ f $. Musi też być $ G(a)=F_n(a)=0=F(a) $, a stąd $ G\equiv F $. Dlatego $ F_n(b)\to F(b) $ dla $ n\to\infty $, a więc

\[ \int_a^b f(x)\, dx=F(b)-F(a)=F(b)=\lim_{n\to\infty} F_n(b)=\lim_{n\to\infty} \bigl(F_n(b)-F_n(a)\bigr)=\lim_{n\to\infty} \int_a^b f_n(x)\, dx\, . \]

    Dowód drugi. Ustalmy $ \eps>0 $. Dobierzmy $ n_0\in N $ tak, aby $ |f_n(x)-f(x)|<\eps/(b-a) $ dla wszystkich $ n>n_0 $ i $ x\in [a,b] $. Oznaczmy

\[ I_n=\int_a^b f_n(x)\, dx\, , \qquad I = \int_a^b f(x)\, dx\, . \]

Na mocy Wniosków~ [link] i~ [link], dla $ n>n_0 $ jest

\[ \begin{eqnarray*} |I_n-I|=\biggl|\int_a^b \bigl(f_n(x)-f(x)\bigr)\, dx\biggr| & \stackrel{\eqref{modpodcalke}}\le & \int_a^b \bigl|f_n(x)-f(x)\bigr|\, dx\\ & \le & (b-a) \sup_{[a,b]}|f_n-f| < (b-a)\cdot\frac{\eps}{b-a}=\eps\, . \end{eqnarray*} \]

Zatem, wprost z definicji granicy ciągu, $ \lim I_n=I $.

Definicja Powiemy, że $ g\colon [a,b]\to \R $ jest kawałkami liniowa, jeśli $ g $ jest ciągła na $ [a,b] $ i przedział $ [a,b] $ jest sumą skończenie wielu przedziałów $ [x_{i-1},x_i] $, na których $ g(x)=\alpha_i x +\beta_i $ dla pewnych $ \alpha_i,\beta_i $.
Zadanie Wykazać, że każda funkcja ciągła $ f\colon [a,b]\to \R $ jest granicą jednostajnie zbieżnego na $ [a,b] $ ciągu funkcji kawałkami liniowych.

Wzór Wallisa i wzór Stirlinga

W 1655 roku angielski matematyk John Wallis, profesor Uniwersytetu w Oksfordzie (Wallis żył w latach 1616-1703. Ciekawostka: podczas wojny domowej w Anglii pracował także jako kryptograf.) udowodnił znany wzór na liczbę $ \pi $.

Twierdzenie [wzór Wallisa] Niech

\[ 	A_n= \frac 1n \biggl(\frac{2\cdot 4\cdot\ldots 2n}{1\cdot 3\cdot\ldots \cdot (2n-1)}\biggr)^2\, , \qquad n=1,2,\ldots . 	\]

Wówczas $ \lim_{n\to\infty}  A_n=\pi $.(#)

Dowód:
Oznaczmy

\[ I_k=\int_0^{\pi/2} (\sin x)^k\, dx\, . \]

Całki $ I_k $ można obliczyć, całkując przez części. Wykażemy, że zachodzi wzór rekurencyjny

\[ \begin{equation} 	\label{Ikk-2} I_k=\frac{k-1}k I_{k-2} \quad\mbox{dla $k\ge 2$}, \qquad I_0=\frac \pi 2, \quad I_1=1. \end{equation} \]

Równości $ I_0=\pi/2 $ oraz $ I_1=1 $ są oczywiste. Dla $ k\ge 2 $ jest, na mocy wzoru na całkowanie przez części dla całek oznaczonych,

\[ \begin{eqnarray*} I_k & = & \int_0^{\pi/2} (\sin x)^{k-1}\cdot (-\cos x)'\, dx\\      & = & \biggl.-\cos x(\sin x)^{k-1}\biggr|_0^{\pi/2} + \int_0^{\pi/2} \Bigl((\sin x)^{k-1}\Bigr)'\cdot \cos x\, dx\\ & = & 0 + (k-1)\int_0^{\pi/2} (\sin x)^{k-2}\cos ^2 x\, dx\\ & = & (k-1) \bigl(I_{k-2}-I_k\bigr)\, , \end{eqnarray*} \]

gdzie w ostatnim kroku skorzystaliśmy z równości $ \cos^2 x=1-\sin^2 x $. Wyznaczając stąd niewiadomą $ I_k $, otrzymujemy Ikk-2.

Z rekurencyjnej zależności Ikk-2 wnioskujemy, że

\[ I_2=\frac 12I_0=\frac 12\cdot \frac \pi 2\, , \qquad I_4=\frac{3}{4}\cdot\frac{1}{2}\cdot \frac\pi 2\, , \qquad\ldots,\qquad I_{2n}=\frac{(2n-1)\cdot\ldots\cdot 3\cdot 1}{2n\cdot\ldots\cdot 4\cdot 2}\cdot \frac\pi 2\, , \]

natomiast dla nieparzystych indeksów

\[ I_{2n-1}=\frac{(2n-2)\cdot\ldots\cdot 4\cdot 2}{(2n-1)\cdot\ldots\cdot 5\cdot 3}\cdot I_1 = \frac{(2n-2)\cdot\ldots\cdot 4\cdot 2}{(2n-1)\cdot\ldots\cdot 5\cdot 3}\, . \]

Zatem

\[ \pi\cdot \frac{I_{2n-1}}{I_{2n}}=\pi\cdot 2n\cdot\frac{2}{\pi}\cdot\left( \frac{(2n-2)\cdot\ldots\cdot 4\cdot 2}{(2n-1)\cdot\ldots\cdot 5\cdot 3}\right)^2= \frac{1}{n}\,\biggl(\frac{2\cdot 4\cdot\ldots 2n}{1\cdot 3\cdot\ldots \cdot (2n-1)}\biggr)^2\, . \]

Aby zakończyć dowód wzoru Wallisa, wystarczy więc wykazać, że ciąg $ a_n=I_{2n-1}/I_{2n} $ ma granicę równą 1. Dla $ x\in [0,\frac\pi 2] $ jest $ \sin x\in [0,1] $; dlatego $ (\sin x)^{k+1}\le (\sin x)^k $ dla każdego $ k\in \N $. Zatem ciąg $ I_k $ jest, na mocy Stwierdzenia~ [link], nierosnący. Dzieląc nierówność

\[ I_{2n}\le I_{2n-1}  \]

przez liczbę dodatnią $ I_{2n} $, otrzymujemy

\[ 1\le a_n\ =\ \frac{I_{2n-1}}{I_{2n}}\ \stackrel{\eqref{Ikk-2}}=\ \frac{2n}{2n-1}\cdot \frac{I_{2n-1}}{I_{2n-2}}\ \le \  \frac{2n}{2n-1}\, , \]

gdyż $ I_{2n-1}\le I_{2n-2} $. Wobec twierdzenia o trzech ciągach, $ a_n\to 1 $ dla $ n\to\infty $. Dowód wzoru Wallisa jest zakończony.

Korzystając ze wzoru Wallisa, wyprowadzimy wzór Stirlinga, (James Stirling żył w latach 1692-1770. Wzór Stirlinga pochodzi z okolic roku 1730. Są historycy matematyki, którzy utrzymują, że mniej więcej w tym samym czasie niezależnie wykazał ten wzór inny brytyjski matematyk, Abraham de Moivre.) opisujący tempo wzrostu $ n! $. Jest on przydatny w wielu zastosowaniach, m.in. w rachunku prawdopodobieństwa.

Twierdzenie [wzór Stirlinga] Istnieje taki ciąg liczb dodatnich $ \rho_n $, że

\[ \begin{equation} 		\label{Stirling} 		n! = \left( \frac ne \right)^n \cdot \sqrt{2\pi n} \cdot \rho_n, \qquad\lim_{n\to\infty } \rho_n = 1\, . 	\end{equation} \]

Dowód:
Krok 1. Zaczniemy od wykazania, że ciąg

\[ \begin{equation} 	\label{an-Stir} 	a_n = \frac{1}{n!} \left( \frac ne \right)^n \cdot \sqrt{ n} \end{equation} \]

ma skończoną granicę $ g>0 $. W tym celu obliczymy dwoma sposobami całkę oznaczoną $ \int_1^n\ln x\, dx $.

     Sposób pierwszy. Z definicji,

\[ \begin{eqnarray} \int_1^n\ln x\, dx &=&\Bigl. (x\ln x - x)\Bigr|^n_1\nonumber \\ &=& n\ln n - n +1 = \ln \left( \frac ne \right)^n + 1\, .\label{sposob1} \end{eqnarray} \]

\begin{figure}[!t] \begin{center} \includegraphics*[totalheight=6cm]{logStirling.png}\hfill \includegraphics*[totalheight=6cm]{miotelka.png}</p>
<p>\end{center}

{\footnotesize\baselineskip 11pt

Pole pod wykresem logarytmu (skala na osi pionowej zniekształcona, dla większej czytelności rysunku) przybliżamy przez sumę pól trapezów o wysokości 1. Indeks $ k $ we wzorze sposob2 spełnia $ 1\le k< k+1\le n $. Błąd, tzn. suma pól małych ``piórek'', jest ograniczony przez stałą $ \ln 2 $ niezależnie od liczby trapezów. To grube szacowanie.

} \end{figure}      Sposób drugi. Podzielmy obszar pod wykresem $ \ln x $ dla $ x\in [1,n] $ na $ (n-1) $ pasów szerokości $ 1 $, prowadząc pionowe proste o równaniach $ x=i $, gdzie $ k=1,2,\ldots,n $. Każdy z pasów składa się z trapezu (Pierwszy trapez jest zdegenerowany, tzn. jest trójkątem) o wysokości 1 i o podstawach $ \ln (k-1) $ i $ \ln k $ oraz z wąskiego ``piórka'', ograniczonego łukiem wykresu funkcji i sieczną wykresu (patrz lewy rysunek). Dzięki geometrycznej interpretacji całki, numerując trapezy od $ 1 $ do $ n-1 $, otrzymujemy

\[ \begin{eqnarray} \int_1^n\ln x\, dx &=&\mbox{suma pól $(n-1)$ trapezów}+\text{suma pól $(n-1)$ piórek}\nonumber \\ &=& \sum_{k=1}^{n-1}\frac{\ln k+\ln (k+1)}2 + \sum_{k=1}^{n-1} p_k\nonumber \\  & = & \sum_{k=1}^n\ln k -\frac 12\ln n +\sum_{k=1}^{n-1} p_k=\ln \frac{n!}{\sqrt{n}} +\sum_{k=1}^{n-1} p_k\, ,\label{sposob2} \end{eqnarray} \]

gdzie $ p_k $ oznacza pole $ k $-tego piórka. Porównując prawe strony sposob1 i sposob2, otrzymujemy równość

\[ \ln \left( \frac ne \right)^n - \ln \frac{n!}{\sqrt{n}} =-1+ \sum_{k=1}^{n-1} p_k\, , \]

tzn. równoważnie, zgodnie z oznaczeniem an-Stir,

\[ \begin{equation} 	\label{loganStir} 	\ln a_n = -1  	+ \sum_{k=1}^{n-1} p_k\, . \end{equation} \]

Zauważmy teraz, że szereg $ \sum p_k $ jest zbieżny. To wynika z wklęsłości logarytmu. Istotnie, wszystkie piórka można, dokonując przesunięć równoległych (wzdłuż siecznych), umieścić w prostokącie $ P $, ograniczonym prostymi $ x=1 $, $ x=2 $, $ y=0 $ i $ y=\ln 2 $ jako obszary rozłączne, patrz prawy rysunek. (Piórko o numerze $ k $, gdzie $ k=2,3,\ldots $, należy przesunąć równolegle o wektor $ (-k+1,-\ln k) $.) Ponieważ przesunięcie zachowuje pole figury, więc suma pól wszystkich piórek nie przekracza pola prostokąta $ P $ i dlatego

\[ \sum_{k=1}^\infty p_k = \lim_{n\to\infty } \sum_{k=1}^n p_k \in (0,\ln 2]\, . \]

Wobec loganStir, ciąg $ a_n $ ma granicę $ g=\exp\bigl(-1+\sum_{k=1}^\infty p_k\bigr)>0 $.

    Krok 2. Wyrazimy liczbę $ g $ w jawny sposób, posługując się wzorem Wallisa. Połóżmy $ b_n=(a_n)^2/a_{2n} $. Ponieważ $ \lim a_n=g>0 $, więc ciąg $ b_n $ ma granicę $ g^2/g=g $. Sprawdzamy, że

\[ b_n=\frac{(a_n)^2}{a_{2n}}=\underbrace{ \frac{1}{\bigl(n!\bigr)^2}\cdot\frac{n^{2n}}{e^{2n}}\cdot n  }_{=(a_n)^2} \cdot \underbrace{ \frac{(2n)!}{2^{2n}}\cdot \frac{e^{2n}}{n^{2n}}\cdot\frac{1}{\sqrt{2n}} }_{=1/a_{2n}}  = \frac{(2n)!}{\bigl(n!\bigr)^{2}\cdot 4^n}\cdot \sqrt{\frac n2}\, . \]

Niech $ c_n=4^{-n}(2n)!/(n!)^{2} $; wtedy

\[ b_n=c_n\cdot \sqrt{\frac n2}\, . \]

Mamy

\[ c_{n+1}=\frac{(2n+2)(2n+1)(2n!)}{4(n+1)^2 \cdot\bigl(n!\bigr)^24^n}= \frac{2n+1}{2n+2} c_n, \qquad c_1=\frac{2!}{4}=\frac 12\, . \]

Zatem, przez indukcję,

\[ c_{n}=\frac{2n-1}{2n}\cdot \frac{2n-3}{2n-2}\cdot\ldots\cdot\frac 12\, ,  \]

a więc

\[ \frac 1{b_n^2}=2 \cdot \frac 1n \biggl(\frac{2\cdot 4\cdot\ldots 2n}{1\cdot 3\cdot\ldots \cdot (2n-1)}\biggr)^2\, . \]

Ze wzoru Wallisa, patrz Twierdzenie~ [link], otrzymujemy $ \lim_{n\to\infty} (1/b_n^2)=2\pi $, stąd zaś $ g=\lim_{n\to\infty} b_n =\lim_{n\to\infty} a_n=1/\sqrt{2\pi} $. Ostatecznie więc

\[ a_n\sqrt{2\pi}=\frac{1}{n!} \left( \frac ne \right)^n \cdot \sqrt{ 2\pi n}\longrightarrow 1\qquad\mbox{dla $n\to\infty$.} \]

Kładąc $ 1/\rho_n =a_n\sqrt{2\pi} $, otrzymujemy wzór Stirlinga Stirling.

Niewymierność liczby $ \pi $. Informacje o liczbach przestępnych.

W 1761 roku niemiecki matematyk Johann Heinrich Lambert udowodnił niewymierność liczby $ \pi $. Jego dowód (Zainteresowanych odsyłam np. do pracy: M. Laczkovich, Lambert's proof of the irrationality of $ \pi $,\ Amer. Math. Monthly) 104, no. 5 (1997), 439-443. opierał się na rozwinięciu funkcji tangens w ułamek łańcuchowy (patrz rysunek) i rzadko jest dziś przytaczany w książkach, bo wykazywanie zbieżności tego rozwinięcia do tangensa wymaga wysiłku, a znane są prostsze dowody. Opiszemy tu jeden z nich.

\begin{figure}[!t] \begin{center} \includegraphics*[totalheight=4.8cm]{Lambert-cf.jpg}</p>
<p>{\footnotesize\baselineskip 11pt</p>
<p>Skan fragmentu pracy Lamberta (źródło: Wikipedia). </p>
<p>}</p>
<p>\end{center} \end{figure}

Zaczniemy od nietrudnego, pomocniczego lematu.

Lemat (#) Niech $ w(x)=\frac {1}{n!} x^n(1-x)^n $ dla $ x\in [0,1] $. Wówczas

  1. $ 0<w(x)\le 4^{-n}/n!< 1/n! $ dla każdego $ x\in (0,1) $;
  2. $ w(x)=\frac {1}{n!}\sum_{k=n}^{2n}c_kx^k, $ gdzie wszystkie współczynniki $ c_k $ są całkowite;
  3. Liczby $ w^{(k)}(0) $ i $ w^{(k)}(1) $ są całkowite dla każdego $ k=0,1,\ldots $; ponadto, $ w^{(k)}(0)=w^{(k)}(1)=0 $ dla wszystkich $ k<n $ i $ k>2n $.

Dowód:
Dla $ x\in (0,1) $ jest $ 0<x(1-x)\le 1/4 $. Podnosząc tę nierówność do $ n $-tej potęgi i dzieląc przez $ n! $, otrzymujemy pierwszy punkt tezy. Drugi punkt tezy wynika natychmiast z równości

\[ n!w(x)=x^n(1-x)^n=x^n\sum_{l=0}^n(-1)^l \binom nl x^l %=\sum_{l=0}^n (-1)^l \binom nl x^{l+n}  %= \sum_{k=n}^{2n}(-1)^{k-n} \binom n{k-n} x^k \]

(współczynniki dwumianowe Newtona są całkowite). Aby wykazać trzecią własność wielomianu $ w $, zauważmy, że $ w(x)=w(1-x) $ i dlatego $ w^{(k)}(x)=(-1)^kw^{(k)}(1-x) $, tzn. $ w^{(k)}(1)=\pm w^{(k)}(0) $. Wystarczy więc zbadać liczby $ w^{(k)}(0) $. Z drugiego punktu tezy wynika, że $ w^{(k)}(0)=0 $ dla $ k<n $ i $ k>2n $ (dla $ k>2n $ funkcja $ w^{(k)}\equiv 0 $, gdyż $ w $ jest wielomianem stopnia $ 2n $). Natomiast dla $ k\in \{n,n+1,\ldots, 2n\} $ mamy

\[ w^{(k)} (0) = \frac {k!}{n!} c_k \in \Z\, , \]

gdyż wtedy $ n! $ jest dzielnikiem $ k! $.

Zanotujmy też oddzielnie inny nietrudny fakt, który przyda się nam nie tylko do dowodu niewymierności $ \pi $.

Lemat [wzór na wielokrotne całkowanie przez części] Niech $ f,g\colon [a,b]\to \R $ będą funkcjami klasy $ C^N $. Wówczas

\[ \begin{eqnarray} 		\label{czesciN} 		\int_a^b f(x)g^{(N)}(x)\, dx &=&\left. \biggl(fg^{(N-1)}-f'g^{(N-2)}+\cdots +(-1)^{N-1}f^{(N-1)}g\biggr)\right|_a^b\\ 	&	&{} + (-1)^N\int_a^b f^{(N)}(x)g(x)\, dx\, .\nonumber 	\end{eqnarray} \]

(#)

Dowód:
Stosujemy $ N $-krotnie wzór na całkowanie przez części, przerzucając w każdym kroku jedno różniczkowanie z $ g $ na $ f $:

\[ \begin{eqnarray*} 	\int_a^b f(x)g^{(N)}(x)\, dx &=& \left. fg^{(N-1)}\right|_a^b - \int_a^b f'(x) g^{(N-1)}(x)\, dx\\ &=& \left. \biggl(fg^{(N-1)}-f'g^{(N-2)}\biggr)\right|_a^b +\int_a^b f^{(2)}(x)g^{(N-2)}(x)\, dx\\[8pt] &  \vdots& \\[8pt] &=&\left. \biggl(fg^{(N-1)}-f'g^{(N-2)}+\cdots +(-1)^{N-1}f^{(N-1)}g\biggr)\right|_a^b\\ &	&{} + (-1)^N\int_a^b f^{(N)}(x)g(x)\, dx\, . \end{eqnarray*} \]

Całkujemy zawsze funkcję typu $ f^{(k)}g^{(N-k)} $ i dlatego pojawia się składnik $ \pm\bigl. f^{(k)}g^{(N-k-1)}\bigr|_a^b $; nietrudno zauważyć i wypisać regułę, określającą znaki kolejnych składników.

Twierdzenie Liczba $ \pi $ jest niewymierna.

Dowód:
Będziemy dowodzić tezy przez zaprzeczenie. Przypuśćmy, że $ \pi = l/m $ dla pewnych $ l,m\in \N $. Rozpatrzmy liczbę

\[ A_n = m^n\pi^{2n+1}\int_0^1 w(x)\sin \pi x\, dx\, , \]

gdzie

\[ w(x)\equiv w_n(x)=\frac{1}{n!} x^n(1-x)^n \]

oznacza wielomian z Lematu~ [link]. Wykażemy, że $ \lim_{n\to\infty} A_n =0 $ i $ A_n $ jest liczbą całkowitą dodatnią dla każdego $ n $. Ta oczywista sprzeczność zakończy dowód.

    Krok 1. $ \lim_{n\to\infty} A_n =0 $. Istotnie, z nierówności $ 0<\sin \pi x\le 1 $, pierwszego punktu tezy Lematu~ [link] i monotoniczności całki wynika, że

\[ 0<A_n \le \pi\bigl(m\pi^2\bigr)^n\int_0^1 \frac{1}{n!} \sin \pi x\, dx= \pi \frac{\bigl(m\pi^2\bigr)^n}{n!} \int_0^1\sin \pi x\, dx \le \pi \frac{(m\pi^2)^n}{n!}\, . \]

Ciąg $ y^n/n!\to 0 $ dla każdego $ y\in \R $, gdyż szereg potęgowy funkcji wykładniczej jest zbieżny na całej prostej.

    Krok 2. Liczby $ A_n $ są całkowite dodatnie. Wiemy już, że $ A_n>0 $ dla każdego $ n $. Aby stwierdzić, że $ A_n\in \Z $, posłużymy się wzorem na wielokrotne całkowanie przez części, biorąc przedział $ [a,b]=[0,1] $, liczbę $ N=2n+1 $, $ f(x)=w(x) $, oraz

\[  g^{(N)}(x)=\pi^{2n+1}\sin \pi x =  \mp \left(\cos\pi x\right)^{(N)}\, \qquad\mbox{tzn.}\qquad g(x)=\mp \cos\pi x\, . \]

(Znak nie będzie odgrywał istotnej roli w rachunkach). Ponieważ $ w=w_n $ jest wielomianem stopnia $ 2n $, a $ N=2n+1>2n $, więc $ w^{(N)}\equiv 0 $ i całka $ \int w^{(N)} g\, dx $ po prawej stronie wzoru czesciN znika. Dlatego

\[ \begin{eqnarray} A_n&=&m^n \left. \biggl(wg^{(N-1)}-w'g^{(N-2)}+\cdots +(-1)^{N-1}w^{(N-1)}g\biggr)\right|_0^1\label{an-nawias}\\ & = & m^n \left. \biggl((-1)^nw^{(n)}g^{(N-n-1)} +(-1)^{n+1}w^{(n+1)}g^{(N-n-2)} +\cdots +(-1)^{N-1}w^{(2n)}g\biggr)\right|_0^1\, ,\nonumber \end{eqnarray} \]

gdyż $ w^{(k)} $ znika w punktach $ 0 $ i $ 1 $ dla $ k<n $ (patrz Lemat~ [link], punkt 3). Sprawdzimy teraz, że każdy składnik w nawiasie jest liczbą wymierną postaci $ p/m^s $, gdzie $ p\in \Z $, natomiast $ s\in \{0,1,\ldots,n\} $. Stąd już wyniknie teza $ A_n\in \Z $. Pochodne funkcji $ w $ w punktach $ 0 $ i $ 1 $ są całkowite (Lemat~ [link]). Mamy też

\[ |g^{(s)}(x)|=\left\{\begin{array}{ll} \pi^{s}|\sin \pi x| \qquad & \mbox{dla $s$ nieparzystych},\\ \pi^{s}|\cos \pi x| \qquad & \mbox{dla $s$ parzystych}.\\ \end{array}\right. \]

W drugiej linii wzoru an-nawias występują pochodne $ g^{(s)} $ dla $ s=0,1,2, \ldots, N-n-1 $, tzn. dla $ s=0,1,2,\ldots, n $. Funkcje $ \pm\sin \pi x $ i $ \pm \cos\pi x $ przyjmują w punktach $ 0,1 $ wartości $ 0 $ i $ \pm 1 $. Dlatego $ g^{(s)}(x) $ przyjmuje w tych punktach wartości

\[ 0, \qquad \pm \pi^s= \pm \frac{l^s}{m^s}\, , \quad s=0,1,2,\ldots, n. \]

Iloczyny $ m^n\cdot \bigl(\pm w^{(N-1-s)}(x)g^{(s)}(x)\bigr) $ są więc, dla $ x\in \{0,1\} $, całkowite. Liczba $ A_n $, która jest sumą takich iloczynów, też więc jest całkowita.

Uwaga W podobny sposób można wykazać niewymierność liczby $ \pi^2 $ (patrz np. książka: M. Aigner, G.M. Ziegler, Dowody z księgi), a także niewymierność wszystkich liczb $ r $, dla których $ \cos r $ jest liczbą wymierną.

Niewymierność drugiej z najważniejszych stałych, z którymi Czytelnik spotyka się w analizie matematycznej, liczby $ e $, można udowodnić znacznie łatwiej: gdyby $ e=p/q $ dla pewnych $ p,q\in \N $, to mielibyśmy

\[ x:=q!\biggl(e-\sum_{n=0}^q\frac{1}{n!}\biggr)=p(q-1)!- \sum_{n=0}^q\frac{q!}{n!}\in \Z\,  \]

gdyż $ n! $ dzieli $ q! $ dla $ n\le q $; z drugiej strony, ponieważ $ e=\sum_{n=0}^\infty 1/n! $, więc

\[ 0< x=q!\biggl(e-\sum_{n=0}^q\frac{1}{n!}\biggr)=\sum_{n=q+1}^\infty\frac{q!}{n!}< \frac{1}{q+1}+\frac{1}{(q+1)^2}+\frac{1}{(q+1)^3}+\cdots = \frac 1q < 1. \]

To jest sprzeczność, gdyż w $ (0,1) $ nie ma żadnej liczby całkowitej.

Przytoczony dowód niewymierności $ \pi $ jest dużo młodszy od oryginalnego dowodu Lamberta. Podobny charakter ma dowód przestępności liczby $ e $.

Definicja Liczba $ z\in \C $ nazywa się algebraiczna, jeśli dla pewnych $ a_0,a_1,\ldots,a_n\in \Z $, $ n\in \N $ zachodzi równość

\[ 	a_0+a_1z+\cdots + a_nz^n=0\, . 	\]

Liczba zespolona, która nie jest algebraiczna, nazywa się przestępna.

Łatwo zauważyć, że wszystkie liczby wymierne są algebraiczne: $ x=p/q\in \Q\subset \R\subset \C $ jest rozwiązaniem równania liniowego $ p-qx=0 $ o współczynnikach całkowitych $ p,q $. Zbiór liczb algebraicznych jest przeliczalny, gdyż dla każdej z przeliczalnie wielu wartości $ n=1,2,\ldots  $ istnieje tylko przeliczalnie wiele wielomianów $ a_0+a_1x+\cdots + a_nx^n $ o współczynnikach całkowitych, a każdy z nich ma co najwyżej $ n $ pierwiastków rzeczywistych. Jednak $ \R $ jest zbiorem nieprzeliczalnym, więc w $ \R $ istnieją liczby przestępne. Pierwszy konkretny przykład takiej liczby,

\[ \sum_{n=0}^\infty\frac{1}{10^{n!}}\, , \]

podał w latach 40-tych XIX wieku Joseph Liouville. W 1873 roku Charles Hermite udowodnił przestępność $ e $.

{\tt $ \spadesuit $ \raggedright \texttt{Dodatek roboczy: resztę tego podrozdziału przy okazji spiszę nieco inaczej, w sposób bliższy przedstawionemu na wykładzie, wyodrębniając w postaci oddzielnego Lematu własności pomocniczego wielomianu $ W $, używanego w dowodzie przestępności $ e $.}

}

Twierdzenie Liczba $ e $ jest przestępna.

Dowód:
Będziemy dowodzić przez zaprzeczenie. Przypuśćmy, że

\[ a_0+a_1e+a_2e^2+\cdots+a_ne^n= 0 \]

dla pewnych $ a_i\in \Z $ ($ i=0,1,\ldots, n $).

     Krok 1. Niech $ W $ oznacza dowolny wielomian zmiennej rzeczywistej, stopnia $ m $. Sprawdzimy, że jeśli całka $ I(x) $ określona jest wzorem

\[ \begin{equation} \label{I} I(x)=\int_0^x e^{x-u} W(u)\, du\, , \end{equation} \]

to

\[ \begin{equation} 	\label{wzornaIx} 	I(x)= e^x\sum_{j=0}^m W^{(j)}(0)-\sum_{j=0}^m W^{(j)}(x)\, . \end{equation} \]

Istotnie, całkując przez części, przekonujemy się, że

\[ 	I(x)=e^x\int_0^x e^{-u}W(u)\, du = e^x \biggl(\biggl.-e^uW(u)\biggr|_0^x+\int_0^x e^{-u}W'(u)\, du\biggr)\, , 	\]

stąd zaś przez indukcję (pamiętajmy, że $ W^{(m+1)}\equiv 0 $)

\[ I(x)=-e^{x-u} \biggl.\Bigl(W(u)+W'(u)+W''(u)+\cdots +W^{(m)}(u)\Bigr)\biggr|_0^x =  e^x\sum_{j=0}^m W^{(j)}(0)-\sum_{j=0}^m W^{(j)}(x)\, . \]

Można również dowieść wzornaIx, stosując od razu wzór na wielokrotne całkowanie przez części.

     Krok 2. Niech $ p $ będzie dostatecznie dużą liczbą pierwszą. (Szereg odwrotności liczb pierwszych jest rozbieżny, więc liczb pierwszych jest nieskończenie wiele). Połóżmy

\[ \begin{equation} 	\label{wzornaW} 	W(x)=x^{p-1}(x-1)^p\cdot\ldots \cdot (x-n)^p \end{equation} \]

i rozpatrzmy całkę

\[ J=\sum_{k=0}^na_k I(k)\, , \]

gdzie liczby $ a_k $ są całkowitymi współczynnikami wielomianu znikającego w punkcie $ e $. Niech $ m=(n+1)p-1=\deg W $. Ze wzoru wzornaIx otrzymujemy

\[ \begin{eqnarray} J=	\sum_{k=0}^na_k I(k) & = & \sum_{k=0}a_k \biggl(e^k\sum_{j=0}^m W^{(j)}(0)-\sum_{j=0}^m W^{(j)}(k)\biggr)\nonumber \\ & = & - \sum_{k=0}^n\sum_{j=0}^m a_k W^{(j)}(k)\, ,\label{wzornaJ} \end{eqnarray} \]

gdyż $ \sum a_ke^k=0 $ z założenia o algebraiczności $ e $.

     Krok 3. Aby zbadać wartość $ J $, wyznaczymy pochodne $ W $ w punktach $ 0,1,\ldots, n $. Posługując się wzorem Leibniza na wyższe pochodne iloczynu dwóch funkcji, łatwo otrzymać następujące zależności:

\[ \begin{gather} 	W^{(j)}(k) = 0 \qquad\mbox{dla $j<p$ i $k=1,2,\ldots, n$},\label{Wjk}\\ 		W^{(j)}(0) = 0 \qquad\mbox{dla $j<p-1$. }\label{Wj0} \end{gather*} \]

Dla przykładu sprawdźmy równość Wjk. (Tak samo sprawdza się Wj0.) Jest $ W(x)=f(x)\cdot g(x) $ dla $ f(x)=(x-k)^p $ i $ g(x) $ zdefiniowanego jako iloczyn pozostałych czynników po prawej stronie wzornaW. Dlatego, ze wzoru Leibniza,

\[ W^{(j)}(k)\ \stackrel{\text{Stw.~\ref{wzorLeibniza}}}= \ \sum_{i=0}^j \binom ji f^{(i)}(k) g^{(j-i)}(k) = 0, \]

gdyż $ f^{(i)}(k)=\bigl.p(p-1)\ldots (p-i+1) (x-k)^{p-i}\bigr|_{x=k}=0 $ dla każdego $ i=0,1,\ldots, j $, gdy $ j<p $. Zauważmy jeszcze, że dla $ k>0 $ jest $ f^{(p)}(k)=p! $ i $ f^{(j)}(k)=0 $ dla $ j>p  $, a więc $ f^{(j)}(k) $ jest liczbą podzielną przez $ p! $.

Nietrudno teraz wywnioskować, że dla $ j=0,1,2,\ldots, m $ i $ k=0,1,\ldots, n $

\[ \begin{equation} 	\mbox{$W^{(j)}(k)\in \Z$ jest liczbą podzielną przez $p!$, chyba, że $j=p-1$, $k=0$;} \end{equation} \]

natomiast

\[ \begin{equation} 	\label{Wp-1} 	W^{(p-1)}(0)=(p-1)! (-1)^{np} (n!)^p\, . \end{equation} \]

Ostatnią równość też można sprawdzić, posługując się wzorem Leibniza, podobnie jak Wjk. Dla liczb pierwszych $ p>n $ liczba $ W^{(p-1)}(0) $ jest więc podzielna przez $ (p-1)! $, ale niepodzielna przez $ p! $.

     Krok 4. Niech odtąd

\[ p>M := \max\bigl(n, |a_0|, |a_1|,\ldots, |a_n|\bigr)\, . \]

Wstawiając obliczone wartości pochodnych $ W $ do wzoru wzornaJ na całkę $ J $, sprawdzamy, że $ J $ jest liczbą całkowitą podzielną przez $ (p-1)! $ i niepodzielną przez $ p! $. To wynika stąd, że wszystkie za wyjątkiem jednego składniki sumy w wzornaJ są podzielne przez $ p! $, zaś jeden, $ a_0 W^{(p-1)}(0) $, wobec Wp-1 dzieli się przez $ (p-1)! $, ale wskutek doboru $ p $ już nie przez $ p! $.

Dlatego $ J\not =0 $ i $ |J|\ge (p-1)! $. Z drugiej strony, posługując się monotonicznością całki i szacując dość brutalnie, otrzymujemy

\[ \begin{eqnarray*} |J| & \le & \sum_{k=0}^n|a_k| |I(k)|\\ &\le& M\sum_{k=0}^n |I(k)|\qquad\mbox{z definicji $M$}  \\ & \le & M e^n \sum_{k=0}^n k \cdot \max_{x\in [0,k]} |W(x)|\qquad\mbox{z definicji $I(k)$ oraz \eqref{modpodcalke}-\eqref{infcalkasup}}\\ & \le & Mn^2e^n \cdot  \max_{x\in [0,n]} |W(x)| \\ & \le & Mn^2e^n \cdot n^{p-1} n^{np} = A\cdot B^p, \end{eqnarray*} \]

gdzie stałe $ A=Mn\, e^n $ i $ B=n^{n+1} $ zależą od $ n $ i współczynników $ a_k $ wielomianu, zerującego się w $ e $, ale nie od liczby $ p $. Porównując uzyskane oszacowania całki $ J $, otrzymujemy

\[ (p-1)!\le |J|\le AB \cdot B^{p-1},  \]

lub równoważnie

\[ 1\le AB\cdot\frac{B^{p-1}}{(p-1)!}\, . \]

To jest sprzeczność dla dużych $ p $, gdyż $ B^k/k!\to 0 $ dla $ k\to \infty $ i każdego $ B\in \R $.

Rok po dowodzie Hermite'a Georg Cantor wprowadził pojęcie mocy zbioru i wykazał, że zbiór liczb przestępnych jest nieprzeliczalny. Niecałe 10 lat później, w roku 1882, Ferdinand von Lindemann (promotor prac doktorskich Davida Hilberta i Hermanna Minkowskiego) wykazał, że liczba $ \pi $ jest przestępna. Wynika stąd, że kwadratury koła nie można przeprowadzić za pomocą cyrkla linijki. Dowód przestępności $ \pi $ jest zbliżony do dowodu przestępności $ e $, choć wymaga minimalnie głębszej wiedzy z algebry. Zainteresowany czytelnik odnajdzie go w książeczce Alana Bakera Transcendental number theory. (Cambridge University Press, 1975 r.; dostępna w bibliotece MIM.)

Uwaga W 1900 roku David Hilbert umieścił na swojej słynnej liście 23 problemów matematycznych (jako problem nr 7) pytanie o to, czy $ \alpha^\beta $ jest przestępna, gdy $ \alpha>0 $ jest liczbą algebraiczną, zaś $ \beta $ liczbą algebraiczną i niewymierną. Twierdzącą odpowiedź podali Gelfond i Schneider w 1934 roku. %Twierdzenie o przestępności $ \pi $ można z ich wyniku, wzoru %$ e^{i\pi}=-1 $ i niewymierności $ \pi $ uzyskać jako prosty wniosek.

Wzór Taylora z resztą w postaci całkowej

W poprzednich podrozdziałach wykorzystaliśmy wzór na wielokrotne całkowanie przez części do dowodów niewymierności $ \pi $ i przestępności $ e $. Teraz wskażemy jeszcze jedno zastosowanie tego wzoru, bardzo przydatne (także do analizowania funkcji wielu zmiennych, z którymi Czytelnik wielokrotnie zetknie się w późniejszych swoich studiach).

Twierdzenie [wzór Taylora z resztą całkową] Niech $ g\in C^{k+1}([a,b]) $, $ a<x<b $. Wówczas

\[ \begin{equation} 	\label{taylor-calko} 	g(x)=g(a) +\sum_{j=1}^k \frac{g^{(j)}(a)}{j!} (x-a)^j + \int_a^x \frac{(x-t)^k}{k!} g^{(k+1)}(t)\, dt\, . \end{equation} \]

Dowód:
Ustalmy $ x\in (a,b) $. Obliczymy całkę we wzorze taylor-calko, posługując się wzorem czesciN z Lematu~ [link] na przedziale $ [a,x] $. Niech $ N=k+1 $, $ f(t)=(x-t)^k/k! $. Przy takich oznaczeniach

\[ \begin{eqnarray} 	\int_a^x \frac{(x-t)^k}{k!} g^{(k+1)}(t)\, dt & = & \int_a^x f(t)g^{(N)}\, dt \nonumber\\ 	& = &  \left.\biggl(fg^{(N-1)}-f'g^{(N-2)}+\cdots +(-1)^{N-1}f^{(N-1)}g\biggr)\right|_a^x\nonumber\\ &	&{} + (-1)^N\int_a^x f^{(N)}(t)g(t)\, dx\label{taycalkwypr}\\ & = & \left.\biggl(fg^{(N-1)}-f'g^{(N-2)}+\cdots\nonumber +(-1)^{N-1}f^{(N-1)}g\biggr)\right|_a^x\,  \end{eqnarray} \]

gdyż $ f^{N}\equiv 0 $, bowiem $ f $ jest wielomianem stopnia $ k<N=k+1 $. Różniczkując $ f $, otrzymujemy

\[ f^{(j)}(t)=(-1)^j \frac{(x-t)^{k-j}}{(k-j)!}, \qquad j=0,1\ldots,k\, . \]

Dlatego dla $ 0\le j<k=N-1 $ jest

\[ \Bigl.(-1)^j f^{(j)} g^{(N-1-j)} \Bigr|_a^x = - \frac{(x-a)^{k-j}}{(k-j)!} g^{(N-1-j)}(a) = -\frac{(x-a)^{k-j}}{(k-j)!} g^{(k-j)}(a)\, , \]

natomiast dla $ j=k=N-1 $ otrzymujemy $ f^{(k)}\equiv (-1)^k $ i

\[ \Bigl.(-1)^j f^{(j)} g^{(N-1-j)} \Bigr|_a^x = g(x)-g(a) \]

Podstawiając te wyrażenia do wzoru taycalkwypr, znajdujemy wartość ostatniej sumy i sprawdzamy, że

\[ \int_a^x \frac{(x-t)^k}{k!} g^{(k+1)}(t)\, dt = g(x)-g(a)-\sum_{i=1}^k \frac{(x-a)^{i}}{i!} g^{(i)}(a) \]

(wygodnie jest zmienić indeks $ k-j $ na $ i $ i dopasować granice sumowania). Dowód jest zakończony.

Całka Riemanna

(#)

Omówimy teraz inne podejście do definicji całki oznaczonej. Z grubsza biorąc, chodzi o to, że definicję można oprzeć o geometryczną interpretację całki, omówioną przez nas wcześniej, przy okazji dowodu Twierdzenia~ [link]. Takie podejście pozwala rozszerzyć klasę funkcji, dla których całka jest określona, o pewne funkcje nieciągłe. Dla funkcji ciągłych oba podejścia (całka Newtona, zdefiniowana jako przyrost funkcji pierwotnej, oraz całka Riemanna) dają identyczny wynik. Definicja całki Newtona jest w teorii całki Riemanna twierdzeniem, natomiast o poprawności definicji całki Riemanna funkcji ciągłej przesądzają oszacowania sum całkowych, które poznaliśmy właśnie w Twierdzeniu~ [link].

Ustalmy przedział $ [a,b] $ osi rzeczywistej. Będziemy rozważać funkcje ograniczone (ale niekoniecznie ciągłe) $ f\colon [a,b]\to \R $.

Definicja [podział przedziału] Podziałem $ P $ przedziału $ [a,b] $ nazwiemy każdy skończony ciąg punktów $ (x_0,x_1,\ldots, x_n) $ taki, że

\[ 	a=x_0\le x_1\le \ldots\le x_n=b\, . 	\]

Piszemy $ \Delta x_i=x_i-x_{i-1} $, $ i=1,\ldots, n $. Zbiór wszystkich podziałów odcinka $ [a,b] $ będziemy oznaczać literą $ \P $. Będziemy też milcząco przyjmować, że napis $ (x_0,x_1,\ldots, x_n) $ oznacza w tym podrozdziale ciąg niemalejący (#)

Definicja [sumy całkowe Riemanna] Niech $ f\colon [a,b]\to \R $ będzie funkcją ograniczoną, a $ P=(x_0,x_1,\ldots, x_n)\in \P $ - ustalonym podziałem $ [a,b] $. Sumy

\[ G(P,f)=\sum_{i=1}^n\ \sup_{[x_{i-1},x_i]} f \,\cdot\, \Delta x_i, \qquad D(P,f) =\sum_{i=1}^n\ \inf_{[x_{i-1},x_i]} f \,\cdot\,  \Delta x_i \]

nazywamy odpowiednio górną i dolną sumą Riemanna funkcji $ f $ dla podziału $ P $.

Interpretacja geometryczna górnych i dolnych sum Riemanna funkcji ograniczonej, nieujemnej $ f $ jest dość oczywista: suma górna jest sumą pól prostokątów, których podstawy są odcinkami podziału $ P $, a wysokości dobrane zostały tak, żeby suma prostokątów przykryła (jak najoszczędniej) cały zbiór $ Z=\{(x,y)\colon 0\le y\le f(x), x\in [a,b]\} $ punktów pod wykresem $ f $. Obliczając sumę dolną, dobieramy wysokości tak, aby jak najlepiej przybliżyć zbiór $ Z $ od wewnątrz.

Definicja [górna i dolna całka Riemanna] Niech $ f\colon [a,b]\to \R $ będzie funkcją ograniczoną. Liczby

\[ 	\inf_{P\in \P} G(P,f), \qquad \sup_{P\in \P} D(P,f) 	\]

nazywamy odpowiednio górną i dolną całką Riemanna funkcji $ f $ na odcinku $ [a,b] $.

Zauważmy, że definicja jest poprawna: jeśli $ M=\sup |f| $, to dla dowolnego podziału $ P\in \P $ jest

\[ -M(b-a)\le D(P,f)\le G(P,f)\le M(b-a)\, , \]

gdyż na każdym odcinku podziału $ -M\le f\le M $; mnożąc tę nierówność przez $ \Delta x_i\ge 0 $ i sumując, otrzymujemy oszacowanie sum dolnych i górnych. Wobec aksjomatu ciągłości, oba kresy, o których mowa w powyższej definicji, istnieją.

Definicja [funkcje całkowalne w sensie Riemanna] Jeśli $ f\colon [a,b]\to \R $ jest ograniczona i

\[ 	\inf_{P\in \P} G(P,f) = \sup_{P\in \P} D(P,f)\, , 	\]

to mówimy, że $ f $ jest całkowalna w sensie Riemanna. Kładziemy wówczas

\[ \int_{a}^b f(x)\, dx = \inf_{P\in \P} G(P,f) = \sup_{P\in \P} D(P,f)\, . \]

Zbiór wszystkich funkcji całkowalnych w sensie Riemanna na przedziale $ [a,b] $ oznaczymy $ \Riem $.

Pytanie o to, które funkcje ograniczone są całkowalne w sensie Riemanna, jest dość subtelne. Zacznijmy od prostych przygotowań natury technicznej. Powiemy, że podział $ P_1 $ jest zagęszczeniem podziału $ P $, jeśli każdy punkt podziału $ P $ jest także punktem $ P_1 $ (inaczej: $ P_1 $ powstaje z $ P $ przez dorzucenie skończenie wielu punktów).

Stwierdzenie (#) Jeśli $ P_1 $ jest zagęszczeniem $ P $, a $ f $ funkcją ograniczoną na $ [a,b] $, to

\[ 	D(P,f)\le D(P_1,f), \qquad G(P_1,f) \le G(P,f) 	\]

Inaczej mówiąc, zagęszczanie podziału zwiększa dolne sumy Riemanna i zmniejsza sumy górne. Dla kogoś, kto rozumie geometryczną interpretację sum całkowych, ten fakt powinien być praktycznie oczywisty.

Dowód:
Dla porządku wykażemy pierwszą nierówność. Jeśli $ P_1 $ powstaje z $ P $ przez dorzucenie jednego punktu $ y $ do odcinka $ [x_{s-1},x_s] $, to

\[ m_1:=\inf_{[x_{s-1},y]} f\ge \inf_{[x_{s-1},x_s]} f=:m, \qquad m_2:=\inf_{[y,x_s]} f\ge \inf_{[x_{s-1},x_s]} f=:m, \]

gdyż kres dolny funkcji nie spada, gdy zawężamy jej dziedzinę. Sumy całkowe $ D(P,f) $ i $ D(P_1,f) $ różnią się tylko składnikami, odpowiadającymi podzbiorom odcinka $ [x_{s-1},x_s] $. Dlatego

\[ \begin{eqnarray*} D(P_1,f)-D(P,f) &=& m_1 (y-x_{s-1}) +m_2(x_s-y)-m(x_s-x_{s-1})\\ & \ge& m\bigl(y-x_{s-1}+x_s-y-(x_s-x_{s-1})\bigr)=0\, . \end{eqnarray*} \]

Jeśli $ P_1 $ powstaje z $ P $ przez dorzucenie $ k $ punktów, to powyższe rozumowanie należy powtórzyć $ k $ razy. Dowód drugiej nierówności jest analogiczny.

Wniosek Całka dolna Riemanna funkcji ograniczonej nie przekracza całki górnej tej funkcji.

Dowód:
Niech $ P_1,P_2\in \P $ i niech $ P_3 $ będzie zagęszczeniem zarówno $ P_1 $, jak i $ P_2 $ - np. niech $ P_3 $ składa się z punktów obu podziałów $ P_{1} $ i $ P_2 $. Wtedy, z powyższego stwierdzenia

\[ D(P_1,f)\le D(P_3,f) \le G(P_3,f)\le D(P_2,f)\, , \]

stąd zaś $ D(P_1,f)\le G(P_2,f) $ dla wszystkich podziałów $ P_1,P_2\in \P $. Biorąc najpierw - przy ustalonym $ P_1 $ - kres dolny prawej strony względem $ P_2\in \P $, następnie zaś kres górny lewej strony względem $ P_1\in \P $, otrzymujemy tezę wniosku.

Wniosek Funkcja ograniczona $ f\in\Riem $ wtedy i tylko wtedy, gdy dla każdego $ \eps>0 $ istnieje podział $ P\in \P $ taki, że $ G(P,f)-D(P,f)<\eps $.(#)

Dowód:
Niech $ I_g $ oznacza całkę górną, zaś $ I_d $ - całkę dolną funkcji $ f $. Jeśli $ I_g=I_d $ i $ \eps>0 $, to wobec definicji kresu górnego i dolnego znajdziemy podziały $ P_1,P_2\in \P $ takie, że

\[ I_d-\frac\eps2 < D(P_1,f) \le I_d=I_g\le G(P_2,f)< I_g+\frac \eps2=I_d+\frac\eps2\, . \]

Niech $ P_3 $ będzie zagęszczeniem zarówno $ P_1 $, jak i $ P_2 $. Wtedy, wobec Stwierdzenia~ [link],

\[ I_d-\frac\eps 2< D(P_1,f)\le D(P_3,f)\le G(P_3,f)\le G(P_2,f)< I_d+\frac\eps 2\,  \]

zatem liczby $ G(P_3,f)\ge D(P_3,f) $ należą do tego samego przedziału, krótszego niż $ \eps $. To kończy dowód implikacji $ \Rightarrow $.

Implikacja $ \Leftarrow $ jest łatwiejsza: jeśli dla każdego $ \eps>0 $ istnieje podział $ P $, dla którego sumy górna i dolna różnią się mniej, niż o $ \eps $, to wprost z definicji kresu górnego i dolnego

\[ 0\le I_g-I_d<\eps \]

dla każdego $ \eps>0 $. Zatem $ I_d=I_g $.

Twierdzenie Każda funkcja $ f\in C([a,b]) $ jest całkowalna w sensie Riemanna. Jej całka Riemanna i całka Newtona są równe.

Dowód:
Wykażemy najpierw, że każda funkcja ciągła spełnia równoważny warunek całkowalności w sensie Riemanna, podany w poprzednim wniosku. Ustalmy $ \eps>0 $. Dobierzmy, korzystając z jednostajnej ciągłości $ f $ na $ [a,b] $, liczbę $ \delta>0 $ tak, aby $ |f(s)-f(t)|<\eps/(b-a) $ dla wszystkich $ |s-t|<\delta $, $ s,t\in [a,b] $. Niech $ P $ będzie takim podziałem $ [a,b] $, że $ \Delta x_i<\delta $ dla każdego $ i=1,\ldots,n $. Wtedy liczby

\[ m_i:=\inf_{[x_{i-1},x_i]} \, f\, , \qquad M_i:=\sup_{[x_{i-1},x_i]}\, f \]

dla każdego $ i=1,\ldots,n $ różnią się mniej niż o $ \eps/(b-a) $, gdyż są wartościami (Funkcja ciągła osiąga swoje kresy na każdym odcinku domkniętym, wyznaczonym przez dwa sąsiednie punkty podziału $ P $.) funkcji $ f $ na przedziale krótszym niż $ \delta $. Zatem

\[ 0\le G(P,f)-D(P,f) = \sum_{i=1}^n (M_i-m_i)\cdot \Delta x_i < \frac{\eps}{b-a} \cdot \sum_{i=1}^n  \Delta x_i  =\frac{\eps}{b-a}\cdot (b-a)=\eps\, . \]

Na mocy poprzedniego wniosku, $ f\in\Riem $.

Pozostaje wykazać równość obu całek: Newtona i Riemanna. Oznaczmy je odpowiednio $ I_N $ i $ I_R $. Jeśli $ P=(x_0,x_1,\ldots x_n)\in \P $, to znajdziemy $ s_i,t_i\in [x_{i-1},x_i] $ takie, że

\[ D(P,f) = \sum_{i=1}^n f(s_i) \Delta x_i\, ,\qquad G(P,f) = \sum_{i=1}^n f(s_i) \Delta x_i \]

(jeszcze raz korzystamy z faktu, że funkcja ciągła $ f $ osiąga swoje kresy na każdym odcinku domkniętym). Ustalmy dowolne $ \eps>0 $. Z Twierdzenia~ [link] o aproksymacji sumami Riemanna wynika, że jeśli podział $ P $ jest odpowiednio drobny, to

\[ |I_N-D(P,f)|<\eps, \qquad |I_N-G(P,f)|<\eps\, . \]

W pierwszej części dowodu sprawdziliśmy, że jeśli podział $ P $ jest odpowiednio drobny, to odpowiadające mu suma górna i dolna różnią się mniej, niż o $ \eps $. Zatem wszystkie liczby

\[ D(P,f)-\eps<I_N<G(P,f)+\eps, \qquad D(P,f), \qquad G(P,f) \]

są wtedy w pewnym przedziale $ J $ krótszym niż $ 3\eps $. Liczba $ I_R $ leży między $ D(P,f) $ i $ G(P,f) $ dla każdego $ P\in \P $. Stąd, także $ I_R\in J $. Przeto, $ |I_N-I_R|<3\eps $, a więc $ I_R=I_N $ wobec dowolności $ \eps $.

Twierdzenie Jeśli $ f $ jest monotoniczna na $ [a,b] $, to $ f\in\Riem $.

Dowód:
Wykażemy, że $ f $ spełnia warunek całkowalności z Wniosku~ [link]. Ustalmy $ \eps>0 $. Dla ustalenia uwagi niech $ f $ będzie niemalejąca. (Dla funkcji nierosnących dowód jest w pełni analogiczny.) Wybierzmy podział $ (x_0,x_1,x_2,\ldots,x_n) $ odcinka $ [a,b] $ na $ n $ równych części. Wtedy $ \Delta x_i =x_i-x_{i-1}=(b-a)/n $. Ponieważ funkcja niemalejąca przyjmuje na każdym odcinku kres górny w prawym końcu tego odcinka, zaś kres dolny - w jego lewym końcu, więc dla podziału na równe części jest

\[ 0\le G(P,f)-D(P,f) = \frac{b-a}n\sum_{i=1}^n\bigl( f(x_i)-f(x_{i-1})\bigr) = \frac{(b-a)(f(b)-f(a))}n <\eps, \]

jeśli $ n $ jest dostatecznie dużą liczbą.

Z ostatniego twierdzenia wynika, że jest bardzo wiele funkcji nieciągłych, które są całkowalne w sensie Riemanna. Jeśli $ f=g-h $, gdzie $ g $ i $ h $ są niemalejące, to $ f\in\Riem $. Taka funkcja może mieć nieskończony (przeliczalny) zbiór punktów nieciągłości. Czytelnik łatwo skonstruuje konkretne przykłady takich funkcji.

Okazuje się, że zbiór funkcji całkowalnych w sensie Riemanna jest jeszcze bogatszy. Bez dowodu przytoczymy następujące twierdzenie.

Twierdzenie Załóżmy, że $ f\colon [a,b]\to\R $ jest funkcją ograniczoną. Następujące warunki są wówczas równoważne:

  1. $ f\in \Riem $;
  2. Zbiór $ Z\in [a,b] $ wszystkich punktów nieciągłości funkcji $ f $ ma następującą własność: dla każdego $ \eps>0 $ istnieje przeliczalna rodzina $ \{I_j\colon j=1,2,\ldots\} $ przedziałów domkniętych $ I_j\subset [a,b] $ taka, że
    \[ 		Z\subset \bigcup_{j=1}^\infty I_j, \qquad \sum_{j=1}^\infty |I_j| <\eps, 		\]

    gdzie $ |I_j| $ oznacza długość przedziału $ I_j $.

(#)

Uwaga Każdy zbiór $ Z\subset \R $, który ma własność podaną w punkcie (ii) Twierdzenia~ [link], nazywamy zbiorem miary Lebesgue'a zero, lub krótko: zbiorem miary zero. Każdy podzbiór zbioru miary zero też oczywiście jest zbiorem miary zero.

Nietrudno zauważyć, że zbiór Cantora $ K $, tzn. zbiór zwarty $ K\subset [0,1] $ opisany w Przykładzie~ [link], jest zbiorem miary zero. Istotnie,

\[ K=\bigcap_{j=1}^n K_j, \]

gdzie zbiory $ K_1\subset K_2\subset\ldots\subset K $ i $ K_j $ składa się z $ 2^{j-1} $ odcinków długości $ 3^{j-1} $. Łączna długość odcinków wchodzących w skład $ K_j $ dąży więc do zera dla $ j\to \infty $ i dlatego $ K $ jest zbiorem miary zero. Zbiór Cantora jest nieprzeliczalny, a zatem zbiór miary zero może być nieprzeliczalny.

Zadanie Skonstruować funkcję ograniczoną $ f\colon[0,1]\to \R $, która jest nieciągła we wszystkich punktach zbioru Cantora i ciągła poza tym zbiorem.      Wskazówka. Taka funkcja może być stała na każdym odcinku w uzupełnieniu zbioru Cantora. Określić $ f $ tak, aby (powiedzmy) $ f>2/3 $ na odcinkach usuwanych w kroku $ 2j+1 $ i $ f<1/3 $ na odcinkach usuwanych w kroku $ 2j $.

Wśród funkcji całkowalnych w sensie Riemanna są więc funkcje nieciągłe na pewnych zbiorach nieprzeliczalnych. Na drugim roku studiów Czytelnik zobaczy, że w wielu sytuacjach wygodniej jest posługiwać się jeszcze inną definicją całki, tak zwaną całką Lebesgue'a. W teorii tej całki twierdzenia o przejściu do granicy pod znakiem całki są znacznie wygodniejsze i mocniejsze. Naturalne uogólnienia wzoru na całkowanie przez części (obejmujące funkcje z nieciągłymi pochodnymi, a także funkcje ciągłe, które są w pewnych punktach nieróżniczkowalne), przydatne np. w teorii równań różniczkowych i jej konkretnych zastosowań, również wygodniej jest rozpatrywać w teorii całki Lebesgue'a.

 

Różnicę między całkami Newtona i Riemanna oraz całką Lebesgue'a można zobrazować poglądowo za pomocą następującej analogii. Przybliżając całkę Riemanna (a także nadając sens geometryczny całce Newtona), dodajemy pola kolejnych prostokątnych słupków, które mogą na przemian być wysokie i niskie. Gdy rozdrabniamy podział odcinka, wysokości słupków naśladują wszelkie wahania całkowanej funkcji. To tak, jakbyśmy obliczali sumę pieniędzy w portfelu, ułożywszy wiele banknotów w zupełnie przypadkowym porządku, mieszając nominały. Każdy wie jednak, że prościej jest ułożyć banknoty nominałami i dopiero wtedy liczyć pieniądze. Całka Lebesgue'a wykorzystuje właśnie takie podejście. Z grubsza biorąc, najpierw dzielimy dziedzinę funkcji na zbiory, na których funkcja przybiera z dobrym przybliżeniem mniej więcej tę samą wartość. Obliczamy `sumę pól słupków', których podstawy mogą być dość dziwnymi zbiorami, a potem wykonujemy przejście graniczne. Doprecyzowanie tej nieco mętnej intuicji, a także wyznaczenie bardzo szerokiej klasy funkcji, dla których takie podejście ma sens, wymaga jednak głębszego wniknięcia w strukturę podzbiorów prostej rzeczywistej (i ogólniej, przestrzeni~$ \R^n $).

Zaletą całek Newtona i Riemanna, które wystarczają do wielu praktycznych zastosowań rachunku całkowego, jest prostota definicji. W subtelniejszych zastosowaniach, a także w teorii, bardzo przydają się silne narzędzia z teorii całki Lebesgue'a, za które trzeba jednak zapłacić dłuższym szykowaniem pojęć tak zwanej teorii miary.

Warto, żeby Czytelnik o tej różnicy wiedział już teraz i pamiętał o niej w przyszłości.

Geometryczne zastosowania całki

Wiemy już, że dla funkcji $ f\colon [a,b]\to (0,\infty) $ ciągłej, albo ogólniej całkowalnej w sensie Riemanna, liczba $ \int_a^b f(x)\, dx $ jest polem obszaru $ \{(x,y)\in \R^2\colon a\le x\le b, 0\le y\le f(x)\} $. Opiszemy w tym rozdziale kilka innych geometryczny zastosowań całki, m.in. do obliczania długości krzywej, a także objętości i pól powierzchni brył obrotowych.

Nie będziemy w sposób ścisły definiować objętości ani pola powierzchni brył w $ \R^3 $. Poprzestaniemy na dość naturalnych intuicjach, a do tematu wrócimy podczas wykładów analizy matematycznej na drugim roku studiów. Wtedy omówimy go znacznie głębiej i ściślej, nie ograniczając się tylko do brył obrotowych.

Długość krzywej

Będziemy rozpatrywać krzywe płaskie, będące wykresami funkcji jednej zmiennej $ y=f(x) $ na pewnym przedziale, a także krzywe opisane równaniami parametrycznymi,

\[ \begin{equation} 	\label{krzywafi} 	\varphi: \quad [a,b]\ni t\ \longmapsto\ \bigl(\varphi_1(t), \varphi_2(t),\ldots,\varphi_n(t)\bigr)\in \R^n\, . \end{equation} \]

Dla $ n=2,3 $ są to krzywe na płaszczyźnie i w przestrzeni. Na przykład, obrazem przekształcenia $ [0,2\pi]\ni t\mapsto (\cos t, \sin t)\in \R^2 $ jest okrąg jednostkowy na płaszczyźnie z kartezjańskim układem współrzędnych.

Będziemy na razie zakładać, że funkcja krzywafi jest różnowartościowa, tzn. z geometrycznego punktu widzenia krzywa pozbawiona jest samoprzecięć. Dla prostoty, zajmiemy się szczegółowo przypadkiem $ n=2 $. Przypadek $ n\ge 3 $ jest w pełni analogiczny.

Definicja Łamaną wpisaną w krzywą $ \varphi\colon [a,b]\to \R^2 $ nazwiemy sumę $ \ell $ odcinków o końcach $ (\varphi_1(t_{i}),\varphi_2(t_i)) $, zwanych wierzchołkami łamanej, gdzie $ i=0,1,\ldots, n $, zaś $ P=(t_0,t_1,\ldots,t_n) $ należy do zbioru $ \P $ wszystkich podziałów odcinka $ [a,b] $. Zbiór wszystkich łamanych wpisanych w daną krzywą będziemy oznaczać literą $ \W $.
Definicja Długością łamanej $ \ell\in\W $ o końcach $ (\varphi_1(t_{i}),\varphi_2(t_i)) $, gdzie $ i=0,1,\ldots, n $ oraz $ P=(t_0,t_1,\ldots,t_n)\in \P $, nazywamy liczbę

\[ \begin{equation} 		\label{dllamanej} 		d(\ell)=\sum_{i=1}^n \sqrt{\Bigl(\varphi_1(t_i)-\varphi_1(t_{i-1})\Bigr)^2+\Bigl(\varphi_2(t_i)-\varphi_2(t_{i-1})\Bigr)^2} 	\end{equation} \]

Z twierdzenia Pitagorasa wynika, że każdy składnik sumy dllamanej rzeczywiście jest długością odcinka, łączącego dwa sąsiednie wierzchołki łamanej.

Definicja [długość krzywej] Niech $ \varphi\colon [a,b]\to \R^2 $. Długością krzywej $ \varphi $ nazywamy kres górny długości wszystkich łamanych wpisanych w tę krzywą, tzn. liczbę

\[ \begin{equation} 	d(\varphi)=\sup_{\ell\in \W} d(\ell), \end{equation} \]

Proszę zauważyć, że ta definicja jest zgodna z naturalną intuicją: odpowiednio gładką krzywą można z dobrą dokładnością zmierzyć linijką, przybliżając długość krzywej długością łamanej o wielu wierzchołkach. Długość łamanej nie będzie większa od długości krzywej.

Twierdzenie [wzór na długość krzywej](#) Niech $ \varphi\colon [a,b]\to \R^2 $ będzie funkcją różnowartościową klasy $ C^1 $. Wtedy

\[ \begin{equation} 		d(\varphi)=\int_a^b \sqrt{\varphi_1'(t)^2+\varphi_2'(t)^2}\, dt\, . 	\end{equation} \]

Twierdzenie wyraża jasną intuicję fizyczną: parametryzacja $ \varphi $ to opis sposobu, w jaki poruszamy się po danym torze ruchu, zaś $ \varphi_1' $ i $ \varphi_2' $ to składowe wektora prędkości. Liczba $ v(t)= \sqrt{\varphi_1'(t)^2+\varphi_2'(t)^2} $ jest długością wektora prędkości w chwili $ t $, czyli chwilową szybkością ruchu. Dla fizyka iloczyn $ v'(t)\, dt $ to przyrost drogi, uzyskany w czasie $ dt $. Dla kogoś, kto tak myśli, wzór na długość krzywej to po prostu zależność między czasem, prędkością i drogą; ponieważ prędkość nie jest stała, więc dzielimy przedział czasu na mniejsze odcinki i przybliżamy całkę sumami Riemanna.

Podobnie jest w przestrzeni $ \R^3 $. Długość krzywej $ \varphi=(\varphi_1,\varphi_2,\varphi_3)\colon [a,b]\to\R^3 $, gdzie $ \varphi_k\in C^1 $ dla $ k=1,2,3 $, określona jako kres górny długości łamanych, wpisanych w tę krzywą, wynosi

\[ d(\varphi)=\int_a^b \sqrt{\varphi_1'(t)^2+\varphi_2'(t)^2+\varphi_3'(t)^2}\, dt\, . \]

Dowód:
Krok 1. Oznaczenia i plan dowodu. Wprowadźmy oznaczenia

\[ v(t)=\sqrt{\varphi_1'(t)^2+\varphi_2'(t)^2}\, ,\quad t\in [a,b]\, , \qquad I=\int_a^b v(t)\, dt = \int_a^b \sqrt{\varphi_1'(t)^2+\varphi_2'(t)^2}\, dt\, . \]

Wybierzmy dowolną łamaną $ l\in W $, odpowiadający jej podział $ P=(t_0,t_1,\ldots,t_n) $ odcinka $ [a,b] $, oraz liczbę $ \eps>0 $. Z nierówności trójkąta wynika, że jeśli podział $ P_1 $ powstaje z $ P $ przez zagęszczenie, to odpowiadająca mu łamana $ \ell_1 $ ma długość $ d(\ell_1)\ge d(\ell) $.

Wykażemy, że podział $ P_1 $ można wybrać tak, aby uzyskać

\[ \begin{equation} 	\label{celdlug}  	d(\ell)\le d(\ell_1) < I + \eps\, , \qquad |I-d(\ell_1)|< \eps\, . \end{equation} \]

Następnie, przechodząc do granicy $ \eps\to 0 $, otrzymamy $ d(\ell)\le I $, co wobec dowolności łamanej $ \ell $ oznacza

\[ d(\varphi)=\sup_{\ell\in \W}d(\ell)\le I\, . \]

Z drugiej nierówności celdlug wynika jednak, że istnieją łamane $ \ell_1\in \W $, dla których liczba $ d(\ell_1) $ może znajdować się dowolnie blisko liczby $ I $. Zatem nie może zachodzić ostra nierówność $ d(\varphi)< I $; musi zachodzić równość $ d(\varphi)=I $. Pozostaje tylko wykazać celdlug.

 

Krok 2. Nierówności celdlug. Niech $ \eta>0 $. Liczbę $ \eta $ dobierzemy do $ \eps>0 $ później. Dokonując zagęszczenia podziału $ P $ i nie zmniejszając długości odpowiadającej mu łamanej, przyjmiemy odtąd, bez zmniejszenia ogólności, że $ P=(t_0,t_1,\ldots,t_n) $, gdzie

\[ 0<\Delta t_i=t_i-t_{i-1} < \delta, \qquad i=1,\ldots, n. \]

Liczbę $ \delta>0 $ dobierzemy za chwilę. Rozpatrzmy $ i $-ty składnik we wzorze dllamanej na długość łamanej. Posługując się dwukrotnie twierdzeniem Lagrange'a o wartości średniej, dla funkcji $ \varphi_1 $ i $ \varphi_2 $, otrzymujemy

\[ \begin{eqnarray*} \lefteqn{ \sqrt{\Bigl(\varphi_1(t_i)-\varphi_1(t_{i-1})\Bigr)^2+\Bigl(\varphi_2(t_i)-\varphi_2(t_{i-1})\Bigr)^2} }\\ & = & \Delta t_i \cdot\sqrt{ \left(\frac{\varphi_1(t_i)-\varphi_1(t_{i-1})}{\Delta t_i}\right)^2 +  \left(\frac{\varphi_2(t_i)-\varphi_2(t_{i-1})}{\Delta t_i}\right)^2 }\\ & = & \Delta t_i \cdot \underbrace{\sqrt{\bigl(\varphi_1'(s_i)\bigr)^2 +\bigl(\varphi_2'(u_i)\bigr)^2}}_{= \text{ (ozn.) }  W(s_i,u_i)}\, , \qquad\mbox{gdzie $t_{i-1}< s_i,u_i<t_i$.} \end{eqnarray*} \]

Sprawdzimy teraz, że jeśli liczba $ \delta>0 $ jest dostatecznie mała, to $ |W(s,u)-v(s)|<\eps $ dla wszystkich $ s,u\in[a,b] $ takich, że $ |s-u|<\delta $. Jeśli $ W(s,u)=0 $, to ów fakt łatwo wynika z ciągłości $ \varphi_2' $. Jeśli $ W(s,u)\not = 0 $, to mamy

\[ \begin{eqnarray*} 	|W(s,u)-v(s)| & = & \frac{|\varphi_2'(u)^2-\varphi_2'(s)^2|}{W(s,u)+v(s)} 	\ \le\  |\varphi_2'(u)-\varphi_2'(s)|\cdot \underbrace{\frac{|\varphi_2'(u)|+|\varphi_2'(s)|}{W(s,u)}}_{= \text{ (ozn.) } \lambda} \\ 	& \le & |\varphi_2'(u)-\varphi_2'(s)|\cdot\sqrt{2}\qquad\mbox{(gdyż wobec nier. Schwarza $\lambda\le \sqrt{2}$)} \\ 	& < & \eta\sqrt{2} \end{eqnarray*} \]

o ile, korzystając z jednostajnej ciągłości $ \varphi_2' $ na $ [a,b] $, dobierzemy $ \delta>0 $ tak, aby $ |\varphi_2'(s)-\varphi_2'(u)|<\eta $ dla wszystkich $ |s-u|<\delta $. Rozważmy teraz dwie sumy,

\[ d(\ell)=\sum_{i=1} \Delta t_i \cdot W(s_i,u_i), \qquad S=\sum_{i=1}^n \Delta t_i\cdot v(s_i) \]

Z Twierdzenia~ [link] o aproksymacji całki $ I=\int_a^b v(s)\, ds $ sumami Riemanna wynika, że $ |I-S|<\eps/2 $, gdy $ \delta>0 $ jest dostatecznie małe. Natomiast

\[ |S-d(\ell)|\le \sum_{i=1}^n \Delta t_i |W(s_i,u_i)-v(s_i)| < \eta\sqrt{2} \sum_{i=1}^n \Delta t_i = \eta\sqrt{2}(b-a)< \eps /2 \]

np. dla $ \eta=\eps/(4(b-a)) $. Z nierówności trójkąta, $ |I-d(\ell)|<\eps $. Dowód jest zakończony.

Uwaga Kluczowej technicznej trudności w dowodzie dostarczało to, że stosując twierdzenie Lagrange'a do wyrażenia wzoru na długość łamanej za pomocą pochodnych, uzyskiwaliśmy wartości pochodnych $ \varphi_1' $ i $ \varphi_2' $ w różnych punktach $ s_i,u_i $ każdego odcinka podziału. Dlatego potrzebny był fragment z szacowaniem różnicy $ W(s,u) $ i $ v(s) $.
Wniosek Jeśli $ f\colon [a,b]\to\R $ jest funkcją klasy $ C^1 $, to długość wykresu tej funkcji jest równa całce

\[ 	\int_a^b \sqrt{1+f'(x)^2}\, dx\, . 	\]

Dowód:
Stosujemy twierdzenie do funkcji $ \varphi_1(x)=x $ i $ \varphi_2=f $.

(Zainteresowany teorią Czytelnik zechce udowodnić ten wniosek bezpośrednio. Dowód jest prostszy, niż dowód Twierdzenia~ [link]

\begin{figure}[!t] \begin{center} \includegraphics*[totalheight=2.8cm]{cykloida.png} \end{center}

{\footnotesize\baselineskip 11pt

Zbiór punktów $ \{(t-\sin t, 1-\cos t)\colon t\in \R\} $ to cykloida. Zaznaczonych zostało 11 położeń toczącego się okręgu (z ustalonym punktem na obwodzie i promieniem o końcu w tym punkcie), odpowiadających równym odstępom czasu $ \pi/5 $. Widać, że punkt toczącego się okręgu nie przemieszcza się wcale po cykloidzie ze stałą szybkością. To jasne:

\[ v(t)=\sqrt{\varphi_1'(t)^2+\varphi_2'(t)^2}=\sqrt{2-2\cos t}, \qquad \inf v = 0, \qquad \sup v =2. \]

} \end{figure}

Uwaga Warto zauważyć, że powyższe twierdzenie stosuje się także do takich krzywych, dla których obraz $ \varphi([a,b]) $ odcinka $ [a,b] $ nie jest wykresem funkcji klasy $ C^1 $, tylko ma ``dziobki''. Przykład: biorąc

\[ \varphi(t)=(t-\sin t ,1-\cos t)\, , \qquad t\in \R\, , \]

otrzymujemy cykloidę, krzywą, jaką zakreśla ustalony punkt okręgu jednostkowego, toczącego się po linii prostej bez poślizgu i ze stałą prędkością. Pochodne parametryzacji to $ \varphi_1'(t)=1-\cos t $ i $ \varphi_2'(t)=\sin t $. W punktach $ t=2k\pi $, $ k\in \Z $, tzn. tam, gdzie $ \cos t=1 $, stosunek $ \varphi_2'/\varphi_1' $ ma granicę lewostronną równą $ -\infty $, a prawostronną równą $ +\infty $ (proszę spojrzeć na znak sinusa). Dlatego w tych punktach cykloida ma ``dziobki.''

Przykład [długość okręgu] Obliczymy długość okręgu jednostkowego, tzn. krzywej $ \varphi(t)=(\cos t,\sin t) $, $ t\in [0,2\pi] $. Mamy

\[ v(t)=\sqrt{\varphi_1'\bigl(t\bigr)^2+\varphi_2'\bigl(t\bigr)^2}=\sqrt{\sin^2 t +\cos^2 t} = 1\, ; \qquad\mbox{zatem}\qquad d(\varphi)= \int_0^{2\pi } 1\, dt = 2\pi\, . \]

Można postąpić inaczej. Ćwiartka okręgu to wykres $ f(x)=\sqrt{1-x^2} $, gdzie $ x\in [-\sqrt{2}/2, \sqrt{2}/2] $. Mamy

\[ \sqrt{1+f'(x)^2}= \sqrt{1+\frac{x^2}{1-x^2}} = \frac{1}{\sqrt{1-x^2}} \]

( i teraz jest jasne, dlaczego wybraliśmy akurat taki przedział: na $ [0,1] $ otrzymany wzór nie określa funkcji ciągłej, z uwagi na zero mianownika w jedynce). Dlatego

\[ \frac 14 d(\varphi)= \int_{-\sqrt{2}/2}^{\sqrt{2}/2}\frac{dx}{\sqrt{1-x^2}} = \biggl.\arcsin x\biggr|_{-\sqrt{2}/2}^{\sqrt{2}/2}=\frac\pi 4 + \frac \pi 4 = \frac \pi 2\, . \]

Przykład [długość jednego łuku cykloidy] Obliczymy długość jednego łuku cykloidy. Niech $  \varphi(t)=(t-\sin t,1-\cos t ) $ dla $ t\in [0,2\pi] $. Wtedy

\[ v(t)=\sqrt{\varphi_1'(t)^2+\varphi_2'(t)^2}=\sqrt{2-2\cos t} = 2\sin \frac t2, \qquad 0\le \frac t2\le \pi. \]

(Posłużyliśmy się jedynką trygonometryczną i wzorem $ \cos t=1-2\sin^2\frac t2 $.) Dlatego

\[ d(\varphi)=\int_0^{2\pi} v(t)\, dt = 2\int_0^{2\pi} \sin \frac t2\, dt = -\biggl. 4 \cos \frac t2 \biggr|_0^{2\pi}=4+4=8. \]

Co ciekawe, wynik jest liczbą wymierną. Długość łuku cykloidy znali Gilles de Roberval i Christopher Wren w XVII wieku.

Objętość bryły obrotowej. Pole powierzchni obrotowej

Załóżmy, że funkcja $ f\colon \R\supset [a,b]\longrightarrow (0,\infty) $ jest klasy $ C^1 $. Obracając wykres $ f $ wokół osi $ x $-ów, otrzymujemy powierzchnię obrotową (patrz rysunek). Powiemy, nie wnikając nadmiernie w kłopotliwe szczegóły techniczne, związane z formalnym definiowaniem objętości i pola powierzchni, jak znaleźć objętość bryły, ograniczonej w $ \R^3 $ powstałą powierzchnią oraz dwiema płaszczyznami $ x=a $, $ x=b $, a także pole powierzchni bocznej tej bryły.

\begin{figure}[!t] \begin{center} \includegraphics*[totalheight=11cm]{obrotowe1.png} \end{center}

{\footnotesize\baselineskip 11pt

Obracając położony w płaszczyźnie $ (x,y) $ wykres funkcji $ y=f(x) $ (klasy $ C^1 $) wokół osi $ x $ w $ \R^3 $, otrzymujemy pewną powierzchnię obrotową. Bliskie, równoległe płaszczyzny $ x=x_{i-1} $ i $ x=x_{i} $ wycinają z tej powierzchni część, która jest bardzo bliska powierzchni bocznej stożka ściętego o promieniach podstaw $ r_1=f(x_{i-1}) $, $ r_2=f(x_i) $ i wysokości $ h=\Delta x_i=x_i-x_{i-1} $.

} \end{figure}

      Objętość $ V $ takiej bryły wyraża się całką

\[ \begin{equation} 	\label{Vobrotowe} 	V=\pi \int_a^b f^2(x) \,dx\, . \end{equation} \]

Z intuicyjnego punktu widzenia jest to dość jasne. Dzieląc odcinek $ [a,b] $ na $ n $ równych części punktami $ x_k=a+k\cdot \frac{b-a}n $, $ k=0,1,\ldots, n $ i prowadząc płaszczyzny $ x=x_k $ prostopadłe do osi $ x $-ów, potniemy bryłę na plastry. Składnik

\[ \pi\cdot f(x_i)^2 \cdot \Delta x_i \]

wyraża objętość walca o promieniu podstawy $ f(x_i)^2 $ i wysokości $ \Delta x_i $. Suma objętości takich walców, czyli suma Riemanna całki $ \pi \int_a^b f(x)^2\, dx $, tym lepiej przybliża objętość (całkę), im gęściej prowadzimy płaszczyzny cięć. (Czytelnik powinien zdawać sobie sprawę, że to intuicja dobra i naturalna, ale jednak nie do końca ścisła, z dwóch powodów. Po pierwsze, nie powiedzieliśmy, czym jest objętość). Po drugie, szkolny wzór na objętość walca, będący uogólnieniem wzoru na objętość graniastosłupa, przyjęliśmy tu ``na wiarę''.

Przykład [objętość kuli] Niech $ f(x)=\sqrt{1-x^2} $ dla $ x\in [-1,1] $. Wykres $ f $ jest połówką okręgu; obróciwszy go, otrzymujemy powierzchnię kuli jednostkowej. Objętość tej kuli jest równa

\[ V=\pi\int_{-1}^1 f^2(x)\, dx = \pi\int_{-1}^1 (1-x^2)\, dx = \left. \pi \left(x-\frac{x^3}3\right)\right|_{-1}^1 = 2\pi\cdot\frac 23=\frac{4\pi}3\, . \]

Objętość kuli o promieniu $ r $ wynosi $ 4\pi r^3/3 $, gdyż objętość brył podobnych jest równa sześcianowi skali podobieństwa.

     Pole $ A $ powierzchni bocznej takiej bryły wyraża się całką

\[ \begin{equation} 	\label{Aobrotowe} 	A=2\pi \int_a^b f(x)\sqrt{1+f'(x)^2}\, dx\, . \end{equation} \]

Aby to zrozumieć, zauważmy, że dwie bardzo bliskie płaszczyzny $ x=x_i $ i $ x=x_{i-1} $ wycinają z takiej powierzchni obrotowej fragment, który w bardzo dobrym przybliżeniu jest powierzchnią boczną stożka ściętego o promieniach o promieniach podstaw $ r_1=f(x_{i-1}) $, $ r_2=f(x_i) $ i wysokości $ h=\Delta x_i=x_i-x_{i-1} $ (patrz rysunek). Jak widzieliśmy, obliczając długość krzywej, tworząca takiego stożka ma długość równą, z bardzo dobrym przybliżeniem, $ \Delta x_i\cdot\sqrt{1+f'(x_i)^2} $. Dlatego pole powierzchni bocznej takiego stożka ściętego wynosi, z zaniedbywalnym w granicy $ \Delta x_i\to 0 $ błędem, tyle, co pole prostokątnego paska o bokach $ 2\pi f(x_i) $ (obwód okręgu) i $ \Delta x_i\cdot\sqrt{1+f'(x_i)^2} $, a więc

\[ 2\pi f(x_i) \cdot  \Delta x_i\cdot\sqrt{1+f'(x_i)^2}\, . \]

Sumując i przechodząc do granicy, otrzymujemy całkę Aobrotowe.

Przykład [Pole powierzchni sfery jednostkowej] Jak wcześniej, niech $ f(x)=\sqrt{1-x^2} $ dla $ x\in [-1,1] $. Wtedy

\[ 	2\pi f(x) \sqrt{1+f'(x)^2}=2\pi \sqrt{1-x^2} \cdot\frac{1}{\sqrt{1-x^2}}= 2\pi 	\]

jest po prostu funkcją stałą. Wynikają stąd dwa wnioski. Po pierwsze, pole powierzchni sfery jednostkowej w $ \R^3 $ jest równe

\[ A=2\pi \int_{-1}^1 f(x)\sqrt{1+f'(x)^2}\, dx=2\pi\int_{-1}^1 1\, dx = 4\pi\, . 	\]

Zatem, pole sfery jest równe polu powierzchni bocznej opisanego na niej walca.

Po drugie, zauważmy, że obracając łuk okręgu, krzywą $ f(x)=\sqrt{1-x^2} $ dla $ x\in [a,b] $, gdzie $ -1\le a<b\le 1 $, otrzymujemy fragment, wycięty ze sfery dwiema równoległymi płaszczyznami $ x=a $ i $ x=b $. Pole powierzchni tego fragmentu,

\[ A=	2\pi \int_{a}^b f(x)\sqrt{1+f'(x)^2}\, dx=2\pi\int_{a}^b 1\, dx = 2\pi(b-a)\, , \]

zależy tylko od różnicy $ b-a $, nie zaś od liczb $ a $ i $ b $ z osobna.

\begin{wrapfigure}[30]{l}[1cm]{9.35cm} \includegraphics*[totalheight=13cm]{plastry3.png}

\end{wrapfigure}

Wiedział to wszytko już Archimedes ponad 2200 lat temu. Doszedł do tego wniosku bez użycia rachunku całkowego we współczesnej postaci, wykonując jednak de facto pewne przejścia graniczne i stosując metodę, nazywaną całkowaniem starożytnych lub metodą wyczerpywania. (Czytelnik może dowiedzieć się więcej o tej metodzie, czytając np. Wykłady z historii matematyki Marka Kordosa).

Stosowanie tej metody wymagało znacznie większej pomysłowości, niż proste i mechaniczne obliczenie konkretnych całek, którymi posłużyliśmy się w tym podrozdziale, żeby wyznaczyć objętość kuli oraz pole sfery. (Aby zrozumieć sens tego zdania, proszę obliczyć pole figury, ograniczonej prostą i łukiem paraboli, nie posługując się naszą dzisiejszą notacją i pojęciem całki. Można rozpatrzeć sumy Riemanna wprost, ale to nie jest szczególnie wygodne.)

Wspomniana własność sfery (patrz też rysunek obok) nazywana bywa czasem twierdzeniem Archimedesa: pole powierzchni obręczy, którą wycięto ze sfery o promieniu $ r $ dwiema równoległymi płaszczyznami, zależy tylko od odstępu $ h $ tych płaszczyzn i jest równe $ 2\pi r h $. Na rysunku oba ciemne fragmenty sfery, a także jaśniejsza, półprzezroczysta obrączka, wycięta przez dwie płaszczyzny z powierzchni bocznej opisanego na sferze walca, mają równe pola.

%

Reguły Guldina