Całka Lebesgue'a

W tym rodziale $ (X,\F,\mu) $ jest ustaloną przestrzenią z miarą. Elementy $ \sigma $-ciała $ \F $ nazywamy zbiorami mierzalnymi.

Ogólna idea, kryjąca się za definicją całki Lebesgue'a, jest bardzo prosta: dla funkcji $ f=c\charfn_A $, gdzie $ A $ jest zbiorem mierzalnym, przyjmujemy $ \int_X f\, d\mu=c\cdot \mu(A) $. Inaczej mówiąc, całka funkcji stałej na zbiorze $ A $ i równej zero poza $ A $ jest proporcjonalna do miary $ \mu(A) $. Oczywiście, byłoby rzeczą naturalną przyjąć umowę, że całka jest liniowa; wtedy całka z funkcji $ \sum a_i\charfn_{A_i} $ powinna być równa sumie $ \sum a_i\mu({A_i}) $. Funkcje nieujemne można przybliżać funkcjami prostymi, więc ich całki można próbować przybliżać całkami funkcji prostych. Natomiast dowolna funkcja mierzalna jest różnicą dwóch funkcji nieujemnych, więc dla takich funkcji całkę można określić jako różnicę całek tych funkcji nieujemnych.

Okazuje się, że ten plan można zrealizować. W dodatku, zachodzą wtedy naturalne, wygodne i ogólne twierdzenia o przechodzeniu do granicy pod znakiem całki. Opisaniem szczegółów tej konstrukcji zajmiemy się w podrozdziałach 5.1 i 5.2. Następnie, w kolejnych podrozdziałach, wyjaśnimy, jaki jest związek całki Lebesgue'a z całką Riemanna, a także omówimy dwa bardzo ważne wyniki: twierdzenie o zamianie zmiennych i twierdzenie Fubiniego. Znajomość tych narzędzi pozwala obliczać bardzo wiele konkretnych całek; przykłady pozna Czytelnik zarówno w trakcie wykładu, jak i na ćwiczeniach.

Całkowanie funkcji dowolnego znaku

Dla takich funkcji posługujemy się rozkładem $ f=\plus f-\minus f $, gdzie

\[ \plus f= \max (f,0), \qquad \minus f = -\min(f,0) \]

oznaczają część dodatnią i część ujemną funkcji mierzalnej $ f\colon X\to \overline \R $. (Zbiór $ X $, $ \sigma $-ciało $ \F\subset 2^X $ jego podzbiorów i miara $ \mu $ na $ \F $ są ustalone).

Definicja Jeśli $ f\colon X\to \overline \R $ jest funkcją mierzalną, zbiór $ E\subset X $ jest mierzalny i co najmniej jedna z całek $ \int_E \plus f\, d\mu $, $ \int_E \minus f\, d\mu $ jest skończona, to przyjmujemy

\[ \int_E f\, d\mu = \int_E \plus f\, d\mu-\int_E \minus f\, d\mu\, .	 	\]

Jeśli całka $ \int_E f\, d\mu $ jest skończona, to mówimy, że funkcja $ f $ jest całkowalna na $ E $.

Jeśli $ f\ge 0 $, to jej część ujemna $ \minus f=0 $; zatem dla funkcji nieujemnych powyższa definicja pokrywa się z przyjętą wcześniej.

Zanotujmy dłuższą listę elementarnych własności całki.

Stwierdzenie [własności całki](#) $ \phantom{a} $

  1. Jeśli $ f=c $ jest stała na zbiorze $ E $, to $ \int_E f\,d\mu=c\mu(E) $.
  2. Jeśli $ \mu(E)=0 $, to $ \int_Ef\,d\mu=0 $ dla każdej funkcji mierzalnej $ f\colon X\to \overline\R $.
  3. Funkcja $ f\colon X\to \overline\R $ jest całkowalna na zbiorze $ E\subset X $ wtedy i tylko wtedy, gdy funkcja $ |f| $ jest całkowalna na $ E $.
  4. Funkcja $ f $ całkowalna na $ E\subset X $ jest skończona prawie wszędzie w $ E $.
  5. Monotoniczność całki: jeśli $ f\le g $ na zbiorze $ E $ i całki z obu funkcji są określone, to $ \int_E f\, d\mu\le \int_Eg\, d\mu $.
  6. Własność wartości średniej: dla każdej funkcji $ f $ całkowalnej na $ E $ jest
    $$\inf_E f\cdot \mu(E)\le \int_E f\, d\mu\le \sup_E f\cdot \mu(E)\, .$$
  7. Nierówność trójkąta: jeśli $ \int_Ef\, d\mu $ jest określona, to
    \[ 		\left|\int_E f\, d\mu\right| \le \int_E |f|\, d\mu\, . 		\]
  8. Przeliczalna addytywność całki jako funkcji zbioru: Jeśli $ E $ jest sumą zbiorów $ E_i\in \F $ parami rozłącznych, a $ f $ jest całkowalna na $ E $, to
    \[ 		 \int_E f\, d\mu=\sum_{i=1}^\infty \int_{E_i} f\, d\mu\, . 		\]
  9. Liniowość całki: jeśli całki funkcji $ f,g $ są określone na $ E $ i ich suma też jest określona (tzn. nie jest wyrażeniem $ \infty-\infty $), to
    \[ 		\int_E (f+g)\, d\mu=\int_E f\, d\mu+\int_E g\, d\mu\, . 		\]
Dowód: Własności (i) oraz (ii) wynikają łatwo z definicji i odpowiednich własności całki funkcji nieujemnej. Mamy $ |f|=\plus f+\minus f $, dlatego wobec liniowości całki funkcji nieujemnej

\[ \int_E |f|\, d\mu=\int_E \plus f\, d\mu + \int_E \minus f\, d\mu <\infty \]

wtedy i tylko wtedy, gdy całki funkcji $ \plus f, \minus f $ są skończone, a więc wtedy i tylko wtedy, gdy ich różnica jest określona i skończona, tzn. gdy $ f $ jest całkowalna. Zatem zachodzi (iii).

Gdyby $ f=+\infty $ (odpowiednio, $ f=-\infty $) na zbiorze miary dodatniej w $ E $, to całka funkcji $ \plus f $ (odpowiednio, funkcji $ \minus f $) byłaby nieskończona. Stąd wynika własność (iv).

Dla dowodu (v) wystarczy zauważyć, że jeśli $ f\le g $, to $ \plus f\le \plus g $ i $ \minus f\ge \minus g  $, a następnie skorzystać z definicji całki i monotoniczności całki funkcji nieujemnej. Własności (vi) i (vii) wynikają od razu z (i), (v) oraz nierówności

\[ \inf f \le f \le \sup f\, , \qquad -|f| \le f\le |f|\, . \]

Przeliczalną addytywność całki funkcji całkowalnej otrzymujemy jako wniosek z Twierdzenia [link]: całka funkcji $ \plus f $ i całka $ \minus f $ - gdy traktować je jako funkcje zbioru - są miarami przeliczalnie addytywnymi.

Najbardziej kłopotliwy jest dowód (ix), gdyż całki mogą przyjmować wartość $ \pm \infty $. Rozważmy najpierw przypadek, gdy $ f,g $ są całkowalne. Ponieważ

\[ \int_E |f+ g|\, d\mu \le \int_E \big(|f|+ |g|\big)\, d\mu = \int_E |f|\, d\mu+ \int_E | g|\, d\mu\, ,   \]

więc $ f+g $ też jest całkowalna. Ponadto,

\[ \begin{equation} \plus f + \plus g-\plus {(f+g)}=\minus f+\minus g -\minus{ (f+g)} \ge 0  \label{znakifg} \end{equation} \]

oraz

\[ \begin{multline}   f+g= \plus f-\minus f +\plus g -\minus g  =\big(\plus f + \plus g\big )-\big(\minus f+\minus g\big)\\= \plus{(f+g)}+\big(\plus f + \plus g - \plus{(f+g)}\big) \ -\       \Big(\minus{(f+g)}+\big(\minus f + \minus g - \minus{(f+g)}\big)\Big)\, .   \end{multline} \]

Dzięki addytywności całki funkcji nieujemnych, otrzymujemy stąd

\[ \begin{eqnarray*} \int_E \plus f\, d\mu+\int_E\plus g\, d\mu = \int_E (\plus f +\plus g)\, d\mu &=& \int_E\, \plus{(f+g)}\, d\mu +\int_E \big(\plus f + \plus g - \plus{(f+g)}\big)  d\mu \notag \\ & \stackrel{\eqref{znakifg}}= &  \int_E\, \plus{(f+g)}\, d\mu +\int_E \big(\minus f + \minus g - \minus {(f+g)}\big)  d\mu \label{zplusem} \end{eqnarray*} \]

i podobnie

\[ \int_E \minus f\, d\mu  +\int_E \minus g\, d\mu =  \int_E\, \minus{(f+g)}\, d\mu +\int_E \big(\minus f + \minus g - \minus {(f+g)}\big)  d\mu\, .\label{zminusem}   \]

Odejmując te równości stronami, sprawdzamy, że $ \int_E f \, d\mu + \int_E g\, d\mu=\int_E(f+g)\, d\mu $.

Przypuśćmy teraz, że np. $ \int_E f\, d\mu=+\infty $, a $ \int_E g\, d\mu\in \R $. Wtedy musi być $ \int_E \plus f\, d\mu=+\infty $. Całki funkcji $ \minus f $, $ \plus g $, $ \minus g $ są liczbami rzeczywistymi. W takim razie, z pierwszej części dowodu,

\[ \begin{gather*} \infty > \int_E \minus f\, d\mu  +\int_E \minus g\, d\mu \stackrel{\eqref{znakifg}}\ge \int_E \minus {(f+g)}\, d\mu\ge 0\, ,   \\ \infty> \int_E\big(\minus f + \minus g - \minus{(f+g)}\big)\, d\mu\stackrel{\eqref{znakifg}}=\int_E\big(\plus f + \plus g - \plus{(f+g)}\big)\, d\mu\ge \int_E\big(\plus f - \plus{(f+g)}\big)\, d\mu\, .  \end{gather*}  \]

Gdyby $ \int_E \plus{(f+g)}\, d\mu $ była skończona, to dzięki wykazanej już liniowości całki funkcji całkowalnych, uzyskalibyśmy stąd $ \int_E \plus f\, d\mu<\infty $, wbrew założeniu. Dlatego $ \int_E \plus{(f+g)}\, d\mu=+\infty>\int_E \minus{(f+g)}\, d\mu $ i własność (ix) zachodzi w rozważanym przypadku.

Pozostałe przypadki można rozpatrzeć podobnie; szczegóły pozostawiamy Czytelnikowi jako ćwiczenie. □

Posługując twierdzeniem Lebesgue'a o zbieżności monotonicznej, udowodnimy teraz kolejne ważne twierdzenia o możliwości przechodzenia do granicy pod znakiem całki.

Twierdzenie [lemat Fatou](#) Jeśli funkcje $ f_j\colon X\to \overline \R $, $ j=1,2,\ldots $, są mierzalne i są nieujemne na zbiorze mierzalnym $ E\subset X $, to

\[ \begin{equation} 		\label{nierfatou}  		\int_{E} \liminf_{j\to\infty} f_j \, d\mu \le \liminf_{j\to\infty}   \int_{E}  f_j \, d\mu\, .  \end{equation} \]
Uwaga [przykład `wędrującego garbu'] Może się zdarzyć, że nierówność w lemacie Fatou jest ostra. Oto przykład dla jednowymiarowej miary Lebesgue'a. Warto go pamiętać, gdyż łatwo sobie wtedy przypomnieć, jaki jest kierunek nierówności w lemacie. Jeśli $ f_j=\charfn_{[j,j+1]}\colon \R\to\R $, to mamy $ \liminf f_j(t)=\lim_j f(t)=0 $ dla każdego $ t\in \R $, więc dla $ \mu=\lambda_1 $ lewa strona nierfatou jest zerem. Jednak $ \int_\R f_j\, d\lambda_1=1 $ dla każdego $ j\in \N $, więc prawa strona nierfatou jest jedynką. Czytelnik zechce samodzielnie podać podobny przykład dla $ E=[0,1] $, $ \mu=\lambda_1 $ na $ [0,1] $. Proszę zauważyć, że ten przykład świadczy również o tym, że założenie monotoniczności w Twierdzeniu [link] jest istotne. □

    Dowód lematu Fatou. Raz jeszcze przypomnijmy, że

\[ \liminf_{j\to\infty} f_j(x)=\sup_{m\in \N} \Big(\inf_{j\ge m} f_j(x)\Big) = \lim_{m\to \infty} \Big(\inf_{j\ge m} f_j(x)\Big) =  \lim_{m\to \infty} h_m(x),  \]

gdzie $ h_m(x)=\inf_{j\ge m} f_j(x) $ jest rosnącym ciągiem funkcji mierzalnych, nieujemnych na $ E $ i $ h_m\le f_m $ dla każdego $ m $. Dlatego, wobec Twierdzenia [link] o zbieżności monotonicznej,

\[ \begin{align*}  \int_{E} \liminf_{j\to\infty} f_j \, d\mu & = \int_E \lim_{m\to\infty} h_m\, d\mu \\ & = \lim_{m\to\infty} \int_E  h_m\, d\mu=  \liminf_{m\to\infty} \int_E  h_m\, d\mu\le \liminf_{m\to\infty} \int_E  f_m\, d\mu\, .    \end{align*} \]

Ostatnia nierówność wynika z monotoniczności całki i nierówności $ h_m\le f_m $. □

Twierdzenie [Lebesgue'a o zbieżności zmajoryzowanej](#) Załóżmy, że funkcje $ f_j,f\colon X\to \overline \R $, $ j=1,2,\ldots $, są mierzalne i $ |f_j|\le g $, gdzie $ g\colon X\to [0,\infty] $ jest funkcją całkowalną. Jeśli $ f_j(x)\to f(x) $ prawie wszędzie w $ X $, to

\[ \begin{equation}        	\label{wzor-TZZ} \lim_{j\to\infty} \int_X |f_j-f|\, d\mu =0\, , \qquad \lim_{j\to\infty}\int_X f_j\, d\mu= \int_X f\, d\mu\, . \end{equation} \]

Podany wcześniej przykład `wędrującego garbu' świadczy o tym, że założenie, iż $ |f_j| $ są wspólnie ograniczone przez jedną i tę samą funkcję $ g $ (czasem nazywaną majorantą), jest istotne!

    

Dowód: Skoro $ g\ge |f_j| $, to $ g \pm f_j\ge 0 $. Z lematu Fatou otrzymujemy więc

\[ \begin{gather} 	\int_{X} \liminf_{j\to\infty} (g\pm f_j) \, d\mu \le \liminf_{j\to\infty}   \int_{X}  (g\pm f_j) \, d\mu\, . \label{wnfatou}    \end{gather} \]

Zauważmy, że dla każdego ciągu liczbowego $ (a_j) $ i $ b\in\R $ jest

\[ \liminf_{j\to \infty} (b+a_j)= b +\liminf_{j\to \infty} a_j\, , \qquad \liminf_{j\to \infty} (b-a_j)= b - \limsup_{j\to \infty} a_j\, . \]

Funkcja $ g $, jako funkcja nieujemna całkowalna, jest skończona prawie wszędzie w $ X $. Dlatego z dwóch nierówności wnfatou, przytoczonej własności granicy dolnej i liniowości całki otrzymujemy

\[ \begin{gather*} \int_{X} \big(g+\liminf_{j\to\infty}  f_j \big)\, d\mu \le \int_X g\, d\mu  + \liminf_{j\to\infty} \int_X f_j\, d\mu\, ,\\ \int_{X} \big(g-\limsup_{j\to\infty}  f_j \big)\, d\mu \le \int_X g\, d\mu  - \limsup_{j\to\infty} \int_X f_j\, d\mu, \end{gather*} \]

stąd zaś, po odjęciu $ \int_X g\, d\mu $,

\[ \int_{X} \liminf_{j\to\infty}  f_j \, d\mu \le \liminf_{j\to\infty} \int_X f_j\, d\mu\ \le    \limsup_{j\to\infty} \int_X f_j\, d\mu \le \int_{X} \limsup_{j\to\infty}  f_j\,  d\mu \, . \]

Jednak $ \liminf f_j=\limsup f_j=\lim f_j=f $ na zbiorze pełnej miary w $ X $, więc prawa i lewa strona w powyższych nierównościach są równe $ \int_X f\, d\mu $. Stąd natychmiast wynika teza. (Dla dowodu pierwszej części p.w. i $ |f_j-f|\le |f_j|+|f|\le 2g $." title="TZZ) proszę zauważyć, że $ |f_j-f|\to 0 $ p.w. i $ |f_j-f|\le |f_j|+|f|\le 2g $.">TZZ) proszę zauważyć, że $ |f_j-f|\to 0 $ p.w. i $ |f_j-f|\le |f_j|+|f|\le 2g $.

Twierdzenie [bezwgzlędna ciągłość całki jako funkcji zbioru] Jeśli $ f $ jest funkcją całkowalną na zbiorze mierzalnym $ E $, to dla każdego $ \eps>0 $ istnieje liczba $ \delta>0 $ taka, że

\[ 	\int_A |f|\, d\mu <\eps 	\]

dla każdego zbioru mierzalnego $ A\subset E $ o mierze $ \mu(A)<\delta $.

Dowód: Wobec Twierdzenia [link],

\[ \nu(A)=\int_{A} |f|\, d\mu, \qquad A\subset E, \quad A\in \F \]

jest miarą (przeliczalnie addytywną) na $ \sigma $-ciele podzbiorów mierzalnych zbioru $ E $. Z założenia, $ \nu(E)=\int_E |f|\, d\mu<\infty $. Połóżmy

\[ E_m=\{x\in E\colon |f(x)|\ge m\}, \qquad m=1,2,\ldots\, ; \]

wtedy $ E_1\supset E_2 \supset E_3\supset\ldots $. Dzięki warunkowi $ \nu(E)<\infty $, ze Stwierdzenia [link](iii) otrzymujemy

\[ \nu\bigg(\bigcap_{m=1}^\infty E_m \bigg)=\lim_{m\to\infty } \nu(E_m)=0. \]

Ustalmy $ \eps>0 $. Dobierzmy $ m\in \N $ tak, aby $ \nu(E_m)<\eps/2 $. Wtedy, dla $ A\subset E $,

\[  \int_A |f|\, d\mu = \int_{A\cap E_m} |f|\,d\mu + \int_{A\setminus E_m} |f|\, d\mu\le \nu(E_m) + m\cdot \mu(A) < \frac \eps 2+ m\cdot \mu(A)<\eps, \]

o ile tylko $ \mu(A)<\delta=\eps/(2m) $.□

Związek całki Lebesgue'a z całką Riemanna

Pozostaje pytanie, jak obliczać całkę Lebesgue'a? Czy dla miary $ \mu=\lambda_1 $ na prostej rzeczywistej mamy do czynienia z tą samą całką, którą obliczaliśmy, znajdując funkcje pierwotne i posługując się twierdzeniem Newtona-Leibniza? Okazuje się, że tak. Wyjaśnijmy krótko związek obu całek. Będziemy posługiwać się terminologią, wprowadzoną podczas wykładów na I roku (patrz rozdział 9.5 skryptu z Analizy Matematycznej I).

Załóżmy, że funkcja $ f\colon [a,b]\to\R $ jest ograniczona i całkowalna w sensie Riemanna na $ [a,b] $. Z całkowalności w sensie Riemanna wynika mierzalność. (Funkcja ograniczona jest całkowalna w sensie Riemanna wtedy i tylko wtedy, gdy zbiór jej punktów nieciągłości jest zbiorem miary Lebesgue'a zero; nietrudno wykazać, że stąd wynika mierzalność: jeśli $ f $ jest ograniczona i całkowalna w sensie Riemanna, to zbiór $ \{x\in [a,b]\colon f(x)>t\} $ jest sumą pewnego zbioru otwartego i zbioru miary zero.) Oczywiście całka Lebesgue'a modułu takiej funkcji nie przekracza $ M(b-a) $, gdzie $ M=\sup |f| $. Niech $ P $ będzie dowolnym podziałem odcinka $ [a,b] $ i niech $ a=x_0<x_1<\ldots<x_N=b $ oznaczają końce odcinków tworzących ten podział. Wobec addytywności całki jako funkcji zbioru (patrz własność (viii) w Stwierdzeniu [link]) całka Lebesgue'a

\[ \begin{equation} \int_{[a,b]} f\, d\lambda_1=\sum_{i=1}^N \int_{J_i} f\, d\lambda_1, \qquad\mbox{gdzie $J_i=[x_{i-1},x_i]$ dla $i=1,\ldots,N$.}    \end{equation} \]

Z monotoniczności całki

\[ \begin{align*}     \sum_{i=1}^N (x_i-x_{i-1})\sup_{J_i} f &= \sum_{i=1}^N \sup_{J_i} f \cdot \lambda_1(J_i) \\ &\ge \sum_{i=1}^N \int_{J_i} f\, d\lambda_1\qquad\mbox{(ta suma jest całką Lebesgue'a $f$)} \\ &\ge \sum_{i=1}^N \inf_{J_i} f \cdot \lambda_1(J_i)=  \sum_{i=1}^N (x_i-x_{i-1})\inf_{J_i} f \end{align*} \]

Lewa i prawa strona powyższych nierówności są, odpowiednio, górną i dolną sumą całkową Riemanna dla podziału $ P $. Zatem $ G(f,P)\ge \int_{[a,b]}f\, d\lambda_1\ge D(f,P) $ dla każdego podziału $ P $. Biorąc kres dolny lewych stron i kres górny prawych stron względem wszystkich podziałów $ [a,b] $, sprawdzamy, że całka Lebesgue'a $ \int_{[a,b]}f\, d\lambda_1 $ jest nie większa od całki górnej Riemanna funkcji $ f $ i nie mniejsza od całki dolnej Riemanna funkcji $ f $:

\[ \int^b_a f(x)\, dx= \inf_P G(f,P)\ge  \int_{[a,b]}f\, d\lambda_1\ge \sup_P D(f,P) =\int^b_a f(x)\, dx\, ; \]

Ponieważ $ f $ jest całkowalna w sensie Riemanna, więc jej całka dolna i całka górna Riemanna są równe całce (Riemanna!) $ \int_a^b f(x)\, dx $. Dlatego całki Lebesgue'a i Riemanna funkcji $ f $ na $ [a,b] $ są równe.

Zachodzi zatem następujące twierdzenie.

Twierdzenie (#) Jeśli $ f\colon [a,b]\to\R $ jest funkcją ograniczoną, całkowalną w sensie Riemanna, to $ f $ jest całkowalna w sensie Lebesgue'a na $ [a,b] $. Obie całki - Riemanna iLebesgue'a - funkcji $ f $ są równe.
Wniosek Dla każdej funkcji ciągłej $ f\colon [a,b]\to \R $ zachodzi wzór

\[ 	\int_a^b f\, d\lambda_1 = F(b)-F(a), 	\]

gdzie $ F $ jest jakąkolwiek funkcją pierwotną $ f $.

Uwaga Nietrudno wywnioskować stąd, że jeśli $ f $ jest funkcją nieujemną na przedziale $ J\subset \R $ i jej całka niewłaściwa Riemanna jest skończona, to $ f $ jest całkowalna w sensie Lebesgue'a na $ J $. Natomiast dla funkcji, które zmieniają znak, jest inaczej: ze zbieżności całki niewłaściwej Riemanna nie wynika całkowalność w sensie Lebesgue'a. Powód jest prosty: nie każda całka niewłaściwa, która jest zbieżna, jest bezwzględnie zbieżna (patrz np. Przykład10.9 w skrypcie z Analizy Matematycznej I).

Całkowanie funkcji nieujemnych

W tym rodziale $ (X,\F,\mu) $ jest ustaloną przestrzenią z miarą. Elementy $ \sigma $-ciała $ \F $ nazywamy zbiorami mierzalnymi.

Ogólna idea, kryjąca się za definicją całki Lebesgue'a, jest bardzo prosta: dla funkcji $ f=c\charfn_A $, gdzie $ A $ jest zbiorem mierzalnym, przyjmujemy $ \int_X f\, d\mu=c\cdot \mu(A) $. Inaczej mówiąc, całka funkcji stałej na zbiorze $ A $ i równej zero poza $ A $ jest proporcjonalna do miary $ \mu(A) $. Oczywiście, byłoby rzeczą naturalną przyjąć umowę, że całka jest liniowa; wtedy całka z funkcji $ \sum a_i\charfn_{A_i} $ powinna być równa sumie $ \sum a_i\mu({A_i}) $. Funkcje nieujemne można przybliżać funkcjami prostymi, więc ich całki można próbować przybliżać całkami funkcji prostych. Natomiast dowolna funkcja mierzalna jest różnicą dwóch funkcji nieujemnych, więc dla takich funkcji całkę można określić jako różnicę całek tych funkcji nieujemnych.

Okazuje się, że ten plan można zrealizować. W dodatku, zachodzą wtedy naturalne, wygodne i ogólne twierdzenia o przechodzeniu do granicy pod znakiem całki. Opisaniem szczegółów tej konstrukcji zajmiemy się w podrozdziałach 5.1 i 5.2. Następnie, w kolejnych podrozdziałach, wyjaśnimy, jaki jest związek całki Lebesgue'a z całką Riemanna, a także omówimy dwa bardzo ważne wyniki: twierdzenie o zamianie zmiennych i twierdzenie Fubiniego. Znajomość tych narzędzi pozwala obliczać bardzo wiele konkretnych całek; przykłady pozna Czytelnik zarówno w trakcie wykładu, jak i na ćwiczeniach.

Całkowanie funkcji nieujemnych

Definicja całki Lebesgue'a przypomina definicję dolnej całki Riemanna. Różnica polega na tym, że rozbijamy dziedzinę funkcji nie na przedziały, tylko na przeliczalne rodziny dowolnych zbiorów mierzalnych. \def\rozb{\mathcal{R}}

Definicja [rozbicia zbioru mierzalnego] Załóżmy, że $ E\in \F $ jest mierzalnym podzbiorem $ X $. Mówimy, że skończona lub przeliczalna rodzina $ \P=\{E_1,E_2,\ldots\} $ zbiorów $ E_i $ jest rozbiciem $ E $ wtedy i tylko wtedy, gdy $ E_i $ są mierzalne, parami rozłączne i $ E=\bigcup E_i $. Zbiór wszystkich rozbić danego zbioru mierzalnego $ E $ oznaczamy $ \rozb(E) $.
Definicja [całka funkcji nieujemnej] (#) Załóżmy, że funkcja mierzalna $ f\colon X\to \overline\R $ jest nieujemna na zbiorze mierzalnym $ E\subset X $. Kładziemy wówczas

\[      \int_E f\, d\mu\equiv  \int_E f(x)d\mu(x)= \sup\biggl( \sum _{i=1}^\infty \inf_{x\in E_i} f(x) \cdot \mu(E_i)\biggr)\, , 	\]

gdzie kres górny jest wzięty po wszystkich rozbiciach $ \P=(E_1,E_2,\ldots) $ zbioru $ E $.

Z własności kresów wynika od razu, że

\[ \begin{equation} 	\label{calkaaf}  	\int_E \alpha f(x)\, d\mu(x)=\alpha \int_E f(x)\, d\mu (x) \end{equation} \]

dla wszystkich liczb $ \alpha\ge 0 $, nieujemnych funkcji mierzalnych $ f $ i zbiorów mierzalnych $ E $. Zauważmy ponadto, że jeśli $ f\colon X\supset E\to [0,\infty] $ przyjmuje wartość $ \infty $ na zbiorze $ A\subset E $ miary dodatniej, to z pewnością $ \int_E f\, d\mu=\infty $.

Stwierdzenie [monotoniczność całki] Jeśli $ 0\le f\le g $ na zbiorze mierzalnym $ E $ i $ f,g\colon X\to \overline\R $ są mierzalne, to

\[   \int_E f(x)\, d\mu(x)\le  \int_E g(x)\, d\mu(x)\, . 	\]
Dowód: Dla każdego zbioru $ A\subset E $ jest $ \inf_A f\le \inf_A g $, zatem dla każdego rozbicia $ \P=(E_1,E_2,\ldots) $ zbioru $ E $ mamy

\[ \sum _{i=1}^\infty \inf_{x\in E_i} f(x) \cdot \mu(E_i)\le \sum _{i=1}^\infty \inf_{x\in E_i} g(x) \cdot \mu(E_i)\, . \]

Biorąc kres górny względem wszystkich rozbić $ \P\in \rozb(E) $, otrzymujemy tezę. □

Stwierdzenie [o wartości średniej] Jeśli $ f\colon X\to \overline\R $ jest mierzalna i nieujemna na zbiorze $ E\in \F $, to

\[ \begin{equation} 	\label{warsredmu}  	 \mu(E)\cdot \inf_E f \le \int_E f(x)\, d\mu(x)\le  \mu(E)\cdot \sup_E f\, .   \end{equation} \]
Dowód: Ustalmy rozbicie $ \P=(E_1,E_2,\ldots) $ zbioru $ E $. Ponieważ $ \mu(E)=\sum \mu(E_i) $ oraz, dla każdego indeksu $ i $ z osobna, $ \inf_E f\le \inf_{E_i} f\le \sup_E f $, więc

\[ \mu(E)\cdot \inf_E f=\sum_{i=1}^\infty \mu(E_i) \inf_E f \le \sum_{i=1}^\infty \mu(E_i) \inf_{E_i} f \le \sup_E f \sum_{i=1}^\infty \mu (E_i) = \mu(E) \sup_E f.  \]

Stąd natychmiast wynika teza. □

Zanotujmy dwa łatwe wnioski z tego twierdzenia.

Wniosek Jeśli $ f=c $ jest funkcją stałą, to $ \int_E f\, d\mu=c\mu(E) $
Dowód: Mamy $ c=\sup_E f=\inf_E f $; obie strony nierówności warsredmu są więc równe $ c\mu(E) $.□
Wniosek Jeśli $ \mu(E)=0 $, to $ \int_E f\, d\mu=0 $ dla każdej funkcji mierzalnej $ f $, nieujemnej na $ E $. □

(#)

Twierdzenie (#) Jeśli $ f $ jest mierzalna i nieujemna na $ X $, to funkcja

\[ 	\nu(A)=\int_A f\, d\mu, \qquad A\in \F 	\]

jest miarą na $ \sigma $-ciele $ F $: gdy zbiór $ E\in \F $ jest sumą skończoną lub przeliczalną zbiorów mierzalnych i parami rozłącznych $ E_i $, to

\[ \begin{equation} 	\label{calkasumzbior}      	\int_E f\, d\mu=\sum_{i}\int_{E_i} f\, d\mu\, .  \end{equation} \]
Dowód: Własności $ \nu(A)\ge 0 $ i $ \nu(\emptyset)=0 $ są oczywiste. Wystarczy udowodnić wzór calkasumzbior. Zrobimy to dla rozbić przeliczalnych zbioru $ E $ na parami rozłączne zbiory $ E_i $ (dla rozbić skończonych zmieniają się tylko oznaczenia).

Niech $ E_i=\bigcup_{k=1}^\infty F_{ik} $, gdzie $ F_{ik}\in \F $, będzie rozbiciem $ E_i $ na zbiory $ F_{ik} $ parami rozłączne. Wtedy $ E=\bigcup_{i=1}^\infty\bigcup_{k=1}^\infty F_{ik} $ jest rozbiciem $ E $ i wprost z definicji całki

\[ \sum_{k=1}^\infty \inf_{F_{1k}} f \cdot \mu(F_{1k}) +\cdots + \sum_{k=1}^\infty \inf_{F_{Nk}} f \cdot \mu(F_{Nk})  \le   \sum_{i=1}^\infty \sum_{k=1}^\infty \inf_{F_{ik}} f \cdot \mu(F_{ik})\le \int_Ef\, d\mu \]

dla każdej liczby $ N\in \N $. Biorąc oddzielnie kres górny każdej ze skończenie wielu sum po lewej stronie względem wszystkich rozbić zbioru $ E_i $ ($ i=1,\ldots, N $), otrzymujemy

\[ \sum_{i=1}^N \int_{E_i}f\, d\mu \le \int_Ef\, d\mu , \]

stąd zaś, dla $ N\to \infty $,

\[ \sum_{i=1}^\infty \int_{E_i}f\, d\mu \le \int_Ef\, d\mu .   \]

Udowodnimy teraz nierówność przeciwną. Niech $ E=\bigcup_{k=1}^\infty A_k $, gdzie $ A_k $ są parami rozłączne. Ponieważ $ E=\bigcup E_i $ i zbiory $ E_i $ też są parami rozłączne, więc wobec przeliczalnej addytywności miary $ \mu $, otrzymujemy \begin{align} \sum_{k=1}^\infty \inf_{A_k} f\cdot \mu (A_k) & = \sum_{k=1}^\infty \inf_{A_k} f\cdot \sum_{i=1}^\infty \mu(A_k\cap E_i) \notag \\ & \le \sum_{i=1}^\infty \biggl(\sum_{k=1}^\infty \inf_{A_k\cap E_i} f\cdot \mu(A_k\cap E_i)\biggr)\notag\\ & \le \sum_{i=1}^\infty \int_{E_i} f\, d\mu.(#) \end{align} Ostatnia nierówność wynika wprost z definicji całki: rodzina $ A_k\cap E_i $, $ k=1,2,\ldots, $ jest rozbiciem zbioru $ E_i $. Biorąc teraz kres górny względem wszystkich rozbić $ E=\bigcup_{k=1}^\infty A_k $, otrzymujemy $ \int f\,d\mu \le \sum_i \int_{E_i}f\, d\mu $. □

Ponieważ miara jest monotoniczną funkcją zbioru, więc natychmiast otrzymujemy następujący wniosek.

Wniosek Jeśli $ f $ jest mierzalna i nieujemna na zbiorze $ E\in \F $, to $ \int_{E_1} f\, d\mu\le \int_E f\, d\mu $ dla każdego zbioru mierzalnego $ E_1\subset E $. □
Wniosek Jeśli funkcje mierzalne $ f,g $ są nieujemne i równe prawie wszędzie na zbiorze $ E\in \F $, to $ \int_E f\, d\mu=\int_E g\, d\mu $.
Dowód: Zbiór $ A=\{f\not=g\} $ jest mierzalny i $ \mu(A)=0 $. Dlatego $ \int_A f\, d\mu=\int_A g\, d\mu =0 $ wobec Wniosku [link]. Na zbiorze $ E\setminus A $ jest $ f=g $, więc zachodzi oczywisty ciąg równości

\[ \int_E f\, d\mu = \int_{E\setminus A}   f\, d\mu + \int_A f\, d\mu  = \int_{E\setminus A}   f\, d\mu = \int_{E\setminus A}   g\, d\mu   =  \int_{E\setminus A}   g\, d\mu + \int_A g\, d\mu =  \int_E g\, d\mu. \]
Wniosek Jeśli $ f $ jest mierzalna i nieujemna na $ E $, a $ \int_E f\, d\mu=0 $, to $ f=0 $ prawie wszędzie na $ E $.
Dowód: Zbiór $ \{x\in X\colon f(x)>0\} $ jest sumą wstępującego ciągu zbiorów mierzalnych $ E_m=\{x\in X\colon f(x)\ge 1/m\} $, $ m=1,2,\ldots $ Dlatego

\[ 0\le \frac 1m \mu(E_m) \le \int_{E_m}f\, d\mu \le \int_E f\, d\mu = 0, \]

skąd $ \mu(E_m)=0 $, a następnie, na mocy Stwierdzenia [link](ii), $ \mu(E)=\lim \mu(E_m)=0 $. □

Całka Lebesgue'a jest wygodnym narzędziem m.in. z uwagi na bardzo ogólne twierdzenia o możliwości przechodzenia do granicy pod znakiem całki. Oto pierwsze z nich.

Twierdzenie [Lebesgue'a o zbieżności monotonicznej](#) Załóżmy, że ciąg funkcji mierzalnych $ f_j\colon X\to \overline \R $ jest niemalejący i wszystkie funkcje $ f_j $ są nieujemne na zbiorze $ E\in \F $. Wówczas

\[ \begin{equation} 	\int_E \big(\lim_{j\to\infty } f_j\big)\, d\mu= \lim_{j\to\infty }  \int_E f_j\, d\mu\, . \end{equation} \]
Dowód: Ciąg $ f_j $ jest niemalejący, więc $ f=\lim f_j $ jest dobrze określona w każdym punkcie przestrzeni $ X $, a także mierzalna na mocy Twierdzenia [link]. Ponadto, $ f_j\le f $ na $ E $ dla każdego indeksu $ j $, więc wobec monotoniczności całki

\[ \int_E f_j\, d\mu\le  \int_E f\, d\mu, \qquad j=1,2,\ldots \]

i dlatego w granicy

\[ \lim_{j\to\infty }  \int_E f_j\, d\mu\le  \int_E f\, d\mu=  \int_E  \lim_{j\to\infty } f_j\, d\mu\, . \]

Wystarczy więc udowodnić nierówność przeciwną. Oznaczmy w tym celu

\[ E_0=\{x\in E\colon f(x)=0\}, \quad E_+=\{x\in E\colon 0<f(x)<\infty\},\quad  E_\infty=\{x\in E\colon f(x)=+\infty\}.  \]

Zbiory $ E_0,E_+,E_\infty $ są parami rozłączne i mierzalne, a ich suma jest równa $ E $.

    Krok 1. Na zbiorze $ E_0 $ jest $ 0\le f_j(x)\le f(x)=0 $ dla każdego $ j\in \N $, tzn. $ f_j\equiv 0\equiv f $ na $ E_0 $ i dlatego $ \lim\int_{E_0}f_j\, d\mu= 0=\int_{E_0}f\, d\mu $.

    Krok 2. Zajmijmy się teraz zbiorem $ E_+ $. Niech $ \theta\in (0,1) $ i $ E_m=\{x\in E_+ \colon f_m(x)\ge \theta f(x)\} $. Dla każdego $ x\in E_+ $ jest $ f(x)=\lim f_j(x) >\theta f(x) $, a więc istnieje liczba $ m_x $ taka, że $ x\in E_m $ dla wszystkich $ m>m_x $. Zatem $ E_+=\bigcup_{m=1}^\infty E_m $, a wobec monotoniczności ciągu $ f_m $ ciąg zbiorów $ E_m $ jest wstępujący. Wobec Twierdzenia [link], $ \nu(A)=\int_A f\, d\mu $ jest miarą na $ \sigma $-ciele podzbiorów mierzalnych zbioru $ E $. Korzystając z monotoniczności całki i Stwierdzenia [link](ii) dla miary $ \nu $, otrzymujemy

\[ \nu(E_+)=\int_{E_+} f\, d\mu \ge \int_{E_+} f_m\, d\mu \ge \int_{E_m} \theta f \, d\mu=\theta \nu(E_m) \to \theta \nu(E_+) \qquad\mbox{dla $m\to \infty$.} \]

Zatem

\[ \int_{E_+}f\, d\mu\ge \lim_{m\to\infty} \int_{E_+} f_m\, d\mu  \ge \theta\int_{E_+} f\, d\mu \]

Biorąc $ \theta \to 1 $, otrzymujemy

\[ \int_{E_+}f\, d\mu= \lim_{m\to\infty} \int_{E_+} f_m\, d\mu\, . \]

    Krok 3. Wreszcie, zbadajmy zachowanie całek funkcji $ f,f_m $ na zbiorze $ E_\infty $. Ustalmy $ M<\infty $. Niech $ A_m=\{x\in E_\infty\colon f_m(x) \ge M\} $. Wtedy

\[ \int_{E_\infty}f\, d\mu\ge \int_{E_\infty} f_m\, d\mu\ge \int_{A_m}f_m\, d\mu \ge M\mu(A_m)  \]

Ciąg zbiorów $ A_m $ jest wstępujący, a jego suma to zbiór $ E_\infty $, więc, podobnie jak wcześniej,

\[ \int_{E_\infty}f\, d\mu\ge \lim_{m\to\infty}\int_{E_\infty} f_m\, d\mu \ge M\mu(E_\infty)\, . \]

Dla $ M\to \infty $ otrzymujemy więc (Czytelnik zechce pamiętać o umowie $ \infty \cdot 0=0 $, którą przyjmujemy w teorii miary i całki.)

\[ \int_{E_\infty}f\, d\mu\ge \lim_{m\to\infty}\int_{E_\infty} f_m\, d\mu \ge\infty\cdot \mu(E_\infty) =\int_{E_\infty} f\, d\mu\, . \]

Dodając otrzymane wyżej nierówności, przekonujemy się, że

\[ \begin{align*} \lim_{m\to\infty}\int_E f_m\, d\mu &= \lim_{m\to\infty}\biggl(  \int_{E_0} f_m\, d\mu +\int_{E_+} f_m\, d\mu+\int_{E_\infty} f_m\, d\mu  \biggr) \\ &\ge \int_{E_0} f\, d\mu  +    \int_{E_+} f\, d\mu   + \int_{E_\infty} f\, d\mu =\int_E f\,d\mu. \end{align*} \]

Dowód twierdzenia o zbieżności monotonicznej jest zakończony. □

Stwierdzenie [liniowość całki] Dla wszystkich $ \alpha,\beta\ge 0 $ i wszystkich funkcji mierzalnych $ f,g $, nieujemnych na zbiorze $ E\in \F $, zachodzi wzór

\[ 	\int_E(\alpha f+\beta g)\, d\mu =\alpha \int_E f\, d\mu + \beta\int_E g\, d\mu. 	\]
Dowód: Z uwagi na równość calkaaf, wystarczy przeprowadzić dowód w szczególnym przypadku $ \alpha=1=\beta $. Ponadto, ponieważ wobec Twierdzenia [link] każda nieujemna funkcja mierzalna jest granicą niemalejącego ciągu funkcji prostych, więc z uwagi na twierdzenie Lebesgue'a o zbieżności monotonicznej wystarczy ograniczyć się do sytuacji, gdy $ f,g $ są funkcjami prostymi.

Z Twierdzenia [link] wynika, że całka z nieujemnej funkcji prostej $ h=\sum_{j=1}^N c_j\charfn_{C_j} $, gdzie zbiory $ C_j $ są mierzalne i parami rozłączne, a stałe $ c_j\ge 0 $ dla wszystkich $ j $, jest równa

\[ \sum_{j=1}^N\int_{C_j} h\, d\mu = \sum_{j=1}^N c_j \mu(C_j)\, . \]

Niech więc $ f=\sum_{j=1}^m {a_j}\charfn_{A_j} $, $ g=\sum_{i=1}^l {b_i}\charfn_{B_i} $, gdzie $ E=\bigcup_{j=1}^m A_j = \bigcup_{i=1}^l B_i $ (w każdej z tych sum zbiory są mierzalne i parami rozłączne). Wtedy $ f+g=a_j+b_i $ na $ A_j\cap B_i $, a zbiór $ E $ jest rozłączną sumą iloczynów $ A_j\cap B_i $. Dlatego na mocy Twierdzenia [link]

\[ \begin{align*} \int_E (f+g)\, d\mu & = \int_{\bigcup (A_j \cap B_i)} (f+g)\, d\mu   = \sum_{j=1}^k\sum_{i=1}^l \int_{A_j \cap B_i}  (f+g)\, d\mu \\ & =  \sum_{j=1}^k\sum_{i=1}^l (a_j+b_i) \mu({A_j \cap B_i})    \\ & =  \sum_{j=1}^k a_j \biggl(\sum_{i=1}^l\mu({A_j \cap B_i})\biggr)    +   \sum_{i=1}^l b_i \biggl( \sum_{j=1}^k \mu({A_j \cap B_i}) \biggr) \\ & = \sum_{j=1}^k a_j \mu({A_j })    +   \sum_{i=1}^l b_i   \mu({ B_i}) =\int_E f\, d\mu + \int_E g\, d\mu\, .    \end{align*} \]

Zamiana zmiennych. Twierdzenie Fubiniego

Podamy teraz dwa bardzo ważne twierdzenia, które w połączeniu z Twierdzeniem [link] umożliwiają obliczanie wielu całek. Pierwsze z nich, twierdzenie o zamianie zmiennych, jest naturalnym uogólnieniem Twierdzenia [link] (o mierze liniowego obrazu zbioru mierzalnego) na przypadek odwzorowań nieliniowych. Twierdzenie Fubiniego orzeka natomiast, że całkę z funkcji wielu zmiennych $ \xx=(x_1,\ldots, x_n) $ całkowalnej względem miary Lebesgue'a można obliczać, całkując kolejno względem zmiennych $ x_k $ imiary Lebesgue'a $ d\lambda_1(x_k) $ (a kolejność całkowań nie ma wpływu na wynik).

Podamy najpierw ścisłe sformułowania obu twierdzeń, następnie zaś omówimy kilka przykładów ich zastosowań.

Twierdzenie [o zamianie zmiennych](#) Niech $ \Omega\subset\R^n $ będzie zbiorem otwartym, a $ \Phi\colon \Omega\to \Phi(\Omega)\subset \R^n $ dyfeomorfizmem klasy $ C^1 $ zbioru $ \Omega $ na $ \Phi(\Omega) $. Załóżmy, że $ f $ jest funkcją całkowalną (lub mierzalną i nieujemną) względem miary Lebesgue'a $ \lambda_n $ na $ \Phi(\Omega) $. Wtedy $ (f\circ\Phi)\cdot |\det D\Phi| $ jest całkowalna (odpowiednio, mierzalna i nieujemna) na zbiorze $ \Omega $ i zachodzi równość

\[ \begin{equation} 	\int_{\Phi(\Omega)} f\, d\lambda_n = \int_\Omega (f\circ\Phi)\cdot |\det D\Phi|\,\, d\lambda_n\, . \label{rown-zamiana} \end{equation} \]

Biorąc $ f=\charfn_{\Phi(E)} $, gdzie $ E\subset \Omega $ jest zbiorem mierzalnym, otrzymujemy

Wniosek Jeśli $ \Omega\subset\R^n $ jest zbiorem otwartym, a $ \Phi\colon \Omega\to \Phi(\Omega)\subset \R^n $ dyfeomorfizmem klasy $ C^1 $, to

\[ \begin{equation} 	\label{m-dyfobr}      	\lambda_n\big(\Phi(E)\big)=\int_E |\det D\Phi|\,\, d\lambda_n  \end{equation} \]

dla każdego zbioru mierzalnego $ E\subset \Omega $.

Twierdzenie [Fubiniego](#) Niech $ f\colon \R^{n+m}=\R^n\times\R^m\to\overline \R $ będzie funkcją całkowalną (lub mierzalną w sensie Lebesgue'a i nieujemną). Wówczas:

  1. Dla $ \lambda_n $-prawie wszystkich $ \xx\in\R^n $ i $ \lambda_m $-prawie wszystkich $ \yy\in \R^m $ funkcje $ f_{\mxx}(\yy):=f(\xx,\yy) $ oraz $ f^{\myy}(\xx):=f(\xx,\yy) $ są mierzalne odpowiednio względem $ \Leb(\R^m) $ i $ \Leb(\R^n) $;
  2. Funkcje
    \[ 		\R^n\ni \xx\longmapsto \int_{\R^m} f(\xx,\yy)\, d\lambda_m(\yy)\in\overline\R\, , \qquad \R^m\ni \yy\longmapsto \int_{\R^n} f(\xx,\yy)\, d\lambda_n(\xx)\in\overline\R 		\]

    są mierzalne odpowiednio względem $ \sigma $-ciał $ \Leb(\R^n) $ i $ \Leb(\R^m) $;

  3. Zachodzą równości
    \[ \begin{equation}  	\label{row:Fubini} 	\begin{split} 		\int_{\R^{n+m}} f\, d\lambda_{n+m} &= \int_{\R^n} \biggl(\int_{\R^m} f(\xx,\yy)\, d\lambda_m(\yy)\biggr)\, d\lambda_n(\xx)\\      	  &= \int_{\R^m} \biggl(\int_{\R^n} f(\xx,\yy)\, d\lambda_n(\xx)\biggr)\, d\lambda_m(\yy) \, .         	\end{split} \end{equation} \]

    Uwaga. Dla $ m=n=1 $ i $ f=\charfn_P $, gdzie $ P $ jest przedziałem w $ \R^2 $, row:Fubini to po prostu wzór na pole prostokąta. Dla $ f=\charfn_{A\times B} $, gdzie $ A\in \Leb(\R^n) $ i $ B\in \Leb(\R^m) $, równość row:Fubini przybiera postać

\[ \lambda_{n+m}(A\times B)  =\int_{\R^{n+m}} \charfn_{A\times B} d\lambda_{n+m}  = \int_A \biggl(\int_B 1\, d\lambda_m(\yy)\biggr)\, d\lambda_n(\xx)=\lambda_n(A)\lambda_m(B)\, . \]

W Twierdzeniu [link] wykazaliśmy, że faktycznie tak jest.

Dowody obu twierdzeń na razie odłożymy i wskażemy kilka przykładów zastosowań.

Przykład Niech $ \Omega=\{(x,y)\in \R^2\colon 0<x<y<1\} $ i $ f(x,y)=x^2 y $. Obliczymy całkę $ \int_\Omega f\, d\lambda_2 $, korzystając z twierdzenia Fubiniego i związku między całkami Lebesgue'a iRiemanna. Czytelnik zechce naszkicować trójkąt $ \Omega $ i prześledzić rachunki, patrząc na rysunek. Otóż,

\[ \begin{align*}  \int_\Omega  f\, d\lambda_2 = \int_{\R^2} \charfn_\Omega\cdot f\, d\lambda_2 &=\int_{\R} \biggl(\int_{\R} \charfn_\Omega\cdot f \, d\lambda_1(x)\biggr)\, d\lambda_1(y) \\  &= \int_0^1 \biggl(\int_0^yx^2 y\, dx \biggr) dy\\   &= \int_0^1 y\biggl(\int_0^yx^2\, dx \biggr) dy\\    &= \int_0^1 y\cdot  \biggl. \frac{x^3}3\biggr|_0^y  \,\, dy = \frac{1}{3}\int_0^1 y^4\, dy= \frac 13 \cdot \biggl. \frac{y^5}{5}\, dx \biggr|_0^y = \frac 1{15}\, .  \end{align*} \]

Całkując najpierw względem $ y $, potem zaś względem $ x $, otrzymujemy

\[ \begin{align*}  \int_\Omega  f\, d\lambda_2 = \int_{\R^2} \charfn_\Omega\cdot f\, d\lambda_2 &=\int_{\R} \biggl(\int_{\R} \charfn_\Omega\cdot f  \,   d\lambda_1(y)\biggr)\, d\lambda_1(x) \\  &= \int_0^1 x^2\biggl(\int_x^1  y\, dy \biggr)\, dx \\ &= \frac{1}{2}\int_0^1 x^2\biggl(1-x^2\biggr)\, dx  = \bigg(\frac{x^3}{6}-\frac{x^5}{10}\bigg)\bigg|_0^1  =\frac{1}{15}\, . \end{align*} \]

Zgodnie z twierdzeniem Fubiniego, wynik jest za każdym razem taki sam. □

Przykład Pokażemy, że założenie całkowalności $ f $ w twierdzeniu Fubiniego jest istotne. Wybierzmy ciąg liczb $ 0=a_0<a_1<a_2<a_3<\ldots < 1 $, $ \lim a_j=1 $. Dla $ j\in \N $ niech $ g_j\colon [0,1]\to [0,\infty) $ będzie funkcją ciągłą na $ [0,1] $ (np. kawałkami liniową), znikającą poza przedziałem $ I_j=[a_{j-1},a_j] $ i taką, że całka $ \int_0^1 g_j(x)\, dx =1 $. Połóżmy

\[ f(x,y)=\sum_{j=1}^\infty \big(g_j(x)-g_{j+1}(x)\big)g_j(y)\, , \qquad (x,y)\in [0,1]^2.   \]

Zauważmy, że dla każdego punktu $ (x,y)\in [0,1]^2 $ szereg, określający $ f $, ma co najwyżej jeden\/ składnik niezerowy (trzeba dobrać $ j_0 $ tak, aby $ y\in [a_{j_0-1},a_{j_0}] $; dla $ j\not= j_0 $ jest $ g_j(y)=0 $). Dlatego $ f $ jest dobrze określoną funkcją mierzalną.

Nietrudno zauważyć (proszę na rysunku zaznaczyć w kwadracie $ [0,1]^2 $ zbiór, gdzie funkcja $ f\not=0 $, a następnie zbadać całki z $ f $ po odcinkach $ x=\mathrm{const} $ i $ y=\mathrm{const} $), że

\[ \int_0^1\biggl(\int_0^1f(x,y)\,d\lambda_1 (x)\biggr)\, d\lambda_1(y) =\sum_{j=1}^\infty\int_{I_j} g_j(y) \biggl(\int_0^1 \big(g_j(x)-g_{j+1}(x)\big)\, dx\biggr) \, dy = 0, \]

jednak

\[ \int_0^1\biggl(\int_0^1f(x,y)\,d\lambda_1 (y)\biggr)\, d\lambda_1(x) =\sum_{j=1}^\infty\int_{I_j} \biggl(\int_0^1 f(x,y) \, dy\biggr) \, dx = \int_{I_1}\int_{I_1} g_1(x)g_1(y)\,dx\, dy= 1. \]

Wyniki są różne, gdyż $ \int_{[0,1]^2}|f|\, d\lambda_2=\infty $, tzn. $ f $ nie jest całkowalna na kwadracie $ [0,1]^2 $.□

Przykład Sprawdzimy, że $ \int_\R \exp(-x^2)\, dx=\sqrt{\pi} $. Oznaczmy tę całkę literą $ I $. Z twierdzenia Fubiniego

\[ I^2=\int_\R \exp(-x^2)\, dx\cdot \int_\R \exp(-y^2)\, dy = \int_{\R^2} \exp(-x^2-y^2)\, d\lambda_2(x,y)\, .  \]

Wprowadzimy teraz zmienne biegunowe w $ \R^2 $. Niech

\[ (0,\infty)\times (0,2\pi)\ni (r,\theta)\ \longmapsto\  \Phi(r,\theta)=(r\cos\theta,r\sin\theta)\in \Phi(\Omega)=\R^2 \setminus \Big([0,\infty)\times \{0\}\Big)\, ;       \]

przekształcenie $ \Phi $ jest dyfeomorfizmem pasa $ \Omega=(0,\infty)\times (0,2\pi) $; uzupełnienie $ \R^2\setminus \Phi(\Omega) $ obrazu tego pasa jest półprostą, a więc ma miarę Lebesgue'a równą zero. Ponadto

\[ \det D\Phi(r,\theta)= \det \begin{pmatrix} \cos \theta & -r\sin\theta \\ \sin\theta & r\cos \theta \end{pmatrix} = r\, . \]

Dlatego, na mocy wzoru rown-zamiana i twierdzenia Fubiniego,

\[ \begin{multline*} 	I^2  	    = \int_{\Phi(\Omega)}  \exp(-x^2-y^2)\, d\lambda_2(x,y) 	    = \int_\Omega \exp(-r^2)\cdot r \, d\lambda_2(r,\theta)\\         = \int_0^\infty e^{-r^2}r\bigg(\int_0^{2\pi} 1\, d\theta\bigg)\, dr = 2\pi \cdot \int_0^\infty e^{-r^2}r\, dr=\pi \cdot  \left(-{e^{-r^2}}\right)\bigg|_0^\infty  =\pi. \end{multline*} \]

Przykład Obliczymy miarę Lebesgue'a kuli $ B(x,r)\subset\R^n $. Z uwagi na niezmienniczość miary Lebesgue'a względem przesunięć i Twierdzenie [link],

\[ \begin{equation} 		\label{kular} 	   \lambda_n\big(B(x,r)\big)=\lambda_n\big(B(0,r)\big)= |\det (r\cdot \mathrm{Id})|\cdot \lambda_n(B(0,1))=r^n\cdot \, \lambda_n(B(0,1)).  \end{equation} \]

Wystarczy więc obliczyć

\[ \begin{equation} 	\omega_n:=\lambda_n(B(0,1))\, . \end{equation} \]
Twierdzenie (#) Dla $ n=1,2,\ldots $ zachodzi wzór

\[ \begin{equation} 		\label{on}       		\omega_n=\frac{\pi^{n/2}}{\Gamma((n+2)/2)}    \end{equation} \]

gdzie

\[ \Gamma(\lambda)=\int_0^\infty t^{\lambda-1} e^{-t}\, dt  \]

jest funkcją gamma Eulera.

Dowód: Przekrój kuli $ B^n(0,1)\subset\R^n $ `płaszczyzną' afiniczną $ \{\xx\in \R^n \colon x_n=t\} $ jest $ (n-1) $-wymiarową kulą o promieniu $ (1-t^2)^{1/2} $. Dlatego z twierdzenia Fubiniego i wzoru kular wynika, że

\[ \omega_n = \int_{\R^n} \charfn_{B^n(0,1)} \, d\lambda_n = \int_{-1}^1 \omega_{n-1} (1-t^2)^{(n-1)/2}\, dt= 2\omega_{n-1} \int_{0}^1 (1-t^2)^{(n-1)/2}\, dt\, . \]

Dokonując teraz zamiany zmiennych $ s=t^2 $, $ dt =(\sqrt{s})'\, ds=\frac 12 s^{-1/2} \, ds $, otrzymujemy zależność rekurencyjną

\[ \begin{equation} 	\omega_n = \omega_{n-1} \int_0^1 (1-s)^{\frac{n+1}2-1}s^{\frac 12 - 1}\, ds =\omega_{n-1}\, \cdot \,  B\Big(\frac{n+1}2, \frac 12\Big)\, ,  \label{ononp1} \end{equation} \]

w której

\[ B(a,b)=\int_0^1 (1-s)^{a-1} s^{b-1}\, ds, \qquad a,b>0 \]

oznacza funkcję beta Eulera. Wiadomo (patrz wykłady Analizy Matematycznej zIroku, podrozdział10.2), że

\[ B(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}, \qquad \Gamma(a+1)=a\Gamma(a), \qquad \Gamma(\tfrac 12) = \sqrt{\pi}\, , \qquad \Gamma(n)=(n-1)! \quad\mbox{dla $n\in \N$.} \]

Zatem rekurencję ononp1 można zapisać jako

\[ \begin{equation} 	\label{rekur-omega} 	\omega_n=\omega_{n-1}\cdot \pi^{1/2} \cdot \frac{\Gamma\big((n+1)/2\big)}{\Gamma\big((n+2)/2\big)}\, .       \end{equation} \]

Wzór on zachodzi dla $ n=1 $, gdyż

\[ \omega_1=\lambda_1\big((-1,1)\big)= 2 = \frac{\pi^{1/2}}{\frac 12 \pi^{1/2}}= \frac{\pi^{1/2}}{\frac 12 \Gamma(\frac 12)}=\frac{\pi^{1/2}}{\Gamma(3/2)}\, ; \]

dlatego teza twierdzenia łatwo wynika z rekur-omega przez indukcję. □

Dla $ n=2 $ i $ n=3 $ wzór on implikuje znane Czytelnikowi zależności

\[ \omega_2=\frac{\pi^{2/2}}{\Gamma(4/2)}=\frac{\pi}{(2-1)!}=\pi, \qquad \omega_3 = \frac{\pi^{3/2}}{\Gamma(5/2)}=\frac{\pi\sqrt{\pi}}{\frac 32 \cdot \frac 12 \cdot \Gamma\big(\frac 12 \big)}= \frac 43 \pi\, . \]
Uwaga Całkę $ \int_0^1 (1-t^2)^{(n-1)/2}\, dt $ można obliczyć różnymi sposobami, niekoniecznie odwołując się do funkcji $ \Gamma $ i $ B $ Eulera. Można np. podstawić $ t=\cos y $, $ y\in (0,\frac \pi 2) $ i potem przez części obliczać całki z potęg sinusa.

Ponadto, miarę $ \omega_n $ kuli $ B^n(0,1) $ można obliczyć inaczej, np. całkując we współrzędnych biegunowych w $ \R^n $. Czytelnik zechce rozwiązać następujące zadanie.

Zadanie Niech, dla $ r>0 $, $ \theta_2\in (0,2\pi) $ i $ |\theta_1|<\frac \pi 2 $,

\[ 	x=r\cos\theta_1 \cos \theta_2\, , \qquad y=r \cos\theta_1 \sin\theta_2\, , \qquad z=r \sin\theta_1\, . 	\]

Proszę sprawdzić, że przekształcenie $ \varphi\colon (r,\theta_1,\theta_2)\mapsto (x,y,z) $ określone powyższymi wzorami jest dyfeomorfizmem przedziału $ (0,1)\times (0,2\pi)\times (-\frac \pi 2, \frac \pi 2)\subset \R^3 $ na podzbiór otwarty pełnej miary w kuli $ B(0,1)\subset \R^3 $. Obliczyć wyznacznik macierzy Jacobiego tego dyfeomorfizmu i objętość kuli.

Dowód twierdzenia o zamianie zmiennych

Idea dowodu jest prosta: rozkłada się dziedzinę $ \Omega $ dyfeomorfizmu $ \Phi\colon \Omega\to \Phi(\Omega)\subset\R^n $ na drobne, parami rozłączne zbiory borelowskie, tak, aby na każdym z nich różniczka $ D\Phi $ tego dyfeomorfizmu była niemalże stała, równa z góry zadanemu automorfizmowi liniowemu przestrzeni $ \R^n $, z dokładnością do ustalonego marginesu błędu. Następnie, korzysta się zTwierdzenia [link] (o mierze liniowego obrazu zbioru mierzalnego), sumuje otrzymane wyniki i przechodzi do granicy z marginesem błędu.

Szczegóły wymagają pewnej staranności.

Lemat [o rozkładzie dziedziny dyfeomorfizmu](#) Jeśli $ \Phi\colon \R^n\supset \Omega\to \Phi(\Omega)\subset \R^n $ jest dyfeomorfizmem, a $ c>1 $ ustaloną liczbą, to dla $ j=1,2,\ldots $ istnieją zbiory otwarte $ U_j\subset \Omega $, których domknięcia $ \overline U_j $ są zwarte i $ \overline U_j\subset \Omega $ dla $ j\in \N $, oraz automorfizmy liniowe $ s_j\in GL(n,\R) $ przestrzeni $ \R^n $, które spełniają następujące warunki:

    {{\rm(\roman{enumi})}}

  1. $ \Omega=\bigcup_{j=1}^\infty U_j $;
  2. Zachodzą nierówności
    \[ \begin{equation} 			\label{det-z-dolu} |\det D\Phi(\xx)|\ge \frac 1c |\det s_j| \qquad\mbox{dla $\xx\in U_j$, $j=1,2,\ldots$} 	\end{equation} \]
  3. Dla każdego zbioru mierzalnego $ A\subset U_j $, gdzie $ j=1,2,\ldots $, zbiór $ \Phi(A) $ jest mierzalny, a ponadto
    \[ \begin{equation}  	  \label{niermiara} 	  \lambda_n(A) |\det s_j| \ge \frac 1c \lambda_n(\Phi(A)). \end{equation} \]

Intuicja jest prosta: $ U_i $ to zbiór tych punktów $ \xx $, dla których $ D\Phi(\xx)\approx s_i $, gdzie $ s_i $ są automorfizmami, wybieranymi z pewnego przeliczalnego, gęstego w $ GL(n,\R) $ podzbioru automorfizmów liniowych $ \R^n $. Liczba $ c>1 $ służy do kontroli błędu przybliżenia i wynikających zeń oszacowań det-z-dolu- niermiara. Dowód tego lematu zawiera kluczowe trudności dowodu twierdzenia o zamianie zmiennych.

    Dowód Lematu [link] Ustalmy $ c>1 $. Wybierzmy przeliczalny gęsty podzbiór $ \mathbb{S}\subset GL(n,\R) $; można np. wziąć wszystkie automorfizmy liniowe, których macierze w standardiowej bazie mają tylko wyrazy wymierne. Ustalmy automorfizm $ s\in \mathbb{S} $ i liczbę $ m\in \N $. Niech $ \eps>0 $ będzie małą liczbą, której wartość dobierzemy do $ c,s,n $ później.

Niech $ k>m $, $ k\in \N $. Określmy $ Z(s,m,k) $ jako zbiór tych punktów $ \xx\in \Omega $, dla których spełnione są trzy warunki, zsm-1- zsm-3 niżej: po pierwsze,

\[ \begin{equation} \dist (\xx, \R^n\setminus \Omega)>\frac 1m \qquad \mbox{oraz} \qquad \|\xx\|<m\, ,\label{zsm-1}      \end{equation} \]

a ponadto dla $ A=D\Phi(\xx) $ jest

\[ \begin{gather}  \big\|A\circ s^{-1}-\mathrm{Id}\big\|  +\big\|s^{-1}\circ A -\mathrm{Id}\big\|     +  \big\| s\circ A^{-1}-\mathrm{Id}\big\| + \big\| A^{-1} \circ  s  -\mathrm{Id}\big\| < \eps\, , \label{zsm-2}\\ \frac{\|\Phi(\xx+\vv)-\Phi(\xx)-D\Phi(\xx) \vv\|}{\|\vv\|} < {\eps} \quad\mbox{dla wszystkich $\zero\not=\vv\in B(\zero,1/k)$,}\label{zsm-3} \end{gather} \]

Następnie, niech $ Z(s,m)=\bigcup_{k>m} Z(s,m,k) $. Jest to zbiór otwarty\/: jeśli $ \xx\in Z(s,m) $, to warunki zsm-1- zsm-2 zachodzą w pewnej kuli wokół $ \xx $, gdyż nierówności są ostre, a $ \Phi $ jest dyfeomorfizmem klasy $ C^1 $. Jeśli warunek zsm-3 jest spełniony w punkcie $ \xx $ dla liczby $ k>m $, to jest spełniony na małej kuli wokół $ \xx $ dla pewnej liczby $ k_1>k $; nietrudno to uzasadnić, korzystając np. z ciągłości lewej strony nierówności zsm-3 jako funkcji pary zmiennych $ \xx,\vv $ (dla $ \vv=\zero $ oczywiście przyjmujemy wartość 0). (Osoby zainteresowane dogłębnym rozumieniem wykładu proszone są o uzupełnienie szczegółów.)

Ponieważ $ \Phi\in C^1 $, więc rodzina wszystkich $ Z(s,m) $ pokrywa zbiór $ \Omega $, a domknięcia zbiorów $ Z(s,m) $ są zwartymi podzbiorami $ \Omega $. Na zbiorze $ Z(s,m) $ funkcja $ \Phi $ nie tylko jest dyfeomorfizmem, ale spełnia warunek Lipschitza na każdej zawartej w nim kuli; stąd wynika, że dla mierzalnych $ A\subset Z(s,m) $ zbiór $ \Phi(A) $ jest mierzalny. (Proszę sprawdzić, że lipschitzowski obraz zbioru miary zero jest zbiorem miary zero, a homeomorficzny obraz zbioru borelowskiego jest borelowski.)

Z oszacowań normy zsm-2 otrzymujemy

\[ \begin{equation} 	\label{DP-s} 	\|D\Phi(\xx)\ww - s(\ww)\|\le \eps \|s(\ww)\|, \qquad    \| s(\ww)-D\Phi(\xx)\ww \|\le \eps \|D\Phi(\xx)(\ww)\| \end{equation} \]

dla $ \xx\in Z(s,m) $ i wszystkich $ \ww\in\R^n $. Stąd i z zsm-2 wynika, że obraz kuli $ B=B(0,1) $ pod działaniem przekształceń liniowych $ D\Phi(\xx) $ i $ s $ spełnia dla każdego $ \xx\in Z(s,m) $ zależności

\[ \begin{equation} 	D\Phi(\xx)(B)\subset (1+\eps)\cdot s(B), \qquad s(B)\subset (1+\eps)\cdot D\Phi(\xx)(B), \end{equation} \]

gdzie $ (1+\eps)\cdot X $ oznacza obraz zbioru $ X $ w jednokładności o środku w zerze i skali $ 1+\eps $. ZTwierdzenia [link] o mierze obrazu liniowego zbioru mierzalnego otrzymujemy więc

\[ \begin{equation} \frac{|\det s|}{(1+\eps)^n}	\le |\det D\Phi(\xx)|\le (1+\eps)^n |\det s|,  \qquad \xx\in Z(s,m). \end{equation} \]

Zatem dla $ 1<(1+\eps)^n\le c $ przeliczalna rodzina zbiorów $ Z(s,m) $ spełnia tezę lematu, za wyjątkiem warunku (iii), którego jeszcze nie sprawdziliśmy.

Dalej pracujemy przy ustalonych $ s $ i $ m $. Wybierzmy jeszcze $ M>1 $ tak, aby

\[ \begin{equation} 	\label{wyborM}  	 \qquad \|s\| + \|s^{-1}\| < M.   \end{equation} \]

Ustalmy $ k>m $. Oszacujemy miarę zbioru $ f(Z(s,m,k)\cap U) $, gdzie $ U $ jest dowolnym otwartym podzbiorem $ Z(s,m) $. Przedstawmy $ U $ jako sumę małych kostek domkniętych o wnętrzach parami rozłącznych. Niech $ Q $ będzie jedną z tych kostek, o krawędzi $ d\ll  1/k $. Wybierzmy $ \xx\in Z(s,m,k)\cap Q $. Porównamy wielkość zbiorów $ \Phi(Q) $ i $ s(Q) $. Niech $ \yy\in Q $ będzie dowolnym punktem. Z nierówności trójkąta,

\[ \begin{eqnarray*} \|\Phi(\yy)-\Phi(\xx) - s(\yy-\xx)\| & \le &  \|\Phi(\yy)- \Phi(\xx)  - D\Phi(\xx)(\yy-\xx)\|\\ & & {} +\|(D\Phi(\xx)-s)(\yy-\xx)\|\\ &\le & \eps\|\yy-\xx\| +\eps \|s(\yy-\xx_0)\| \qquad\mbox{wobec \eqref{zsm-3} i \eqref{DP-s}}\\ & \stackrel{\eqref{wyborM}}\le & 2\eps M \|\yy-\xx_0\|\le 2\eps M d\sqrt{n} .    \end{eqnarray*} \]

Zatem $ \Phi(\yy)-\Phi(\xx) - s(\yy-\xx)=\ww=s(\zz) $ dla punktu $ \zz $ takiego, że

\[\|\zz\|\le \|s^{-1}\|\cdot \|\ww\| \le 2\eps  M^2d\sqrt{n} \, .\]

Punkt $ \yy+\zz $ należy więc do kostki $ Q' $ współśrodkowej z $ Q $ i mającej krawędź $ d'=d+ 2\cdot 2\eps  M^2d\sqrt{n} $. Jest $ d' < c^{1/n} d $, gdy do ustalonych $ M>1 $ i $ c>1 $ dobierzemy $ \eps>0 $ dostatecznie małe. Punkt $ \Phi(\yy)= \Phi(\xx)-s(\xx)+ s(\yy+\zz)=\pp + s(\yy+\zz) $ należy do przesuniętego o ustalony wektor $ \pp $ obrazu zbioru $ s( Q') $. Stąd

\[ \lambda_n(\Phi(Q))\le\lambda_n( s(Q'))=|\det s|\cdot \lambda_n(Q') \le c \cdot |\det s|\cdot  \lambda_n(Q). \]

Sumując takie oszacowania, otrzymujemy

\[ \lambda_n(\Phi(Z(s,m,k)\cap U))\le  c \cdot |\det s|\cdot  \lambda_n(U), \qquad U\subset Z(m,s) \]

a następnie, przechodząc do granicy $ k\to \infty $ (zbiory $ Z(s,m,k) $ tworzą ciąg wstępujący!),

\[ \lambda_n(\Phi(U))\le  c \cdot |\det s|\cdot  \lambda_n(U)  \]

dla otwartych podzbiorów $ U\subset Z(s,m) $. Stąd już łatwo uzyskać warunek (iii) tezy lematu najpierw dla zbiorów borelowskich typu $ G_\delta $, potem zaś dla wszystkich mierzalnych. □

     Uwaga. Drugą część dowodu tego lematu można nieco uprościć; trzeba w tym celu wykazać, że na odpowiednio drobnych podzbiorach zbioru $ Z(s,m,k) $ funkcja $ \Phi\circ s^{-1} $ spełnia warunek Lipschitza ze stałą $ \theta $ odpowiednio bliską 1 (co jest dość łatwe) i wiedzieć, że wtedy $ \lambda_n(\Phi(Q))\le \theta^n \lambda_n(Q) $. Intuicyjnie to w miarę jasne, ale dowód nie jest zupełnie trywialny.

    Dowód twierdzenia o zamianie zmiennych. Wystarczy przeprowadzić dowód dla funkcji mierzalnych, nieujemnych; dla funkcji całkowalnych dowolnego znaku twierdzenie wyniknie stąd natychmiast. Ustalmy zbiór mierzalny $ E\subset \Omega $ i liczbę $ c>1 $. Niech $ U_i $ oraz $ s_i $ oznaczają zbiory iprzekształcenia z Lematu [link]. Biorąc $ A_1=U_1 $ i $ A_j=U_j\setminus (A_1\cup\ldots\cup A_{j-1}) $ dla $ j\ge 2 $, otrzymujemy rodzinę zbiorów borelowskich, parami rozłącznych, pokrywającą $ \Omega $. Jest

\[ E= \bigcup_{i=1}^\infty (E\cap A_i), \qquad \Phi(E)=\bigcup_{i=1}^\infty \Phi(E\cap A_i)\, ; \]

z Lematu [link] wynika, że wszystkie zbiory wyżej są mierzalne. Wobec addytywności całki i nierówności det-z-dolu- niermiara,

\[ \begin{align*} \int_E |\det D\Phi|\, d\lambda_n &= \sum_{i=1}^\infty \int_{E\cap A_i} |\det D\Phi|\, d\lambda_n \\ &\ge \frac 1c \sum_{i=1}^\infty |\det(s_i)|\cdot \lambda_n(E\cap A_i) \ge  \frac{1}{c^2}   \sum_{i=1}^\infty  \lambda_n\big(\Phi(E\cap A_i)\big) = \frac{1}{c^2}\lambda_n(\Phi(E)). \end{align*} \]

Przechodząc do granicy $ c\to 1 $, otrzymujemy stąd

\[ \begin{equation} \int_E |\det D\Phi|\, d\lambda_n\ge \lambda_n(\Phi(E))\, , 	 \end{equation} \]

lub równoważnie,

\[ \begin{equation} \label{prenierP} \int_\Omega (f\circ\Phi)\cdot |\det D\Phi|\, d\lambda_n \ge \int_{\Phi(\Omega)} f\, d\lambda_n\, ,	 \end{equation} \]

gdzie $ f=\charfn_{\Phi(E)} $ jest funkcją charakterysteryczną zbioru $ \Phi(E) $. Wobec liniowości całki, prenierP zachodzi nie tylko dla funkcji charakterystycznych, ale i dla wszystkich nieujemnych funkcji prostych. Z Twierdzenia [link] (Lebesgue'a o zbieżności monotonicznej) wynika natychmiast, że nierówność prenierP ma miejsce dla każdej funkcji mierzalnej $ f $ nieujemnej na $ \Phi(\Omega) $.

Dyfeomorfizm $ \Phi $ i zbiór otwarty $ \Omega $ też mogą być dowolne. Z tego teraz skorzystamy. Zapiszmy prenierP dla zbioru $ V=\Phi(\Omega) $, dyfeomorfizmu $ \Psi=\Phi^{-1}\colon V\to \Omega=\Psi(V) $, oraz funkcji

\[ g=(f\circ \Phi)\cdot |\det D\Phi|, \qquad g\ge 0 \quad\mbox{na $\Omega=\Psi(V)$}. \]

Otrzymamy

\[ \begin{equation} 	\label{odwrotka}    	\int_V (g\circ\Psi)\cdot |\det D\Psi|\, d\lambda_n \ge \int_{\Psi(V)} g\, d\lambda_n= \int_\Omega (f\circ \Phi)\cdot |\det D\Phi|\, d\lambda_n \, .        \end{equation} \]

Uprośćmy funkcję podcałkową po lewej stronie. Jest

\[ \begin{align*} (g\circ \Psi)(\xx)\cdot  |\det D\Psi(\xx)| & =  f\big(\Phi(\Psi(\xx))\big) \cdot \big|\det D\Phi\big(\Psi (\xx)\big)\big| \cdot  |\det D\Psi(\xx)|  \\ & =  f\big(\xx)\big) \cdot \Big|\det\big( D\Phi(\Psi (\xx))\cdot D\Psi(\xx) \big)\Big| \\ & =  f\big(\xx)\big) \cdot \Big|\det\big( D(\Phi\circ\Psi)(\xx)\big)\Big| = f(\xx)\, , \qquad \mbox{gdyż $\Phi\circ \Psi=\mathrm{Id}$.}   \end{align*} \]

Dlatego odwrotka jest w istocie nierównością przeciwną do prenierP. Znak nierówności można więc w obu warunkach zastąpić znakiem równości! Dowód twierdzenia o zmianie zmiennych jest zakończony. □

Dowód twierdzenia Fubiniego

%\texttt{- poczeka spokojnie do semestru letniego.}

Dowód Twierdzenia [link] przeprowadzimy dla funkcji mierzalnych, nieujemnych. Wersja dla funkcji całkowalnych wynika stąd łatwo; zainteresowany Czytelnik sam zechce uzupełnić odpowiednie szczegóły.

Podzielimy rozumowanie na kilka kroków, stopniowo poszerzając klasę funkcji, dla których zachodzą poszczególne części tezy. Będziemy dowodzić tylko pierwszej z równości row:Fubini i tych fragmentów pierwszego i drugiego punktu tezy, które są niezbędne do nadania sensu tej równości, tzn. mierzalności prawie wszystkich funkcji $ f_{\mxx}(\yy)=f(\xx,\yy) $ względem $ \sigma $-ciała $ \Leb(\R^m) $ i mierzalności funkcji

\[ \R^n\ni \xx\longmapsto \int_{\R^m} f(\xx,\yy)\, d\lambda_m(\yy)\in\overline\R\, , \]

będących całkami $ f_{\mxx} $ względem $ \lambda_m $. Aby uzyskać drugą z równości row:Fubini i pozostałe fragmenty pierwszego i drugiego punktu tezy, wystarczy zamienić role zmiennych $ \xx $ i $ \yy $ w rozumowaniu.

    Krok 1. Niech $ f $ będzie funkcją charakterystyczną $ (n+m) $-wymiarowego przedziału domkniętego $ [\aa,\bb]_{n+m} $, otwartego $ (\aa,\bb)_{n+m} $ lub domknięto-otwartego

\[ [\aa,\bb)_{n+m}=\{\zz\in \R^{n+m} \colon \aa\preccurlyeq\zz\prec \bb\} \, . \]

Każdy taki przedział jest produktem $ I_n\times J_m $ pewnego przedziału $ n $-wymiarowego $ I_n $ ipewnego przedziału $ m $-wymiarowego $ J_m $. Dla każdego $ \xx\in \R^n $ funkcja $ \yy\mapsto f(\xx,\yy) $ jest albo równa $ \charfn_{J_m} $ (gdy $ \xx\in I_n $), albo jest funkcją stałą równą zero (gdy $ \xx\not\in I_n $), więc jest mierzalna względem $ \Leb(\R^m) $. Stąd wynika, że

\[ \R^n\ni \xx\longmapsto \int_{\R^m} f(\xx,\yy)\, d\lambda_m(\yy)=\charfn_{I_n}(\xx)\cdot \lambda_m (J_m) \]

jest funkcją mierzalną względem $ \Leb(\R^n) $. Pierwsza z równości row:Fubini przybiera więc w tym przypadku postać

\[ \lambda_{n+m}(I_n\times J_m) = \lambda_n(I_n) \cdot \lambda_m (J_m)\, ,   \]

co jest prawdą na mocy Twierdzenia [link]. (Można też po prostu odwołać się do równości miary Lebesgue'a i objętości przedziału.)

    Krok 2. Niech teraz $ f $ będzie funkcją charakterystyczną zbioru otwartego $ \Omega\subset \R^{n+m} $. Wiemy, że każdy taki zbiór jest sumą przeliczalnej rodziny kostek domkniętych o wnętrzach parami rozłącznych; nietrudno stąd wywnioskować, że $ \Omega=\bigcup_{j=1}^\infty P_j $, gdzie $ P_j $ są przedziałami otwarto-domkniętymi i parami rozłącznymi. Zatem

\[ f=\charfn_\Omega=\sum_{j=1}^\infty f_j, \qquad\mbox{gdzie}\quad f_j=\charfn_{P_j}. \]

Funkcja $ \R^m\ni \yy\mapsto f(\xx,\yy) $ jest więc mierzalna dla każdego $ \xx\in\R^n $ (jako granica zbieżnego ciągu funkcji mierzalnych). Następnie, funkcja

\[ \R^n\ni \xx\longmapsto \int_{\R^m} f(\xx,\yy)\, d\lambda_m(\yy)=\sum_{j=1}^\infty  \int_{\R^m} f_j(\xx,\yy)\, d\lambda_m(\yy) \]

(równość zachodzi wobec twierdzenia Lebesgue'a o zbieżności monotonicznej) jest mierzalna z tego samego powodu. Wreszcie,

\[ \begin{multline*} 	\int_{\R^{n+m}} f\, d\lambda_{n+m} = \sum_{j=1}^\infty  \int_{\R^{n+m}} f_j\, d\lambda_{n+m}    	= \sum_{j=1}^\infty   \int_{\R^n} \biggl(\int_{\R^m} f_j(\xx,\yy)\, d\lambda_m(\yy)\biggr)\, d\lambda_n(\xx) \\ 	 =    \int_{\R^n}  \biggl( \sum_{j=1}^\infty \int_{\R^m} f_j(\xx,\yy)\, d\lambda_m(\yy)\biggr)\, d\lambda_n(\xx)    	 =    \int_{\R^n}  \biggl(\int_{\R^m} \underbrace{\sum_{j=1}^\infty  f_j(\xx,\yy)}_{=f(\mxx,    \myy)}, d\lambda_m(\yy)\biggr)\, d\lambda_n(\xx) 	%\\    =  \int_{\R^n}  \biggl(\int_{\R^m}  f(\xx,\yy)\, d\lambda_m(\yy)\biggr)\, d\lambda_n(\xx)  \end{multline*} \]

na mocy pierwszego kroku dowodu i kilkakrotnie zastosowanego twierdzenia Lebesgue'a o zbieżności monotonicznej.     Krok 3. Teraz niech $ f=\charfn_G $, gdzie $ G\subset \R^{n+m} $ jest zbiorem ograniczonym typu $ G_\delta $. Wówczas $ G=\bigcap_{j=1}^\infty \Omega_j $ dla pewnego zstępującego ciągu zbiorów otwartych ograniczonych $ \Omega_j $. Niech $ f_j $ oznacza funkcję charakterystyczną $ \Omega_j $; wtedy oczywiście $ f_j\searrow f $ dla $ j\to\infty $. Ponownie więc funkcja $ \yy\mapsto f(\xx,\yy) = \lim_j f_j(\xx,\yy) $ jest dla każdego $ \xx\in \R^n $ mierzalna względem $ \Leb(\R^m) $. Ponadto, dla każdego $ \xx\in \R^n $ jest

\[ \int_{\R^m} f_1(\xx,\yy) \, d\lambda_m(\yy) < \infty \]

więc

\[ \lim_{j\to\infty} \int_{\R^m} f_j(\xx,\yy) \, d\lambda_m(\yy) =   \int_{\R^m} \lim_{j\to\infty}  f_j(\xx,\yy) \, d\lambda_m(\yy)  = \int_{\R^m} f(\xx,\yy) \, d\lambda_m(\yy)   \]

na mocy twierdzenia Lebesgue'a o zbieżności zmajoryzowanej. Dlatego, wobec poprzedniego kroku dowodu, funkcja $ \xx\mapsto \int_{\R^m} f(\xx,\yy)\, d\lambda_m(\yy) $ jest mierzalna jako granica funkcji mierzalnych. Wiemy już, że

\[ \int_{\R^{n+m}} f_j\, d\lambda_{n+m} = \int_{\R^n}\biggl(\int_{\R^m} f_j(\xx,\yy) \, d\lambda_m(\yy)\biggr)\, d\lambda_n(\xx) \qquad\mbox{dla $j=1,2,\ldots$;} \]

przechodząc do granicy $ j\to \infty $ (trzeba w tym celu znów kilka razy skorzystać ztwierdzenia Lebesgue'a o zbieżności zmajoryzowanej), otrzymujemy równość row:Fubini dla $ f=\charfn_G=\lim f_j $.

    Krok 4. Teraz udowodnimy tezę dla $ f=\charfn_A $, gdzie $ A\in \Leb(\R^{n+m}) $ jest dowolnym zbiorem mierzalnym ograniczonym. Z charakteryzacji zbiorów mierzalnych w sensie Lebesgue'a (patrz Twierdzenie [link]) wynika, że $ A=G\setminus Z $, gdzie $ G $ jest ograniczonym zbiorem typu $ G_\delta $, zaś $ Z\subset G $ jest zbiorem miary $ \lambda_{n+m} $ zero. Zbiór $ Z $ jest zawarty w pewnym zbiorze $ H $ typu $ G_\delta $ i miary Lebesgue'a zero. (Można np. wziąć $ H=\bigcap U_j $, gdzie $ U_j $, dla każdego $ j=1,2,\ldots $, jest sumą rodziny przedziałów otwartych pokrywających $ Z $, o łącznej mierze $ < 1/j $.) Funkcja $ \charfn_H $ spełnia

\[ \int_{\R^n}\biggl(\int_{\R^m}\, \charfn_H (\xx,\yy)\,  d\lambda_m(\yy)\biggr)\, d\lambda_n(\xx) =\int_{\R^{n+m}}\charfn_H \, d\lambda_{n+m} =\lambda_{n+m}(H)=0, \]

więc

\[ \int_{\R^m}\, \charfn_H(\xx,\yy)\, d\lambda_m(\yy)=0\qquad\mbox{dla wszystkich $\xx\in X$, gdzie $\lambda_n(\R^n\setminus X)=0$.} \]

Stąd wynika, że dla każdego $ \xx\in X $ istnieje zbiór $ Y_{\mxx} $ taki, że

\[ \charfn_H(\xx,\yy)=0  \qquad\mbox{dla wszystkich $\yy\in Y_{\mxx}$, gdzie $\lambda_m(\R^m\setminus Y_{\mxx})=0$.}  \]

Jednak $ 0\le \charfn_Z\le \charfn_H $, więc

\[ \begin{equation} \label{chfnZ} \charfn_Z(\xx,\yy)=0 \qquad\mbox{dla wszystkich $x\in X$ i $\yy\in Y_{\mxx}$}.	 \end{equation} \]

Funkcja $ f=\charfn_A=\charfn_G-\charfn_Z $. Ustalmy $ x\in X $. Wobec chfnZ jest $ f(\xx,\yy)=\charfn_G(\xx,\yy) $ dla wszystkich $ \yy\in Y_{\mxx} $, tzn. na zbiorze pełnej miary w $ \R^m $. Funkcja, która jest $ \lambda_m $-prawie wszędzie równa funkcji mierzalnej, sama jest mierzalna; innymi słowy, $ f_{\mxx}(\cdot)=f(\xx,\cdot) $ jest mierzalna dla prawie wszystkich $ \xx $. Ponadto,

\[ \begin{equation} 	\label{naXdobrze}       	\int_{\R^m} f(\xx,\yy)\, d\lambda_m(\yy)= \int_{\R^m}\charfn_G(\xx,\yy) \, d\lambda_m(\yy) 	\qquad\mbox{dla wszystkich $\xx\in X$.} \end{equation} \]

Wynika stąd, że lewa strona tej równości jest mierzalną funkcją zmiennej $ \xx\in \R^n $.

Wreszcie, ponieważ $ X $ jest zbiorem pełnej miary w $ \R^n $, więc

\[ \begin{multline*} \int_{\R^{n+m}} f\, d\lambda_{n+m}=\int_{\R^{n+m}}\charfn_G\, d\lambda_{n+m} =  \int_{\R^n}\biggl(\int_{\R^m} \charfn_G (\xx,\yy) \, d\lambda_m(\yy)\biggr)\, d\lambda_n(\xx) \\ =  \int_{X}\biggl(\int_{\R^m} \charfn_G (\xx,\yy) \, d\lambda_m(\yy)\biggr)\, d\lambda_n(\xx) \stackrel{\eqref{naXdobrze}}=  \int_{\R^n}\biggl(\int_{\R^m} f (\xx,\yy) \, d\lambda_m(\yy)\biggr)\, d\lambda_n(\xx)\, .   \end{multline*} \]

    Krok 5: przypadek ogólny. Niech $ f $ będzie dowolną funkcją mierzalną nieujemną. Istnieje wtedy ciąg funkcji prostych $ 0\le f_j\nearrow f $ dla $ j\to \infty $. Zauważmy, że wtedy

\[ 0\le g_j=f_j\cdot \charfn_{B(\zero,j)} \nearrow f\, . \]

Z poprzednich kroków dowodu i liniowości całki łatwo wynika, że teza twierdzenia Fubiniego zachodzi dla wszystkich funkcji prostych nieujemnych, które znikają poza pewną kulą w $ \R^{n+m} $, a więc w szczególności dla każdej z funkcji $ g_j $. Dlatego, dla każdego $ j=1,2,\ldots $ istnieje taki zbiór $ X_j\subset \R^n $, że

\[ \begin{equation} 	\label{wlas-gj} 	\lambda_n(\R^n\setminus X_j)=0, \qquad \yy\mapsto g_j(\xx,\yy) \text{ jest funkcją mierzalną dla $\xx\in X_j$.} \end{equation} \]

Ponadto, funkcje

\[ \begin{equation} 	\R^n\ni \xx\mapsto\int_{\R^m} g_j(\xx,\yy)\, d\lambda_m(\yy) \qquad\text{są mierzalne dla } j=1,2\ldots \end{equation} \]

Połóżmy $ X=\bigcap_{j=1}^\infty X_j $. Zbiór $ X $ jest pełnej miary w $ \R^n $ i wszystkie funkcje $ \yy\mapsto g_j(\xx,\yy) $ są mierzalne dla każdego $ \xx\in X $; dlatego $ \yy\mapsto f(\xx,\yy)=\lim_j g_j(\xx,\yy) $ jest funkcją mierzalną dla każdego $ \xx\in X $. Z twierdzenia Lebesgue'a o zbieżności monotonicznej otrzymujemy teraz mierzalność funkcji

\[ \begin{equation}  	\label{fgj-ust-x} 	\R^n\ni \xx\mapsto\int_{\R^m} f(\xx,\yy)\, d\lambda_m(\yy)=\lim_{j\to\infty} \int_{\R^m} g_j(\xx,\yy)\, d\lambda_m(\yy) \end{equation} \]

Ponieważ teza twierdzenia Fubiniego zachodzi dla każdej funkcji $ g_j $, więc

\[ \int_{\R^{n+m}} f\, d\lambda_{n+m}=\lim_{j\to\infty }\int_{\R^{n+m}} g_j \, d\lambda_{n+m} =\lim_{j\to\infty }  \int_{\R^n}\biggl(\int_{\R^m} g_j (\xx,\yy) \, d\lambda_m(\yy)\biggr)\, d\lambda_n(\xx) \, ; \]

stąd i z fgj-ust-x otrzymujemy, raz jeszcze stosując twierdzenie Lebesgue'a o zbieżności monotonicznej, równość row:Fubini dla funkcji $ f $. To kończy cały dowód. □

Wniosek Niech $ A\in \Leb(\R^{n+m}) $. Dla $ \xx\in \R^n $ i $ \yy\in \R^m $ niech

\[ \begin{equation} 		\label{przekroje} 		A_{\mxx}:=\{\yy\in \R^m\colon (\xx,\yy) \in A\}, \qquad A^{\myy}:=\{\xx\in \R^n\colon (\xx,\yy) \in A\} \end{equation} \]

oznaczają tak zwane przekroje pionowe i poziome zbioru $ A $. Wówczas $ A_{\mxx}\in \Leb(\R^m) $ dla prawie wszystkich $ \xx\in \R^n $ i $ A^{\myy}\in \Leb(\R^n) $ dla prawie wszystkich $ \yy\in\R^m $.

Dowód: Stosujemy pierwszy punkt tezy twierdzenia Fubiniego do $ f=\charfn_A $.□
Uwaga Jeśli $ A\in \Leb(\R^{n+m}) $, to dla pewnych $ \xx\in \R^n $ przekrój $ A_{\mxx} $ może być zbiorem niemierzalnym. Niech np. $ n=m=1 $ i niech $ V\subset [0,1] $ będzie zbiorem niemierzalnym, skonstruowanym w Przykładzie [link]. Zbiór $ A=\{0\}\times V $ jest elementem $ \sigma $-ciała $ \Leb(\R^2) $, gdyż $ \lambda_2(A)=0 $, jednak jego przekrój $ A_0=V $ nie jest mierzalnym podzbiorem $ \R<img class="teximage" src="/sites/default/files/tex/caa71b3ca5d429eee8c60fca89372f3577171a70.png" alt="a1fd2caa389951a6eb1312615c0f72c3:458:" />A,B\in \Leb(\R^{n+m}) $ i równość $ \lambda_m(A_{\mxx})=\lambda_m(B_{\mxx}) $ zachodzi dla prawie wszystkich $ \xx\in \R^n $, to wówczas $ \lambda_{n+m}(A)=\lambda_{n+m}(B) $. □

Tej równości dla $ n=1,m=2 $ i `przyzwoitych' brył $ A,B\subset \R^3 $ świadom był już Archimedes, który wiedział, że objętość kuli stanowi $ \frac 23 $ objętości opisanego na niej walca, dowodził zaś tego, rozpatrując poziome przekroje kuli i dwóch stożków wpisanych w walec.

Podamy kilka innych przykładów zastosowań twierdzenia Fubiniego i twierdzenia o zamianie zmiennych.

Przykład [miara stożka nad zbiorem $ n $-wymiarowym] Niech $ A\in \Leb(\R^n) $, gdzie $ R^n $ utożsamiamy z $ \R^n\times \{0\}\subset \R^{n+1} $, i niech $ \vv\in \R^{n+1}=\R^n\times\R $ będzie punktem o współrzędnej $ v_{n+1}\not=0 $. Stożkiem $ C(A,\vv) $ o podstawie $ A $ (inaczej: nad zbiorem $ A $) i o wierzchołku $ \vv $ nazywa się zwykle zbiór

\[ 	C(A,\vv)=\{\zz\in \R^{n+1}\colon\quad \zz=t \cdot (\xx,0)+(1-t)\cdot \vv, \ \xx\in A, \ t\in [0,1]\}, 	\]

będący sumą wszystkich odcinków o jednym końcu w punkcie $ \xx=(\xx,0)\in A $ i drugim końcu w punkcie $ \vv $. Wykażemy, że

\[ \begin{equation} 	\label{miarastozka} 	\lambda_{n+1}\big(C(A,\vv)\big) = \frac{1}{n+1}\cdot  |v_{n+1}|\cdot \lambda_n(A). \end{equation} \]

(Czytelnik zechce zauważyć, że gdy $ n=2 $ i $ A $ jest wielokątem w $ \R^2 $, to miarastozka jest znanym wzorem na objętość ostrosłupa.) Niech

\[ \Phi\colon \R^n\times (0,1)\ni (\xx,t)\mapsto \Phi(\xx,t)= t \cdot (\xx,0)+(1-t)\cdot \vv\in \R^{n+1}\, ; \]

macierzą różniczki $ D\Phi $ przekształcenia $ \Phi $ jest, jak łatwo zauważyć, następująca macierz $ (n+1)\times (n+1) $:

\[ \begin{pmatrix} 	t\cdot {\mathrm{Id}}_{n\times n} & B \\ \zero & -v_{n+1}  \\ \end{pmatrix}  , \]

gdzie $ B $ oznacza kolumnę liczb $ x_i-v_i $, $ i=1,2,\ldots, n $. Dlatego $ |\det D\Phi(\xx,t)|=t^n\cdot |v_{n+1}| $. Mamy

\[ \begin{align*} \lambda_{n+1}\big(C(A,\vv)\big)&=\int_{\R^{n+1}}\charfn_{C(A,\mvv)} \, d\lambda_{n+1} \\ & = \int_{\R^n\times (0,1)} \Big(\charfn_{C(A,\mvv)}\circ \Phi \Big)\cdot |\det D\Phi|\, d\lambda_{n+1} \qquad\mbox{wobec Twierdzenia\ref{tw:zamiana}}\\ & = \int_0^1\int_A t^n \cdot |v_{n+1}|\, d\lambda_n(\xx)\, dt \qquad\mbox{wobec Twierdzenia Fubiniego\ref{tw:Fubini}}\\ & = \frac{1}{n+1}\cdot  |v_{n+1}|\cdot \lambda_n(A)\, ,  \end{align*} \]

a więc istotnie zachodzi wzór miarastozka\, .

Przykład [zasada Cavalieri'ego, wersja II] Niech $ f $ będzie funkcją mierzalną nieujemną na $ \R^n $. Wówczas dla każdej liczby $ p\ge 1 $ zachodzi wzór

\[ \begin{equation} 	\label{cav2} \int_{\R^n} f^p\, d\lambda_n =p\int_0^\infty t^{p-1}\cdot \lambda_n\big(\{\xx\in \R^n\colon f(\xx)>t\}\big)\, dt\, . \end{equation} \]

Istotnie, dzięki równości $ z^p=p\int_0^z t^{p-1}\, dt $, stosując twierdzenie Fubiniego, żeby zamienić kolejność całkowania względem $ \xx\in \R^n $ i $ t>0 $, otrzymujemy

\[ \begin{align*} \label{cav2} \int_{\R^n} f^p\, d\lambda_n = \int_{\R^n} \biggl(p\int_0^f t^{p-1}\, dt\biggr)\, d\lambda_n & =\int_{\R^{n+1}}  p\, t^{p-1}\cdot \charfn_{\{(\mxx,t)\colon f(\xx)>t>0\}} (\xx,t)\, d\lambda_{n+1}(\xx,t)\\  & =p\int_0^\infty t^{p-1}\cdot \lambda_n\big(\{\xx\in \R^n\colon f(\xx)>t\}\big)\, dt\, .   \end{align*} \]

Innym przykładem zastosowania obu twierdzeń (o zamianie zmiennych i Fubiniego) do obliczania objętości brył obrotowych w $ \R^3 $ jest tzw. reguła Pappusa-Guldina (znana także jako reguła Guldina lub twierdzenie Pappusa o środku ciężkości).

Definicja Jeśli $ A $ jest zbiorem mierzalnym w $ \R^n $, a $ \mu $ miarą na $ \Leb(\R^n) $, dodatnią na $ A $, to środkiem ciężkości zbioru $ A $ względem miary $ \mu $ nazywamy punkt $ s(A) $ o współrzędnych

\[ 	\frac{1}{\mu(A)} \int_A x_i\,  d\mu \, ,\qquad i=1,\ldots, n. 	\]

(Jeśli któraś z powyższych całek nie istnieje, to środek ciężkości $ A $ względem $ \mu $ nie jest określony). Używa się także zapisu wektorowego

\[ s(A)= \frac{1}{\mu(A)} \int_A \xx \,  d\mu \]

Gdy $ \mu=\lambda_n $, mówimy po prostu o środku ciężkości zbioru $ A $.

Stwierdzenie [reguła Pappusa-Guldina] Załóżmy, że zbiór $ A $ zawarty w półpłaszczyźnie $ \{(x,y,z)\in \R^3\colon x>0, y=0\} $ jest mierzalny względem $ \lambda_2 $ i ma środek ciężkości. Niech $ B $ będzie zbiorem, który powstaje z $ A $ przez obrót o kąt $ 2\pi $ wokół prostej $ x=y=0 $ w $ \R^3 $. Wtedy

\[ \begin{equation} 		\label{row:Guldin} 		\lambda_3(B)=2\pi r\cdot \lambda_2 (A), \end{equation} \]

gdzie $ r $ oznacza odległość środka ciężkości zbioru $ A $ od osi obrotu.

Dowód: Połóżmy

\[ \Phi(x,z,t)=(x\cos t,x\sin t, z) \qquad\mbox{dla}\quad (x,z,t)\in \Omega = (0,\infty)\times \R\times (0,2\pi)\, .    	\]

Czytelnik łatwo sprawdzi, że

\[ |\det D\Phi(x,z,t)|= |x\cos^2 t+ x\sin^2 t|= x, \qquad (x,z,t)\in \Omega. \]

Zbiór $ \Phi(A\times (0,2\pi)) $ to po prostu zbiór $ B $ z usuniętą półpłaszczyzną $ \{x>0, y=0\} $, która jest zbiorem miary zero w $ \R^3 $. Dlatego, wobec twierdzenia o zamianie zmiennych i twierdzenia Fubiniego,

\[ \lambda_3(B)=\lambda_3(\Phi(A))=\int_{A\times (0,2\pi)} |\det D\Phi|\, d\lambda_3 = \int_0^{2\pi}\lambda_2(A)\cdot\biggl( \frac{1}{\lambda_2(A)}\int_A x\, d\lambda_2 \biggr)\, dt\, . \]

Całka wewnętrzna

\[ \frac{1}{\lambda_2(A)}\int_A x\, d\lambda_2\, , \]

tzn. $ x $-owa współrzędna środka ciężkości $ s(A) $ zbioru $ A $, jest równa $ r $, odległości punktu $ s(A) $ od osi obrotu $ \{x=y=0\} $. Dlatego

\[ \lambda_3(B) = \int_0^{2\pi}\lambda_2(A)\cdot r\, dt\, = 2\pi r\cdot \lambda_2 (A)\, .   \]

Przykład [objętość torusa obrotowego] Niech $ R>r>0 $. Obracając wokół osi $ z $ koło $ K=\{(x,y,z)\colon (x-R)^2+z^2=r^2, y=0\} $ położone w płaszczyźnie $ y=0 $ otrzymamy pełny torus o objętości $ 2\pi R \cdot \pi r^2= 2\pi^2 Rr^2 $. To wynika z reguły Pappusa-Guldina: środek ciężkości koła $ K $ pokrywa się z jego geometrycznym środkiem i leży właśnie w odległości $ R $ od osi obrotu.
Zadanie Wyznaczyć środek ciężkości trójkąta prostokątnego i półkola. Sprawdzić znane wzory na objętość stożka, walca i kuli, posługując się regułą Guldina.

Przestrzeń $L^1$ funkcji całkowalnych

Definicja Niech $ (X,\F,\mu) $ będzie przestrzenią z miarą. Dla $ f\colon X\to \overline \R $ mierzalnej względem $ \mu $ połóżmy

\[ \begin{equation} 	\label{norm1}   	\|f\|_1 =\int_X |f|\, d\mu\, .   \end{equation} \]

Oczywiście, wielkość $ \|f\|_1 $ jest skończona wtedy i tylko wtedy, gdy funkcja $ |f| $ jest całkowalna na $ X $ względem miary $ \mu $. Nietrudno zauważyć, że gdy $ f,g $ są całkowalne, zaś $ \alpha\in \R $, to

\[ \big\|\alpha \cdot f\big\|_1=|\alpha|\cdot \|f\|_1, \qquad \|f+g\|_1\le \|f\|_1+\|g\|_1 \]

(druga nierówność wynika wprost z nierówności trójkąta $ |f+g|\le |f|+|g| $ i liniowości całki). Jednak, formalnie biorąc, odwzorowanie $ f\mapsto \|f\|_1 $ nie jest normą na przestrzni liniowej wszystkich funkcji całkowalnych, gdyż z równości $ \|f\|_1=0 $ nie wynika wcale, że $ f\equiv 0 $ - wynika stąd jedynie, że $ f=0 $ prawie wszędzie względem miary $ \mu $ na $ X $.

Aby ominąć tę drobną trudność i wyposażyć przestrzeń funkcji całkowalnych w naturalną normę norm1, określa się na zbiorze funkcji całkowalnych na $ X $ relację

\[ \begin{equation} 	\label{rownepw}     	f\sim g\qquad\mbox{wtedy i tylko wtedy, gdy}\qquad\mu\big(\{x\in X\colon f(x)\not= g(x)\}\big)=0.   \end{equation} \]

Nietrudno sprawdzić, że jest to relacja równoważności. Dwie funkcje są w relacji wtedy i tylko wtedy, gdy są równe $ \mu $-prawie wszędzie. To nie ma wpływu na wartość całki.

Definicja [przestrzeń funkcji całkowalnych] Symbolem $ L^1(X,\mu) $ oznaczamy zbiór klas abstrakcji relacji rownepw, określonej na zbiorze tych funkcji mierzalnych $ f\colon X\to \overline\R $, dla których $ \int_X |f|\, d\mu<\infty $.

Z formalnego punktu widzenia, wg. powyższej definicji elementy przestrzeni funkcji całkowalnych nie są funkcjami, tylko klasami abstrakcji relacji $ \sim $. W praktyce, utożsamia się funkcję $ f $ z jej klasą abstrakcji $ [f]_{\sim} $ i traktuje elementy $ L^1(X,\mu) $ jak funkcje. W typowych sytuacjach nie prowadzi to do żadnych nieporozumień.

Stwierdzenie Odwzorowanie $ f\mapsto \|f\|_1 $ jest normą na $ L^1(X,\mu) $.
Dowód: Jednorodność i nierówność trójkąta są oczywiste i już o nich mówiliśmy. Jeśli $ f\sim 0\in L^1(X,\mu) $, to $ f=0 $ prawie wszędzie i $ \|f\|_1=\int_X|f|\, d\mu=0 $. Na odwrót, jeśli $ \|f\|_1=\int_X|f|\, d\mu=0 $, to $ |f|=0 $ p.w., a więc $ f\sim 0 $, tzn. $ f=0\in L^1(X,\mu) $.□

Przestrzeń liniowa $ L^1(X,\mu) $ wyposażona w metrykę

\[ d(f,g)=\|f-g\|_1 \]

staje się przestrzenią metryczną. Ma miejsce następujący ważny fakt.

Twierdzenie [zupełność przestrzeni $ L^1 $] Przestrzeń $ L^1(X,\mu) $ z metryką $  d(f,g)=\|f-g\|_1  $ jest przestrzenią metryczną zupełną.
Dowód: Wykażemy, że jeśli ciąg $ (f_j)\subset L^1(X,\mu) $ spełnia warunek Cauchy'ego, to jest zbieżny do pewnej funkcji $ f\in L^1(X,\mu) $.

    Krok 1: identyfikacja funkcji $ f $. Korzystając z warunku Cauchy'ego, można wybrać podciąg $ f_{j_1},f_{j_2},f_{j_3},\ldots $ ciągu $ (f_j) $ taki, że

\[ \begin{equation} 	\label{2jdecay} 	\big\|f_{j_{k}}-f_{m}\big\|_1 < \frac{1}{2^k} \qquad\mbox{dla $m>j_k$, $k=1,2,3,\ldots$} \end{equation} \]

Połóżmy

\[ g_k = \sum_{s=1}^k |f_{j_{s+1}}-f_{j_s}|, \qquad g=  \sum_{s=1}^\infty |f_{j_{s+1}}-f_{j_s}|=\lim g_k. \]

Wobec 2jdecay i liniowości całki $ \|g_k\|_1<\frac 12+\cdots+\frac{1}{2^k}<1 $ dla każdego $ k\in \N $. Z lematu Fatou,

\[ \int_X |g|\, d\mu = \int_X \lim |g_k|\, d\mu = \int_X \liminf |g_k|\, d\mu \le \liminf \int_X |g_k|\, d\mu\le 1. \]

Zatem $ g\in L^1(X,\mu) $, więc z pewnością $ g $ jest skończona prawie wszędzie. Szereg, definiujący $ g $, jest więc zbieżny dla $ \mu $-prawie wszystkich $ x\in X $. Dlatego szereg

\[ \begin{equation} 	\label{SxL1} S(x)=\sum_{s=1}^\infty (f_{j_{s+1}}(x)-f_{j_s}(x))   \end{equation} \]

też jest zbieżny dla $ \mu $-prawie wszystkich $ x\in X $, gdyż jest bezwzględnie zbieżny p.w. Niech

\[ f(x)=\begin{cases} f_{i_1}(x)+S(x) & \text{gdy szereg \eqref{SxL1} jest zbieżny}\\ 0 & \text{wpp.}\end{cases} \]

Zauważmy, że na zbiorze pełnej miary w $ X $ (tam, gdzie szereg $ S(x) $ jest zbieżny) mamy

\[ f(x)=f_{i_1}(x) + \sum_{s=1}^\infty \big(f_{j_{s+1}}(x)-f_{j_s}(x)\big) = \lim_{k\to \infty} f_{j_k}(x)\, . \]

To wynika wprost z definicji sumy szeregu. Ponadto, raz jeszcze korzystając z lematu Fatou, otrzymujemy

\[ \begin{equation} 	\label{zbnapodc}     	\|f-f_{j_s}\|_1= \int_X \lim_{k\to\infty} |f_{j_k}-f_{j_s}|\, d\mu \le\liminf_{k\to\infty} \|f_{j_k}-f_{j_s}\|_1\le \frac {1}{2^s}.  \end{equation} \]

    Krok 2: zbieżność ciągu $ f_j $ do $ f $ w przestrzeni $ L^1 $. Ustalmy $ \eps>0 $. Wybierzmy indeks $ j_s $ tak, aby

\[ \frac{1}{2^s} <\frac \eps 2, \qquad \|f_l-f_m\|_1<\frac \eps{2}\quad\mbox{dla $m,l\ge j_s$.} \]

Wówczas, dla dowolnego $ m\ge j_s $ jest

\[ \|f-f_m\|_1\le \|f-f_{j_s}\|_1+\|f_{j_s}-f_m\|_1 \stackrel{\eqref{zbnapodc}}\le \frac 1{2^s}   +\|f_{j_s}-f_m\|_1 < \frac \eps 2 + \frac \eps 2 = \eps, \]

a więc, wprost z definicji granicy, $ f_m\to f $ w przestrzeni $ L^1(X,\mu) $.□

Odnotujmy oddzielnie ważny wniosek z pierwszej części powyższego dowodu.

Wniosek Jeśli $ f_m\to f $ w przestrzeni $ L^1(X,\mu) $, to ciąg $ (f_m) $ ma podciąg, który jest zbieżny do $ f $ prawie wszędzie na $ X $.□

Splot

W tym podrozdziale symbol $ L^1(\R^n) $ oznacza przestrzeń funkcji całkowalnych na $ \R^n $ względem miary Lebesgue'a $ \lambda_n $.

Definicja Splotem funkcji $ f,g\in L^1(\R^n) $ nazywamy funkcję

\[ f\ast g(\xx)=\int_{\R^n} f(\xx-\yy)g(\yy) \, d\lambda_n(\yy)\, . \]

Iloczyn dwóch funkcji całkowalnych wcale nie musi być funkcją całkowalną (przykład: $ f(x)=g(x)=1/\sqrt{x} $ na odcinku jednostkowym), więc nie jest rzeczą jasną, czy definicja splotu jest poprawna. (Łatwo natomiast zauważyć, że splot funkcji $ f\in L^1 $ z funkcją mierzalną, ograniczoną $ g $ jest dobrze określony.) Wykażemy jednak, że nie ma powodu do obaw.

Twierdzenie (#) Jeśli $ f,g\in L^{1}(\R^n) $, to ich splot $ f\ast g\in L^1(\R^n) $ i zachodzi nierówność

\[ \begin{equation}               		\label{5.46} 		\|f\ast g\|_1\le \|f\|_1 \cdot \|g\|_1\, . \end{equation} \]
Dowód: Czytelnik zechce samodzielnie sprawdzić, że $ \Phi(\xx,\yy)=|f(\xx-\yy)\cdot g(\yy)| $ jest funkcją mierzalną na $ \R^{2n} $. Wobec Twierdzenia Fubiniego i niezmienniczości miary Lebesgue'a względem przesunięć,

\[ \begin{equation} 	\label{splot11}  \begin{split} \int_{\R^{2n}}  |f(\xx-\yy)\cdot g(\yy)|\, d\lambda_{2n}(\xx,\yy)  &=  \int_{\R^n}\biggl(\int_{\R^n} |f(\xx-\yy)|\, d\lambda_n(\xx)\biggr)\,  |g(\yy)|\, d\lambda_n(\yy)\\  &=  \int_{\R^n} |f|\, d\lambda_n \cdot   \int_{\R^n} |g|\, d\lambda_n= \|f\|_1\cdot \|g\|_1\, ,   \end{split} \end{equation} \]

gdyż całka $ \int_{\R^n}|f(\xx-\yy)|\, d\lambda_n(\xx) $ nie zależy od $ \yy $. Z drugiej strony, wprost z definicji splotu $ f\ast g $, otrzymujemy

\[ \begin{eqnarray*} \big\||f|\ast |g| \big\|_1=\int_{\R^n} |f|\ast |g|\, d\lambda_n & = &\int_{\R^n} \biggl(\int_{\R^n}|f(\xx-\yy)\cdot g(\yy)|\, d\lambda_{n}(\yy)\biggr) d\lambda_n(\xx) \\&= &  \int_{\R^{2n}}  |f(\xx-\yy)\cdot g(\yy)|\, d\lambda_{2n}(\xx,\yy)\, \\ & \stackrel{\eqref{splot11}}= &  \|f\|_1\cdot \|g\|_1\, < \infty\, . \end{eqnarray*} \]

Zatem $ |f|\ast |g|\in L^1(\R^n) $ i, na mocy twierdzenia Fubiniego, całka $ \int_{\R^n}|f(\xx-\yy)\cdot g(\yy)|\, d\lambda_{n}(\yy) $, jest skończona dla prawie wszystkich $ \xx\in\R^n $.

Tezę w ogólny przypadku otrzymujemy natychmiast z nierówności $ |f\ast g|\le |f|\ast |g| $, która zachodzi, gdyż $ |\int_X h\,d\mu|\le \int_X |h|\, d\mu $ dla dowolnej przestrzeni z miarą. □

Stwierdzenie Dla $ f,g\in L^1(\R^n) $ jest $ f\ast g=g\ast f $.
Dowód: To łatwo wynika z twierdzenia o całkowaniu przez podstawienie: przy ustalonym $ \xx $ przekształcenie $ \yy\mapsto \zz=\xx-\yy $ jest dyfeomorfizmem $ \R^n $ na $ \R^n $, a moduł wyznacznika macierzy Jacobiego tego przekształcenia jest (oczywiście) równy 1. Dlatego

\[ f\ast g(\xx)=\int_{\R^n} f(\xx-\yy) g(\yy)\, d\lambda_n(\yy) = \int_{\R^n} f(\zz)g (\xx-\zz)\, d\lambda_n(\zz) = g\ast f(\xx). \]

Dowód jest zakończony.□

Podobnie można wykazać, że splot jest działaniem łącznym na $ L^1(\R^n) $, ma więc pożądane cechy `mnożenia'. Jest to jednak mnożenie bez jedynki:

Zadanie Wykazać, że nie istnieje funkcja $ \delta\in L^{1}(\R^n) $ taka, że $ \delta\ast f=f $ dla każdej $ f\in L^1(\R^n) $.     Wskazówka. Jaką wartość powinna mieć całka takiej funkcji $ \delta $? Na jakim zbiorze powinna zachodzić równość $ \delta=0 $?

Aproksymacja funkcji całkowalnych funkcjami gładkimi

(#)

Jednym z najważniejszych zastosowań splotu w różnych działach analizy jest aproksymowanie funkcji `nieporządnych' (tzn. być może bardzo nieregularnych) funkcjami znacznie `porządniejszymi', o lepszych własnościach. Wskażemy, jak się to robi.

Definicja [jedynka aproksymatywna] Niech $ \varphi\in C_0^\infty (B(\zero,1)) $ będzie nieujemną funkcją gładką o nośniku zawartym w kuli $ B(\zero, 1)\subset \R^n $, taką, że $ \int_{B(\zero,1)}\varphi\, d\lambda_1=1 $. Będziemy mówić, że rodzina funkcji

\[ 	\varphi_\eps(\xx)=\eps^{-n}\varphi\Big(\frac{\xx}{\eps}\Big), \qquad \xx\in \R^n, \quad \eps>0, 	\]

jest jedynką aproksymatywną.(#)

Lemat Jeśli $ h $ jest funkcją klasy $ C_0^\infty(\R^n) $, to dla każdej funkcji $ f\in L^1 $ splot $ f\ast h $ jest funkcją klasy $ C^\infty $. Ponadto, dla każdego wielowskaźnika $ \alpha $ zachodzi równość

\[ 	D^\alpha(f\ast h) = f\ast (D^\alpha h)\, . 	\]

Ostatnia równość oznacza po prostu, że różniczkowanie $ D^\alpha $ można bez obaw o wynik wprowadzić pod całkę, definiującą splot. Jest to możliwe dzięki twierdzeniu Lebesgue'a o zbieżności zmajoryzowanej.

Dowód: Ciągłość funkcji $ f\ast h $ oraz $ f\ast (D^\alpha h) $ łatwo wynika z twierdzenia o zbieżności zmajoryzowanej, gdyż każda funkcja gładka o zwartym nośniku jest ograniczona. Dowód równości z tezy lematu wystarczy przeprowadzić w przypadku, gdy $ \alpha $ jest wielowskaźnikiem długości $ |\alpha|=1 $, tzn. dla pochodnych cząstkowych pierwszego rzędu. Przypadek ogólny wynika stąd natychmiast przez indukcję.

Ustalmy $ j\in \{1,\ldots,n\} $ i punkt $ \xx\in \R^n $. Wówczas

\[ \begin{equation} 	\label{pochodnasplotu} 	 \frac{f\ast h(\xx+t\ee_j)-f\ast h(\xx)}t=\int_{\R^n} \frac{ h(\xx+t\ee_j-\yy)-h(\xx-\yy)}t f(\yy)\, d\lambda_n(\yy).   \end{equation} \]

Dla $ t\to 0 $ funkcje podcałkowe są punktowo zbieżne do $ \pcz {h}{x_j} (\xx-\yy)\cdot f(\yy) $. Nośnik funkcji gładkiej $ h $ jest zbiorem zwartym, dlatego wobec twierdzenia o wartości średniej

\[ \left|\frac{ h(\xx+t\ee_j-\yy)-h (\xx-\yy)}t\right| \le \frac{|t|\sup_{\mzz} \|Dh (\zz)\|}{|t|} =  \sup_{\mzz} \|Dh(\zz)\|=: C\, . \]

Można więc, korzystając z twierdzenia Lebesgue'a o zbieżności zmajoryzowanej, przejść do granicy $ t\to 0 $ pod całką po prawej stronie równości pochodnasplotu; daje to wynik

\[ \pcz {(f\ast h)}{x_j} (\xx)= \int_{\R^n} \pcz {h}{x_j} (\xx-\yy) f(\yy) \, d\lambda_n(\yy)=   \pcz {h}{x_j}\ast f(\xx)= f\ast \pcz {h}{x_j} (\xx) \]

(skorzystaliśmy, jak widać, z przemienności splotu). □

Wniosek Jeśli $ (\varphi_\eps) $ jest jedynką aproksymatywną, to dla każdej funkcji $ f\in L^1 $ i każdego $ \eps>0 $ splot $ f\ast\varphi_\eps\in C^\infty $ idla każdego wielowskaźnika $ \alpha $

\[ 	D^\alpha(f\ast \varphi_\eps) = f\ast (D^\alpha\varphi_\eps)\, . \]

(#)

Zobaczymy teraz, że splot $ f\ast \varphi_\eps $ funkcji $ f\in L^1 $ z jedynką aproksymatywną przybliża $ f $ w normie $ L^1 $. Zaczniemy od sprawdzenia tego w szczególnie prostej sytuacji.

Lemat Jeśli $ (\varphi_\eps) $ jest jedynką aproksymatywną, to dla każdej funkcji $ g\colon \R^n\to\R $ ciągłej na $ \R^n $ i znikającej poza pewną kulą $ B(\zero,r) $ mamy

\[ 	g\ast \varphi_\eps \rightrightarrows g \qquad\mbox{dla $\eps\to 0$} 	\]

jednostajnie na $ \R^n $. Ponadto, $ g\ast\varphi_\eps\to g $ w przestrzeni $ L^1(\R^n) $, gdy $ \eps\to 0 $. (#)

Dowód: Ustalmy liczbę $ \eta >0  $. Ponieważ funkcja $ g $ jest ciągła i znika poza pewnym zbiorem zwartym, więc jest jednostajnie ciągła na $ \R^n $. Dobierzmy $ \delta>0 $ tak, aby $ |g(\xx)-g(\zz)|<\eta $ dla $ \|\xx-\zz\|<\delta $. Niech $ \eps\in (0,\delta) $. Ponieważ nośnik funkcji $ \varphi_\eps $ jest zwarty w kuli $ B(0,\eps) $, aponadto $ \int \varphi_\eps=1 $, więc

\[ \begin{multline*} 	|g\ast\varphi_\eps(\xx)-g(\xx)| = \biggl|\int_{B(\zero, \eps)}g(\xx-\zz)\varphi_\eps(\zz)\, d\lambda_n(\zz)\, - \, g(\xx)\int_{B(\zero, \eps)}\varphi_\eps(\zz)\, d\lambda_n(\zz)\biggr|             \\ \le    \int_{B(\zero, \eps)}|g(\xx-\zz)-g(x)|\cdot \varphi_\eps(\zz)\, d\lambda_n(\zz)  < \eta  \int_{B(\zero,\eps)}\varphi_\eps(\zz)\, d\lambda_n(\zz)  = \eta\, . \end{multline*} \]

Zatem $ g\ast\varphi_\eps\rightrightarrows g $ wprost z definicji zbieżności jednostajnej. Ponieważ dla $ \eps<1 $ nośnik funkcji $ g\ast\varphi_\eps $ zawiera się w kuli $ B(\zero,r+1) $, więc ze zbieżności jednostajnej $ g\ast\varphi_\eps\rightrightarrows g $ wynika także zbieżność $ g\ast\varphi_\eps\to g $ w $ L^1(\R^n) $.□

Lemat Funkcje ciągłe o zwartym nośniku w $ \R^n $ tworzą zbiór gęsty w $ L^1(\R^n) $. (#)
Dowód: Ustalmy $ f\in L^1 $. Niech $ \eta>0 $ będzie dowolną liczbą. Przybliżając część dodatnią $ \plus f $ i część ujemną $ \minus f $ funkcji $ f $ niemalejącymi ciągami funkcji prostych (patrz Twierdzenie [link]), znajdziemy funkcję prostą $ h $ taką, że $ \|f-h\|_1<\eta $. Bez zmniejszenia ogólności, posługując się twierdzeniem o bezwzględnej ciągłości całki, można założyć, że $ h $ jest skończoną kombinacją liniową funkcji charakterystycznych zbiorów mierzalnych ograniczonych.

Z uwagi na nierówność trójkąta w $ L^1 $ wystarczy więc wykazać, że dla dowolnego $ \eps>0 $ i $ h=\charfn_A $, gdzie $ A\in \Leb(\R^n) $ jest zbiorem ograniczonym, istnieje funkcja ciągła $ g $, znikająca poza pewną kulą w $ \R^n $ i taka, że $ \|h-g\|_1<\eps $.

Z Twierdzenia [link] wynika, że istnieje zbiór zwarty $ K\subset A $ i zbiór otwarty $ \Omega\supset A $ takie, że $ \lambda_n(\Omega\setminus K)<\eps $. Z lematu Urysohna wynika, że istnieje funkcja ciągła $ g\colon \R^n\to [0,1] $ taka, że $ g\equiv 1 $ na $ K $ i $ g\equiv 0 $ na $ \R^n\setminus \Omega $. Mamy

\[ \|h-g\|_1=\int_{R^n}|\charfn_A-g|\, d\lambda_n = \int_{\Omega\setminus K}|\charfn_A-g|\, d\lambda_n  \le  \int_{\Omega\setminus K}1\, d\lambda_n    =\lambda_n(\Omega\setminus K) <\eps\, . \]

Dowód lematu jest zakończony.□

Możemy teraz łatwo wykazać zapowiedziane wcześniej twierdzenie o aproksymacji funkcji całkowalnych za pomocą splotu z jedynką aproksymatywną.

Twierdzenie Niech $ (\varphi_\eps)_{\eps>0} $ będzie jedynką aproksymatywną. Dla każdej funkcji $ f\in \L^1(\R^n) $ splot $ f\ast\varphi_\eps\to f $ w $ L^1(\R^n) $ dla $ \eps\to 0 $.
Dowód: Ustalmy $ f\in L^1(\R^n) $ i liczbę $ \eta>0 $. Posługując się Lematem [link], wybierzmy taką funkcję ciągłą o zwartym nośniku $ g\colon \R^n\to\R $, żeby $ \|f-g\|_1<\frac\eta 3 $. Z nierówności trójkąta,

\[ \|f\ast\varphi_\eps-f\|_{{L^1}}\le \|(f-g)\ast\varphi_\eps\|_{{L^1}} + \|g\ast\varphi_\eps-g\|_{{L^1}}   + \|g-f\|_{{L^1}}\, . \]

Trzeci składnik nie przekracza $ \eta/3 $ wskutek doboru $ g $. Drugi składnik jest mniejszy od $ \eta/3 $ dla wszystkich $ \eps $ dostatecznie małych wobec Lematu [link]. Wreszcie, dla każdego $ \eps>0 $, na mocy nierówności 5.46 z tezy Twierdzenia [link],

\[ \|(f-g)\ast\varphi_\eps\|_1\le \|f-g\|_1\cdot \|\varphi_\eps\|_1 = \|f-g\|_1 <\frac \eta/3. \]

Ostatecznie,

\[ \|f\ast\varphi_\eps-f\|_{{L^1}}<\frac \eta 3 +\frac \eta 3 +\frac \eta 3 = \eta\, . \]

Dowód twierdzenia jest zakończony. □

Często wygodnie jest wiedzieć, że funkcje całkowalne można aproksymować nie tylko funkcjami gładkimi, ale także funkcjami gładkimi o zwartym nośniku. Nietrudno to wywnioskować z ostatniego twierdzenia.

Wniosek Dla każdej funkcji $ f\in L^1(\R^n) $ i każdej liczby $ \eta>0 $ istnieje funkcja $ \psi \in C_0^\infty (\R^n) $ taka, że $ \|f-\psi\|_1<\eta $.
Dowód: Niech $ \zeta\colon \R^n\to [0,1] $ będzie ustaloną funkcją klasy $ C_0^\infty(\R^n) $, taką, że $ \zeta\equiv 1 $ na kuli $ B(\zero,1) $ i $ \zeta\equiv 0 $ poza kulą $ B(\zero,2) $. Połóżmy $ \zeta_R(\xx)=\zeta(\xx/R) $ dla $ \xx\in \R^n $ i $ R>0 $.

Ustalmy $ \eta>0 $ i dobierzmy $ \eps>0 $ tak, aby $ \|f-f\ast\varphi_\eps\|_1<\frac \eta 2 $. Nietrudno sprawdzić, że dla każdej funkcji $ g\in L^1 $ iloczyn $ g\cdot \zeta_R\to g $ w $ L^1 $ dla $ R\to\infty $. Istotnie,

\[ \|g\cdot \zeta_R- g \|_1=\int_{\R^n\setminus B(\zero,R)} |g\cdot \zeta_R- g|\, d\lambda_n \le 2 \int _{\R^n\setminus B(\zero,R)}  |g|\, d\lambda_n\to 0, \qquad R\to\infty\, , \]

gdyż $ \int_{B(\zero,R)}|g|\, d\lambda_n\to \int_{\R^n}|g|\, d\lambda_n<\infty $.

Zatem, dla odpowiedniego małego $ \eps>0 $ i odpowiednio dużego $ R>0 $ (dobranego do $ \eps $) jest

\[ \|f-\zeta_R\cdot (f\ast\varphi_\eps)\|_1\le \|f-f\ast\varphi_\eps\|_1+  \|f\ast\varphi_\eps-\zeta_R\cdot (f\ast\varphi_\eps)\|_1  <\frac \eta 2+ \frac \eta 2=\eta\, .  \]

Funkcja $ \zeta_R\cdot (f\ast\varphi_\eps) $ jest oczywiście gładka i ma zwarty nośnik. □

Twierdzenie Weierstrassa dla funkcji wielu zmiennych

Metodą bardzo podobną do opisanej w poprzednim podrozdziale można udowodnić ogólną wersję twierdzenia Weierstrassa o jednostajnej aproksymacji funkcji ciągłych wielomianami. Czytelnik zna ją już dla funkcji jednej zmiennej rzeczywistej.

Twierdzenie [Weierstrassa o jednostajnej aproksymacji funkcji ciągłych wielomianami] Niech $ K\subset\R^n $ będzie zbiorem zwartym. Dla każdej funkcji ciągłej $ f\colon K\to\R $ i każdej liczby $ \eps>0 $ istnieje wielomian $ P\colon \R^n\to\R $ taki, że

\[ \sup_{\mxx\in K} |f(\xx)-P(\xx)|<\eps. \]

(#)

W dowodzie wykorzystamy jako narzędzie splot. Posłużymy się tak zwanymi wielomianami Tonellego. Zbiór wszystkich funkcji ciągłych na $ K $ o wartościach rzeczywistych będziemy oznaczać symbolem $ C(K) $.

    Dowód. Ponieważ złożenie wielomianu z funkcją afiniczną $ \xx\mapsto \lambda \cdot \xx + \bb $ jest wielomianem, więc wystarczy wykazać twierdzenie przy dodatkowym założeniu $ K\subset B(\zero,\frac 14) $. Ustalmy $ f\in C(K) $. Korzystając z twierdzenia Tietzego o przedłużaniu możemy założyć, że $ f $ jest określona na całej przestrzeni $ \R^n $ i znika poza kulą $ B(\zero, \frac 12) $.

    Krok 1: definicja wielomianów Tonellego. Połóżmy

\[ \begin{gather*} t_N(\xx)= (1-\|\xx\|^2)^N, \qquad \xx\in \R^n, \quad N=1,2,\ldots,\\ d_{N,n}=\int_{B^n(\zero,1)}t_N(\xx)\, d\lambda_n(\xx)\\ \end{gather*} \]

Sprawdzimy, że

\[ \begin{equation} 	d_{N,n}\ge \frac{1}{N^n} \qquad\mbox{dla $N>n$.}\label{dnn} \end{equation} \]

W tym celu oszacujemy (Można wyrazić $ d_{N,n} $ przez funkcje $ \Gamma $ i $ B $ Eulera, posługując się regułą Cavalieri'ego.) całkę, definiującą $ d_{N,n} $, stosując twierdzenie Fubiniego (podobnie jak w dowodzie Twierdzenia [link]). Oznaczając $ \xx=(\xx',x_n) $, gdzie $ \xx'\in\R^{n-1} $, otrzymujemy po niezbyt skomplikowanym rachunku

\[ \begin{eqnarray} 	d_{N,n}&=&\int_{B^n(\zero,1)}t_N(\xx)\, d\lambda_n(\xx)\nonumber \\&=&\int_{-1}^1 \biggl(\int_{B^{n-1}(\zero,\sqrt{1-x_n^2})} (1-x_n^2-\|\xx'\|^2)^{N}\, d\lambda_{n-1}(\xx')\biggr)\, dx_n\nonumber\\ 	& = & \int_{-1}^1 (1-x_n^2)^N\biggl(\int_{B^{n-1}(\zero,\sqrt{1-x_n^2})} \biggl(1-\Big\|\frac{\xx'}{\sqrt{1-x_n^2}}\Big\|^2\biggr)^{N}\, d\lambda_{n-1}(\xx')\biggr)\, dx_n\nonumber\\ 	& = & \int_{-1}^1 (1-x_n^2)^{N+\frac{n-1}2}\biggl(\int_{B^{n-1}(\zero,1)} \Big(1-\|\yy'\|^2\Big)^{N}\, d\lambda_{n-1}(\yy')\biggr)\, dx_n\nonumber\\ & = & 2 d_{N,{n-1}}\int_{0}^1 (1-x_n^2)^{N+\frac{n-1}2} dx_n	\label{rekurw} 	 \end{eqnarray} \]

Dokonaliśmy wyżej linowej zamiany zmiennych: w wewnętrznej całce, przy ustalonym $ x_n $, podstawiliśmy $ \xx'=(1-x_n^2)^{1/2}\cdot \yy'  $; jest to przekształcenie liniowe przestrzeni $ \R^{n-1} $, a jego jakobian wynosi $ (1-x_n^2)^{(n-1)/2} $.

Ponieważ $ 1-x_n^2>1-x_n $ na $ (0,1) $, więc z rekurw otrzymujemy

\[ \begin{multline*} d_{N,n} = 2 d_{N,{n-1}}\int_{0}^1 (1-x_n^2)^{N+\frac{n-1}2} dx_n \ge 2 d_{N,{n-1}} \int_0^1 (1-x_n)^{N+\frac{n-1}2}\, dx_n\\ = \frac{2 d_{N,n-1}}{N+\frac{n-1}2}  > \frac{d_{N,n-1}}N\qquad\mbox{dla $N>n>\frac{n-1}2$.}  \end{multline*} \]

Stąd, przez indukcję,

$$d_{N,n}\ge \frac{d_{N,1}}{N^{n-1}}=\frac 2{N^{n-1}}\int_0^1(1-x^2)^N\, dx>\frac{2}{N^{n-1}}\int_0^1(1-x)^N\, dx=\frac{2}{(N+1)N^{n-1}}>N^{-n}.$$

Połóżmy teraz

\[ \begin{equation} 	\label{TNF} T_Nf(\xx) =\frac 1{d_{N,n}}\cdot  t_N\ast f(\xx)=\frac 1{d_{N,n}}\int_{\R^n} t_N(\xx-\zz) f(\zz)\, d\lambda_n(\zz), \qquad \xx\in B(\zero,\tfrac 12).  \end{equation} \]

Przy ustalonym $ \zz $ funkcja podcałkowa jest wielomianem zmiennej $ \xx=(x_1,\ldots,x_n) $. Dlatego funkcja $ T_Nf $ jest wielomianem zmiennej $ \xx $. Ponieważ $ f\equiv 0 $ poza kulą $ B(\zero,\frac 12) $, więc całkowanie w TNF odbywa się w istocie tylko po $ B(\zero,\frac 12) $. Jeśli $ \xx,\zz\in B(0,\frac 12) $, to $ \xx-\zz\in B(0,1) $. Dlatego, z przemienności splotu,

\[ \begin{equation} 	\label{TNF2} T_Nf(\xx) = \frac 1{d_{N,n}}\int_{B(\zero,1)} t_N(\yy) f(\xx-\yy)\, d\lambda_n(\yy) \end{equation} \]

    Krok 2. Zbieżność wielomianów Tonellego. Ustalmy $ \eps>0 $. Funkcja $ f $ jest jednostajnie ciągła na $ \R^n $, więc istnieje liczba $ \delta>0 $ taka, że dla $ \|\xx-\zz\|<\delta $ jest $ |f(\xx)-f(\zz)|<\eps $. Wprost z definicji funkcji $ t_N $ i liczb $ d_{N,n} $ otrzymujemy

\[ f(\xx)= f(\xx)\cdot \frac 1{d_{N,n}}\int_{B(\zero,1)} t_N(\yy) \,  d\lambda_n(\yy),  \]

więc dla dowolnego punktu $ \xx\in B(\zero,\frac 12) $ jest

\[ \begin{eqnarray*} |f(\xx)-T_N	f(\xx)| &=& \frac 1{d_{N,n}}\biggl|\int_{B(\zero,1)} t_N(\yy) \cdot \big(f(\xx)-f(\xx-\yy)\big)\, d\lambda_n(\yy)\biggr|\\ &\le & I_1 + I_2, \end{eqnarray*} \]

gdzie

\[ \begin{align*} I_1&=\frac1{d_{N,n}}\int_{\|\myy\|<\delta} t_N(\yy) \cdot \big|f(\xx)-f(\xx-\yy)\big|\, d\lambda_n(\yy)\, ,\\  I_2&=\frac 1{d_{N,n}}\int_{\delta\le\|\myy\|\le 1} t_N(\yy) \cdot \big|f(\xx)-f(\xx-\yy)\big|\, d\lambda_n(\yy)\, . \end{align*} \]

Całkę $ I_2 $ szacujemy brutalnie, zastępując moduł różnicy sumą modułów, a następnie uwzględniamy oszacowanie dnn liczb $ d_{N,n} $. Oto efekt:

\[ \begin{eqnarray*} I_2&\le & 2\sup |f| \cdot \frac 1{d_{N,n}}\int_{\delta\le\|\myy\|\le 1} t_N(\yy) \, d\lambda_n(\yy)\\ & \le & 2\sup |f|\cdot  N^n \int_{\delta\le\|\myy\|\le 1} (1-\delta^2)^N \, d\lambda_n(\yy)\\ & \le & 2\omega_n\sup |f| \cdot N^n (1-\delta^2)^N\to 0\qquad\mbox{dla $N\to\infty$.} \end{eqnarray*} \]

Dlatego całka $ I_2<\eps $ dla wszystkich $ N>N_0=N_0(\eps,f,\delta,n) $; uzyskane oszacowanie $ I_2 $ jest jednostajne względem $ \xx $, więc oczywiście $ N_0 $ nie zależy\/ od $ \xx\in B(\zero,\frac 12) $.

Szacując $ I_1 $, zauważamy, że w tej całce czynnik $ \big|f(\xx)-f(\xx-\yy)\big| $ jest mały wskutek doboru liczby $ \delta $. Dlatego

\[ \begin{eqnarray*} I_1&\le & \frac\eps{d_{N,n}}\int_{\|\myy\|<\delta} t_N(\yy)  \, d\lambda_n(\yy)\\ &\le & \frac\eps{d_{N,n}}\int_{B(\zero,1)} t_N(\yy)  \, d\lambda_n(\yy) = \eps \qquad\mbox{dla wszystkich $N\in \N$ i  $\xx\in B(\zero,\frac 12)$.} \end{eqnarray*} \]

Ostatecznie więc, $ \sup_{\mxx\in B(\zero,1/2)}|f(\xx)-T_N	f(\xx)| <2\eps $ dla wszystkich $ N>N_0 $. □

Czytelnik, który pamięta jeszcze definicję wielomianów Bernsteina i dowód twierdzenia Weierstrassa dla przestrzeni $ C\big([0,1]\big) $, może zwrócić uwagę na podobieństwo obu dowodów. Mówiąc niezbyt precyzyjnie, uśredniamy w nich wartości $ f $ względem pewnej miary unormowanej (inaczej: probabilistycznej) $ \mu_N $, dobranej tak, aby wynik uśrednienia był wielomianem stopnia zależnego od $ N $. Dla dużych $ N $ miara $ \mu_N $ jest niemal skoncentrowana w jednym punkcie. Oszacowanie różnicy między funkcją $ f $ i wielomianem, który powstaje w wyniku jej uśredniania, wykonane jest w obu dowodach tym samym sposobem. Osoba, zainteresowana analizą, zetknie się z taką metodą szacowania sum lub całek wwielu innych zagadnieniach.