Aksjomatyka Rachunku Prawdopodobieństwa

Aksjomatyka Rachunku Prawdopodobieństwa

Celem tego rozdziału jest formalne wprowadzenie podstawowych pojęć z teorii prawdopodobieństwa i zbadanie ich podstawowych własności. Przypuśćmy, że wykonujemy pewien eksperyment losowy. Powstaje natychmiast pytanie: w jaki sposób opisać go matematycznie?

Jak to czyniliśmy we wstępie, na pewno możemy mówić o jego potencjalnych ,,najdrobniejszych'' wynikach, które będziemy nazywać zdarzeniami elementarnymi. Zbiór wszystkich zdarzeń elementarnych oznaczamy literą $ \Omega $, a do oznaczenia zdarzeń elementarnych będziemy zazwyczaj używać litery $ \omega $.

Przykłady:

1. Rzut monetą: możliwe dwa wyniki: $ \Omega=\{O,R\}. $

2. Rzut kostką: możliwe sześć wyników: $ \Omega=\{1,2,3,4,5,6\} $.

Jak widzieliśmy w poprzednim rozdziale, często nie interesuje nas tyle konkretny wynik $ \omega $, ale raczej to, czy należy on do wcześniej ustalonego podzbioru zbioru $ \Omega $. Takie podzbiory nazywamy zdarzeniami i oznaczamy literami $ A $, $ B $, $ C $, $ \ldots $.

Przykłady, c.d.:

3. Rzucamy dwa razy kostką, $ A $ - suma oczek wynosi $ 4 $. Wówczas

$$\Omega=\big\{(i,j): i,\,j\in \{1,2,3,4,5,6\}\big\}\quad \mbox{ i }\quad A=\{(1,3),(2,2), (3,1)\}.$$

4. Rzucamy monetą aż do wypadnięcia orła, $ A $ - wykonano co najwyżej trzy rzuty. Pojedyncze doświadczenie sprowadza się do ciągu rzutów monetą, zakończonego w momencie uzyskania orła. Jako pojedynczy wynik możemy więc wziąć ciąg wyników uzyskanych w kolejnych rzutach:

$$ \Omega=\big\{(O),(R,O),(R,R,O),(R,R,R,O),\ldots\big\}.$$

Wówczas interesujące nas zdarzenie odpowiada podzbiorowi

$$ A=\big\{(O),(R,O),(R,R,O)\big\}.$$

5. Obrót tarczy w ruletce, $ A $ - strzałka zatrzymuje się w drugiej ćwiartce. Wówczas $ \Omega=[0,2\pi) $ i $ A=[\pi/2,\pi]. $

Szczególne zdarzenia, interpretacje działań i relacji na zdarzeniach:

  • $ \Omega $ - zdarzenie pewne,
  • $ \emptyset $ - zdarzenie niemożliwe,
  • $ A \cap B $ - zaszły oba zdarzenia $ A $, $ B $,
  • $ A \cap B=\emptyset $ - zdarzenia się wykluczają (są rozłączne),
  • $ A \cup B $ - zaszło $ A $ lub $ B $,
  • $ A' $ - nie zaszło $ A $ ($ A' $ nazywamy zdarzeniem przeciwnym do $ A $, bądź dopełnieniem zbioru $ A $),
  • $ A \setminus B=A \cap B' $ - zaszło $ A $ i nie zaszło $ B $,
  • $ A \subseteq B $ - $ A $ pociąga za sobą $ B $.\\

Przejdźmy teraz do kolejnego ważnego zagadnienia. Załóżmy, że $ \Omega $ jest ustalonym zbiorem i spróbujmy się zastanowić, jakie podzbiory $ \Omega $ będą/mogą nas interesować w dalszych rozważaniach; klasę tych ,,dopuszczalnych'' podzbiorów oznaczmy przez $ \F $. Na pierwszy rzut oka problem ten wydaje się nie mieć sensu: dlaczego nie możemy po prostu mieć możliwości badania wszystkich możliwych podzbiorów, tzn. dlaczego nie położymy $ \F=2^\Omega $? Otóż okazuje się, iż wybór ten dobrze się sprawdza w sytuacji gdy $ \Omega $ jest zbiorem co najwyżej przeliczalnym. Z drugiej strony, dla $ |\Omega|>\aleph_0 $ klasa $ 2^\Omega $ jest na ogół zbyt duża - w wielu naturalnych kontekstach pojawiają się kłopoty z określeniem na niej prawdopodobieństwa. To w konsekwencji wymusza wybór pewnej właściwej jej podrodziny. Jak wybrać taką podrodzinę? Sensowna klasa $ \F $ powinna być zamknięta na branie przeliczalnych sum, iloczynów i zdarzenia przeciwnego, tak, by móc wykonywać podstawowe operacje (por. lista działań powyżej). To zaś prowadzi do postulatu, iż $ \mathcal{F} $ jest pewnym wyróżnionym $ \sigma $-ciałem podzbiorów $ \Omega $. Przypomnijmy odpowiednią definicję.

Definicja Rodzinę $ \F $ podzbiorów $ \Omega $ nazywamy $ \sigma $-ciałem, jeśli

\[  \begin{split} \mbox{(i)} & \,\quad\emptyset \in \F,\\ (ii) & \quad\, A \in \F \Rightarrow A'\in \F,\\ (iii) &\quad A_1,\,A_2,\,\ldots \in \F \Rightarrow \bigcup_{n=1}^\infty A_n \in \F. \end{split}  \]

Parę $ (\Omega,\F) $ nazywamy przestrzenią mierzalną.

Przechodzimy teraz do określenia prawdopodobieństwa: obiekt ten będzie zadany przez szereg własności i postulatów. Aby zyskać nieco intuicji dotyczącej tego pojęcia, jak również zrozumieć, skąd biorą się odpowiednie założenia, wygodnie najpierw rozważyć tzw. częstość zdarzeń (por. poprzedni rozdział). Załóżmy, iż w pewnym doświadczeniu interesuje nas prawdopodobieństwo zajścia pewnego zdarzenia $ A $. Powtórzmy to doświadczenie $ n $ razy i zdefiniujmy

$$ \rho_n(A)=\frac{\mbox{liczba doświadczeń w których zaszło $A$}}{n}.$$

Jest to częstość względna zajścia zdarzenia $ A $ w serii $ n $ doświadczeń; spodziewamy się, iż dla dużych $ n $ liczba $ \rho_n(A) $ powinna być bliska szansie zajścia zdarzenia $ A $ w pojedynczym doświadczeniu. Jak łatwo sprawdzić, $ \rho_n $ przyjmuje wartości w przedziale $ [0,1] $ oraz posiada następujące własności:

\[  \begin{split} \mbox{(i)} &\quad \rho_n (\Omega)=1,\\ \mbox{(ii)} & \mbox{ jeśli }A_1,\,A_2,\ldots \mbox{ są parami rozłączne, to }\rho_n\left(\bigcup_{k=1}^\infty A_k\right)=\sum_{k=1}^\infty \rho_n(A_k). \end{split}  \]

Prowadzi to do następującej definicji.

Definicja [Aksjomatyka Kołmogorowa] Niech $ (\Omega,\F) $ będzie ustaloną przestrzenią mierzalną. Funkcję $ \P:\F \to [0,1] $ nazywamy prawdopodobieństwem, jeśli

\[  \begin{split} \mbox{(i)} &\quad \P(\Omega)=1,\\ \mbox{(ii)} & \text{ dla dowolnych parami rozłącznych }A_1,\,A_2,\,\ldots \in \F \text{ zachodzi }\\ &\qquad \qquad \qquad  \P\left(\bigcup_{k=1}^\infty A_k\right)=\sum_{k=1}^\infty \P(A_k). \end{split}  \]

Trójkę $ (\Omega,\F,\P) $ nazywamy przestrzenią probabilistyczną.

Uwagi:

1. Prawdopodobieństwo jest więc miarą unormowaną na $ (\Omega,\F) $. Czasami będziemy mówić, że $ \mathbb{P} $ jest miarą probabilistyczną.

2. Należy pamiętać, iż przy modelowaniu konkretnego doświadczenia losowego wybór przestrzeni probabilistycznej zależy tylko od nas. W wielu sytuacjach z warunków doświadczenia wynikają pewne postulaty, które w mniej czy bardziej jednoznaczny sposób zadają trójkę $ (\Omega,\F,\P) $; czasami jednak tak nie jest (por. paradoks Bertranda poniżej).

Twierdzenie [Własności prawdopodobieństwa] Załóżmy, że $ (\Omega,\F,\P) $ jest przestrzenią probabilistyczną oraz $ A,\,B, $ $ A_1,\,A_2 $, $ \ldots $ $ \in \F $. Wówczas

\[  \begin{split} \mbox{(i)} & \,\, \P(\emptyset)=0.\\ \mbox{(ii)} & \,\, \text{Jeśli $A_1,\,A_2,\,\ldots, A_n$ są parami rozłączne, to } \P\left(\bigcup_{i=1}^n A_i\right)=\sum_{i=1}^n \P(A_i).\\ \mbox{(iii)} &\,\, \P(A')=1-\P(A).\\ \mbox{(iv)} & \,\,\text{Jeśli }A \subseteq B,\text{ to }\P(B\setminus A)=\P(B)-\P(A)\mbox{ oraz }\P(A)\leq \P(B).\\ \mbox{(v)} & \,\, \P(A \cup B)=\P(A)+\P(B)-\P(A\cap B).\\ \mbox{(vi)} & \,\, \P\left(\bigcup_{i=1}^\infty A_i\right) \leq \sum_{i=1}^\infty \P(A_i). \end{split}  \]

Własność (v) z powyższego twierdzenia można uogólnić na przypadek skończonej liczby zbiorów. Zachodzi następujący fakt.

Twierdzenie [Wzór właczeń i wyłączeń] Jeśli $ A_1,\,A_2,\,\ldots,\,A_n\in \F $, to

\[  \begin{split}  \P(A_1\cup A_2\cup \ldots \cup A_n)=&\sum_{i=1}^n \P(A_i)-\sum_{i< j} \P(A_i\cap A_j)+\sum_{i< j<k} \P(A_i\cap A_j\cap A_k)-\ldots\\ & +(-1)^{n+1}\P(A_1\cap A_2\cap \ldots \cap A_n). \end{split}  \]

Dowody powyższych dwóch twierdzeń są bardzo proste i opieraja się na wykorzystaniu aksjomatyki Kołmogorowa. Szczegóły pozostawiamy czytelnikowi.

Twierdzenie [Twierdzenie o ciągłości] Załóżmy, że $ (\Omega,\F,\P) $ jest przestrzenią probabilistyczną oraz $ (A_n)_{n=1}^\infty $ jest ciągiem zdarzeń.

(i) Jeśli ciąg ten jest wstępujący (tzn. $ A_1\subseteq A_2\subseteq \ldots $), to

$$ \P\left( \bigcup_{n=1}^\infty A_n\right)=\lim_{n\to \infty} \P(A_n).$$

(ii) Jeśli ciąg ten jest zstępujący (tzn. $ A_1\supseteq A_2\supseteq \ldots $), to

$$ \P\left( \bigcap_{n=1}^\infty A_n\right)=\lim_{n \to \infty} \P(A_n).$$
Dowód:[Dowód:] (i) Rozważmy ciąg $ (B_n)_{n\geq 1} $ zdarzeń, zadany przez

$$ B_1=A_1,\,\,\,B_2=A_2\setminus A_1,\,\,\,B_3=A_3\setminus A_2,\,\,\,\ldots.$$

Jak łatwo sprawdzić, zdarzenia $ B_1,\,B_2,\,\ldots $ są parami rozłączne, $ \bigcup_{n=1}^k B_n=A_k $ dla dowolnego $ k\geq 1 $ oraz $ \bigcup_{n=1}^\infty B_n=\bigcup_{n=1}^\infty A_n $. Zatem \begin{align*} \P\left( \bigcup_{n=1}^\infty A_n\right)&=\P\left( \bigcup_{n=1}^\infty B_n\right)\\ &=\sum_{n=1}^\infty \mathbb{P}(B_n)=\lim_{k\to \infty}\sum_{n=1}^k \mathbb{P}(B_n)=\lim_{k\to \infty}\mathbb{P}\left(\bigcup_{n=1}^k B_n\right)=\lim_{k\to\infty}\mathbb{P}(A_k), \end{align*} gdzie w drugim przejściu korzystaliśmy z przeliczalnej addytywności miary $ \mathbb{P} $, a w czwartym skorzystaliśmy z Twierdzenia 1 (ii).

(ii) Ciąg dopełnień $ (A_n')_{n\geq 1} $ jest wstępujący, a zatem, korzystając z (i) oraz z praw de Morgana, mamy \begin{align*} \P\left( \bigcap_{n=1}^\infty A_n\right)&=1-\P\left(\left( \bigcap_{n=1}^\infty A_n\right)'\right)\\ &=1-\P\left( \bigcup_{n=1}^\infty A_n'\right)=1-\lim_{n\to\infty}\mathbb{P}(A_n')=\lim_{n\to\infty}\mathbb{P}(A_n).\qedhere \end{align*} □

Omówimy teraz kilka podstawowych przykładów, pojawiających się w wielu naturalnych i typowych zagadnieniach.

Przykłady:

1. (Schemat klasyczny, prawdopodobieństwo klasyczne). Załóżmy, że $ \Omega $ jest zbiorem skończonym, $ \F=2^\Omega $ i wszystkie zdarzenia jednoelementowe są jednakowo prawdopodobne. Wówczas, jak łatwo sprawdzić, dla dowolnego $ A \in \F $,

$$ \P(A)=\frac{|A|}{|\Omega|}. $$

2. Załóżmy, że $ \Omega=\{\omega_1,\omega_2,\ldots\} $ jest zbiorem co najwyżej przeliczalnym oraz $ p_1,\,p_2,\,\ldots $ - liczby nieujemne o sumie $ 1 $. Wówczas wybór $ \F=2^\Omega $ oraz $  \P(\{\omega_i\})=p_i $, $ i=1,\,2,\,\ldots $, jednoznacznie zadaje przestrzeń probabilistyczną $ (\Omega,\F,\mathbb{P}) $: dla każdego $ A \in \F $ mamy

$$ \P(A)=\sum_{i} 1_{A}(\omega_i)p_i,$$

gdzie $ 1_A $ to funkcja wskaźnikowa (charakterystyczna) bądź indykator zbioru $ A $:

$$ 1_A(\omega)=\begin{cases} 1 & \text{jeśli }\omega \in A,\\ 0 & \text{jeśli }\omega \notin A. \end{cases}$$

3. (Prawdopodobieństwo geometryczne). Załóżmy, że $ \Omega\in \mathcal{B}(\R^d) $, tzn. $ \Omega $ jest podzbiorem borelowskim $ \R^d $, przy czym $ 0<|\Omega|<\infty $ (tu $ |\cdot| $ oznacza miarę Lebesgue'a w $ \R^d $). Niech $ \mathcal{F}=\mathcal{B}(\Omega) $ będzie $ \sigma $-ciałem podzbiorów borelowskich $ \Omega $, a miara probabilistyczna $ \mathbb{P} $ będzie zadana przez

$$ \mathbb{P}(A)=\frac{|A|}{|\Omega|}.$$

Wówczas trójka $ (\Omega,\F,\mathbb{P}) $ jest przestrzenią probabilistyczną. Przestrzeń tę wykorzystujemy do modelowania doświadczenia polegającego na losowaniu punktu ze zbioru $ \Omega $.

4. (Paradoks Bertranda) Z okręgu o promieniu $ 1 $ wylosowano cięciwę $ AB $. Jakie jest prawdopodobieństwo tego, że będzie ona dłuższa niż bok trójkąta równobocznego wpisanego w ten okrąg?

Przedstawimy trzy rozwiązania.

I) Ze względu na niezmienniczość okręgu na obroty, wylosowanie cięciwy $ AB $ możemy utożsamić z wylosowaniem miary kąta środkowego $ \alpha=\angle AOB \in [0,2\pi) $. Tak więc $ \Omega=[0,2\pi) $, $ \F=\mathcal{B}(\Omega) $ oraz $ \P $ jest prawdopodobieństwem geometrycznym. Cięciwa spełnia warunki zadania wtedy i tylko wtedy, gdy $ \alpha \in (2\pi/3,4\pi/3) $, a zatem szukane prawdopodobieństwo wynosi

$$ \mathbb{P}((2\pi/3,4\pi/3))=\frac{|(2\pi/3,4\pi/3)|}{|[0,2\pi)|}=\frac{1}{3}.$$

II) Wylosowanie cięciwy można utożsamić z wylosowaniem jej środka. Mamy więc $ \Omega=B(0,1) $, $ \F=\mathcal{B}(\Omega) $ i $ \P $ jest prawdopodobieństwem geometrycznym. Cięciwa będzie spełniała żądane warunki wtedy i tylko wtedy, gdy jej środek będzie leżał wewnątrz koła o promieniu $ 1/2 $ współśrodkowego z danym okręgiem, zatem szukane prawdopodobieństwo wynosi

$$ \P([0,1/2))=\frac{|B(0,1/2)|}{B(0,1)}=\frac{1}{4}.$$

III) Tak jak w poprzednim rozwiązaniu, bierzemy pod uwagę położenie środka cięciwy, lecz tym razem patrzymy na jego odległość od środka okręgu. Tak więc $ \Omega=[0,1] $, $ \F=\mathcal{B}(\Omega) $ i $ \P $ jest prawdopodobieństwem geometrycznym. Cięciwa będzie spełniała warunki zadania jeśli jej środek będzie odległy od środka okręgu o mniej niż $ 1/2 $. Zatem szukane prawdopodobieństwo wynosi

$$ \mathbb{P}([0,1/2))=\frac{|[0,1/2)|}{|[0,1]|}=\frac{1}{2}.$$

Tak więc widzimy, iż otrzymaliśmy trzy różne wyniki, stąd wyraz ,,paradoks'' powyżej. Sprzeczności jednak tu nie ma - użyliśmy trzech różnych przestrzeni probabilistycznych do opisu tego samego doświadczenia losowego. Ogólnie rzecz ujmując, teoria prawdopodobieństwa nie rozstrzyga, jaki model doświadczenia należy wybrać; pozwala ona obliczać prawdopodobieństwa zdarzeń dopiero w sytuacji, gdy zadano już konkretną trójkę $ (\Omega,\F,\mathbb{P}) $.

Zadania

1. Na ile sposobów można ustawić w ciąg sześć jedynek, pięć dwójek oraz cztery trójki?

2. Wyznaczyć liczbę rozwiązań równania $  x_1+x_2+x_3+x_4=50 $

  • w liczbach całkowitych nieujemnych $ x_1,\ x_2,\ x_3,\ x_4 $,
  • w liczbach całkowitych dodatnich $ x_1,\ x_2,\ x_3,\ x_4 $.

3. Ile jest takich ,,szóstek'' w Totolotku, że żadne dwie z wylosowanych liczb nie są kolejne?

4. Z talii 52 kart wylosowano 13 kart. Jakie jest prawdopodobieństwo tego, że istnieje kolor, w którym a) dokładnie siedem, b) dokładnie sześć kart jest tego samego koloru?

5. Klasa liczy 15 uczniów. Nauczyciel wybiera na każdej lekcji na chybił trafił jednego ucznia do odpowiedzi. Obliczyć prawdopodobieństwo tego, że w ciągu 16 lekcji każdy uczeń będzie przepytany.

6. W szafie jest $ n $ par butów. Wyjmujemy na chybił trafił $ k $ butów $ (k\leq n) $. Obliczyć prawdopodobieństwo tego, że

  • wśród wyjętych butów jest co najmniej jedna para,
  • wśród wyjętych butów jest dokładnie jedna para.

7. $ (\Omega,\mathcal{F},P) $ jest przestrzenią probabilistyczną, $ A,\ B,\ C\in\mathcal{F} $.

  • Załóżmy, że $ P(A\cup B)=1/2,\ P(A\cap B)=1/4,\ P(A\backslash B)=P(B  \backslash A) $. Obliczyć $ P(A) $ oraz $ P(B \backslash A) $.

  • Załóżmy, że $ A\cup B \cup C=\Omega,\ P(B)=2P(A),\ P(C)=3P(A),\ P(A\cap  B)=P(A\cap C)=P(B \cap C) $. Wykazać, że $ 1/6 \leq P(A) \leq 1/4 $.
  • Załóżmy, że $ P(A)\geq 2/3,\ P(B)\geq 2/3,\ P(C)\geq 2/3,\ P(A\cap B\cap  C)=0 $. Obliczyć $ P(A) $.

8. Rozdano $ 52 $ karty czterem graczom, po $ 13 $ kart każdemu. Jakie jest prawdopodobieństwo, że każdy z graczy ma co najmniej jednego pika?

9. Jest $ N $ listów i $ N $ zaadaresowanych kopert z różnymi adresami. Każdy list odpowiada dokładnie jednemu adresowi i na odwrót. Włożono listy do kopert na chybił trafił, po jednym liście do każdej koperty. Obliczyć prawdopodobieństwo, że żaden list nie trafił do właściwej koperty.

10. Udowodnić, że każde nieskończone $ \sigma $-ciało jest nieprzeliczalne.

11. Kij o długości $ 1 $ złamano losowo w dwóch punktach. Jakie jest prawdopodobieństwo, że z powstałych trzech odcinków można zbudować trójkąt?

12. Na nieskończoną szachownicę o boku 1 rzucono monetę o średnicy $ \frac{2}{3} $. Jakie jest prawdopodobieństwo, że a) moneta znajdzie się całkowicie we wnętrzu jednego z pól; b) przetnie się z dwoma bokami szachownicy?

13. Na płaszczyznę podzieloną na nieskończone pasy o szerokości $ d $ rzucono losowo igłę o długości $ \ell $ ($ \ell<d $). Wyznaczyć prawdopodobieństwo tego, że igła przetnie brzeg któregoś pasa.