11 Rozkłady warunkowe
Zobaczymy teraz jak koncepcja prawdopodobieństwa warunkowego współgra z koncepcjami wartości oczekiwanej i rozkładu zmiennej losowej. Niech \((\Omega, \mathcal{F}, \mathbb{P})\) będzie przestrzenią probabilistyczną. Rozważać będziemy zdarzenie \(A\) o dodatnim prawdopodobieństwie. Przypomnijmy, że definiujemy prawdopodobieństwo warunkowe pod warunkiem zajścia zdarzenia \(A\) poprzez \[\begin{equation*} \mathbb{P}[B | A] = \frac{\mathbb{P}[A\cap B]}{\mathbb{P}[A]}, \qquad B \in \mathcal{F}. \end{equation*}\]
Definicja 11.1 Niech \(\vec{X}\) będzie \(d\)-wymiarowym wektorem losowym. Rozkładem warunkowym \(\vec{X}\) pod warunkiem zajścia zdarzenia \(A\) nazywamy miarę probabilistyczną \(\mu_{\vec{X}|A}\) na \(\mathbb{R}^d\) zadaną przez \[\begin{equation*} \mu_{\vec{X}|A}(B) = \mathbb{P} \left[\left. \vec{X} \in B \right| A \right], \qquad B \in \mathcal{B}or\left(\mathbb{R}^d\right). \end{equation*}\]
Zauważmy, że powyższa konstrukcja nie różni się znacząco od rozkładu \(\mu_{\vec{X}}\) wektora losowego \(\vec{X}\). Można wręcz powiedzieć, że jest taka sama. Istotnie, zauważmy, że funkcja zbioru \(\mathbb{P}[\cdot |A]\) jest miarą probabilistyczną na \((\Omega, \mathcal{F})\). Mamy w takim przypadku dwie miary probabilistyczne na \(\Omega\). Są nimi wyjściowe prawdopodobieństwo \(\mathbb{P}[\cdot]\) oraz prawdopodobieństwo warunkowe \(\mathbb{P}[\cdot|A]\). Wektor losowy \(\vec{X} \colon \Omega \to \mathbb{R}^d\) ma więc dwa opisy probabilistyczne (rozkłady) w zależności od tego która z przestrzeni probabilistycznych \[\begin{equation*} (\Omega, \mathcal{F}, \mathbb{P}), \qquad (\Omega, \mathcal{F}, \mathbb{P}[\cdot | A]) \end{equation*}\] jest aktualnie rozważana. Oznacza to, że wszystkie związki między \(\mathbb{P}\) a \(\mu_{\vec{X}}\) zachodzą też między \(\mathbb{P}[\cdot|A]\) a \(\mu_{\vec{X}|A}\). Jednym z najczęściej spotykanych przykładów jest związek między wartością oczekiwaną a całką względem rozkładu.
Definicja 11.2 Niech \(X\) będzie zmienną losową posiadającą wartość oczekiwaną. Warunkową wartością oczekiwaną pod warunkiem zajścia zdarzenia \(A\) nazywamy \[\begin{equation*} \mathbb{E}[X | A] = \int_\Omega X(\omega) \mathbb{P}[\mathrm{d}\omega |A]. \end{equation*}\]
Według powyższej definicji \(\mathbb{E}[X|A]\) jest po prostu całką z funkcji \(X\) względem miary \(\mathbb{P}[\cdot |A]\). Oznacza to, że dla dowolnej funkcji borelowskiej \(\varphi \colon \mathbb{R} \to \mathbb{R}\) zachodzi \[\begin{equation*} \mathbb{E} [\varphi(X) | A] = \int_\mathbb{R} \varphi(s) \mu_{X|A}(\mathrm{d}s). \end{equation*}\] Powyższa dyskusja pokazuje, że pod kątem teoretycznym rozkłady warunkowe mają taką samą naturę jak zwykłe rozkłady poznane wcześniej. W praktyce jednak operacja warunkowania istotnie zmienia własności probabilistyczne zmiennych losowych.
Przykład 11.1 Rzucamy nieskończenie wiele razy symetryczną monetą. Niech \(X\) będzie liczbą rzutów potrzebnych do otrzymania pierwszego orła. Interesuje nas rozkład \(X\) pod warunkiem zdarzenia \(A\), że w pierwszych \(n\) rzutach pojawił się (co najmniej jeden) orzeł. Zauważmy najpierw, że \(A = \{ X \leq n\}\). Chcąc wyznaczyć rozkład \(X\) wystarczy wyznaczyć prawdopodobieństwa zdarzeń \(\{X=k\}\) względem prawdopodobieństwa warunkowego. Zauważmy, że \[\begin{equation*} \mathbb{P}[X \leq n] = 1-\mathbb{P}[X > n] = 1-2^{-n}. \end{equation*}\] Dla \(k \leq n\) mamy \[\begin{equation*} \mathbb{P}[X =k | A] = \frac{2^{-k}}{1-2^{-n}} \end{equation*}\] oraz \(\mathbb{P}[X =k | A] = 0\) dla \(k>n\). Dla porównania \(\mathbb{P}[X=k] = 2^{-k}\). Warunkowanie zmienia tylko prawdopodobieństwo o stałą na pierwszych \(n\) liczbach naturalnych.
Przykład 11.2 Ponownie rzucamy symetryczną monetą. Niech \(X\) będzie liczbą rzutów potrzebną do otrzymania pierwszego orła. Tym razem niech \(A\) będzie zdarzeniem, że w pierwszych \(n\) rzutach pojawił się dokładnie jeden orzeł. Wówczas \[\begin{equation*} \mathbb{P}[A] = n 2^{-n}. \end{equation*}\] Dla \(k\leq n\), \[\begin{equation*} \mathbb{P}[X = k|A] = \frac{2^{-n}}{n2^{-n}} = \frac 1n. \end{equation*}\] Tym razem warunkowanie całkowicie zmieniło charakter rozkładu. Rzeczywiście, pod warunkiem \(A\) zmienna \(X\) ma rozkład jednostajny na \([n] = \{1, 2, \ldots , n\}\).