28 Tempo zbieżności w CTG
Centralne twierdzenie graniczne mówi, że dla ciągu niezależnych zmiennych \(\{X_n\}_{n \in \mathbb{N}}\) o tym samym rozkładzie z wartością oczekiwaną zero i wariancji jeden, \[\begin{equation*} \mathbb{P}\left[ a \leq S_n/\sqrt{n} \leq b \right] \approx \frac{1}{\sqrt{2\pi}} \int_a^b e^{-s^2/2}\mathrm{d}s. \end{equation*}\] Dokładna wartość prawdopodobieństwa po lewej stronie może być trudna do wyliczenia. W takich sytuacjach korzysta się z powyższego przybliżenia przez całkę po prawej stronie. To z kolei prowadzi do naturalnego pytania: Jaki jest błąd powyższego przybliżenia?
Przez \(\Phi\) będziemy oznaczać dystrybuantę standardowego rozkładu normalnego, tj. \[\begin{equation*} \Phi(t) = \frac{1}{\sqrt{2\pi}}\int^t_{-\infty} e^{-s^2/2} \mathrm{d}s. \end{equation*}\]
Przykład 28.1 Niech \(\{U_n\}_{n \in \mathbb{N}}\) będzie ciągiem Bernoulliego, tzn. \(\mathbb{P}[U_n=\pm 1]=1/2\). Wówczas dla parzystych wartości \(n\): \[\begin{align*} \left|\mathbb{P}\left( \frac{U_1+\ldots + U_n }{\sqrt n \mathbb{V}ar[U_n]} <0 \right) - \Phi(0)\right| =& \left| \mathbb{P}[U_1+\ldots + U_n < 0] - \frac 12 \right|\\ =& \left| \frac 12 \mathbb{P} \left[U_1+\ldots + U_n < 0\right]\right. \\ & +\left.\frac 12 \mathbb{P}\left[U_1+\ldots + U_n > 0\right] - \frac 12 \right|\\ =& \left| \frac 12 \big( 1 - \mathbb{P}[U_1+\ldots + U_n = 0] \big) - \frac 12 \right|\\ & = \frac 12 \mathbb{P}[U_1+\ldots + U_n = 0]\\ &= \frac 12 \cdot \frac{{n\choose n/2}}{2^{n}} \\ &\sim \frac 12\cdot \frac 1{\sqrt{\pi n/2}} = \frac 1{\sqrt{2\pi}} \frac 1{\sqrt n}. \end{align*}\] W przypadku zmiennych \(\{U_n\}_{n \in \mathbb{N}}\) błąd przybliżenia w CTG jest rzędu \(n^{-1/2}\).
Poniższe twierdzenie opisuje tempo zbieżności w CTG, a więc rozmiar błędu, jaki robimy powołując się na CTG. Twierdzenie podamy bez dowodu.
Twierdzenie 28.1 (Berry-Essen) Jeżeli \(\{X_n\}_{n\in \mathbb{N}}\) jest ciągiem niezależnych zmiennych losowych o takim samym rozkładzie,\(\mathbb{E} \left[ |X_1|^3 \right]<\infty\), \(\mathbb{E}[ X_1] = 0\) oraz \(\sigma^2 = \mathbb{V}ar [X_1]\), to \[ \sup_{t\in\mathbb{R}}\left| \mathbb{P}\left( \frac{X_1+\ldots+ X_n}{\sqrt n \sigma} < t \right) - \Phi(t) \right| \le \frac{C\mathbb{E}\left[|X_1|^3\right]}{\sigma^3 \sqrt n}, \] gdzie \(\Phi(t)\) jest dystrybuantą rozkładu normalnego \(N(0,1)\), a \(C\) pewną ustaloną stałą (niezależną od rozkładu \(X_1\)).

Andrew Campbell Berry (1906 -1998)

Carl-Gustav Esseen (1918 - 2001)
Remark. Optymalna wartość \(C\) nie jest znana. Wiadomo, że \(\frac 1{\sqrt{2\pi}} \le C < 0,8\).
Powyższy wynik mówi, że błąd w CTG jest rzędu \(C/\sqrt n\) i \(C\ge 1/\sqrt{2\pi}\). Tego oszacowania nie można poprawić.