Wykład 6: od generatora przez półgrupę do procesu
2024-11-07
Piotr Dyszewski
W całym tym rozdziale \((L, \mathcal{D}(L))\) będzie generatorem infinitezymalnym. Naszym pierwszym zadaniem jest skonstruowanie odpowiadającej mu półgrupy Fellera. Aby to zrobić, wprowadzamy aproksymację \(L_\epsilon\) zadaną przez \[L_\epsilon = L(I - \epsilon L)^{-1}.\] Zauważmy, że \(L_\epsilon\) jest dobrze określone ponieważ \[f \in \mathcal{D}(L), \: f - \epsilon L f = g \quad \text{jest równoważne} \quad f = (I - \epsilon L)^{-1} g.\] Ponadto, przy oznaczeniach jak wyżej, \[\|L_\epsilon g\| = \|L f\| \leq \frac{\|f\| + \|g\|}{\epsilon} \leq \frac{2}{\epsilon} \|g\|\], więc \(L_\epsilon\) jest ograniczonym operatorem. To pozwala zdefiniować \(T_\epsilon(t)\) przez \[T_\epsilon(t) = e^{tL_\epsilon} = \sum_{n=0}^{\infty} \frac{t^n L_\epsilon^n}{n!}.\]
Zadanie 13
Pokaż, że dla każdego \(f \in C_0(S)\), \[\begin{equation} (I - \epsilon L)^{-1} f - \epsilon L_\epsilon f = f. \tag{19} \end{equation}\]
Użyj części (a), aby pokazać, że \(L_\epsilon\) jest generatorem infinitezymalny,, oraz że \(T_\epsilon(t)\) jest półgrupą Fellera, której generatorem jest \(L_\epsilon\).
Twierdzenie 12 Dla \(f \in C_0(S)\), \[ T(t)f = \lim_{\epsilon \to 0} T_\epsilon(t) f \tag{20} \] jednostajnie na ograniczonych przedziałach \(t\). Definiuje to półgrupę Fellera, której generatorem jest \(L\).
Proof. Najpierw sprawdzamy, że \(L_\epsilon\) i \(L_\delta\) komutują dla \(\epsilon, \delta > 0\). Aby to sprawdzić zauważmy najpierw, że \[(I - \epsilon L)^{-1} (I - \delta L)^{-1} = (I - \delta L)^{-1} (I - \epsilon L)^{-1},\] co z kolei jest prawdziwe, ponieważ \[(I - \epsilon L)^{-1} (I - \delta L)^{-1} f = g \quad \text{jest równoważne} \quad f = g - (\epsilon + \delta)Lg + \epsilon \delta L^2 g,\] co jest symetryczne w \(\epsilon\) i \(\delta\). Korzystając teraz z (19) napiszmy \[\begin{gathered} \epsilon\delta L_\epsilon L_\delta = \left( (I-\epsilon L)^{-1}-I \right) \left( (I-\delta L)^{-1} -I \right) = \\ \left( (I-\delta L)^{-1}-I \right) \left( (I-\epsilon L)^{-1} -I \right) = \epsilon\delta L_\delta L_\epsilon. \end{gathered}\] Zauważmy, że dzięki temu operatory \(L_\delta\), \(L_\epsilon\), \(T_\epsilon(t)\) i \(T_\delta(t)\) również komutują.
Chcąc pokazać, że \(T_\epsilon(t)\) przy \(\epsilon \to 0\) rzeczywiście zbiegają będziemy chcieli opierać się na zbieżności \(L_\epsilon\) przy \(\epsilon \to 0\). Uzasadnimy teraz nierówność, która uzasadni, że takie wnioskowanie jest możliwe. Stosując zasadnicze twierdzenie rachunku różniczkowego i całkowego otrzymujemy, że dla każdej \(f \in C_0(S)\), \[T_\epsilon(t)f - T_\delta(t)f = \int_0^t \frac{\mathrm{d}}{\mathrm{d}s} [T_\epsilon(s)T_\delta(t - s)] f \, \mathrm{d}s = \int_0^t T_\epsilon(s)T_\delta(t - s) (L_\epsilon - L_\delta) f \, \mathrm{d}s.\] Skoro \(\| T_\epsilon(s) \| , \|T_\delta(t - s) \| \leq 1\) udowodniona właśnie nierówność implikuje, że \[ \|T_\epsilon(t)f - T_\delta(t)f\| \leq t \|L_\epsilon f - L_\delta f\| (\#eq:3-21).\] Wystarczy pokazać zatem, że \(L_\epsilon\) zbiegają. Spodziewamy się, że \((I-\epsilon L)^{-1} \to I\), co z kolei powinno implikować, że \(L_\epsilon \to L\). Sprawdzimy teraz formalnie to rozumowanie. Dla \(f \in \mathcal{D}(L)\) mamy \[(I - \epsilon L)^{-1} f - f = \epsilon (I - \epsilon L)^{-1} L f\] Skoro \(\|(I-\epsilon L)^{-1}\|\leq 1\), to \[\|(I - \epsilon L)^{-1} f - f\| \leq \epsilon \|L f\|.\] W szczególności, dla \(f \in \mathcal{D}(L)\), \[\lim_{\epsilon \to 0} (I - \epsilon L)^{-1} f = f.\] Skoro \((I-\epsilon L)^{-1}\) jest ciągłe a \(\mathcal{D}(L)\) gęste w \(C_0(S)\), powyższa zbieżność ma miejsce dla wszystkich \(f \in C_0(S)\). Ponieważ \[L_\epsilon f = (I - \epsilon L)^{-1} L f\] dla \(f \in \mathcal{D}(L)\), to \[\begin{equation} \lim_{\epsilon \to 0} L_\epsilon f = L f \tag{21} \end{equation}\] dla \(f \in \mathcal{D}(L)\). Tak więc przez @ref\tag{22}, granica w (20) istnieje jednostajnie na ograniczonych zbiorach \(t\) dla \(f \in \mathcal{D}\). Ponieważ zbiór \(\mathcal{D}(L)\) jest gęsty w \(C_0(S)\) i \(T_\epsilon(t)\) jest kontrakcją, ten sam wniosek jest prawdziwy dla wszystkich \(f \in C_0(S)\). Z udowodnionej właśnie zbieżności wynika, że a \(T(t)\) spełnia własność półgrupy oraz wszystkie postulaty procesu Fellera z wyjątkiem ostatniego.
Aby uzasadnić, że \((T_t)_{t \in \mathbb{R}_+}\) spełnia ostatnią własność pokażemy najpierw, że \[(I - \alpha L)^{-1} = \alpha \int_0^\infty e^{-\alpha t} T_t \mathrm{d} t.\] Ustalmy w tym celu \(\lambda > 0\) tak małe, że \(\mathcal{R}(I - \lambda L) = C_0(S)\), i wybierzmy \(\alpha\) tak, że \(\alpha \lambda = 1\). Ustalmy \(g \in C_0(S)\). Chcąc uzasadnić \[ (I - \alpha L)^{-1}g = \alpha \int_0^\infty e^{-\alpha t} T_tg \mathrm{d} t \tag{23} \] odwołamy się do aproksymacji \(L\) i \(T(t)\) przez odpowiednio \(L_\epsilon\) oraz \(T_\epsilon(t)\). Niech \[f_\epsilon = (I-\alpha L_\epsilon)^{-1}g = \alpha U_\epsilon(\alpha)g = \alpha \int_0^\infty e^{-\alpha t} T_\epsilon(t)g \, \mathrm{d}t.\] Z (20), \[\lim_{\epsilon \to 0^+} f_\epsilon = f, \qquad f= \alpha \int_0^\infty e^{-\alpha t} T(t)g \, \mathrm{d}t.\] Połóżmy \(h_\epsilon = (I - \epsilon L)^{-1} f_\epsilon\). Wówczas z (19), \(\lim_{\epsilon \to 0} h_\epsilon = f\). Niech wreszcie \(h = (I-\lambda L)^{-1} g\). Naszym aktualnym celem (23) we wprowadzonej właśnie notacji jest pokazać, że \(f=h\). Z definicji \(L_\epsilon\), \[\begin{gathered} \lambda L h_\epsilon = L_\epsilon f_\epsilon = \alpha\int_0^\infty e^{-\alpha t} L_\epsilon T_\epsilon(t) f \mathrm{d}t= \alpha\int_0^\infty e^{-\alpha t} \frac{\mathrm{d}}{\mathrm{d}t} T_\epsilon(t) f \mathrm{d}t \\ -\alpha g+\alpha^2\int_0^\infty e^{-\alpha t}T_\epsilon(t) f \mathrm{d}t = \alpha(f_\epsilon-g) \rightarrow \alpha (f - g) \end{gathered}\] gdy \(\epsilon \to 0\). Dlatego, \[\lim_{\epsilon \to 0} [(h_\epsilon - h) - \lambda L(h_\epsilon - h)] = 0,\] z czego z kolei wynika, że \(h_\epsilon - h \to 0\). Stąd \(f = h\). Zastosowanie (23) do \(g_n\) i \(f_n =(I-\lambda L)^{-1}g_n\) z Definicji 8 widzimy, że \[\lim_{n \to \infty} \alpha \int_{0}^{\infty} e^{-\alpha t} (T(t)g_n)(x) \mathrm{d}t =\lim_{n \to \infty }f_n(x)= 1\] dla każdego \(x \in S\). Niech \(\mu_{t,x}\) będzie miarą zdefiniowaną przez \[T(t)f(x) = \int f(y) \mu_{t,x}(\mathrm{d} y).\] Skoro \(T(t)\) jest ograniczonym operatorem, to miara \(\mu_{t,x}\) jest skończona. Jako, że \(g_n \to 1\) punktowo, to twierdzenia o zbieżności ograniczonej mamy więc \[T(t)g_n(x) \to \mu_{t,x}(S).\] Stąd \[1 = \alpha \int_{0}^{\infty} e^{-\alpha t} \mu_{t,x}(S) \mathrm{d} t.\] Innymi słowy transformatą Laplace’a funkcji \(t \mapsto \mu_{t,x}(S)\) jest \(\alpha \to 1/\alpha\). Widzimy więc, że \(\mu_{t,x}(S) \equiv 1\). Czyli \(T(t) g_n \to 1\) punktowo. Oznacza to, że spełniona jest ostatnia własność w Definicji 8.
Wreszcie, sprawdzamy, że ta półgrupa Fellera \((T_t)_{t \in \mathbb{R}_+}\) ma generator \(L\). Mamy \[T_\epsilon(t)f - f = \int_{0}^{t} \frac{\mathrm{d}}{\mathrm{d}s} T_\epsilon(s) \mathrm{d}s = \int_{0}^{t} T_\epsilon(s)L_\epsilon f \mathrm{d}s.\] Jeśli \(f \in \mathcal{D}(L)\), to (20), (21) oraz własność kontrakcji \(T_\epsilon(t)\) implikują, że można przejść do granicy w tym równaniu, aby uzyskać \[T(t)f - f = \int_{0}^{t} T(s)Lf \mathrm{d}s.\] Zatem \[\lim_{t \to 0} \frac{T(t)f - f}{t} = Lf \text{ dla } f \in \mathcal{D}(L).\] Pokazaliśmy właśnie, że \[\mathcal{D}(L) \subseteq \mathcal{D}'(L) = \left\{ f \in C_0(S) \: :\: \lim_{t \to 0} (T(t)f - f)/t \text{ istnieje } \right\}.\] Wiemy, że obie pary \((L, \mathcal{D}(L))\) oraz \((L, \mathcal{D}'(L))\) są generatorami infinitezymalnymi. Niech \(f \in \mathcal{D}'(L)\). Rozważmy \(g = (I-\lambda L)f\). Istnieje \(h \in \mathcal{D}(L)\) takie, że \(g = (I-\lambda L)h\). Stąd \((I-\lambda L)(f-h) =0\) a co za tym idzie \(f = h \in \mathcal{D}(L)\). Pokazaliśmy właśnie, że \(\mathcal{D}(L) = \mathcal{D}'(L)\).
Twierdzenie 13 Jeśli \((T_t)_{t \geq 0}\) jest półgrupą Fellera, to istnieje proces Fellera \((\mathbf{P}, \mathbb{F})\) spełniający \[\mathbf{E}_x f(X(t)) = T_tf(x)\] dla \(x \in S, t \geq 0\), oraz \(f \in C_0(S)\).
Proof. Ustalmy \(x \in S\). Pokażemy najpierw, że istnieje proces \(Y(t), t \in \mathbb{Q}^+\) na pewnej przestrzeni probabilistycznej, który ma pożądane rozkłady skończenie wymiarowe oraz \(Y(0) = x\).
Dla dowolnego \(n \in \mathbb{N}\) i dowolnych \(0 \leq t_1< t_2 <\ldots < t_n\) definiujemy rozkład \(\mu_{t_1, \ldots, t_n}\) na \(S^n\) poprzez następujący wymóg: dla dowolnych \(f_1, \ldots, f_n\) z \(C_0(S)\) zachodzi \[\begin{equation} \int f_1(y_1) f_2(y_2) \cdots f_n(y_n) \mu_{t_1, \ldots, t_n}(\mathrm{d}(y_1, \ldots y_n)) = T_{t_1} \left( f_1 T_{t_2-t_1} \left( f_2 T_{t_3-t_2} ( \ldots) \right) \right)(x). \tag{24} \end{equation}\] Funkcje o rozdzielonych zmiennych \(f_1(y_1) f_2(y_2) \cdots f_n(y_n)\) są liniowo gęste w \(C\left( S^n \right)\). Miara \(\mu_{t_1, \ldots, t_n}\) jest więc dobrze określona (istnieje dokładnie jedna spełniająca zadany warunek). Aby powołać się na twierdzenie Kołmogorowa o istnieniu procesu należy uzasadnić, że skonstruowane w ten sposób miary są zgodne. Dokładniej, że dla dowolnego \(j\leq n\), i dowolnych borelowskich \(A_1, \ldots , A_n \in S\), \[\begin{gathered} \mu_{t_1, \ldots, t_n}(A_1 \times \cdots \times A_{j-1} \times S \times A_{j+1} \times \cdots A_n) = \\ \mu_{t_1, \ldots, t_{j-1}, t_{j+1} \ldots t_n}(A_1 \times \cdots \times A_{j-1} \times A_{j+1} \times \cdots A_n). \end{gathered}\] Wynika to z (24) dla \(f_j\equiv 1\) i zastosowaniu własności półgrupy \((T_t)_{t \in \mathbb{R}_+}\). Zastosowanie twierdzenia Kołmogorowa pozwala wywnioskować istnienie procesu o zadanych rozkładach skończenie wymiarowych. Jednakże nie daje ono żadnej kontroli nad regularnością trajektorii. Dlatego jesteśmy zmuszeni przeprowadzić dodatkową konstrukcję.
Stosując konstrukcję w poprzedniego paragrafu dla wymiernych \(t\) otrzymujemy proces \((Y_q^{(x)} \: : \: q \in \mathbb{Q}_+)\) o rozkładach zadanych rozkładach skończenie wymiarowych: \[\mathbb{P}[Y_{t_1}^{(x)}\in A_1, \ldots , Y_{t_n}^{(x)} \in A_n] = \mu_{t_1, \ldots, t_n}(A_1 \times \cdots \times A_n)\] oraz taki, że \(\mathbb{P}[Y^{(x)}_0=x]=1\). Proces ten ma własność Markowa. Z definicji miary \(\mu_{t_1, \ldots, t_n}\), \[\mathbb{E} [f_1(Y_{t_1}^{(x)}) \cdots f_n(Y_{t_n}^{(x)}) ] = \mathbb{E} [f_1(Y_{t_1}^{(x)}) \cdots f_{n-1}(Y_{t_{n-1}}^{(x)}) T_{t_{n} - t_{n-1}} f_n (Y_{n-1}^{(x)}) ]\] Powyższe implikuje \[\mathbb{E} [f_n(Y_{t_n}^{(x)}) | Y_q^{(x)}, q \leq t_{n-1}] = T_{t_n-t_{n-1}} f_n(Y_{t_{n-1}}^{(x)})\] W analogiczny sposób uzasadniamy własność Markowa.
Jeśli \(f \in C_0(S)\) jest nieujemna, to \[e^{-\alpha t} T(t) U(\alpha) f = \int_{t}^{\infty} e^{-\alpha s} T(s) f \mathrm{d}s \leq U(\alpha) f.\] Stąd wynika, że \(e^{-\alpha t} U(\alpha) f(Y(t))\) jest (ograniczonym) supermartingałem względem filtracji \(\{\mathcal{F}_t, t \in \mathbb{Q}^+\}\), gdzie \(\mathcal{F}_t\) jest generowana przez \[(Y(s), s \in \mathbb{Q} \cap [0,t]).\] Rzeczywiście mamy \[\mathbb{E}[ e^{-\alpha(t+s)} U(\alpha) f(Y_{t+s}) | \mathcal{F}_s] = e^{-\alpha (t+s)} T_t U(\alpha) f(Y_s) \leq e^{-\alpha s} U(\alpha) f(Y_s).\] Wówczas prawdopodobieństwem jeden, prawostronne i lewostronne granice tego supermartingału wzdłuż liczb wymiernych istnieją w każdym \(t \in [0, \infty)\).
Dowód twierdzenia o zbieżności nadmartynggałów sprowadza się pokazania, że w prawdopodobieństwem jeden liczba przejść w dół przez każdy przedział o końcach wymiernych jest skończona. Każda funkcja zmiennej rzeczywistej o tej własności musi mieć lewostronną i prawostronną granicę w każdym punkcie.
Dla każdej \(\alpha\) i każdej nieujemnej \(f\) proces \(e^{-\alpha t} U(\alpha) f(Y_t)\) ma lewostronne i prawostronne granice. Oczywiście, zbiór o prawdopodobieństwie zero, na którym to się nie udaje, może zależeć od \(f\) i \(\alpha\). Musimy więc ograniczyć naszą uwagę do gęstego, przeliczalnego zbioru \(f\) i \(\alpha\), aby stwierdzić istnienie prawostronnych i lewostronnych granic procesu \(Y(s)\) samego w sobie. Ponieważ \(\alpha U(\alpha) f \to f\) gdy \(\alpha \to \infty\), oraz \(C_0(S)\) jest ośrodkową przestrzenią metryczną, możemy po prostu użyć funkcji \(U(\alpha) f\), gdzie \(\alpha\) jest liczbą całkowitą, oraz \(f\) jest wzięte z pewnego przeliczalnego gęstego zbioru w \(C_0(S)\).
Istnieje nadal jeden problem, że te prawostronne i lewostronne granice mogą być jednopunktową kompaktyfikacją \(S\), i wykluczenie tego przypadku wymaga dodatkowego argumentu. Chodzi o to, żeby uzasadnić, że \(Y\) nie ucieka do nieskończoności. Niech \(f \in C_0(S)\) będzie ściśle dodatnie. Rozważmy supermartingał \(M(t) = e^{-tU(1)f(Y(t))}\). To jest ściśle dodatnie, więc \(\inf_{s \in \mathbb{Q} \cap [0,t]} M(s) > 0\) prawie na pewno dla każdego \(t > 0\) (zadanie). Oznacza to, że z prawdopodobieństwem jeden \(Y_s\) dla \(s \leq t\) są zawarte w zbiorze zwartym.
Wiemy teraz, że z prawdopodobieństwem jeden, \(Y(s)\) ma prawostronne i lewostronne granice w każdym \(t \in [0, \infty)\). Więc możemy zdefiniować \[X(t) = \lim_{\substack{s \downarrow t \\ s \in \mathbb{Q}}} Y(s).\] To jest automatycznie prawostronnie ciągłe i ma lewostronne granice. Ponieważ skończenie wymiarowe rozkłady odpowiadające \(T(t)\) są słabo ciągłe, \(X(t)\) ma poprawne skończenie wymiarowe rozkłady.