Wykład 13: Epidemia
23-01-2025
Piotr Dyszewski
W tym rozdziale badać będziemy contact process rozważany zazwyczaj jako model rozprzestrzeniania się infekcji. Niech \(G=(V, E)\) będzie grafem prostym o ograniczonym stopniu, tj. \[\sup_{x \in V}\mathrm{deg}(x)<\infty.\] Modelujemy sytuację, w której każdy zdrowy wierzchołek choruje z intensywnością proporcjonalną do liczby swoich zarażonych sąsiadów. Każdy chory wierzchołek zdrowieje z intensywnością \(1\). Rozwój epidemii możemy modelować precesem \((\eta_t)_{t\in \mathbb{R}_+}\) o wartościach w \(\{0,1\}^V\). Wierzchołek \(x \in V\) jest chory w chwili \(t \in \mathbb{R}_+\) jeżeli \(\eta_t(x)=1\) i jest zdrowy gdy \(\eta_t(x)=0\). Powyższy opis mówi, że \((\eta_t)_{t \in \mathbb{R}_+}\) jest procesem Fellera z generatorem infinitezymalnym \[Lf(\eta) = \sum_{x \in V} c(x, \eta) \left[ f\left( \eta^{(x)} \right) -f(\eta)\right],\] gdzie \[c(x,\eta) = \mathbf{1}_{\{\eta(x)=1\}} + \lambda\mathbf{1}_{\{\eta(x)=0\}} \# \{ y \in V \: : \: y\sim x, \: \eta(y)=1\}.\] Tutaj \(\lambda \in \mathbb{R}_+\) jest parametrem modelu będącym współczynnikiem proporcjonalności intensywności zarażania do liczby chorych sąsiadów. Proces ten jest dobrze określony ponieważ \[\gamma(x,u) =\sup_{\eta}\left|c\left(x,\eta^{(u)}\right) - c(x,\eta)\right|=\lambda \mathbf{1}_{\{x\sim u\}}\] oraz \[\sup_{x\in V}\sum_{u\neq x}\gamma(x,u) = \sup_{x \in V} \lambda \mathrm{deg}(x)<\infty.\] Z opisu procesu widać, że zawsze posiada on co najmniej jedną miarę stacjonarną (skupioną w punkcie \(\eta \equiv 0\)). Chcemy zrozumieć kiedy jest to jedyny rozkład stacjonarny.
Reprezentacja graficzna, addytywność i dualność
Reprezentacja graficzna umożliwia konstrukcję modelu epidemii dla wszystkich początkowych konfiguracji jednocześnie jako funkcji niezależnych procesów Poissona. Pokazuje również, że proces ten ma właściwość addytywności i jest dualny sam do siebie.
Przypomnimy, że \(N=(N(t))_{t \in \mathbb{R}_+}\) jest procesem Poissona z intensywnością \(\mu \in \mathbb{R}_+\) jeżeli
\(N(0)=0\) p.w.
\(N\) ma niezależne przyrosty: dla każdych \(t>s\) zmienna \(N(t)-N(s)\) jest niezależna od \(\sigma(N_r \: : \: r \leq s)\)
\(N\) ma stacjonarne przerosty: dla każdych \(t>s\) zmienna \(N(t)-N(s)\) ma rozkład Poissona z parametrem \(\mu(t-s)\).
funkcja \(t \mapsto N(t)\) jest prawostronnie ciągła.
Zauważmy, że skoro \(N\) przyjmuje tylko wartości całkowitoliczbowe, to musi być kawałkami stała. Własności rozkładu Poissona implikują, że odstępy między kolejnymi skokami maja rozkład wykładniczy z parametrem \(\mu\).
Aby skonstruować reprezentacją graficzną procesu epidemii będziemy używali dwóch typów procesów Poissona. Pierwszy typ stowarzyszony jest z wierzchołkami. Dla każdego wierzchołka \(x\in V\) rozważamy jednorodny proces Poissona \(N_x = N_x(t)_{t \in \mathbb{R}_+}\) z intensywnością jeden. Momenty skoku tego procesu kodować będą momenty, w których wierzchołek \(x\) zdrowieje. Drugi typ stowarzyszony jest z krawędziami skierowanymi. Dla każdej krawędzi zatem rozważamy dwa procesy, po jednym dla każdej orientacji. Innymi słowy dla każdej uporządkowanej pary sąsiadujących wierzchołków \(x, y\) w \(V\) rozważamy proces Poissona \(N_{x,y}\) z intensywnością \(\lambda\). Momenty skoków procesu \(N_{x,y}\) utożsamiać będziemy z momentami czasu, w których \(x\) zaraża \(y\).
Reprezentacja graficzna procesu ma miejsce w czasoprzestrzeni \(G \times \mathbb{R}_+\). Zbiór \(\mathbb{R}_+\) w ostatnim produkcie interpretować będziemy oczywiście jako czas. Nad każdym wierzchołkiem stoi kopia \(\mathbb{R}_+\) na której zaznaczamy momenty skoku procesu \(N_x\). Dla każdej uporządkowanej pary sąsiadujących wierzchołków \(x,y\) w momentach skoku \(N_{x,y}\) rysujemy krawędź skierowaną od \(x\) do \(y\).
Definicja 14 Niech \(s<t\). Ścieżką z \((x, s)\) do \((y, t)\) w \(G \times \mathbb{R}\) nazywać będziemy ciąg \((x,s)=(x_0, t_0), (x_1, t_1), \dots, (x_n, t_n) = (y, t)\) taki, że:
Chwile \(t_k\) tworzą rosnący ciąg zdarzeń: \(t_0 < t_1 < \dots < t_n\),
Zdarzenia mają miejsca między sąsiadami: \(x_k\) i \(x_{k+1}\) są sąsiadami dla każdego \(k\).
Każde zdarzenie polega na zarażeniu \(x_{k+1}\) przez \(x_k\): \(t_k\) jest momentem skoku \(N_{x_k, x_{k+1}}\) dla każdego \(k\) (na wysokości \(t_k\) jest strzałka od \(x_{k}\) do \(x_{k+1}\)).
Żaden z wierzchołków nie wyzdrowiał przed zarażeniem kolejnego: \(s\) nie jest punktem skoku \(N_{x_k}\) dla \(t_{k-1} < s < t_k\).
Reprezentacja graficzna koduje nam całą dynamikę modelu epidemii. Dokładniej: istnieje ścieżka z \((x,s)\) do \((y,t)\) wtedy i tylko wtedy, gdy jeżeli w chwili \(s\) wierzchołek \(x\) jest chory, to w chwili \(t\) wierzchołek \(y\) jest chory. Pozostaje jedynie zadać warunek początkowy. Każdy punkt startowy \(\eta \in \{0,1\}^V\) możemy jednoznacznie utożsamić ze zbiorem zainfekowanych wierzchołków \(A = \{ x \in V \: : \: \eta(x)=1\}\). Stąd wartość \(\eta_t\) z warunkiem początkowym \(A\) możemy jednoznacznie utożsamić ze zbiorem \[A_t^{A} = \{ x \in V \: : \: \mbox{Istnieje ścieżka z } (y,0) \mbox{ do } (x,t) \mbox{ dla pewnego } y \in A\}.\] Konstrukcja ta pozwala rozważać procesy epidemii dla wszystkich warunków początkowych na jednej przestrzeni probabilistycznej. Stąd też wynika własność addytywności procesu \[A_t^{A\cup B} = A_t^A \cup A_t^B\] dla dowolnych \(A, B \subseteq V\). W szczególności, jeżeli \(A \subseteq B\), to \[A_t^{A} \subseteq A_t^B.\] Innymi słowy, jeżeli zaczniemy proces z większą liczbą zarażonych wierzchołków, to w każdym momencie otrzymamy większą liczbę chorych. Zauważmy wreszcie, że ograniczając reprezentację graficzną do zbioru \(G \times[0,t]\) długości wszystkich wszystkich pionowych obcinków między zdarzaniami poszczególnych procesów Poissona mają ucięty rozkład wykładniczy, tj. zmiennej losowej postaci \(\xi\wedge t\), gdzie \(\xi\) ma rozkład wykładniczy z parametrem \(1\) bądź \(\lambda\). Obserwacja ta będzie istotna w momencie odwrócenia czasu w procesie. Okazuje się, że dla każdego \(t>0\) czas między ostatnim odnotowanym zdarzeniem a \(t\) również ma rozkład wykładniczy. Pomocny będzie też następujący fakt.
Fakt 5 Niech \(\{\xi_k\}_{k \in \mathbb{N}}\) będzie ciągiem niezależnych zmiennych losowych o rozkładzie wykładniczym z parametrem \(\mu \in \mathbb{R}_+\). Niech \(S_0=0\) i dla \(n \in \mathbb{N}\) \[S_n = \sum_{k=1}^n \xi_k.\] Dla \(t \in \mathbb{R}_+\) połóżmy \[N(t) = \# \{ n \in \mathbb{N} \: : \: S_n \leq t\}.\] Wówczas \(N = (N(t))_{t \in \mathbb{R}_+}\) jest jednorodnym procesem Poissona z intensywnością \(\mu\). Dodatkowo zmienna losowa \(t-S_{N(t)}\) ma ten sam rozkład co \(\xi_1 \wedge t\).
Proof. Dowód pierwszego postulatu jest częścią wykładu z RP2R. Dowód drugiej części faktu pozostawiamy jako ćwiczenie. ◻
Dla \(x\in V\), \(t,s\in \mathbb{R}_+\) takich, że \(s<t\) rozważmy \[\widehat{A}_s^{A,t} = \{ y \in V \: : \: \mbox{Istnieje ścieżka z } (y,t-s) \mbox{ do } (x,t) \mbox{ dla pewnego } x \in A \}.\] Wówczas zbiór \(\widehat{A}_s^{\{x\},t}\) stanowi kolekcję wierzchołków \(y \in V\) os następującej własności: Jeżeli w chwili \(t-s\) wierzchołek \(y\) jest zarażony, to w chwili \(t\) wierzchołek \(x\) będzie zarażony. Daje to charakteryzacje wierzchołków zarażonych w chwili \(t\), \[A_t^A = \left\{ x \in V \: : \: A_{t-s}^A \cap \widehat{A}_s^{\{x\},t}\neq \emptyset \right\}.\] dla \(s=t\) dostajemy \[A_t^A = \left\{ x \in V \: : \: A \cap \widehat{A}_s^{\{x\},t}\neq \emptyset \right\}.\] W szczególności, dla dowolnego \(B \subseteq V\), \[A_t^A\cap B = \left\{ x \in B \: : \: A \cap \widehat{A}_t^{\{x\},t}\neq \emptyset \right\}.\] Podobnie jest w przypadku zbioru \(\widehat{A}_s^{A,t}\): to zbiór tych \(y \in V\) takich, że jeżeli \(y\) jest zarażony w chwili \(t-s\), to zarażony jest pewien wierzchołek z \(A\). W szczególności mamy równość zdarzeń \[\begin{equation} \left\{A_t^A\cap B \neq \emptyset \right\} = \left\{ A \cap \widehat{A}_t^{B,t} \neq \emptyset\right\} \tag{51} \end{equation}\] Ze stworzonej przez nas konstrukcji graficznej dla \(A_t\) łatwo można otrzymać konstrukcję graficzną \(\widehat{A}_s\). Wystarczy cały obrazek odbić w poziomie i odwrócić orientację strzałek. Z Faktu 5 długości wszystkich pionowych segmentów w interpretacji \(A_t\) obciętej do \(G \times [0,t]\) mają obcięty rozkład wykładniczy. Zatem odbicie obrazka w poziomie nie zmieni ich rozkładów. Odwrócenie kierunku strzałek również nie zmienia rozkładu. Oznacza to, że \(A_t^{B,t}\) ma ten sam rozkład co \(A_t^B\). Relacja (51) w terminach prawdopodobieństwa zapisuje się jako \[\mathbf{P}_A[A_t \cap B \neq \emptyset] = \mathbf{P}_B[A_t\cap A \neq \emptyset].\] Rozważmy sytuację, w której zaczynamy nasz proces od stanu, w którym wszystkie wierzchołki są zarażone, tj. \(A=V\). Wówczas \[\mathbf{P}_V[A_t \cap B \neq \emptyset] = \mathbf{P}_B[A_t \neq \emptyset].\] Zauważmy, że zdarzenia występujące pod prawdopodobieństwem po prawej stronie są zstępujące, dla \(s<t\) mamy \[\{A_s \neq \emptyset\} \supseteq \{ A_t\neq \emptyset\}.\] Oznacza to, że dla każdego \(B\) istnieje granica \[\lim_{t \to \infty} \mathbf{P}_V[A_t \cap B \neq \emptyset] = \lim_{t \to \infty}\mathbf{P}_B[A_t \neq \emptyset].\] Rozważając skończone podzbiory \(B \subseteq V\) poprzez skończone operacje mnogościowe jesteśmy w stanie wyrazić zdarzenia typu \(\{ A_t \cap B \in \cdot \}\) poprzez zdarzenia typu \(\{A_t \cap B \neq \emptyset\}\). Oznacza to, że zbieżne są rozkłady \(A^V_t \cap B\) są zbieżne przy \(t\to \infty\). Poprzez charakteryzację słabej zbieżności na przeliczalnym produkcie \(\{0,1\}^V\) w terminach zbieżności rozkładów skończenie wymiarowych otrzymujemy zbieżność rozkładu \(A_t^V\) do pewnej miary probabilistycznej \(\overline{\nu}\) na \(\{0,1\}^V\). Miara \(\overline{\nu}\) nazywana jest górnym rozkładem stacjonarnym. Bowiem dla dowolnego innego rozkładu stacjonarnego \(\pi\) zachodzi \[\pi(\eta\equiv 1 \mbox{ na } A) \leq \overline{\nu}(\eta \equiv 1 \mbox{ na } A)\] dla dowolnego \(A\subseteq V\). W szczególności dla modelu epidemii będzie istniała nietrywialny rozkład stacjonarny (inny niż \(\delta_{\mathbf{0}}\)) wtedy i tylko wtedy, gdy \(\overline{\nu} \neq \delta_\mathbf{0}\).