Galton-Watson-Bäume Johannes Cuno Sommersemester 2005 Im folgenden Dokument wollen wir untersuchen, wie sich die Generationengrößen in einer Population auf lange Sicht entwickeln, wenn jedes Individuum mit der gleichen Verteilung aber vollkommen unabhängig Nachkommen hervorbringt. In unserem Modell beschränken wir uns auf diskrete Zeit, gehen also davon aus, dass sich alle Individuen einer Generation zeitgleich fortpflanzen. Wir beginnen in Generation Null mit einem einzigen Individuum. 1 Vorbereitung Neben dieser Ausarbeitung stehen die Folien, die ich im Rahmen meiner Präsentation verwendet habe, im Netz zur Verfügung. Mit ihrer Hilfe haben wir uns gemeinsam überlegt, wie die Bäume in unserem Modell wachsen und wie die entsprechenden Generationengrößen aussehen. Dem Leser seien an dieser Stelle die Folien 2 bis 31 besonders ans Herz gelegt. 2 2.1 Der Galton-Watson-Prozess Definition P Seien pk ∈ [0, 1] (wobei k ∈ N0 ) mit pk = 1 und sei L eine N0 -wertige Zufallsvariable mit der entsprechenden Verteilung: Ws ({L = k}) = pk 1 Galton-Watson-Bäume Seite 2 (n) Seien (Li )i,n∈N unabhängige Kopien unserer Zufallsvariablen L. Dann wird der Galton-Watson-Prozess (Zn ) induktiv definiert durch: Z0 ≡ 1 und Zn+1 = Zn X i=1 Größe der (n+1)-ten Generation (n+1) Li I @ @ @ Anzahl der Nachkommen des i-ten Individuums der n-ten Generation. 2.2 Bemerkungen 1. Der Galton-Watson-Prozess (Zn ) ist eine Markovkette. Begründung. Nach unserer Definition ist die Anzahl der Nachkommen für jedes Individuum unabhängig und identisch verteilt. Wenn ich nun eine bestimmte Generationengröße Zn kenne, dann ist es für die Verteilung der darauffolgenden Generationengröße Zn+1 vollkommen ohne Bedeutung, auf welchem Wege ich zu meiner ursprünglichen Generationengröße Zn gekommen bin. 2. Wenn die Generationengröße Zn einmal den Wert 0 angenommen hat, so wird sie von diesem Zeitpunkt an offensichtlich immer den Wert 0 haben. Das Ereignis {∃ n ∈ N0 : Zn = 0} nennen wir Aussterben. 3. Auf den folgenden Seiten werden wir mit der Erzeugendenfunktion unserer Zufallsvariablen L arbeiten. Sie lautet: f : [0, 1] → [0, 1] mit ∞ X f (s) = E sL = pk sk k=0 2.3 Fragen Nachdem wir uns ein wenig mit dem Galton-Watson-Prozess vertraut gemacht haben, stellen sich einige Fragen. Seien p0 , p1 , p2 . . . gegeben. 1. Wie groß ist die Wahrscheinlichkeit, dass wir irgendwann aussterben? 2. Gehen wir einfach mal davon aus, wir wüssten, dass wir nicht aussterben. Folgt daraus dann schon Zn → ∞? Zusatzfrage. Kann man im Falle Zn → ∞ vielleicht sogar schon eine Aussage darüber machen, wie schnell die Zn wachsen? 3 3.1 Erste Antworten Antwort auf die zweite Frage Lemma. Sei p1 6= 1. Dann gilt, gegeben dem Ereignis, dass der Galton-WatsonProzess (Zn ) nicht ausstirbt, Zn → ∞ fast sicher. Beweis. (Zn ) ist eine Irrfahrt auf den nichtnegativen ganzen Zahlen. Wir zeigen zunächst, dass alle Zustände außer 0 transient sind. Im Falle p0 = 0 ist das klar. Galton-Watson-Bäume Seite 3 Im Falle p0 > 0 besteht die Möglichkeit auszusterben. Eine notwendige Bedingung dafür, dass unser Galton-Watson-Prozess bei Start im Zustand n ∈ N0 \{0} nach endlicher Zeit zurückkehrt, ist, dass er nicht sofort ausstirbt, was mit Wahrscheinlichkeit pn0 passiert. Es gilt also: Wsn (Rückkehrzeit ist endlich) ≤ 1 − pn0 < 1 Daraus folgt, dass alle Zustände n ∈ N0 \ {0} transient sind. Nun können wir die Behauptung zeigen, denn hiermit folgt für alle n ∈ N0 \ {0}: Wsn (Anzahl der Besuche in n ist endlich) = 1 Wenn also (Zn ) nicht ausstirbt, das heißt in 0 absorbiert wird, wird es jedes k ∈ N fast sicher in endlicher Zeit übertreffen und divergiert somit fast sicher gegen ∞. Zeit 6• In jedem einzelnen Zustand gibt es nur endlich viele Besuche. • • • • • • • • 0 1 2 3 4 k+1 - N 0 3.2 Antwort auf die erste Frage Satz. Es gilt: E sZn = f ◦ . . . ◦ f (s) =: f (n) (s) | {z } n mal Beweis. Rechnen wir nach: h h PZn−1 ii E s Zn = E E s i=1 Li Zn−1 bedingte Erwartung E[X] = E[E[X | Y ]] Li sind unabhängig und identisch verteilt ZQ n−1 i=1 = E Unabhängigkeit der Zufallsvariablen ## = E E sLi Zn−1 i=1 # " ZQ n−1 L E s i Zn−1 = E " " " ZQ n−1 i=1 E s Li # i h Zn−1 = E E s Li = E f (s)Zn−1 Galton-Watson-Bäume Seite 4 Nun können wir beobachten: E s Zn = E f (s)Zn−1 = E f (2) (s)Zn−2 = . . . = E f (n) (s)Z0 = E f (n) (s) = f (n) (s) Corollar. Es gilt: Ws(Aussterben) = lim f (n) (0) =: q n→∞ Beweis. Beobachte zunächst: Aussterben bis zur Zeit n = {Zn = 0} = n S {Zk = 0} ↑ k=1 Mit der σ-Stetigkeit folgt: Ws(Aussterben) ∞ S {Zk = 0} = Aussterben k=1 = lim Ws ({Zn = 0}) = lim E I{Zn =0} n→∞ n→∞ = lim E 0Zn = lim f (n) (0) n→∞ n→∞ Diese Aussage ist auf den ersten Blick ziemlich überraschend: Wir können die Wahrscheinlichkeit, dass unser Galton-Watson-Prozess (Zn ) ausstirbt, annähern, indem wir von der Stelle 0 ausgehen und nun die Abbildung f : [0, 1] → [0, 1] mehrfach hintereinander ausführen. Der folgende Satz verrät, wie wir diesen Grenzwert ganz einfach ausrechnen können. Zuvor empfehle ich jedoch, einen Blick auf die Folien 32 bis 58 der Präsention zu werfen. Satz. Sei p1 6= 1. Dann gelten die folgenden Aussagen: (i) q ist der kleinste Fixpunkt von f . (ii) q = 1 ⇔ f 0 (1) ≤ 1 Beweis. Die Erzeugendenfunktion f ist stetig und streng monoton wachsend. Aus der Stetigkeit von f folgt: f (q) = f lim f (n) (0) = lim f (n+1) (0) = lim f (n) (0) = q n→∞ n→∞ n→∞ Wir wissen also, dass q Fixpunkt der Erzeugendenfunktion f ist. Noch zu zeigen ist, dass q auch der kleinste Fixpunkt ist. Sei nun o.B.d.A. p0 = f (0) > 0. Dann folgt aus der strengen Monotonie von f : 0 < f (0) < f (2) (0) < f (3) (0) < . . . Angenommen, es gibt einen Fixpunkt s ∈ [0, 1] mit f (n) (0) ≤ s < f (n+1) (0). Dann gilt jedoch: f (n) (0) ≤ s und f (f (n) (0)) > f (s) Galton-Watson-Bäume Seite 5 Dies steht im Widerspruch zur Monotonie von f . Es folgt, dass es kein solches s geben kann, also dass q der kleinste Fixpunkt von f ist. Die zweite Aussage folgt unmittelbar aus der Tatsache, dass f konvex und p 1 6= 1 ist. An dieser Stelle sei noch einmal auf die Folien 32 bis 58 der Präsentation verwiesen. Hinweis. Mit f 0 (1) bezeichnen wir die linksseitige Ableitung der Funktion f an der Stelle 1. Man kann sie wie folgt berechnen: f 0 (1) = lim h↓0 = lim f 0 (s) s↑1 = lim Mittelwertsatz f (1)−f (1−h) h ∞ P s↑1 k=0 = Lemma von der ∞ P pk · ksk−1 lim pk · ksk−1 k=0 s↑1 = E [L] =: m monotonen Konvergenz Sprechweise. Wir nennen unseren Galton-Watson-Prozess: subkritisch kritisch superkritisch 3.3 wenn m < 1 wenn m = 1 wenn m > 1 Antwort auf die Zusatzfrage Um unsere Zusatzfrage, ob man im Falle Zn → ∞ vielleicht sogar schon eine Aussage darüber machen kann, wie schnell die Zn wachsen, zu beantworten, stellen wir zunächst folgende Beobachtung an. Satz. Wenn 0 < m < ∞ ist, dann ist (Zn /mn ) ein Martingal. Beweis. Rechne nach: i h Zn+1 E m n+1 Zn = E = = = 1 mn+1 1 mn+1 E 1 mn+1 1 mn+1 Zn P i=1 Z n P Zn P i=1 Zn P i=1 i=1 (n+1) Li (n+1) Li Zn Zn i h (n+1) E Li Zn m = Zn ·m mn+1 = Zn mn Galton-Watson-Bäume Seite 6 Corollar. Es gilt: E [Zn ] = mn Beweis. Wir wissen, dass (Zn /mn ) ein Martingal ist. Also gilt: Zn Z0 n n E [Zn ] = m · E =m ·E = mn · E [1] = mn mn m0 n Bemerkung. Unser Martingal (Zn /m ) ist nichtnegativ, also konvergiert es nach dem Konvergenzsatz für Martingale fast sicher gegen eine endliche Zufallsvariable W . Das heißt: Zn → W fast sicher mit 0 ≤ W < ∞ mn Wir unterscheiden nun zwei Fälle: Wenn W > 0 ist, wächst die Folge (Zn ) bis auf einen zufälligen Faktor wie (mn ). Wenn aber W = 0 ist, konvergiert der Quotient Zn /mn gegen 0, was nichts anderes heißt, als dass die Folge (Zn ) langsamer wächst als (mn ). Im Moment können wir allerdings noch nicht absehen, wie die Zufallsvariable W verteilt sein wird, wann sie echt positive Werte annimmt und wann sie den Wert 0 annimmt. Im nächsten Abschnitt kümmern wir uns genau um diese Frage. 4 Untersuchung der Zufallsvariablen W Vereinbarung. Von nun an sei stets p1 6= 1. 4.1 Erbliche Eigenschaften Definition. Sei T ein Galton-Watson Baum und seien T (1) , T (2) , . . . , T (Z1 ) die Nachkommenbäume der Individuen der ersten Generation. Eine Eigenschaft des Galton-Watson-Baumes T heißt erblich, wenn gilt: (i) T hat diese Eigenschaft ⇒ T (1) , T (2) , . . . , T (Z1 ) haben diese Eigenschaft. (ii) Alle endlichen Bäume haben diese Eigenschaft. Lemma. Jede erbliche Eigenschaft hat entweder Wahrscheinlichkeit 0 oder Wahrscheinlichkeit 1, gegeben dem Ereignis, dass der entsprechende Baum nicht ausstirbt. Beweis. Betrachte eine beliebige erbliche Eigenschaft und definiere: A := {Bäume mit dieser Eigenschaft} Es gilt: Ws ({T ∈ A}) = E [Ws ({T ∈ A} | Z1 )] ≤ E Ws T (1) ∈ A, . . . , T (Z1 ) ∈ A | Z1 Satz von der totalen Wahrscheinlichkeit = E Ws T (1) ∈ A | Z1 · · · Ws T (Z1 ) ∈ A | Z1 h i = E Ws ({T ∈ A})Z1 = f (Ws ({T ∈ A})) Galton-Watson-Bäume Seite 7 Zu Anfang dieses Abschnittes haben wir vereinbart, dass p1 6= 1. Wir wissen also, dass die Erzeugendenfunktion f strikt konvex ist mit f (q) = q und f (1) = 1. Anhand des Graphen von f kann man erkennen: Ws ({T ∈ A}) ∈ [0, q] ∪ {1} Andererseits gilt, da alle endlichen Bäume zu A gehören: Ws ({T ∈ A}) ≥ q Es folgt die Behauptung. Sätzchen. Sei 0 < m < ∞. Dann gilt, gegeben dem Ereignis, dass (Zn ) nicht ausstirbt, entweder W = 0 fast sicher oder W > 0 fast sicher. Beweis. Das Ereignis {W = 0} ist offensichtlich erblich, die Behauptung folgt unmittelbar aus dem eben bewiesenen Lemma. Nun sind wir schon ein Stückchen klüger. Wir wissen, dass W entweder fast sicher echt positiv oder fast sicher 0 ist. Dies gibt Anlass zur Hoffnung, dass wir unsere Frage vom Ende des dritten Abschnitts doch noch beantworten können. 4.2 Ausblick Kesten-Stigum-Theorem (1966). Sei 0 < m < ∞. Dann sind die folgenden Aussagen äquivalent: (a) Ws({W = 0}) = q (b) E[W ] = 1 (c) E[L log+ L] < ∞ Galton-Watson-Bäume Seite 8 Besonderes Augenmerk sollten wir auf die Folgerung (c) ⇒ (a) legen. Wenn ein Galton-Watson-Prozess (Zn ) mit 0 < m < ∞ die Bedingung E[L log+ L] < ∞ erfüllt und wir einmal davon ausgehen, dass er nicht ausstirbt, dann wissen wir bereits, dass er fast sicher bis auf einen zufälligen Faktor so wächst wie (mn ). Doch selbst für Galton-Watson-Prozesse, die dieser schwachen Bedingung nicht genügen, gilt eine ähnliche Aussage. Seneta-Heyde-Theorem. Sei 0 < m < ∞. Dann gibt es Konstanten cn sodass gilt: (a) lim Zn /cn existiert fast sicher in [0, ∞) (b) Ws({lim Zn /cn = 0}) = q (c) cn+1 /cn → m