Stochastische Prozesse Abschnitt 5 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik Wintersemester 2016/2017 Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 1 5. Markowsche Ketten 1. Bemerkung Eine einfache Klasse von Zufallsfolgen bilden die Folgen von unabhängigen (oft identisch verteilten) Zufallsgrößen, die eine große Rolle in der Wahrscheinlichkeitstheorie spielen, man denke an das Gesetz der großen Zahlen, den zentralen Grenzwertsatz oder den Begriff der mathematischen Stichprobe. I Sind Folgen von abhängigen Zufallsgrößen zu modellieren, ist eine besondere und relative einfache Form der Abhängigkeit gegeben, wenn eine gewisse Gedächtnislosigkeit“ angenommen werden kann. ” Unterscheidet man für die Zeit als Indexmenge Vergangenheit, Gegenwart und Zukunft, dann gibt es viele Situationen und Modelle, bei der die zukünftige Entwicklung in der Zeit nur von der Gegenwart, nicht aber von der Vergangenheit abhängt. I In der deterministischen Theorie werden solche Erscheinungen z.B. durch Differentialgleichungen oder Differenzengleichungen erster Ordnung modelliert, eine Entsprechung in der Stochastik ist die Markowsche Eigenschaft. Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 2 Beispiel - zufällige Irrfahrt 2. Jemand startet zum Zeitpunkt 0 im Punkt 0 und in den nachfolgenden ganzzahligen Zeitpunkten entscheidet er sich jeweils z.B. mit Wahrscheinlichkeit 0.5 zu einem Schritt der Länge 1 nach rechts oder links, unabhängig von den vorherigen Entscheidungen. I Wird die zufällige Position zum Zeitpunkt n ∈ N0 durch die Zufallsgröße ξn modelliert, erhalten wir eine Folge (ξn ; n ∈ N0 ) von diskreten Zufallsgrößen mit Wertebereich Z (man spricht von der Zustandsmenge oder dem Zustandsraum Z), die nicht unabhängig voneinander sind. Kennen wir aber die Realisierung ξn (ω) für ein n ∈ N , dann hat durch die Unabhängigkeit der Entscheidungen die Folge der Schritte bis zu diesem Zeitpunkt n keinen Einfluss auf die Wahrscheinlichkeiten für zukünftige Positionen (Zustände), insbesondere gilt für ik ∈ Z ; k, n ∈ N , P(ξn+1 = in+1 |ξn = in , ξn−1 = in−1 , . . . , ξ1 = i1 ) = P(ξn+1 = in+1 |ξn = in ) Prof. Dr. Hans-Jörg Starkloff (falls definiert) . Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 3 Voraussetzung 3. Voraussetzung Wir betrachten in diesem Kapitel Folgen (ξn ; n ∈ N0 ) von Zufallsgrößen mit diskreter Verteilung, als mögliche Werte werden wir die endliche Teilmenge der Menge der natürlichen Zahlen X := {1, 2, . . . , r } mit r ∈ N betrachten, diese Menge wird auch Zustandsmenge oder Zustandsraum und deren Elemente als Zustände bezeichnet. Die Zustandsmenge wird mit der Potenzmenge P(X) als σ−Algebra aller Teilmengen ausgestattet und ergibt den messbaren Raum (X, P(X)) . Wir werden weiterhin immer voraussetzen, dass gilt ∀ i = 1, . . . , r ∃ n ∈ N0 : P(ξn = i) > 0 . I Die nachfolgende Definition einer Markowschen Kette kann analog für abzählbar unendliche Zustandsmengen und auch für den zeitstetigen Fall gegeben werden. Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 4 Definition 4. Definition (i) (ξn ; n ∈ N0 ) ist eine Markowsche Kette (Markow-Kette) mit Zustandsraum X , falls für beliebige n ∈ N , ik ∈ X , k ∈ N0 gilt P(ξn+1 = in+1 |ξn = in , ξn−1 = in−1 , . . . , ξ0 = i0 ) = P(ξn+1 = in+1 |ξn = in ) , (1) wenn die bedingten Wahrscheinlichkeiten definiert sind, d.h. falls P(ξn = in , ξn−1 = in−1 , . . . , ξ0 = i0 ) > 0 gilt. (ii) Wird eine endliche Folge (ξn ; n ∈ {0, 1, . . . , N}) betrachtet, wird die Bedingung (1) für n = 1, . . . , N − 1 gefordert. (iii) Hängen die Übergangswahrscheinlichkeiten P(ξn+1 = j|ξn = i) =: pij i, j ∈ X , nicht von n ab, spricht man von einer homogenen Markowschen Kette (oder einer Markowschen Kette mit stationären Übergangswahrscheinlichkeiten). Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 5 Bemerkung 5. Bemerkung (i) In der Vorlesung werden (vor allem) homogene Markowsche Ketten mit der Zustandsmenge X = {1, . . . , r } betrachtet, welche der Voraussetzung 3 genügen. Diese werden hier endliche homogene Markowsche Ketten genannt. (ii) Der allgemeinere Begriff, insbesondere im Hinblick auf beliebige, nicht nur diskrete Verteilungen der Zufallsgrößen ξt und Parametermengen T ⊂ R ist der Begriff eines Markowschen Zufallsprozesses. Die Vergabe von Attributen wie stetig oder diskret bzw. der Gebrauch der Bezeichnungen Kette bzw. Prozess ist in der Literatur nicht eindeutig. (iii) Für endliche homogene Markowsche Ketten können zum Teil grafische Methoden zur Veranschaulichung und Analyse genutzt werden. (iv) Bei der Untersuchung von endlichen homogenen Markowschen Ketten spielen die lineare Algebra und die Matrizentheorie eine nicht unwesentliche Rolle. Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 6 Stochastische Matrizen 6. Definition Eine r × r −Matrix Q = (qij )i,j=1,...,r ist eine stochastische Matrix, falls gilt (i) qij ≥ 0 ∀ i, j = 1, . . . , r ; r X qij = 1 ∀ i = 1, . . . , r , (ii) j=1 d.h. für jede Zeile ist die Summe der Elemente gleich 1. 7. Satz Sei (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette mit Übergangswahrscheinlichkeiten pij , i, j = 1, . . . , r gemäß Bemerkung 5 (i). Dann ist die Matrix P := (pij )i,j=1,...,r der Übergangswahrscheinlichkeiten eine stochastische Matrix. Diese Matrix wird auch Übergangsmatrix der Markowschen Kette genannt. Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 7 Äquivalente Bedingungen für stochastische Matrizen 8. Definition Ein Vektor Rr 3 f = (f1 , . . . , fr )T mit r ∈ N ist nichtnegativ, falls gilt ∀ i = 1, . . . , r : fi ≥ 0 , dies wird durch f ≥ 0 bezeichnet. 9. Satz Sei Q = (qij )i,j=1,...,r eine r × r −Matrix (r ∈ N). Dann sind die folgenden Aussagen äquivalent. (i) Q ist eine stochastische Matrix. (ii) (a) ∀ Rr 3 f ≥ 0 : Qf ≥ 0 und (b) für Rr 3 1 = (1, . . . , 1)T gilt Q1 = 1 , d.h. der Vektor 1 ist ein Eigenvektor der Matrix Q zum Eigenwert 1. (iii) Ist µ = (µ1 , . . . , µr ) eine Wahrscheinlichkeitsverteilung auf r X X = {1, . . . , r } , d.h. gelten µi ≥ 0 , i = 1, . . . , r und µi = 1 , i=1 dann ist auch µQ eine Wahrscheinlichkeitsverteilung auf X = {1, . . . , r } . Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 8 Produkte von stochastischen Matrizen 10. Satz Seien Q 0 = (qij0 )i,j=1,...,r und Q 00 = (qij00 )i,j=1,...,r stochastische Matrizen und Q = (qij )i,j=1,...,r = Q 0 Q 00 . (i) Dann ist auch Q eine stochastische Matrix, insbesondere sind auch die Potenzen (Q 0 )n und (Q 00 )n für beliebige n ∈ N stochastische Matrizen. (ii) Gilt zusätzlich qij00 > 0 ∀ i, j = 1, . . . , r , dann gilt auch qij > 0 ∀ i, j = 1, . . . , r . Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 9 Endlichdimensionale Verteilungen 11. Satz Sei (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette mit Übergangswahrscheinlichkeiten pij , i, j = 1, . . . , r , gemäß Bemerkung 5 (i) und mit der Wahrscheinlichkeitsverteilung (0) (0) µ(0) = (µ1 , . . . , µr ) der Zufallsgröße ξ0 (Anfangs- oder (0) Startverteilung) , d.h. P(ξ0 = i) = µi , i = 1, . . . , r . Dann gilt für beliebige n ∈ N, i0 , . . . , in ∈ {1, . . . , r } (0) P(ξ0 = i0 , ξ1 = i1 , . . . , ξn = in ) = µi0 · pi0 i1 · . . . · pin−1 in . (2) Gilt umgekehrt für eine Zufallsfolge ξ = (ξn ; n ∈ N0 ) mit Zustandsraum X = {1, . . . , r } die Formel (2) mit einer stochastischen Matrix P = (pij )i,j=1,...,r und einer (0) (0) Wahrscheinlichkeitsverteilung µ(0) = (µ1 , . . . , µr ) auf X , dann ist ξ eine endliche homogene Markowsche Kette mit Übergangsmatrix P und Anfangsverteilung µ(0) . Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 10 Existenz von endlichen homogenen Markowschen Ketten 12. Satz Seien P = (pij )i,j=1,...,r eine stochastische Matrix und (0) (0) µ(0) = (µ1 , . . . , µr ) eine Wahrscheinlichkeitsverteilung auf {1, . . . , r } . Dann existiert auf einem geeigneten Wahrscheinlichkeitsraum (Ω, F, P) eine endliche homogene Markowsche Kette (ξn ; n ∈ N0 ) mit Übergangsmatrix P und Anfangsverteilung µ(0) . Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 11 Allgemeinere Markowsche Bedingung 13. Satz Sei (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette gemäß Bemerkung 5 (i). Dann gilt, falls die bedingten Wahrscheinlichkeiten definiert sind, für beliebige m, n ∈ N , i0 , . . . , in , in+1 , . . . , in+m ∈ {1, . . . , r } P(ξn+m = in+m , . . . , ξn+1 = in+1 |ξn = in , ξn−1 = in−1 , . . . , ξ0 = i0 ) = P(ξn+m = in+m , . . . , ξn+1 = in+1 |ξn = in ) . Allgemeiner gilt, falls die bedingten Wahrscheinlichkeiten definiert sind, für beliebige Bk ⊆ X , k = n + 1, . . . , n + m und i0 , . . . , in ∈ {1, . . . , r } P(ξn+m ∈ Bn+m , . . . , ξn+1 ∈ Bn+1 |ξn = in , ξn−1 = in−1 , . . . , ξ0 = i0 ) = P(ξn+m ∈ Bn+m , . . . , ξn+1 ∈ Bn+1 |ξn = in ) . Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 12 Bedingte Unabhängigkeit von Zukunft und Vergangenheit 14. Satz Sei (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette gemäß Bemerkung 5 (i). Dann gilt, falls die bedingten Wahrscheinlichkeiten definiert sind, für beliebige m, n ∈ N , i0 , . . . , in , in+1 , . . . , in+m ∈ {1, . . . , r } , P(ξn+m = in+m , . . . , ξn+1 = in+1 , ξn−1 = in−1 , . . . , ξ0 = i0 |ξn = in ) = P(ξn+m = in+m , . . . , ξn+1 = in+1 |ξn = in )· P(ξn−1 = in−1 , . . . , ξ0 = i0 |ξn = in ) . Diese Bedingung ist auch eine hinreichende Bedingung dafür, dass eine zufällige Folge (ξn ; n ∈ N0 ) mit Zustandsraum {1, . . . , r } eine Markowsche Kette ist. Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 13 n−Schritt-Übergangswahrscheinlichkeiten 15. Definition Sei (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette gemäß Bemerkung 5 (i) mit Übergangsmatrix P = (pij )i,j=1,...,r (0) (0) und mit der Anfangsverteilung µ(0) = (µ1 , . . . , µr ) . Die Wahrscheinlichkeiten (n) P(ξm+n = j|ξm = i) =: pij (3) für beliebige i, j ∈ {1, . . . , r } , m, n ∈ N mit P(ξm = i) > 0 heißen n−Schritt Übergangswahrscheinlichkeiten. I Es wird außerdem (1) pij = pij (0) und pij = δij für beliebige i, j ∈ {1, . . . , r } gesetzt. Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 14 Die Chapman-Kolmogorowschen Gleichungen 16. Satz Sei (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette gemäß Bemerkung 5 (i) mit Übergangsmatrix P = (pij )i,j=1,...,r (0) (0) und mit der Anfangsverteilung µ(0) = (µ1 , . . . , µr ) . (i) Die Familie der n−Schritt-Übergangswahrscheinlichkeiten erfüllen die Chapman-Kolmogorowschen Gleichungen (n+1) pij = r X (n) pik pkj k=1 bzw. allgemeiner für m, n ∈ N0 (n+m) pij = r X (n) (m) pik pkj k=1 (ii) Für die Matrix der n−Schritt-Übergangswahrscheinlichkeiten gilt (n) P n = pij . i,j=1,...,r Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 15 Zustandswahrscheinlichkeiten der Markowschen Kette 17. Satz Sei (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette gemäß Bemerkung 5 (i) mit Übergangsmatrix P = (pij )i,j=1,...,r (0) (0) (0) und mit der Anfangsverteilung µ = (µ1 , . . . , µr ) . (n) Desweiteren sei P n = pij i,j=1,...,r die n−te Potenz der Übergangsmatrix (n ∈ N) . Dann gilt für beliebige j ∈ {1, . . . , r } P(ξn = j) =: (n) µj = µ (0) P n j = r X (0) (n) µi pij , (4) i=1 dabei werde mit µ(n) die Wahrscheinlichkeitsverteilung von ξn auf {1, . . . , r } bezeichnet. Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 16 Beispiel 18. Die Eckpunkte des Einheitsquadrats seien in Uhrzeigerrichtung durchnummeriert. Ein Teilchen befindet sich zum Zeitpunkt 0 im Punkt mit der Nummer 1 und bewegt sich zu ganzzahligen Zeitpunkten mit Wahrscheinlichkeit 0.5 in Uhrzeigerrichtung und mit Wahrscheinlichkeit 0.5 gegen Uhrzeigerrichtung zum nächsten Eckpunkt, unabhängig von den vorherigen Bewegungen. Mit ξn wird die Nummer der Position des Teilchens nach der Bewegung zum Zeitpunkt n bezeichnet. Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 17 Erreichbare Zustände 19. Definition Sei (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette gemäß Bemerkung 5 (i) mit Übergangsmatrix P = (pij )i,j=1,...,r (0) (0) und mit der Anfangsverteilung µ(0) = (µ1 , . . . , µr ) . (i) Der Zustand j heißt vom Zustand i aus erreichbar, wenn (n) ∃ n ∈ N : pij > 0 . Dies soll durch i → j bezeichnet werden. (ii) Die Zustände i und j heißen gegenseitig erreichbar, wenn i → j und j → i . Dies soll durch i ↔ j bezeichnet werden. I Der Begriff der gegenseitigen Erreichbarkeit definiert in der Zustandsmenge eine symmetrische und transitive Relation, die im Allgemeinen nicht reflexiv ist. Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 18 Irreduzible und reduzible Markowsche Ketten 20. Definition Eine Markowsche Kette heißt irreduzibel, wenn alle ihre Zustände gegenseitig erreichbar sind, sonst wird sie reduzibel genannt. 21. Beispiel Gegeben seien Markowsche Übergangsmatrizen 0.5 0.5 0 0 0.5 0 0.5 0 P1 = 0 0.5 0 0.5 0 0 0.5 0.5 Ketten mit r = 4 und 0.5 0.5 0 0 0 , P2 = 0.5 0.5 0 . 0 0 0.4 0.6 0 0 0.7 0.3 Die Markowsche Kette mit Übergangsmatrix P1 ist irreduzibel, die mit Übergangsmatrix P2 reduzibel. Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 19 Aperiodische Zustände und Markowsche Ketten 22. Definition Sei (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette gemäß Bemerkung 5 (i) mit Übergangsmatrix P = (pij )i,j=1,...,r (0) (0) und mit der Anfangsverteilung µ(0) = (µ1 , . . . , µr ) . (i) Die Periode des Zustandes i ist definiert durch (n) d(i) := ggT{n ∈ N : pii > 0} . (ii) Ist d(i) = 1 , dann heißt der Zustand i aperiodisch. (iii) Die Markowsche Kette wird aperiodisch genannt, falls alle ihre Zustände aperiodisch sind. Im gegenteiligen Fall heißt sie periodisch. 23. Bemerkung (n) (d·n) Aus pii > 0 folgt auch pii > 0 für beliebige d ∈ N . 24. Die Markowsche Kette aus Beispiel 18 ist periodisch, die Ketten aus Beispiel 21 sind aperiodisch. Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 20 Eigenschaften aperiodischer Markowscher Ketten 25. Satz Sei (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette gemäß Bemerkung 5 (i) mit Übergangsmatrix P = (pij )i,j=1,...,r (0) (0) und mit der Anfangsverteilung µ(0) = (µ1 , . . . , µr ) . (i) Ist die Markowsche Kette aperiodisch, dann existiert ein N ∈ N , so dass für beliebige i ∈ {1, . . . , r } und n ≥ N gilt (n) pii > 0 . (ii) Ist die Markowsche Kette irreduzibel und aperiodisch, dann existiert ein M ∈ N , so dass für beliebige i, j ∈ {1, . . . , r } und n ≥ M gilt (n) pij > 0 . Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 21 Stationäre Verteilung 26. Definition Sei ξ = (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette gemäß Bemerkung 5 (i) mit Übergangsmatrix P = (pij )i,j=1,...,r (0) (0) und mit der Anfangsverteilung µ(0) = (µ1 , . . . , µr ) . Eine Wahrscheinlichkeitsverteilung µs = (µs1 , . . . , µsr ) heißt stationäre Verteilung zur Markowschen Kette ξ oder zur Übergangsmatrix P , falls gilt µs P = µs . 27. Bemerkung Ist für eine solche Markowsche Kette die Anfangsverteilung gleich einer stationären Verteilung, µ(0) = µs , dann sind auch die Verteilungen der Zufallsgrößen ξn gleich dieser stationären Verteilung, d.h. es gilt µ(n) = µs , n ∈ N0 . Die Zufallsfolge ist dann eine stationäre Zufallsfolge. Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 22 Existenz von stationären Verteilungen 28. Satz Sei ξ = (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette gemäß Bemerkung 5 (i) mit Übergangsmatrix P = (pij )i,j=1,...,r (0) (0) und mit der Anfangsverteilung µ(0) = (µ1 , . . . , µr ) . Die Markowsche Kette sei irreduzibel und aperiodisch. Dann gelten: (i) Die Markowsche Kette ξ besitzt eine eindeutig bestimmte stationäre Verteilung µs . (ii) Für die Zustandsverteilungen µ(n) gilt lim dTV (µ(n) , µs ) = 0 . n→∞ Dabei bezeichnet dTV den Totalvariationsabstand zwischen Wahrscheinlichkeitsverteilungen auf {1, . . . , r } , der definiert ist durch r dTV (µ(n) , µs ) := 1 X (n) |µi − µsi | . 2 i=1 Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 23 Reversible Markowsche Ketten 29. Definition Ist P = (pij )i,j=1,...,r eine stochastische Matrix, dann heißt eine Wahrscheinlichkeitsverteilung µ = (µ1 , . . . , µr ) reversibel bezüglich P oder einer Markowschen Kette mit Übergangsmatrix P , falls ∀ i, j = 1, . . . , r : µi pij = µj pji . 30. Satz Sei ξ = (ξn ; n ∈ N0 ) eine endliche homogene Markowsche Kette gemäß Bemerkung 5 (i) mit Übergangsmatrix P = (pij )i,j=1,...,r . Ist µ eine reversible Verteilung für diese Markowsche Kette, dann ist µ auch eine stationäre Verteilung für ξ (bzw. für P) . 31. Bemerkung Diese Eigenschaft wird z.B. häufig bei Monte-Carlo-Simulationen benutzt (”MCMC”, ”Markov Chain Monte Carlo”-Verfahren). Prof. Dr. Hans-Jörg Starkloff Stochastische Prozesse Abschnitt 5 Version: 2. Februar 2017 24