Vorlesung 11a Markovketten

Werbung
Vorlesung 11a
Markovketten
Teil 2
1
Erwartete Treffzeiten
2
Erwartete Treffzeiten
Sei X eine Markovkette mit Zustandsraum S
und Übergangsmatrix P .
Erwartete Treffzeiten
Sei X eine Markovkette mit Zustandsraum S
und Übergangsmatrix P .
Für eine Teilmenge C ⊂ S ist
TC = min{n : n ≥ 0, Xn ∈ C}
die erste Treffzeit von C.
Erwartete Treffzeiten
Sei X eine Markovkette mit Zustandsraum S
und Übergangsmatrix P .
Für eine Teilmenge C ⊂ S ist
TC = min{n : n ≥ 0, Xn ∈ C}
die erste Treffzeit von C.
Es geht um die Berechnung von Ea[TC ]:
Für a ∈
/C
Zerlegung von Ea[TC ]
nach dem ersten Schritt:
b
a
C
Erst ein Schritt
von a nach b gemäß P (a, b),
S
dann “Neustart” in b:
3
Für a ∈
/C
Zerlegung von Ea[TC ]
nach dem ersten Schritt:
b
a
C
Erst ein Schritt
von a nach b gemäß P (a, b),
S
dann “Neustart” in b:
4
Für a ∈
/C
Zerlegung von Ea[TC ]
nach dem ersten Schritt:
b
a
C
Erst ein Schritt
S
von a nach b gemäß P (a, b),
dann “Neustart” in b:
Ea[TC ] = 1 +
X
b∈S
P (a, b) Eb[TC ]
Für a ∈
/C
Zerlegung von Ea[TC ]
nach dem ersten Schritt:
b
a
C
Erst ein Schritt
S
von a nach b gemäß P (a, b),
dann “Neustart” in b:
Ea[TC ] = 1 +
X
b∈S
P (a, b) Eb[TC ]
(Formales Argument hierfür: siehe Buch Seite 106.)
Und für a ∈ C
ist Pa(TC = 0) = 1,
a
C
also
Ea[TC ] = 0.
S
5
Und für a ∈ C
ist Pa(TC = 0) = 1,
a
C
also
Ea[TC ] = 0.
S
6
b
a
Fazit:
C
S
a 7→ e(a) := Ea[TC ] erfüllt das Gleichungssystem
e(a) = 1 +
X
P (a, b) e(b)
für a ∈
/ C,
b∈S
e(a) = 0
für a ∈ C.
7
Beispiel:
Erwartete Zeit bis zum ersten Erfolg.
q
n
p
e
8
Beispiel:
Erwartete Zeit bis zum ersten Erfolg.
q
n
p
e
En[Te] = 1 + q En[Te] + pEe[Te] .
Beispiel:
Erwartete Zeit bis zum ersten Erfolg.
q
n
p
e
En[Te] = 1 + q En[Te] + pEe[Te] .
Wegen Ee[Te] = 0 wird dies gelöst durch
Beispiel:
Erwartete Zeit bis zum ersten Erfolg.
q
n
p
e
En[Te] = 1 + q En[Te] + pEe[Te] .
Wegen Ee[Te] = 0 wird dies gelöst durch
En[Te] = 1/p.
Beispiel 2:
Einfache Irrfahrt auf den ganzen Zahlen: E0[T1] =?
9
Beispiel 2:
Einfache Irrfahrt auf den ganzen Zahlen: E0[T1] =?
Zerlegung nach dem ersten Schritt:
1 0 + 1 E [T ]
E0[T1] = 1 + 2
2 −1 1
Beispiel 2:
Einfache Irrfahrt auf den ganzen Zahlen: E0[T1] =?
Zerlegung nach dem ersten Schritt:
1 0 + 1 E [T ]
E0[T1] = 1 + 2
2 −1 1
Andererseits gilt:
E−1[T1] = E−1[T0] + E0[T1] = 2E0[T1]
Beispiel 2:
Einfache Irrfahrt auf den ganzen Zahlen: E0[T1] =?
Zerlegung nach dem ersten Schritt:
1 0 + 1 E [T ]
E0[T1] = 1 + 2
2 −1 1
Andererseits gilt:
E−1[T1] = E−1[T0] + E0[T1] = 2E0[T1]
Zusammen: E0[T1] = 1 + E0[T1],
Beispiel 2:
Einfache Irrfahrt auf den ganzen Zahlen: E0[T1] =?
Zerlegung nach dem ersten Schritt:
1 0 + 1 E [T ]
E0[T1] = 1 + 2
2 −1 1
Andererseits gilt:
E−1[T1] = E−1[T0] + E0[T1] = 2E0[T1]
Zusammen: E0[T1] = 1 + E0[T1],
mit der Lösung E0[T1] = ∞.
Transport von Verteilungen
Pρ(Xn = c)
zerlegt nach Xn−1 ergibt die Rekursion
10
Transport von Verteilungen
Pρ(Xn = c)
zerlegt nach Xn−1 ergibt die Rekursion
Pρ(Xn = c) =
X
b∈S
Pρ(Xn−1 = b) P (b, c)
Mit
πn(·) := Pρ(Xn ∈ ·) ,
n = 0, 1, . . .
lautet diese Rekursion
Transport von Verteilungen
Pρ(Xn = c)
zerlegt nach Xn−1 ergibt die Rekursion
Pρ(Xn = c) =
X
b∈S
Pρ(Xn−1 = b) P (b, c)
Mit
πn(·) := Pρ(Xn ∈ ·) ,
n = 0, 1, . . .
lautet diese Rekursion
πn(c) =
X
b∈S
πn−1(b)P (b, c) ,
n≥1
Zweischritt-Übergangswahrscheinlichkeiten
P 2(a, c) := Pa(X2 = c) ,
n ≥ 0 , a, c ∈ S
11
Zweischritt-Übergangswahrscheinlichkeiten
P 2(a, c) := Pa(X2 = c) ,
n ≥ 0 , a, c ∈ S
Zerlegungen nach dem Zwischenschritt:
Pa(X2 = c) =
X
b∈S
Pa(X1 = b)Pb(X1 = c)
Zweischritt-Übergangswahrscheinlichkeiten
P 2(a, c) := Pa(X2 = c) ,
n ≥ 0 , a, c ∈ S
Zerlegungen nach dem Zwischenschritt:
Pa(X2 = c) =
X
b∈S
2
P (a, c) =
Pa(X1 = b)Pb(X1 = c)
X
b∈S
P (a, b) P (b, c)
Zweischritt-Übergangswahrscheinlichkeiten
P 2(a, c) := Pa(X2 = c) ,
n ≥ 0 , a, c ∈ S
Zerlegungen nach dem Zwischenschritt:
Pa(X2 = c) =
X
b∈S
2
P (a, c) =
Pa(X1 = b)Pb(X1 = c)
X
P (a, b) P (b, c)
b∈S
P 2 = (P 2(a, c))a,c∈S lässt sich also auffassen als
Produkt der Matrix P mit sich selbst.
Mehrschritt-Übergangswahrscheinlichkeiten
P n(a, c) := Pa(Xn = c) ,
n ≥ 0 , a, c ∈ S
12
Mehrschritt-Übergangswahrscheinlichkeiten
P n(a, c) := Pa(Xn = c) ,
n ≥ 0 , a, c ∈ S
Zerlegung nach dem ersten Schritt:
P n(a, c)
=
X
b∈S
P (a, b) P n−1(b, c)
Mehrschritt-Übergangswahrscheinlichkeiten
P n(a, c) := Pa(Xn = c) ,
n ≥ 0 , a, c ∈ S
Zerlegung nach dem ersten Schritt:
P n(a, c)
=
X
P (a, b) P n−1(b, c)
b∈S
Zerlegung nach dem letzten Schritt:
P n(a, c)
=
X
b∈S
P n−1(a, b) P (b, c)
Mehrschritt-Übergangswahrscheinlichkeiten
P n(a, c) := Pa(Xn = c) ,
n ≥ 0 , a, c ∈ S
Zerlegung nach dem ersten Schritt:
P n(a, c)
=
X
P (a, b) P n−1(b, c)
b∈S
Zerlegung nach dem letzten Schritt:
P n(a, c)
=
X
P n−1(a, b) P (b, c)
b∈S
P n = (P n(a, c))a,c∈S lässt sich also auffassen als
n-te Matrixpotenz von P .
Gleichgewichtsverteilungen
13
Gleichgewichtsverteilungen
Eine Verteilung π auf S heißt
Gleichgewichtsverteilung zur Übergangsmatrix P ,
wenn eine der folgenden äquivalenten Bedingungen erfüllt ist:
Gleichgewichtsverteilungen
Eine Verteilung π auf S heißt
Gleichgewichtsverteilung zur Übergangsmatrix P ,
wenn eine der folgenden äquivalenten Bedingungen erfüllt ist:
(G1)
X
a∈S
π(a)P (a, b) = π(b) ,
b∈S.
Gleichgewichtsverteilungen
Eine Verteilung π auf S heißt
Gleichgewichtsverteilung zur Übergangsmatrix P ,
wenn eine der folgenden äquivalenten Bedingungen erfüllt ist:
(G1)
X
π(a)P (a, b) = π(b) ,
b∈S.
a∈S
(G2)
Pπ (X1 = b) = Pπ (X0 = b) ,
b∈S
Gleichgewichtsverteilungen
Eine Verteilung π auf S heißt
Gleichgewichtsverteilung zur Übergangsmatrix P ,
wenn eine der folgenden äquivalenten Bedingungen erfüllt ist:
(G1)
X
π(a)P (a, b) = π(b) ,
b∈S.
a∈S
(G2)
Pπ (X1 = b) = Pπ (X0 = b) ,
b∈S
(Dann haben auch X2, X3, . . . die Verteilung π.)
Reversible Gleichgewichtsverteilungen
Hinreichend für
(G2)
Pπ (X1 = b) = Pπ (X0 = b) ,
b∈S
ist die Bedingung
(R)
Pπ (X0 = a, X1 = b) = Pπ (X0 = b, X1 = a) ,
a, b ∈ S
14
Reversible Gleichgewichtsverteilungen
Hinreichend für
(G2)
Pπ (X1 = b) = Pπ (X0 = b) ,
b∈S
ist die Bedingung
(R)
Pπ (X0 = a, X1 = b) = Pπ (X0 = b, X1 = a) ,
a, b ∈ S
(Denn dann ist das Paar (X0, X1) so verteilt wie (X1, X0),
also insbesondere X0 so wie X1.)
Gleichbedeutend mit
(R)
Pπ (X0 = a, X1 = b) = Pπ (X0 = b, X1 = a) ,
a, b ∈ S
ist
π(a)P (a, b) = π(b)P (b, a) ,
a, b ∈ S .
π heißt dann reversible Gleichgewichtsverteilung zu P .
15
Beispiel
für eine nicht reversible Gleichgewichtsverteilung:
16
Beispiel
für eine nicht reversible Gleichgewichtsverteilung:
Zyklische Irrfahrt auf S = {a, b, c}, mit
Beispiel
für eine nicht reversible Gleichgewichtsverteilung:
Zyklische Irrfahrt auf S = {a, b, c}, mit
P (a, b) = P (b, c) = P (c, a) := p,
Beispiel
für eine nicht reversible Gleichgewichtsverteilung:
Zyklische Irrfahrt auf S = {a, b, c}, mit
P (a, b) = P (b, c) = P (c, a) := p,
P (b, a) = P (c, b) = P (a, c) := 1 − p
Beispiel
für eine nicht reversible Gleichgewichtsverteilung:
Zyklische Irrfahrt auf S = {a, b, c}, mit
P (a, b) = P (b, c) = P (c, a) := p,
P (b, a) = P (c, b) = P (a, c) := 1 − p
Die uniforme Verteilung auf S
ist eine Gleichgewichtsverteilung zu P .
Beispiel
für eine nicht reversible Gleichgewichtsverteilung:
Zyklische Irrfahrt auf S = {a, b, c}, mit
P (a, b) = P (b, c) = P (c, a) := p,
P (b, a) = P (c, b) = P (a, c) := 1 − p
Die uniforme Verteilung auf S
ist eine Gleichgewichtsverteilung zu P .
Nur für p = 1/2 ist sie reversibel.
Beispiel:
Die einfache Irrfahrt auf dem Würfel S = {0, 1}3:
17
Beispiel:
Die einfache Irrfahrt auf dem Würfel S = {0, 1}3:
Von jedem a ∈ S geht man in einem Schritt
zu einem rein zufällig ausgewählten Nachbarn.
Beispiel:
Die einfache Irrfahrt auf dem Würfel S = {0, 1}3:
Von jedem a ∈ S geht man in einem Schritt
zu einem rein zufällig ausgewählten Nachbarn.
(Zwei Elemente von S heißen benachbart,
wenn sie sich in genau einer Komponente unterscheiden.)
Für benachbarte Knoten a und b ist hier P (a, b) = 1/3.
Beispiel:
Die einfache Irrfahrt auf dem Würfel S = {0, 1}3:
Von jedem a ∈ S geht man in einem Schritt
zu einem rein zufällig ausgewählten Nachbarn.
(Zwei Elemente von S heißen benachbart,
wenn sie sich in genau einer Komponente unterscheiden.)
Für benachbarte Knoten a und b ist hier P (a, b) = 1/3.
Die uniforme Verteilung auf S
ist reversible Gleichgewichtsverteilung.
Beispiel:
Die einfache Irrfahrt
auf einem ungerichteten, zusammenhängenden Graphen
mit endlicher Knotenmenge S
18
Beispiel:
Die einfache Irrfahrt
auf einem ungerichteten, zusammenhängenden Graphen
mit endlicher Knotenmenge S
Von jedem a ∈ S geht man in einem Schritt
zu einem rein zufällig ausgewählten Nachbarn:
1 ,
P (a, b) = g(a)
mit b Nachbar von a, g(a) := # Nachbarn von a
Ansatz:
π(a) := 1c g(a)
19
Ansatz:
π(a) := 1c g(a)
Die Verteilung π erfüllt die die Reversibilitätsbedingung (R),
denn für benachbarte Knoten a, b gilt:
20
Ansatz:
π(a) := 1c g(a)
Die Verteilung π erfüllt die die Reversibilitätsbedingung (R),
denn für benachbarte Knoten a, b gilt:
1
1
1
1
g(a)
= g(b)
c
g(a)
c
g(b)
Man kann zeigen (hier ohne Beweis):
Es gibt nur eine Gleichgewichtsverteilung.
Fazit: Die Gewichte der Knoten
unter der Gleichgewichtsverteilung
sind proportional zur Anzahl der Nachbarn der Knoten.
Beispiel 4: Das Ehrenfest-Modell,
veröffentlicht 1909 von Paul und Tatjana Ehrenfest, konzipiert
als Spielzeugmodell für Boltzmanns Statistische Mechanik:
21
Beispiel 4: Das Ehrenfest-Modell,
veröffentlicht 1909 von Paul und Tatjana Ehrenfest, konzipiert
als Spielzeugmodell für Boltzmanns Statistische Mechanik:
d Teilchen sind verteilt auf eine linke und eine rechte Urne:
Beispiel 4: Das Ehrenfest-Modell,
veröffentlicht 1909 von Paul und Tatjana Ehrenfest, konzipiert
als Spielzeugmodell für Boltzmanns Statistische Mechanik:
d Teilchen sind verteilt auf eine linke und eine rechte Urne:
ℓ Teilchen links, r Teilchen rechts.
Beispiel 4: Das Ehrenfest-Modell,
veröffentlicht 1909 von Paul und Tatjana Ehrenfest, konzipiert
als Spielzeugmodell für Boltzmanns Statistische Mechanik:
d Teilchen sind verteilt auf eine linke und eine rechte Urne:
ℓ Teilchen links, r Teilchen rechts.
In jedem Schritt wird rein zufällig eines aus den d
ausgewählt und in die andere Urne verfrachtet.
Beispiel 4: Das Ehrenfest-Modell,
veröffentlicht 1909 von Paul und Tatjana Ehrenfest, konzipiert
als Spielzeugmodell für Boltzmanns Statistische Mechanik:
d Teilchen sind verteilt auf eine linke und eine rechte Urne:
ℓ Teilchen links, r Teilchen rechts.
In jedem Schritt wird rein zufällig eines aus den d
ausgewählt und in die andere Urne verfrachtet.
Die Übergangsw’keiten für die Anzahl links sind somit:
Beispiel 4: Das Ehrenfest-Modell,
veröffentlicht 1909 von Paul und Tatjana Ehrenfest, konzipiert
als Spielzeugmodell für Boltzmanns Statistische Mechanik:
d Teilchen sind verteilt auf eine linke und eine rechte Urne:
ℓ Teilchen links, r Teilchen rechts.
In jedem Schritt wird rein zufällig eines aus den d
ausgewählt und in die andere Urne verfrachtet.
Die Übergangsw’keiten für die Anzahl links sind somit:
d−ℓ
,
P (ℓ, ℓ + 1) =
d
ℓ
P (ℓ, ℓ − 1) = .
d
Hat diese Dynamik eine (reversible)
Gleichgewichtsverteilung,
und wenn ja, wie sieht sie aus?
22
Hat diese Dynamik eine (reversible)
Gleichgewichtsverteilung,
und wenn ja, wie sieht sie aus?
Ein eleganter Weg zur Antwort führt über ein Feinmodell:
Hat diese Dynamik eine (reversible)
Gleichgewichtsverteilung,
und wenn ja, wie sieht sie aus?
Ein eleganter Weg zur Antwort führt über ein Feinmodell:
Die Teilchen werden durchnummeriert mit 1, . . . , d.
Hat diese Dynamik eine (reversible)
Gleichgewichtsverteilung,
und wenn ja, wie sieht sie aus?
Ein eleganter Weg zur Antwort führt über ein Feinmodell:
Die Teilchen werden durchnummeriert mit 1, . . . , d.
ai = 1 falls das Teilchen mit Nr. i in linker Urne,
Hat diese Dynamik eine (reversible)
Gleichgewichtsverteilung,
und wenn ja, wie sieht sie aus?
Ein eleganter Weg zur Antwort führt über ein Feinmodell:
Die Teilchen werden durchnummeriert mit 1, . . . , d.
ai = 1 falls das Teilchen mit Nr. i in linker Urne,
z (i) = 0
......
in rechter Urne.
Hat diese Dynamik eine (reversible)
Gleichgewichtsverteilung,
und wenn ja, wie sieht sie aus?
Ein eleganter Weg zur Antwort führt über ein Feinmodell:
Die Teilchen werden durchnummeriert mit 1, . . . , d.
ai = 1 falls das Teilchen mit Nr. i in linker Urne,
z (i) = 0
......
in rechter Urne.
a := (a1, . . . , ad) ∈ {0, 1}d.
Dynamik des Feinmodells:
23
Dynamik des Feinmodells:
Ein i ∈ {1, . . . , d} wird rein zufällig ausgewählt
und das ai wird “geflippt”
(von 0 nach 1 bzw. von 1 nach 0).
Dynamik des Feinmodells:
Ein i ∈ {1, . . . , d} wird rein zufällig ausgewählt
und das ai wird “geflippt”
(von 0 nach 1 bzw. von 1 nach 0).
Das ergibt die Irrfahrt auf dem Würfel {0, 1}d.
Dynamik des Feinmodells:
Ein i ∈ {1, . . . , d} wird rein zufällig ausgewählt
und das ai wird “geflippt”
(von 0 nach 1 bzw. von 1 nach 0).
Das ergibt die Irrfahrt auf dem Würfel {0, 1}d.
Diese hat ein reversibles Gleichgewicht:
die uniforme Verteilung.
Vom Feinmodell zum Ehrenfest-Modell kommt man durch
“Zählen der Teilchen links”:
24
Vom Feinmodell zum Ehrenfest-Modell kommt man durch
“Zählen der Teilchen links”:
l(a) :=
d
X
i=1
ai
Vom Feinmodell zum Ehrenfest-Modell kommt man durch
“Zählen der Teilchen links”:
l(a) :=
d
X
i=1
ai
Ist Z = (Z (1), . . . , Z (d)) uniform verteilt auf {0, 1}d,
Vom Feinmodell zum Ehrenfest-Modell kommt man durch
“Zählen der Teilchen links”:
l(a) :=
d
X
i=1
ai
Ist Z = (Z (1), . . . , Z (d)) uniform verteilt auf {0, 1}d,
dann ist
d
X
i=1
1 )-verteilt.
Z (i) Binomial(d, 2
Vom Feinmodell zum Ehrenfest-Modell kommt man durch
“Zählen der Teilchen links”:
l(a) :=
d
X
i=1
ai
Ist Z = (Z (1), . . . , Z (d)) uniform verteilt auf {0, 1}d,
dann ist
d
X
i=1
Z (i) Binomial(d, 1
2 )-verteilt.
25
Zur Probe: Die Binomial(d, 1
2 )-Verteilung
ist ein reversibles Gleichgewicht für das Ehrenfest-Modell:
26
Zur Probe: Die Binomial(d, 1
2 )-Verteilung
ist ein reversibles Gleichgewicht für das Ehrenfest-Modell:
ℓ+1
d
d
−
ℓ
d
−d
−d
=2
.
2
ℓ+1
ℓ
d
d
Herunterladen