28 - Humboldt-Universität zu Berlin

Werbung
16.3
Rekurrente und transiente Zustände
Für alle n ∈ N bezeichnen wir mit
fi (n) = P (Xn = i, Xn−1 6= i, . . . , X1 6= i, X0 = i)
die Wahrscheinlichkeit, daß nach n Schritten erstmalig
wieder der Zustand i erreicht wird. Es gilt:
fi (0) = 0 und fi (1) = pii .
Sei i fest und seien
∀k = 1, . . . , n
Bk = {Xk = i, Xν 6= i
∀ν = 1, . . . , k − 1|X0 = i}
Bn+1 = {System befand sich während der ersten n Schritte
nie im Zustand i}.
717
W.Kössler, Humboldt-Universität zu Berlin
Offenbar
n+1
[
Bl = Ω,
Bl ∩ Bl 0 = ∅
(l 6= l0 ).
l=1
Dann gilt
pii (n) = P (Xn = i|X0 = i)
n+1
X
P (Xn = i|Bk ) · P (Bk )
=
=
k=1
n
X
fi (k)pii (n − k) + P (Xn = i|Bn+1 ) · P (Bn+1 )
k=1
718
W.Kössler, Humboldt-Universität zu Berlin
Wegen P (Xn = i|Bn+1 ) = 0 folgt
pii (n) =
n
X
fi (k) · pii (n − k)
(n ≥ 1).
k=1
Damit läßt sich fi (k) rekursiv berechnen:
fi (0) = 0,
fi (1) = pii
pii (2) = fi (1) · pii (1) + fi (2) · pii (0)
= p2ii + fi (2)
fi (2) = pii (2) − p2ii
X
2
pii (2) =
pik pki ≥ pii .
k
719
W.Kössler, Humboldt-Universität zu Berlin
Wirbezeichnen mit
Fi :=
∞
X
fi (j)
j=1
die Wkt., daß man irgendwann in den Zustand i zurückkehrt.
Def. 63 Ein Zustand i ∈ S heißt rekurrent, wenn Fi = 1 gilt.
Ist dagegen Fi < 1, so heißt er transient.
Bemerkung: Wir werden in der Vorlesung einige der folgenden
Beweise weglassen.
Satz 68 Zustand i rekurrent ⇒ er wird unendlich oft erreicht
mit Wkt. 1.
720
Zustand i transient ⇒ er kann höchstens endlich oft erreicht
werden.
W.Kössler, Humboldt-Universität zu Berlin
Beweis: Sei ri (k) die Wkt., dass die MK mindestens k mal
nach i zurückkehrt.
ri (k) =
∞
X
P (k -1 mal zurück | erstmals nach n Schritten zurück) ·
n=1
P (nach n Schritten das erste Mal nach i zurück)
∞
X
=
fi (n)ri (k − 1)
n=1
= ri (k − 1)
∞
X
fi (n)
n=1
= ri (k − 1)Fi
⇒ ri (k) = Fik
721
W.Kössler, Humboldt-Universität zu Berlin
Ist i rekurrent, also Fi = 1, dann ist ri (k) = 1 ∀k ∈ N.
Sei i transient, d.h. Fi < 1.
Sei Zi die Anzahl der Besuche in i.
P (Zi = k) = Fik (1 − Fi )
geometrische Verteilung mit Parameter (1 − Fi ).
1
<∞
EZi =
1 − Fi
722
W.Kössler, Humboldt-Universität zu Berlin
Satz 69 Ein Zustand i ist genau dann rekurrent, wenn gilt:
∞
P
pii (n) = ∞.
n=0
Er ist genau dann transient, wenn
∞
P
pii (n) < ∞ ist.
n=0
Beweis: (für einen anderen Beweis siehe z.B.
Mathar/Pfeifer, Satz 3.2.1).
Erinnerung:
pii (n) =
n
X
fi (k) · pii (n − k)
(n ≥ 1)
k=1
Multiplizieren diese Gleichung mit z n und summieren über n:
723
W.Kössler, Humboldt-Universität zu Berlin
Pi (z) :=
=
∞
X
n=1
∞
X
pii (n)z n
zn
n=1
=
X
n
fi (k) · pii (n − k)
k=1
zfi (1) · pii (1 − 1)
2
+z fi (1) · pii (2 − 1) + fi (2) · pii (2 − 2)
3
+z fi (1) · pii (3 − 1) + fi (2) · pii (3 − 2) + fi (3) · pii (3 − 3)
+...
+z n fi (1) · pii (n − 1) + . . . + fi (n) · pii (0)
+...
724
W.Kössler, Humboldt-Universität zu Berlin
=
∞
X
z ν pii (ν)
zfi (1) 1 +
ν=1
∞
X
+z 2 fi (2) 1 +
z ν pii (ν)
ν=1
+...
∞
X
+z n fi (n) 1 +
z ν pii (ν)
ν=1
+...
∞
X
ν
=
z fi (ν) · 1 + Pi (z)
ν=1
= Fi (z) · 1 + Pi (z)
725
W.Kössler, Humboldt-Universität zu Berlin
wobei
Fi (z) :=
∞
X
z ν fi (ν).
ν=1
Die Fkt. Fi (z) und Pi (z) sind analytisch für |z| < 1.
Pi (z)
,
Fi (z) =
1 + Pi (z)
Fi (z)
Pi (z) =
1 − Fi (z)
lim Fi (z) = Fi (1) = Fi =
z→1
∞
X
fi (ν)
ν=1
ist die Wkt. für eine Rückkehr nach i. Sei
lim Pi (z) = Pi =
z→1
726
∞
X
pii (n) = ∞
n=1
W.Kössler, Humboldt-Universität zu Berlin
Daraus folgt
Pi (z)
Fi = lim
= 1,
z→1 1 + Pi (z)
d.h. i ist rekurrent.
Sei umgekehrt Fi = 1. Dann folgt
Pi = lim Pi (z) =
z→1
1
1 − limz→1 Fi (z)
= ∞.
Der zweite Teil des Satzes ist die Kontraposition des ersten
Teils.
2
Folg. 11 Sei i transient. dann
Pi
Fi =
< 1.
1 + Pi
727
W.Kössler, Humboldt-Universität zu Berlin
Diese beiden Aussagen können zum Beweis des folgenden
Lemmas verwendet werden.
Lemma 70 Ist ein Zustand i rekurrent (transient) und
kommuniziert er mit einem Zustand j (i ←→ j), so ist auch
der Zustand j rekurrent (transient).
Beweis: 1. Sei i ←→ j. Dann existieren m, k > 0:
pij (k) > 0 und pji (m) > 0. Für alle n ∈ N gilt:
X X
pjj (m + n + k) =
pjk0 (m)pk0 l (n) plj (k)
l
=
X
k0
pjl (m + n)plj (k)
l
≥ pji (m)pii (n)pij (k)
728
(l = i).
W.Kössler, Humboldt-Universität zu Berlin
Daraus folgt (da i rekurrent)
∞
X
n=1
pjj (m + n + k) ≥ pji (m)pij (k)
∞
X
pii (n) = ∞.
n=1
2. Sei i ←→ j. und i transient. Ang, j wäre rekurrent, dann
wäre nach 1. auch i rekurrent. Wid.
2
Folg. 12 Eine irreduzible M ARKOFF’sche Kette mit endlich
vielen Zuständen hat nur rekurrente Zustände.
Beweis: Mindestens ein Zustand muß rekurrent sein. Da alle
Zustände miteinander kommunizieren, sind alle Zustände
rekurrent.
2
729
W.Kössler, Humboldt-Universität zu Berlin
Bsp. 117 (Random walk, eindim. Fall) Der Zustandsraum
ist S = Z. Die Übergangswahrscheinlichkeiten sind
pi,i+1 := p
pi,i−1 := 1 − p
pij := 0,
falls |i − j| =
6 1.
D.h. Übergänge zwischen Zuständen, die einen Abstand
ungleich Eins zueinander haben, sind nicht möglich. Die
730
W.Kössler, Humboldt-Universität zu Berlin
Übergangsmatrix M hat folgende Gestalt:

..
..
..
..
.
.
.
.

 ...
0
p
0


 ... 1 − p
0
p

M=
 ...
0
1−p
0


 ...
0
0
1−p

..
..
..
.
.
.
..
.
0 ...
0 ...
p ...
0 ...
.. . .
.
.







.





Offenbar kommunizieren alle Zustände miteinander. Ist somit
ein Zustand rekurrent, so sind es alle. Und umgekehrt.
731
W.Kössler, Humboldt-Universität zu Berlin
Es genügt also zu untersuchen:
∞
X
p00 (n).
n=1
Dazu siehe den Abschnitt Irrfahrten!
P∞
1
p
(n)
=
∞,
wenn
p
=
.
n=1 00
2
732
W.Kössler, Humboldt-Universität zu Berlin
Bsp. 118 (Random walk, zwei- und dreidim. Fall) Im
zweidimensionalen Fall haben wir in jedem Zustand vier
mögliche Übergänge, denen die Wahrscheinlichkeiten
p1 , p2 , p3 und p4 zugeordnet werden. DieZustände sind
rekurrent, wenn p1 = p2 = p3 = p4 = 41 gilt.
Im dreidimensionalen Fall sind in jedem Punkt im
dreidimensionalen ganzzahligen Gitter sechs Übergänge
möglich. Auch wenn p1 = . . . = p6 = 61 , so sind alle Zustände
transient.
Dazu siehe den Abschnitt Irrfahrten!
733
W.Kössler, Humboldt-Universität zu Berlin
(die folgenden drei Seiten können überlesen werden.)
Sei jetzt der Zustand i Startzustand (fest) und
Y1 = # Schritte bis zur ersten Rückkehr nach i
Y2 = # Schritte bis zur zweiten Rückkehr
Yk = # Schritte bis zur k-ten Rückkehr
P (Y1 < ∞) = Fi
Y1 = ∞ =⇒ Y2 = ∞, d.h. {Y1 = ∞} ⊆ {Y2 = ∞}
=⇒ P (Y2 < ∞|Y1 < ∞) = Fi
734
W.Kössler, Humboldt-Universität zu Berlin
P (Y2 < ∞) = P (Y2 < ∞|Y1 < ∞) · P (Y1 < ∞)
= Fi2
P (Yk < ∞) = Fik
Sei jetzt Fi < 1. =⇒
∞
X
k=1
P (Yk < ∞) =
∞
X
Fik < ∞
k=1
Folg. 13 i transient =⇒ nach unendlich vielen Schritten tritt
i höchstens endlich oft mit Wkt. 1 ein.
735
W.Kössler, Humboldt-Universität zu Berlin
Beweis:
Nach dem Lemma von Borel-Cantelli gilt
∞
X
P (Ak ) < ∞ =⇒ P (lim sup An ) = 0.
k=1
Mit Ak = {Yk < ∞},
Bn =
S
k≥n
Ak ↓ folgt
0 = P (lim sup An ) = P (lim Bn ) = lim P (Bn ) = P (B)
B = {unendlich viele der Ak , k = 1, 2, . . . , treten ein}
B = {endlich viele derAk , k = 1, 2, . . . , treten ein}
P (B) = 1
2
736
W.Kössler, Humboldt-Universität zu Berlin
Folg. 14 Sei jetzt i rekurrent, d.h. Fi = 1. =⇒ i wird
unendlich oft erreicht.
Beweis:
Für beliebiges k gilt: P (Yk < ∞) = 1.
Y = # der Rückkehren nach i bei unendlich vielen Schritten.
{Yk < ∞} ⇔ {Y ≥ k}
P (Y = ∞) = lim P (Y ≥ k) = lim P (Yk < ∞) = 1.
k→∞
k→∞
2
737
W.Kössler, Humboldt-Universität zu Berlin
16.4
Grenzverteilungen
Def. 64 Ein Zustand i heißt periodisch mit der Periode d,
falls d größter gemeinsamer Teiler aller der Zahlen n ∈ Z+
ist, für die pii (n) > 0 gilt. Ist d = 1, so heißt der Zustand i
aperiodisch. Falls für alle Zahlen n ∈ Z+ pii (n) = 0 gilt, so
setzen wir d := ∞.
Satz 71 Es sei i ∈ S ein periodischer Zustand mit Periode d.
Desweiteren kommuniziere er mit einem weiteren Zustand j
(i ←→ j). Dann hat auch der Zustand j die Periode d.
Beweis: Nach Voraussetzung ist i periodischer Zustand mit
Periode d. Folglich lassen sich alle Zahlen k mit pii (k) > 0
738
W.Kössler, Humboldt-Universität zu Berlin
durch k = k0 · d, für eine Zahl k0 , darstellen. Da die Zustände
i und j miteinander kommunizieren, existieren weitere
Zahlen n und m, so daß gilt:
pij (n) > 0 und pji (m) > 0.
Daraus folgt mit Hilfe der Rekursion von
C HAPMAN –KOLMOGOROFF:
X
pii (n + m) =
pil (n) · pli (m)
l∈S
≥ pij (n) · pji (m)
> 0
Folglich ist d Teiler der Summe n + m.
739
W.Kössler, Humboldt-Universität zu Berlin
Es gelte nun pjj (r) > 0 für ein gewisses r. Dann gilt:
X
pii (n + m + r) =
pil (n) · pls (r) · psi (m)
l,s∈S
≥ pij (n) · pjj (r) · pji (m)
> 0
Wir stellen also fest:

d teilt m + n + r 
d teilt r.
d teilt m + n 
Folglich ist der Zustand j periodisch mit Periode d0 , wobei
gilt: d0 ≤ d.
Da die Relation ←→“ symmetrisch ist, gilt auch: j ←→ i.
”
740
W.Kössler, Humboldt-Universität zu Berlin
Mit der gleichen Beweisführung wie oben können wir dann
zeigen, daß gilt: d ≤ d0 . Daraus folgt: Die Zustände i und j
haben die gleiche Periodenlänge.
2
Es sei nun i ein Zustand aus dem Zustandsraum S. Wir
betrachten die folgende Zufallsgröße:


1
2
...
n
...
.
Y :
fi (1) fi (2) . . . fi (n) . . .
Wir definieren die mittlere Rückkehrzeit in den Zustand i:
µi :=
∞
X
n · fi (n) = EY.
n=1
741
W.Kössler, Humboldt-Universität zu Berlin
Def. 65 Es sei i ein Zustand aus dem Zustandsraum S. Der
Zustand i heißt positiv rekurrent, falls µi < ∞ gilt. Ist
dagegen µi = ∞, so nennen wir den Zustand i
Null–rekurrent.
Es gelten für einen beliebigen Zustand i die folgenden
Zusammenhänge (ohne Beweis):
• µi < ∞ genau dann, wenn lim pii (n) > 0;
n→∞
• µi = ∞ genau dann, wenn lim pii (n) = 0.
n→∞
• Ist der Zustand i positiv rekurrent und aperiodisch, so
gilt:
1
µi =
.
lim pii (n)
n→∞
742
W.Kössler, Humboldt-Universität zu Berlin
Def. 66 Eine M ARKOFF’sche Kette {Xt }t∈T heißt ergodisch,
falls der Zustandsraum S nur aus positiv–rekurrenten und
aperiodischen Zuständen besteht.
Satz 72 (Ergodensatz) Eine homogene M ARKOFF’sche
Kette {Xt }t∈T ist genau dann irreduzibel und ergodisch,
wenn für alle Zustände i ∈ S gilt:
pj := lim pij (n) > 0.
n→∞
Außerdem gilt µj =
1
pj
und {pj } ist eindeutig bestimmt durch:
pj =
∞
X
pi · pij .
i=1
743
W.Kössler, Humboldt-Universität zu Berlin
{pi } heißt stationäre oder Finalverteilung. Die stationäre
Verteilung kann also nach obiger Gleichung ermittelt werden.




p1
p1




 p 
 p 
 2 
 2 
 . 
 . 
T


..  .
p =  ..  = M · 






 pj 
 pj 




..
..
.
.
Also gilt: MT · p = p = λ · p mit λ = 1. Eigenwertgleichung
für den Eigenwert 1. p ist Eigenvektor zum Eigenwert 1.
Bem. 28 M und MT haben dieselben Eigenwerte.
744
W.Kössler, Humboldt-Universität zu Berlin
Folg. 15 Sei M die Übergangsmatrix einer M ARKOFF’schen
Kette mit endlich vielen Zuständen (in der Form, in der die
Äquivalenzklassen ablesbar sind) Dann gilt: Die Vielfachheit
des Eigenwertes 1 ist gleich der Anzahl der rekurrenten
Äquivalenzklassen.
Beweis: Jede Teilübergangsmatrix von Äquivalenzklassen
hat den einfachen Eigenwert 1 (Finalverteilung eindeutig!) 2
Bsp. 119 Wir betrachten eine M ARKOFF’sche Kette über
einem dreielementigen Zustandsraum, die die folgende
745
W.Kössler, Humboldt-Universität zu Berlin
Übergangsmatrix M besitzt:


M =

1
2
3
4
1
2
1
4
0


0 
.
0 0 1
Äquivalenzklassen: {1, 2}, {3}. Wir ermitteln die Eigenwerte:
0 = det(M − λ · I)
1 −λ
1
0
2
2
3
1
= 4
−
λ
0
4
0
0
1−λ 1
3
1
= (1 − λ) · 2 − λ · 4 − λ − 8
746
W.Kössler, Humboldt-Universität zu Berlin
Der erste Eigenwert: λ1 = 1. Weiter:
1
1
0 = 2 −λ · 4 −λ −
1 3
3
2
=
− λ+λ −
8 4
8
1
3
2
= λ − λ−
4
4
r
9
3
16
λ2,3 =
±
+
8
64 64
r
3
25
=
±
8
64
3 5
λ2 =
+ =1
8 8
1
λ3 = −
4
747
3
8
W.Kössler, Humboldt-Universität zu Berlin
Also: Eigenwerte: λ1 = λ2 = 1 und λ3 = − 41 . Der Eigenwert
1 hat folglich die Häufigkeit 2, und somit gibt es zwei
rekurrente Äquivalenzklassen.
Folg. 16 Falls
X
i
pij =
X
pij = 1
j
so sind die stationären Verteilungen einer endlichen
irreduziblen Markoffschen Kette Gleichverteilungen.
748
W.Kössler, Humboldt-Universität zu Berlin
Beweis: Es gilt für die stationäre Verteilung (p1 , . . . , pn ):
X
X
pij
pi pij = pj = pj
i
i
Daraus folgt ∀j
X
(pi − pj )pij = 0,
insbesondere
X
j0 = min pj
i
(pi − pj0 )pij0 = 0,
i
Wegen (pi − pj0 ) ≥ 0 folgt pj0 = pi
j
∀i, d.h. pi = n1 .
2
Folg. 17 Ist die Übergangsmatrix einer endlichen
irreduziblen Markoffschen Kette symmetrisch so sind die
stationären Verteilungen Gleichverteilungen.
749
W.Kössler, Humboldt-Universität zu Berlin
Veranschaulichung von lim pjj (n) =
Ergodensatzes
1
µj
und des
{Xt }: homogene Markoffsche Kette
j: rekurrenter Zustand, X0 = j (j fest).

1,
falls Xk = j
Yk =
0,
sonst.
P (Yk = 1) = pjj (k),
750
EYk = pjj (k)
W.Kössler, Humboldt-Universität zu Berlin
Anzahl der Wiederkehrzeitpunkte im Zeitraum 1, . . . , N
N
X
Yk = kN .
k=1
Beobachtete mittlere Anzahl der Wiederkehrpunkte pro
Schritt (im Zeitraum 1, . . . , N )
kN
N
N
N
kN
1 X 1 X
Yk =
EYk
∼ E
= E
N
N n=1
N n=1
N
X
1
pjj (n)
=
N n=1
751
W.Kössler, Humboldt-Universität zu Berlin
Mittlere beobachtete Wiederkehrzeit im Zeitraum 1, . . . , N
N
→ µj
kN
=⇒
N
1
1 X
pjj (n) →N →∞
N n=1
µj
Andererseits:
N
1
1 X
pjj (n) →N →∞ pj = .
lim pjj (n) = pj =⇒
n→∞
N n=1
µj
752
W.Kössler, Humboldt-Universität zu Berlin
Abschätzung der Konvergenzgeschwindigkeit
X
1
c(n0 ) := 1 − sup
|pim (n0 ) − pjm (n0 )|
2 i,j m
Für n ≥ n0 gilt:
c(n) > 0.
Satz 73 Sei c(n0 ) > 0 für ein gewisses n0 . dann existiert
lim pj (n) = pj ,
n→∞
j = 1, 2, . . .
und es gilt für alle Anfangsverteilungen {p0j }:
|pj (n) − pj | ≤ C · e−Dn ,
753
W.Kössler, Humboldt-Universität zu Berlin
wobei
1
C=
,
1 − c(n0 )
Beweis:
1
1
D=
ln
n0 1 − c(no )
Rosanov, Zufällige Prozesse
pj (n) = P (Xn = j) =
X
2
p0i pij (n)
i
754
W.Kössler, Humboldt-Universität zu Berlin
Herunterladen