8. Markovketten 8.1. Homogene Markovketten in diskreter Zeit

Werbung
8. MARKOVKETTEN
127
u
u
H
6 HH
6
u
- u
6
HH
H
HH
HH
j u
u
@ @
@
@
R
@
u
u
- u
u
Abbildung 8.1: Reduzible und periodische Markovkette
8.
Markovketten
8.1. Homogene Markovketten in diskreter Zeit
Ein Prozess {Xn : n ∈ IIN} heisst homogene Markovkette (in diskreter Zeit) mit
(abzählbarem) Zustandsraum E, falls Xn ∈ E für alle n ∈ IIN und
IIP[Xn+1 = in+1 | X0 = i0 , . . . , Xn = in ] = IIP[X1 = in+1 | X0 = in ]
für alle n ∈ IIN und alle ik ∈ E, 0 ≤ k ≤ n + 1. Es genügt den Fall E = IIN (I = ∞)
oder E = {0, 1, . . . , I} für ein I ∈ IIN zu betrachten. Wir setzen νi = IIP[X0 = i] und
pij = IIP[X1 = j | X0 = i]. Sei ν = (ν0 , . . . , νI ) und P = (pij )i,j∈E falls I < ∞, mit
der analogen Definition falls I = ∞. Wir haben dann für die Verteilung von Xn
IIP[Xn = i] = IIE[IIP[Xn = i | Xn−1 ]] =
I
X
pji IIP[Xn−1 = j] = [(IIP[Xn−1 = j])j∈E P ]i .
j=0
Mittels Induktion ist dies
(IIP[Xn = i])i = (νP n )i .
Definition 8.1. Wir sagen Zustand j ist erreichbar von i, falls es ein n gibt, so
dass IIP[Xn = j | X0 = i] > 0. Wir sagen, die Markovkette ist irreduzibel, falls j
erreichbar von i ist für alle i, j ∈ E. Wir sagen eine Markovkette ist aperiodisch,
falls für alle i 1 der grösste gemeinsame Teiler von {n ≥ 1 : IIP[Xn = i | X0 =
i] > 0} ist. Ist der grösste gemeinsame Teiler d > 1, so nennen wir die Markovkette
periodisch mit Periode d.
In Abbildung 8.1 ist in der Graphik links eine Kette abgebildet, in der der unterste
Zustand nicht von den anderen erreicht werden kann. Die anderen Zustände sind
128
8. MARKOVKETTEN
u
?
- u
- u
- u
- u
- u
?
Abbildung 8.2: Markovkette
von allen anderen aus erreichbar. Löscht man den untersten Zustand, so wird die
Kette aperiodisch und irreduzibel. Die rechte Graphik ist eine irreduzible Kette mit
Periode 3.
Schreiben wir nun i ↔ j, falls i von j und j von i erreichbar ist. Falls es für ein i
kein j gibt, so dass i ↔ j, so wird die Markovkette den Zustand i verlassen und nie
mehr zurückkehren oder für immer in i bleiben. Für solche Zustände interessieren
wir uns nicht. Falls es keine solchen Zustände gibt, ist ↔ eine Äquivalenzrelation.
Wir können also die Zustände in Äquivalenzklassen unterteilen. Ein Markovprozess verlässt dann die Äquivalenzklasse nie, und wir können jede Äquivalenzklassse
gesondert betrachten. Daher werden wir nur irreduzible Markovketten betrachten.
In einer irreduziblen Markovkette haben alle Zustände die gleichen Perioden.
Hat eine Markovkette Periode d, so gibt es d Mengen, so dass die Markovkette
deterministisch durch diese d Mengen läuft. In diesem Fall wollen wir nur die Markovkette Xnd studieren, die dann aperiodisch ist. Daher werden wir nur aperiodische
Markovketten betrachten.
Sei nun I endlich. Ist die Markovkette irreduzibel und aperiodisch, dann gibt es
ein n0 (da der grösste gemeinsame Teiler 1 ist), so dass IIP[Xn0 = j | X0 = i] > 0
für alle i, j. Betrachten wir die Eigenwerte von P , und nennen wir sie λ0 , . . . , λI .
P
Wir ordnen die Eigenwerte so, dass |λi | ≥ |λi+1 |. Da Ij=0 pij = 1, ist P e = e für
e = (1, . . . , 1)> , also existiert ein Eigenwert 1. Die Matrix P n0 hat die Eigenwerte
λni 0 . Da P n0 e = e, und e echt positive Koordinaten hat, ist nach dem Perron–
Fröbenius-Theorem λ0 = 1 und |λi | < λ0 = 1 für i ≥ 1. e ist der einzige (Rechts-)
Eigenvektor, der nur positive Koordinaten hat. Weiter gibt es einen (Links-) Eigenvektor π mit πi > 0 für alle i. Wir haben dann, πP = π. Nach dem Perron–
Fröbenius-Theorem ist dies der einzige Eigenvektor, der nur positive Einträge hat.
P
Wir können annehmen, dass Ii=0 πi = 1. Also ist {π} eine stationäre Verteilung.
Da π der einzige Eigenvektor mit positiven Einträgen ist, ist π eindeutig.
Beispiel 8.2. Sei pi,i+1 = p ∈ (0, 1) für 0 ≤ i < I, pi,i−1 = 1 − p für 1 ≤ i ≤ I,
pI,I = p und p0,0 = 1 − p. Dann sind alle anderen Einträge 0. Die Kette ist in
Abbildung 8.2 illustriert. Die Markovkette ist dann irreduzibel und aperiodisch.
8. MARKOVKETTEN
129
Wir müssen das Gleichungssystem
πi = pπi−1 + (1 − p)πi+1 , 1 ≤ i ≤ I − 1 ,
π0 = (1 − p)(π0 + π1 ) ,
πI = p(πI−1 + πI )
lösen. Wir erhalten π1 = pπ0 /(1 − p), πi+1 = (πi − pπi−1 )/(1 − p), also πi = (p/(1 −
p))i π0 . Dann ist die letzte Gleichung auch erfüllt. Ist p 6= 21 , so ist die Randbedingung
I X
p i
1 − p − p(p/(1 − p))I
π0 =
π0 .
1=
1−p
1 − 2p
i=0
Also lässt sich π0 berechnen. Ist p = 21 , dann ist πi = π0 , und damit πi = (I + 1)−1 .
Ist I = ∞, so folgern wir analog πi = (p/(1 − p))i π0 . Ist p < 12 , erhalten wir
durch Summieren, π0 = (1 − 2p)/(1 − p), und damit
πi =
(1 − 2p)pi
.
(1 − p)i+1
Ist p ≥ 12 , dann sind die πi nur summierbar, falls π0 = 0. In diesem Falle existiert
keine stationäre Verteilung. Wir werden die Kette mit I = ∞ und p ≥ 21 später
analysieren.
Proposition 8.3. Sei {Xn } eine irreduzible aperiodische Markovkette auf einem
endlichen Zustandsraum. Dann existiert der Grenzwert πi = limn→∞ IIP[Xn = i |
X0 = j] und ist unabhängig von j. Weiter gilt {π} ist eine stationäre Verteilung,
und πi > 0 für alle i.
Beweis.
(n)
Sei Mj
(n)
= supi∈E (P n )ij und mj
(n+1)
mj
= inf
i∈E
X
= inf i∈E (P n )ij . Wir haben dann
pik (P n )kj ≥ inf
k∈E
i∈E
X
(n)
pik mj
(n)
= mj
.
k∈E
(n)
(n)
Also ist {mj } eine wachsende Folge. Analog folgt, dass {Mj } eine fallende Folge
(n)
ist. Somit existiert πj = limn Mj . Sei a = inf i,j (P n0 )ij . Dann haben wir
(P (n0 +m )ij =
X
=
X
(P n0 )ik (P m )kj
k∈E
k∈E
[(P n0 )ik − a(P m )jk ](P m )kj + a
X
(P m )jk (P m )kj
k∈E
X
=
[(P n0 )ik − a(P m )jk ](P m )kj + a(P 2m )jj .
k∈E
130
8. MARKOVKETTEN
Wir erhalten also
(m)
(P (n0 +m )ij ≥ mj
X
(m)
[(P n0 )ik − a(P m )jk ] + a(P 2m )jj = mj (1 − a) + a(P 2m )jj
k∈E
(n +m)
(m)
(n0 +m)
und damit mj 0
≥ mj (1 − a) + a(P 2m )jj . Analog folgt Mj
a) + a(P 2m )jj . Die Differenz wird
(n0 +m)
Mj
(n0 +m)
− mj
(m)
≤ (1 − a)(Mj
(m)
≤ Mj
(1 −
(m)
− mj ) ,
und damit
(kn0 +m)
Mj
(kn0 +m)
− mj
(m)
≤ (1 − a)k (Mj
(kn +m)
(m)
− mj ) .
(kn +m)
gegen Null konvergiert. Somit
− mj 0
Lassen wir k → ∞, folgt dass Mj 0
P
(n0 )
n
≥ a, ist πj > 0. Aus j (P n )ij = 1, folgt
konvergiert (P )ij gegen πj . Da mj
P
P
n
n+1
)ij =
dass
k∈E (P )ik pkj folgt, dass {π} eine stationäre
j πj = 1. Aus (P
Verteilung ist.
Die Situation wird komplizierter, falls I = ∞. Wir sagen, die Markovkette ist
transient, falls jeder Zustand nur endlich oft besucht wird, und rekurrent, falls
jeder Zustand unendlich oft besucht wird. Wir sagen, die Markovkette ist positiv
rekurrent, falls die mittlere Rückkehrzeit endlich ist, und Null-rekurrent, falls
die mittlere Rückkehrzeit unendlich ist.
(n)
Wir bezeichnen nun mit fij = IIP[Xk 6= j, 1 ≤ k < n, Xn = j | X0 = i] die
(n)
Wahrscheinlichkeit, dass der erste Besuch in j zur Zeit n stattfindet, und fj =
P
(n)
(n)
fjj . Wir setzen fij = ∞
n=1 fij , und bemerken, dass fij > 0, da die Markovkette
irreduzibel ist. Analog ist fj = fjj . Die mittlere Rückkehrzeit bezeichnen wir mit
P
(n)
µj = n nfj .
Seien nun i, j ∈ IIN mit i 6= j und N = inf{n : (P n )ij > 0} und M = inf{n :
(P n )ji > 0}. Dann haben wir
(P n+N +M )ii ≥ (P N )ij (P n )jj (P M )ji .
(8.1)
P
Falls nun j ein rekurrenter Zustand ist, dann ist n (P n )jj = ∞ (Borel–Cantelli).
P
Somit schliessen wir, dass auch n (P n )ii = ∞. Wäre nun i ein transienter Zustand,
so wäre die Anzahl der Besuche in i geometrisch verteilt, und
∞
∞
∞
hX
X
X
(P n )ii =
IIE[1IXn =i | X0 = i] = IIE
1IXn =i
n=1
n=1
n=1
i
X
=
i
<∞
0
8. MARKOVKETTEN
131
würde folgen. Wir schliessen aus (8.1), dass alle Zustände der Markovkette transient
oder alle Zustände rekurrent sind. Sind die Zustände transient, so folgt daraus,
dass (P n )ii gegen Null konvergiert. Da (P n+M )ii ≥ (P n )ij (P M )ji folgt, dass auch
(P n )ij gegen Null konvergiert. Wir zeigen nun, dass auch positive Rekurrenz eine
Eigenschaft ist, die für alle oder keine Zustände der Markovkette gilt.
Proposition 8.4. Eine irreduzible und aperiodische Markovkette hat eine der folgenden Eigenschaften:
i) Die Zustände sind transient. In diesem Fall gilt
limn (P n )ij = 0.
P
n (P
ii) Die Zustände sind Null-rekurrent. In diesem Fall gilt
limn (P n )ij = 0.
n
)ij < ∞, und damit
P
n (P
n
)ij = ∞, aber
iii) Die Zustände sind positiv rekurrent. In diesem Fall gilt limn (P n )ij = µ−1
j .
Beweis. Wir haben die Aussage im transienten Fall schon bewiesen. Sei die Mar(n)
kovkette daher rekurrent. Sei uij = IIP[Xn = j | X0 = i] = (P n )ij die Wahrschein(0)
lichkeit, dass das Ereignis (Rückkehr) zum Zeitpunkt n eintritt. Wir setzen uii = 1.
Dann gilt für n ≥ 1
n
X
(k) (n−k)
(n)
.
fi uii
uii =
k=1
P∞
(k)
k=n+1 fi
(keine Rückkehr bis zum Zeitpunkt n), so ist
Setzen wir nun rn =
(k)
r0 = 1. Wir haben fi = rk−1 − rk . Die obige Gleichung ist dann
(n)
r0 uii
n
X
(n−k)
(rk−1 − rk )uii
=
.
k=1
Also erhalten wir
n
X
(n−k)
rk uii
k=0
=
n
X
(n−k)
rk−1 uii
k=1
=
n−1
X
(n−1−k)
rk uii
(0)
= r0 uii = 1 .
k=0
Die zweitletzte Gleichung folgt, da die Summe nicht von n abhängt. Sei nun λi =
(n)
(n)
limn uii . Sei ε > 0. Es gibt ein n0 , so dass für alle n ≥ n0 uii < λi + ε. Es gibt ein
P
(k)
(n)
n1 ≥ n0 , so dass ∞
< ε. Es gibt ein n > 2n1 , so dass uii > λi − ε. Also
k=n1 fi
λi − ε <
(n)
uii
<
n1
X
k=1
(k) (n−k)
fi uii
+ ε ≤ λi +
n1
X
k=1
(k)
(n−k)
fi (uii
− λi ) + ε < λi + 2ε .
132
8. MARKOVKETTEN
P
(n−k)
Wir schliessen daraus, dass uii
nach λi konvergiert. Ist µi = ∞
k=0 rk < ∞, so
Pn
(n−k)
folgt mit beschränkter Konvergenz aus k=0 rk uii
= 1, dass λi µi = 1. Also ist
Pm
P
(n−k)
−1
λi = µi . Ist µi = ∞, so konvergiert k=0 rk uii
nach λi m
k=0 rk . Der Grenzwert
ist aber durch 1 beschränkt, also ist λi = 0. Aus (8.1) folgt nun, dass entweder
alle (P n )jj gegen Null konvergieren, oder alle einen echt positiven Grenzwert haben.
Das heisst, dass entweder alle µi = ∞, oder alle µi < ∞. Somit sind alle Zustände
gleichzeitig positiv rekurrent oder Null-rekurrent. Im Falle, wo die Zustände Nullrekurrent sind, ist wegen der Ungleichung (P n+N )ii ≥ (P N )ij (P n )ji die Aussage
auch bewiesen. Nehmen wir nun an, dass die Zustände alle positiv rekurrent sind.
Sei i 6= j. Dann haben wir
n
X
(n)
(k) (n−k)
uij =
fij ujj
.
k=1
Die Aussage folgt nun mit beschränkter Konvergenz.
Korollar 8.5. Für eine irreduzible und aperiodische Markovkette gibt es genau
dann eine stationäre Verteilung, wenn die Kette positiv rekurrent ist. In diesem
Falle ist πk = µ−1
k .
Beweis. Nehmen wir an, es gibt eine stationäre Verteilung {πk }. Dann gilt wegen
der beschränkten Konvergenz
X
X
X
−1
πk =
πi (P n )ik = lim
πi (P n )ik =
πi µ−1
k = µk .
n
i
i
i
Sei die Markovkette nun positiv rekurrent. Wir schliessen dann mit Hilfe des Lemmas
P
P
n
von Fatou, dass k µ−1
k ≤ 1, da
k (P )ik = 1. Aus
X
(P n+1 )ij =
(P n )ik P kj ,
k
erkennen wir, dass µ−1
j ≥
X
j
µ−1
j ≥
P
k
µ−1
k P kj . Also ist
XX
j
k
µk−1 P kj =
XX
k
j
µ−1
k P kj =
X
µ−1
k .
k
P −1
Somit gilt das Gleichheitszeichen und {(µ−1
i /
k µk )i } ist eine stationäre Verteilung. Wir haben aber bereits gezeigt, dass πk = µ−1
k .
Das folgende Resultat wird oft für Simulationen verwendet.
8. MARKOVKETTEN
133
Korollar 8.6. Für eine irreduzible aperiodische Markovkette {Xn } definieren wir
P
(n)
ai = n−1 nk=1 1IXk =i , die mittlere Anzahl Besuche in i bis zum Zeitpunkt n. Ist die
(n)
Markovkette positiv rekurrent, dann konvergiert ai nach µ−1
i . Ist die Markovkette
(n)
transient oder Null-rekurrent, dann konvergiert ai nach 0.
Beweis. Die Aussage ist für eine transiente Markovkette klar. Sei die Kette also
(0)
(n)
rekurrent. Nehmen wir an, dass wir in i starten. Sei Ti = 0 und Ti die Zeit des
n-ten Besuches in i. Dann haben wir
n
X
(n)
(j)
ai n =
1IXk =i = sup{j : Ti ≤ n} .
k=1
(k)
Da die Variablen {Ti
konvergiert
(k−1)
− Ti
(n)
ai n
(n)
(j)
} unabhängig sind, konvergiert j −1 Ti
(n)
(n)
ai n + 1
(ai n+1)
ai n + 1 Ti
nach µi . Also
(n)
≤ ai
≤
ai n
(n)
a
Ti i
n
nach µ−1
i .
Zum Abschluss betrachten wir im Folgenden Markovketten, die nicht irreduzibel sind. Wir können dann die Kette in irreduzible Teilketten Cj und transiente
Zustände T zerlegen. Falls X0 = i ein rekurrenter Zustand ist, dann sind alle erreichbaren Zustände in der gleichen irreduziblen Teilkette. Nehmen wir nun an, dass
X0 = i in der Menge T von transienten Zuständen ist. Dann kann die Markovkette
irgendwann eine rekurrente Menge Cj erreichen, oder für immer in der Menge T
bleiben. Wir wollen nun die Wahrscheinlichkeit xij berechnen, dass die Markovkette
in der Menge Cj absorbiert wird.
(1)
Die Wahrscheinlichkeit im ersten Schritt in die Menge Cj zu gelangen ist xij =
k∈Cj Pik . Falls die Kette nicht schon im ersten Schritt in Cj landet, muss sie in T
landen, da sonst Cj nicht mehr erreicht werden kann. Daher löst xij das Gleichungssystem
X
X
xij =
Pik +
Pik xkj .
(8.2)
P
k∈Cj
k∈T
Falls dieses Gleichungssystem eine eindeutige beschränkte Lösung hat, sind die {xij }
bestimmt. Ansonsten definieren wir
X
(n+1)
(n)
xij
=
Pik xkj ,
k∈T
die Wahrscheinlichkeit, in n + 1 Schritten die Menge Cj zu erreichen. Wir haben
P
(n)
dann xij = ∞
n=1 xij .
134
8. MARKOVKETTEN
Betrachten wir nun die Wahrscheinlichkeit yi , dass das System für immer in den
transienten Zuständen bleibt. Dann muss im ersten Schritt ein transienter Zustand
erreicht werden. Das heisst, {yi } löst das Gleichungssystem
yi =
X
Pik yk .
k∈T
Falls 0 die einzige beschränkte Lösung des obigen Gleichungssystems ist, folgt dass
irgend einmal ein rekurrenter Zustand erreicht wird. Falls die Lösung nicht einP
(1)
deutig ist, setzen wir yi = k∈T Pik , die Wahrscheinlichkeit, dass die transienten
P
(n+1)
(n)
Zustände im ersten Schritt nicht verlassen werden, und yi
= k∈T Pik yk die
Wahrscheinlichkeit, dass in n + 1 Schritten die transienten Zustände nicht verlassen
(n)
werden. Dann ist yi = limn yi .
Sei nun {zk } eine beschränkte Lösung des Gleichungssystems
zi =
X
Pik zk .
(8.3)
k∈T
(1)
Wir können annehmen, dass |zi | ≤ 1. Dann erhalten wir |zi | ≤ yi , und rekursiv,
(n)
|zi | ≤ yi . Also ist |zi | ≤ yi . Wir schliessen somit, dass das System für immer in
den transienten Zuständen bleiben kann, falls es eine beschränkte Lösung des Gleichungssystems (8.3) mit zi 6= 0 gibt. In diesem Falle ist {yi } die maximale Lösung,
die durch 1 begrenzt ist. Ist 0 die einzige Lösung, dann sind die Wahrscheinlichkeiten
{xij } durch die eindeutige Lösung des Systems (8.2) gegeben.
Die Differenz zweier Lösungen von (8.2) löst (8.3). Wir sehen nun auch, dass
(8.2) genau dann eine eindeutige beschränkte Lösung besitzt, falls das System fast
sicher einen rekurrenten Zustand erreicht. Ansonsten müssen wir die Kette unter
der Bedingung betrachten, dass das System irgendwann einen rekurrenten Zustand
erreicht. Das heisst, wir setzen für i ∈ T
P̃ik = (1 − yk )Pik /(1 − yi ) ,
k∈T ,
P̃ik = Pik /(1 − yi ) ,
k∈
/T .
Dann hat das Gleichungssystem
x̃ij =
X
k∈Cj
P̃ik +
X
P̃ik x̃kj
k∈T
eine eindeutige beschränkte Lösung. Die gesuchte Lösung ist dann xij = x̃ij (1 − yi ).
8. MARKOVKETTEN
135
Beispiel 8.7. Die Matrix P ist gegeben durch P00 = 1 und Pn(n+1) = 1 − Pn0 =
pn > 0, n ≥ 1. Dann ist 0 ein rekurrenter Zustand, die andern Zustände sind transient. Wir müssen dann also das System yn = pn yn+1 lösen. Dies hat nur dann eine
Qn
−1
nicht-triviale Lösung, falls y1 6= 0. Wir erhalten nun yn+1 = p−1
n yn = y1
k=1 pk . Es
Q∞
gibt somit genau dann eine beschränkte Lösung, falls p = k=1 pk > 0. Da yn ≤ 1,
Q
folgt y1 ≤ n−1
k=1 pk , also y1 ≤ p. Da wir die maximale Lösung suchen, ist y1 = p,
Q
Q∞
und damit yn = p/ n−1
k=1 pk =
k=n pk .
Q
Setzen wir zum Beispiel pn = n/(n+1), so ist nk=1 pk = 1/(n+1) und konvergiert
nach Null. Die Markovkette wird also fast sicher den Zustand 0 erreichen. Setzen
Q
n n+2
, so ist nk=1 pk = (n + 2)/(2(n + 1)). Dies
wir pn = ((n + 1)2 − 1)/(n + 1)2 = n+1
n+1
konvergiert nach p = 21 . Somit ist es möglich, dass die Kette immer in den transienten
Zuständen verbleibt. Die gesuchte Wahrscheinlichkeit ist dann also yn = n/(n + 1).
Wir können nun auch ein Kriterium formulieren, wann eine irreduzible Markovkette transient oder rekurrent ist.
Korollar 8.8. Eine irreduzible Markovkette ist genau dann transient, falls das
Gleichungssystem
∞
X
yi =
Pij yj
j=1
eine nicht triviale beschränkte Lösung besitzt.
Beweis. Für eine irreduzible Markovkette müssen alle Zustände transient oder
alle rekurrent sein. Die Kette ist genau dann transient, wenn es einen Zustand gibt,
von dem aus 0 mit echt positiver Wahrscheinlichkeit nicht erreicht wird. Ändern
wir die Markovkette, so dass 0 absorbierend wird, dann ist die Kette genau dann
transient, wenn die Kette die transienten Zustände der veränderten Kette mit positiver Wahrscheinlichkeit nie verlässt. Dies ist genau dann der Fall, wenn die obige
Gleichung eine nicht triviale beschränkte Lösung besitzt.
Beispiel 8.2 (Fortsetzung). Im betrachteten Beispiel müssen wir die Gleichungen
y1 = py2 , yk = pyk+1 + (1 − p)yk−1 , k ≥ 2 lösen. Ist y1 = 0, so erhalten wir durch
Induktion yk = 0 für alle k. Somit muss y1 6= 0 gelten, falls eine nichtriviale Lösung
existiert. Wir können y1 = 1 wählen. Dann ist y2 = p−1 . Im Falle p = 21 ist dies
y2 = 2. Aus yk+1 = 2yk − yk−1 erhalten wir mittels Induktion yk = k. Somit ist diese
136
8. MARKOVKETTEN
Lösung nicht beschränkt, und die Kette ist rekurrent. Ist p 6= 21 , dann ist die Lösung
yk =
p 1 − p k
−1 .
1 − 2p
p
Diese Lösung ist genau dann beschränkt, falls p > 12 . Somit ist die Markovkette
transient im Falle p > 12 , und rekurrent im Falle p ≤ 12 .
Wir haben bereits gesehen, dass nur im Falle p < 12 eine stationäre Verteilung
existiert. Also ist die Markovkette positiv rekurrent, falls p < 12 , und Null-rekurrent,
falls p = 12 .
Nehmen wir an, wir wissen, dass Xn = i. Sei m < n. Dann ist
P
m
n−m
)ji
k (P )kj (P
k νP
qij (n, m) = IIP[Xm = j | Xn = i] =
.
n
k νk (P )ki
Insbesondere für m = n − 1 erhalten wir
P
νk (P n−1 )kj P ji
kP
qij (n, n − 1) =
.
n
k νk (P )ki
Wenn das System im stationären Zustand startet, dann ist νk = πk = µ−1
k . Dies
macht nur Sinn, falls der Prozess positiv rekurrent ist. In diesem Falle erhalten wir
qij = qij (n, n − 1) =
πj P ji
.
πi
Die bedingten Wahrscheinlichkeiten qij definieren die Übergangswahrscheinlichkeiten einer Markovkette. Wir erhalten damit den Prozess, wenn die Zeit umgekehrt
wird. Falls wir die gleiche Markovkette erhalten, das heisst, qij = Pij , so nennen wir
die Markovkette reversibel.
8.2. Homogene Markovketten in stetiger Zeit
Generell definieren wir einen Markovprozess in stetiger Zeit als einen Prozess mit
der Eigenschaft IIP[Xt+s ∈ B | Ft ] = IIP[Xt+s ∈ B | Xt ]. Der Prozess heisst homogen,
falls IIP[Xt+s ∈ B | Xt = x] = IIP[Xs ∈ B | X0 = x]. Falls der Prozess nur Werte in
IIN annimmt, dann darf die Zeit T1 , bis der Prozess den Zustand X0 = i verlässt,
kein Gedächtnis haben. Das heisst sie muss exponentialverteilt sein. Nennen wir den
Parameter −Qii . Die Folge der Zustände, die der Prozess besucht, müssen dann eine
Markovkette bilden. Nennen wir die Übergangsmatrix P . Es gilt dann Pii = 0, da
die Kette den Zustand i verlässt. Wir definieren nun Qij = −Pij Qii für i 6= j. Die
8. MARKOVKETTEN
137
Matrix Q = (Qij ) heisst Intensitätsmatrix der Markovkette X. Die Matrix Q hat
dann die Eigenschaft, dass die Zeilen sich zu Null addieren, die Diagonalen negativ
sind, und die Einträge ausserhalb der Diagonalen positiv sind. Wir nehmen an, dass
in endlicher Zeit nur endlich viele Sprünge stattfinden können.
Wir haben nun die Wahrscheinlichkeiten
IIP[T1 ≤ h, XT1 = j | X0 = i] = Pij (1 − eQii h ) = Pij (−Qii h + o(h)) = Qij h + o(h) .
Also ist Qij die Intensität eines Sprunges von i nach j. Wir wollen nun die Verteilung
von Xt bestimmen. Sei pi (t) = IIP[Xt = i]. Wir haben dann
pi (t + h) = pi (t)(1 + Qii h) +
X
pj (t)Qji h + o(h) = pi (t) +
X
pj (t)Qji h + o(h) .
j
j6=i
Somit sind die Funktionen pi (t) rechtsstetig. Wir haben nun
pi (t + h) − pi (t) X
=
pj (t)Qji + o(1) ,
h
j
P
also p0i (t) = j pj (t)Qji . Ersetzen wir t durch t − h, erhalten wir die gleiche Differentialgleichung für die Ableitung von links. Die Lösung mit der Anfangsbedingung
pi (0) = νi ist
(IIP[Xt = i])i = νeQt .
Ist der Zustand j vom Zustand i aus erreichbar, dann ist IIP[Xt = j | X0 = i] > 0
für alle t, da die Sprungzeiten absolutstetig mit Träger [0, ∞] sind. Also sind i und
j in derselben irreduziblen Menge, falls beide (eQ )ij > 0 und (eQ )ji > 0.
Da die Zeiten zwischen Sprüngen exponentialverteilt sind, ist jede irreduzible
Markovkette in stetiger Zeit aperiodisch. Wir haben also folgende möglichen irreduziblen Markovketten.
Proposition 8.9. Eine irreduzible Markovkette in stetiger Zeit hat eine der folgenden Eigenschaften:
i) Die Zustände sind transient. In diesem Fall gilt
und limt→∞ etQ = 0.
nhQ
)ij
n (e
P
ii) Die Zustände sind Null-rekurrent. In diesem Fall gilt
h > 0, aber limt→∞ etQ = 0.
< ∞ für alle h > 0,
nhQ
)ij
n (e
P
= ∞ für jedes
138
8. MARKOVKETTEN
iii) Die Zustände sind positiv rekurrent. In diesem Fall gilt limt→∞ (etQ )ij = µ−1
j ,
wobei µj = IIE[inf{t : Xt = j, Xt− 6= j} | X0 = j] die mittlere Rückkehrzeit nach
j ist.
Beweis. Die Aussagen im transienten und Null-rekurenten Fall sind klar. Wir
wissen, dass (enQ )ij gegen eine stationäre Verteilung der Kette {Xn } konvergiert.
Dies ist also ein Eigenvektor der Matrix eQ zum Eigenwert 1. Nach dem Perron–
Fröbenius-Theorem ist dieser Eigenwert einfach. Da 0 = log 1 ein Eigenwert von Q
ist, ist dieser Eigenwert auch einfach, und πQ = 0. Somit konvergiert enhQ gegen
den gleichen Grenzwert für alle h. Aus
IIP[Xnh+s = j | X0 = i] ≥ IIP[Xnh = j | X0 = i](1 − eQjj s )
für alle s ∈ [0, h), schliessen wir, dass limt (etQ )ij ≥ πj . Aus
IIP[Xnh = j | X0 = i] ≥ IIP[Xnh−s = j | X0 = i](1 − eQjj s )
schliessen wir, dass auch limt (etQ )ij ≤ πj . Die Interpretation als Rückkehrzeit folgt
analog.
Wir sehen nun also, dass die stationäre Verteilung die normierte Lösung der
Gleichung πQ = 0 ist. Die folgende Aussage folgt wie im Fall der diskreten Zeit.
Korollar 8.10. Für eine positiv rekurrente Markovkette konvergiert
Z t
(t)
−1
aj = t
1IXs =j ds
0
nach πj = µ−1
j . Für eine Null-rekurrente oder transiente Markovkette konvergiert
(t)
aj nach 0.
Herunterladen