wahrscheinlichkeitstheorie und statistik für studierende der informatik

Werbung
10 Übergangswahrscheinlichkeiten und bedingte
Wahrscheinlichkeiten
10.1 Gekoppelte Zufallsexperimente
Viele stochastische Vorgänge bestehen aus Teilexperimenten.
Ergebnisse eines n-stufigen Experiments sind n–Tupel ω = (a1 , a2 , . . . , an ), wobei
aj den Ausgang des j–ten Teilexperimentes angibt.
Ist Ωj die Ergebnismenge dieses Teilexperimentes, so ist
Ω := Ω1 × · · · × Ωn = {ω = (a1 , . . . , an ) : aj ∈ Ωj für j = 1, . . . , n}
ein Grundraum für das Gesamt–Experiment.
10.1 Beispiel
Eine Urne enthalte eine rote und drei schwarze Kugeln. Es werden rein zufällig eine
Kugel gezogen, ihre Farbe notiert und anschließend diese sowie eine weitere Kugel
derselben Farbe in die Urne zurückgelegt. Nach gutem Mischen wird wiederum eine
Kugel gezogen. Mit welcher Wahrscheinlichkeit ist diese rot?
Ziehen einer roten (bzw. schwarzen) Kugel: 1“ (bzw. 0“ )
”
”
Ω := Ω1 × Ω2 mit Ω1 = Ω2 = {0, 1}
B =
die beim zweiten Mal gezogene Kugel ist rot“ = {(1, 1), (0, 1)}
”
Festlegung von f (ω) durch
f (1, 1) :=
1 2
· ,
4 5
f (1, 0) :=
1 3
· ,
4 5
f (0, 1) :=
3 1
· ,
4 5
f (0, 0) :=
3 4
· .
4 5
Start 1
4
3
4
2
5
1
2
20
1
3
5
0
4
1
5
0
3
20
5
1
3
20
P(B) = f (1, 1) + f (0, 1) =
0
12
20
2
3
1
+
=
.
20 20
4
10.2 Satz und Definition
Ω1 und Ω2 seien abzählbare Grundräume, P1 ein Wahrscheinlichkeitsmaß auf Ω1 ,
die sog. Startverteilung, mit der Zähldichte f1 (ω1 ) := P1 ({ω1 }).
f12 sei eine Übergangs-Zähldichte von Ω1 nach Ω2 , d.h. eine Funktion mit
f12 (ω1 , ω2 ) ≥ 0,
X
f12 (ω1 , ω2 ) = 1 für alle ω1 .
ω2 ∈Ω2
Dann ist (sog. 1. Pfadregel)
f (ω1 , ω2 ) := f1 (ω1 ) · f12 (ω1 , ω2 )
eine Zähldichte auf Ω := Ω1 × Ω2 .
Das zu f gemäß
P(A) :=
X
f (ω),
A⊂Ω
ω∈A
gehörende Wahrscheinlichkeitsmaß P auf Ω heißt Koppelung von f1 und f12 . 10.3 Satz (2. Pfadregel)
P sei die Koppelung von f1 und f12 und Xj (ω1 , ω2 ) := ωj der zufällige Ausgang
von Teilexperiment j, j = 1, 2. Dann besitzt X2 die Zähldichte
f2 (ω2 ) :=
X
f1 (ω1 ) · f12 (ω1 , ω2 ),
ω2 ∈ Ω2 .
ω1 ∈Ω1
Beweis: Bildung der Randverteilung ergibt
f2 (ω2 ) =
X
ω1 ∈Ω1
f (ω1 , ω2 ) =
X
ω1 ∈Ω1
f1 (ω1 ) · f12 (ω1 , ω2 ). 10.2 Bedingte Wahrscheinlichkeiten
10.4 Definition
(Ω, A, P) Wahrscheinlichkeitsraum, A, B ∈ A mit P(B) > 0. Dann heißt
P(A|B) :=
P(A ∩ B)
P(B)
die bedingte Wahrscheinlichkeit von A unter der Bedingung B.
10.5 Beispiel
Gedächtnislosigkeit der Exponentialverteilung
Die zufällige Dauer X ≥ 0 eines Prozesses habe die Verteilungsfunktion FX .
Der Prozess sei zum Zeitpunkt s ≥ 0 noch nicht beendet. Es liegt daher das Ereignis
{X > s} vor.
Gesucht ist unter dieser Bedingung die Verteilung von X − s.
P(X − s > y | X > s) =
=
P(X > y + s, X > s)
P({X − s > y} ∩ {X > s})
=
P(X > s)
P(X > s)
1 − FX (y + s)
P(X > y + s)
=
.
P(X > s)
1 − FX (s)
Speziell für X ∼ Exp(α) gilt 1 − FX (t) = e−α·t und daher
P(X − s > y | X > s) =
für y > 0, unabhängig von s.
e−α·y · e−α·s
= e−α·y = P(X > y)
−α·s
e
Diese Eigenschaft heißt Gedächtnislosigkeit der Exponentialverteilung.
Unter allen stetigen Verteilungen auf den positiven reellen Zahlen sind die Exponentialverteilungen die einzigen Verteilungen mit dieser Eigenschaft.
Bedeutung: Ein gebrauchtes Gerät mit dieser Eigenschaft, das zum Zeitpunkt s
noch funktioniert, ist genauso gut wie ein neues Gerät.
Die geometrischen Verteilungen sind die einzigen diskreten Verteilungen auf N0 mit
der entsprechenden Eigenschaft: Ist X ∼ G(p), so gilt
P(X − n ≥ k | X ≥ n) = P(X ≥ k), k, n ∈ N0 .
10.6 Satz (Multiplikationsformel)
Es seien A1 , . . . , An ∈ A Ereignisse mit
P (A1 ∩ . . . ∩ An−1 ) > 0.
Dann gilt:
P (A1 ∩ . . . ∩ An ) =
P (A1) · P (A2 |A1 ) · P (A3 |A1 ∩ A2 ) · . . . · P (An |A1 ∩ . . . ∩ An−1 ).
10.7 Satz
Es seien A1 , A2 , . . . ∈ A paarweise disjunkte Ereignisse mit
legung von Ω) und B ein Ereignis. Dann gilt:
a) P (B) =
∞
P
P (Aj ) · P (B|Aj )
j=1
(Formel von der totalen Wahrscheinlichkeit)
b) Falls P (B) > 0, so gilt für jedes k
P (Ak |B) =
P (Ak ) · P (B|Ak )
∞
P
P (Aj ) · P (B|Aj )
j=1
(Formel von Bayes)
P∞
j=1 Aj
= Ω (sog. Zer-
Beweis: a) folgt aus
P (B) = P
∞
X
j=1
=
∞
X
Aj
!
∩B
P (Aj ∩ B) =
j=1
!
= P
∞
X
∞
X
Aj ∩ B
j=1
P (Aj ) · P (B|Aj ).
j=1
b) folgt aus a):
P (Ak |B) =
=
P (Ak ∩ B)
P (B ∩ Ak ) P (Ak )
=
·
P (B)
P (Ak )
P (B)
P (Ak ) · P (B|Ak )
∞
P
j=1
!
P (Aj ) · P (B|Aj )
10.8 Satz
Sei PB (A) := P(A|B) für A ∈ A. Dann gilt:
a) PB ist ein Wahrscheinlichkeitsmaß, d.h.
PB (Ω) = 1,
A1 , A2 , . . . ∈ A paarweise disjunkt =⇒ PB
∞
X
n=1
An
!
=
∞
X
PB (An ).
n=1
b) Ist Ω abzählbar und besitzt P die Zähldichte f , so besitzt PB die Zähldichte

 f (ω) , falls ω ∈ B,
P(B)
fB (ω) := PB ({ω}) =

0
, sonst.
10.9 Definition
a) Es seien X und Y zwei diskrete Zufallsvariablen mit Werten in den abzählbaren
Mengen MX bzw. MY und der gemeinsamen Zähldichte fX,Y . Dann heißt
die Funktion

 fX,Y (s, t) , falls f (s) > 0,
X
fX (s)
fY |X (s, t) :=

0
, sonst,
die bedingte Zähldichte von Y unter der Bedingung X.
b) Es seien X und Y zwei stetige Zufallsvariablen mit der gemeinsamen Dichte
fX,Y . Dann heißt die Funktion

 fX,Y (s, t) , falls f (s) > 0,
X
fX (s)
fY |X (s, t) :=

0
, sonst,
die bedingte Dichte von Y unter der Bedingung X.
Für diskrete Zufallsvariablen X und Y ist (falls P(X = s) > 0)
fY |X (s, t) = P(Y = t | X = s)
die bedingte Wahrscheinlichkeit, dass Y den Wert t annimmt, wenn bekannt ist,
dass X den Wert s angenommen hat.
Umgekehrt kann man aus fX und fY |X die gemeinsame Zähldichte bzw. Dichte von
X und Y bestimmen:
fX,Y (s, t) = fX (s) · fY |X (s, t).
Herunterladen