Kapitel 10

Werbung
WR 1
W. Merz
Kapitel 10
Zufallsvariable
Vorlesung Wahrscheinlichkeitsrechnung I vom 03. Juni 2009
W. Merz
Lehrstuhl für Angewandte Mathematik 1
FAU
10.1
WR 1
Zufallsgrößen
W. Merz
Zufallsgrößen sind Abbildungen X : Ω −→ Ω̂ von der
Ergebnismenge Ω eines Wahrscheinlichkeitsraums in eine
Menge Ω̂ mit noch zu definierenden Eigenschaften
Symbole: Zufallsgrößen werden durch Großbuchstaben aus
dem letzten Drittel des Alphabets gekennzeichnet:
X , Y , Z , U, V .
10.2
WR 1
Urbildmengen
W. Merz
Für die Urbilder von Teilmengen A ⊂ Ω̂ benutzen wir die schon
früher eingeführte Bezeichnung
(X ∈ A) = {ω ∈ Ω ; X (ω) ∈ A}
Rechenregeln
• (X ∈ A ∪ B) = (X ∈ A) ∪ (X ∈ B)
S
Ak ) = k (X ∈ Ak )
• (X ∈ A ∩ B) = (X ∈ A) ∩ (X ∈ B)
T
T
• (X ∈ k Ak ) = k (X ∈ Ak )
• (X ∈
S
k
• (X ∈ A) = (X ∈ A)
• (X ∈ Ω̂) = Ω
10.3
Zufallsgrößen
WR 1
W. Merz
Beispiel für die Verifikation der Rechenregeln
ω ∈ (X ∈ A ∪ B) ⇔ X (ω) ∈ A ∪ B
⇔ X (ω) ∈ A oder X (ω) ∈ B
⇔ ω ∈ (X ∈ A) oder ω ∈ (X ∈ B)
⇔ ω ∈ (X ∈ A) ∪ (X ∈ B)
Folgerungen
• (X ∈ ∅) = ∅
• A∩B =∅
⇒ (X ∈ A) ∩ (X ∈ B) = ∅
• (X ∈ A + B) = (X ∈ A) + (X ∈ B)
P
P
• (X ∈ k Ak ) = k (X ∈ Ak )
10.4
WR 1
Zufallsgrößen
W. Merz
Definition
Sind A bzw. Â σ-Algebren auf den Mengen Ω bzw. Ω̂ so heißt
eine Abbildung X : Ω −→ Ω̂ mit der Eigenschaft (X ∈ A) ∈ A
für alle A ∈ Â A-Â-messbar.
Bezeichnung
Eine A-Â-messbare Abbildung auf einem
Wahrscheinlichkeitsraum (Ω, A, P) heißt kurz eine
Zufallsgröße.
Theorem
Die Mengenfunktion P X : Â −→ R mit P X (A) = P(X ∈ A) ist
eine Wahrscheinlichkeit auf  und heißt die Verteilung der
Zufallsgröße X .
Schema
X
(Ω, A, P) −→ (Ω̂, Â, P X )
10.5
Zufallsvariable
WR 1
W. Merz
Definition
Eine Abbildung X : Ω −→ R auf einem
Wahrscheinlichkeitsraum (Ω, A, P), die messbar bezüglich der
σ-Algebra A und der σ-Algebra B der Borelschen Mengen auf
R ist, heißt eine Zufallsvariable.
Theorem
Eine Funktion X : Ω −→ R auf einem Wahrscheinlichkeitsraum
(Ω, A, P) ist genau dann eine Zufallsvariable, wenn für alle
reellen Zahlen t die Urbilder
(X ≤ t) = (X ∈ (−∞, t]) = {ω ∈ Ω ; X (ω) ≤ t}
in der σ-Algebra A liegen.
10.6
Zufallsvariable
WR 1
W. Merz
Test, ob eine Funktion X : Ω −→ R eine Zufallsvariable ist:
Versuche, die Wahrscheinlichkeiten P(X ≤ t) für alle reellen
Zahlen t zu berechnen.
Geht das, so ist X eine Zufallsvariable und
P(X ≤ t) = P(X ∈ (−∞, t]) = P X (−∞, t] = F X (t)
die Verteilungsfunktion (der Verteilung) von X .
10.7
Die Verteilung einer Zufallsvariable
WR 1
W. Merz
Beispiel 1
Bestimme die Verteilung von X (s) = − ln(s) auf dem
Wahrscheinlichkeitsraum (R, B, P), wenn P die
U(0, 1)-Verteilung ist.
Sprechweise
„Bestimme die Verteilung“ heißt:
„Berechne eine Formel für eine Funktion, die die Verteilung P X
vollständig charakterisiert“,
also entweder die Verteilungsfunktion F X (t) oder
— wenn das geht —
die Dichte f (x).
10.8
WR 1
Beispiel 1
W. Merz
λ(B ∩ (0, 1))
= λ(B ∩ (0, 1))
λ((0, 1))
− ln(s) falls s > 0
X (s) =
x0
falls s ≤ 0
P(B) =
(X ≤ t)
{s ∈ R ; X (s) ≤ t}
{s ≤ 0 ; X (s) ≤ t} + {0 < s < 1 ; − ln(s) ≤ t}
+{s ≥ 1 ; X (s) ≤ t}
+
=: A−
t + Bt + At
=
=
+
A−
t und At disjunkt zum offenen Intervall (0, 1), daher ist
−
P(At ) = P(A+
t ) = 0 und P(X ≤ t) = P(Bt ).
10.9
WR 1
Beispiel 1
Bt = {0 < s < 1 ; − ln(s) ≤ t}
W. Merz
1. Fall Für t ≤ 0 ist Bt = ∅, denn für 0 < s < 1 ist − ln(s) > 0.
2. Fall Für t > 0 ist
Bt = {0 < s < 1 ; s ≥ e−t } = [e−t , 1)
Daraus folgt
X
F (t) =
0
P[e−t , 1) = 1 − e−t
für t ≤ 0
für t > 0
d.h. F X (t) ist die Verteilungsfunktion der Exponentialverteilung
bzw. die Zufallsvariable X ist exponentiell verteilt mit Parameter
λ = 1.
10.10
Die Verteilung einer Zufallsvariablen
WR 1
W. Merz
Beispiel 2
Bestimmen Sie die Verteilung der Zufallsvariablen
X (y ) = ay + b auf dem Wahrscheinlichkeitsraum (R, B, P), wo
P die N (0, 1)-Verteilung ist.
Die N (0, 1)-Verteilung besitzt die Dichte
1 2
1
ϕ(x) = √ e− 2 x
2π
Für die Verteilungsfunktion
Z
t
Φ(t) =
ϕ(x)dx
−∞
gibt es keine „Formel“, d.h. Darstellung durch irgendwelche
analytischen Funktionen.
10.11
WR 1
Beispiel 2
Verteilungsfunktion von X :
W. Merz
F X (t) = P(X ≤ t) = P{y ∈ R ; X (y ) ≤ t} = P{y ∈ R ; ay +b ≤ t}
Fall a > 0
ay + b ≤ t
⇔
ay ≤ t − b
⇔
y≤
1
(t − b)
a
Mit yt = a1 (t − b) ist (X ≤ t) = (−∞, yt ] und daher
1
F X (t) = P(−∞, yt ] = Φ(yt ) = Φ( (t − b))
a
10.12
Beispiel 2
Dichte der Verteilung von X :
f X (t) =
WR 1
W. Merz
d X
d
1
F (t) = Φ( (t − b))
dt
dt a
Nach der Kettenregel
f X (t)
d 1
dΦ 1
( (t − b)) ·
(t − b)
dy a
dt a
1
1
= ϕ( (t − b))
a
a
1 1 − 1 ( 1 (t−b))2
√ e 2 a
=
a 2π
=
Umformung:
f X (t)
=
=
1 1 − 1 ( 1 (t−b))2
√ e 2 a
a 2π
2
1
1
√
e− 2a2 (t−b)
2
2πa
10.13
WR 1
Beispiel 2
W. Merz
Fall a < 0
ay + b ≤ t
⇔
ay ≤ t − b
⇔
y≥
1
(t − b)
a
Mit yt = a1 (t − b) ist (X ≤ t) = [yt , ∞) und daher
F X (t)
= P[yt , ∞) = 1 − P(−∞, yt ) = 1 − Φ(yt − 0) = 1 − Φ(yt )
1
= 1 − Φ( (t − b))
a
Differenzieren:
1
1
1
1
f X (t) = −ϕ( (t − b)) =
ϕ( (t − b))
a
a
(−a) a
10.14
WR 1
Beispiel 2
W. Merz
Umformung
f X (t)
=
=
2
1 1
1
1
√ e− 2 ( a (t−b))
(−a) 2π
2
1
1
√
e− 2a2 (t−b)
2
2πa
Die Dichte und damit die Verteilung hängt nur vom Quadrat a2
der Zahl a ab.
Bezeichnung: N (b, a2 )-Verteilung.
Man kann nachrechnen, dass b der Mittelwert und a2 die
Varianz dieser Verteilung ist.
10.15
WR 1
Die Normalverteilung
W. Merz
Definition
Sei µ eine reelle und σ 2 > 0 eine positive reelle Zahl. Dann
heißt die Verteilung mit der Dichte
f (t) = √
1
2πσ 2
1
e− 2σ2 (t−µ)
2
die Normalverteilung mit Mittelwert µ und Varianz σ 2 oder kurz
N (µ, σ 2 )-Verteilung.
10.16
WR 1
Die Verteilung einer Zufallsvariablen
W. Merz
Schießen auf eine Zielscheibe
Wahrscheinlichkeitsraum (R2 , B2 , P), Verteilung P absolutstetig
mit Dichte
f (x1 , x2 ) = ϕ(x1 )ϕ(x2 ) =
1 − 1 (x12 +x22 )
e 2
2π
Abstand des Treffpunkts vom Zentrum der Scheibe:
q
X (x1 , x2 ) = x12 + x22
10.17
WR 1
Beispiel 3
(X ≤ t) = {(x1 , x2 ) ∈ R2 ;
W. Merz
q
x12 + x22 ≤ t} =: Bt
Für t < 0 ist Bt = ∅
Für t ≥ 0 ist Bt die Kreisscheibe mit Radius t.
0
für t < 0
X
R
F (t) = P(Bt ) =
f
(x
,
x
)d(x
,
x
)
für
t ≥0
1 2
1 2
Bt
10.18
Beispiel 3
Parametrisierung von Bt mit Polarkoordinaten:
x1
x2
WR 1
W. Merz
= r cos(φ)
= r sin(φ)
mit 0 ≤ r ≤ t, 0 ≤ φ < 2π
Funktionaldeterminante
∂(x1 , x2 )
=r
∂(r , φ)
x12 + x22 = r 2 cos2 (φ) + sin2 (φ) = r 2
10.19
WR 1
Beispiel 3
Z
Bt
1 − 1 (x12 +x22 )
d(x1 , x2 )
e 2
2π
W. Merz
!
1 − 1 r2
=
re 2 dφ dr
2π
0
0
Z t
Z 2π
1 2
1
=
re− 2 r
dφdr
2π
0
0
Z t
1 2
=
re− 2 r dr
Z
t
Z
2π
0
=
h
1 2
−e− 2 r
it
0
= 1−e
− 21 t 2
10.20
WR 1
Die Rayleighverteilung
W. Merz
Definition
Die eindimensionale Verteilung mit der Verteilungsfunktion
(
0
für t ≤ 0
2
F (t) =
− 12 ( βt )
für t > 0
1−e
heißt die Rayleigh-Verteilung mit Parameter β (> 0).
Die Verteilung von X ist somit die Rayleighverteilung mit
Parameter β = 1
Die Wahrscheinlichkeit, dass der Treffpunkt in einem Ring liegt:
2
P(a ≤ X ≤ b) = P X [a, b] = F X (b) − F X (a) = e−0.5a − e−0.5b
2
10.21
WR 1
Die Rayleigh-Verteilung
W. Merz
Die Verteilungsfunktion
(
F (t) =
für t ≤ 0
0
2
1−e
− 12 ( βt )
für t > 0
ist stetig differenzierbar mit der Ableitung
(
0
für t ≤ 0
0
2
f (t) = F (t) =
t − 12 ( βt )
e
für t > 0
β2
Daher ist f (t) die Dichte der Rayleighverteilung.
10.22
Zufallsvektoren
WR 1
W. Merz
Definition
Eine Abbildung X : Ω −→ Rn auf der Ergebnismenge eines
Wahrscheinlichkeitsraums (Ω, A, P), die bezüglich A und der
σ-Algebra Bn der n-dimensionalen Borelschen Mengen
messbar ist, heißt ein Zufallsvektor oder eine n-dimensionale
Zufallsvariable.
X (ω) ist ein Vektor: X (ω) = (X1 (ω), X2 (ω), . . . , Xn (ω))
Die Funktionen Xk : Ω −→ R heißen die Komponenten des
Zufallsvektors X .
Kurzschreibweise: X = (X1 , X2 , . . . , Xn )
Theorem
X = (X1 , X2 , . . . , Xn ) ist ein Zufallsvektor genau dann, wenn
alle Komponenten Zufallsvariable sind.
10.23
Die Verteilung eines Zufallsvektors
X = (X1 , X2 , . . . , Xn ) sei ein n-dimensionaler Zufallsvektor mit
der Verteilung P X :
WR 1
W. Merz
X
(Ω, A, P) −→ (Rn , Bn , P X )
Wir beschränken uns in dieser Vorlesung auf absolutstetige
Verteilungen P X , d.h. solche, die durch eine Dichte
f (x) = f (x1 , x2 , . . . , xn ) charakterisiert sind.
Für eine Borelsche Menge B ∈ Bn gilt unter dieser
Voraussetzung
Z
Z
P(X ∈ B) = P X (B) = 1B (x)f (x) dx =
f (x) dx
B
Die meisten Fragestellungen in dieser Situation laufen auf das
Problem hinaus, die Beschreibung eines Ereignisses in die
Gestalt (X ∈ B) überzuführen.
10.24
Die Verteilung eines Zufallsvektors
WR 1
W. Merz
Beispiel
Die Verteilung des Zufallsvektors X = (X1 , X2 ) besitze die
Dichte f (x1 , x2 ).
Berechne die Wahrscheinlichkeit des Ereignisses (X1 < X2 ).
(X1 < X2 )
=
=
=
=
{ω
{ω
{ω
(X
; X1 (ω) < X2 (ω)}
; (X1 (ω), X2 (ω)) ∈ {(x1 , x2 ) ∈ R2 ; x1 < x2 }}
; X (ω) ∈ B}
∈ B)
Z
P(X1 < X2 ) =
1B (x1 , x2 )f (x1 , x2 ) d(x1 , x2 )
10.25
WR 1
Beispiel
W. Merz
Bei B = {(x1 , x2 ) ∈ R2 ; x1 < x2 } ergibt sich je nach
Reihenfolge der Integration als Berechnungsformel
Z
Z Z
1B (x1 , x2 )f (x1 , x2 ) d(x1 , x2 ) =
1B (x1 , x2 )f (x1 , x2 ) dx2 dx1
Z ∞ Z ∞
=
f (x1 , x2 ) dx2 dx1
−∞
x1
=: I1
oder
Z
1B (x1 , x2 )f (x1 , x2 ) d(x1 , x2 )
Z Z
=
Z
∞
=
−∞
1B (x1 , x2 )f (x1 , x2 ) dx1 dx2
Z x2
f (x1 , x2 ) dx1 dx2
−∞
=: I2
10.26
WR 1
Beispiel
W. Merz
Speziallfall
f (x1 , x2 ) = f1 (x1 )f2 (x2 ) mit eindimensionalen Dichten fi (t).
Fi (t) sei die Verteilungsfunktion zu fi (t).
∞
Z
I2
=
−∞
Z ∞
=
Z
x2
f1 (x1 )f2 (x2 ) dx1 dx2
Z x2
f2 (x2 )
f1 (x1 ) dx1 dx2
−∞
−∞
∞
−∞
Z
f2 (x2 )F1 (x2 ) dx2
=
−∞
∞
∞
f1 (x1 )f2 (x2 ) dx2 dx1
x1
−∞
Z ∞
Z ∞
=
f1 (x1 )
f2 (x2 ) dx2 dx1
−∞
x1
Z ∞
=
f1 (x1 ) (1 − F2 (x1 )) dx1
Z
I1
Z
=
−∞
10.27
WR 1
Beispiel
W. Merz
Noch spezieller:
fi (t) bzw. Fi (t) sei die Dichte bzw. Verteilungsfunktion der
Exponentialverteilung mit Parameter λi .
Z
I1
∞
f1 (t) (1 − F2 (t)) dt
=
−∞
∞
Z
=
=
λ1 e−λ1 t e−λ2 t dt
0
Z ∞
λ1
(λ1 + λ2 )e−(λ1 +λ2 )t dt
λ 1 + λ2 0
Der Integrand ist die Dichte der Exponentialverteilung mit
Parameter λ1 + λ2 , der Wert des Integrals daher 1 und
P(X1 < X2 ) =
λ1
λ1 + λ 2
10.28
Funktionen von Zufallsvariablen
X12 (ω)
WR 1
W. Merz
X22 (ω)
Y1 (ω) =
+
Y2 (ω) = a1 X1 (ω) + a2 X2 (ω) + a3 X3 (ω)
Allgemein: Sind X1 , X2 , . . . , Xn Zufallsvariable auf einem
Wahrscheinlichkeitsraum (Ω, A, P)und
yi = Gi (x1 , . . . , xn )
für i = 1, . . . , m reellwertige Funktionen, so möchte man die
Verteilung des Zufallsvektors Y = (Y1 , Y2 , . . . , Ym ) mit den
zusammengesetzten Funktionen
Yi (ω) = Gi (X1 (ω), . . . , Xn (ω))
auf Ω bestimmen.
10.29
Funktionen von Zufallsvariablen
WR 1
W. Merz
Vektorschreibweise:
• X : Ω −→ Rn , X (ω) = (X1 (ω), X2 (ω), . . . , Xn (ω))
• G : Rn −→ Rm , G(x) = (G1 (x), G2 (x), . . . , Gm (x))
mit x = (x1 , . . . , xn )
• Y : Ω −→ Rm , Y (ω) = (Y1 (ω), Y2 (ω), . . . , Ym (ω))
• Kurzschreibweise: Y (ω) = G (X (ω))
• Ohne Argumente: Y = G ◦ X
• Y = G ◦ X heißt die Komposition von X und G
10.30
WR 1
Funktionen von Zufallsvariablen
W. Merz
Falls X , G und Y = G ◦ X Zufallsvektoren, d.h. messbar sind,
liegt die folgende Situation vor:
X
(Ω, A, P)
(Rn , Bn , P X )
-
HH
H
Y =G◦X
HH
H
G
HH
H
HH
j
?
(R , Bm , P )
m
10.31
Kompositionssatz
WR 1
W. Merz
Satz
Sind X : Ω −→ Rn und G : Rn −→ Rm Zufallsvektoren, dann ist
auch Y = G ◦ X ein Zufallsvektor und Y und G besitzen die
gleiche Verteilung: P Y = P G .
Beweis
Zu zeigen ist, dass für beliebige Borelsche Mengen B ⊂ Rm
das Urbild (Y ∈ B) in der σ-Algebra A liegt und
P Y (B) = P G (B) gilt.
Sei A = (G ∈ B). Da G ein Zufallsvektor ist, ist A eine
Borelsche Menge im Rn und für beliebige ω ∈ Ω gilt
ω ∈ (Y ∈ B) ⇐⇒ Y (ω) = G X (ω) ∈ B
⇐⇒ X (ω) ∈ (G ∈ B) = A
⇐⇒ ω ∈ (X ∈ A)
10.32
WR 1
Kompositionssatz
W. Merz
Beweis
(Y ∈ B) = (X ∈ A) = (X ∈ (G ∈ B))
Da X ein Zufallsvektor ist, ist (X ∈ A) und damit (Y ∈ B) ein
Ereignis aus A.
Y ist also auch ein Zufallsvektor.
P Y (B)
= P(Y ∈ B) = P(X ∈ A) =
= P X (A) = P X (G ∈ B) =
= P G (B)
Bei P Y und P G handelt es sich um das gleiche
Wahrscheinlichkeitsgesetz.
10.33
WR 1
Funktionen von Zufallsvariablen
X
(Ω, A, P)
-
W. Merz
(Rn , Bn , P X )
HH
HH
Y =G◦X
H
HH
G
H
HH
j
H
?
(R , Bm , P )
m
10.34
WR 1
Mehrdimensionale Verteilungen
W. Merz
„Bestimme die Verteilung des Zufallsvektors Y “ bedeutet also:
Bestimme die Verteilung P G in dem Schema
G
(Rn , Bn , P X ) −→ (Rm , Bm , P G )
wobei die Funktion G : Rn −→ Rm und die Verteilung P X als
bekannt vorausgesetzt sind.
Die Verteilung P X sei absolutstetig mit einer (bekannten)
Dichte f (x) = f (x1 , x2 , . . . , xn )
Z
P X (A) = 1A (x)f (x)dx
Verteilung von G:
P G (B) = P X (G ∈ B) =
Z
1(G∈B) (x)f (x) dx
Gesucht ist eine Dichte g der Verteilung P G , d.h. eine Funktion
mit
Z
Z
P G (B) = 1B (y )g(y ) dy = 1(G∈B) (x)f (x) dx
10.35
Herunterladen