Kapitel 4: Zufallsvariable und ihre Verteilungen

- 25 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
Kapitel 4: Zufallsvariable und ihre Verteilungen
Bei einem stochastischen Experiment interessiert man sich oft nicht so sehr für die
zufälligen Ausgänge selbst, als für Zahlenwerte und allgemeinere Größen, die durch den
Ausgang des Experiments bestimmt werden. Diese Größen nennt man Zufallsvariable, eine
Begriffsbildung, die grundlegend für die Wahrscheinlichkeitstheorie ist.
4.1
Beispiel : Viermaliger (unverfälschter) Münzenwurf.
Zufallsvariable: X = „Anzahl der geworfenen Z´s“.
Modell: Ω = {Z, W}4, P ist die Gleichverteilung auf Ω.
X ist dann eine Abbildung : X : Ω → {0, 1, 2, 3, 4} = : Ω´,
z.B. X((W, W, Z, W)) = 1.
4.2
Definition : a) (Ω, P) sei ein (diskreter) W-raum und Ω´ ≠ ∅ eine höchstens abzählbare
Menge. Unter einer diskreten Zufallsvariablen (ZV) X in Ω´ verstehen wir eine Abbildung X : Ω → Ω´.
b) Falls Ω´ ⊂ IR , sprechen wir von einer reellen ZVen, und falls Ω´ ⊂ IR k (k ≥ 2), von
einem reellen Zufallsvektor .
Anschaulich gesprochen bedeutet „ ZVe in Ω´ “, daß ein Zufallsexperiment vorliegt,
das durch (Ω, P) repräsentiert wird (in unserem Beispiel der viermalige Münzenwurf), und
daß in Abhängigkeit von der Realisierung ω (z.B. = (W, W, Z, W)) das Element X(ω) von Ω´
(z.B. = 1) ausgewählt wird. In diesem Sinne haben wir eine „vom Zufall gesteuerte“ Variable
X in Ω´.
4.3
Im obigen Beispiel interessieren wir uns für Wahrscheinlichkeiten von Ereignissen
wie
(1 ≤ X ≤ 3) : = {ω| 1 ≤ X(ω) ≤ 3} = X –1 (Ω´ ∩ [1 , 3] ) .
Allgemein schreiben wir für B ⊂ Ω´ :
( X ∈ B ) : = {ω| X(ω) ∈ B} = X –1 ( B ) .
P(1 ≤ X ≤ 3) = P(X = 1) + P(X = 2) + P(X = 3) = (4 + 6 + 4) 16 =
7
8
.
- 26 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
Allgemein benötigen wir also die Wahrscheinlichkeiten
PX (ω´) : = P( X = ω´) = P ({ω | X(ω) = ω´}) = P( X –1 (ω´)) , ω´ ∈ Ω´.
Da PX (ω´) ≥ 0 und
∑P
ω
X
(ω ′) =
′ ∈ Ω′
∑ P(X
ω
-1
(ω ′)) = P(
′ ∈ Ω′
UX
ω
-1
(ω ′) ) = P(Ω
Ω) = 1,
′ ∈ Ω′
ist ( PX (ω´) )ω´∈ Ω´ ein W-vektor und definiert deshalb eine Wahrscheinlichkeit PX
auf Ω´ , die sogenannte Verteilung der ZVen X.
(Ω
Ω´, PX ) ist ein W-raum und es gilt:
PX(B) = (
∑P
ω
X
(ω ′) =
′∈ B
∑ P(ω ) =
P(X-1(B)) ) = P(X ∈ B) , B ⊂ Ω´ .
ω ∈ X -1 ( B)
Die Verteilung PX beschreibt, mit welchen Wahrscheinlichkeiten die „vom Zufall gesteuerte“ Variable X Werte in Ω´ annimmt. Als Konsequenz ist für viele w-theoretische
Probleme der zugrunde liegende W-raum (Ω
Ω, P) von untergeordneter Bedeutung und kann oft
vernachlässigt werden. In diesen Fällen ist nur wesentlich, die Verteilung der ZVe X zu kennen.
d
Wir schreiben: X = D , falls D die Verteilung von X ist, und
d
X = Y , falls die ZVen X und Y die gleiche Verteilung haben.
Die das Zufallsexperiment beschreibende Wahrscheinlichkeit P auf Ω läßt sich als
Spezialfall in dieses Konzept einordnen. Falls wir Ω´= Ω und id : Ω → Ω mit id(ω) : = ω
betrachten, dann ist P die Verteilung von id.
4.4
Beispiele :
1. Urnenmodelle :
N Kugeln, R schwarze; und n Kugeln gezogen.
K : = „Anzahl von schwarzen gezogenen Kugeln“.
d
a) Ziehen ohne Zurücklegen : K = Hg(n, R, N ) .
b) Ziehen mit Zurücklegen :
d
K = B(n, p) , wobei p =
R
N
.
- 27 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
2. Viermaliger (unverfälschter) Münzenwurf :
X = „Anzahl von Z´s“.
d
X = B(4,
1
2
) (Begründung ?).
3. (Ω
Ω, P) sei ein (diskreter) W-raum und A ⊂ Ω ein Ereignis.
Wir setzen
 1, falls ω ∈ A
1A(ω): = 
 0, falls ω ∉ A, d.h. ω ∈ A .
1A heißt Indikatorvariable von A.
Die Zufallsvariable 1A (mit Werten in Ω´ = {0, 1}) hat die Verteilung
( P( A ), P( A ) ) ( = B(1, P( A ); Bernoulliverteilung mit Parameter p = P(A) ).
4.5
Bemerkungen : a) Es gelten folgende leicht nachzuprüfende Beziehungen zwischen
Ereignissen und Indikatorvariablen :
A ⊂ B ⇔ 1A ≤ 1B ;
A = B ⇔ 1A = 1B .
1A∩B = 1A ⋅ 1B = min (1A, 1B)
1A∪B = 1A + 1B − 1A ⋅ 1B = max (1A, 1B)
1B\A = 1B − 1A ⋅ 1B
1A
= 1 − 1A .
b) Falls (Ω
Ω, P) ein Urnenexperiment wie in Beispiel 4.4, 1 beschreibt, und
Aj = „schwarz beim j-ten Zug“ , 1 ≤ j ≤ n,
dann kann K = „Anzahl von schwarzen gezogenen Kugeln“ als
K = 1A1 + 1A 2 + . . . + 1A n
geschrieben werden.
X sei nun eine diskrete reelle ZVe, d.h. Ω´ ⊂ IR . Dann gibt es eine weitere Möglichkeit, die Verteilung von X darzustellen, die es uns erlauben wird, den Begriff der ZVen etwas
zu verallgemeinern. Zu diesem Zweck können wir X als Abbildung von Ω nach IR auffassen. Da PX( IR \ Ω´ ) : = P(X∈ IR \ Ω´ ) = P(∅) = 0, können wir sinngemäß
PX(B) : = PX( B ∩ Ω´ )
für alle B ⊂ IR
setzen.
- 28 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
4.6
Definition : Für jede reelle ZVe X heißt
FX(x) : = PX((− ∞, x]) = P( X ≤ x ) ,
x ∈ IR ,
Verteilungsfunktion von X .
4.7
Definition : F sei eine monotone Funktion auf IR . Wir setzen
F(x+) : =
4.8
lim F(x + h) und
F(x−) : =
h > 0, h ↓ 0
lim F(x − h) , x ∈ IR .
h > 0, h ↓ 0
Lemma : F : = FX hat folgende Eigenschaften :
(i)
x≤y ⇒
(ii)
F(x+) = F(x) ∀ x ∈ IR , d.h. F ist rechtsseitig stetig .
(iii)
F(x) ≤ F(y)
lim F(x) = 0 ,
x→ - ∞
lim F(x) = 1 .
x→ ∞
Beweis :
(i)
(- ∞, x] ⊂ (- ∞, y] für x ≤ y ⇒
(ii)
Es sei x1 ≥ x2 ≥ x3 ≥ . . . > x mit lim xn = x
⇒
F(x) ≤ F(y)
n→ ∞
∞
(- ∞, x1] ⊃ (- ∞, x2] ⊃ . . . und
I (- ∞, x
n
] = (- ∞, x] .
n =1
⇒
∞
F(x+) = lim F(xn) = lim PX(( - ∞, xn] ) = PX( I (- ∞, x n ] ) = PX((- ∞, x] ) = F(x).
n→ ∞
n→ ∞
∞
(iii)
∞
I (- ∞, - n ] = ∅
U (- ∞, n]
;
n =1
⇒
= IR
n =1
lim F(x) = lim F(- n) = lim PX((- ∞, -n] ) = PX(∅) = 0
x→ - ∞
n→ ∞
lim F(x) = lim F(n)
x→ ∞
4.9
n =1
n→ ∞
n→ ∞
= lim PX((- ∞, n] ) = PX( IR ) = 1 .
n→ ∞
Definition : Eine reelle Funktion F über IR mit den Eigenschaften 4.8 (i), (ii) und
(iii) heißt Verteilungsfunktion über IR .
4.10
Weitere Eigenschaften der Verteilungsfunktion F(x) : = FX(x) :
(iv)
F(x−) = PX((− ∞, x )),
da
( - ∞, x ) =
∞
U (- ∞, x
n =1
n
]
für x1 ≤ x2 ≤ x3 ≤ . . . < x mit lim xn = x .
n→ ∞
- 29 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
(v) F(b) − F(a) = PX( (a, b] )
F(b) − F(a-) = PX( [a, b] )
F(b-) − F(a-) = PX( [a, b) )
F(b-) − F(a) = PX( (a, b) )
für - ∞ < (≤) a ≤ b (≤) < ∞ .
(vi)
PX(x) = P( X = x ) = FX(x) − FX(x-) = Sprunghöhe von F im Punkte x,
da
PX(x) = PX([x, x]) = FX(x) − FX(x-), d.h.
⇔
PX(x) = 0
F ist stetig in x .
(vii) Wenn PX( (a, b) ) = 0, dann ist F auf [a, b) konstant :
( PX( (a, b) ) = F(b-) − F(a) = 0 ).
Da die Anzahl der Unstetigkeitsstellen einer monotonen Funktion höchstens abzählbar
ist, folgt aus (vi), daß eine Verteilungsfunktion F über IR genau dann die Verteilungsfunktion einer diskreten reellen ZVen X ist, wenn sich ihre Sprunghöhen zu 1 aufaddieren. Die
Gesamtheit aller Unstetigkeitsstellen ω´ von F ist gerade Ω´ (⊂ IR ), der Wertebereich von X.
Falls Ω´ keine Häufungspunkte besitzt (was insbesondere für endliches Ω´ zutrifft),
dann ist F wegen (vii) eine Treppenfunktion .
4.11
Beispiel :
d
X = B(3,
1
2
d.h. Ω´ = {0, 1, 2, 3} ,
),
PX(0) = PX(3) =
1
8
,
FX(x) =
PX(1) = PX(2) =
0
1
 18
2
 78

1
3
8
.
−∞ < x < 0
0 ≤ x <1
1≤ x < 2
2≤ x <3
3≤ x <∞
- 30 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
Bei vielen Zufallsexperimenten ist die uns interessierende Variable X keine diskrete
Anzahl, wie bei den Urnenmodellen, sondern eine stetige Meßgröße. Man denke etwa an die
Wartezeit, bis der nächste Bus ankommt, oder an den Treibstoffverbrauch eines Autos auf
einer Strecke von 100 km. Wir benötigen also ZVen X, die sich in einem Kontinuum von
Werten (d.h. insbesondere : überabzählbar viele) bewegen. In anderen Worten, gesucht sind
Verteilungen D = PX auf IR , die nicht auf höchstens abzählbare Teilmengen konzentriert
sind.
Aus maßtheoretischen Gründen ist es im allgemeinen nicht möglich, allen Teilmengen
B von IR eine Wahrscheinlichkeit D(B) zuzuordnen. Wir werden deshalb nicht mehr alle
Teilmengen von IR als Ereignisse betrachten. Da wir an Wahrscheinlichkeiten wie
P(a ≤ X ≤ b) = PX( [a, b] ) = D( [a, b] )
interessiert sind, werden wir typischerweise Intervalle, und alles, was man hieraus durch
Komplementbildung und höchstens abzählbare ∪- und ∩-Operationen erhalten kann, als
Ereignisse ansprechen. Diese speziellen Teilmengen von IR heißen Borelmengen, und wir
bezeichnen ihre Gesamtheit, d.h. die Klasse aller Ereignisse in IR , mit B. B ≠ (⊂) P( IR ).
- 31 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
4.12
Bemerkungen :
1. B ist eine sogenannte σ − Algebra in IR , d.h.
(a) IR ∈ B
(b) A ∈ B
⇒
(c) A1, A2, . . . ∈ B
A : = IR \ A ∈ B
⇒
∞
UA
n
∈ B.
n =1
B ist die kleinste σ − Algebra , die alle Intervalle enthält. Sie heißt
Borel − σ − Algebra.
2. Da sich jede offene Teilmenge G von IR als höchstens abzählbare Vereinigung
U (q, r) ;
von offenen Intervallen darstellen läßt (G =
Übung !), enthält B alle
q, r∈ QI
( q, r) ⊂ G
offenen und alle abgeschlossenen Teilmengen von IR .
4.13
Mit maßtheoretischen Hilfsmitteln läßt sich zeigen, daß jede Verteilungsfunktion F
über IR (d.h. 4.8 (i), (ii) und (iii) sind erfüllt) eine Verteilung D auf ( IR , B ) definiert,
D( (- ∞, x] ) : = F(x)
d.h. wenn wir
für alle x ∈ IR
setzen, dann läßt sich D in eindeutiger Weise zu einer Wahrscheinlichkeit auf ( IR , B )
fortsetzen (d.h. D : B → [0, 1], und D erfüllt die Kolmogorovschen Axiome). In
anderen Worten, die Verteilungsfunktionen über IR und die Verteilungen auf ( IR , B )
entsprechen sich in eineindeutiger Weise und können deshalb stellvertretend für einander verwendet werden.
4.14
Definition : Eine reelle ZVe X und ihre Verteilung PX heißen stetig, falls FX stetig
ist.
4.15
Beispiel : T sei die Zeit zwischen zwei Anrufen in einer Telefonzentrale. Die Vertei-
lung von T wird oft durch folgende stetige Verteilungsfunktion (Übung!) gegeben :
1 − e - λ x
FT(x) : = 
0
für x ≥ 0
für x < 0
wobei λ ∈ ( 0, ∞ ) eine geeignete Konstante. Die zugehörige Verteilung auf ( IR , B )
heißt Exponentialverteilung mit Parameter λ, kurz: Exp(λ) .
- 32 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
T ist also eine stetige reelle ZVe. Da
P(- ∞ < T < 0 ) = FT(0-) = FT(0) = 0,
ist
P( 0 ≤ T < ∞ ) = 1,
d.h. Exp(λ) ist auf [ 0, ∞ ) konzentriert, wie man es erwartet (da die ZVe T nur
nichtnegative Werte annimmt).
4.16
Bemerkungen :
a) Eine stetige ZVe kann man als Grenzwert von diskreten ZVen interpretieren.
Falls in Beispiel 4.15 T̂ die Zeit zwischen zwei Anrufen auf die Minute genau
gemessen ist, ergibt sich etwa folgendes Bild:
- 33 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
Falls wir nun auf die Sekunde, Zehntelsekunde, . . . genau messen, streben die zugehörigen diskreten Verteilungsfunktionen FT̂ gegen die stetige Verteilungsfunktion FT.
Die stetige ZVe T ist deshalb das idealisierte Modell für völlig akkurate Messungen
und daher eine nützliche Approximation für reale Meßwerte, die hinreichend genau
sind.
b) Für stetige ZVe X gilt stets PX(x) = 0, x ∈ IR , da FX keine Unstetigkeiten besitzt. Elementarereignisse haben also die Wahrscheinlichkeit 0, d.h. P(X = x) = 0 für
alle x, und deshalb „ist es ‚unmöglich‘, eine solche ZVe zu beobachten“. Dies kann
man etwa so verstehen, daß man stets − wie wir unter a) gesehen haben − eine diskrete Approximation X̂ der stetigen ZVen X beobachten, und deshalb das Ereignis
„ X̂ = x “ = „ x - ε ≤ X ≤ x + ε “ = „ X ∈ [ x - ε, x + ε ] “,
ε > 0 geeignet,
betrachten muß. Solche Ereignisse haben aber positive Wahrscheinlichkeiten und sind
deshalb „beobachtbar“.
(Wir haben uns bereits überlegt, daß es nicht sehr sinnvoll ist, zu sagen, daß jemand
im Alter von genau 59,73 Jahren gestorben ist.)
4.17
Bemerkung : Exp(λ) wird oft als Verteilung der Lebensdauer L benützt. Dieses
Modell ist jedoch nur dann realistisch, wenn die Verteilung der verbleibenden Lebenszeit eines Individuums nicht von seinem Alter abhängt, d.h.
P( L > x + t | L > t ) = P( L > x )
( = 1 – Exp(λ) (x) )
für alle x, t ∈ [ 0, ∞ ) (Übung !).
In obigem Beispiel ist die Verteilungsfunktion FT von Exp(λ) an allen Stellen x ≠ 0
differenzierbar:
 λe - λ x , x > 0
fT(x) : = FT′ (x) = 
,x<0
0
Daraus ergibt sich für a ≤ b, a, b ∈ IR :
b
P(a ≤ T ≤ b) = FT(b) − FT(a) =
∫f
T
( t) dt ,
a
x
FT(x) =
∫f
-∞
T
( t ) dt , x ∈ IR .
also insbesondere:
- 34 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
Wir definieren allgemein:
4.18
Definition : Eine ZVe X , bzw. ihre Verteilung PX , hat eine Dichte fX , wenn es
eine integrierbare Funktion
fX : IR → [ 0, ∞ )
gibt mit
für alle
(⇒
∞
x
∫ f X (t) dt
FX(x) =
x∈ IR .
−∞
∫f
X
(t) dt = 1 ).
−∞
Andererseits definiert jede integrierbare Funktion
∞
f : IR → [ 0, ∞ )
mit
∫ f(t) dt
= 1
−∞
x
gemäß
F(x) : =
∫ f(t) dt ,
x∈ IR ,
−∞
eine stetige Verteilungsfunktion F über IR und damit eine stetige Verteilung D auf
( IR , B ) (Übung !).
4.19
Bemerkungen :
a) Jede reelle ZVe mit Dichte hat eine stetige Verteilungsfunktion. Die Umkehrung
gilt nicht !
- 35 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
b) In dieser Vorlesung sind wir nur an solchen stetigen reellen ZVen X interessiert,
die eine Dichte fX besitzen. Dies ist insbesondere dann der Fall, wenn FX (stetig
ist und ) (mit Ausnahme von höchstens abzählbar vielen Stellen) differenzierbar
ist.
4.20
X habe die Dichte fX(x) = f(x). Die Wahrscheinlichkeit des Ereignisses
„ a ≤ X ≤ b “,
a < b,
ist dann die Fläche unter der Kurve fX zwischen den Stellen a und b :
b
P( a ≤ X ≤ b ) = FX(b) − FX(a) =
∫ f(t) dt .
a
Analogie zu diskreter ZVen K:
P( a ≤ K ≤ b ) =
∑P
K
a ≤ ω ′ ≤b
4.21
(ω ′) ;
P( a ≤ X ≤ b ) =
∫f
X
a≤t≤b
(t) dt .
Beispiel : Das rechte Hinterrad eines Autos wird vor dem Start so gekennzeichnet,
daß die Verbindungsstrecke zwischen dem Radmittelpunkt und der Markierung parallel zur Straße nach hinten zeigt. Das Auto fährt dann eine (zufällige) Strecke, und
nachdem es geparkt wird, wird das Rad wiederum auf dieselbe Weise gekennzeichnet.
Mit welcher Wahrscheinlichkeit liegt der Winkel ψ zwischen der ersten und der
zweiten Markierung (linksdrehend) zwischen 36° und 72° ?
- 36 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
~
Hierzu benötigen wir eine Gleichverteilung auf Ω = [ 0, 360 ] , bzw. auf
Ω = [ 0, 2 π ].
Allgemein sei Ω = [ a, b ] , − ∞ < a < b < ∞ .
f(x) : =
1
1[a , b] (x) , x∈ IR ,
b-a
ist offensichtlich eine W-dichte auf IR . Die zugehörige Verteilung U[a , b] nennen wir
die Gleichverteilung auf [ a, b ] . Sie ist das kontinuierliche Analogon zum Laplaceschen W-raum. Es gilt:
0
x -a
F(x) = ∫ f(t) dt = 
−∞
b-a
1
x
-∞< x <a
a≤x≤b
b<x<∞
Für a ≤ c ≤ d ≤ b erhält man:
U[a, b]( [c, d ] ) =
Speziell erhält man für ψ :
d-c
Länge von [c, d]
=
.
b-a
Länge von [a, b]
d
ψ = U[0, 2 π] .
2π
π
2π
P( ≤ ψ ≤
) = 5 5 = 0,1 .
5
5
2π - 0
π
l sei nun die Länge der Verbindungsstrecke der beiden Markierungen. Gesucht
ist die Verteilung von l , falls das Rad den Radius r hat.
- 37 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
l : [0, 2 π] → [0, ∞ )
Lösung :
l (ψ) = 2 r sin
Für 0 ≤ a ≤ b ≤ 2 r ergibt sich :
(2 arc sin
ψ
2
, 0 ≤ ψ ≤ 2π.
(a ≤ l ≤ b) = (
a
≤ sin
2r
ψ
2
≤
b
) =
2r
a
b
b
a
≤ ψ ≤ 2 arc sin
) ∪ (2 π − 2 arc sin
≤ ψ ≤ 2 π − 2 arc sin ).
2r
2r
2r
2r
Da diese beiden Wertebereiche höchstens einen Wert gemeinsam haben (nämlich π,
falls b = 2 r), und ψ eine stetige ZVe, ergibt sich:
P(a ≤ l ≤ b) =
2 arc sin
b
) =
2r
1
2π
2
π
(2 arc sin
(arc sin
b
a
− 2 arc sin ) +
2r
2r
b
a
− arc sin ) ,
2r
2r
1
2π
(2 π − 2 arc sin
a
−2π+
2r
0 ≤ a ≤ b ≤ 2 r.
Also gilt:
0

F (x) =  π2 arc sin
l
1

l hat deswegen die Dichte
f (x) =
l
-∞<x <0
x
2r
0


π
 0
0≤x≤2r
2r<x<∞
-∞< x <0
2
4 r2 - x2
0≤x<2r .
2r≤x<∞
- 38 (Kapitel 4 : Zufallsvariable und ihre Verteilungen)
4.22
Bemerkung : Im Beispiel 4.21 wurde durch die Hintereinanderschaltung der ZVen
ψ und der Abbildung l : [0, 2 π] → IR eine neue ZVe l (genauer : l o ψ ) gewonnen. Allgemein muß man jedoch folgendes beachten :
X sei eine reelle ZVe und T : IR → IR . Damit T o X wieder eine reelle ZVe
ist, müssen die Werte
FToX (x) = P( T o X ≤ x ) = P( X ∈ T – 1((- ∞, x] )) = PX( T – 1((- ∞, x] )), x ∈ IR ,
definiert sein. Das ist sicher dann der Fall, wenn
(* )
T – 1((- ∞, x] ) ∈ B , x ∈ IR .
Abbildungen T, die (* ) erfüllen, heißen meßbar . Insbesondere sind alle stetigen T
meßbar , da dann T – 1((- ∞, x] ) abgeschlossen.