- 25 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) Kapitel 4: Zufallsvariable und ihre Verteilungen Bei einem stochastischen Experiment interessiert man sich oft nicht so sehr für die zufälligen Ausgänge selbst, als für Zahlenwerte und allgemeinere Größen, die durch den Ausgang des Experiments bestimmt werden. Diese Größen nennt man Zufallsvariable, eine Begriffsbildung, die grundlegend für die Wahrscheinlichkeitstheorie ist. 4.1 Beispiel : Viermaliger (unverfälschter) Münzenwurf. Zufallsvariable: X = „Anzahl der geworfenen Z´s“. Modell: Ω = {Z, W}4, P ist die Gleichverteilung auf Ω. X ist dann eine Abbildung : X : Ω → {0, 1, 2, 3, 4} = : Ω´, z.B. X((W, W, Z, W)) = 1. 4.2 Definition : a) (Ω, P) sei ein (diskreter) W-raum und Ω´ ≠ ∅ eine höchstens abzählbare Menge. Unter einer diskreten Zufallsvariablen (ZV) X in Ω´ verstehen wir eine Abbildung X : Ω → Ω´. b) Falls Ω´ ⊂ IR , sprechen wir von einer reellen ZVen, und falls Ω´ ⊂ IR k (k ≥ 2), von einem reellen Zufallsvektor . Anschaulich gesprochen bedeutet „ ZVe in Ω´ “, daß ein Zufallsexperiment vorliegt, das durch (Ω, P) repräsentiert wird (in unserem Beispiel der viermalige Münzenwurf), und daß in Abhängigkeit von der Realisierung ω (z.B. = (W, W, Z, W)) das Element X(ω) von Ω´ (z.B. = 1) ausgewählt wird. In diesem Sinne haben wir eine „vom Zufall gesteuerte“ Variable X in Ω´. 4.3 Im obigen Beispiel interessieren wir uns für Wahrscheinlichkeiten von Ereignissen wie (1 ≤ X ≤ 3) : = {ω| 1 ≤ X(ω) ≤ 3} = X –1 (Ω´ ∩ [1 , 3] ) . Allgemein schreiben wir für B ⊂ Ω´ : ( X ∈ B ) : = {ω| X(ω) ∈ B} = X –1 ( B ) . P(1 ≤ X ≤ 3) = P(X = 1) + P(X = 2) + P(X = 3) = (4 + 6 + 4) 16 = 7 8 . - 26 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) Allgemein benötigen wir also die Wahrscheinlichkeiten PX (ω´) : = P( X = ω´) = P ({ω | X(ω) = ω´}) = P( X –1 (ω´)) , ω´ ∈ Ω´. Da PX (ω´) ≥ 0 und ∑P ω X (ω ′) = ′ ∈ Ω′ ∑ P(X ω -1 (ω ′)) = P( ′ ∈ Ω′ UX ω -1 (ω ′) ) = P(Ω Ω) = 1, ′ ∈ Ω′ ist ( PX (ω´) )ω´∈ Ω´ ein W-vektor und definiert deshalb eine Wahrscheinlichkeit PX auf Ω´ , die sogenannte Verteilung der ZVen X. (Ω Ω´, PX ) ist ein W-raum und es gilt: PX(B) = ( ∑P ω X (ω ′) = ′∈ B ∑ P(ω ) = P(X-1(B)) ) = P(X ∈ B) , B ⊂ Ω´ . ω ∈ X -1 ( B) Die Verteilung PX beschreibt, mit welchen Wahrscheinlichkeiten die „vom Zufall gesteuerte“ Variable X Werte in Ω´ annimmt. Als Konsequenz ist für viele w-theoretische Probleme der zugrunde liegende W-raum (Ω Ω, P) von untergeordneter Bedeutung und kann oft vernachlässigt werden. In diesen Fällen ist nur wesentlich, die Verteilung der ZVe X zu kennen. d Wir schreiben: X = D , falls D die Verteilung von X ist, und d X = Y , falls die ZVen X und Y die gleiche Verteilung haben. Die das Zufallsexperiment beschreibende Wahrscheinlichkeit P auf Ω läßt sich als Spezialfall in dieses Konzept einordnen. Falls wir Ω´= Ω und id : Ω → Ω mit id(ω) : = ω betrachten, dann ist P die Verteilung von id. 4.4 Beispiele : 1. Urnenmodelle : N Kugeln, R schwarze; und n Kugeln gezogen. K : = „Anzahl von schwarzen gezogenen Kugeln“. d a) Ziehen ohne Zurücklegen : K = Hg(n, R, N ) . b) Ziehen mit Zurücklegen : d K = B(n, p) , wobei p = R N . - 27 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) 2. Viermaliger (unverfälschter) Münzenwurf : X = „Anzahl von Z´s“. d X = B(4, 1 2 ) (Begründung ?). 3. (Ω Ω, P) sei ein (diskreter) W-raum und A ⊂ Ω ein Ereignis. Wir setzen 1, falls ω ∈ A 1A(ω): = 0, falls ω ∉ A, d.h. ω ∈ A . 1A heißt Indikatorvariable von A. Die Zufallsvariable 1A (mit Werten in Ω´ = {0, 1}) hat die Verteilung ( P( A ), P( A ) ) ( = B(1, P( A ); Bernoulliverteilung mit Parameter p = P(A) ). 4.5 Bemerkungen : a) Es gelten folgende leicht nachzuprüfende Beziehungen zwischen Ereignissen und Indikatorvariablen : A ⊂ B ⇔ 1A ≤ 1B ; A = B ⇔ 1A = 1B . 1A∩B = 1A ⋅ 1B = min (1A, 1B) 1A∪B = 1A + 1B − 1A ⋅ 1B = max (1A, 1B) 1B\A = 1B − 1A ⋅ 1B 1A = 1 − 1A . b) Falls (Ω Ω, P) ein Urnenexperiment wie in Beispiel 4.4, 1 beschreibt, und Aj = „schwarz beim j-ten Zug“ , 1 ≤ j ≤ n, dann kann K = „Anzahl von schwarzen gezogenen Kugeln“ als K = 1A1 + 1A 2 + . . . + 1A n geschrieben werden. X sei nun eine diskrete reelle ZVe, d.h. Ω´ ⊂ IR . Dann gibt es eine weitere Möglichkeit, die Verteilung von X darzustellen, die es uns erlauben wird, den Begriff der ZVen etwas zu verallgemeinern. Zu diesem Zweck können wir X als Abbildung von Ω nach IR auffassen. Da PX( IR \ Ω´ ) : = P(X∈ IR \ Ω´ ) = P(∅) = 0, können wir sinngemäß PX(B) : = PX( B ∩ Ω´ ) für alle B ⊂ IR setzen. - 28 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) 4.6 Definition : Für jede reelle ZVe X heißt FX(x) : = PX((− ∞, x]) = P( X ≤ x ) , x ∈ IR , Verteilungsfunktion von X . 4.7 Definition : F sei eine monotone Funktion auf IR . Wir setzen F(x+) : = 4.8 lim F(x + h) und F(x−) : = h > 0, h ↓ 0 lim F(x − h) , x ∈ IR . h > 0, h ↓ 0 Lemma : F : = FX hat folgende Eigenschaften : (i) x≤y ⇒ (ii) F(x+) = F(x) ∀ x ∈ IR , d.h. F ist rechtsseitig stetig . (iii) F(x) ≤ F(y) lim F(x) = 0 , x→ - ∞ lim F(x) = 1 . x→ ∞ Beweis : (i) (- ∞, x] ⊂ (- ∞, y] für x ≤ y ⇒ (ii) Es sei x1 ≥ x2 ≥ x3 ≥ . . . > x mit lim xn = x ⇒ F(x) ≤ F(y) n→ ∞ ∞ (- ∞, x1] ⊃ (- ∞, x2] ⊃ . . . und I (- ∞, x n ] = (- ∞, x] . n =1 ⇒ ∞ F(x+) = lim F(xn) = lim PX(( - ∞, xn] ) = PX( I (- ∞, x n ] ) = PX((- ∞, x] ) = F(x). n→ ∞ n→ ∞ ∞ (iii) ∞ I (- ∞, - n ] = ∅ U (- ∞, n] ; n =1 ⇒ = IR n =1 lim F(x) = lim F(- n) = lim PX((- ∞, -n] ) = PX(∅) = 0 x→ - ∞ n→ ∞ lim F(x) = lim F(n) x→ ∞ 4.9 n =1 n→ ∞ n→ ∞ = lim PX((- ∞, n] ) = PX( IR ) = 1 . n→ ∞ Definition : Eine reelle Funktion F über IR mit den Eigenschaften 4.8 (i), (ii) und (iii) heißt Verteilungsfunktion über IR . 4.10 Weitere Eigenschaften der Verteilungsfunktion F(x) : = FX(x) : (iv) F(x−) = PX((− ∞, x )), da ( - ∞, x ) = ∞ U (- ∞, x n =1 n ] für x1 ≤ x2 ≤ x3 ≤ . . . < x mit lim xn = x . n→ ∞ - 29 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) (v) F(b) − F(a) = PX( (a, b] ) F(b) − F(a-) = PX( [a, b] ) F(b-) − F(a-) = PX( [a, b) ) F(b-) − F(a) = PX( (a, b) ) für - ∞ < (≤) a ≤ b (≤) < ∞ . (vi) PX(x) = P( X = x ) = FX(x) − FX(x-) = Sprunghöhe von F im Punkte x, da PX(x) = PX([x, x]) = FX(x) − FX(x-), d.h. ⇔ PX(x) = 0 F ist stetig in x . (vii) Wenn PX( (a, b) ) = 0, dann ist F auf [a, b) konstant : ( PX( (a, b) ) = F(b-) − F(a) = 0 ). Da die Anzahl der Unstetigkeitsstellen einer monotonen Funktion höchstens abzählbar ist, folgt aus (vi), daß eine Verteilungsfunktion F über IR genau dann die Verteilungsfunktion einer diskreten reellen ZVen X ist, wenn sich ihre Sprunghöhen zu 1 aufaddieren. Die Gesamtheit aller Unstetigkeitsstellen ω´ von F ist gerade Ω´ (⊂ IR ), der Wertebereich von X. Falls Ω´ keine Häufungspunkte besitzt (was insbesondere für endliches Ω´ zutrifft), dann ist F wegen (vii) eine Treppenfunktion . 4.11 Beispiel : d X = B(3, 1 2 d.h. Ω´ = {0, 1, 2, 3} , ), PX(0) = PX(3) = 1 8 , FX(x) = PX(1) = PX(2) = 0 1 18 2 78 1 3 8 . −∞ < x < 0 0 ≤ x <1 1≤ x < 2 2≤ x <3 3≤ x <∞ - 30 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) Bei vielen Zufallsexperimenten ist die uns interessierende Variable X keine diskrete Anzahl, wie bei den Urnenmodellen, sondern eine stetige Meßgröße. Man denke etwa an die Wartezeit, bis der nächste Bus ankommt, oder an den Treibstoffverbrauch eines Autos auf einer Strecke von 100 km. Wir benötigen also ZVen X, die sich in einem Kontinuum von Werten (d.h. insbesondere : überabzählbar viele) bewegen. In anderen Worten, gesucht sind Verteilungen D = PX auf IR , die nicht auf höchstens abzählbare Teilmengen konzentriert sind. Aus maßtheoretischen Gründen ist es im allgemeinen nicht möglich, allen Teilmengen B von IR eine Wahrscheinlichkeit D(B) zuzuordnen. Wir werden deshalb nicht mehr alle Teilmengen von IR als Ereignisse betrachten. Da wir an Wahrscheinlichkeiten wie P(a ≤ X ≤ b) = PX( [a, b] ) = D( [a, b] ) interessiert sind, werden wir typischerweise Intervalle, und alles, was man hieraus durch Komplementbildung und höchstens abzählbare ∪- und ∩-Operationen erhalten kann, als Ereignisse ansprechen. Diese speziellen Teilmengen von IR heißen Borelmengen, und wir bezeichnen ihre Gesamtheit, d.h. die Klasse aller Ereignisse in IR , mit B. B ≠ (⊂) P( IR ). - 31 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) 4.12 Bemerkungen : 1. B ist eine sogenannte σ − Algebra in IR , d.h. (a) IR ∈ B (b) A ∈ B ⇒ (c) A1, A2, . . . ∈ B A : = IR \ A ∈ B ⇒ ∞ UA n ∈ B. n =1 B ist die kleinste σ − Algebra , die alle Intervalle enthält. Sie heißt Borel − σ − Algebra. 2. Da sich jede offene Teilmenge G von IR als höchstens abzählbare Vereinigung U (q, r) ; von offenen Intervallen darstellen läßt (G = Übung !), enthält B alle q, r∈ QI ( q, r) ⊂ G offenen und alle abgeschlossenen Teilmengen von IR . 4.13 Mit maßtheoretischen Hilfsmitteln läßt sich zeigen, daß jede Verteilungsfunktion F über IR (d.h. 4.8 (i), (ii) und (iii) sind erfüllt) eine Verteilung D auf ( IR , B ) definiert, D( (- ∞, x] ) : = F(x) d.h. wenn wir für alle x ∈ IR setzen, dann läßt sich D in eindeutiger Weise zu einer Wahrscheinlichkeit auf ( IR , B ) fortsetzen (d.h. D : B → [0, 1], und D erfüllt die Kolmogorovschen Axiome). In anderen Worten, die Verteilungsfunktionen über IR und die Verteilungen auf ( IR , B ) entsprechen sich in eineindeutiger Weise und können deshalb stellvertretend für einander verwendet werden. 4.14 Definition : Eine reelle ZVe X und ihre Verteilung PX heißen stetig, falls FX stetig ist. 4.15 Beispiel : T sei die Zeit zwischen zwei Anrufen in einer Telefonzentrale. Die Vertei- lung von T wird oft durch folgende stetige Verteilungsfunktion (Übung!) gegeben : 1 − e - λ x FT(x) : = 0 für x ≥ 0 für x < 0 wobei λ ∈ ( 0, ∞ ) eine geeignete Konstante. Die zugehörige Verteilung auf ( IR , B ) heißt Exponentialverteilung mit Parameter λ, kurz: Exp(λ) . - 32 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) T ist also eine stetige reelle ZVe. Da P(- ∞ < T < 0 ) = FT(0-) = FT(0) = 0, ist P( 0 ≤ T < ∞ ) = 1, d.h. Exp(λ) ist auf [ 0, ∞ ) konzentriert, wie man es erwartet (da die ZVe T nur nichtnegative Werte annimmt). 4.16 Bemerkungen : a) Eine stetige ZVe kann man als Grenzwert von diskreten ZVen interpretieren. Falls in Beispiel 4.15 T̂ die Zeit zwischen zwei Anrufen auf die Minute genau gemessen ist, ergibt sich etwa folgendes Bild: - 33 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) Falls wir nun auf die Sekunde, Zehntelsekunde, . . . genau messen, streben die zugehörigen diskreten Verteilungsfunktionen FT̂ gegen die stetige Verteilungsfunktion FT. Die stetige ZVe T ist deshalb das idealisierte Modell für völlig akkurate Messungen und daher eine nützliche Approximation für reale Meßwerte, die hinreichend genau sind. b) Für stetige ZVe X gilt stets PX(x) = 0, x ∈ IR , da FX keine Unstetigkeiten besitzt. Elementarereignisse haben also die Wahrscheinlichkeit 0, d.h. P(X = x) = 0 für alle x, und deshalb „ist es ‚unmöglich‘, eine solche ZVe zu beobachten“. Dies kann man etwa so verstehen, daß man stets − wie wir unter a) gesehen haben − eine diskrete Approximation X̂ der stetigen ZVen X beobachten, und deshalb das Ereignis „ X̂ = x “ = „ x - ε ≤ X ≤ x + ε “ = „ X ∈ [ x - ε, x + ε ] “, ε > 0 geeignet, betrachten muß. Solche Ereignisse haben aber positive Wahrscheinlichkeiten und sind deshalb „beobachtbar“. (Wir haben uns bereits überlegt, daß es nicht sehr sinnvoll ist, zu sagen, daß jemand im Alter von genau 59,73 Jahren gestorben ist.) 4.17 Bemerkung : Exp(λ) wird oft als Verteilung der Lebensdauer L benützt. Dieses Modell ist jedoch nur dann realistisch, wenn die Verteilung der verbleibenden Lebenszeit eines Individuums nicht von seinem Alter abhängt, d.h. P( L > x + t | L > t ) = P( L > x ) ( = 1 – Exp(λ) (x) ) für alle x, t ∈ [ 0, ∞ ) (Übung !). In obigem Beispiel ist die Verteilungsfunktion FT von Exp(λ) an allen Stellen x ≠ 0 differenzierbar: λe - λ x , x > 0 fT(x) : = FT′ (x) = ,x<0 0 Daraus ergibt sich für a ≤ b, a, b ∈ IR : b P(a ≤ T ≤ b) = FT(b) − FT(a) = ∫f T ( t) dt , a x FT(x) = ∫f -∞ T ( t ) dt , x ∈ IR . also insbesondere: - 34 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) Wir definieren allgemein: 4.18 Definition : Eine ZVe X , bzw. ihre Verteilung PX , hat eine Dichte fX , wenn es eine integrierbare Funktion fX : IR → [ 0, ∞ ) gibt mit für alle (⇒ ∞ x ∫ f X (t) dt FX(x) = x∈ IR . −∞ ∫f X (t) dt = 1 ). −∞ Andererseits definiert jede integrierbare Funktion ∞ f : IR → [ 0, ∞ ) mit ∫ f(t) dt = 1 −∞ x gemäß F(x) : = ∫ f(t) dt , x∈ IR , −∞ eine stetige Verteilungsfunktion F über IR und damit eine stetige Verteilung D auf ( IR , B ) (Übung !). 4.19 Bemerkungen : a) Jede reelle ZVe mit Dichte hat eine stetige Verteilungsfunktion. Die Umkehrung gilt nicht ! - 35 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) b) In dieser Vorlesung sind wir nur an solchen stetigen reellen ZVen X interessiert, die eine Dichte fX besitzen. Dies ist insbesondere dann der Fall, wenn FX (stetig ist und ) (mit Ausnahme von höchstens abzählbar vielen Stellen) differenzierbar ist. 4.20 X habe die Dichte fX(x) = f(x). Die Wahrscheinlichkeit des Ereignisses „ a ≤ X ≤ b “, a < b, ist dann die Fläche unter der Kurve fX zwischen den Stellen a und b : b P( a ≤ X ≤ b ) = FX(b) − FX(a) = ∫ f(t) dt . a Analogie zu diskreter ZVen K: P( a ≤ K ≤ b ) = ∑P K a ≤ ω ′ ≤b 4.21 (ω ′) ; P( a ≤ X ≤ b ) = ∫f X a≤t≤b (t) dt . Beispiel : Das rechte Hinterrad eines Autos wird vor dem Start so gekennzeichnet, daß die Verbindungsstrecke zwischen dem Radmittelpunkt und der Markierung parallel zur Straße nach hinten zeigt. Das Auto fährt dann eine (zufällige) Strecke, und nachdem es geparkt wird, wird das Rad wiederum auf dieselbe Weise gekennzeichnet. Mit welcher Wahrscheinlichkeit liegt der Winkel ψ zwischen der ersten und der zweiten Markierung (linksdrehend) zwischen 36° und 72° ? - 36 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) ~ Hierzu benötigen wir eine Gleichverteilung auf Ω = [ 0, 360 ] , bzw. auf Ω = [ 0, 2 π ]. Allgemein sei Ω = [ a, b ] , − ∞ < a < b < ∞ . f(x) : = 1 1[a , b] (x) , x∈ IR , b-a ist offensichtlich eine W-dichte auf IR . Die zugehörige Verteilung U[a , b] nennen wir die Gleichverteilung auf [ a, b ] . Sie ist das kontinuierliche Analogon zum Laplaceschen W-raum. Es gilt: 0 x -a F(x) = ∫ f(t) dt = −∞ b-a 1 x -∞< x <a a≤x≤b b<x<∞ Für a ≤ c ≤ d ≤ b erhält man: U[a, b]( [c, d ] ) = Speziell erhält man für ψ : d-c Länge von [c, d] = . b-a Länge von [a, b] d ψ = U[0, 2 π] . 2π π 2π P( ≤ ψ ≤ ) = 5 5 = 0,1 . 5 5 2π - 0 π l sei nun die Länge der Verbindungsstrecke der beiden Markierungen. Gesucht ist die Verteilung von l , falls das Rad den Radius r hat. - 37 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) l : [0, 2 π] → [0, ∞ ) Lösung : l (ψ) = 2 r sin Für 0 ≤ a ≤ b ≤ 2 r ergibt sich : (2 arc sin ψ 2 , 0 ≤ ψ ≤ 2π. (a ≤ l ≤ b) = ( a ≤ sin 2r ψ 2 ≤ b ) = 2r a b b a ≤ ψ ≤ 2 arc sin ) ∪ (2 π − 2 arc sin ≤ ψ ≤ 2 π − 2 arc sin ). 2r 2r 2r 2r Da diese beiden Wertebereiche höchstens einen Wert gemeinsam haben (nämlich π, falls b = 2 r), und ψ eine stetige ZVe, ergibt sich: P(a ≤ l ≤ b) = 2 arc sin b ) = 2r 1 2π 2 π (2 arc sin (arc sin b a − 2 arc sin ) + 2r 2r b a − arc sin ) , 2r 2r 1 2π (2 π − 2 arc sin a −2π+ 2r 0 ≤ a ≤ b ≤ 2 r. Also gilt: 0 F (x) = π2 arc sin l 1 l hat deswegen die Dichte f (x) = l -∞<x <0 x 2r 0 π 0 0≤x≤2r 2r<x<∞ -∞< x <0 2 4 r2 - x2 0≤x<2r . 2r≤x<∞ - 38 (Kapitel 4 : Zufallsvariable und ihre Verteilungen) 4.22 Bemerkung : Im Beispiel 4.21 wurde durch die Hintereinanderschaltung der ZVen ψ und der Abbildung l : [0, 2 π] → IR eine neue ZVe l (genauer : l o ψ ) gewonnen. Allgemein muß man jedoch folgendes beachten : X sei eine reelle ZVe und T : IR → IR . Damit T o X wieder eine reelle ZVe ist, müssen die Werte FToX (x) = P( T o X ≤ x ) = P( X ∈ T – 1((- ∞, x] )) = PX( T – 1((- ∞, x] )), x ∈ IR , definiert sein. Das ist sicher dann der Fall, wenn (* ) T – 1((- ∞, x] ) ∈ B , x ∈ IR . Abbildungen T, die (* ) erfüllen, heißen meßbar . Insbesondere sind alle stetigen T meßbar , da dann T – 1((- ∞, x] ) abgeschlossen.