WR 1 W. Merz Kapitel 10 Zufallsvariable Vorlesung Wahrscheinlichkeitsrechnung I vom 03. Juni 2009 W. Merz Lehrstuhl für Angewandte Mathematik 1 FAU 10.1 WR 1 Zufallsgrößen W. Merz Zufallsgrößen sind Abbildungen X : Ω −→ Ω̂ von der Ergebnismenge Ω eines Wahrscheinlichkeitsraums in eine Menge Ω̂ mit noch zu definierenden Eigenschaften Symbole: Zufallsgrößen werden durch Großbuchstaben aus dem letzten Drittel des Alphabets gekennzeichnet: X , Y , Z , U, V . 10.2 WR 1 Urbildmengen W. Merz Für die Urbilder von Teilmengen A ⊂ Ω̂ benutzen wir die schon früher eingeführte Bezeichnung (X ∈ A) = {ω ∈ Ω ; X (ω) ∈ A} Rechenregeln • (X ∈ A ∪ B) = (X ∈ A) ∪ (X ∈ B) S Ak ) = k (X ∈ Ak ) • (X ∈ A ∩ B) = (X ∈ A) ∩ (X ∈ B) T T • (X ∈ k Ak ) = k (X ∈ Ak ) • (X ∈ S k • (X ∈ A) = (X ∈ A) • (X ∈ Ω̂) = Ω 10.3 Zufallsgrößen WR 1 W. Merz Beispiel für die Verifikation der Rechenregeln ω ∈ (X ∈ A ∪ B) ⇔ X (ω) ∈ A ∪ B ⇔ X (ω) ∈ A oder X (ω) ∈ B ⇔ ω ∈ (X ∈ A) oder ω ∈ (X ∈ B) ⇔ ω ∈ (X ∈ A) ∪ (X ∈ B) Folgerungen • (X ∈ ∅) = ∅ • A∩B =∅ ⇒ (X ∈ A) ∩ (X ∈ B) = ∅ • (X ∈ A + B) = (X ∈ A) + (X ∈ B) P P • (X ∈ k Ak ) = k (X ∈ Ak ) 10.4 WR 1 Zufallsgrößen W. Merz Definition Sind A bzw.  σ-Algebren auf den Mengen Ω bzw. Ω̂ so heißt eine Abbildung X : Ω −→ Ω̂ mit der Eigenschaft (X ∈ A) ∈ A für alle A ∈  A-Â-messbar. Bezeichnung Eine A-Â-messbare Abbildung auf einem Wahrscheinlichkeitsraum (Ω, A, P) heißt kurz eine Zufallsgröße. Theorem Die Mengenfunktion P X :  −→ R mit P X (A) = P(X ∈ A) ist eine Wahrscheinlichkeit auf  und heißt die Verteilung der Zufallsgröße X . Schema X (Ω, A, P) −→ (Ω̂, Â, P X ) 10.5 Zufallsvariable WR 1 W. Merz Definition Eine Abbildung X : Ω −→ R auf einem Wahrscheinlichkeitsraum (Ω, A, P), die messbar bezüglich der σ-Algebra A und der σ-Algebra B der Borelschen Mengen auf R ist, heißt eine Zufallsvariable. Theorem Eine Funktion X : Ω −→ R auf einem Wahrscheinlichkeitsraum (Ω, A, P) ist genau dann eine Zufallsvariable, wenn für alle reellen Zahlen t die Urbilder (X ≤ t) = (X ∈ (−∞, t]) = {ω ∈ Ω ; X (ω) ≤ t} in der σ-Algebra A liegen. 10.6 Zufallsvariable WR 1 W. Merz Test, ob eine Funktion X : Ω −→ R eine Zufallsvariable ist: Versuche, die Wahrscheinlichkeiten P(X ≤ t) für alle reellen Zahlen t zu berechnen. Geht das, so ist X eine Zufallsvariable und P(X ≤ t) = P(X ∈ (−∞, t]) = P X (−∞, t] = F X (t) die Verteilungsfunktion (der Verteilung) von X . 10.7 Die Verteilung einer Zufallsvariable WR 1 W. Merz Beispiel 1 Bestimme die Verteilung von X (s) = − ln(s) auf dem Wahrscheinlichkeitsraum (R, B, P), wenn P die U(0, 1)-Verteilung ist. Sprechweise „Bestimme die Verteilung“ heißt: „Berechne eine Formel für eine Funktion, die die Verteilung P X vollständig charakterisiert“, also entweder die Verteilungsfunktion F X (t) oder — wenn das geht — die Dichte f (x). 10.8 WR 1 Beispiel 1 W. Merz λ(B ∩ (0, 1)) = λ(B ∩ (0, 1)) λ((0, 1)) − ln(s) falls s > 0 X (s) = x0 falls s ≤ 0 P(B) = (X ≤ t) {s ∈ R ; X (s) ≤ t} {s ≤ 0 ; X (s) ≤ t} + {0 < s < 1 ; − ln(s) ≤ t} +{s ≥ 1 ; X (s) ≤ t} + =: A− t + Bt + At = = + A− t und At disjunkt zum offenen Intervall (0, 1), daher ist − P(At ) = P(A+ t ) = 0 und P(X ≤ t) = P(Bt ). 10.9 WR 1 Beispiel 1 Bt = {0 < s < 1 ; − ln(s) ≤ t} W. Merz 1. Fall Für t ≤ 0 ist Bt = ∅, denn für 0 < s < 1 ist − ln(s) > 0. 2. Fall Für t > 0 ist Bt = {0 < s < 1 ; s ≥ e−t } = [e−t , 1) Daraus folgt X F (t) = 0 P[e−t , 1) = 1 − e−t für t ≤ 0 für t > 0 d.h. F X (t) ist die Verteilungsfunktion der Exponentialverteilung bzw. die Zufallsvariable X ist exponentiell verteilt mit Parameter λ = 1. 10.10 Die Verteilung einer Zufallsvariablen WR 1 W. Merz Beispiel 2 Bestimmen Sie die Verteilung der Zufallsvariablen X (y ) = ay + b auf dem Wahrscheinlichkeitsraum (R, B, P), wo P die N (0, 1)-Verteilung ist. Die N (0, 1)-Verteilung besitzt die Dichte 1 2 1 ϕ(x) = √ e− 2 x 2π Für die Verteilungsfunktion Z t Φ(t) = ϕ(x)dx −∞ gibt es keine „Formel“, d.h. Darstellung durch irgendwelche analytischen Funktionen. 10.11 WR 1 Beispiel 2 Verteilungsfunktion von X : W. Merz F X (t) = P(X ≤ t) = P{y ∈ R ; X (y ) ≤ t} = P{y ∈ R ; ay +b ≤ t} Fall a > 0 ay + b ≤ t ⇔ ay ≤ t − b ⇔ y≤ 1 (t − b) a Mit yt = a1 (t − b) ist (X ≤ t) = (−∞, yt ] und daher 1 F X (t) = P(−∞, yt ] = Φ(yt ) = Φ( (t − b)) a 10.12 Beispiel 2 Dichte der Verteilung von X : f X (t) = WR 1 W. Merz d X d 1 F (t) = Φ( (t − b)) dt dt a Nach der Kettenregel f X (t) d 1 dΦ 1 ( (t − b)) · (t − b) dy a dt a 1 1 = ϕ( (t − b)) a a 1 1 − 1 ( 1 (t−b))2 √ e 2 a = a 2π = Umformung: f X (t) = = 1 1 − 1 ( 1 (t−b))2 √ e 2 a a 2π 2 1 1 √ e− 2a2 (t−b) 2 2πa 10.13 WR 1 Beispiel 2 W. Merz Fall a < 0 ay + b ≤ t ⇔ ay ≤ t − b ⇔ y≥ 1 (t − b) a Mit yt = a1 (t − b) ist (X ≤ t) = [yt , ∞) und daher F X (t) = P[yt , ∞) = 1 − P(−∞, yt ) = 1 − Φ(yt − 0) = 1 − Φ(yt ) 1 = 1 − Φ( (t − b)) a Differenzieren: 1 1 1 1 f X (t) = −ϕ( (t − b)) = ϕ( (t − b)) a a (−a) a 10.14 WR 1 Beispiel 2 W. Merz Umformung f X (t) = = 2 1 1 1 1 √ e− 2 ( a (t−b)) (−a) 2π 2 1 1 √ e− 2a2 (t−b) 2 2πa Die Dichte und damit die Verteilung hängt nur vom Quadrat a2 der Zahl a ab. Bezeichnung: N (b, a2 )-Verteilung. Man kann nachrechnen, dass b der Mittelwert und a2 die Varianz dieser Verteilung ist. 10.15 WR 1 Die Normalverteilung W. Merz Definition Sei µ eine reelle und σ 2 > 0 eine positive reelle Zahl. Dann heißt die Verteilung mit der Dichte f (t) = √ 1 2πσ 2 1 e− 2σ2 (t−µ) 2 die Normalverteilung mit Mittelwert µ und Varianz σ 2 oder kurz N (µ, σ 2 )-Verteilung. 10.16 WR 1 Die Verteilung einer Zufallsvariablen W. Merz Schießen auf eine Zielscheibe Wahrscheinlichkeitsraum (R2 , B2 , P), Verteilung P absolutstetig mit Dichte f (x1 , x2 ) = ϕ(x1 )ϕ(x2 ) = 1 − 1 (x12 +x22 ) e 2 2π Abstand des Treffpunkts vom Zentrum der Scheibe: q X (x1 , x2 ) = x12 + x22 10.17 WR 1 Beispiel 3 (X ≤ t) = {(x1 , x2 ) ∈ R2 ; W. Merz q x12 + x22 ≤ t} =: Bt Für t < 0 ist Bt = ∅ Für t ≥ 0 ist Bt die Kreisscheibe mit Radius t. 0 für t < 0 X R F (t) = P(Bt ) = f (x , x )d(x , x ) für t ≥0 1 2 1 2 Bt 10.18 Beispiel 3 Parametrisierung von Bt mit Polarkoordinaten: x1 x2 WR 1 W. Merz = r cos(φ) = r sin(φ) mit 0 ≤ r ≤ t, 0 ≤ φ < 2π Funktionaldeterminante ∂(x1 , x2 ) =r ∂(r , φ) x12 + x22 = r 2 cos2 (φ) + sin2 (φ) = r 2 10.19 WR 1 Beispiel 3 Z Bt 1 − 1 (x12 +x22 ) d(x1 , x2 ) e 2 2π W. Merz ! 1 − 1 r2 = re 2 dφ dr 2π 0 0 Z t Z 2π 1 2 1 = re− 2 r dφdr 2π 0 0 Z t 1 2 = re− 2 r dr Z t Z 2π 0 = h 1 2 −e− 2 r it 0 = 1−e − 21 t 2 10.20 WR 1 Die Rayleighverteilung W. Merz Definition Die eindimensionale Verteilung mit der Verteilungsfunktion ( 0 für t ≤ 0 2 F (t) = − 12 ( βt ) für t > 0 1−e heißt die Rayleigh-Verteilung mit Parameter β (> 0). Die Verteilung von X ist somit die Rayleighverteilung mit Parameter β = 1 Die Wahrscheinlichkeit, dass der Treffpunkt in einem Ring liegt: 2 P(a ≤ X ≤ b) = P X [a, b] = F X (b) − F X (a) = e−0.5a − e−0.5b 2 10.21 WR 1 Die Rayleigh-Verteilung W. Merz Die Verteilungsfunktion ( F (t) = für t ≤ 0 0 2 1−e − 12 ( βt ) für t > 0 ist stetig differenzierbar mit der Ableitung ( 0 für t ≤ 0 0 2 f (t) = F (t) = t − 12 ( βt ) e für t > 0 β2 Daher ist f (t) die Dichte der Rayleighverteilung. 10.22 Zufallsvektoren WR 1 W. Merz Definition Eine Abbildung X : Ω −→ Rn auf der Ergebnismenge eines Wahrscheinlichkeitsraums (Ω, A, P), die bezüglich A und der σ-Algebra Bn der n-dimensionalen Borelschen Mengen messbar ist, heißt ein Zufallsvektor oder eine n-dimensionale Zufallsvariable. X (ω) ist ein Vektor: X (ω) = (X1 (ω), X2 (ω), . . . , Xn (ω)) Die Funktionen Xk : Ω −→ R heißen die Komponenten des Zufallsvektors X . Kurzschreibweise: X = (X1 , X2 , . . . , Xn ) Theorem X = (X1 , X2 , . . . , Xn ) ist ein Zufallsvektor genau dann, wenn alle Komponenten Zufallsvariable sind. 10.23 Die Verteilung eines Zufallsvektors X = (X1 , X2 , . . . , Xn ) sei ein n-dimensionaler Zufallsvektor mit der Verteilung P X : WR 1 W. Merz X (Ω, A, P) −→ (Rn , Bn , P X ) Wir beschränken uns in dieser Vorlesung auf absolutstetige Verteilungen P X , d.h. solche, die durch eine Dichte f (x) = f (x1 , x2 , . . . , xn ) charakterisiert sind. Für eine Borelsche Menge B ∈ Bn gilt unter dieser Voraussetzung Z Z P(X ∈ B) = P X (B) = 1B (x)f (x) dx = f (x) dx B Die meisten Fragestellungen in dieser Situation laufen auf das Problem hinaus, die Beschreibung eines Ereignisses in die Gestalt (X ∈ B) überzuführen. 10.24 Die Verteilung eines Zufallsvektors WR 1 W. Merz Beispiel Die Verteilung des Zufallsvektors X = (X1 , X2 ) besitze die Dichte f (x1 , x2 ). Berechne die Wahrscheinlichkeit des Ereignisses (X1 < X2 ). (X1 < X2 ) = = = = {ω {ω {ω (X ; X1 (ω) < X2 (ω)} ; (X1 (ω), X2 (ω)) ∈ {(x1 , x2 ) ∈ R2 ; x1 < x2 }} ; X (ω) ∈ B} ∈ B) Z P(X1 < X2 ) = 1B (x1 , x2 )f (x1 , x2 ) d(x1 , x2 ) 10.25 WR 1 Beispiel W. Merz Bei B = {(x1 , x2 ) ∈ R2 ; x1 < x2 } ergibt sich je nach Reihenfolge der Integration als Berechnungsformel Z Z Z 1B (x1 , x2 )f (x1 , x2 ) d(x1 , x2 ) = 1B (x1 , x2 )f (x1 , x2 ) dx2 dx1 Z ∞ Z ∞ = f (x1 , x2 ) dx2 dx1 −∞ x1 =: I1 oder Z 1B (x1 , x2 )f (x1 , x2 ) d(x1 , x2 ) Z Z = Z ∞ = −∞ 1B (x1 , x2 )f (x1 , x2 ) dx1 dx2 Z x2 f (x1 , x2 ) dx1 dx2 −∞ =: I2 10.26 WR 1 Beispiel W. Merz Speziallfall f (x1 , x2 ) = f1 (x1 )f2 (x2 ) mit eindimensionalen Dichten fi (t). Fi (t) sei die Verteilungsfunktion zu fi (t). ∞ Z I2 = −∞ Z ∞ = Z x2 f1 (x1 )f2 (x2 ) dx1 dx2 Z x2 f2 (x2 ) f1 (x1 ) dx1 dx2 −∞ −∞ ∞ −∞ Z f2 (x2 )F1 (x2 ) dx2 = −∞ ∞ ∞ f1 (x1 )f2 (x2 ) dx2 dx1 x1 −∞ Z ∞ Z ∞ = f1 (x1 ) f2 (x2 ) dx2 dx1 −∞ x1 Z ∞ = f1 (x1 ) (1 − F2 (x1 )) dx1 Z I1 Z = −∞ 10.27 WR 1 Beispiel W. Merz Noch spezieller: fi (t) bzw. Fi (t) sei die Dichte bzw. Verteilungsfunktion der Exponentialverteilung mit Parameter λi . Z I1 ∞ f1 (t) (1 − F2 (t)) dt = −∞ ∞ Z = = λ1 e−λ1 t e−λ2 t dt 0 Z ∞ λ1 (λ1 + λ2 )e−(λ1 +λ2 )t dt λ 1 + λ2 0 Der Integrand ist die Dichte der Exponentialverteilung mit Parameter λ1 + λ2 , der Wert des Integrals daher 1 und P(X1 < X2 ) = λ1 λ1 + λ 2 10.28 Funktionen von Zufallsvariablen X12 (ω) WR 1 W. Merz X22 (ω) Y1 (ω) = + Y2 (ω) = a1 X1 (ω) + a2 X2 (ω) + a3 X3 (ω) Allgemein: Sind X1 , X2 , . . . , Xn Zufallsvariable auf einem Wahrscheinlichkeitsraum (Ω, A, P)und yi = Gi (x1 , . . . , xn ) für i = 1, . . . , m reellwertige Funktionen, so möchte man die Verteilung des Zufallsvektors Y = (Y1 , Y2 , . . . , Ym ) mit den zusammengesetzten Funktionen Yi (ω) = Gi (X1 (ω), . . . , Xn (ω)) auf Ω bestimmen. 10.29 Funktionen von Zufallsvariablen WR 1 W. Merz Vektorschreibweise: • X : Ω −→ Rn , X (ω) = (X1 (ω), X2 (ω), . . . , Xn (ω)) • G : Rn −→ Rm , G(x) = (G1 (x), G2 (x), . . . , Gm (x)) mit x = (x1 , . . . , xn ) • Y : Ω −→ Rm , Y (ω) = (Y1 (ω), Y2 (ω), . . . , Ym (ω)) • Kurzschreibweise: Y (ω) = G (X (ω)) • Ohne Argumente: Y = G ◦ X • Y = G ◦ X heißt die Komposition von X und G 10.30 WR 1 Funktionen von Zufallsvariablen W. Merz Falls X , G und Y = G ◦ X Zufallsvektoren, d.h. messbar sind, liegt die folgende Situation vor: X (Ω, A, P) (Rn , Bn , P X ) - HH H Y =G◦X HH H G HH H HH j ? (R , Bm , P ) m 10.31 Kompositionssatz WR 1 W. Merz Satz Sind X : Ω −→ Rn und G : Rn −→ Rm Zufallsvektoren, dann ist auch Y = G ◦ X ein Zufallsvektor und Y und G besitzen die gleiche Verteilung: P Y = P G . Beweis Zu zeigen ist, dass für beliebige Borelsche Mengen B ⊂ Rm das Urbild (Y ∈ B) in der σ-Algebra A liegt und P Y (B) = P G (B) gilt. Sei A = (G ∈ B). Da G ein Zufallsvektor ist, ist A eine Borelsche Menge im Rn und für beliebige ω ∈ Ω gilt ω ∈ (Y ∈ B) ⇐⇒ Y (ω) = G X (ω) ∈ B ⇐⇒ X (ω) ∈ (G ∈ B) = A ⇐⇒ ω ∈ (X ∈ A) 10.32 WR 1 Kompositionssatz W. Merz Beweis (Y ∈ B) = (X ∈ A) = (X ∈ (G ∈ B)) Da X ein Zufallsvektor ist, ist (X ∈ A) und damit (Y ∈ B) ein Ereignis aus A. Y ist also auch ein Zufallsvektor. P Y (B) = P(Y ∈ B) = P(X ∈ A) = = P X (A) = P X (G ∈ B) = = P G (B) Bei P Y und P G handelt es sich um das gleiche Wahrscheinlichkeitsgesetz. 10.33 WR 1 Funktionen von Zufallsvariablen X (Ω, A, P) - W. Merz (Rn , Bn , P X ) HH HH Y =G◦X H HH G H HH j H ? (R , Bm , P ) m 10.34 WR 1 Mehrdimensionale Verteilungen W. Merz „Bestimme die Verteilung des Zufallsvektors Y “ bedeutet also: Bestimme die Verteilung P G in dem Schema G (Rn , Bn , P X ) −→ (Rm , Bm , P G ) wobei die Funktion G : Rn −→ Rm und die Verteilung P X als bekannt vorausgesetzt sind. Die Verteilung P X sei absolutstetig mit einer (bekannten) Dichte f (x) = f (x1 , x2 , . . . , xn ) Z P X (A) = 1A (x)f (x)dx Verteilung von G: P G (B) = P X (G ∈ B) = Z 1(G∈B) (x)f (x) dx Gesucht ist eine Dichte g der Verteilung P G , d.h. eine Funktion mit Z Z P G (B) = 1B (y )g(y ) dy = 1(G∈B) (x)f (x) dx 10.35