WR 1 W. Merz Kapitel 11 Funktionen von Zufallsvariablen Vorlesung Wahrscheinlichkeitsrechnung I vom 3/4. Juni 2009 W. Merz Lehrstuhl für Angewandte Mathematik 1 FAU 11.1 WR 1 Marginalverteilungen W. Merz Definition Die Verteilung P Xk der k -ten Komponente eines Zufallsvektors X = (X1 , X2 , . . . , Xn ) heißt die k -te Marginalverteilung oder k -te Randverteilung von P X . Mit der Funktion Zk (x1 , x2 , . . . , xn ) = xk lässt sich die k -te Komponente als Komposition Xk = Zk ◦ X darstellen. X (Ω, A, P) - (Rn , Bn , P X ) HH HH Xk = Zk ◦ X H HH Zk H HH j H ? (R, B, P Zk ) P Xk (B) = P Zk (B) = P X (Zk ∈ B) = R 1(Zk ∈B) (x)f (x)dx 11.2 Marginalverteilungen Fall n = 3 und k = 2 mit x = (x1 , x2 , x3 ): WR 1 W. Merz (Z2 ∈ B) = {x = (x1 , x2 , x3 ) ; x2 ∈ B} = R × B × R Wegen x ∈ (Z2 ∈ B) ⇔ x2 ∈ B ist 1(Z2 ∈B) (x) = 1B (x2 ) Satz von Fubini: Z 1(Z2 ∈B) (x1 , x2 , x3 )f (x1 , x2 , x3 )d(x1 , x2 , x3 ) Z = 1B (x2 ) f (x1 , x2 , x3 )d(x1 , x3 ) dx2 2 R ZR Z Z = 1B (x2 ) f (x1 , x2 , x3 )dx1 dx3 dx2 R R Z R =: 1B (x2 )f2 (x2 )dx2 R3 Z R 11.3 WR 1 Marginalverteilungen W. Merz Mit der Funktion Z Z f2 (x2 ) = f (x1 , x2 , x3 ) dx1 dx3 R R gilt also Xk P (B) = Z 1B (x2 )f2 (x2 )dx2 d.h. also, f2 (x2 ) ist Dichte der Verteilung P Xk . 11.4 Marginalverteilungen WR 1 W. Merz Theorem Besitzt der n-dimensionale Zufallsvektor X eine absolutstetige Verteilung mit der Dichte f (x1 , x2 , . . . , xn ), so besitzt die k -te Marginalverteilung die Dichte Z Z fk (xk ) = ... f (x1 , x2 , . . . , xn )dx1 . . . dxk −1 dxk +1 . . . dxn R R | {z } (n−1)-mal Bezeichnung fk (xk ) heißt die k -te Marginaldichte oder k -te Randdichte von f . 11.5 WR 1 Marginalverteilungen W. Merz Exercise f (x1 , x2 ) = e−x2 0 falls x1 > 0 und x2 > x1 sonst x2 6 e−x2 - x1 11.6 WR 1 1. Marginaldichte W. Merz f1 (x1 ) = R f (x1 , x2 )dx2 x2 6 e−x2 x1 x1 ≤ 0 ⇒ f (x1 , x2 ) = 0 ⇒ f1 (x1 ) = 0 x1 > 0 , x2 ≤ x1 ⇒ f (x1 , x2 ) = 0 R∞ R∞ f1 (x1 ) = x1 f (x1 , x2 )dx2 = x1 e−x2 dx2 = e−x1 11.7 WR 1 2. Marginaldichte W. Merz f2 (x2 ) = R f (x1 , x2 )dx1 6 e−x2 x2 - x1 x2 ≤ 0 ⇒ f (x1 , x2 ) = 0 ⇒ f2 (x2 ) = 0 x2 > 0 , x1 ≥ x2 oder x1 ≤ 0 ⇒ f (x1 , x2 ) = 0 Rx Rx f2 (x2 ) = 0 2 f (x1 , x2 )dx1 = 0 2 e−x2 dx1 = x2 e−x2 11.8 Stochastische Unabhängigkeit WR 1 W. Merz Definition Zufallsvariable X1 , X2 , . . . , Xn auf einem Wahrscheinlichkeitsraum (Ω, A, P) heißen stochastisch unabhängig, wenn für beliebige Borelsche Mengen B1 , B2 , . . . , Bn aus R gilt P (X1 ∈ B1 ) ∩ (X2 ∈ B2 ) ∩ . . . ∩ (Xn ∈ Bn ) = P(X1 ∈ B1 ) · P(X2 ∈ B2 ) · . . . · P(Xn ∈ Bn ) Theorem Sei X = (X1 , X2 , . . . , Xn ) ein Zufallsvektor, dessen Verteilung P X die Dichte f besitzt. Dann gilt: Die Komponenten X1 , X2 , . . . , Xn sind genau dann stochastisch unabhängig, wenn es Dichten fk : R −→ R gibt, so dass für fast alle Vektoren x = (x1 , x2 , . . . , xn ) ∈ Rn gilt f (x1 , x2 , . . . , xn ) = f1 (x1 )f2 (x2 ) · · · fn (xn ) Die fk sind dabei die Marginaldichten von f . 11.9 WR 1 Stochastische Unabhängigkeit W. Merz Die Dichte sei von der Form f (x1 , x2 , x3 ) = g1 (x1 )g2 (x2 )g3 (x3 ) mit (eindimensionalen) Dichten gk (xk ). Dann sind die gk (xk ) bereits die Marginaldichten: Beispiel k = 2: Z Z f2 (x2 ) = g1 (x1 )g2 (x2 )g3 (x3 ) dx1 dx3 R R Z Z = g2 (x2 ) g1 (x1 )dx1 g3 (x3 )dx3 } | R {z } | R {z =1 =1 = g2 (x2 ) 11.10 WR 1 Sprachgebrauch W. Merz Die Formulierung „Die Zufallsvariablen X1 und X2 sind stochastisch unabhängig. X1 ist N (0, 1)-verteilt und X2 exponentiell verteilt mit Parameter 2“ heißt: Der Zufallsvektor X = (X1 , X2 ) besitzt die Verteilung P X mit den folgenden Eigenschaften: 1. Die 1. Marginalverteilung P X1 ist die N (0, 1)-Verteilung mit der Dichte f1 (x1 ) = 2 √1 e −(1/2)x1 2π 2. Die 2. Marginalverteilung P X2 ist die Exponentialverteilung mit dem Parameter λ = 2 und der Dichte f2 (x2 ) = 2e−2x2 für x2 > 0 und f2 (x2 ) = 0 für x2 ≤ 0 3. P X besitzt die Dichte f (x1 , x2 ) = f1 (x1 )f2 (x2 ) 11.11 Stochastische Unabhängigkeit WR 1 W. Merz X1 und X2 seien stochastisch unabhängige Zufallsvariable. Sind dann auch p Y1 = X12 und Y2 = X2 stochastisch unabhängig? Y1 (ω) = G1 (X1 (ω)) und Y2 (ω) = G2 (X2 (ω)) √ mit G1 (x) = x 2 und G2 (y ) = y . Theorem Sind X1 und X2 stochastisch unabhängige Zufallsvariable und sind Gi : R −→ R für i = 1, 2 B-B-messbare Funktionen, so sind die Zufallsvariablen Y1 = G1 ◦ X1 und Y2 = G2 ◦ X2 ebenfalls stochastisch unabhängig. 11.12 WR 1 Stochastische Unabhängigkeit W. Merz Beweis. Sind B1 und B2 Borelsch, dann auch die Mengen Ai = (Gi ∈ Bi ). Wie beim Kompositionssatz ist (Yi ∈ Bi ) = (Xi ∈ Ai ) = (Xi ∈ (Gi ∈ Bi )). P[(Y1 ∈ B1 ) ∩ (Y2 ∈ B2 )] = P[(X1 ∈ A1 ) ∩ (X2 ∈ A2 )] = P(X1 ∈ A1 ) · P(X2 ∈ A2 ) = P(Y1 ∈ B1 ) · P(Y2 ∈ B2 ) 11.13 WR 1 Der Transformationssatz für Dichten W. Merz Beispiel für die Problemstellung: X1 und X2 seien stochastisch unabhängige und mit Parameter λ exponentiell verteilte Zufallsvariable. Welche Verteilung besitzt der Zufallsvektor Y = (Y1 , Y2 ) mit Y1 = X1 + X2 und Y2 = X1 /X2 ? Y1 (ω) = G1 (X1 (ω), X2 (ω)) mit G1 (x1 , x2 ) = x1 + x2 Y2 (ω) = G2 (X1 (ω), X2 (ω)) mit G2 (x1 , x2 ) = x1 /x2 X (Ω, A, P) - (R2 , B2 , P X ) H HH H Y =G◦X H HH G H HH j H ? (R , B2 , P ) 2 11.14 Der Transformationssatz für Dichten WR 1 W. Merz Nach dem Kompositionssatz muss die Verteilung P G in dem Schema G (R2 , B2 , P X ) −→ (R2 , B2 , P G ) bestimmt werden, wobei G : R2 −→ R2 die durch G: y1 y2 = x1 + x2 = x1 /x2 definierte Abbildung ist. 11.15 WR 1 Der Transformationssatz für Dichten W. Merz Die Verteilung P X besitzt die Dichte f (x1 , x2 ) = f1 (x1 )f2 (x2 ), wobei die Marginaldichten die der Exponentialverteilung mit Parameter λ sind: λe−λt für t > 0 fi (t) = 0 für t ≤ 0 Dichte von P X : f (x1 , x2 ) = λ2 e−λ(x1 +x2 ) 0 falls x1 > 0 sonst und x2 > 0 11.16 WR 1 Allgemeine Problemstellung W. Merz Berechnung der Verteilung eines Zufallsvektors Y = G ◦ X bzw. die Berechnung der Verteilung des Zufallsvektors G in dem Schema G (Rn , Bn , P X ) −→ (Rn , Bn , P G ) (Gleiche Dimension auf beiden Seiten: m = n) Als bekannt werden dabei vorausgesetzt: 1. Die Dichte f (x) = f (x1 , x2 , . . . , xn ) der Verteilung P X 2. Die Abbildung G : Rn −→ Rn : y1 y2 yn = G1 (x1 , x2 , . . . , xn ) = G2 (x1 , x2 , . . . , xn ) .. . = Gn (x1 , x2 , . . . , xn ) 11.17 WR 1 Lösungsweg W. Merz Die Verteilung P G ist definiert durch P G (B) = P X (G ∈ B) = R 1(G∈B) (x)f (x)dx Falls die Verteilung P G eine Dichte g(y ) besitzt, ist P G (B) = R 1B (y )g(y )dy Es wird also eine Funktion g(y ) gesucht, die für beliebige n-dimensionale Borelsche Mengen B die Gleichung R 1B (y )g(y )dy = R 1(G∈B) (x)f (x)dx R f (x)dx oder R B g(y )dy = (G∈B) erfüllt. 11.18 WR 1 Der Parametrisierungssatz W. Merz In der Analysis hat man es meist mit der umgekehrten Situation zu tun: Die Funktion g(y ) ist bekannt und soll auf einer Menge B integriert werden. Dazu sucht man eine Parametrisierung G : IB −→ B der Menge B. Insbesondere ist IB = (G ∈ B). Der Parametrisierungssatz besagt, dass unter bestimmten Voraussetzungen Z Z g(y )dy = f (x)dx B IB mit der Funktion f (x) = g(G(x))|JG (x)| wobei JG (x) die Jacobische oder Funktionaldeterminante der Abbildung G ist. 11.19 WR 1 Der Parametrisierungssatz JG (x) ist die Funktionaldeterminante von G: ∂G ∂G1 ∂G1 1 ∂x (x) ∂x2 (x) . . . ∂xn (x) ∂G12 ∂G2 ∂G2 ∂x1 (x) ∂x2 (x) . . . ∂xn (x) JG (x) = det .. .. .. .. . . . . ∂Gn ∂Gn ∂Gn ∂x1 (x) ∂x2 (x) . . . ∂xn (x) W. Merz 11.20 WR 1 Der Transformationssatz W. Merz In unserer Situation ist die Dichte f (x) bekannt, gesucht wird g(y ). Wenn immer die Funktionen f und g in der Relation f (x) = g(G(x))|JG (x)| zueinander stehen, gilt nach dem Parametrisierungssatz Z Z g(y )dy = f (x)dx B (G∈B) Um g zu bestimmen, muss man also nur die obige Gleichung nach g auflösen. 11.21 Der Transformationssatz WR 1 W. Merz Auflösen der Gleichung f (x) = g(G(x))|JG (x)| nach g(y ). 1. Schritt: g(G(x)) = f (x) |JG1(x)| 2. Schritt: Wir setzen y := G(x), d.h. y1 y2 yn = G1 (x1 , x2 , . . . , xn ) = G2 (x1 , x2 , . . . , xn ) .. . = Gn (x1 , x2 , . . . , xn ) Dann muss auf der rechten Seite der Vektor x als Funktion von y dargestellt werden: x = x(y ) = G∗ (y ). D.h. man muss das Gleichungssystem nach den Variablen xk auflösen. 11.22 Der Transformationssatz WR 1 W. Merz Eine Parametrisierung ist eine bijektive Abbildung von (G ∈ B) auf B, also geht das: x1 x2 xn = G1∗ (y1 , y2 , . . . , yn ) = G2∗ (y1 , y2 , . . . , yn ) .. . = Gn∗ (y1 , y2 , . . . , yn ) Kurz: x = G∗ (y ) Bezeichnung Die Abbildung G∗ : B −→ (G ∈ B) heißt die Umkehrabbildung zu G. 11.23 WR 1 Der Transformationssatz W. Merz Ergebnis: g(y ) = f (G∗ (y )) 1 |JG (G∗ (y ))| Jetzt müssen nur noch die Voraussetzungen präzisiert werden, unter denen diese Formel gültig ist. 11.24 Der Transformationssatz WR 1 W. Merz Theorem Es gebe eine offene zusammenhängende Menge M ⊂ Rn so, dass für die Dichte f (x) der Verteilung P X und den Zufallsvektor G : Rn −→ Rn die nachstehenden Bedingungen erfüllt sind: • Für x ∈ / M ist f (x) = 0 • Die Komponenten Gj (x) von G sind auf M stetig partiell differenzierbar und es ist JG (x) 6= 0 für alle x ∈ M. • Ist M ∗ = G(M) = {y ∈ Rn ; y = G(x) mit x ∈ M} das Bild der Menge M unter G, so ist die Abbildung G : M −→ M ∗ bijektiv mit der Umkehrabbildung G∗ : M ∗ −→ M. Dann besitzt die Verteilung P G des Zufallsvektors G die Dichte f (G∗ (y )) |JG (G1∗ (y ))| falls y ∈ M ∗ g(y ) = 0 sonst 11.25 Der Transformationssatz WR 1 W. Merz Exercise X1 und X2 seien stochastisch unabhängige und mit Parameter λ exponentiell verteilte Zufallsvariable. Welche Verteilung besitzt der Zufallsvektor Y = (Y1 , Y2 ) mit Y1 = X1 + X2 und Y2 = X1 /X2 ? 1. Verteilung P X : Die Dichte ist von der Form f (x1 , x2 ) = f1 (x1 )f2 (x2 ), wobei die Marginaldichten die der Exponentialverteilung mit Parameter λ sind. 2 −λ(x +x ) 1 2 λ e falls x1 > 0 und x2 > 0 f (x1 , x2 ) = 0 sonst 2. Die Menge M = {(x1 , x2 ) ; f (x1 , x2 ) > 0} = {(x1 , x2 ) ; x1 > 0, x2 > 0} ist offen und zusammenhängend. 11.26 WR 1 Beispiel W. Merz 3. Dem Zufallsvektor Y entspricht die Abbildung G mit y1 = G1 (x1 , x2 ) y2 = G2 (x1 , x2 ) = x1 + x2 x1 = x2 G ist auf der Menge M wohldefiniert und differenzierbar. 4. Die Funktionaldeterminante ist 1 1 JG (x) = 1 − x1 x2 x22 x1 + x2 =− x22 Für x ∈ M ist JG (x) 6= 0. 11.27 WR 1 Beispiel W. Merz 5. Umkehrabbildung G∗ : y2 = x1 /x2 ⇒ x1 = x2 y2 Einsetzen in y1 = x1 + x2 ergibt y1 = x2 (1 + y2 ) und damit x1 = x2 = y1 y2 1 + y2 y1 1 + y2 6. Bildmenge M ∗ ist offensichtlich M ∗ = {(y1 , y2 ) ∈ R2 ; y1 > 0, y2 > 0} = M 11.28 WR 1 Beispiel W. Merz 7. Einsetzen von G∗ (y ) für x. Für y ∈ M ∗ ist G∗ (y ) ∈ M. Mit x1 + x2 = y1 und x22 = y12 /(1 + y2 )2 erhält man f (x) = λ2 e−λ(x1 +x2 ) ⇒ f (G∗ (y )) = λ2 e−λy1 und JG (x) = − x1 + x2 x22 ⇒ JG (G∗ (y )) = − (1 + y2 )2 y1 8. Dichte des Zufallsvektors G bzw. Y g(y1 , y2 ) 1 = f (G∗ (y )) |JG (G∗ (y ))| 1 y1 λ2 e−λy1 (1+y2 )2 falls y1 > 0 = und y2 > 0 0 sonst 11.29 WR 1 Beispiel W. Merz 9. Es ist g(y1 , y2 ) = g1 (y1 )g2 (y2 ) mit den Dichten y1 λ2 e−λy1 falls y1 > 0 g1 (y1 ) = 0 sonst und g2 (y2 ) = 1 (1+y2 )2 0 falls y2 > 0 sonst d.h. die Zufallsvariablen Y1 und Y2 sind stochastisch unabhängig. 11.30 Verteilung von Zufallsvariablen WR 1 W. Merz Exercise X1 und X2 seien stochastisch unabhängige und im Intervall (0, 1) uniform verteilte Zufallsvariable. Welche Verteilung besitzt dann die Zufallsvariable Y = X1 X2 ? Es ist Y = G1 (X1 , X2 ) mit G1 (x1 , x2 ) = x1 x2 , d.h. man muss die Verteilung einer Abbildung G1 : R2 −→ R1 berechnen. Auf diese Situation ist der Transformationssatz für Dichten nicht direkt anwendbar, da eine solche Funktion nicht umkehrbar eindeutig auf einer offenen Menge M ⊂ R2 sein kann. 11.31 Vorgehensweise WR 1 W. Merz (X1 , X2 ) - (R2 , B , P X ) (Ω, A, P) 2 HH H H G1 Y = G1 (X1 , X2 ) HH HH j ? (R, B, P G1 ) Auf G1 : R2 −→ R kann der Transformationssatz nicht angewandt werden. 11.32 WR 1 Vorgehensweise (X1 , X2 ) - (R2 , B , P X ) (Ω, A, P) 2 HH H H G1 Y = G1 (X1 , X2 ) HH HH j ? (R, B, P G1 ) W. Merz (G1 , G2 ) - (R2 , B , P G ) 2 Auf G1 : R2 −→ R kann der Transformationssatz nicht angewandt werden. Erweitere G1 zu einem Zufallsvektor G = (G1 , G2 ) und berechne P G 11.32 Vorgehensweise WR 1 W. Merz (X1 , X2 ) - (R2 , B , P X ) (G1 , G2 ) - (R2 , B , P G ) (Ω, A, P) 2 2 HH H H G1 Y = G1 (X1 , X2 ) HH Z1 HH j ? G1 (R, B, P ) Auf G1 : R2 −→ R kann der Transformationssatz nicht angewandt werden. Erweitere G1 zu einem Zufallsvektor G = (G1 , G2 ) und berechne P G Berechne die erste Marginalverteilung P G1 11.32 Vorgehensweise • Ergänze die Funktion y1 = G1 (x1 , x2 ) durch eine passende zweite Funktion y2 = G2 (x1 , x2 ) zu einer Abbildung G = (G1 , G2 ), die die Voraussetzungen des Transformationssatzes erfüllt. • Berechne die Dichte g(y1 , y2 ) von P G . • Berechne die erste Marginaldichte Z g1 (y1 ) = g(y1 , y2 )dy2 WR 1 W. Merz 11.33 WR 1 Fortsetzung des Beispiels W. Merz Wegen der Unabhängigkeit der beiden Variablen X1 und X2 besitzt P X die Dichte f (x1 , x2 ) = f1 (x1 )f2 (x2 ), wobei die Marginaldichten fi (t) jeweils die Dichten der U(0, 1)-Verteilung sind: fi (t) = 1, falls 0 < t < 1 und fi (t) = 0 sonst. Mit M = {x = (x1 , x2 ) ∈ R2 ; 0 < x1 < 1 , 0 < x2 < 1 } ist also f (x) = 1 0 x ∈M sonst 11.34 WR 1 Ergänzung W. Merz G1 wird durch G2 (x1 , x2 ) = x2 ergänzt: G: y1 y2 = x1 x2 = x2 Die Funktionaldeterminante x JG (x) = 2 0 x1 = x2 1 ist auf M von Null verschieden. 11.35 WR 1 Umkehrfunktion G: y1 y2 W. Merz = x1 x2 = x2 ⇒ G∗ : x1 x2 y1 y2 = = y2 Bildmenge M ∗ : Aus 0 < x2 < 1 folgt 0 < y2 < 1. Aus 0 < x1 < 1 folgt 0 < y1 /y2 < 1 oder 0 < y1 und y1 < y2 M ∗ = {y = (y1 , y2 ) ; 0 < y1 < y2 < 1} Für y ∈ M ∗ ist G∗ (y ) ∈ M und daher f (G∗ (y )) = 1. JG (G∗ (y )) = y2 11.36 WR 1 Dichten W. Merz Dichte von P G : g(y1 , y2 ) = 1 · y12 0 für 0 < y1 < y2 < 1 sonst 1. Marginaldichte: Für y1 ≤ R0 und y1 ≥ 1 ist g(y1 , y2 ) = 0 und damit auch g1 (y1 ) = g(y1 , y2 )dy2 = 0. Für 0 < y1 < 1 erhält man Z 1 g1 (y1 ) = y1 1 dy2 = − log y1 . y2 11.37 Affin lineare Transformationen WR 1 W. Merz Yi = ai1 X1 + ai2 X2 + · · · + ain Xn + bi für i = 1, 2, . . . , n entspricht y = G(x) mit yi = Gi (x1 , x2 , . . . , xn ) = ai1 x1 + ai2 x2 + · · · + ain xn + bi ∂Gi (x) = aik ∂xk 11.38 Vektorschreibweise y1 y2 y = . .. WR 1 W. Merz x = yn x1 x2 .. . b= xn A= a11 a21 .. . a12 a22 .. . an1 an2 b1 b2 .. . bn . . . a1n . . . a2n .. .. . . . . . ann ergibt: y = G(x) = Ax + b ∂Gi (x) = A ∂xk JG (x) = det(A) 11.39 WR 1 Transformationssatz W. Merz Wenn die Matrix A nichtsingulär ist, ist det(A) 6= 0 und y = Ax + b auf dem ganzen Rn umkehrbar mit x = G∗ (y ) = A−1 (y − b) Mit M = M ∗ = Rn erhält man die Dichte g(y ) = 1 f (A−1 (y − b)) |det(A)| 11.40 WR 1 Faltungen W. Merz Berechnung der Verteilung der Summe Y = X1 + X2 zweier Zufallsvariabler. Ergänzung der Funktion y1 = G1 (x1 , x2 ) = x1 + x2 durch y2 = G2 (x1 , x2 ) = x2 ergibt die affin lineare Abbildung 1 1 x1 G(x) = 0 1 x2 mit der Umkehrabbildung 1 −1 y1 y1 − y2 ∗ G (y ) = = 0 1 y2 y2 Wegen det(A) = 1 besitzt der Zufallsvektor G die Dichte g(y1 , y2 ) = f (y1 − y2 , y2 ) 11.41 WR 1 Faltungen W. Merz Dichte des Zufallsvektors G g(y1 , y2 ) = f (y1 − y2 , y2 ) Die Dichte der Verteilung der Zufallsvariable Y ist die erste Marginaldichte von g: Z g1 (y1 ) = f (y1 − y2 , y2 )dy2 R Spezialfall: X1 , X2 stochastisch unabhängig, f (x1 , x2 ) = f1 (x1 )f2 (x2 ). Z g1 (t) = (f1 ∗ f2 )(t) = f1 (t − s)f2 (s)ds R Das Integral heißt Faltungsintegral und f1 ∗ f2 die Faltungsdichte von f1 und f2 . 11.42 WR 1 Beispiel W. Merz Die Zufallsvariablen X1 und X2 seien stochastisch unabhängig und exponentiell verteilt mit Parameter λ, d.h. λe−λx für x > 0 f1 (x) = f2 (x) = 0 für x ≤ 0 f2 (s) = 0 für s ≤ 0: Z Z g1 (t) = f1 (t − s)f2 (s)ds = R ∞ f1 (t − s)λe−λs ds 0 Aus t ≤ 0 und s ≥ 0 folgt t − s ≤ 0 und damit f1 (t − s) = 0: g1 (t) = 0 für t ≤ 0 11.43 WR 1 Beispiel W. Merz Ist t > 0, so ist f1 (t − s) = 0 für s ≥ t: Z ∞ g1 (t) = f1 (t − s)λe−λs ds 0 t Z = λe −λ(t−s) λe −λs ds = λ 0 2 −λt 2 Z t e−λt eλs e−λs ds 0 Z = λ e t 1ds = λ2 te−λt 0 11.44 WR 1 Berechnungsmethoden W. Merz Exercise Bestimme die Verteilung der Zufallsvariablen Y = X12 + X22 , wenn X1 und X2 stochastisch unabhängige und N (0, 1)-verteilte Zufallsvariable auf einem Wahrscheinlichkeitsraum (Ω, A, P) sind. (Ω, A, P) X = (X1 , X2 ) (R2 , B2 , P X ) HH H HH H Y G(x1 , x2 ) HH HH j ? H (R, B, .) 11.45 WR 1 Berechnungsmethoden W. Merz Zu bestimmen ist die Verteilung der Zufallsvariablen G(x1 , x2 ) = x12 + x22 auf dem Wahrscheinlichkeitsraum (R2 , B2 , P X ), wobei die Verteilung P X die Dichte f (x1 , x2 ) = f1 (x1 )f2 (x2 ) = ϕ(x1 )ϕ(x2 ) = 1 − 1 (x12 +x22 ) e 2 2π besitzt. 11.46 WR 1 Verteilungsfunktion W. Merz F G (t) = P G (−∞, t] = P X (G ≤ t) (G ≤ t) = {(x1 , x2 ) ; x12 + x22 ≤ t} = ∅ B√t für t < 0 für t ≥ 0 wobei Br die Kreisscheibe mit Radius r ist. 11.47 WR 1 Verteilungsfunktion W. Merz Für t < 0 ist (G ≤ t) = {(x1 , x2 ) ; x12 + x22 ≤ t} = ∅ und daher F G (t) = 0. Für t ≥ 0 erhält man F G (t) Z = P X (B√t ) = 1B√t (x1 , x2 )f (x1 , x2 )d(x1 , x2 ) Z 1 − 1 (x12 +x22 ) = e 2 d(x1 , x2 ) B√t 2π ! Z √t Z 2π 1 − 1 r2 = r e 2 dϕ dr 2π 0 0 1 = 1 − e− 2 ( 1 = 1 − e− 2 t √ t)2 Die Verteilung von G und somit die von Y ist daher die Exponentialverteilung mit dem Parameter λ = 1/2. 11.48 Faltung WR 1 W. Merz Die Zufallsvariablen Yi = Xi2 sind stochastisch unabhängig. Sind g1 und g2 die Dichten der Verteilungen dieser Zufallsvariablen, besitzt die Verteilung von Y = Y1 + Y2 die Faltungsdichte Z f Y (t) = g1 ∗ g2 (t) = g1 (t − x) g2 (x) dx 11.49 WR 1 Berechnung der Dichten Yi F (t) = P(Yi ≤ t) = W. Merz P(Xi2 ≤ t) Für t < 0 ist (Xi2 ≤ t) = ∅, weil die Zufallsvariable Xi (ω)2 nur nichtnegative Werte annehmen kann, und daher F Yi (t) = 0. Ist t ≥ 0, so gilt (Xi2 ≤ t) = {ω ; Xi2 (ω) ≤ t} √ √ = {ω ; − t ≤ Xi (ω) ≤ t} √ √ = (− t ≤ Xi ≤ t) 11.50 WR 1 Berechnung der Dichten W. Merz Also √ √ √ √ √ √ F Yi (t) = P(− t ≤ Xi ≤ t) = P(Xi ∈ [− t, t]) = P Xi [− t, t] P Xi ist die N (0, 1)-Verteilung mit der stetig differenzierbaren Verteilungsfunktion Z t Φ(t) = t ϕ(x)dx = −∞ Daher Z −∞ 1 2 1 √ e− 2 x dx 2π √ √ √ √ F Yi (t) = P Xi [− t, t] = Φ( t) − Φ(− t) 11.51 Berechnung der Dichten WR 1 W. Merz Die Dichte gi erhält man durch Ableiten der Verteilungsfunktion F Yi . Für t < 0 ist gi (t) = 0 und für t ≥ 0 nach der Kettenregel gi (t) = √ √ √ 1 d √ d 1 Φ( t) − Φ(− t) = ϕ( t) √ − ϕ(− t) √ dt dt 2 t −2 t ϕ(−x) = ϕ(x), daher √ √ 1 1 1 1 gi (t) = √ (ϕ( t) + ϕ( t)) = √ √ e− 2 t 2 t t 2π 11.52 WR 1 Faltungsdichte W. Merz f Y (t) = g1 ∗ g2 (t) = Z g1 (t − x) g2 (x)dx Wie beim Beispiel zum Faltungsintegral: Für t ≤ 0 ist f Y (t) = 0 Für t > 0 ist f Y (t) Z = = t 1 1 1 1 1 1 √ e− 2 (t−x) √ √ e− 2 x dx x t − x 2π 2π 0 Z 1 −1t 1 t 1 2 p dx e 2 π 0 (t − x)x √ 11.53 WR 1 Faltungsdichte W. Merz Die Variablensubstitution y = 2t x − 1 mit der Umkehrfunktion 2 x = 2t (y + 1) und dy dx = t liefert Z t Z 1 p dx = (t − x)x 1 1 dy 1 − y2 π π = arcsin(1) − arcsin(−1) = − (− ) = π 2 2 0 −1 p so dass 1 −1t e 2 2 d.h. die Dichte der Exponentialverteilung mit λ = 1/2. f Y (t) = 11.54 WR 1 Transformationssatz W. Merz Erweiterung des Transformationssatzes auf nicht eindeutig umkehrbare Abbildungen G. Ergänzung von x12 + x22 durch eine zweite Funktion: G: y1 y2 = G1 (x1 , x2 ) = x12 + x22 = G2 (x1 , x2 ) = x22 1. Die Funktionaldeterminante 2x1 JG (x1 , x2 ) = det 0 2x2 2x2 = 4x1 x2 verschwindet auf der Menge N = (x1 , x2 ) ∈ R2 ; x1 = 0 oder x2 = 0 Vermutlich kein Problem, weil N eine Nullmenge ist (Achsenkreuz). 11.55 WR 1 Transformationssatz W. Merz Alle Punkte (x1 , x2 ) 6∈ N werden durch y1 y2 = G1 (x1 , x2 ) = x12 + x22 = G2 (x1 , x2 ) = x22 wegen x12 > 0 und x22 > 0 in die Menge M ∗ = (y1 , y2 ) ∈ R2 ; 0 < y2 < y1 abgebildet. 11.56 WR 1 Transformationssatz y1 y2 W. Merz = G1 (x1 , x2 ) = x12 + x22 = G2 (x1 , x2 ) = x22 G ist nicht eindeutig umkehrbar, denn zu jedem (y1 , y2 ) ∈ M ∗ gibt es vier verschiedene Urbildpunkte √ √ x11 = y1 − y2 x12 = − y1 − y2 √ √ x21 = y2 x22 = y2 √ x13 = − y1 − y2 √ x23 = − y2 √ x14 = y1 − y2 √ x24 = − y2 je einen in einem der vier offenen Quadranten M1 , M2 , M3 und M4 des R2 11.57 WR 1 Transformationssatz W. Merz 11.58 Transformationssatz WR 1 W. Merz G : Mi −→ M ∗ besitzt eine Umkehrfunktion Gi∗ : M ∗ −→ Mi , die durch die entsprechende Gleichung √ x1 = ± y1 − y2 √ x2 = ± y2 gegeben ist. Für diese eingeschränkte Abbildung sind alle Voraussetzungen des Transformationssatzes erfüllt. 11.59 WR 1 Transformationssatz W. Merz B ⊂ M ∗ Borelsche Menge. (G ∈ B) = I1 + I2 + I3 + I4 mit Ik = (G ∈ B) ∩ Mk = {(x1 , x2 ) ∈ Mk ; G(x1 , x2 ) ∈ B} Daher ist P G (B) = P X (G ∈ B) = 4 X P X (Ik ) k =1 11.60 WR 1 Transformationssatz W. Merz Da durch G und Gk∗ die Menge Ik eineindeutig auf B abgebildet wird und umgekehrt, ist Z Z P X (Ik ) = f (x)dx = gk (y )dy Ik B mit gk (y ) = f (Gk∗ (y )) P G (B) = R P4 B 1 |JG (Gk∗ (y ))| k =1 gk (y )dy Unabhängig vom Quadranten gilt stets x12 + x22 = y1 , so dass f (Gk∗ (y )) = 1 − 1 y1 e 2 2π 11.61 WR 1 Transformationssatz |JG (Gk∗ (y ))| W. Merz √ √ = |4 · (± y1 − y2 )(± y2 )| q √ √ = 4 y1 − y2 y2 = 4 y1 y2 − y22 Damit 1 1 gk (y1 , y2 ) = e− 2 y1 8π q y1 y2 − y22 und P G (B) = Z X 4 B k =1 Z Z 4g1 (y )dy = gk (y )dy = B g(y )dy B 11.62 WR 1 Transformationssatz mit g(y1 , y2 ) = W. Merz 1 − 1 y1 1 1 q e 2 2 π y y − y2 1 2 2 Das Urbild einer Menge B, die zu M ∗ disjunkt ist, ist entweder leer oder in der Nullmenge N enthalten, so dass für eine derartige Menge Z G P (B) = P(G ∈ B) = f (x)dx = 0 (G∈B) Setzt man g(y ) = 0 auf M ∗ und wie oben auf M ∗ , so gilt stets Z P G (B) = g(y )dy B 11.63 WR 1 1. Marginaldichte W. Merz Z g1 (y1 ) = g(y1 , y2 )dy2 Ist y1 ≤ 0, so ist (y1 , y2 ) ∈ M ∗ . Für solche Punkte ist der Integrand g(y1 , y2 ) und damit auch g1 (y1 ) gleich Null. Ist y1 > 0, liegt (y1 , y2 ) in M ∗ , wenn 0 < y2 < y1 . Z y1 g(y1 , y2 )dy2 g1 (y1 ) = 0 Z 1 − 1 y1 1 y1 1 2 q = e dy2 2 π 0 y1 y2 − y22 Wie schon berechnet, hat das letzte Integral den Wert π. Ergebnis: Dichte der Exponentialverteilung mit λ = 1/2. 11.64