4. Verteilungen von Funktionen von Zufallsvariablen Allgemeine Problemstellung: • Gegeben sei die gemeinsame Verteilung der ZV’en X1, . . . , Xn (d.h. bekannt seien fX1,...,Xn bzw. FX1,...,Xn ) • Wir betrachten k Funktionen g1 : Rn −→ R, . . . , gk : Rn −→ R • Gesucht wird die gemeinsame Verteilung der k ZV’en Y1 = g1(X1, . . . , Xn), . . . , Yk = gk (X1, . . . Xn) (d.h. gesucht wird fY1,...,Yk bzw. FY1,...,Yk ) 155 Beispiel: • Gegeben seien die ZV’en X1, . . . , Xn mit fX1,...,Xn • Wir betrachten die beiden Funktionen g1(X1, . . . , Xn) = n X Xi und i=1 • Gesucht wird fY1,Y2 mit Y1 = n 1 X g2(X1, . . . , Xn) = Xi n i=1 Pn 1 Pn Y = X und 2 i=1 i n i=1 Xi Bemerkungen: • Aus der gemeinsamen Verteilung fY1,...,Yk kann man die k Randverteilungen fY1 , . . . fYk ermitteln (vgl. Kapitel 3, Folien 106 ff.) 156 Inhalt dieses Kapitels: • Techniken zur Bestimmung der (Rand)Verteilungen von (Y1, . . . , Yk )0 157 4.1 Erwartungswerte von Funktionen von Zufallsvariablen Vereinfachung: • Zunächst interessieren nicht die exakten Verteilungen, sondern nur bestimmte Erwartungswerte von Y1, . . . , Yk Vorüberlegungen: • Gegeben seien die (stetigen) ZV’en X1, . . . , Xn und die Funktion g : Rn −→ R • Wir betrachten die ZV’e Y = g(X1, . . . , Xn) und interessieren uns für deren E-Wert E[g(X1, . . . , Xn)] 158 • Mögliche Berechnungen: E(Y ) = bzw. E(Y ) = Z +∞ −∞ ... Z +∞ −∞ Z +∞ −∞ y · fY (y) dy g(x1, . . . , xn)·fX1,...,Xn (x1, . . . xn) dx1 . . . dxn (vgl. Definition 3.9, Folie 128) • Es gilt: Beide Berechnungen führen zum gleichen Ergebnis −→ wähle die einfachere Berechnungsart 159 Jetzt: • Berechnungsregeln für Erwartungswerte, Varianzen, Kovarianzen von Summen von Zufallsvariablen Ausgangslage: • X1, . . . , Xn seien gegebene stetige oder diskrete ZV’en mit gemeinsamer Dichte fX1,...,Xn • Die (transformierende) Funktion g : Rn −→ R sei g(x1, . . . , xn) = n X xi i=1 160 • Gesucht werden zunächst der Erwartungswert und die Varianz von Y = g(X1, . . . , Xn) = n X Xi i=1 Satz 4.1: (E-Wert und Varianz einer Summe) Für die gegebenen ZV’en X1, . . . , Xn gelten E n X i=1 bzw. Var n X i=1 Xi = n X i=1 Xi = n X E(Xi) i=1 Var(Xi) + 2 · n X n X Cov(Xi, Xj ). i=1 j=i+1 161 Folgerungen: • Für gegebene Konstanten a1, . . . , an ∈ R gilt ferner E n X a i · Xi = i=1 (warum?) n X i=1 ai · E(Xi) • Für die ZV’en X1 und X2 gilt E(X1 ± X2) = E(X1) ± E(X2) • Falls X1, . . . , Xn paarweise stochastisch unabhängig sind, so folgt Cov(Xi, Xj ) = 0 für alle i 6= j und es gilt Var n X i=1 Xi = n X Var(Xi) i=1 162 Jetzt: • Berechnung der Kovarianz zweier Summen von ZV’en Satz 4.2: (Kovarianz zweier Summen) Gegeben seien die ZV’en X1, . . . , Xn sowie Y1, . . . , Ym und die Konstanten a1, . . . an, b1, . . . , bm ∈ R. Dann gilt: Cov n X i=1 ai · Xi , m X j=1 bj · Yj = m n X X i=1 j=1 ai · bj · Cov(Xi, Yj ). 163 Folgerungen: • Für die Varianz einer gewichteten Summe von ZV’en folgt Var n X i=1 ai · Xi = Cov = n X i=1 n n X X i=1 j=1 = n X i=1 = n X i=1 ai · Xi, n X j=1 aj · Xj ai · aj · Cov(Xi, Xj ) a2 i · Var(Xi ) + n X n X i=1 j=1,j6=i a2 i · Var(Xi) + 2 · n X n X ai · aj · Cov(Xi, Xj ) i=1 j=i+1 ai · aj · Cov(Xi, Xj ) 164 • Für die beiden ZV’en X1 und X2 gilt Var(X1 ± X2) = Var(X1) + Var(X2) ± 2 · Cov(X1, X2) bzw. unter stochastischer Unabhängigkeit Var(X1 ± X2) = Var(X1) + Var(X2) Abschließend: • Wichtiges Resultat für den Erwartungswert des Produktes zweier ZV’en 165 Ausgangslage: • X1, X2 seien stetige oder diskrete ZV’en mit gemeinsamer Dichte fX1,X2 • Die Funktion g : Rn −→ R sei g(x1, x2) = x1 · x2 • Gesucht wird der Erwartungswert von Y = g(X1, X2) = X1 · X2 Satz 4.3: (E-Wert eines Produktes) Für die ZV’en X1, X2 gilt E (X1 · X2) = E(X1) · E(X2) + Cov(X1, X2). 166 Folgerung: • Für stochastisch unabhängige ZV’en gilt E (X1 · X2) = E(X1) · E(X2) Bemerkungen: • Es gibt auch eine Formel für die Varianz Var(X1 · X2) • Für die Erwartungswerte und Varianzen anderer Transformationen (z.B. Quotienten) existieren oft keine exakten Formeln 167 4.2 Die Verteilungsfunktions-Methode Motivation: • Gegeben sind die ZV’en X1, . . . , Xn mit gemeinsamer Dichte fX1,...,Xn • Gesucht ist die gemeinsame Verteilung von Y1, . . . , Yk mit Yj = gj (X1, . . . , Xn) für j = 1, . . . , k • Die gemeinsame VF von Y1, . . . , Yk ist definiert durch FY1,...,Yk (y1, . . . , yk ) = P (Y1 ≤ y1, . . . , Yk ≤ yk ) (vgl. Definition 3.2, Folie 98) 168 • Nun gilt für das Ereignis {Y1 ≤ y1, . . . , Yk ≤ yk } = {g1(X1, . . . , Xn) ≤ y1, . . . , gk (X1, . . . , Xn) ≤ yk } d.h. das interessierende Ereignis für Y1, . . . , Yk kann mit den Funktionen g1, . . . , gk durch X1, . . . , Xn ausgedrückt werden −→ da die gemeinsame Verteilung von X1, . . . , Xn bekannt ist, kann man in bestimmten Fällen FY1,...,Yk und damit fY1,...,Yk berechnen 169 Beispiel 1: • Betrachte n = 1 (d.h. die ZV’e X1 ≡ X mit VF FX ) und k = 1 (d.h. g1 ≡ g bzw. Y1 ≡ Y ) • Betrachte die Funktion g(x) = a · x + b, b ∈ R, a > 0 • Gesucht wird die Verteilung von Y = g(X) = a · X + b 170 • Berechnung der VF von Y : FY (y) = P (Y ≤ y) = P [g(X) ≤ y] = P (a · X + b ≤ y) y−b = P X≤ a y−b = FX a • Falls X stetig ist, so folgt für die Dichte von Y y−b 1 y−b 0 fY (y) = FY0 (y) = FX = · fX a a a (vgl. Folie 48) 171 Beispiel 2: • Betrachte n = 1 und k = 1 und die Funktion g(x) = ex • Für die VF von Y = g(X) = eX gilt FY (y) = P (Y ≤ y) = P (eX ≤ y) = P [X ≤ ln(y)] = FX [ln(y)] • Falls X stetig ist, so folgt für die Dichte von Y fX [ln(y)] 0 0 fY (y) = FY (y) = FX [ln(y)] = y 172 Jetzt: • Betrachte n = 2 und k = 2, d.h. gegeben sind die ZV’en X1 und X2 mit gemeinsamer Dichte fX1,X2 (x1, x2) • Betrachte die Funktionen g1(x1, x2) = x1 + x2 bzw. g2(x1, x2) = x1 − x2 • Gesucht werden die Verteilungen der Summe bzw. der Differenz zweier ZV’en • Herleitung über 2-dimensionale Anwendung der VF-Methode 173 Satz 4.4: (Verteilung einer Summe / Differenz) Es seien X1 und X2 zwei stetige ZV’en mit gemeinsamer Dichtefunktion fX1,X2 (x1, x2). Dann gilt für die Dichtefunktionen von Y1 = X1 + X2 bzw. Y2 = X1 − X2 fY1 (y1) = Z +∞ fX1,X2 (x1, y1 − x1) dx1 = Z +∞ fX1,X2 (y1 − x2, x2) dx2 bzw. −∞ −∞ fY2 (y2) = Z +∞ fX1,X2 (x1, x1 − y2) dx1 = Z +∞ fX1,X2 (y2 + x2, x2) dx2. −∞ −∞ 174 Folgerung: • Sind X1 und X2 stochastisch unabhängig, so folgt fY1 (y1) = Z +∞ fX1 (x1) · fX2 (y1 − x1) dx1 fY2 (y2) = Z +∞ fX1 (x1) · fX2 (x1 − y2) dx1 −∞ −∞ Beispiel: • X1 und X2 seien stochastisch unabhängig mit identischer Dichtefunktion fX1 (x) = fX2 (x) = ( 1 0 , für x ∈ [0, 1] , sonst • Gesucht wird die Dichtefunktion von Y = X1 + X2 (vgl. Übung) 175 Jetzt: • Analoges Resultat für das Produkt bzw. den Quotienten zweier ZV’en Satz 4.5: (Verteilung eines Produktes / Quotienten) Es seien X1 und X2 zwei stetige ZV’en mit gemeinsamer Dichtefunktion fX1,X2 (x1, x2). Dann gilt für die Dichtefunktionen von Y1 = X1 · X2 bzw. Y2 = X1/X2 fY1 (y1) = Z +∞ 1 bzw. fY2 (y2) = Z +∞ −∞ y fX1,X2 (x1, 1 ) dx1 x1 −∞ |x1| |x2| · fX1,X2 (y2 · x2, x2) dx2. 176 4.3 Die Methode der momentenerzeugenden Funktionen Motivation: • Gegeben sind erneut die ZV’en X1, . . . , Xn mit gemeinsamer Dichte fX1,...,Xn • Gesucht ist wiederum die gemeinsame Verteilung von Y1, . . . , Yk mit Yj = gj (X1, . . . , Xn) für j = 1, . . . , k 177 • Gemäß Definition 3.14, Folie 143, gilt für die gemeinsame momentenerzeugende Funktion der Y1, . . . , Yk (falls diese existiert) mY1,...,Yk (t1, . . . , tk ) = E = h et1·Y1+...+tk ·Yk Z +∞ −∞ ... Z +∞ −∞ i et1·g1(x1,...,xn)+...+tk ·gk (x1,...,xn) ×fX1,...,Xn (x1, . . . , xn) dx1 . . . dxn • Falls sich mY1,...,Yk (t1, . . . , tk ) berechnen und als eine ”bekannte momentenerzeugende Funktion” identifizieren lässt, so hat Y1, . . . , Yk ebendiese zur momentenerzeugenden Funktion gehörige gemeinsame Verteilung (vgl. Folie 145) 178 Beispiel: • Betrachte n = 1 und k = 1, wobei die gegebene ZV X1 ≡ X standardnormalverteilt sein soll • Betrachte die Funktion g1(x) ≡ g(x) = x2 • Gesucht ist die Verteilung von Y = g(X) = X 2 • Für die momentenerzeugende Funktion von Y ergibt sich: h i t·X 2 mY (t) = E et·Y = E e = Z +∞ −∞ 2 et·x · fX (x)dx 179 = Z +∞ −∞ = ... 1 2 2 1 t·x √ e · 2π 1 = 1 2−t 2 2 −1 2x ·e dx 1 für t < 2 • Dies ist die momentenerzeugende Funktion einer Gamma1 und r = 1 Verteilung mit Parametern λ = 2 2 (vgl. Mood, Graybill, Boes (1974), S. 540/541) −→ Y = X 2 ist Γ(0.5, 0.5)-verteilt 180 Jetzt: • Verteilung von Summen unabhängiger ZV’en Vorüberlegung: • Betrachte die momentenerzeugende Funktion dieser Summe • Es seien also X1, . . . , Xn gegebene stochastisch unabhängige P ZV’en und Y = n i=1 Xi • Für die momentenerzeugende Funktion von Y gilt Pn i h i t· X t·X t·X t·X mY (t) = E = E e i=1 i = E e 1 · e 2 · . . . · e n i i h h h i t·X t·X t·X [Satz 3.13(c)] = E e 1 · E e 2 · ... · E e n h et·Y i h = mX1 (t) · mX2 (t) · . . . · mXn (t) 181 Satz 4.6: (Momentenerzeugende Funktion einer Summe) Es seien X1, . . . , Xn unabhängige Zufallsvariable mit existierenden momentenerzeugenden Funktionen mX1 (t), . . . , mXn (t) für alle t ∈ (−h, h), h > 0. Die momentenerzeugende Funktion der Pn Xi ist dann gegeben durch Summe Y = i=1 mY (t) = n Y i=1 mXi (t) für t ∈ (−h, h). Hoffnung: • Vielleicht lässt sich anhand der momentenerzeugenden FunkPn tion der Summe mY (t) die Verteilung der Summe Y = i=1 Xi identifizieren 182 Beispiel 1: • Es seien X1, . . . , Xn unabhängig und identisch exponentialverteilt mit Parameter λ > 0 • Die momentenerzeugende Funktion einer jeden ZV’en Xi (i = 1, . . . , n) ist damit gegeben durch λ mXi (t) = für t < λ λ−t (vgl. Mood, Graybill, Boes (1974), S. 540/541) • Die momentenerzeugende Funktion der Summe Y = lautet dann Pn i=1 Xi n λ mY (t) = mP Xi (t) = mXi (t) = λ−t i=1 n Y 183 • Dies entspricht der momentenerzeugenden Funktion einer Γ(n, λ)-Verteilung (vgl. Mood, Graybill, Boes (1974), S. 540/541) −→ Die Summe von n unabhängigen identisch exponentialverteilter ZV’en mit Parameter λ ist also Γ(n, λ)-verteilt 184 Beispiel 2: • Es seien X1, . . . , Xn unabhängig normalverteilte ZV’en mit Parametern µi, σi2, d.h. Xi ∼ N (µi, σi2) • Ferner seien a1, . . . , an ∈ R Konstanten • Dann gilt für die gewichtete Summe Y = n X i=1 ai · Xi ∼ N (Herleitung: Übungsaufgabe) n X i=1 ai · µi, n X i=1 ai2 · σi2 185 4.4 Allgemeine Transformationssätze Bisher: • Techniken, mit denen in speziellen Fällen die Verteilungen der Transformierten Y1 = g1(X1, . . . , Xn), . . . , Yk = gk (X1, . . . , Xn) gefunden werden können Nachteil: • Die Methoden führen nicht immer zum Ziel (z.B. Rechnungen zu kompliziert) 186 Ausweg: • Es gibt konstruktive Methoden, mit denen sich die Verteilungen von Transformierten (unter bestimmten Voraussetzungen) stets berechnen lassen −→ Transformationssätze für Dichten In dieser VL: • Wir betrachten nur den einfachen Fall n = 1, k = 1, d.h. die Transformation Y = g(X) • Für multivariate Verallgemeinerungen (d.h. für n ≥ 1, k ≥ 1) siehe Mood, Graybill, Boes (1974), S. 203 ff. 187 Satz 4.7: (Transformationssatz für Dichten) Es sei X eine stetige ZV mit Dichtefunktion fX (x). Es bezeichne D = {x : fX (x) > 0}. Weiter sei angenommen, dass (a) die Transformation g : D −→ W mit y = g(x) eine bijektive Abbildung von D auf W ist. (b) die Ableitung der inversen Funktion g −1 : W −→ D mit x = g −1(y) bzgl. y für alle y ∈ W stetig und von Null verschieden ist. Dann ist Y = g(X) eine stetige ZV mit Dichtefunktion −1 dg (y) · f −1 g (y) fY (y) = dy X 0 , für y ∈ W . , sonst 188 Bemerkung: • Eine Abbildung g : D −→ W mit y = g(x) heißt bijektiv, wenn zu jedem y ∈ W genau ein x ∈ D mit y = g(x) existiert Beispiel: • Die ZV X habe die Dichtefunktion fX (x) = ( θ · x−θ−1 0 , für x ∈ [1, +∞) , sonst (Pareto-Verteilung mit Parameter θ > 0) • Gesucht ist die Verteilung von Y = ln(X) • Wir haben D = [1, +∞), g(x) = ln(x), W = [0, +∞) 189 • Weiterhin ist g(x) = ln(x) eine bijektive Abbildung von D = [1, +∞) auf W = [0, +∞) mit der inversen Funktion x = g −1(y) = ey • Für deren Ableitung nach y gilt dg −1(y) = ey , dy d.h. die Ableitung ist für alle y ∈ [0, +∞) stetig und von Null verschieden • Somit folgt für die Dichtefunktion von Y = ln(x): fY (y) = ( ey · θ · (ey )−θ−1 0 = ( θ · e−θ·y 0 , für y ∈ [0, +∞) , sonst , für y ∈ [0, +∞) , sonst 190