Eindimensionale Zufallsvariablen Grundbegriffe Verteilungstypen Diskrete Zufallsvariablen Stetige Zufallsvariablen Spezielle Maßzahlen für eindimensionale Zufallsvariablen Erwartungswert Varianz Standardabweichung Schwankungsintervalle Prof. Mohr / Dr. Ricabal Zufallsvariablen 1 Bibliografie Bleymüller / Gehlert / Gülicher Verlag Vahlen Statistik für Wirtschaftswissenschaftler Bleymüller / Gehlert Verlag Vahlen Statistische Formeln, Tabellen und Programme PowerPointPräsentationen (Prof. Mohr/ Dr. Ricabal) Vorlesungsskript für Statistik I (Dr. Pu Chen) Vorlesungsskript für Statistik II (Prof. Mohr, Private Hanseuniversität Rostock) http://www.wiwi.uni-rostock.de/vwl/statistik/download/ba/ Prof. Mohr / Dr. Ricabal Zufallsvariablen 2 Grundlagen Häufig interessiert man sich bei einem Zufallsexperiment nicht so sehr für die einzelnen Elementarereignisse, sondern für gewisse reelle Merkmalswerte, die diesen Ereignissen zugeordnet sind. Mit den reellen Zahlen lässt sich meist bequemer rechnen. Beispiel: Werfen mit 3 Würfeln: Augensumme Lotto: Anzahl der richtigen getippten Zahlen Prof. Mohr / Dr. Ricabal Zufallsvariablen 3 Zufallsvariable Eine Abbildung (Funktion) X, die jedem Elementarereignis w ∊ Ω eine reelle Zahl X(w) zuordnet, heißt Zufallsvariable. X :Ω → R w → X( w) Somit ist X eine Größe, die beim Auftreten eines zufälligen Elementarereignisses einen davon abhängigen reellen Wert X(w) annimmt. X ist also eine Variable, die vom Zufall abhängt. Mittels einer Zufallsvariable kann jedem Ereignis eine gewisse Menge von reellen Zahlen zugeordnet werden. Ferner kann man für die durch die Zufallsvariable erzeugten Ereignisse Wahrscheinlichkeit angeben. Sei A ein Ereignis. Dann lautet die über X berechnete Wahrscheinlichkeit: WX (A) = W ({w | X −1 ( w ) ∈ A}) Prof. Mohr / Dr. Ricabal Zufallsvariablen 4 Beispiel: Zufallsvariable Beispiel: Sei X die Anzahl der Ausprägung „Zahl“ bei drei Würfen einer Münze Elementarereignisse 1. Darstellung 2. Darstellung X(wi) 0 w1 = (W, W, W) = (0, 0, 0) w2 = (Z, W, W) = (1, 0, 0) 1 w3 = (W, Z, W) = (0, 1, 0) 1 w4 = (W, W, Z) = (0, 0, 1) 1 = (1, 1, 0) 2 w5 = (Z, Z, W) w6 = (Z, W, Z) = (1, 0, 1) 2 w7 = (W, Z, Z) = (0, 1, 1) 2 = (1, 1, 1) 3 w8 = (Z, Z, Z) → W(X=0) = 1/8 } } → W(X=1) = 3/8 → W(X=2) = 3/8 → W(X=3) = 1/8 A = Augenzahl ≤ 1 bzw. X ≤ 1 WX (A) = W ({w | X( w ) ≤ 1}) = W (X = 0 ∨ X = 1) = W (X = 0) + W (X = 1) 1 3 4 1 = + = = 8 8 8 2 Prof. Mohr / Dr. Ricabal Zufallsvariablen 5 Verteilungsfunktion ¾ Die Verteilungsfunktion ist für alle reelle Zahlen x definiert. ¾ Die Verteilungsfunktion an der Stelle x gibt die Wahrscheinlichkeit an, dass die Zufallsvariable X einen Wert von höchstens x annimmt bzw. x nicht überschreitet. FX : R → [0,1] x → FX ( x ) = W (X ≤ x ) Prof. Mohr / Dr. Ricabal Zufallsvariablen 6 Beispiel: Verteilungsfunktion Beispiel: Sei X die Anzahl der Ausprägung „Zahl“ bei drei Würfen einer Münze x W(X = x) 0 1/8 1 3/8 2 3/8 FX(x) 3 1/8 1 FX ( x) = W (X ≤ x) für alle x ∈ R x 1/2 FX(x) = W(X ≤ x) -∞ < x < 0 0 0≤x<1 1/8 1≤x<2 1/8+3/8=4/8=1/2 2≤x<3 1/8+3/8+3/8=7/8 0 1 2 3 x FX (−1) = W (X ≤ −1) = 0 x≥3 1/8+3/8+3/8+1/8=1 1 FX (0) = W (X ≤ 0) = W (X = 0) = 8 FX (0,5) = W (X ≤ 0,5) = W (X = 0) = 1 8 1 3 3 1 FX (3,5) = W (X ≤ 3,5) = W (X = 0) + W (X = 1) + W (X = 2) + W (X = 3) = + + + = 1 8 8 8 8 Prof. Mohr / Dr. Ricabal Zufallsvariablen 7 Eigenschaften der Verteilungsfunktion Monotonie FX (a ) ≤ FX (b) für a ≤ b Rechtsseitigstetigkeit lim F( x + h) = FX ( x) h→0 Grenzverhalten FX ( x) = 0 lim x → −∞ und lim FX ( x) = 1 x→∞ Es gilt: W (a < X ≤ b) = W (X ≤ b) − W (X ≤ a ) = FX (b) − FX (a ) Beispiel: a b W (1 < X ≤ 3) = W (X ≤ 3) − W (X ≤ 1) = FX (3) − FX (1) = 1 − Prof. Mohr / Dr. Ricabal Zufallsvariablen 1 1 = 2 2 8 Diskrete Zufallsvariable Eine Zufallsvariable X heißt diskret, wenn die Menge der Werte, die X mit positiver Wahrscheinlichkeit annehmen kann, d. h. D(X) = {x ∈ ℜ | W (X = x ) > 0} abzählbar ist. Diese Menge D(X) bezeichnet man als Träger, die Werte x ∊ D(X) als Massenpunkte. Es kann endlich oder abzählbar unendlich viele Massenpunkte geben. Die Funktion fX(x) , die jedem Element x des Trägers die Wahrscheinlichkeit W(X = x) zuordnet, heißt Wahrscheinlichkeitsfunktion. Für alle andere x ist f(x) = 0. ⎧W (X = x ) für x ∈ D(X) f X (x) = ⎨ sonst ⎩0 Es gelten folgende Eigenschaften: 0 ≤ f X ( x) ≤ 1 und Prof. Mohr / Dr. Ricabal ∑f X ( x) = 1 Zufallsvariablen 9 Beispiel: Diskrete Zufallsvariable Sei X die Anzahl der Ausprägung „Zahl“ bei drei Würfen einer Münze. Es gilt: x 0 fX(x) = W(X = x) 1/8 1 3/8 2 3/8 3 1/8 fX(x) = 0 für alle andere x fX(x) 1/2 3/8 0 ≤ f X ( x ) ≤ 1 und 1/4 ∑f 1/8 0 ∀x 1 Prof. Mohr / Dr. Ricabal 2 3 X 1 3 3 1 (x) = + + + = 1 8 8 8 8 x Zufallsvariablen 10 Beispiel: Abzählbar unendlich viele Werte Ein Würfel wird solange geworfen, bis zum ersten Mal eine 6 erscheint. X bezeichnet die Anzahl der Misserfolge (vor der ersten 6). Die möglichen Werte von X bilden den Träger D(X)={0, 1, 2, …}. Diese Menge ist dann abzählbar unendlich. Da die entsprechenden Würfe unabhängige Ereignisse darstellen, gilt: fX(x) 1 5 1 5 f (1) = ⋅ = ≈ 0,17 ; ≈ 0,14 ; 6 6 6 36 5 5 1 25 f ( 2) = ⋅ ⋅ = ≈ 0,12 ; 6 6 6 216 5 5 5 1 125 f (3) = ⋅ ⋅ ⋅ = ≈ 0,10 ; 6 6 6 6 1296 f ( 0) = 0,20 0,15 0,10 0,05 ⎧⎛ 5 ⎞ x 1 ⎪ f ( x ) = ⎨⎜⎝ 6 ⎟⎠ ⋅ 6 für x ∈ D(X) ⎪o für x ∉ D(X) ⎩ Prof. Mohr / Dr. Ricabal 0 1 3 2 Zufallsvariablen x 11 Beispiel: Verteilungsfunktion der geometrischen Verteilung Ein Würfel wird solange geworfen, bis zum ersten Mal eine 6 erscheint. X bezeichnet die Anzahl der Misserfolge (vor der ersten 6). Es gilt: ⎧⎛ 5 ⎞ x 1 ⎪ f ( x ) = ⎨⎜⎝ 6 ⎟⎠ ⋅ 6 ⎪0 ⎩ für x = 0, 1, 2, L x 0 fX(x) 0,17 … … sonst FX(x) Für die Verteilungsfunktion gilt: x x<0 0≤x<1 1≤x<2 2≤x<3 3≤x<4 FX(x) 0 0,17 0,31 0,45 0,55 1 … … Diese ist eine spezielle diskrete Verteilung und heißt geometrische Verteilung, denn die f(x) bildet eine geometrische Folge. Prof. Mohr / Dr. Ricabal 1 2 3 0,14 0,12 0,10 Zufallsvariablen 0,75 0,50 0,25 0 1 3 2 12 x Stetige Zufallsvariablen Eine Zufallsvariable X heißt stetig, wenn die Menge aller möglichen Werte der Zufallsvariable eine Menge bilden, die überabzählbar viele Werte enthält. D. h. die Menge der möglichen Werte besteht aus einem Intervall reeller Zahlen oder aus allen reellen Zahlen. Die Verteilungsfunktion lässt sich wie folgt darstellen: x FX ( x ) = W (X ≤ x ) = ∫ f X (u )du fX(x) heißt Dichtefunktion. −∞ f X (x) = d FX ( x ) dx für alle Differenzierbarkeitsstellen von FX(x) b ∞ f X ( x ) ≥ 0 und ∫f X ( x )dx = 1 −∞ W (a < X ≤ b) = FX (b) − FX (a ) = ∫ f ( x )dx a Es gilt i. a. nicht, dass f(x) ≤ 1 ist. Ferner lassen sich die Werte von f(x) nicht als Wahrscheinlichkeiten interpretieren. Prof. Mohr / Dr. Ricabal Zufallsvariablen 13 Beispiel: Stetige Zufallsvariablen Sei X eine Zufallsvariable mit folgender Dichtefunktion x für x < 0 ⎧0 ⎪1 2 f X ( x ) = ⎨ ( x − 3) 0 ≤ x ≤ 3 ⎪9 für x > 3 ⎩0 1 0,75 F( x ) = ∫ f (u )du −∞ 0 0 x 3 für 0 ≤ x ≤ 3 ∞ 1 F( x ) = ∫ 0du + ∫ ( u − 3) 2 du + ∫ 0du = 1 für x > 3 9 0 0 −∞ fX(x) 0,25 1 −∞ x 1 1 F( x ) = ∫ 0du + ∫ ( u − 3) 2 du = ( x − 3) 3 9 27 0 0 −∞ 0,50 0 x F( x ) = ∫ 0du = 0 für x < 0 2 F(0) = −1 + 1 = 0; F(1) = − Prof. Mohr / Dr. Ricabal 3 x für x < 0 ⎧0 ⎪1 3 F( x ) = ⎨ ( x − 3) + 1 0 ≤ x ≤ 3 ⎪ 27 für x > 3 ⎩1 8 19 1 26 +1 = ≈ 0,70; F(2) = − + 1 = ≈ 0,96; F(3) = 0 + 1 = 1 27 27 27 27 Zufallsvariablen 14 Spezielle Maßzahlen für eindimensionale Zufallsvariablen Symmetriestelle: xsym heißt Symmetriestelle von f(x), wenn gilt: f(xsym - h) = f(xsym + h) Modus: xmod heißt Modus von f(x), wenn in xmod ein relatives Maximum von f(x) liegt. Quantil bzw. Perzentil: xα heißt Quantil zum Niveau α mit (0< α<1), wenn gilt: F(xα) = α im stetigen Fall xα = min{x∊D(X)|F(x) ≥ α } im diskreten Fall Für = 0,5; 0,25 und 0,75 erhält man Median, unteres (erstes) bzw. oberes (drittes) Quartil Prof. Mohr / Dr. Ricabal Zufallsvariablen 15 Beispiel: Spezielle Maßzahlen für eindimensionale Zufallsvariablen X: Die Anzahl der Ausprägung „Zahl“ bei drei Würfen einer Münze. x 0 fX(x) = W(X = x) 1/8 1 3/8 2 3/8 Symmetriestelle: xsym= 1,5 Modus: xmod = 1 bzw. 2 Median: x0,50 = 1 3 1/8 fX(x) 1/2 3/8 1/4 1/8 FX(x) 0 1 2 3 x x x<0 0≤x<1 1≤x<2 2≤x<3 FX(x) 0 0,125 0,5 0,875 1/2 0 1 1 2 Prof. Mohr / Dr. Ricabal 3 x Erstes Quartil: x0,25= 1 Drittes Quartil: x0,75 = 2 0,95-Quantil: x0,95 = 3 Zufallsvariablen 16 3≤x 1 Beispiel: Spezielle Maßzahlen für eindimensionale Zufallsvariablen Ein Würfel wird solange geworfen, bis zum ersten Mal eine 6 erscheint. X bezeichnet die Anzahl der Misserfolge (vor der ersten 6). x 0 fX(x) 0,17 1 2 3 0,14 0,12 0,10 fX(x) … … x x<0 0≤x<1 1≤x<2 2≤x<3 3≤x<4 FX(x) 0 0,17 0,31 0,42 0,52 FX(x) 0,20 1 0,15 0,75 0,10 0,50 0,05 0,25 0 1 2 3 x 0 Keine Symmetriestelle Modus: xmod = 0 Median: x0,50 = 3 Prof. Mohr / Dr. Ricabal 1 3 2 … … x Erstes Quartil: x0,25= 1 Drittes Quartil: x0,75 = 7 0,95-Quantil: x0,95 = 16 Zufallsvariablen 17 Beispiel: Spezielle Maßzahlen für eindimensionale Zufallsvariablen Sei X eine Zufallsvariable mit folgender Dichtefunktion für x < 0 ⎧0 ⎪1 2 f ( x ) = ⎨ ( x − 3) 0 ≤ x ≤ 3 ⎪9 für x > 3 ⎩0 für x < 0 ⎧ 0 ⎪1 3 F( x ) = ⎨ ( x − 3) + 1 0 ≤ x ≤ 3 ⎪ 27 für x > 3 ⎩ 1 Keine Symmetriestelle Modus: xmod = 0 Median: x0,50 = 0,62 Prof. Mohr / Dr. Ricabal 1 0,75 fX(x) 0,50 0,25 0 F( x 0,5 ) = 0,5 ⇔ 1 2 3 x 1 ( x 0,5 − 3) 3 + 1 = 0,5 27 1 ( x 0,5 − 3)3 = 0,5 − 1 ⇔ ( x 0,5 − 3) 3 = −0,5 ⋅ 27 27 ( x 0,5 − 3) = 3 − 0,5 ⋅ 27 ⇔ x 0,5 ≈ 0,62 Zufallsvariablen 18 Die wichtigsten Verteilungsmaßzahlen Erwartungswert: ⎧ ⎪∑ x ⋅ f X ( x ) im diskreten Fall ⎪ µ = E ( X ) = ⎨ ∀∞x ⎪ x ⋅ f X ( x )dx im stetigen Fall ∫ ⎩⎪ − ∞ Interpretation! Varianz: ⎧ 2 ⎪∑ ( x − µ) ⋅ f X ( x ) im diskreten Fall ⎪ σ 2 = Var (X ) = E ( x − µ) 2 = ⎨ ∀∞x ⎪ ( x − µ) 2 ⋅ f X ( x ) im stetigen Fall ⎪⎩ −∫∞ Standardabweichung: Bemerkung: Nicht für alle Zufallsvariablen existieren die jeweiligen Maßzahlen. σ = Var(X) = σ 2 Prof. Mohr / Dr. Ricabal Zufallsvariablen 19 Rechenregel zu den Verteilungsmaßzahlen Wie im Rahmen der deskriptiven Statistik gelten für lineare Transformationen: E (a + b ⋅ X ) = a + b ⋅ E ( X ) Var (a + b ⋅ X) = b 2 ⋅ Var (X) Var (X) = E (X ) − [E (X)] 2 2 Die letzte Formel kann bei der Berechnung der Varianz einfacher durchzuführen sein mit ⎧ 2 ⎪∑ x ⋅ f X ( x ) ⎪ E (X 2 ) = ⎨ ∀∞x ⎪ x 2 ⋅ f X ( x )dx ⎪⎩ −∫∞ Prof. Mohr / Dr. Ricabal im diskreten Fall im stetigen Fall Zufallsvariablen 20 Beispiel: Erwartungswert und Varianz im diskreten Fall Sei X die Anzahl der Ausprägung „Zahl“ bei drei Würfen einer Münze x 0 fX(x) = W(X = x) 1/8 1 3/8 2 3/8 3 1/8 1 3 3 1 12 3 µ = E(X) = ∑ x ⋅ f X ( x ) = 0 ⋅ + 1⋅ + 2 ⋅ + 3 ⋅ = = = 1,5 8 8 8 8 8 2 ∀x 2 ⎛ 3 ⎞ 12 9 3 Var(X) = E(X ) − [E(X)] = 3 − ⎜ ⎟ = − = = 0,75 4 4 4 ⎝2⎠ 1 3 3 1 E (X 2 ) = ∑ x 2 ⋅ f X ( x ) = 0 2 ⋅ + 12 ⋅ + 2 2 ⋅ + 32 ⋅ 8 8 8 8 ∀x 1 3 3 1 24 = 0 ⋅ + 1⋅ + 4 ⋅ + 9 ⋅ = =3 Interpretation? 8 8 8 8 8 2 2 Prof. Mohr / Dr. Ricabal Zufallsvariablen 21 Beispiel: Erwartungswert und Varianz im stetigen Fall Sei X eine Zufallsvariable mit folgender Dichtefunktion ∞ E (X ) = ∫ x ⋅f X ( x )dx −∞ ⎧1 ⎪⎪ ⋅ x für 1 ≤ x ≤ 3 f (x) = ⎨ 4 ⎪ sonst ⎩⎪0 1 3 3 ∞ = 1 1 x3 ∫−∞x ⋅ 0 dx + ∫1 x ⋅ 4 ⋅ x dx + ∫3 x ⋅ 0 dx = 4 ⋅ 3 1 = 27 1 26 13 − = = = 2,167 * 12 12 12 6 169 180 − 169 11 ⎛ 13 ⎞ 2 Var (X ) = E(X 2 ) − [E (X)] = 5 − ⎜ ⎟ = 5 − = = ≈ 0,306 * 36 36 36 ⎝6⎠ 2 ∞ E(X 2 ) = 2 ∫ x ⋅ f X (x )dx = −∞ 1 3 1 1 = ⋅ (34 − 14 ) = ⋅ 80 = 5 16 16 Prof. Mohr / Dr. Ricabal ∞ 1 x4 2 2 1 2 x ⋅ 0 dx + x ⋅ ⋅ x dx + x ⋅ 0 dx = ⋅ ∫ ∫1 4 ∫3 4 4 −∞ 3 1 *Interpretation? Zufallsvariablen 22 Zentrierung Sei X eine Zufallsvariable mit dem Erwartungswert µ und die Varianz σ2. Die spezielle lineare Transformation Y = X −µ bezeichnet man als Zentrierung. Für die neue Zufallsvariable Y gilt: E(Y) = E(X – µ) = E(X) - µ = µ - µ = 0 Var(Y) = Var (X – µ) = Var (X) = σ2 Durch die Zentrierung ereicht man eine Verschiebung der Lage der Verteilung auf der Ursprung. Die Varianz bleibt aber gleich. Prof. Mohr / Dr. Ricabal Zufallsvariablen 23 Normierung Sei X eine Zufallsvariable mit dem Erwartungswert µ und die Varianz σ2. Die spezielle lineare Transformation Y= X σ bezeichnet man als Normierung. Für die neue Zufallsvariable Y gilt: X 1 1 µ E(Y) = E( ) = E(X) = ⋅ µ = σ σ σ σ X 1 1 Var (Y) = Var ( ) = 2 Var (X) = 2 ⋅ σ 2 = 1 σ σ σ Durch diese Transformation erreicht man eine neue dimensionslose Zufallsvariable mit Varianz gleich Einz. Prof. Mohr / Dr. Ricabal Zufallsvariablen 24 Standardisierung Sei X eine Zufallsvariable mit dem Erwartungswert µ und die Varianz σ2. Die spezielle lineare Transformation Z= X −µ σ bezeichnet man als Standardisierung bzw. Z-Transformation. Für die neue Zufallsvariable Z gilt: X −µ 1 ) = E ( X − µ) = 0 σ σ X −µ 1 1 Var ( Z) = Var ( ) = 2 Var (X − µ) = 2 ⋅ σ 2 = 1 σ σ σ E ( Z) = E ( Die Standardisierung wird für die wichtigste stetige Zufallsvariable, die Normalverteilung, und für viele statistische Verfahren eingesetzt. Prof. Mohr / Dr. Ricabal Zufallsvariablen 25 Schwankungsintervall Wenn die Realisationen x der Zufallsvariablen X in einen Intervall (a, b) mit a < b liegen, spricht man von einen Schwankungsintervall (d. h. {x | a < x < b). Ein k-faches zentrales Schwankungsintervall ist gegeben durch a = µ – kσ und b = µ + kσ, d. h. {x | µ – kσ < x < µ + kσ} Ist die Verteilung der Zufallsvariable X bekannt, lässt sich die zugehörige Wahrscheinlichkeit für W(µ – kσ < X < µ + kσ) genau berechnen. Ist die Verteilung unbekannt, dann kann man mittels der Tschebysscheffschen Ungleichung die Wahrscheinlichkeit abschätzen. W (µ – kσ < X < µ + kσ) ≥ 1 Prof. Mohr / Dr. Ricabal 1 k2 µ-kσ Zufallsvariablen µ µ+kσ 26 Beispiel: Schwankungsintervall Es wird die Wahrscheinlichkeit einer Standardnormalverteilung im einfachen, 2-fachen und 3-fachen zentralen Schwankungsintervall abgeschätzt. Es ist bekannt, dass E(Z) = 0 und Var(Z) = 1 sind. Dann gilt: W (0 – 1⋅1 < Z < 0 + 1.1) ≥ 1 W (0 – 2 ⋅1 < Z < 0 + 2.1) ≥ 1 W (0 – 3 ⋅1 < Z < 0 + 3.1) ≥ 1 - 1 =0 12 1 3 = = 0,75 22 4 1 8 = = 0,8889 32 9 Exakte Wahrscheinlichkeiten durch die Nutzung der bekannten Verteilungsfunktion. W (0 – 1 ⋅1 < Z < 0 + 1.1) = 0,6827 Es sind echt grobe Schätzungen! W (0 – 3 ⋅1 < Z < 0 + 3.1) = 0,9973 W (0 – 2 ⋅1 < Z < 0 + 2.1) = 0,9545 Prof. Mohr / Dr. Ricabal Zufallsvariablen 27 Drei Sigma Regel. Grafische Darstellung W(µ - σ < X < µ + σ) = W(-1 ≤ Z ≤ 1) = 0,6827 W(µ – 2·σ < X < µ + 2·σ) = W(-2 ≤ Z ≤ 2) = 0,9545 -4 -2 0 68,27 % 2 4 x W(µ – 3·σ < X <µ + 3·σ) = W(-3 ≤ Z ≤ 3) = 0,9973 94,45 % 99,73 % Prof. Mohr / Dr. Ricabal Zufallsvariablen 28