Diskrete Zufallsvariablen Erste Beispiele diskreter Verteilungen Bernoulli-Verteilung Eine diskrete Zufallsvariable X heißt bernoulliverteilt mit Parameter p, falls sie die Wahrscheinlichkeitsfunktion x = 1, p, f ( x ) = P( X = x ) = 1 − p, x = 0, 0, sonst besitzt. Bedeutung? Beispiel? Bemerkung Bei einem Zufallsvorgang oft von Interesse ob ein Ereignis A eintritt oder nicht Kodierung durch „Bernoulli-Variable“ Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 407 Diskrete Zufallsvariablen Diskrete Gleichverteilung Eine diskrete Zufallsvariable X heißt gleichverteilt auf dem Träger T = { a1 , a2 , K, ak } , falls sie die Wahrscheinlichkeitsfunktion f ( x ) = P (X = a j ) = besitzt. Bedeutung? 1 , j = 1, K , k k Beispiel? Geometrische Verteilung Eine diskrete Zufallsvariable X heißt geometrisch verteilt mit Parameter p, kurz X ~ G(p), falls sie die Wahrscheinlichkeitsfunktion (1 − p )x −1 p, x = 1, 2, K , f (x ) = P( X = x ) = 0, sonst besitzt. Wie lautet die Summe aller Wahrscheinlichkeiten? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 408 Diskrete Zufallsvariablen Modell der geometrischen Verteilung Bei einem Zufallsvorgang sei nur von Interesse, ob ein bestimmtes Ereignis A eintritt oder nicht, wobei P(A) = p mit 0 < p < 1. Der Zufallsvorgang wird nun unabhängig voneinander so oft wiederholt, bis zum ersten Mal A eintritt. Definiere Zufallsvariable X = „Anzahl der Versuche bis zum ersten Mal A eintritt“ ! Gelegentlich auch alternative Definition: X = „Anzahl der Fehlerversuche bis zum ersten Mal A eintritt“ P( X = 1) = P( A1 ) = p, Warum geht das? P( X = 2 ) = P (A1 ∩ A2 ) = P (A ) P( A) = (1 − P ( A)) P ( A) = (1 − p ) p, P( X = 3) = P (A1 ∩ A2 ∩ A3 ) = P (A ) P (A ) P( A) = (1 − P ( A)) P ( A) = (1 − p ) p, 2 2 M k −1 P( X = k ) = P (A1 ∩ K ∩ Ak −1 ∩ Ak ) = P (A )⋅ K ⋅ P (A ) P ( A) = (1 − p ) p. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 409 Diskrete Zufallsvariablen Geometrische Verteilung mit p =0.1 Geometrische Verteilung mit p =0.5 Träger? Anwendungsmöglichkeiten: Lebensdauer- und Wartezeitmodelle Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 410 Diskrete Zufallsvariablen Unabhängigkeit von diskreten Zufallsvariablen Zur Erinnerung: Postulat der empirischen Unabhängigkeit zweier Merkmale (vgl. S. 214): fij f i• = f• j fij = f• j fi• für i = 1, ..., k und j = 1, ..., l Übertragung auf Zufallsvariablen Unabhängigkeit von zwei diskreten Zufallsvariablen Zwei diskrete Zufallsvariablen X und Y mit Trägern TX = { a1 , a2 ,K, ak ,K} und TY = { b1 , b2 ,K, bl ,K} heißen unabhängig, falls für beliebige x ∈ TX und y ∈ TY P( X = x, Y = y ) = P( X = x ) P(Y = y ) gilt. Analogie zur Unabhängigkeit von zwei Ereignissen? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 411 Diskrete Zufallsvariablen Bemerkung: Sind zwei Zufallsvariablen X und Y gemäß dieser Definition unabhängig, so folgt sogar allgemeiner die Unabhängigkeit von zwei Ereignissen der Form {X ∈A} und { Y ∈ B }, wobei A und B zulässige Bereiche auf der Menge der reellen Zahlen sind (vgl. S. 399). Beispiel: Zweimaliger Würfelwurf X = „Augenzahl im ersten Wurf“, Y = „Augenzahl im zweiten Wurf“ Klar: P( X = 1, Y = 2) = P( X = 1) P(Y = 2) = 1 / 6 ×1 / 6 = 1 / 36. Es gilt aber auch P( X ≤ 2, Y = 1) = P( X ≤ 2) P(Y = 1) = 1 / 3 ×1 / 6 = 1 / 18, da P( X ≤ 2, Y = 1) = P( X = 1, Y = 1) + P( X = 2, Y = 1) = P( X = 1) P(Y = 1) + P( X = 2) P(Y = 1) = [P( X = 1) + P( X = 2)] P(Y = 1) = P( X ≤ 2) P(Y = 1) . Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 412 Diskrete Zufallsvariablen Unabhängigkeit von mehreren diskreten Zufallsvariablen Die diskreten Zufallsvariablen X1, X2, ..., Xn heißen unabhängig, falls für beliebige Werte x1, x2, ..., xn aus den jeweiligen Trägern P( X 1 = x1 , X 2 = x2 ,K, X n = xn ) = P( X 1 = x1 ) P( X 2 = x2 ) ⋅K⋅ P( X n = xn ) gilt. Analogie zur Unabhängigkeit von mehreren Ereignissen? Bemerkung: Beachte: Aus der Unabhängigkeit gemäß dieser Definition lässt sich wiederum die Unabhängigkeit von mehreren Ereignissen ableiten. Beispiel: Dreimaliger Würfelwurf Xi = „Augenzahl im i-ten Wurf“, i = 1, 2, 3. Dann gilt z.B.: P( X 1 ≤ 2, X 2 = 1) = P( X 1 ≤ 2) P( X 2 = 1) = 1 / 3 ×1 / 6 = 1 / 18, da Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 413 Diskrete Zufallsvariablen 6 6 i =1 i =1 P( X 1 ≤ 2, X 2 = 1) = ∑ P( X 1 = 1, X 2 = 1, X 3 = i ) + ∑ P( X 1 = 2, X 2 = 1, X 3 = i ) 6 6 i =1 i =1 = ∑ P( X 1 = 1)P( X 2 = 1)P( X 3 = i ) + ∑ P( X 1 = 2)P( X 2 = 1)P( X 3 = i ) 6 6 i =1 i =1 = P( X 1 = 1)P( X 2 = 1)∑ P( X 3 = i ) + P( X1 = 2)P( X 2 = 1)∑ P( X 3 = i ) = P( X 1 = 1) P( X 2 = 1) + P( X 1 = 2) P( X 2 = 1) = [P( X1 = 1) + P( X1 = 2)]P( X 2 = 1) = P( X 1 ≤ 2) P( X 2 = 1) . „Unabhängige Zufallsvariablen erzeugen unabhängige Ereignisse“. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 414 Diskrete Zufallsvariablen Berechnung von Lageparametern Berechnung von Erwartungswerten Erwartungswert einer diskreten Zufallsvariablen Der Erwartungswert E ( X ) einer diskreten Zufallsvariable X ist gegeben durch E ( X ) = a1 p1 + K + ak pk + K = ∑ a j p j = ∑ a j P(X = a j ) = ∑ a j f (a j ). j ≥1 j ≥1 j ≥1 Anstelle von E ( X ) wird auch häufig das Symbol µ X oder einfach µ verwendet. Analogie in deskriptiver Statistik? Interpretation? ! Erwartungswert kann bereits vor Ablauf des Zufallsvorgangs berechnet werden. Die Berechnung beruht also nicht auf vorliegenden Daten! Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen ! 415 Wie ist der Erwartungswert zu interpretieren? 416 Was unterscheidet arithmetisches Mittel und Erwartungswert? 417 Diskrete Zufallsvariablen Beispiel: Würfelwurf Sei X = „Augenzahl“ beim einmaligen Würfelwurf. 1 1 1 1 1 1 E( X ) = a1 p1 + K + a6 p6 = 1⋅ + 2 ⋅ + 3 ⋅ + 4 ⋅ + 5 ⋅ + 6 ⋅ = 3.5 6 6 6 6 6 6 Angenommen, ein Würfel werde fünfmal unabhängig voneinander geworfen. Sei nun X i die Augenzahl beim i-ten Würfelwurf für i = 1, ..., 5. Dann sind die Zufallsvariablen X 1 , X 2 ,K, X 5 stochastisch unabhängig und identisch verteilt wie X. Lauten die Ergebnisse der Zufallsexperimente (Realisationen) x1 = 4, x2 = 3, x3 = 1, x4 = 3, x5 = 6, so ergibt sich für das arithmetische Mittel der Realisationen (Beobachtungswerte) 1 5 x = ∑ xi = 3.2. n i =1 Was ist bei einer 1000-maligen Wiederholung des Experiments zu erwarten? ! Beachte: Zufallsvariablen werden i.d.R. groß, Realisationen klein geschrieben. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 418 Diskrete Zufallsvariablen Transformationsregel für Erwartungswerte Sei X eine diskrete Zufallsvariable und g(x) eine reelle Funktion. Dann gilt für Y = g(X): E(Y ) = E (g ( X )) = ∑ g (a j ) p j = ∑ g (a j ) f (a j ). j ≥1 Beispiel: j ≥1 Sei X = „Augenzahl“ beim einmaligen Würfelwurf ( )= ∑ j 6 EX 2 j =1 2 1 1 1 1 1 1 1 ⋅ = 12 ⋅ + 22 ⋅ + 32 ⋅ + 42 ⋅ + 52 ⋅ + 66 ⋅ = 15.167 6 6 6 6 6 6 6 Erwartungswert bei Lineartransformation Sei X eine diskrete Zufallsvariable. Dann gilt für Y = a + bX: E (Y ) = a + b E ( X ) . Analogie in deskriptiver Statistik? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 419 Diskrete Zufallsvariablen Beachte: E (Y ) = ∑ b j p j = ∑ (a + ba j ) p j = ∑ ap j + b∑ a j p j j j j j = a∑ p j + bE( X ) = a + bE( X ) j für b j = a + ba j . Erwartungswert der Summe von Zufallsvariablen Für zwei diskrete Zufallsvariablen X und Y gilt: E( X + Y ) = E( X ) + E (Y ) . Für n diskrete Zufallsvariablen X 1 , X 2 ,K, X n und n Konstanten c1 , c2 ,K, cn gilt: E(c1 X1 + c2 X 2 + K + cn X n ) = c1E( X1 ) + c2 E( X 2 ) + K + cn E( X n ) . Ohne formalen Beweis Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 420 Diskrete Zufallsvariablen Produktregel für unabhängige Zufallsvariablen Für zwei unabhängige(!) diskrete Zufallsvariablen X und Y gilt: E( X ⋅ Y ) = E( X ) E(Y ) . Ohne formalen Beweis Beispiel: Beim zweimaligen Würfeln gilt für das Produkt der Augenzahl X und Y E( X ⋅Y ) = 3.5 ⋅ 3.5 = 12.25 . Wie würden Sie ohne Produktregel E( X ⋅ Y ) berechnen? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 421 Diskrete Zufallsvariablen Berechnung von Quantilen Quantile und Median einer diskreten Zufallsvariable Sei X eine diskrete Zufallsvariable mit Verteilungsfunktion F(x). Dann heißt qα mit 0 < α < 1 α-Quantil von X, falls F (qα ) = P( X ≤ qα ) ≥ α und F (qα − ε ) < α für ε > 0 . Interpretation? Analogie in deskriptiver Statistik? Für α = 0.5 heißt q0.5 Median. Beispiel: Einmaliger Würfelwurf aj 1 f (a j ) 1/6 F (a j ) 1/6 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 2/6 3/6 4/6 5/6 1 Fortsetzung auf Folgeseite ... Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 422 Diskrete Zufallsvariablen Übung: Zeichnen Sie die Verteilungsfunktion der diskreten Zufallsvariablen X, wobei X = „Augensumme beim einmaligen Würfelwurf“. Bestimmen Sie anschließend das 0.25-, das 0.5- und das 0.75-Quantil von X. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 423 Diskrete Zufallsvariablen Aufgabe 48 Gegeben sei die Situation des viermaligen Münzwurfs (vgl. S. 395 und 405). Die Zufallsvariable X gebe die Anzahl von „Zahl“ an. R F Der Erwartungswert von X ist gleich 2. Der Median von X ist gleich 2.5. Das 0.25-Quantil ist gleich 1.5. Das 0.75-Quantil ist gleich 3. Der Erwartungswert von X3 ist gleich 8. Der Erwartungswert von Y mit Y = 2X2 - 8 ist gleich 0. Würde die Münze 5 mal geworfen, so wäre der Erwartungswert für die Anzahl von „Zahl“ gleich 2.5. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 424 Diskrete Zufallsvariablen Berechnung von Streuungsparametern Varianz und Standardabweichung einer diskreten Zufallsvariable Die Varianz Var( X ) einer diskreten Zufallsvariable X ist gegeben durch ( ) ( ) Var( X ) = E ( X − µ ) = E X 2 − µ 2 2 = ∑ (a j − µ ) f (a j ) 2 j ≥1 2 = ∑ a 2j f (a j ) − ∑ a j f (a j ) . j ≥1 j ≥1 Anstelle von Var( X ) wird auch häufig das Symbol σ X2 oder einfach σ 2 verwendet. Die Standardabweichung ist σ = σ 2 = Var( X ) . Analogie in deskriptiver Statistik? Interpretation? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 425 Diskrete Zufallsvariablen Beachte: ( ) ( E ( X − µ ) = E X 2 − 2 Xµ + µ 2 2 ( ) = E ( X ) − 2µ = E (X ) − µ ) ( ) = E X 2 − 2µ E ( X ) + E µ 2 2 2 2 + µ2 2 Die anderen Gleichungen in der Definition folgen aus den Rechenregeln für Erwartungswerte. Beispiel: Würfelwurf Sei X = „Augenzahl“ beim einmaligen Würfelwurf. ( ) Var( X ) = E X 2 − µ 2 1 1 1 1 1 1 = 12 ⋅ + 22 ⋅ + 32 ⋅ + 42 ⋅ + 52 ⋅ + 62 ⋅ − 3.52 6 6 6 6 6 6 = 15.167 − 12.25 = 2.917 Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 426 Diskrete Zufallsvariablen Angenommen, ein Würfel werde fünfmal unabhängig voneinander geworfen. Sei nun X i die Augenzahl beim i-ten Würfelwurf für i = 1, ..., 5. Dann sind die Zufallsvariablen X 1 , X 2 ,K, X 5 stochastisch unabhängig und identisch verteilt wie X. Lauten die Ergebnisse der Zufallsexperimente (Realisationen) x1 = 4, x2 = 3, x3 = 1, x4 = 3, x5 = 6, so ergibt sich für die (empirische) Varianz der Realisationen (Beobachtungswerte) 1 5 1 5 2 2 2 s = ∑ (xi − x ) = ∑ xi − x 2 = 14.2 − 3.22 = 3.96 . n i =1 n i =1 Was ist bei einer 1000-maligen Wiederholung des Experiments zu erwarten? Weitaus schwierigere Frage: Angenommen, der fünfmalige Würfelwurf werde 1000 mal wiederholt und jedes mal die empirische Varianz berechnet. Würde das arithmetische Mittel der einzelnen Varianzen dann der Varianz von X (nahezu) entsprechen? Problemfeld der schließenden Statistik: „Erwartungstreue Schätzung“ der Parameter von Verteilungen durch endliche Stichproben. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 427 Diskrete Zufallsvariablen Varianz bei Lineartransformation Sei X eine diskrete Zufallsvariable. Dann gilt für Y = a + bX: Var(Y ) = b 2Var( X ) und σ Y = b σ X . Analogie in deskriptiver Statistik? ( ) ( Beweis: Var(Y ) = σ Y2 = Var(a + bX ) = E (a + bX − E (a + bX )) = E (a + bX − a − bµ ) ( ) ( 2 ) = E b 2 ( X − µ ) = b 2 E ( X − µ ) = b 2Var( X ) = b 2σ X2 2 2 2 ) Varianz der Summe von unabhängigen Zufallsvariablen Für unabhängige diskrete Zufallsvariablen X und Y bzw. X 1 , X 2 ,K, X n gilt: Var( X + Y ) = Var( X ) + Var(Y ) und mit beliebigen Konstanten c1 , c2 ,K, cn Var(c1 X 1 + c2 X 2 + K + cn X n ) = c12Var( X 1 ) + c22Var( X 2 ) + K + cn2Var( X n ) . Ohne formalen Beweis Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 428 Diskrete Zufallsvariablen Übung: Berechnen Sie die Varianz für X, falls X einer Bernoulli-Verteilung genügt. Wahrscheinlichkeitsfunktion der Bernoulli-Verteilung x = 1, p, f ( x ) = P( X = x ) = 1 − p, x = 0, 0, sonst Var ( X ) = Für welchen Wert von p ist die Varianz von X maximal? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 429 Diskrete Zufallsvariablen Aufgabe 49 Gegeben sei eine diskrete Zufallsvariable X. Dann gilt stets: R F Var ( X ) = 0, falls E ( X ) = 0, ( ) E X 2 ≥ (E ( X )) = µ X2 , 2 Var ( X + a ) = Var ( X ) für jede beliebige Konstante a, Var (− X ) = − Var ( X ) . Aufgabe 50 Gegeben sei die Situation des viermaligen Münzwurfs (vgl. S. 395 und 405). Die Zufallsvariable X gebe die Anzahl von „Zahl“ an. R F Die Varianz von X ist gleich 2. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 430 Diskrete Zufallsvariablen Aufgabe 51 Für zwei unabhängige diskrete Zufallsvariablen X und Y gilt stets: R F Var ( X − Y ) = Var ( X + Y ) , Var ( X − Y ) = Var ( X ) − Var (Y ) , Var (2 X + 2Y ) = 4 Var ( X + Y ) . Aufgabe 52 Seien X 1 , X 2 ,K, X n stochastisch unabhängig und identisch verteilt mit E ( X i ) = µ und Var ( X i ) = σ 2 für i = 1, ..., n. Dann gilt: R F 1 n E ∑ X i = µ n i =1 1 n σ2 Var ∑ X i = n i =1 n Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 431 Diskrete Zufallsvariablen Spezielle diskrete Verteilungsmodelle Ziel: Lösung bestimmter Problemstellungen durch parametrische Verteilungen. Parametrische Verteilung: Wahrscheinlichkeitsfunktion wird durch einen oder mehrere Parameter bestimmt, z.B. Bernoulli-Verteilung und Geometrische Verteilung (jeweils einparametrige Verteilungen mit Parameter p) Binomialverteilung Urnenmodell: Aus einer Urne mit N Kugeln, darunter M schwarze und N-M weiße Kugeln, werden n Kugeln mit Zurücklegen gezogen. Die Zufallsvariable X gebe gerade die Anzahl der schwarzen Kugeln in der Stichprobe an. Wie sieht die Verteilung von X aus? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 432 Diskrete Zufallsvariablen Realisation könnte z.B. so aussehen: x=2 Wie groß ist die Wahrscheinlichkeit für dieses Ergebnis? Wahrscheinlichkeit für Ereignis A = „schwarze Kugel“ ist bei jedem Zug p = M/N = 1/3. Die Wahrscheinlichkeit für dieses spezielle Ergebnis errechnet sich dann durch 1 1 1 1 4 P ( A ∩ A ∩ A ∩ A ) = P ( A) P ( A ) P ( A ) P ( A ) = ⋅ 1 − ⋅ ⋅ 1 − = . 3 3 3 3 81 Allerdings folgt daraus nicht P( X = 2) = 4 / 81 , da z.B. auch das Ergebnis {X =2} A ∩ A ∩ A ∩ A das Ereignis impliziert. 4 Nach kombinatorischen Überlegungen (vgl. S. 363) gibt es hier genau = 6 2 mögliche Ergebnisse (Elementarereignisse) , die das Ereignis { X = 2 } implizieren. Damit gilt: 4 1 P( X = 2) = ⋅ 2 3 2 2 4 24 1 ⋅ 1 − = 6 ⋅ = = 0.2963 . 81 81 3 Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 433 Diskrete Zufallsvariablen Binomialverteilung Eine Zufallsvariable X heißt binomialverteilt mit den Parametern n und p, kurz X ~ B(n, p), wenn sie die Wahrscheinlichkeitsfunktion f (x ) = n x p (1 − p )n− x , x = 0, 1, K, n x Bedeutung? 0, sonst besitzt. Die Verteilung heißt Binomialverteilung oder kurz B(n, p)-Verteilung. Binomialverteilung und Bernoulli-Verteilung Die B(1, p)-Verteilung entspricht gerade einer Bernoulli-Verteilung mit Parameter p. Sind X 1 , X 2 ,K, X n stochastisch unabhängig B(1, p)-verteilt, so ist die Summe n X = ∑ Xi B(n, p)-verteilt. i =1 Damit folgt unmittelbar: Sind X ~ B(n, p) und Y ~ B(m, p) unabhängig, so ist X + Y ~ B (n+ m, p). Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 434 Diskrete Zufallsvariablen Betrachte nochmals das vorige Urnenmodell. Das Ereignis A = „schwarze Kugel“ wird nun mit der Zahl 1 kodiert und das Gegenereignis mit 0. Dann ist X bernoulliverteilt mit Parameter p = 1/3, falls nur einmal gezogen wird. Da nun aber n mal unabhängig (mit Zurücklegen) gezogen wird, entspricht X gerade der Summe von n unabhängigen Bernoulli-Variablen. x1=0 x2=1 x3=0 x4=1 x = x1 + x2 + x3 + x4 = 2 Erwartungswert und Varianz der Binomialverteilung a) Falls X ~ B(1, p)-verteilt, so gilt: E ( X ) = p, Var ( X ) = p (1 − p ) . b) Falls X ~ B(n, p)-verteilt, so gilt: E( X ) = n p, Var ( X ) = n p (1 − p ) . Beweis von a) ist klar (vgl. auch Übung S. 429). Teil b) folgt aus dem Zusammenhang von Binomial- und Bernoulli-Verteilung. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 435 Diskrete Zufallsvariablen Beispiele :Wahrscheinlichkeitsfunktionen der Binomialverteilung für n = 10 Schief oder symmetrisch? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 436 Diskrete Zufallsvariablen Beispiele :Wahrscheinlichkeitsfunktionen der Binomialverteilung für p = 0.1 Bedeutung? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 437 Diskrete Zufallsvariablen Hypergeometrische Verteilung Urnenmodell: Aus einer Urne mit N Kugeln, darunter M schwarze und N-M weiße Kugeln, werden n Kugeln ohne Zurücklegen gezogen. Die Zufallsvariable X gebe gerade die Anzahl der schwarzen Kugeln in der Stichprobe an. 4 5 1 2 6 3 Wie sieht die Verteilung von X aus? Realisation könnte z.B. so aussehen: 1 6 3 5 x=2 Wie groß ist die Wahrscheinlichkeit für dieses Ergebnis? Klar: Die Ergebnisse der einzelnen Züge sind nicht mehr unabhängig voneinander. Weshalb? Was passiert, falls n/N (Auswahlsatz) sehr klein ist? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 438 Diskrete Zufallsvariablen Verteilung von X durch rein kombinatorische Überlegungen ermitteln Wir beachten folgende „kombinatorischen Fakten“ für das Ziehen ohne Zurücklegen und ohne Berücksichtigung der Anordnung. 6 1. Es gibt genau = 15 Möglichkeiten, 4 Kugeln aus 6 Kugeln zu ziehen. 4 2 2. Es gibt genau = 1 2 Möglichkeit, aus den 2 schwarzen Kugeln 2 zu ziehen. 4 3. Es gibt genau = 12 Möglichkeiten, aus den 4 weißen Kugeln 2 zu ziehen. 2 Die Wahrscheinlichkeit aus einer Urne mit 4 weißen und 2 schwarzen Kugeln in vier Zügen genau 2 schwarze und 2 weiße Kugeln zu ziehen beträgt damit 2 4 P( X = 2 ) = ⋅ 2 2 6 12 = = 0.75 . 4 15 Weshalb? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 439 Diskrete Zufallsvariablen Hypergeometrische Verteilung Eine Zufallsvariable X heißt hypergeometrisch verteilt mit den Parametern n, M und N, kurz X ~ H(n, M, N), falls sie die Wahrscheinlichkeitsfunktion f (x ) = M N − M x n x − , N n x ∈T 0, sonst Bedeutung? Was soll denn das? besitzt. Dabei ist T durch T = { max(0, n − ( N − M )), K, min (n, M ) } gegeben. Es gilt: E(X ) = n M M , Var ( X ) = n N N M N −n . 1 − N N −1 Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen Interpretation? Beweis? 440 Diskrete Zufallsvariablen Poisson-Verteilung Eine Zufallsvariable X, die zählt, wie oft ein relativ seltenes Ereignis in einem festen, vorgegebenen Zeitintervall auftritt, kann oft als poissonverteilt angenommen werden. Ebenso erhält man die Poisson-Verteilung als Grenzverteilung der B(n, p)-Verteilung, falls p sehr klein und n sehr groß ist (vgl. Seite 443). Poisson-Verteilung Eine Zufallsvariable X heißt poissonverteilt mit Parameter λ > 0, kurz X ~ Po(λ), falls sie die Wahrscheinlichkeitsfunktion λx − λ e , x ∈ { 0, 1, 2, K } f (x ) = x ! 0, sonst Bedeutung? besitzt. Es gilt: E ( X ) = λ , Var ( X ) = λ . Sind X ~ Po(λ1) und Y ~ Po(λ2) unabhängig, so ist X + Y ~ Po (λ1+λ2). Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 441 Diskrete Zufallsvariablen Beispiele :Wahrscheinlichkeitsfunktionen der Poisson-Verteilung Bedeutung? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 442 Diskrete Zufallsvariablen Verteilungskonvergenz der Binomialverteilung gegen die Poisson-Verteilung Sei X binomialverteilt mit Parametern n und p. Für np = λ gilt dann: n x n λ λ λ n− x ( ) ( ) = 1 − 1 − P X = x = p 1− p x x n n n x n −x n ⋅ (n − 1) ⋅K ⋅ (n − x + 1) λx λ λ = ⋅ ⋅ 1 − 1 − . x n x! n n −x n Damit folgt für festes x und festes λ für n → ∞ n−x+ j → 1, n 1 ≤ j ≤ x, λ 1 − → 1 n x Daraus folgt P( X = x ) → Bedeutung? λ −λ 1 − → e . n n und λx x! e −λ für n → ∞ . Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 443 Diskrete Zufallsvariablen Beispiel: Anzahl von Schadensmeldungen bei einer Sachversicherung Die Wahrscheinlichkeit für einen Versicherungsfall eines Versicherungsnehmers bei einer Sachversicherung bezogen auf einen Zeitraum von einem Jahr beträgt p = 0.0001. Angenommen, die Anzahl der Versicherungsnehmer ist n = 10000. Im Falle von mehr als 30 Versicherungsfällen wäre das Versicherungsunternehmen ruiniert. Es interessiert nun die Frage, mit welcher Wahrscheinlichkeit mehr als 30 Versicherungsfälle eintreten. Zur Vereinfachung sei angenommen, dass die einzelnen Versicherungsfälle stets unabhängig voneinander eintreten. Für X = „Anzahl der Versicherungsfälle“ gilt X ~ B(10000, 0.0001). Weshalb? n n− x 1 − P( X ≤ 30) = 1 − ∑ p x (1 − p ) x =0 x 30 Exakte Lösung wäre also: Probleme? Da nun p „klein“ und n „groß“, kann X ~ Po(λ) mit λ = np = 1 angenommen werden. 30 Damit gilt: 1 − P( X ≤ 30 ) ≈ 1 − ∑ x =0 λx x! e −λ 30 1 −1 1 30 1 = 1− ∑ e = 1− ∑ ≈ 0 e x =0 x ! x =0 x ! Wann ist p „klein“ und wann ist n „groß“? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 444 Diskrete Zufallsvariablen Diskrete Verteilungen im Überblick Verteilung Wahrscheinlichkeitsfunktion X ~ B(n, p ) f (x ) = n x p (1 − p )n − x , x = 0, 1, K, n x 0, sonst X ~ H (n, M , N ) f (x ) = M N − M x n− x 0, (n, M, N „sinnvoll“) N , x ∈ T n sonst E(X) Var(X) np np(1 − p ) M N siehe Seite 440 n X ~ Po(λ ) λx − λ f ( x ) = x ! e , x ∈ { 0, 1, 2, K }, 0, sonst λ λ X ~ G (λ ) (1 − p )x −1 p, x = 1, 2, K , f (x ) = 0, sonst 1 p 1− p p2 (λ > 0) Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 445 Diskrete Zufallsvariablen Diskrete Verteilungsmodelle und Approximationsregeln Anzahl des Eintretens von A in n Versuchen (n mal Ziehen) B(n, p) Modell mit Zurücklegen unabhängige Wiederholungen n/N klein p = M/N p klein, n groß np = λ G(p) Anzahl der Versuche bis zum Eintreten von A Po(λ) Anzahl der beobachteten Ereignisse in einem Zeitintervall H(n, M, N) Modell ohne Zurücklegen n/N klein, M/N klein, N groß nM/N = λ Approximationsregeln n/N klein: < 0.05 p bzw. M/N klein: < 0.05 n bzw. N groß: Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen > 30 446 Diskrete Zufallsvariablen Aufgabe 53 Beim Lotto 6 aus 49 (Ziehen ohne Zurücklegen und ohne Berücksichtigung der Anordnung) ist die Wahrscheinlichkeit R F für 6 gerade Zahlen größer als 2%, für mindestens 1 Richtige größer als 50%, für genau 1 Richtige größer als 40%, für mindestens 3 Richtige größer als 2%, Aufgabe 54 Ein Versicherungsvertreter schließt mit 5 Kunden, die alle das gleiche Alter besitzen, Lebensversicherungsverträge ab. Nach der Sterbetafel beträgt die Wahrscheinlichkeit, die nächsten 30 Jahre zu überleben, für jeden Versicherungsnehmer 0.65. Die Wahrscheinlichkeit dafür, dass nach 30 Jahren Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 447 Diskrete Zufallsvariablen R F alle Kunden noch leben, ist größer als 0.1, wenigstens 3 Kunden noch leben, ist größer als 0.8, genau 2 Kunden noch leben, ist kleiner als 0.2, höchstens 1 Kunde noch lebt, ist kleiner als 0.05, Aufgabe 55 Folgende Verteilungsapproximationen sind zulässig: R F H(4, 50, 100)-Verteilung durch B(4, 0.5)-Verteilung, B(0.03, 100)-Verteilung durch Po(3)-Verteilung, H(4, 10, 100)-Verteilung durch Po(0.4)-Verteilung. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen 448