Ausgewählte spezielle Verteilungen In Anwendungen werden oft Zufallsvariablen betrachtet, deren Verteilung einem Standardmodell entspricht. Zu den wichtigsten dieser Modelle gehören: diskrete Verteilungen: I Binomialverteilung I hypergeometrische Verteilung I PoissonVerteilung I geometrische Verteilung stetige Verteilungen: I Normalverteilung I Exponentialverteilung I χ2 , t und F Verteilung verteilungen.pdf, Seite 1 Bemerkung Die in der Praxis betrachteten Wahrscheinlichkeitsverteilungen enthalten in der Regel einen oder mehrere Parameter, deren Wert an die jeweilige Anwendung angepasst werden kann. Diese Parameter werden beispielsweise so gewählt, dass Erwartungswert und/oder Varianz mit beobachteten Daten übereinstimmen. verteilungen.pdf, Seite 2 Ein BernoulliExperiment ist ein Zufallsexperiment mit zwei möglichen Ausgängen Erfolg Ist = 1 und Misserfolg = 0. Erfolgswahrscheinlichkeit einer X (d. h. p = P(X = 1)), P(X = 0) = 1 − p p ∈ (0; 1) die Bernoulliverteilten Zufallsvariable so gilt Für den Erwartungswert erhält man EX = P(X = 1) · 1 + P(X = 0) · 0 = p . Aus X = X2 folgt (da X nur die Werte 0 und 1 annimmt) E (X 2 ) = EX = p . Damit ist die Varianz V (X ) = E (X 2 ) − (EX )2 = p − p 2 = p · (1 − p). verteilungen.pdf, Seite 3 Die Binomialverteilung mit Parametern n∈N und p ∈ (0, 1) erhält man, wenn man n unabhängige BernoulliExperimente mit Erfolgswahrscheinlichkeit X p ausführt. ist dann die Zahl der Erfolge, also X = X1 + X2 + ... + Xn = n X Xi , i=1 X1 , ..., Xn unabhängige Zufallsvariablen P(Xi = 1) = p und P(Xi = 0) = 1 − p . wobei Man schreibt X ∼ Bi(n, p), X ∼ b(n, p) ( X ist binomialverteilt mit Parametern oder n und sind mit X ∼ bn;p p ). verteilungen.pdf, Seite 4 Anwendung/Interpretation X n beschreibt die Zahl der Erfolge in Versuchen, wenn in jedem einzelnen Versuch die Erfolgswahrscheinlichkeit gleich p ist. Beispiele I nfacher p = 0, 5 bei n maligem Münzwurf, I Zahl der Sechsen Würfeln, p= 1 6 I Meinungsumfragen: Zahl der Befragten, die angeben, eine bestimmte Partei zu wählen I Zahl der Patienten, bei denen ein Medikament wirksam ist I Zahl der gebuchten Flugpassagiere, die tatsächlich am Flughafen erscheinen I Qualitätskontrolle: Zahl der entdeckten fehlerhaften Artikel bei einer Stichprobe von n Artikeln verteilungen.pdf, Seite 5 Eigenschaften der Binomialverteilung Aus EXi = p und V (Xi ) = p · (1 − p) folgt EX = EX1 + ... + EXn = n · p und und V (X ) = V (X1 ) + ... + V (Xn ) = n · p · (1 − p) p p V (X ) = np(1 − p). damit σX = Für k = 0, ..., n gilt n P(X = k) = bn;p (k) = · p k · (1 − p)n−k k (Wahrscheinlichkeit für genau k Erfolge bei n Versuchen) Begründung: Es gibt kn Möglichkeiten, die k Erfolge und n − k Misserfolge auf n Versuche zu verteilen. Jede einzelne k n−k dieser Möglichkeiten hat die Wahrscheinlichkeit p · (1 − p) . verteilungen.pdf, Seite 6 Beispiel Wahrscheinlichkeit von zwei Sechsen bei fünfmal Würfeln Es gibt folgende Möglichkeiten: 66XXX 6X 6XX 6XX 6X 6XXX 6 X 66XX X 6X 6X X 6XX 6 XX 66X XX 6X 6 XXX 66 Dabei steht X Wahrscheinlichkeit Wahrscheinlichkeit Wahrscheinlichkeit Wahrscheinlichkeit Wahrscheinlichkeit Wahrscheinlichkeit Wahrscheinlichkeit Wahrscheinlichkeit Wahrscheinlichkeit Wahrscheinlichkeit 1 6 1 6 1 6 1 6 5 6 5 6 5 6 5 6 5 6 5 6 · · · · · · · · · · 1 6 5 6 5 6 5 6 1 6 1 6 1 6 5 6 5 6 5 6 5 · · · · · · · · · · 6 1 6 5 6 5 6 1 6 5 6 5 6 1 6 1 6 5 6 · · · · · · · · · · 5 6 5 6 1 6 5 6 5 6 1 6 5 6 1 6 5 6 1 6 · · · · · · · · · · 5 6 5 6 5 6 1 6 5 6 5 6 1 6 5 6 1 6 1 6 für eine Augenzahl zwischen 1 und 5. Zusammen gibt es also 10 5 2 = (5 über 2) Möglichkeiten, von denen jede die Wahrscheinlichkeit 1 2 6 5 3 hat. 6 · Die Wahrscheinlichkeit, dass eine dieser Möglichkeiten eintritt, liegt insgesamt bei 5 2 · 1 2 6 · 5 3 6 = 10 · 1 36 · 125 216 ≈ 16%. verteilungen.pdf, Seite 7 Beispiel: Wahrscheinlichkeit für ... I 6 mal Wappen bei 10 Münzwürfen: b10;0,5 (6) = 10 6 · 1 6 2 · 1 4 2 = 210 · 1 10 2 ≈ 21%, I 3 Sechsen bei 10 mal Würfeln: b10;1/6 (3) = 10 3 · 1 3 6 · I 30 Sechsen bei 100 mal 5 7 6 ≈ 16%, Würfeln: b100;1/6 (30) ≈ 0, 038%, I zwischen 25 und 34 Sechsen bei 100 Würfen: P(X P = 25) + P(X = 26) + ... + P(X = 34) = 34 k=25 b100;1/6 (k) ≈ 2, 2%, I zwischen 11 und 20 Sechsen bei 100 Würfen: ≈ 80, 5%. verteilungen.pdf, Seite 8 Beispiel Binomialverteilung mit n = 20, p = 0, 7, die die typische Form einer Glockenkurve hat. verteilungen.pdf, Seite 9 Beispiel Binomialverteilung mit n = 200, p = 0, 7 verteilungen.pdf, Seite 10 Weitere Eigenschaften der Binomialverteilung I Ist X ∼ b(n, p) Y ∼ b(m, p) und sind X X + Y ∼ b(n + m, p). und unabhängig, so ist und Y Dies folgt unmittelbar aus der Denition. Dabei ist wichtig, dass X und Y die gleiche p haben. n − X ∼ b(n, 1 − p) Erfolgswahrscheinlichkeit I Ist X ∼ b(n, p), so ist (Zahl der Misserfolge). Bemerkung Es handelt sich tatsächlich um eine Wahrscheinlichkeitsverteilung, denn nach der binomischen Formel gilt 1 =1 n n n X n · p k · (1 − p)n−k = p + (1 − p) = k k=0 verteilungen.pdf, Seite 11 Hypergeometrische Verteilung Beispiel: Von N = 50 Artikeln sind K =5 fehlerhaft. Wie groÿ ist dann die Wahrscheinlichkeit, bei einer Stichprobe von n = 10 Artikeln k =2 fehlerhafte zu entdecken? Die Binomialverteilung gibt hier die Wahrscheinlichkeiten nicht korrekt wieder, da z. B. die Wahrscheinlichkeit p2 , dass der zweite geprüfte Artikel defekt ist, davon abhängt, ob der erste defekt war oder nicht (p2 ist entweder 4/49 oder 5/49). Ähnliche Fragestellung Wie groÿ ist die Wahrscheinlichkeit, dass ein Skatspieler genau zwei Buben bekommt? (hier ist N = 32, n = 10, K = 4 und k = 2). verteilungen.pdf, Seite 12 Antwort zum Skatbeispiel 32 10 Es gibt insgesamt = 64.512.240 verschiedene Skatblätter (10 Karten von 32), die alle (Annahme einer LaplaceVerteilung!) gleich wahrscheinlich sind. 4 2 Für die zwei Buben gibt es =6 Möglichkeiten (zwei von vier), für die übrigen 8 Karten (NichtBuben) gibt es 28 8 = 3.108.105 Möglichkeiten. 4 2 Folglich gibt es insgesamt · 28 8 = 18.648.630 verschiedene Skatblätter mit genau zwei Buben. Die Wahrscheinlichkeit, eines davon zu bekommen, liegt bei K k N−K n−k · N n = 4 2 28 8 · 32 10 = 18.648.630 64.512.240 ≈ 28, 9% verteilungen.pdf, Seite 13 Denition Eine Zufallsvariable X mit P(X = k) = H(k|n; K ; N) = K k N−K n−k · N n k ∈ Z mit k ≥ 0, k ≤ n und k ≤ K heiÿt hypergeometrisch verteilt mit den Parametern n, K , N ∈ N, für alle Notation X ∼ H(n; K ; N). Dabei muss gelten n≤N K ≤ N. und Anwendung/Interpretation Von N Objekten, von denen haben, werden n Verteilung gibt für 0 unter den n K eine besondere Eigenschaft zufällig ausgewählt. Die hypergeometrische ≤k ≤n die Wahrscheinlichkeit an, dass ausgewählten Objekten k die besondere Eigenschaft haben. verteilungen.pdf, Seite 14 Zum Skatbeispiel Hier ist K =4 N = 32 die Gesamtzahl der Karten. Davon haben die Eigenschaft Bube. Zufällig ausgewählt werden n = 10 Karten (die ein Spieler ausgeteilt bekommt). Die Zahl X der darin enthaltenen Buben wird dann durch die hypergeometrische Verteilung X ∼ H(10; 4; 32) beschrieben. Es ist P(X = 0) ≈ 0, 203 = 20, 3%, P(X = 1) ≈ 0, 428 = 42, 8%, P(X = 2) ≈ 0, 289 = 28, 9%, P(X = 3) ≈ 0, 073 = 7, 3% und P(X = 4) ≈ 0, 006 = 0, 6%. verteilungen.pdf, Seite 15 Verteilung H(6; 6; 49) Zahl der Richtigen beim Lotto: Von n=6 N = 49 Kugeln werden gezogen. Auf dem eigenen Tippschein sind K =6 Gewinnzahlen angekreuzt. Bemerkung: P(X = 4) ≈ 0, 1%, P(X = 5) ≈ 0, 002% und P(X = 6) ≈ 0, 000007% verteilungen.pdf, Seite 16 Erwartungswert und Varianz Ist EX = n · KN = n · p und · 1 − KN · N−n = n · p · (1 − p) · N−1 X ∼ H(n; K ; N), V (X ) = n · mit p= K N so ist N−n N−1 K . N Bemerkung Ist N im Vergleich zu n sehr groÿ (in der Praxis etwa N ≥ 20n), so kann die hypergeometrische Verteilung durch die Binomialverteilung approximiert werden, d. h. H(k|n; K ; N) ≈ bn;p (k) mit p= K . N verteilungen.pdf, Seite 17 PoissonVerteilung X Eine Zufallsvariable λ ∈ R, λ > 0, heiÿt Poissonverteilt mit Parameter wenn P(X = k) = λk −λ ·e k! für k = 0, 1, 2, ... Berechnungen der PoissonVerteilung führen auf die Exponentialreihe (Taylorreihe der eFunktion): Um zu zeigen, dass es sich tatsächlich um eine Wahrscheinlichkeitsverteilung handelt, betrachtet man P∞ P λk = e−λ · ∞ k=0 k! = e−λ · 1 + λ + 12 λ2 + 16 λ3 + ... = e−λ · eλ = 1 k=0 P(X = k) = P∞ λk −λ k=0 k! e verteilungen.pdf, Seite 18 Approximation der Binomialverteilung Die PoissonVerteilung kann benutzt werden, um die Binomialverteilung für sehr kleine p und groÿe approximieren (in der Praxis etwa für Dann ist bn;p (k) ≈ λk k! e −λ mit n p ≤ 0, 01 zu und n ≥ 50). λ = np . Anwendungen I Zahl der Schadensfälle einer Versicherung I Zahl der Anrufer einer Hotline oder Kunden in einem Geschäft I Zahl der Aufrufe einer Internetseite I Zahl von Meteoriten- oder Blitzeinschlägen I Zahl der fehlerhaften Artikel in einer Produktion jeweils innerhalb eines festgelegten Zeitraums verteilungen.pdf, Seite 19 Beispiel 1 Die Zahl X der Schadensfälle einer Versicherung an einem Tag sei Poissonverteilt mit Paramater λ = 5. Dann ist 50 −5 = e−5 ≈ 0, 67% 0! · e 51 −5 = 5e−5 ≈ 3, 37% 1) = 1! · e 52 −5 2) = = 12, 5 · e−5 ≈ 8, 42% 2! · e 55 −5 −5 = 625 ≈ 17, 55% 5) = 5! · e 24 · e 510 −5 10) = ≈ 1, 81% 10! · e I P(X = 0) = I P(X = I P(X = I P(X = I P(X = P(X ≤ 2) = P(X = 0)+P(X = 1)+P(X = 2) ≈ 12, 47% P(4 ≤ X ≤ 6) = P(X = 4)+P(X = 5)+P(X = 6) ≈ 49, 72% I I verteilungen.pdf, Seite 20 PoissonVerteilung mit λ = 5 verteilungen.pdf, Seite 21 Beispiel 2 Ein Unternehmen unterbreitet 100.000 potentiellen Kunden ein Angebot und geht davon aus, dass dieses in 0, 2 % der Fälle angenommen wird. Die Zahl X der Kunden, die das Angebot annehmen, kann dann als binomialverteilt mit den Parametern p = 0, 002 n = 100.000 und angenommen werden. Diese Binomialverteilung kann durch eine PoissonVerteilung mit Parameter λ = n · p = 200 approximiert werden. Somit gilt z. B. für dei Wahrscheinlichkeit, dass genau 190 Kunden das Angebot annehmen P(X = 190) ≈ 200190 190! Zum Vergleich: Der mit der Binomialverteilung berechnete · e−200 ≈ 2, 243 %. exakte Wert liegt bei 2, 244 %. verteilungen.pdf, Seite 22 Erwartungswert und Varianz werden mit Hilfe der Exponentialreihe berechnet: Für den Erwartungswert einer Poissonverteilten Zufallsvariable Parameter λ X mit gilt ∞ X λk−1 λk = λ · e−λ k! (k − 1)! k=1 k=0 = λ · e−λ · 1 + λ + 21 λ2 + 16 λ3 + ... = λ · e−λ · eλ = λ. EX = ∞ X k · e−λ Analog berechnet man die Varianz V (X ) = λ Summationseigenschaft Y unabhängig und Poissonverteilt mit Parametern λ bzw. µ, so ist X + Y Poissonverteilt Parameter λ + µ. Sind X und mit verteilungen.pdf, Seite 23 Erweiterung: PoissonProzess Ein PoissonProzess modelliert die Anzahl zufällig eintretender Ereignisse (wie Anrufe bei einer Telefonzentrale, Kunden in einem Geschäft, Meteoriteneinschläge etc.) als Funktion der Zeit. Er besteht aus einer Familie von Zufallsvariablen für jeden Zeitpunkt t>0 (Xt )t>0 , d. h. ist eine Zufallsvariable deniert, welche die Zahl der zwischen den Zeitpunkten 0 und t eingetretenen Ereingnisse beschreibt. Ein PoissonProzess mit Parameter λ>0 ist dabei durch folgende Eigenschaften charakterisiert: t > 0 ist Xt Poissonverteilt mit Parameter tλ für 0 < t < s ist die Zufallsvariable Xs − Xt unabhängig von Xt und Poissonverteilt mit Parameter (s − t)λ I für festes I verteilungen.pdf, Seite 24 Die geometrische Verteilung gibt bei einem Versuch mit Erfolgswahrscheinlichkeit Zahl der Versuche bis zum ersten Erfolg wieder. Für p die n≥1 ist P(X = n) = p · (1 − p)n−1 (n −1 Fehlversuche gefolgt von einem erfolgreichen Versuch). q = 1 − p erhält man mit Hilfe P∞ P∞ k−1 k=1 P(X = k) = p · k=1 q Mit der geometrischen Reihe = p · (1 + q + q 2 + ...) = p · 1 1−q = p p = 1, also liegt tatsächlich eine Wahrscheinlichkeitsverteilung vor. verteilungen.pdf, Seite 25 Geometrische Verteilung mit Parameter p = 1 6 verteilungen.pdf, Seite 26 Eigenschaften I Ist X geometrisch verteilt mit Parameter Erwartungswert und Varianz EX = p1 und V (X ) = 1p−p ⇒ 2 σX = 1 p · √ p, 1 so gilt für − p. I Die geometrische Verteilung ist gedächtnislos, denn für n, m ∈ N gilt P(X > n + m|X > n) = P(X > m) (der linke Term bezeichnet die bedingte Wahrscheinlichkeit, dass nach n n Misserfolgen weitere Misserfolge folgen), d. h. die Wahrscheinlichkeit, dass die nächsten m Versuche Misserfolge sind, hängt nicht davon ab, wie viele Versuche man schon vorher gemacht hat. Die Berechnung von Erwartungswert und Varianz sowie der Nachweis der Gedächtnislosigkeit erfolgt mit Hilfe von Potenzreihen. verteilungen.pdf, Seite 27 Beispiel Die Zahl der Würfe, die man benötigt, um eine Sechs zu bekommen, ist geometrisch verteilt mit Parameter Ihr Erwartungswert ist 1 p = 6, p= 1 6. d. h. im Durchschnitt werden 6 Würfe benötigt. Die Varianz beträgt σ2 = die Standardabweichung 1−p p2 σ= = √ 5/6 (1/6)2 30 = 5·36 6 = 30, ≈ 5, 5. P(X ≤ 5) = 1 − (1 − p)5 ≈ 0, 598, d. h. benötigt man knapp 60% der Fälle maximal 5 Würfe, also weniger als im Es gilt in Durchschnitt. Anderseits werden nur in etwa benötigt, da 1 der Fälle mehr als 6 Würfe 6 3 P(X > 6) = 56 ≈ 0, 335. verteilungen.pdf, Seite 28