Verteilungen eindimensionaler diskreter Zufallsvariablen • Einführung • Diskrete Verteilungen ¾Diskrete Gleichverteilung ¾Bernoulli-Verteilung ¾Binomialverteilung Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 1 Zufallsvariablen II Bibliografie: ¾ Prof. Dr. Kück Universität Rostock Statistik, Vorlesungsskript, Abschnitt 5.2 ¾ Bleymüller / Gehlert Verlag Vahlen 2003 Statistische Formeln, Tabellen und Programme ¾ Bleymüller / Gehlert / Gülicher Verlag Vahlen 2004 Statistik für Wirtschaftswissenschaftler ¾ Hartung Oldenbourg Verlag 2002 Statistik Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 2 Zufallsvariablen II 1 Einführung Die Verteilungen der Zufallsvariablen sind grundsätzlich als Wahrscheinlichkeitsverteilungen aufzufassen. Alle Werte, die eine Zufallsvariable X annehmen kann, bilden zusammen mit ihren Wahrscheinlichkeiten W die Wahrscheinlichkeitsverteilung (das Verteilungsgesetz) der Zufallsvariablen. Notation: X: W: x1, x2, ..., xi W(X=x1), W(X=x2), ..., W(X=xi) Kann die diskrete Zufallsvariable endlich viele (n viele) Werte annehmen, so gilt: n ∑W(X = x ) = 1 i =1 Kann die Zufallsvariable unendlich viele (∞ viele) Werte annehmen, so gilt: i ∞ ∑W(X = x ) = 1 i =1 Prof. Kück / S. Winterfeldt Lehrstuhl Statistik (i=1, 2, ...) (i=1, 2, ...) i 3 Zufallsvariablen II Einführung Die Verteilung der Wahrscheinlichkeiten wird mit Hilfe der Wahrscheinlichkeitsfunktion dargestellt: f(xi) = W(X=xi), wobei: f(xi)≥0 und Σf(xi)=1. ⇒ Es besteht eine Analogie zur Häufigkeitsverteilung und ihrer Beschreibung durch Häufigkeits- und Verteilungsfunktion (vgl. Abschnitt 4). ¾ Die Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariablen ordnet jeder möglichen Realisation die Wahrscheinlichkeit ihres Auftretens zu. ¾ Handelt es sich bei der Wahrscheinlichkeitsfunktion wirklich um eine mathematische Funktion (=>eine Formel!), so erhält sie dadurch einen eigenständigen analytischen Gehalt. ¾ Grafisch dargestellt wird die Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariablen durch ein Stabdiagramm. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 4 Zufallsvariablen II 2 Einführung Ist die Zahl der Ausprägungen einer diskreten Zufallsvariablen groß, so rücken die einzelnen Stäbchen enger zusammen, das Stabdiagramm nähert sich dann dem Bild einer Fläche unter einer stetigen Kurve an und kann auch gut durch eine solche approximiert werden: Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 5 Zufallsvariablen II Einführung Die Verteilungsfunktion der Wahrscheinlichkeitsverteilung ist bei einer diskreten Zufallsvariablen die Summenfunktion (Wahrscheinlichkeitssumme) der Wahrscheinlichkeitsfunktion. Sie gibt die Wahrscheinlichkeit dafür an, dass die Zufallsvariable X höchstens den Wert x annimmt. Es ist: F(x) = W(X ≤ x) Aus der Wahrscheinlichkeitsfunktion lässt sich folgende Beziehung ableiten: F(x) = W(X ≤ x) = ∑ f (x ) x i ≤x Prof. Kück / S. Winterfeldt Lehrstuhl Statistik i 6 Zufallsvariablen II 3 Einführung T reppenkurv e (am Beispiel einer Binomialv erteilung mit n=1 0 Versuchen) W(X<=x) Die grafische Darstellung der Verteilungsfunktion einer diskreten Zufallsvariablen liefert eine Treppenkurve: 1 ,2 1 0 ,8 0 ,6 0 ,4 0 ,2 0 0 1 2 3 4 5 6 7 8 9 10 11 x Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 7 Zufallsvariablen II Einführung Fragt man nach der Wahrscheinlichkeit, dass die Zufallsvariable einen Wert in einem Intervall [a,b] annimmt, so ist: W (a ≤ X ≤ b ) = ∑ f (x ) a≤ xi ≤b i Intervalle werden danach unterschieden, ob die Intervallgrenzen zum Intervall gehören oder nicht. Eine Übersicht gebräuchlicher Intervallangaben, ihrer Symbolik und ihrer verbalen Beschreibung findet sich in der folgenden Tabelle: Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 8 Zufallsvariablen II 4 Einführung Symbolik x liegt im Mathematische für das Intervall, Bezeichnung des Intervall wenn Intervalls Umgangssprachliche Beschreibung [ a, b ] a≤ x≤ b abgeschlossen mind. a und höchstens b [ a, b [ a≤ x<b halboffen mindestens a und kleiner b ] a, b ] a<x≤ b halboffen größer a und höchstens b ] a, b [ a<x<b offen größer a und kleiner b [ a, ∞ [ x≥a nach oben unbeschränkt mindestens a ] a, ∞ [ x>a nach oben unbeschränkt größer a ] -∞, b ] x≤b nach unten unbeschränkt höchstens b ] -∞, b [ x<b nach unten unbeschränkt kleiner b Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 9 Zufallsvariablen II Einführung Erwartungswert Wahrscheinlichkeitsverteilungen von Zufallsvariablen werden durch Maßzahlen/ Parameter charakterisiert. Der Erwartungswert E(X) charakterisiert als sogenannter Lokationsparameter das mittlere Niveau der Merkmalsausprägungen. Für eine diskrete Zufallsvariable ist er definiert als: E(X) = ∑ xi ⋅ W(X = xi ) =∑ xi ⋅ f (xi ) i Prof. Kück / S. Winterfeldt Lehrstuhl Statistik i 10 Zufallsvariablen II 5 Einführung Varianz Als Streuungsparameter findet die Varianz Var(X) Verwendung. Die Streuung einer Verteilung gibt an, wie stark Merkmalsausprägungen vom Erwartungswert abweichen. Die Varianz ist der Erwartungswert des Abweichungsquadrates einer Zufallsvariablen und wird definiert durch: Var(X) = E[(X-E(X))²] = E(X²)-[E(X)]² Durch Einsetzen erhält man: ⎡ ⎤ 2 2 Var( X) = ∑ [x i − E( X)] ⋅ f (x i ) = ⎢∑ x i2 ⋅ f (x i )⎥ − [E( X)] i ⎣ i ⎦ Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 11 Zufallsvariablen II Diskrete Verteilungen Wir werden uns nun mit einigen diskreten Verteilungen befassen und diese in folgender Reihenfolge darstellen: Diskrete Gleichverteilung Bernoulli-Verteilung Binomialverteilung Hypergeometrische Verteilung Poissonverteilung Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 12 Zufallsvariablen II 6 Diskrete Gleichverteilung Ein Versuch hat n mögliche gleichwahrscheinliche Versuchsergebnisse x1, ..., xn mit x1<...<xn. Wahrscheinlichkeitsfunktion: f(xi) = W(X=xi) = 1/n für i=1, ..., n Verteilungsfunktion: ⎧ 0 für x < x1 ⎪ F(x) = W(X ≤ x) = ⎨j / n für x j ≤ x < x j+1 mit j = 1,...,n − 1 ⎪ 1 für x ≥ xn ⎩ Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 13 Zufallsvariablen II Diskrete Gleichverteilung Erwartungswert: n n E( X ) = ∑ x i ⋅ f (x i ) = ⋅ ∑ x i 1 n i =1 i =1 Varianz: n ⎛ ⎞ Var ( X) = E( X ) − [E( X) ] = ⋅ ∑ x − ⎜ n1 ⋅ ∑ x i ⎟ i =1 ⎝ i =1 ⎠ 2 Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 2 n 1 n 2 2 i 14 Zufallsvariablen II 7 Diskrete Gleichverteilung Beispiel: Würfel mit den Augenzahlen 1, 2, 3, 4, 5, 6 X einmaliges Würfeln xi=i für i = 1, ..., 6 Augenzahl f(xi)=1/6 für i = 1, ..., 6 Wahrscheinlichkeit, i Augen zu würfeln ⎧ 0 für ⎪ Verteilungsfunktion: F( X) = ⎨ j / 6 für ⎪ 1 für ⎩ x<1 j ≤ x < j + 1 mit x≥6 Erwartungswert: E(X) Varianz: Var(X) = (12+22+32+42+52+62)/6 – 3,52 = 91/6 - 12,25 ≈ 2,92 Prof. Kück / S. Winterfeldt Lehrstuhl Statistik = (1+2+3+4+5+6)/6 j = 1,...,5 = 3,5 15 Zufallsvariablen II Diskrete Gleichverteilung Grafische Darstellungen: Wahrscheinlichkeitsfunktion f(x) 0,18 1/6 1/6 1/6 1/6 1/6 Verteilungsfunktion 1/6 1,2 F(x) 0,15 1 0,12 0,8 0,09 0,6 0,06 0,4 0,03 0,2 0,00 1 2 3 4 5 0 0 6 x Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 1 2 3 4 5 6 7 x 16 Zufallsvariablen II 8 Bernoulli-Verteilung Es wird ein Versuch mit den möglichen Versuchsergebnissen A und Ā durchgeführt. Als Wahrscheinlichkeit für das Eintreten von A wird W(A) = θ festgelegt. Damit ist W(Ā) = 1-θ. Die Zufallsgröße X, die durch die Zahl des Eintretens von A in einem Versuch gekennzeichnet ist, kann als Realisierungen die Werte 0 und 1 annehmen (=>Null-Eins-Verteilung). Wahrscheinlichkeitsfunktion: Verteilungsfunktion: Prof. Kück / S. Winterfeldt Lehrstuhl Statistik ⎧ θ f (x) = W (X = x) = ⎨ ⎩1 − θ für für ⎧ 0 ⎪ F (x ) = ⎨1 − θ ⎪ 1 ⎩ x < 0 0 ≤ x < 1 x ≥ 1 für für für x=1 x=0 17 Zufallsvariablen II Bernoulli-Verteilung Erwartungswert: Varianz: E(X) = 0·(1-θ)+1·θ = θ Var(X) = E(X2)-[E(X)]2 = 02·(1-θ)+12·θ-θ2 = θ-θ2 = θ·(1- θ) Für θ=0,5 ist die Bernoulli-Verteilung mit der diskreten Gleichverteilung mit n=2, x1=0 und x2=1 identisch. Eine Bernoulli-Verteilung liegt u.a. für folgende Sachverhalte vor: • einmaliges Werfen einer präparierten Münze (Zahl oder Wappen) • Geschlecht einer zufällig ausgewählten Person • Funktionsfähigkeit einer zufällig ausgewählten Energiesparlampe Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 18 Zufallsvariablen II 9 Bernoulli-Verteilung Beispiel: Bei der Auslosung der Halbfinale eines DFB-Pokals mit den Mannschaften M, N, O und P wird M als Heimmannschaft des ersten Spiels gezogen. Das Ereignis A sei die Auslosung der Mannschaft P als Spielgegner von M mit W(A)=1/3. X sei die Zufallsgröße für die Zahl der erfolgreichen Versuche bei obigem Vorgehen mit den möglichen Realisationen x1=0 und x2=1. Die Werte der Wahrscheinlichkeitsfunktion sind f(0)=2/3 und f(1)=1/3. ⎧ 0 für ⎪ F(X) = ⎨2/3 für ⎪ 1 für ⎩ Verteilungsfunktion: Erwartungswert: Varianz: x<0 0 ≤ x <1 x ≥1 E(X) = 1/3 Var(X) = 1/3 · 2/3 = 2/9 Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 19 Zufallsvariablen II Bernoulli-Verteilung Grafische Darstellungen: Wahrscheinlichkeitsfunktion Verteilungsfunktion 1 1/3 1 1/3 F(x) f(x) 1 1 2/3 2/3 1/3 1/3 0 0 -0,5 0 0,5 1 1,5 x Prof. Kück / S. Winterfeldt Lehrstuhl Statistik -0,5 0 0,5 1 1,5 x 20 Zufallsvariablen II 10 Binomialverteilung Es werden n Versuche (Bernoulli-Experimente) mit den möglichen Versuchsergebnissen A und Ā durchgeführt (dichotome Merkmale). In jedem Versuch ist W(A) = θ gleich, das ist zum Beispiel beim Ziehen von Kugeln aus einer Urne durch Zurücklegen erreichbar. f(x) = W(X=x) ist die Wahrscheinlichkeit für das x-ma⎛n⎞ lige Eintreten von A bei n Versuchen. Es gibt ⎜⎜⎝ x ⎟⎟⎠ Versuchsserien aus n Versuchen, in denen A x-mal eintritt. In einer Versuchsserie aus n Versuchen ergibt sich die Wahrscheinlichkeit für das x-malige Eintreten von A durch θx•(1-θ)n-x (entsprechend Multiplikationssatz). Wahrscheinlichkeitsfunktion: ⎛n⎞ f B ( x ) = ⎜⎜ ⎟⎟ ⋅ θ x ⋅ (1 − θ ) n − x für ⎝x⎠ Prof. Kück / S. Winterfeldt Lehrstuhl Statistik x = 0 ,..., n 21 Zufallsvariablen II Binomialverteilung Verteilungsfunktion: 0 für x<0 ⎧ ⎪⎪ j ⎛ n⎞ ν FB (x) = ⎨∑⎜⎜ ⎟⎟ ⋅ θ ⋅ (1 − θ)n−ν für j ≤ x < j + 1 mit j = 0,...,n − 1 ⎪ν=0 ⎝ ν ⎠ ⎪⎩ 1 für x≥n Erwartungswert: E(X) = n·θ Varianz: Var(X) = n·θ·(1- θ) Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 22 Zufallsvariablen II 11 Binomialverteilung ¾ Eine Binomialverteilung mit n = 1 Versuch ist eine Bernoulli-Verteilung. ¾ Grundmodell der Binomialverteilung ist das Ziehen von Kugeln aus einer Urne mit schwarzen und weißen Kugeln mit Zurücklegen. ¾ Rechenregeln zur Berechnung von Binomialkoeffizienten und eine Wertetabelle findet man in der Formelsammlung (Bleymüller/ Gehlert). ¾ Für einige ausgewählte θ-Werte und n-Werte sind auch die Wahrscheinlichkeits- und Verteilungsfunktion der Binomialverteilung tabelliert (Bleymüller/ Gehlert). Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 23 Zufallsvariablen II Binomialverteilung Beispiel: Mit 5 Würfeln mit der Augenzahl 1, 2, ..., 6 wird gleichzeitig gewürfelt. Gesucht sind die Wahrscheinlichkeitsfunktion und die Verteilungsfunktion für die Anzahl der Sechsen (n=5; θ=1/6). Man erhält folgende Werte dieser Funktionen: x 0 fB(x) 0,40188 0,40188 0,16075 FB(x) 0,40188 0,80376 0,96451 0,99666 0,99987 1,00000 Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 1 2 3 4 5 0,03215 0,00321 0,00013 24 Zufallsvariablen II 12 Binomialverteilung Grafische Darstellungen: Wahrscheinlichkeitsfunktion Verteilungsfunktion 1,2 F(x) 0,5 f(x) 1 0,4 0,8 0,3 0,6 0,2 0,4 0,1 0,2 0 0 -1 0 1 2 3 4 5 -1 6 0 1 2 x Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 3 4 5 6 x 25 Zufallsvariablen II Binomialverteilung Beispiel: Das demografische Maß der Sexualproportion bezeichnet den Quotienten aus männlichen und weiblichen Geburten (SP=GM/GW). In Deutschland beträgt die Sexualproportion etwa 1,06. Berechnen Sie a) den Anteil männlicher Geburten an allen Geburten und b) die Wahrscheinlichkeits- und Verteilungsfunktion für die Anzahl der Söhne in einer Familie mit drei Kindern. Lösung: a) GM θ= GM = GM + G W Prof. Kück / S. Winterfeldt Lehrstuhl Statistik GW GM GW + GG WW = SP 1,06 = = 0,5146 SP + 1 1,06 + 1 26 Zufallsvariablen II 13 Binomialverteilung Lösung (Fortsetzung): b) Wahrscheinlichkeitsfunktion: ⎛ 3⎞ f B ( x ) = ⎜⎜ ⎟⎟ ⋅ 0,5146 x ⋅ (0,4854)3 − x für x = 0,...,3 ⎝ x⎠ Verteilungsfunktion: 0 ⎧ ⎪⎪ j ⎛ 3 ⎞ FB ( x ) = ⎨∑ ⎜⎜ ⎟⎟ ⋅ 0,5146 ν ⋅ 0,4854 3− ν ⎪ ν =0 ⎝ ν ⎠ 1 ⎩⎪ x<0 für j ≤ x < j + 1 mit für j = 0,1,2 x≥3 für x 0 1 2 3 fB(x) 0,11437 0,36374 0,38562 0,13627 FB(x) 0,11437 0,47811 0,86373 1,00000 Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 27 Zufallsvariablen II Binomialverteilung Die grafische Darstellung der Wahrscheinlichkeitsfunktion zeigt u.a., dass die Wahrscheinlichkeit, drei Söhne zu haben, sichtbar größer ist als die Wahrscheinlichkeit, drei Töchter zu haben: Wahrscheinlichkeitsfunktion Verteilungsfunktion 1,2 F(x) 1 0,5 f(x) 0,36374 0,4 0,8 0,385621 0,3 0,6 0,2 0,4 0,136273 0,114367 0,2 0,1 0 0 -1 0 1 2 3 4 x Prof. Kück / S. Winterfeldt Lehrstuhl Statistik -1 0 1 2 3 4 x 28 Zufallsvariablen II 14