Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 1 Kursthemen 11. Sitzung Spezielle diskrete diskrete Verteilungen: Verteilungen: Auswahlexperimente Auswahlexperimente Spezielle A) A) Kombinatorik (Folien (Folien 22 bis bis 5) 5) Kombinatorik B) B) Die diskrete diskrete Gleichverteilung Gleichverteilung (Folie (Folie 6) 6) Die C) C) Die Bernoulliverteilung Bernoulliverteilung (Folien (Folien 77 bis bis 9) 9) Die D) D) Die Binomialverteilung Binomialverteilung (Folien (Folien 10 10 bis bis 19) 19) Die E) Die Hypergeometrische Verteilung (Folien 20 bis 23) Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 2 Kombinatorik 1 / 2 Gänsemarschproblem I: Wie viele Möglichkeiten gibt es, n Gänse in verschiedener Reihenfolge anzuordnen? Es gibt n! Möglichkeiten, n Gänse in verschiedener Reihenfolge anzuordnen. Definition: n ! = 1 ⋅ 2 ⋅ ... ⋅ n, n ∈ » (sprich: "n Fakultät") und 0! = 1 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 3 Kombinatorik 1 / 2 Gänsemarschproblem II: Wie viele Möglichkeiten gibt es, n Gänse in verschiedener Reihenfolge anzuordnen, wenn jeweils n1, n2, nicht unterscheidbar sind (bzw. es auf ihre Reihenfolge nicht ankommt)? Nun gibt es nur noch n! n1 !⋅ n2 !⋅ ... ⋅ nk ! unterscheidbare Anordnungen. ..., nk Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 4 Kombinatorik 2 / 2 Abgeleitete Regeln Es werden n Elemente aus N gezogen. Wie viele mögliche Ergebnisse kann dieser Auswahlprozess haben? Wenn es auf die Auswahlreihenfolge ankommt: - mit Zurücklegen (Bsp.: Lotto Super 6, Spiel 77): Nn N! - ohne Zurücklegen (Bsp.: Platzwette, Toto): ( N − n)! Wenn es auf die Auswahlreihenfolge nicht ankommt: - mit Zurücklegen: ( N + n − 1) ! ( N + n − 1) =: n n !⋅ ( N − 1) ! N N! = : - ohne Zurücklegen (Bsp.: Lotto 6 aus 49): n !( N − n)! n Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 5 Definition: Binomialkoeffizient n n! n ⋅ ( n − 1) ⋅ ... ⋅ ( n − k + 1) = = k ( n − k )!⋅ k ! 1 ⋅ 2 ⋅ ... ⋅ k (sprich: "n über k") Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 6 Die Gleichverteilung Ausgangssituation: Sie ziehen zufällig ein Objekte aus 1 bis n durchgehend numerierten Objekten heraus. Dann ist die Zufallsvariable X = "Nummer des gezogenen Objektes" gleichverteilt mit dem Parameter n, d. h. sie folgt der Verteilung GLV ( n ) . Mögliche Werte von X: k = 1, 2, ..., n Erwartungswert von X: E( X ) = n +1 2 Häufigkeitsfunktion: 1 Y? Wie groß ist die Varianz von f (k ) = P ( X = k ) = n Varianz von X: Wie groß ist die Varianz n2 − 1 von Y? Var ( X ) = 12 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 7 Das Urnenmodell 1 / 4 In einer Urne liegen: - 20 (N) Kugeln; - ein Anteil von 25% (p) ist schwarz, - ein Anteil von 75% (1-p) ist weiß. Die Urne enthält somit 5 (N·p) schwarze und 15 (N·(1-p)) weiße Kugeln Nehmen wir an, man zieht blind eine Kugel aus der Urne. Dann ist die Wahrscheinlichkeitsverteilung für die Anzahl der schwarzen Kugeln: 0,75 1-p=0,75 0,25 p=0,25 0 1 Anzahl schwarze Kugeln Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 8 Das Urnenmodell 1 / 4 0,75 1-p=0,75 0,25 p=0,25 0 1 Anzahl schwarze Kugeln Die Verteilung heißt Zweipunktverteilung mit dem Parameter p=0,25 oder Binomialverteilung B(n, p) mit den Parametern n=1 und p=0,25. Erwartungswert: µ = p = 0, 25 Standardabweichung: σ= p ⋅ (1 − p ) = 0, 43 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 9 Die Zweipunktverteilung (Bernoulliverteilung) Ausgangssituation: Sie ziehen zufällig ein Objekt aus N Objekten heraus, die sich in bezug auf ein Merkmal mit zwei Ausprägungen A und A unterscheiden. Dann ist die ZV X = "Anzahl der gezogenen Objekte mit A" NA , wobei N A die Anzahl der Objekte N mit A ist. D. h. die ZV folgt der Verteilung ZPV ( p ). bernoulliverteilt mit dem Parameter p = Mögliche Werte von X: k = 0,1 Erwartungswert von X: E( X ) = p Häufigkeitsfunktion: Wie groß ist die Varianz von Y? k 1− k f ( k ) = P ( X = k ) = p (1 − p ) Varianz von X: Wie groß ist die Varianz von Y? Var ( X ) = p(1 − p ) Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 10 Das Urnenmodell 2 / 4 Nehmen wir an, man zieht blind eine Kugel, notiert die Farbe, legt die Kugel zurück, mischt und zieht ein zweites Mal. Mögliche Ergebnisse W-keit Anzahl schwarze K. WW WS SW SS (1 − p ) 2 = 0,5625 (1 − p ) ⋅ p = 0,1875 0 1 1 2 p ⋅ (1 − p ) = 0,1875 p 2 = 0,0625 W-keit (1 − p ) 2 = 0,5625 2 ⋅ (1 − p ) ⋅ p = 0,3750 p 2 = 0,0625 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 11 Das Urnenmodell 2 / 4 Mögliche Ergebnisse W-keit Anzahl schwarze K. WW WS SW SS (1 − p ) 2 = 0,5625 (1 − p ) ⋅ p = 0,1875 p ⋅ (1 − p ) = 0,1875 0 1 1 2 p 2 = 0,0625 0,75 W-keit (1 − p ) 2 = 0,5625 2 ⋅ (1 − p ) ⋅ p = 0,3750 p 2 = 0,0625 (1 − p )2 2 ⋅ p ⋅ (1 − p ) 0,25 p2 0 1 2 Anzahl schwarze Kugeln µ = 2 ⋅ p = 0, 5 σ = 2 ⋅ p ⋅ (1 − p ) = 0, 61 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 12 Das Urnenmodell 3 / 4 Nun wird dreimal mit Zurücklegen gezogen. Mögliche Ergebnisse W-keit Anzahl schwarze K. WWW WWS WSW SWW WSS SWS SSW SSS (1 − p )3 = 0,420 (1 − p ) 2 ⋅ p = 0,140 (1 − p ) 2 ⋅ p = 0,140 (1 − p ) 2 ⋅ p = 0,140 (1 − p ) ⋅ p 2 = 0,047 (1 − p ) ⋅ p 2 = 0,047 (1 − p ) ⋅ p 2 = 0,047 0 1 1 1 2 2 2 3 p 3 = 0,016 W-kei (1 − p )3 = 0,42 3 ⋅ (1 − p ) 2 ⋅ p = 0,42 3 ⋅ (1 − p ) ⋅ p 2 = 0,14 p 3 = 0,02 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 13 Das Urnenmodell 3 / 4 Anzahl schwarze K. 0 1 1 1 2 2 2 3 W-keit (1 − p )3 = 0,42 3 ⋅ (1 − p ) 2 ⋅ p = 0,42 0,75 (1 − p )3 3 ⋅ p ⋅ (1 − p )2 3 ⋅ p 2 ⋅ (1 − p ) 0,25 3 ⋅ (1 − p ) ⋅ p = 0,14 2 0 p 3 = 0,02 µ = 3 ⋅ p = 0, 75 σ = 3 ⋅ p ⋅ (1 − p) = 0, 75 1 2 p3 3 Anzahl schwarze Kugeln Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 14 Das Urnenmodell 4 / 4 Die Binomialverteilung Verallgemeinerung: Es wird n-mal gezogen. Allgemeine Binomialverteilung: B(n,p) n k P ( k ) = ⋅ p ⋅ (1 − p )n − k k n n! n ⋅ ( n − 1) ⋅ ... ⋅ ( n − k + 1) mit = = 1 ⋅ 2 ⋅ ... ⋅ k k ( n − k )!⋅ k ! (Binomialkoeffizient) Erwartungswert: µ = n⋅ p Standardabweichung: σ = n ⋅ p ⋅ (1 − p ) Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 15 Die Binomialverteilung Ausgangssituation: Sie ziehen nacheinander zufällig n Objekte aus N Objekten heraus, die sich in bezug auf ein Merkmal mit zwei Ausprägungen A und A unterscheiden. Die Objekte werden zurückgelegt. Dann ist die ZV X = "Anzahl der gezogenen Objekte mit A" NA , wobei N A die N Anzahl der Objekte mit A ist. D. h. die ZV folgt der Verteilung BV ( n, p ) . binomialverteilt mit den Parametern n und p = Mögliche Werte von X: k = 0,1, ..., n Erwartungswert von X: E( X ) = n ⋅ p Wie groß ist die Varianz von Y? Häufigkeitsfunktion: n P ( k ) = f ( k ) = ⋅ p k ⋅ (1 − p )n−k k Wie großvon ist X: die Varianz von Y? Varianz Var ( X ) = n ⋅ p ⋅ (1 − p ) Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 16 Aufgaben zur Binomialverteilung 1 / 4 Die Lostrommel Die Lostrommel... In einem Behälter befinden sich 20 Lose, von denen 5 Gewinne sind. Nach gutem Mischen wird ein Los gezogen, angeschaut und wieder zurückgelegt. a) Wie groß ist die Wahrscheinlichkeit, einen Gewinn zu ziehen? b) Wie groß ist die Wahrscheinlichkeit, dass drei nacheinander gezogene Lose Gewinne sind? c) Wie groß ist die Wahrscheinlichkeit, dass drei nacheinander gezogene Lose Nieten sind? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 17 Aufgaben zur Binomialverteilung 2 / 4 „Mensch ärgere Dich nicht“ und Therapieversager Mensch ärgere Dich nicht... Sie würfeln 6 mal hintereinander mit einem fairen Würfel. Wie groß ist die Wahrscheinlichkeit, dass keine 6 dabei ist? Therapieversager.... Sie behandeln 95 Patienten mit einem zu 95% sicheren Medikament. Wie groß ist die Wahrscheinlichkeit, keinen Therapieversager zu erleben? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 18 Aufgaben zur Binomialverteilung 3 / 4 In der Manege Manege frei! Sie verteilen Handzettel an auf der Straße spielende Kinder, die zum Besuch Ihres Wanderzirkusses einladen. Aus Erfahrung wissen Sie, dass jedes 5. Kind kommt. Sie verteilen zufällig 50 Handzettel. a) Wie groß ist die Wahrscheinlichkeit, dass weniger als drei Kinder kommen (dann fällt die Vorstellung aus)? b) Wie groß ist die Wahrscheinlichkeit, dass mehr als 46 Kinder kommen (dann bricht das Zelt zusammen)? c) Wieviele Kinder werden im Schnitt zu erwarten sein? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 19 Aufgaben zur Binomialverteilung 4 / 4 Die Schraubenfabrik In der Schraubenfabrik... Bei der Massenproduktion von Schrauben eines bestimmten Typs sei die Ausschussquote 10%. a) Wieviele defekte Schrauben sind in einem 50er-Pack zu erwarten? b) Wie groß ist jeweils die Wahrscheinlichkeit, dass in einem 4er-Pack c) i. keine defekte Schraube ist? ii. eine defekte Schraube ist? iii. zwei defekte Schrauben sind? Wieviele Schrauben muß man sicherheitshalber zum 4er-Pack dazugeben, damit die Wahrscheinlichkeit, dass mindestens 4 Schrauben in Ordnung sind, mehr als 95% beträgt? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 20 Die hypergeometrische Verteilung Ausgangssituation: Sie ziehen nacheinander zufällig n Objekte aus N Objekten heraus, die sich in bezug auf ein Merkmal mit zwei Ausprägungen A und A unterscheiden. Die Objekte werden nicht zurückgelegt. Dann ist die ZV X = "Anzahl der Objekte mit A" hypergeometrisch verteilt mit den Parametern ( N , N A , n ) , wobei N A die Anzahl der Objekte mit A ist. D. h. die ZV folgt der Verteilung HV ( N , N A , n ) . Mögliche Werte von X: k = 0,1, ...,min ( N A , n ) Erwartungswert von X: N E( X ) = n ⋅ A N N N − N Häufigkeitsfunktion: ⋅ Wie groß ist die Varianz von k Y? n−k A f (k ) = N n Varianz Wie großvon ist X: die Varianz von Y? Var ( X ) = n ⋅ NA N A N N −n ⋅ 1 − A ⋅ N N −1 Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 21 Aufgabe zur hypergeometrischen Verteilung: Das Skat-Turnier Auf dem Skat-Turnier... Sie spielen Skat. Nach dem Geben haben Sie zwei Buben auf der Hand. a) Wie groß ist die Wahrscheinlichkeit, dass Ihr Mitspieler zur Linken zwei Buben dagegen hat? b) Wie groß ist die Wahrscheinlichkeit, dass einer Ihrer beiden Mitspieler zwei Buben dagegen hat? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Folie I - 11 - 22 Aufgabe: Das Capture-Recapture-Problem Um den Bestand in einem Fischteich zu schätzen, wurden außerhalb der Laichzeit 100 Fische gefangen und markiert (capture). Nach drei Tagen wurden wieder 100 Fische gefangen (recapture). Y sei die ZV „Zahl der markierten Fische unter den wiedergefangenen Fischen“. a) Welche Verteilung kann man für Y ansetzen, wenn in dem Teich 2000 Fische leben und welche impliziten Annahmen trifft man dabei? b) Wieviele markierte Fische sind im zweiten Fang zu erwarten? c) Wie groß würden Sie den Fischbestand schätzen, wenn Sie im zweiten Fang 2 markierte Fische finden? Universität Hamburg - Institut für Statistik und Ökonometrie - Dr. S. Kindermann - Methodenlehre der Statistik I - Sitzung 11 Übersicht: Wichtige diskrete Verteilungen für Auswahlexperimente Gleichverteilung GLV ( n), n ∈ » Bernoulliverteilung (=Zweipunktverteilung) Binomialverteilung Folie I - 11 - 23 ZPV ( p ), p ∈ [ 0, 1] BV ( n, p ), n ∈ », p ∈ [ 0, 1] Hypergeometrische Verteilung HV ( N , M , n), N , M , n ∈ »