htw saar 1 KAPITEL 3 DISKRETE ZUFALLSVARIABLEN UND VERTEILUNGEN WS 2016/2017 Hans-Peter Hafner htw saar 2 Gliederung 18.01. Was sind Zufallsvariablen? Charakteristika einer Zufallsvariablen: Verteilung, Erwartungswert und Varianz Ausgewählte diskrete Verteilungen: • Binomial- und Multinomialverteilung 24.01. • Geometrische Verteilung • Negative Binomialverteilung • Poissonverteilung WS 2016/2017 Hans-Peter Hafner htw saar 3 Einführung Zufallsvariablen sind Funktionen auf Wahrscheinlichkeitsräumen. Sie fassen Informationen über den Ausgang eines Zufallsexperimentes zusammen. Beispiele: Lottoziehung: Anzahl der Treffer auf Lottoschein Zwei Würfel: Augensumme Kinder: Anzahl der Kinder in einer Familie WS 2016/2017 Hans-Peter Hafner R htw saar 4 Zufallsvariable Sei (Ω, P) ein Wahrscheinlichkeitsraum. Eine Abbildung X: Ω -> ℝ heißt Zufallsvariable (auf Ω). Hat X höchstens abzählbar viele Werte, so nennen wir sie diskret, andernfalls stetig. Zunächst betrachten wir nur diskrete Zufallsvariablen auf endlichen Wahrscheinlichkeitsräumen! WS 2016/2017 Hans-Peter Hafner htw saar 5 Schreibweisen und Bemerkungen 1) Für das Ereignis, dass X den Wert k annimmt, schreiben wir kurz: X=k Dies ist die abkürzende Schreibweise für {X = k} := {ω ∈ Ω : X(ω) = k} 2) Der Wertebereich von X ist X(Ω) := {X(ω) : ω ∈ Ω} 3) Sind X und Y Zufallsvariablen auf einem Wahrscheinlichkeitsraum Ω, so sind auch X + Y, X – Y, X * Y, max(X, Y) und min(X, Y) Zufallsvariablen auf Ω. Ebenso ist für jede reelle Konstante a das Produkt a * X eine Zufallsvariable auf Ω. WS 2016/2017 Hans-Peter Hafner htw saar 6 Verteilung einer Zufallsvariablen Die Verteilung einer Zufallsvariablen X gibt die Wahrscheinlichkeit an, mit der X einen bestimmten Wert annimmt. Formal: P(X = x) := P({ω ∈ Ω : X(ω) = x}) Liegt der Wert von X im Intervall [a, b], so schreiben wir: P(a ≤X ≤ b) := P({a ≤ X ≤ b}) Liegt der Wert von X in der Menge B, so schreiben wir: P(B) := ∑ ∈ P( ) Da wir momentan nur Zufallsvariablen auf endlichen W-Räumen betrachten, ist X(Ω) eine endliche Menge und für jedes xk, das nicht in X(Ω) enthalten ist, gilt: P(X = xk) = 0. WS 2016/2017 Hans-Peter Hafner htw saar 7 Verteilungsfunktion Die Verteilungsfunktion F einer Zufallsvariablen X gibt die kumulierte Wahrscheinlichkeit an, dass X einen Wert kleiner oder gleich einem Wert x annimmt. = ≤ =∑ ( = ) Beispiel: X Augenzahl beim Werfen eines Würfels F(1) = 1/6 F(5) = 5/6 WS 2016/2017 Hans-Peter Hafner htw saar 8 Erwartungswert einer Zufallsvariablen 1 Der Begriff Erwartungwert (engl.: expectation) geht auf Christiaan Huygens (1629–1695) zurück, der in seiner Abhandlung Van rekeningh in spelen van geluck (1656) den erwarteten Wert eines Spieles mit ”Das ist mir soviel wert“ umschreibt. Huygens’ Arbeit wurde 1657 von Frans van Schooten (um 1615 – 1660) ins Lateinische übersetzt, welcher hier zur Verdeutlichung das Wort expectatio einführt. Diese Übersetzung diente Jakob Bernoulli als Grundlage für seine Ars conjectandi, in der dieser den Begriff valor expectationis benutzt. Der Erwartungswert einer Zufallsvariablen ist der Wert, der auf lange Sicht im Durchschnitt zu erwarten ist. Er ist das Analogon zum arithmetischen Mittel in der Statistik. WS 2016/2017 Hans-Peter Hafner htw saar 9 Erwartungswert einer Zufallsvariablen 2 Für eine Zufallsvariable X : Ω → IR auf einem endlichen W–Raum (Ω,P ) heißt die Zahl E(X) := ∑x ∈X(Ω) xi * P(X = xi) i der Erwartungswert (engl.: expectation, expected value) von X. Bezeichnung: Oft schreibt man statt E(X) einfach EX. Beispiel: X Augenzahl beim Würfeln E(X) = 1 * 1/6 + 2 * 1/6 + 3 * 1/6 + 4 * 1/6 + 5 * 1/6 + 6 * 1/6 = 21 / 6 = 3.5 Sind X und Y Zufallsvariablen auf Ω und ist a eine reelle Konstante, so gilt: (a) E (X + Y) = E(X) + E(Y) (b) E(aX) = a * E(X) Im allgemeinen gilt nicht: E(X * Y) = E(X) * E(Y) WS 2016/2017 Hans-Peter Hafner htw saar 10 Varianz einer Zufallsvariablen Die Varianz einer Zufallsvariablen ist ein Maß dafür, wie stark die Werte um den Erwartungswert streuen. Für eine Zufallsvariable X : Ω → IR auf einem endlichen W-Raum (Ω,P ) heißt V (X) := E(X − EX)2 die Varianz (engl.: variance) von X. Die mit σ(X) := ( )bezeichnete Wurzel aus V (X) heißt Standardabweichung (engl.: standard deviation) von X. WS 2016/2017 Hans-Peter Hafner htw saar 11 Umformung der Formel für die Varianz Seien x1, ··· , xk die Werte der Zufallsvariablen X. Dann lässt sich die Varianz auch wie folgt schreiben: V(X) = ∑ WS 2016/2017 (xi - EX)2 * P(X = xi ) Hans-Peter Hafner htw saar 12 Binomialverteilung 1 Bernoulli – Versuche sind Zufallsexperimente, die • wiederholt durchgeführt werden • unabhängig vom Ergebnis des vorherigen Versuchs sind • zwei mögliche Ausgänge haben: „Erfolg“ (Treffer) mit Wahrscheinlichkeit p, „Misserfolg“ (kein Treffer) mit Wahrscheinlichkeit q, wobei p + q = 1 Beispiele Münzwurf: Wappen / Zahl Los: Gewinn / Niete Klausur: bestanden / nicht bestanden Qualitätskontrolle: fehlerfrei / mangelhaft WS 2016/2017 Hans-Peter Hafner htw saar 13 Binomialverteilung 2 Eine Folge von n nacheinander durchgeführten identischen Bernoulli-Experimenten nennen wir Bernoulli-Kette der Länge n. Meist interessiert nur die Anzahl der Erfolge. Es gilt: Bei einer Bernoulli-Kette der Länge n mit Erfolgswahrscheinlichkeit p ist die Wahrscheinlichkeit für k Treffer (0 ≤ k ≤ n): * pk * qn-k b(k; n, p) = Beweis: 1) Es gibt verschiedene Möglichkeiten für die Anordnung der Erfolge in n Versuchen. 2) Für jede dieser möglichen Ausgänge beträgt die Wahrscheinlichkeit für k Erfolge pk und die Wahrscheinlichkeit für n-k Misserfolge ist qn-k . WS 2016/2017 Hans-Peter Hafner htw saar 14 Binomialverteilung 3 Eine Zufallsvariable X besitzt eine Binomialverteilung mit Parametern n und p, falls gilt: P(X = k) = * pk * qn-k Wir schreiben: X ~ Bin(n, p) Für die Wahrscheinlichkeit P(X = k) schreiben wir in diesem Fall oft Bin(k; n, p). Die Binomialverteilung hat den Erwartungswert n * p. Dies sind man am einfachsten so: Schreibe X = X1 + X2 + ∙∙∙ + Xn mit Xi = 1, falls Erfolg in Versuch i und 0 sonst. Klar: Jedes Xi hat Erwartungswert p. Wegen E(X1 + X2 + ∙∙∙ + Xn ) = E(X1) + E(X2) + ∙∙∙ + E(Xn ) folgt die Behauptung. WS 2016/2017 Hans-Peter Hafner htw saar 15 Binomialverteilung 4 Die Binomialverteilung hat die Varianz n * p * q. Setze wieder X = X1 + X2 + ∙∙∙ + Xn mit Xi = 1, falls Erfolg in Versuch i und 0 sonst. V(Xi) = (1 – p)2 * p + (0 – p)2 * (1 – p) = (1 – p) * ((1 – p) * p + p2) = (1 – p) * p = p * q WS 2016/2017 Hans-Peter Hafner htw saar 16 Binomialverteilung 5 Bin(k; 10, 0.25) Bin(k; 10, 0.5) Bin(k; 10, 0.8) Quelle: Behrens WS 2016/2017 Hans-Peter Hafner htw saar 17 Übung 6 1) 10% der Ersatzteile, die ein Computerhersteller produziert, sind defekt. Wie hoch ist die Wahrscheinlichkeit für genau 3 defekte Teile bei einer Stichprobe von 10? 2) Ein Examen besteht aus 10 Multiple Choice – Fragen mit je 4 Antwortmöglichkeiten (jeweils ist genau eine Antwort richtig). Ein Kandidat rät zufällig. Wie hoch ist die Wahrscheinlichkeit, dass er mindestens 7 Fragen richtig beantwortet? 3) Fabian und Florian spielen Tennis. Fabian gewinnt erfahrungsgemäß 80% der Spiele. Wie groß ist die Wahrscheinlichkeit, dass a) Florian bei 4 Spielen öfters als einmal gewinnt? b) Fabian bei 4 Spielen immer gewinnt? WS 2016/2017 Hans-Peter Hafner htw saar 18 Übung 6/1 10% der Ersatzteile, die ein Computerhersteller produziert, sind defekt. Wie hoch ist die Wahrscheinlichkeit für genau 3 defekte Teile bei einer Stichprobe von 10? WS 2016/2017 Hans-Peter Hafner htw saar 19 Übung 6/2 Ein Examen besteht aus 10 Multiple Choice – Fragen mit je 4 Antwortmöglichkeiten (jeweils ist genau eine Antwort richtig). Ein Kandidat rät zufällig. Wie hoch ist die Wahrscheinlichkeit, dass er mindestens 7 Fragen richtig beantwortet? WS 2016/2017 Hans-Peter Hafner htw saar 20 Übung 6/3 Fabian und Florian spielen Tennis. Fabian gewinnt erfahrungsgemäß 80% der Spiele. Wie groß ist die Wahrscheinlichkeit, dass a) Florian bei 4 Spielen öfters als einmal gewinnt? b) Fabian bei 4 Spielen immer gewinnt? WS 2016/2017 Hans-Peter Hafner htw saar 21 Multinomialverteilung 1 Die Multinomialverteilung ist die Verallgemeinerung der Binomialverteilung für den Fall, dass ein Experiment r ≥ 2 Ausgänge haben kann. Beispiele: Würfel: 6 Ausgänge Bälle mit r Farben (ohne Zurücklegen) WS 2016/2017 Hans-Peter Hafner htw saar 22 Multinomialverteilung 2 Modellannahmen: Experimentausgang k Treffer k-ter Art mit Wahrscheinlichkeit pk p1 + p2 + ∙∙∙ + pr = 1 Ω := {(a1,a2, . . . ,an) : ai ∈ {1,2, . . . ,r} für i = 1, . . . ,n} aj = k: Im j-ten Experiment tritt ein Treffer k-ter Art auf. Sei nk , k = 1, . . . ,r die Anzahl der Treffer k-ter Art in einem n-Tupel. Es gibt ! n1 ! ∗ n2 ! ∗ ··· ∗ nr Möglichkeiten für diese Trefferanzahlen (s. Permutationen ohne Whd. Spezialfall) ! Die Wahrscheinlichkeit für diese Trefferverteilung ist (p1n1 ) * (p2 n2) * ∙∙∙ * (pr nr ). WS 2016/2017 Hans-Peter Hafner htw saar 23 Multinomialverteilung 3 Der Zufallsvektor (X1, . . . ,Xr) besitzt eine Multinomialverteilung (engl.: multinomial distribution) mit Parametern n und p1, . . . ,pr (r ≥ 2, n ≥ 1, p1 ≥ 0, . . . ,pr ≥ 0, p1 + p2 + ··· + pr = 1), falls für nk , k = 1, . . . ,r mit nk ≥ 0 und n1 + . . . + nr = n P(X1 = n1, . . . ,Xr = nr) = ! n1 ! ∗n2 ! ∗··· ∗nr ! * (p1n1 ) * (p2 n2) * ∙∙∙*(pr nr ) Wir schreiben: (X1, . . . ,Xr) ~ Mult(n; p1, . . . ,pr). Für die Wahrscheinlichkeit P(X1 = n1, . . . ,Xr = nr) schreiben wir Mult (n1 , . . . , nr; n; p1, . . . ,pr) Es gilt: Xk ~ Bin(n, pk) für k = 1, . . . ,r. WS 2016/2017 Hans-Peter Hafner htw saar 24 Übung 7 Im Tierheim gibt es 80 Katzen, 60 Hunde, 20 Meerschweinchen, 10 Hamster und 30 Kaninchen. Wie groß ist die Wahrscheinlichkeit, dass unter 20 zufällig ausgewählten Tieren a) genau 8 Katzen, 4 Hunde, 2 Meerschweinchen, 2 Kaninchen und 4 Hamster sind? b) kein Hamster ist? c) nur Katzen sind? WS 2016/2017 Hans-Peter Hafner htw saar 25 Literatur Henze Kapitel 3, 6.3, 12, 18, 20 Behrens 5.1 WS 2016/2017 Hans-Peter Hafner