WS 3.2 und WS 3.3 - Die Binomialverteilung Eine Zufallsvariable, die beschreibt, wie oft ein mehrmals durchgeführtes Zufallsexperiment günstig realisiert, heißt binomialverteilt, wenn sie folgenden Kriterien genügt: 1. Das zugrundeliegende Zufallsexperiment hat nur genau zwei mögliche Ausgänge: günstig und ungünstig. 2. Die Zufallsexperimente sind voneinander unabhängig. Das bedeutet, die Wahrscheinlichkeiten für einen günstigen bzw. einen ungünstigen Ausgang des Zufallsexperiments ändern sich nicht während der Versuchsreihe. Entscheidend, ob nur zwei Ausgänge möglich sind, ist oft die Fragestellung. Bsp: Ein Würfel wird mehrmals geworfen, und die Zufallsvariable X bezeichnet, wie oft die Zahl „6“ geworfen wird. Hier gibt es zwar sechs mögliche Ausgänge des Zufallsexperiments, nämlich {1, 2, 3, 4, 5, 6}, aber die Menge {6} wird als günstiges Ereignis, die Menge {1, 2, 3, 4, 5} als ungünstiges Ereignis betrachtet. So betrachtet gibt es nur zwei Ereignisse. Wenn das Zufallsexperiment aus einer Auswahl besteht, ist es wichtig, dass die Grundmenge immer wieder ergänzt wird, sonst verschieben sich die Wahrscheinlichkeiten, und die Zufallsvariable ist nicht binomialverteilt. Bsp: Aus einer Kiste mit 5 blauen und 4 roten Bällen werden 2 Bälle gezogen. Die Zufallsvariable X beschreibt die Anzahl der gezogenen blauen Bälle. a) Wenn der erste Ball nach dem Ziehen zurückgelegt wird, ist die Wahrscheinlichkeit, einen blauen Ball zu ziehen wieder dieselbe, nämlich 5 , die Zufallsvariable ist also binomialverteilt. 9 b) Wenn der erste Ball nicht wieder zurückgelegt wird, ändert sich die Wahrscheinlichkeit beim zweiten Versuch einen blauen Ball zu ziehen abhängig vom Ergebnis des ersten Zuges. Wenn beim ersten Versuch ein blauer Ball gezogen wurde ist die Wahrscheinlichkeit beim zweiten Versuch wieder einen blauen Ball zu ziehen etwas kleiner als 5 4 , nämlich . Wenn beim ersten 9 8 Versuch ein roter Ball gezogen wurde ist die Wahrscheinlichkeit beim zweiten Versuch einen blauen Ball zu ziehen etwas größer als 5 5 , nämlich . Die Experimente sind also nicht unabhängig, die 9 8 Wahrscheinlichkeiten ändern sich, die Zufallsvariable ist nicht binomialverteilt. Die Unabhängigkeit der Zufallsexperimente ist beispielsweise immer dann etwas zweifelhaft, wenn Trainings- oder Ermüdungseffekte eine Rolle spielen könnten. Bsp: Ein Kind wirft im Laufe einer Trainingswoche 200 Mal mit dem Basketball einen Freiwurf, es trifft mit einer Wahrscheinlichkeit von 40%. X beschreibt die Anzahl der geworfenen Körbe. Hier kann man die konstant bleibende Wahrscheinlichkeit anzweifeln. Wahrscheinlichkeitsfunktion, Erwartungswert, Varianz und Standardabweichung der Binomialverteilung Die bei der Binomialverteilung üblichen Notationen sind: n Anzahl der Versuche k Anzahl der günstigen Ereignisse p Wahrscheinlichkeit, dass bei einem Versuch das günstige Ereignis realisiert q Wahrscheinlichkeit, dass bei einem Versuch das ungünstige Ereignis realisiert: q = 1-p P(X=k) Die Wahrscheinlichkeit, dass die Zufallsvariable X den Wert k annimmt, also die Wahrscheinlichkeit, dass bei n Versuchen k-mal das günstige Ereignis realisiert Die Wahrscheinlichkeitsfunktion lautet: n P( X k ) p k q n k k Für den Erwartungswert µ gilt: n p Für die Varianz 2 gilt: 2 n p q Für die Standardabweichung gilt: n p q Bsp: In einer Firma werden die Produkte in der Qualitätskontrolle vor dem Ausliefern noch einmal überprüft. Aus Erfahrung weiß man, dass im Mittel 15% der Produkte fehlerhaft sind. Es werden 40 Produkte überprüft. Die Zufallsvariable X beschreibt die Anzahl der fehlerhaften Produkte. a) Ist X binomialverteilt? b) Wie groß ist die Wahrscheinlichkeit, dass von diesen 40 genau 8 Produkte fehlerhaft sind? c) Berechne Erwartungswert µ und die Standardabweichung und interpretiere das Intervall 2 ; 2 a) Die 40 Überprüfungen sind eine Reihe von Versuchen mit immer nur zwei Ausgängen, fehlerhaft oder nicht. Aber ob die Versuche wirklich unabhängig sind, kann bezweifelt werden. Es kann leicht sein, dass Aufgrund z.B. eines Maschinenfehlers gleich mehrere Produkte hintereinander fehlerhaft sind. Trotzdem nehmen wir für b) und c) eine Binomialverteilung an. 40 P( X 8) 0,158 0,8532 0,1087 10,87% 8 c) 40 0,15 6 b) 40 0,15 0,85 2, 26 Mit ca. 95% Wahrscheinlichkeit wird bei dieser Überprüfung die Anzahl der fehlerhaften Produkte im Intervall 6 4,52;6 4,52 [1, 48; 10,52] , also eigentlich (da hier nur ganzzahlige Werte angenommen werden können) im Intervall [2; 10] liegen.