3. Approximation der Binomialverteilung durch die Normalverteilung Bsp1: Ein Spielwürfel wird 612 - Mal geworfen. Die Zufallsvariable π beschreibt die Anzahl der Sechsen. 1 Die Zufallsvariable π ist binomialverteilt mit π = 612 und π = 6. π = πΈ(π) = π β π = 102 π = √π(π) = √π β π β (1 − π) = √85 ≈ 9,129 Die Zufallsvariable π sei normalverteilt mit den Parametern π = 100 und π = √85 In folgender Abbildung ist die Wahrscheinlichkeitsverteilung von π als Histogramm und der Graph der Dichtefunktion der Zufallsvariable π dargestellt. 0,04 0,03 0,02 0,01 0 70 75 80 85 90 95 100 105 110 115 120 125 130 Da die Balken des Histogramms die Breite 1 und die Höhe π(π = π) haben, ist ihr Flächeninhalt gleich der Wahrscheinlichkeit π(π = π). π Summe der Rechtecke des Histogramms der Binomialverteilung im Intervall [0; π] π(π ≤ π) = ∑ π(π = π) π=0 π(π ≤ π) = 1 √2π β π π 1 π₯−π 2 ) π β ∫ π −2β( −∞ ππ₯ Fläche unter der Dichtefunktion der Normalverteilung im Intervall [−∞; π] Wir berechnen die Wahrscheinlichkeit π(π ≤ 120): 1 π(π ≤ π) = π΅πΌπππππΈπ π (120; 612; 6) = 0,97577 π(π ≤ π) ≈ π(π ≤ π) = πππ πππΈπ π(120; 102; √85) = 0,97455 Bsp2: In einer Meinungsumfrage werden 400 Personen befragt, ob sie eine bestimmte Partei wählen werden. Lediglich 50 Personen geben an, dass sie die Partei wählen werden. Die Zufallsvariable π, welche die Anzahl der Befragten wiedergibt, die angeben die Partei zu wählen, ist binomialverteilt mit π = 400 und dem unbekannten Anteilswert π. Punktschätzung: πΜ = 50 = 0,125 = 12,5% 400 Berechnung der unteren Grenze ππ’ eines 95% - Konfidenzintervalls 400 π(π ≥ 50) = 0,025 → 400 ) β ππ β (1 − π)400−π = 0,025 π ∑ ( π=50 Die Wahrscheinlichkeit, dass mindestens 50 Befragte angeben die Partei zu wählen, wird kleiner, wenn sich der Anteilswert π verringert. Je kleiner der unbekannte Anteilswert π ist, desto unwahrscheinlicher ist es, dass mindestens 50 Befragte angeben die Partei zu wählen. Somit ist die untere Grenze ππ’ der kleinste Anteilswert, bei dem noch angenommen wird, dass mindestens 50 Befragte angeben die Partei zu wählen. Für kleinere Werte von π erscheint dies zu unwahrscheinlich, da die Wahrscheinlichkeit unter 2,5% fällt. π(π ≥ 50) = 0,025 π(π ≤ 49) = 0,975 ππ’ = π΅πΈππ΄πΌππ(0,025; 50; 351) = 0,09422 Berechnung der oberen Grenze ππ eines 95% - Konfidenzintervalls 50 π(π ≤ 50) = 0,025 → 400 ) β ππ β (1 − π)400−π = 0,025 π ∑( π=0 Die Wahrscheinlichkeit, dass höchstens 50 Befragte angeben die Partei zu wählen, wird kleiner, wenn sich der Anteilswert π erhöht. Je größer der Anteilswert π ist, desto unwahrscheinlicher ist es, dass höchstens 50 Befragte angeben die Partei zu wählen. Somit ist die obere Grenze ππ der größte Anteilswert, bei dem noch angenommen wird, dass höchstens 50 Befragte angeben die Partei zu wählen. Für größere Werte von π erscheint dies zu unwahrscheinlich, da die Wahrscheinlichkeit unter 2,5% fällt. π(π ≤ 50) = 0,025 ππ = π΅πΈππ΄πΌππ(0,975; 51; 350) = 0,16146 Im Intervall [0,09422; 0,16146] liegt der unbekannte Wähleranteil π mit einer Wahrscheinlichkeit von 95%. Approximation mit Hilfe der Normalverteilung: Wir nehmen die Zufallsvariable π als normalverteilt mit π = π β πΜ = 400 β 0,125 = 50 und π = √π β πΜ β (1 − πΜ ) = √43,75 ≈ 6,614 an. Wir berechnen ein zum Erwartungswert π symmetrisches Intervall, dass die Anzahl der Befragten, die angeben die Partei zu wählen. mit einer Wahrscheinlichkeit von πΎ = 95% enthält: π(π − π ≤ π ≤ π + π) = πΎ π₯−π π+π−π π = = π π π π = π§βπ π§= Φ(π§) = 1 − πΌ 2 πΌ z = Φ−1 (1 − ) 2 π(π − π§ β π ≤ π ≤ π + π§ β π) = πΎ π (π β πΜ − π§ β √π β πΜ β (1 − πΜ ) ≤ π ≤ π β πΜ + π§ β √π β πΜ β (1 − πΜ )) = πΎ π (πΜ − π§ π π§ β √π β πΜ β (1 − πΜ ) ≤ ≤ πΜ + β √π β πΜ β (1 − πΜ )) = πΎ π π π π β πΜ β (1 − πΜ ) π β πΜ β (1 − πΜ ) √ π (πΜ − π§ β √ ≤ π ≤ πΜ + π§ β )=πΎ π2 π2 πΜ β (1 − πΜ ) πΜ β (1 − πΜ ) π (πΜ − π§ β √ ≤ π ≤ πΜ + π§ β √ )=πΎ π π Näherungsformel zur Berechnung eine πΎ - Konfidenzintervalls πΌ z = Φ−1 (1 − ) , wobei πΌ = 1 − πΎ 2 πΜ β (1 − πΜ ) ππ’ = πΜ − π§ β √ π πΜ β (1 − πΜ ) ππ = πΜ + π§ β √ π Wenn diese Formel verwendet wird, sollte π ≥ 50 und π − π ≥ 50 sein. Trotzdem kann die Verwendung des Standard-Intervalls problematisch sein. Für die gegebene Meinungsumfrage ist π = 400 und πΜ = 0,125. πΌ = 1 − πΎ = 1 − 0,95 = 0,05 πΌ z = Φ−1 (1 − ) = Φ−1 (0,975) = πππ ππΌππ(0,975; 0; 1) = 1,959963985 ≈ 1,96 2 πΜ β (1 − πΜ ) ππ’ = πΜ − π§ β √ = 0,09259 π π0 = πΜ + π§ β √ πΜ β (1 − πΜ ) = 0,15741 π Die Näherungsformel ergibt das Konfidenzintervall [0,09259; 0,15741], die exakte Berechnung mit der Binomialverteilung das Konfidenzintervall [0,09422; 0,16146]. Bsp3: In einer Meinungsumfrage unter 500 zufällig ausgewählten Personen zu Gentechnik in Lebensmitteln lehnen 80% der Befragten diese ab. Aufgrund dieses Ergebnisses gibt das Meinungsforschungsinstitut an, dass der Anteil der Personen, die Gentechnik in Lebensmitteln ablehnen, zwischen 76% und 84% liegt. Mit welcher Sicherheit kann diese Behauptung aufgestellt werden? D.h. mit welcher Wahrscheinlichkeit liegt die Anzahl der Befragten die die Gentechnik ablehnen im vom Meinungsforschungsinstitut angegebenen Konfidenzintervall? Berechnung der Überdeckungswahrscheinlichkeit mit der Binomialverteilung: 0,76 β 500 = 380 0,84 β 500 = 420 π(380 ≤ π ≤ 420) = π΅πΌπππππΈπ π(420; 500; 0,8; 1) − π΅πΌπππππΈπ π(379; 500; 0,8; 1) π(380 ≤ π ≤ 420) = 0,97824 Mit einer Wahrscheinlichkeit von 97,8% kann gesagt werden, dass der Anteil der Personen, die Gentechnik in Lebensmitteln ablehnen, zwischen 76% und 84% liegt. Berechnung der Überdeckungswahrscheinlichkeit mit der Normalverteilung: π = π β πΜ = 500 β 0,8 = 400 0,76 β 500 = 380 π = √π β πΜ β (1 − πΜ ) = √80 ≈ 8,944 0,84 β 500 = 420 π(380 ≤ π ≤ 420) ≈ πππ πππΈπ π(420; 400; √80; 1) − πππ πππΈπ π(380; 400; √80; 1) π(380 ≤ π ≤ 420) ≈ 0,97465 Mit einer Wahrscheinlichkeit von 97,5% kann gesagt werden, dass der Anteil der Personen, die Gentechnik in Lebensmitteln ablehnen, zwischen 76% und 84% liegt. Bsp4: Berechne die Überdeckungswahrscheinlichkeiten für die in Bsp2 ermittelten Konfidenzintervalle mit Hilfe der Binomialverteilung. Beachte: Die Berechnung mit Hilfe der Näherungsformel liefert das Konfidenzintervall [0,09259; 0,15741] mit einer Überdeckungswahrscheinlichkeit von 0,94178. Die Überdeckungswahrscheinlichkeit liegt somit unter den geforderten 95%. Die exakte Berechnung mit Hilfe der Binomialverteilung liefert das Konfidenzintervall [0,09422; 0,16146] mit einer Überdeckungswahrscheinlichkeit von 0,95754. Bsp5: Eine Fluggesellschaft weiß aus Erfahrung, dass bei Langstreckenflügen 10% der gebuchten Tickets nicht in Anspruch genommen werden. Sie setzt für diese Flüge Flugzeuge vom Typ Airbus A380-800 mit 526 Sitzplätzen ein. Wie viele Plätze dürfen überbucht werden, damit das Risiko Fluggäste zurückweisen zu müssen höchstens 1% beträgt? Berechnung mit der Binomialverteilung: π … Anzahl der erscheinenden Fluggäste; π = unbekannt; π = 0,9 π(π ≤ 526) = 0,99 → π = 567 Soll das Risiko, dass Fluggäste zurückgewiesen werden müssen höchstens 1% betragen so dürfen nicht mehr als 41 Plätze überbucht werden. Berechnung mit der Standardnormalverteilung: π(π ≤ π§) = 0,99 → π§ = πππ ππΌππ(0,99; 0; 1) = 2,326347874 π−π π 526 − π π§= π π= π§ β √π β 0,9 β 0,1 = 526 − π β 0,9 π§ 2 β π β 0,09 = (526 − π β 0,9)2 Die Gleichung besitzt die Lösungen π1 = 565,996 ≈ 566 und π2 = 603,494 ≈ 603.