Hochschule Harz Fachbereich Automatisierung und Informatik Prof. Dr. T. Schade Fit for Abi & Study - April 2014 Lösungen zu den Aufgaben zu elementarer Wahrscheinlichkeitsrechnung 1. a) b) c) 2. 12 20 8 20 · · 11 19 7 19 · · 10 18 6 18 (122)·(82) = (204) · · 9 17 5 17 616 1615 = = 33 = 0.102 19·17 14 = 0.014 969 = 0.38. a) P(mindestens eine 6) = 1− P(keine 6) = 1 − b) 25 216 5 3 6 = 1 − 0.5787 = 0.4213. c) Anzahl Ergebnisse mit verschiedenen Augenzahlen: 6 · 5 · 4 = 120, Anzahl Ergebnisse mit drei gleichen Augenzahlen: 6, also gibt es 216 − 120 = 96 Ergebnisse mit mindestens zwei gleichen Zahlen: P (mindestens zwei gleiche Augenzahlen) = 96 = 0.4 216 3. Die Anzahl aller Möglichkeiten, aus n = 10 Gebieten drei auszuwählen, ist 720 10 = = 120. 3 6 a) Die Anzahl günstiger Möglichkeiten ist gleich derAnzahl Möglichkeiten, aus 5 den 5 vorbereiteten Gebieten drei auszuwählen: = 10. Deshalb ist 3 10 = 0.083̄. P (X = 3) = 120 b) Die Anzahl Möglichkeiten, aus den 5 vorbereiteten Gebieten zwei auszuwählen und das dritte Prüfungsgebiet aus den 5 nicht vorbereiteten ist: 5 5 · = 50. 2 1 Deshalb ist P (X = 2) = 50 120 = 0.416̄. c) Analog zu a) ist P (X = 0) = 10 120 = 0.083̄. Hat sich der Prüfling auf 6 Gebiete vorbereitet, so gibt es 6 a) = 20 Möglichkeiten, aus diesen Gebieten drei auszuwählen. Deshalb 3 20 = 0.16̄. ist P (X = 3) = 120 6 4 b) · = 15 · 4 = 60 Möglichkeiten, aus den vorbereiteten Gebieten 2 1 zwei und aus den nicht vorbereiteten eins auszuwählen. Deshalb ist 60 = 0.5. P (X = 2) = 120 4 c) = 4 Möglichkeiten, aus den nicht vorbereiteten Gebieten drei aus3 4 zuwählen, so dass P (X = 0) = 120 = 0.03̄. 4. a) 1 3. b) 2 5. c) 0.2. 5. Der erwartete Gewinn ist (Achtung: der Einsatz von 1 Euro ist immer abzuziehen!) E(X) = 0.75 · (−1) + 0.2 · 1 + 0.04 · 4 + 0.01 · 9 = −0.3 Sie verlieren also (erwartet) bei jedem Spiel 30 Cent. 6. Wir bezeichnen die Ereignisse mit A: es gibt Alarm wissen wir: P (A|B̄) = 0.01, P (Ā|B) = 0.05 und B: es brennt. und P (B) = 0.1, also Dann P (B̄) = 0.9. Ausserdem gilt P (A|B̄) + P (Ā|B̄) = 1 ⇒ P (Ā|B̄) = 1 − 0.01 = 0.99 P (Ā|B) + P (A|B) = 1 ⇒ P (A|B) = 1 − 0.05 = 0.95, P (Ā ∩ B̄) P (A ∩ B̄) P (Ā ∩ B) P (A ∩ B) = = = = so dass P (Ā|B̄) · P (B̄) = 0.891, P (A|B̄) · P (B̄) = 0.009, P (Ā|B) · P (B) = 0.005, P (A|B) · P (B) = 0.095. a) Gesucht ist die Wahrscheinlichkeit P (B|A) = 0.095 0.095 P (A ∩ B) = = = 0.9135. P (A) 0.009 + 0.095 P (A ∩ B̄) + P (A ∩ B) b) Hier ist gesucht P (B|Ā) = 0.005 P (B ∩ Ā) = = 0.00558. 0.005 + 0.891 P (Ā ∩ B) + P (Ā ∩ B̄) 7. Mit K: Person hat die Krankheit und T: Test zeigt Krankheit an kennen wir folgende Wahrscheinlichkeiten: P (K) = 0.05, P (K) = 0.95, P (T | K) = 0.96, P (T | K) = 0.16. Damit wissen wir auch P (T | K) = 1 − P (T | K) = 0.04, P (T | K) = 1 − P (T | K) = 0.84. und P (T ∩ K) = P (T | K) · P (K) = 0.04 · 0.05 = 0.002, P (T ∩ K) = P (T | K) · P (K) = 0.96 · 0.05 = 0.048, P (T ∩ K) = P (T | K) · P (K) = 0.16 · 0.95 = 0.152 P (T ∩ K) = P (T | K) · P (K) = 0.84 · 0.95 = 0.798, Damit ist P (T ) = P (T ∩ K) + P (T ∩ K) = 0.2, also P (T ) = 0.8. a) P (K | T ) = P (T ∩K) P (T ) = 0.002 0.8 = 0.0025, b) P (K | T ) = P (K∩T ) P (T ) = 0.152 0.2 = 0.76. 8. Wir bezeichnen mit S: Versicherter verursacht Schadensfall und mit U25: Versicherter ist unter 25 Jahre alt. Die folgenden Wahrscheinlichkeiten sind gegeben: P (S|U 25) = 0.24, P (S|U 25) = 0.08 und P (U 25) = 0.1. Dann kennen wir auch die Wahrscheinlichkeiten P (S|U 25) = 1 − P (S|U 25) = 0.76, P (S|U 25) = 1 − P (S|U 25) = 0.92 und P (U 25) = 0.9. a) Gefragt ist P (S) = P (S ∩ U 25) + P (S ∩ U 25) = P (S|U 25) · P (U 25) + P (S|U 25) · P (U 25) = 0.24 · 0.1 + 0.08 · 0.9 = 0.096. b) Wir suchen P (U 25|S) = P (S|U 25) · P (U 25) 0.24 · 0.1 P (U 25 ∩ S) = = = 0.25 P (S) P (S) 0.096 9. Wir schreiben R für einen Regentag und R für einen Tag ohne Regen, und hängen das Wetter an den nächsten drei Tagen hintereinander: R R R bedeutet z.B. kein Regen, danach Regen, dann wieder kein Regen. Das Wetter in den nächsten Tagen, wenn wir am dritten Tag keinen Regen haben wollen, könnte so aussehen: RRR, RRR, RRR, RRR a) Wenn es heute trocken ist, sehen die Wahrscheinlichkeiten so aus: P (RRR) = 0.8 · 0.8 · 0.8 = 0.512 P (RRR) = 0.8 · 0.2 · 0.3 = 0.048 P (RRR) = 0.2 · 0.3 · 0.8 = 0.048 P (RRR) = 0.2 · 0.7 · 0.3 = 0.042 Also ist P(in drei Tagen kein Regen) = 0.65 und P(in drei Tagen Regen) = 0.35. b) Wenn es heute regnet, sehen die Wahrscheinlichkeiten so aus: P (RRR) = 0.3 · 0.8 · 0.8 = 0.192 P (RRR) = 0.3 · 0.2 · 0.3 = 0.018 P (RRR) = 0.7 · 0.3 · 0.8 = 0.168 P (RRR) = 0.7 · 0.7 · 0.3 = 0.147 Also ist P(in drei Tagen kein Regen) = 0.525 und P(in drei Tagen Regen) = 0.475 Hochschule Harz Fachbereich Automatisierung und Informatik Prof. Dr. T. Schade Fit for Abi & Study - April 2014 Aufgaben zu Binomial- und Normalverteilung 1. Es liegt eine Binomialverteilung mit p = 1 8 vor. a) Wskeit für keinen Gewinn beim Kauf von 10 Losen: 10 7 P ( kein Gewinn) = = 0.263. 8 b) P(mindestens zwei Gewinne) = 1 - ( P(kein Gewinn) + P(ein Gewinn)): 20 19 ! 7 20 1 7 P (≥ 2 Gewinne) = 1 − + 8 1 8 8 = 1 − (0.0692 + 0.1977) = 0.7331. Erwartungswert einer Binomialverteilung: E(X) = n·p, also beim Kauf von n = 32 Losen: E(X) = 4. 2. Binomialverteilung mit p = 0.85 a) Gesucht ist P (k = 9) bei n = 10: 10 P (k = 9) = (0.85)9 · 0.15 = 0.3474. 1 b) Mit n = 100, p = 0.15 ist gesucht 100 P (k = 3) = (0.15)3 · (0.85)97 = 0.0000777. 3 Ist X = Anzahl Rhesus-positiver Personen in einer Stichprobe von 500 Personen, so ist X ∼ B(500, 0.85). Wir können X durch eine normalverteilte Zufallsvariable Y ∼ N (µ, σ 2 ) approximieren, wobei µ = 500 · 0.85 = 425 und σ 2 = 63.75. Wir suchen also ein Intervall, in dem Y mit einer Wahrscheinlichkeit von mindestens 95 % liegt. Wir transformieren Y auf die standardnormalverteilte Zufallsvariable Y −425 : Z=√ 63.75 P (425 − w ≤ X ≤ 425 + w) ≈ P (425 − w ≤ Y ≤ 425 + w) w −w ≤Z≤ √ ) = P (−w ≤ Y − 425 ≤ w) = P ( √ 63.75 63.75 w −w = Φ( √ ) − Φ( √ ) 63.75 63.75 w )−1 = 2 · Φ( √ 63.75 Diese Wahrscheinlichkeit soll mindestens 95 % betragen, also w ) − 1 ≥ 0.95 63.75 w 1.95 Φ( √ ) ≥ = 0.975 2 63.75 2 · Φ( √ Also muss lung ist. √w 63.75 ≥ c gelten, wobei c das 0.975-Quantil der Standardnormalverteiw ≥c· √ 63.75 = 1.96 · 7.984 = 15.65. Wir erhalten also das Intervall [425 − 16, 425 + 16] = [409, 441]. (Benutzen wir die Binomialverteilung selbst, erhalten wir für P (X ∈ [409, 441]) = 0.9615. Für das kleinere Intervall [410, 440] ist P (X ∈ [410, 440]) = 0.948.) 3. Binomialverteilung mit Erfolgswahrscheinlichkeit p ≤ 0.03 (wir rechnen mit p = 0.03, dem worst case“ ). ” a) Das Ereignis Von 10 Glühbirnen mindestens eine defekt“ ist das Gegenteil ” von Von 10 Glühbirnen keine defekt“ . Diese Wahrscheinlichkeit ist einfach ” auszurechnen: 10 0.030 0.9710 = 1 · 1 · 0.7374 = 0.7374. P (keine defekt ) = 0 Damit ist also P ( mindestens eine defekt ) = 1 − 0.7374 = 0.2626. b) Die Wahrscheinlichkeit, dass von 100 Glühbirnen höchstens 3 defekt sind, ist 3 X 100 P (X ≤ 3) = 0.03i 0.97100−i i i=0 = (0.04755 + 0.14707 + 0.22515 + 0.22747) = 0.64724 c) Wir suchen k, so dass gilt: k X 50 0.03i 0.9750−i ≥ 0.95. P (X ≤ k | n = 50) = i i=0 Wir berechnen P (X = i | n = 50) für i = 0, 1, . . .: 50 P (X = 0) = · 0.030 · 0.9750 0 50 P (X = 1) = · 0.031 · 0.9749 1 50 P (X = 2) = · 0.032 · 0.9748 2 50 P (X = 3) = · 0.033 · 0.9747 3 50 P (X = 4) = · 0.034 · 0.9746 4 = 0.218 = 0.337 = 0.256 = 0.126 = 0.046 Damit ist also P (X ≤ 3) = 0.937 und P (X ≤ 4) = 0.983. Wir müssen also k mindestens 4 wählen. 4. Binomialverteilung mit p = 0.8. 15 5 a) P(15 Treffer) = 20 15 · 0.8 · 0.2 = 0.175 b) n = 30 P (mindestens 27 Treffer) = 30 X 30 0.8i 0.230−i i i=27 = 0.0785 + 0.0337 + 0.0093 + 0.0012 = 0.1227 Bei n = 40 Würfen ist 40 X 40 0.8i 0.240−i P (X ≤ 36) = 1 − i i=37 = 1 − (0.0205 + 0.0065 + 0.0013 + 0.0001) = 0.9715 40 X 40 0.8i 0.240−i P (X > 38) = i i=39 = 0.0013 + 0.0001 = 0.0014 30 X 40 P (28 ≤ X ≤ 30) = 0.8i 0.240−i i i=28 = = 0.0443 + 0.0733 + 0.1075 = 0.225 P (32 < X < 37) = P (33 ≤ X ≤ 36) 36 X 40 = 0.8i 0.240−i i i=33 = 0.1513 + 0.1246 + 0.0854 + 0.0475 = 0.4087 Mit Approximation durch die normalverteilte Zufallsvariable Y , wobei µ = 32 und σ 2 = 6.4, ist ohne Stetigkeitskorrektur Y − 32 36 − 32 ≤ P (X ≤ 36) ≈ P (Y ≤ 36) = Φ σ 2.53 = Φ(1.58) = 0.9429 37 − 32 P (X > 38) ≈ 1 − P (Y ≤ 37) = 1 − Φ Z ≤ 2.53 = 1 − Φ(1.98) = 1 − 0.976 = 0.024 30 − 32 27 − 32 P (28 ≤ X ≤ 30) ≈ P (Y ≤ 30) − P (Y ≤ 27) = Φ( ) − Φ( ) 2.53 2.53 = Φ(−0.79) − Φ(−1.98) = (1 − 0.7852) − (1 − 0.976) = 0.1905 32 − 32 36 − 32 ) − Φ( ) P (32 < X < 37) ≈ P (Y ≤ 36) − P (Y ≤ 32) = Φ( 2.53 2.53 = Φ(1.5811) − Φ(0) = 0.9429 − 0.5 = 0.4429 Mit Stetigkeitkorrektur erhält man P (X ≤ 36) ≈ P (Y ≤ 36 + 0.5) = Φ = Φ(1.78) = 0.9624 P (X > 38) ≈ = P (28 ≤ X ≤ 30) ≈ = P (32 < X < 37) ≈ = Y − 32 36.5 − 32 ≤ σ 2.53 38.5 − 32 1 − P (Y ≤ 38 + 0.5) = 1 − Φ Z ≤ 2.53 1 − Φ(2.57) = 1 − 0.9949 = 0.0051 27.5 − 32 30.5 − 32 ) − Φ( ) P (28 − 0.5 ≤ Y ≤ 30 + 0.5) = Φ( 2.53 2.53 Φ(−0.5929) − Φ(−1.78) = (1 − 0.7224) − (1 − 0.9625) = 0.24 32.5 − 32 36.5 − 32 ) − Φ( ) P (33 − 0.5 ≤ Y ≤ 36 + 0.5) = Φ( 2.53 2.53 Φ(1.78) − Φ(0.198) = 0.9625 − 0.5793 = 0.383. Die Approximation ist nicht sehr gut, weil np(1 − p) = 40 · 0.8 · 0.2 = 6.4 < 9. (Faustregel: die Approximation ist gut genug, wenn np(1 − p) > 9) 5. Ist X ∼ N (5, σ 2 = 0.152 ), so ist Y = a) P (X < 5.3) = P (Y < 0.3 0.15 ) X−5 0.15 standardnormalverteilt. Damit ist = Φ(2) = 0.9772. b) P (X > 5.2) = 1−P (X ≤ 5.2) = 1−P (Y < 0.0918. 0.2 0.15 ) = 1−Φ(1.33) = 1−0.9082 = 0.15 0.15 c) P (4.85 < X ≤ 5.15) = P (− 0.15 < Y ≤ 0.15 ) = 2 · Φ(1) − 1 = 2 · 0.8413 − 1 = 0.6826, d.h. der Ausschussanteil beträgt 31.74 %. 6. Wir bezeichnen die tatsächliche Füllmenge mit X, dann ist X normalverteilt mit µ = 50 und σ = 0.8 und Z = X−50 0.8 ist standardnormalverteilt. 1 a) P (X < 49) = P (Z < − 0.8 ) = Φ(−1.25) = 1 − 0.8944 = 0.1056. b) P (X > 52) = 1 − P (X ≤ 52) = 1 − P (Z ≤ 0.0062. c) Jetzt ist X ∼ N (50, σ = 1.2) und Z = P (X < 49) = P (X < 49) = P (X > 52) = 7. X−50 1.2 2 0.8 ) = 1 − Φ(2.5) = 1 − 0.9938 = ∼ N (0, 1). Dann ist 1 P (Z < − 1.2 ) = Φ(−0.833) = 1 − 0.7967 = 0.2033. 1 P (Z < − 1.2 ) = Φ(−0.833) = 1 − 0.7967 = 0.2033. 2 1 − P (Z < 1.2 ) = 1 − Φ(1.67) = 1 − 0.9525 = 0.0475. a) Der Schätzwert für den Erwartungswert µ einer Normalverteilung ist der arithmetische Mittelwert x̄ der Stichprobe, also für µ : x̄ = für σ 2 : σ̂ 2 = = 1 12 (35.6 + . . . + 34.0) = 35.3, 1 P 2 i (xi − x̄) n−1 1 2 11 ((35.6 − 35.3) + . . . + (34.0 − 35.3)2 ) = 3.444 b) Der Erwartungswert für den Ertrag auf 100 Hektar beträgt 100 · 35.3 = 3530 dt. c) Gesucht ist P(X ≥ 32) bei einer Normalverteilung mit Parametern µ = 35.3 und σ 2 = 3.444: 32 − 35.3 X −µ < √ ) σ 3.444 = 1 − Φ(−1.7782) = 1 − (1 − 0.9625) = 0.9625. P (X ≥ 32) = 1 − P (X < 32) = 1 − P ( d) Das Konfidenzintervall für µ bei bekanntem σ ist [x̄ − c √σn , x̄ − c √σn ], wobei √ σ = 3.5. c ist der Wert, für den gilt Φ(c) = 1+γ , 2 hier also Φ(c) = 0.975. Dabei ist Φ die Verteilungsfunktion der Standardnormalverteilung. Aus einer Tabelle lesen wir für c den Wert 1.96 ab. Der arithmetische Mittelwert der Stichprobe ist x̄ = 35.3. Damit ist das Konfidenzintervall für µ: r r 3.5 3.5 , 35.3 + 1.96 ] = [ 34.24 , 36.36 ]. [ 35.3 − 1.96 12 12 Hochschule Harz Fachbereich Automatisierung und Informatik Prof. Dr. T. Schade Fit for Abi & Study - April 2014 Lösungen zu den Aufgaben zu statistischen Tests 1. Einseitiger Gauß-Test für eine binomialverteilte Grundgesamtheit der Nullhypothese H0 : p ≤ p0 = 0.5. Mit n = 3000 und p̂ = 0.526 erhält man für die Testgröße √ √ (p̂ − p0 ) n (0.526 − 0.5) 3000 √ = 2.848. U=p = 0.5 · 0.5 p0 (1 − p0 ) Der Annahmebereich für die Nullhypothese liegt bei kleinen Werten von U im Intervall (−∞, c] wobei c das 0.99- Quantil der Standardnormalverteilung ist. Aus einer Tabelle lesen wir c = 2.325 ab. Die Nullhypothese kann also mit Irrtumswahrscheinlichkeit α = 0.01 abgelehnt werden, da U > c. 2. Einseitiger Gauß-Test für eine binomialverteilte Grundgesamtheit der Nullhypothese H0 : p ≤ p0 = 0.03. Mit n = 500 und p̂ = 0.042 erhält man für die Testgröße U = 1.573. Die Nullhypothese kann bei α = 0.05 nicht abgelehnt werden, da U < c = 1.645 (0.95-Quantil der Standardnormalverteilung). 3. Einseitiger Gauss-Test für eine binomialverteilte Grundgesamtheit, H0 : p ≤ 0.08. Mit p̂ = 0.11 ist die Testgröße U = 1.5639, der Annahmebereich ist (−∞, 1.75], also wird H0 angenommen. 4. a) Xn ist binomialverteilt mit Parametern n und p = 16 . b) (i) Wir suchen P (X = 5) für X35 ∼ B(35, 61 ). P (X = 5) = 5 30 35 1 5 · · = 0.176 5 6 6 (ii) Wir suchen P (X ≤ 10) für X50 ∼ B(50, 16 ). 10 i 50−i X 50 1 5 P (X ≤ 10) = · · = 0.7986 i 6 6 i=0 (aus Tabelle der Binomialverteilung) c) Jetzt ist n = 100. Wir suchen den Annahmebereich eines zweiseitigen GaussTests für eine binomialverteilte Grundgesamtheit, d.h. wir suchen k1 und k2 , so dass unter H0 gilt P (k1 ≤ X100 ≤ k2 ) ≥ 1 − α = 0.95 oder anders ausgedrückt: P (X100 ≤ k1 − 1) ≤ α = 0.025 2 und P (X100 ≥ k2 + 1) ≤ α = 0.025 2 Die zweite Ungleichung kann man besser so verwenden: P (X100 ≤ k2 ) ≥ 1 − α = 0.975 2 Aus einer Tabelle der Binomialverteilung kann man ablesen: P (X100 ≤ 9) = 0.0213, P (X100 ≤ 10) = 0.0427 also wählen wir k1 = 10, und P (X100 ≤ 23) = 0.9621, P (X100 ≤ 24) = 0.9783 also ist k2 = 24. Damit wird also die Nullhypothese angenommen, wenn die Anzahl der gefundenen farbigen Chips im Intervall [10, 24] liegt, sonst abgelehnt. 5. Die Anzahl X der Kunden, die Interesse an längeren Öffnungszeiten haben, ist binomialverteilt mit unbekannter Wahrscheinlichkeit p. Werden n = 200 Kunden befragt, ist also X ∼ B(200, p). a) Die Nullhypothese H0 : p ≥ p0 = 0.4 wird angenommen, wenn der Anteil p̂ (von Kunden, die längere Öffnungszeiten wollen) in der Stichprobe groß ist und abgelehnt bei kleinem p̂. Der Ablehnungsbereich für den Test ist also [0, pk ] oder, in der Anzahl Kunden ausgedrückt, die bei der Befragung längere Öffnungszeiten gut finden, die Menge {0, 1, 2, . . . , k}. Wir wollen k so bestimmen, dass unter der Voraussetzung p = 0.4 (d.h. H0 stimmt) die Wahrscheinlichkeit für X ≤ k höchstens α = 0.05 beträgt. Berechnen wir die Binomialwahrscheinlichkeiten b(200, 0.4, i) für i = 0, 1, . . . oder schauen sie in einer Tabelle nach, stellen wir fest, dass 68 X i=0 69 X i=0 b(200, 0.4, i) = b(200, 0.4, i) = 68 X 200 i=0 69 X i=0 i 0.4i 0.6200−i = 0.0475 200 0.4i 0.6200−i = 0.0639 i Damit muss als Ablehnungsbereich also {0, 1, . . . 68} gewählt werden. Alternativ kann man auch die Approximation durch die Standardnormalverteilung benutzen. Hier soll H0 abgelehnt werden, wenn √ (p̂ − p0 ) n ≥ c, U=p p0 (1 − p0 ) wobei c das 0.05-Quantil der Standardnormalverteilung ist. Aus einer Tabelle lesen wir c = −1.645 ab. Damit erhalten wir für p0 = 0.4 und n = 200: √ (p̂ − p0 ) n p ≥ c p0 (1 − p0 ) √ (p̂ − 0.4) 200 p ≥ −1.645 0.4(1 − 0.4) √ √ (p̂ − 0.4) 200 ≥ −1.645 · 0.24 = −0.806 −0.3948 √ = −0.057 (p̂ − 0.4) ≥ 200 p̂ ≥ 0.4 − 0.057 = 0.343 Damit wird die Nullhypothese abgelehnt, wenn höchstens p̂ · n = 68.6 der 200 befragten Kunden Interesse an den längeren Öffnungszeiten haben. b) Ist p = 0.25, ist die Anzahl Kunden mit Interesse an längeren Öffnungszeiten X ∼ B(200, 0.25). Die Hypothese H0 aus Teil a) wird angenommen, falls mindestens 69 der 200 befragten Kunden sich für längere Öffnungszeiten aussprechen. Die Wahrscheinlichkeit dafür beträgt 200 X 200 0.25i 0.75200−i i i=69 68 X 200 = 1− 0.25i 0.75200−i i P (X ≥ 69 | p = 0.25) = i=0 = 1 − 0.9983 = 0.0017 6. Zweiseitiger Gauß-Test der Nullhypothese H0 : µ = µ0 = 100. Mit n = 10, σ = 3 und x̄ = 102 erhält man für die Testgröße U = 2.108. Für α = 0.05 ist c = 1.96 und H0 wird abgelehnt, für α = 0.01 ist c = 2.575 und H0 kann nicht abgelehnt werden. 7. Einseitiger t-Test der Nullhypothese H0 : µ ≥ µ0 = 50. Mit n = 12 und x̄ = 42, s = 11.9 berechnet man die Testgröße T = −2.33. Das 0.01-Quantil der t-Verteilung mit 11 Freiheitsgraden ist t11,0.01 = −t11,0.99 = −2.718; der Annahmebereich ist also [−2.718, ∞). Da T > −2.718, kann die Nullhypothese nicht abgelehnt werden. Hochschule Harz Fachbereich Automatisierung und Informatik Prof. Dr. T. Schade Fit for Abi & Study - April 2014 Lösungen zu den alten Abituraufgaben aus Sachsen-Anhalt 1. a) Es handelt sich um Ziehen ohne Zurücklegen“ . Damit ist ” 9 8 7 P (A) = · · = 0.7. 10 9 8 Wird jede einzelne Packung mit Wahrscheinlichkeit p = 0.7 angenommen, so gilt für die Annahme aller 50 Packungen: P (B) = (0.7)50 = 1.8−8 ≈ 0. b) Angegeben sind die folgenden Wahrscheinlichkeiten P (F 1 ∪ F 2) = 0.1, P (F 1) = 0.04, P (F 1 ∩ F 2) = 0.0025. Wegen P (F 1 ∪ F 2) = P (F 1) + P (F 2) − P (F 1 ∩ F 2) ist P (F 2) = P (F 1 ∪ F 2) − P (F 1) + P (F 1 ∩ F 2) = 0.1 − 0.04 + 0.0025 = 0.0625. Die beiden Fehler F1 und F2 sind stochastisch unabhängig, wenn P (F 1 ∩ F 2) = P (F 1) · P (F 2) gilt. Da P (F 1) · P (F 2) = 0.04 · 0.0625 = 0.0025, sind also F1 und F2 stochastisch unabhängig. c) Die Zufallgröße X : Anzahl der fehlerhaften CDR in der Stichprobe von ” n = 100 CDR“ ist binomialverteilt mit n = 100 und unbekannter Wahrscheinlichkeit p. Die Nullhypothese ist H0 : p0 ≤ 0.05. Eine große Anzahl fehlerhafter CDR in der Stichprobe spricht gegen H0 , so dass H0 also für X ∈ {0, 1, . . . k} angenommen wird. (Der Ablehnungsbereich A ist dann A = {k+1, k+2, . . . , 100}. Wir müssen k so wählen, dass bei p = 0.05 die Wahrscheinlichkeit für X ∈ A höchstens α = 0.05 ist. Das bedeutet, dass die Wahrscheinlichkeit für X ∈ A mindestens 1 − α = 0.95 sein muss. Dazu berechnen wir die Wahrscheinlichkeiten für X ≤ k für aufsteigende Werte von k (oder schauen in einer Tabelle nach): 8 X i=0 9 X i=0 b(100, 0.05, i) = b(100, 0.05, i) = 8 X 100 i=0 9 X i=0 i 0.05i 0.95100−i = 0.9369 100 0.05i 0.95100−i = 0.9718 i Damit ist A = {0, 1, . . . 8, 9} und A = {10, 11, . . . , 100}. d) Berechnen Sie die fehlenden Funktionswerte der Verteilungsfunktion der Binomialverteilung B(100,p) (A), wobei A der von Ihnen ermittelte Ablehnungsbereich aus dem letzten Aufgabenteil ist, für verschiedene Werte von p: p = 0.04 : p = 0.05 : p = 0.1 : p = 16 : p = 0.2 : p = 0.3 : 2. B(100,0.04) (A) = B(100,0.05) (A) = B(100,0.1) (A) = B(100, 1 ) (A) = 6 B(100,0.2) (A) = B(100,0.3) (A) ≈ 0.00684 0.02819 0.54871 0.97871 0.99767 1 a) P (Y = 39) = 1 − (0.251 + 0.364 + 0.227 + 0.058) = 0.1. Den Erwartungswert berechnet man aus E(Y ) = 39 · 0.1 + 40 · 0.251 + 41 · 0.364 + 42 · 0.227 + 43 · 0.058 = 40.892. b) (i) X ist binomialverteilt mit Parametern n = 100 und p = 0.9. (ii) Wir berechnen P (X = 90) und P (X ≥ 90): 100 P (X = 90) = 0.990 0.110 = 0.13187, 90 100 89 X X 100 100 i 100−i P (X ≥ 90) = 0.9 0.1 =1− 0.9i 0.1100−i = 0.5831. i i i=90 i=0 Die gesuchte bedingte Wahrscheinlichkeit erhählt man dann aus P (X = 90 | X ≥ 90) = 0.13187 P (X = 90) = = 0.22613. P (X ≥ 90) 0.5831 (iii) Wir müssen k so wählen, dass die Wahrscheinlichkeit P (X ≥ k) mindestens 0.9 beträgt. Das ist gleichbedeutend mit P (X ≤ k − 1) ≤ 0.1 Wir suchen den maximalen Wert von k, für den diese Ungleichung noch gilt und berechnen die Wahrscheinlichkeiten P (X ≤ i) für ansteigendes i (oder lesen die Werte aus einer Tabelle ab). Wir erhalten P (X ≤ 85) = P (X ≤ 86) = 85 X 100 i=0 i 86 X 100 i=0 i 0.9i 0.1100−i = 0.0726 0.9i 0.1100−i = 0.1239 Wir können also k − 1 maximal gleich 85 wählen, damit ist der maximale Wert für k = 86. c) (i) H0 ist die geeignete Nullhypothese. Die irrtümliche Ablehnung der Nullhypothese bedeutet eine irrtümliche Auslösung einer Bestellung, was den schwerwiegenderen Fehler darstellt. Dieser Fehler ist durch das Signifikanzniveau begrenzt. (ii) Berechnung der Wahrscheinlichkeit einer irrtümlichen Bestellung: Die binomialverteilte Zufallsgröße Z hat Parameter n = 500 und (falls H0 zutrifft) p0 = 0.25 (ungünstigster Fall). Wir berechnen die Wahrscheinlichkeit für Z ∈ A, also P (Z ≥ 140) = 1 − P (Z ≤ 139) = 1 − 139 X 500 i=0 i 0.25i 0.75500−i = 0.0684. Benutzen wir die Approximation durch die Normalverteilung mit Parametern µ = n · p = 500 · 0.25 = 125 und σ 2 = np(1 − p) = 93.75, so erhalten wir 139 + 0.5 − µ √ 1 − P (Z ≤ 139) = 1 − Φ σ2 139 + 0.5 − 125 √ = 1−Φ = 1 − Φ(1.5) 93.75 = 1 − 0.9332 = 0.0668. 3. a) (i) Begründung der Binomialverteilung von X: • X beschreibt die Anzahl Treffer“ (= Anzahl fehlgeleiteter Gepäckstücke) ” in einer Bernoulli-Kette der Länge 1000. • Für jedes der Gepäckstücke werden genau zwei Ereignisse, nämlich fehlgeleitet“ oder nicht fehlgeleitet“ unterschieden. ” ” • Die Wahrscheinlichkeit der beiden Ereignisse bleiben in jeder Stufe (für jedes Gepäckstück) unverändert. (ii) Der Erwartungswert ist E(X) = n · p = 1000 · 0.017 = 17, die Standardabweichung σ ist die Wurzel aus der Varianz: V (X) = n · p · (1 − p) = 1000 · 0.017 · 0.983 = 16.711 also ist σ = 4.088. (iii) Wir approximieren Y durch die Normalverteilung mit µ = 17 und σ 2 = 16.711 (mit Stetigkeitskorrektur): P (X ≤ 14) = Φ( −2.5 14 + 0.5 − 17 √ ) = Φ( ) = Φ(−0.61) = 1−Φ(0.61) = 0.2709 4.088 16.711 b) (i) P (Y ≥ 4) = 1 − P (Y ≤ 3) = 1 − 3 X 100 i=0 i 0.05i 0.95100−i = 1 − 0.25784 = 0.74216. (ii) Da 4 ∈ A, wird die Nullhypothese abgelehnt. Die Vermutung, dass der Anteil fehlgeleiteter Gepäckstücke sogar 0.05 beträgt, ist damit bestätigt. c) Zunächst ist die Wahrscheinlichkeit, dass ein Gepäckstück nicht fehlgeleitet wird (also sofort am Zielflughafen ankommt), 1 − 0.017 = 0.983. Von den 1.7 % fehlgeleiteter Gepäckstücke kommen 85 % nach spätestens 48 Stunden am Zielflughafen an. Damit ist die Wahrscheinlichkeit, dass ein fehlgeleitetes Gepäckstück trotzdem rechtzeitig ankommt: 0.017 · 0.85 = 0.01445. Damit kommen 98.3 + 1.445 = 99.745 % der Gepäckstücke spätestens nach 48 Stunden am Zielflughafen an. Der Anteil der auch dann noch nicht angekommenen Gepäckstücke ist 0.017 · 0.15 = 0.00255. Hochschule Harz Fachbereich Automatisierung und Informatik Prof. Dr. T. Schade Fit for Abi & Study - April 2014 Lösung zu der alten Abituraufgabe aus Niedersachsen 1. Wir bezeichnen die vorkommenden Ereignisse wie folgt: MK : Nuss mit verwertbarem Kern. OK : Nuss ohne verwertbaren Kern. A : Nuss wird ausgesondert. NA : Nuss wird nicht ausgesondert. Das Baumdiagramm sieht dann so aus: 0.1 u HH 0.9 HH HH j OK 0.05 NA MK A 0.95 A AA U A 0.98 NA @ 0.02 @ @ R @ A Die gesuchten Wahrscheinlichkeiten sind: P (E1 ) = 0.9 · 0.98 = 0.882 P (N A) = 0.882 + 0.1 · 0.05 = 0.887 0.882 P (E1 ) = ≈ 0.9944 P (E2 ) = P (N A) 0.887 2. Wenn die Standardabweichung σ größer als 3 ist, kann man die Binomialverteilung durch die Normalverteilung annähern. Das hat den Vorteil, dass man Tabellenwerte verwenden kann. Für alle Normalverteilungen sind die Wahrscheinlichkeiten in entsprechenden σUmgebungen gleich. Die Standardnormalverteilung mit µ = 0 und σ = 1 liefert: Φ(1.78)−Φ(−1.78) = Φ(1.78)−(1−Φ(1.78)) = 2·Φ(1.78)−1 ≈ 2·0.96246−1 = 0.9249. Es gilt also für alle Normalverteilungen, dass die Wahrscheinlichkeit dafür, dass Ereignisse in der 1.78σ - Umgebung liegen, etwa 92.5 % beträgt. Die relative Häufigkeit der MK-Nüsse in der Stichprobe beträgt h = 4976 5000 = 0.9952. Die Wahrscheinlichkeit für MK-Nüsse in der Gesamtmenge der brauchbaren Nüsse ist unbekannt, wir bezeichnen sie mit p. Zu bestimmen sind alle Wahrscheinlichkeiten p, so dass h in der 1, 78σ-Umgebung liegt (Sicherheitswahrscheinlichkeit etwa 92.5 %). Also gilt: (p − h)2 ≤ 1.782 σ 2 = 1.782 · (p − 0.9952)2 ≤ 1.782 · p(1 − p) n bzw. p(1 − p) 5000 Durch Lösen der entsprechenden quadratischen Gleichung erhält man die Grenzen des Vertrauensintervalls. (Graphischer Taschenrechner: Bestimme die Schnittpunkte der beiden Funktionen Y1 (x) = (x − 0.9952)2 und Y2 (x) = 1.782 x(1−x) 5000 .) Man erhält das Intervall [0.9931 . . . ; 0.9966 . . .]. Für die Maschine A wurde P (E2 ) ≈ 0.994 berechnet. Diese Wahrscheinlichkeit liegt in dem Vertrauensintervall für Maschine B. Man kann also mit 92.5 % Wahrscheinlichkeit behaupten, dass Maschine B nicht besser arbeitet als Maschine A. 3. Die Wahrscheinlichkeit des Ereignisses E3 : Ein Beutel enthält keine Nuss ohne verwertbaren Kern ist 50 P (E3 ) = · 0.0060 · (1 − 0.006)50 ≈ 0.74. 0 Die Wahrscheinlichkeit des Ereignisses E4 : Nur die erste einem Beutel entnommene Nuss hat keinen verwertbaren Kern ist P (E4 ) = 0.0061 · (1 − 0.006)49 ≈ 0.00447. Gesucht ist die Wahrscheinlichkeit p dafür, dass in mindestens 95 % der Überprüfungen nur gute Nüsse im Beutel sind. Dann gilt: p0 · (1 − p)50 ≥ 0.95 √ 50 0.95, 1−p ≥ so dass p ≤ 0.001025 sein muss. Das Intervall H, das diese Wahrscheinlichkeiten enthält, ist [0; 0.001 . . .]. Für alle Werte von p, die kleiner als 0.1 % sind, wird man mit mehr als 95 % Wahrscheinlichkeit keine hohle Nuss im Beutel finden. Das gegebene Intervall G = [0; 0.0714] umfasst H. Da mit p = 0.07 eine sehr hohe Wahrscheinlichkeit für eine hohle Nuss vorliegt, ist das Intervall G für die vorliegende Fragestellung nicht geeignet.