Aufgabe 1 (4 + 2 + 3 Punkte) Beim Wiegen von 50 Reispaketen ergaben sich folgende Gewichte X(in Gramm): i Ki = (xui , xoi ] ni 1 (985,995] 15 2 (995, 1000] 5 3 (1000,1005] 20 4 (1005,1020] 10 a) Erstellen Sie das Histogramm. b) Sei F (x) die empirische Verteilungsfunktion. Bestimmen Sie F (998). F (998) = F (995) + f (998)(998 − 995) = 0.3 + 5 (998 50·5 − 995) = 0.36 c) Bestimmen Sie das arithmetische Mittel und die empirische Varianz. P 1 x = n1 4i=1 ni x∗i = 50 (15 · 990 + 5 · 997.5 + 20 · 1002.5 + 10 · 1012.5) = 1000.25 P 4 1 1 ∗ 2 [15(990 − 1000.25)2 + 5(997.5 − 1000.25)2 + 20(1002.5 − s = n i=1 ni (xi − x)2 = 50 2 1000.25) + 10(1012.5 − 1000.25)2 ] ≈ 64.31 Aufgabe 2 (2 + 6 + 1 + 2 Punkte) Im Folgenden sind das Alter X (in Jahren) und das Einkommen Y (in Tausend Euro) von n = 5 Personen gegeben: P i 1 2 3 4 5 xi 40 16 23 27 54 160 yi 55 6 24 35 50 170 Daraus errechnen sich: 5 X x2i = 6030, i=1 5 X yi2 = 7362, i=1 5 X (xi − x)(yi − y) = 1053 i=1 a) Zeichnen Sie das Streudiagramm. b) Bestimmen Sie für die Regressionsgerade y = a + bx die empirischen Regressionskoeffizienten â und b̂ und interpretieren Sie b̂ am Sachverhalt. x = 15 · 160 = 32 x2 = 15 · 6030 = 1206 s2x = x2 − x2 = 1206 − 322 = 182 sxy = 15 · 1053 = 210.6 b̂ = ssxy2 = 210.6 ≈ 1.16 182 x 1 â = 5 · 170 − 1.16 · 32 ≈ −3.12 b̂ = 1.16 bedeutet, dass nach dem vorliegenden Modell eine Person mit jedem Jahr, das sie älter wird, 1160 Euro mehr verdient. c) Erklären Sie kurz die Idee der Methode der kleinsten Quadrate (KQ-Methode). Die Idee ist der KQ-Methode ist es, die Regressionsgerade so durch die Punktwolke der Beobachtungen zu legen, dass der quadratische Abstand der Beobachtungen zur Regressionsgerade minimal ist. d) Berechnen und interpretieren Sie das Bestimmtheitsmaß. s2y = 1 5 · 7362 − ( 15 · 170)2 = 316.4 s2 2 210.6 ≈ 0.77 R2 = s2xys2 = 182·316.4 x y 2 R = 0.77 bedeutet, dass 77% der Gesamtstreuung durch die Regressionsgerade erklärt werden. Aufgabe 3 (2 + 3 Punkte) Im Rahmen einer Untersuchung der Abschlussnoten von Universitätsabsolventen liegen folgende Daten der Universitäten X, Y , und Z vor: Universität Durchschnittsnote der Absolventen Anzahl der Absolventen Empirische Varianz der Noten X 2.7 130 0.25 Y 1.8 80 ? Z 2.4 90 0.4 Weiterhin sei bekannt, dass die empirische Varianz der Noten aller betrachteten Absolventen s2 = 0.55 beträgt. a) Berechnen Sie die Durchschnittsnote aller betrachteten Absolventen. a = (n(x)x + n(y)y + n(z)z)/n = 130 · 2.7 + 80 · 1.8 + 90 · 2.4 = 2.37 b) Berechnen Sie die empirische Varianz der Absolventen von Universität Y . n s2y = [s2 − [n(x)s2x + n(z)s2z ]/n − [n(x)(x − a)2 + n(y)(y − a)2 + n(z)(z − a)2 ]/n] n(y) = 2 2 = [0.55 − [130 · 0.25 + 90 · 0.4]/300 − [130 · (2.7 − 2.37) + 80 · (1.8 − 2.37) + 90 · (2.4 − 2.37)2 ]/300] · 300 80 ≈ 0.7034 Aufgabe 4 (2 + 3 + 3 Punkte) Bei einer olympischen Disziplin werden nach den olympischen Spielen Dopingtests zu der Substanz TDM gemacht. Die Prüfmethode zum Nachweis von TDM weist in 99% der tatsächlich positiven Fälle die Nutzung nach. In 5% der Fälle liefert sie jedoch ein falsch positives Ergebnis, d.h. der Test ist positiv, obwohl der Sportler kein TDM genommen hat. Weiterhin weiß man, dass 20% der Sportler TDM nehmen. a) Wie groß ist die Wahrscheinlichkeit, dass eine Dopingprobe positiv ist? P (positiv) = P (positiv|doping) · P (doping) + P (positiv|clean) · P (clean) = 0.99 · 0.2 + 0.05 · 0.8 = 0.238 b) Wie groß ist die Wahrscheinlichkeit, dass ein Sportler TDM genommen hat, obwohl seine Dopingprobe negativ war? Gegeben ist: P (positiv|doping) = .99, P (positiv|clean) = .05, P (d) = .2. P (n|d)P (d) P (d|negativ) = P (n) P (n|d)P (d) + P (n|c)P (c) 0.01 · 0.2 = = 0.00262 0.01 · 0.2 + 0.95 · 0.8 P (d|n) = c) Es werden 10 Sportler zum Test gebeten. Wie groß ist die Wahrscheinlichkeit, dass mindestens ein Sportler positiv getestet wird, obwohl kein Einziger von ihnen TDM genommen hat? Nehmen Sie hierbei an, dass die Wahrscheinlichkeiten zwischen den einzelnen Sportlern total unabhängig sind. 10 10 [ \ P ( p i | ci ) i = i 1 − P( 10 \ i ni | 10 \ ci ) i T T10 ci ) P ( 10 i ni ∩ = 1− T10 i P( ci ) T10 i p( i (ni ∩ ci )) = 1− T p( 10 ci ) Q10 i P (ni ∩ ci ) unabh. = 1 − iQ10 i P (ci ) 10 10 Y Y P (ni ∩ ci ) = 1− =1− P (ni |ci ) P (ci ) i i = 1− 10 Y i P (n|c) = 1 − .9510 = .40126 Aufgabe 5 (2 + 1 + 2 + 4 Punkte) 1. Die Anzahl X von abgesetzten Notebooks in einer beliebigen Woche in einer Filiale der PC-Kette Hypercom lässt sich durch eine Poisson-Verteilung mit Erwartungswert E(X) = 4 beschreiben. a) Bestimmen Sie für eine beliebige Woche die Wahrscheinlichkeiten, dass • kein Gerät λ = E(X) = 4 0 P (X = 0) = 40! e−4 ≈ 0.018 • mindestens ein Gerät P (X ≥ 1) = 1 − P (X = 0) ≈ 0.982 verkauft wird. b) Wie groß ist die Varianz der Anzahl von abgesetzten Notebooks in einer beliebigen Woche? var(X) = λ = 4 c) Bestimmen Sie für einen Zeitraum von zwei Wochen die Wahrscheinlichkeit, dass mehr als sechs aber höchstens acht Geräte verkauft werden. Bezeichne Y die Anzahl an verkauften Notebooks in einer halben Woche. λY = E(Y ) = 8 8 7 P (6 < Y ≤ 8) = P (Y = 7) + P (Y = 8) = 87! e−8 + 8! 8e−8 ≈ 0.28 2. Die Anzahl von abgesetzten Notebooks in einer beliebigen Woche in der gesamten PCKette Hypercom lässt sich durch eine Poisson-Verteilung mit Erwartungswert 640 beschreiben. Wie groß ist die Wahrscheinlichkeit, dass mindestens 565, aber höchstens 680 Geräte innerhalb einer Woche abgesetzt werden? Bezeichne K die Anzahl an verkauften Notebooks der Kette in einer Woche. λK = E(K) = 640 Approximationsregel erfüllt: λK = 640 > 9 P (565 ≤ K ≤ 680) = P (K ≤ 680) − P (K ≤ 564) √ √ = P (Z ≤ 680−640+0.5 − P (Z ≤ 564−640+0.5 ) 640 640 ≈ Φ(1.60) − Φ(−2.98) ≈ 0.94 Aufgabe 6 (3 + 2 + 3 Punkte) In den zwei Laboren A und B werden methodisch unterschiedliche Messungen der Lichtgeschwindigkeit c (in Kilometer pro Sekunde) durchgeführt. Die Messergebnisse von Labor A sind normalverteilt mit Mittelwert 0.299 · 106 und Standardabweichung 0.01 · 106 . In Labor B sind sie normalverteilt mit Mittelwert 0.3 · 106 und Standardabweichung 0.02 · 106 . a) Mit welcher Wahrscheinlichkeit liegen die Messungen in den Laboren jeweils über 0.3·106 ? A: 6 −0.299·106 P (A > 0.3 · 106 ) = P (Z > 0.3·100.01·10 ) = Φ(−0.1) = 1 − Φ(0.1) ≈ 0.46 6 B: P (B > 0.3 · 106 ) = 0.5 wegen Symmetrie. b) Mit welcher Wahrscheinlichkeit liegen die Messungen von Labor A zwischen 0.29 · 106 und 0.301 · 106 ? 6 6 −0.299·10 ) − P (Z < P (0.297 · 106 ≤ A ≤ 0.301 · 106 ) = P (Z < 0.301·10 0.01·106 = Φ(0.2) − Φ(−0.2) = 2Φ(0.2) − 1 ≈ 0.159 0.301·106 −0.299·106 ) 0.01·106 c) Bei einer Messung einer Geschwindigkeit von weniger als 0.295 · 106 in einem der beiden Labore wird eine Neukalibrierung der gesamten Anlage nötig. Wenn zufällig mit gleicher Wahrscheinlichkeit eines der Labore ausgewählt wird, mit welcher Wahrscheinlichkeit muss dann nach dem nächsten Versuch eine Neukalibrierung durchgeführt werden? P (“Neukalibrierung00 ) = 0.5 · P (A < 0.295 · 106 ) + 0.5P (B < 0.295 · 106 ) 6 −0.3·106 6 −0.299·106 ) + 0.5Φ( 0.295·10 ) = 0.5Φ( 0.295·10 0.01·106 0.02·106 = 0.5Φ(−4) − 0.5Φ(−2.5) ≈ 0.003