Statistik1 08-09

Werbung
Aufgabe 1
(4 + 2 + 3 Punkte)
Beim Wiegen von 50 Reispaketen ergaben sich folgende Gewichte X(in Gramm):
i
Ki = (xui , xoi ]
ni
1
(985,995]
15
2
(995, 1000]
5
3
(1000,1005]
20
4
(1005,1020]
10
a) Erstellen Sie das Histogramm.
b) Sei F (x) die empirische Verteilungsfunktion. Bestimmen Sie F (998).
F (998) = F (995) + f (998)(998 − 995) = 0.3 +
5
(998
50·5
− 995) = 0.36
c) Bestimmen Sie das arithmetische Mittel und die empirische Varianz.
P
1
x = n1 4i=1 ni x∗i = 50
(15 · 990 + 5 · 997.5 + 20 · 1002.5 + 10 · 1012.5) = 1000.25
P
4
1
1
∗
2
[15(990 − 1000.25)2 + 5(997.5 − 1000.25)2 + 20(1002.5 −
s = n i=1 ni (xi − x)2 = 50
2
1000.25) + 10(1012.5 − 1000.25)2 ] ≈ 64.31
Aufgabe 2
(2 + 6 + 1 + 2 Punkte)
Im Folgenden sind das Alter X (in Jahren) und das Einkommen Y (in Tausend Euro) von
n = 5 Personen gegeben:
P
i
1
2
3
4
5
xi 40 16 23 27 54 160
yi 55 6 24 35 50 170
Daraus errechnen sich:
5
X
x2i
= 6030,
i=1
5
X
yi2
= 7362,
i=1
5
X
(xi − x)(yi − y) = 1053
i=1
a) Zeichnen Sie das Streudiagramm.
b) Bestimmen Sie für die Regressionsgerade
y = a + bx
die empirischen Regressionskoeffizienten â und b̂ und interpretieren Sie b̂ am Sachverhalt.
x = 15 · 160 = 32
x2 = 15 · 6030 = 1206
s2x = x2 − x2 = 1206 − 322 = 182
sxy = 15 · 1053 = 210.6
b̂ = ssxy2 = 210.6
≈ 1.16
182
x
1
â = 5 · 170 − 1.16 · 32 ≈ −3.12
b̂ = 1.16 bedeutet, dass nach dem vorliegenden Modell eine Person mit
jedem Jahr, das sie älter wird, 1160 Euro mehr verdient.
c) Erklären Sie kurz die Idee der Methode der kleinsten Quadrate (KQ-Methode).
Die Idee ist der KQ-Methode ist es, die Regressionsgerade so durch die
Punktwolke der Beobachtungen zu legen, dass der quadratische Abstand
der Beobachtungen zur Regressionsgerade minimal ist.
d) Berechnen und interpretieren Sie das Bestimmtheitsmaß.
s2y =
1
5
· 7362 − ( 15 · 170)2 = 316.4
s2
2
210.6
≈ 0.77
R2 = s2xys2 = 182·316.4
x y
2
R = 0.77 bedeutet, dass 77% der Gesamtstreuung durch die Regressionsgerade erklärt werden.
Aufgabe 3
(2 + 3 Punkte)
Im Rahmen einer Untersuchung der Abschlussnoten von Universitätsabsolventen liegen folgende
Daten der Universitäten X, Y , und Z vor:
Universität
Durchschnittsnote der Absolventen
Anzahl der Absolventen
Empirische Varianz der Noten
X
2.7
130
0.25
Y
1.8
80
?
Z
2.4
90
0.4
Weiterhin sei bekannt, dass die empirische Varianz der Noten aller betrachteten Absolventen
s2 = 0.55 beträgt.
a) Berechnen Sie die Durchschnittsnote aller betrachteten Absolventen.
a = (n(x)x + n(y)y + n(z)z)/n =
130 · 2.7 + 80 · 1.8 + 90 · 2.4 = 2.37
b) Berechnen Sie die empirische Varianz der Absolventen von Universität Y .
n
s2y = [s2 − [n(x)s2x + n(z)s2z ]/n − [n(x)(x − a)2 + n(y)(y − a)2 + n(z)(z − a)2 ]/n] n(y)
=
2
2
= [0.55 − [130 · 0.25 + 90 · 0.4]/300 − [130 · (2.7 − 2.37) + 80 · (1.8 − 2.37) + 90 · (2.4 −
2.37)2 ]/300] · 300
80
≈ 0.7034
Aufgabe 4
(2 + 3 + 3 Punkte)
Bei einer olympischen Disziplin werden nach den olympischen Spielen Dopingtests zu der Substanz TDM gemacht. Die Prüfmethode zum Nachweis von TDM weist in 99% der tatsächlich
positiven Fälle die Nutzung nach. In 5% der Fälle liefert sie jedoch ein falsch positives Ergebnis,
d.h. der Test ist positiv, obwohl der Sportler kein TDM genommen hat. Weiterhin weiß man,
dass 20% der Sportler TDM nehmen.
a) Wie groß ist die Wahrscheinlichkeit, dass eine Dopingprobe positiv ist?
P (positiv) = P (positiv|doping) · P (doping) + P (positiv|clean) · P (clean) = 0.99 · 0.2 +
0.05 · 0.8 = 0.238
b) Wie groß ist die Wahrscheinlichkeit, dass ein Sportler TDM genommen hat, obwohl seine
Dopingprobe negativ war?
Gegeben ist: P (positiv|doping) = .99, P (positiv|clean) = .05, P (d) = .2.
P (n|d)P (d)
P (d|negativ)
=
P (n)
P (n|d)P (d) + P (n|c)P (c)
0.01 · 0.2
=
= 0.00262
0.01 · 0.2 + 0.95 · 0.8
P (d|n) =
c) Es werden 10 Sportler zum Test gebeten. Wie groß ist die Wahrscheinlichkeit, dass mindestens ein Sportler positiv getestet wird, obwohl kein Einziger von ihnen TDM genommen
hat? Nehmen Sie hierbei an, dass die Wahrscheinlichkeiten zwischen den einzelnen Sportlern total unabhängig sind.
10
10
[
\
P ( p i | ci )
i
=
i
1 − P(
10
\
i
ni |
10
\
ci )
i
T
T10
ci )
P ( 10
i ni ∩
=
1−
T10 i
P(
ci )
T10 i
p( i (ni ∩ ci ))
=
1−
T
p( 10
ci )
Q10 i
P (ni ∩ ci )
unabh.
=
1 − iQ10
i P (ci )
10
10
Y
Y
P (ni ∩ ci )
=
1−
=1−
P (ni |ci )
P (ci )
i
i
=
1−
10
Y
i
P (n|c) = 1 − .9510 = .40126
Aufgabe 5
(2 + 1 + 2 + 4 Punkte)
1. Die Anzahl X von abgesetzten Notebooks in einer beliebigen Woche in einer Filiale der
PC-Kette Hypercom lässt sich durch eine Poisson-Verteilung mit Erwartungswert E(X) =
4 beschreiben.
a) Bestimmen Sie für eine beliebige Woche die Wahrscheinlichkeiten, dass
• kein Gerät
λ = E(X) = 4
0
P (X = 0) = 40! e−4 ≈ 0.018
• mindestens ein Gerät
P (X ≥ 1) = 1 − P (X = 0) ≈ 0.982
verkauft wird.
b) Wie groß ist die Varianz der Anzahl von abgesetzten Notebooks in einer beliebigen
Woche?
var(X) = λ = 4
c) Bestimmen Sie für einen Zeitraum von zwei Wochen die Wahrscheinlichkeit, dass
mehr als sechs aber höchstens acht Geräte verkauft werden.
Bezeichne Y die Anzahl an verkauften Notebooks in einer halben
Woche.
λY = E(Y ) = 8
8
7
P (6 < Y ≤ 8) = P (Y = 7) + P (Y = 8) = 87! e−8 + 8! 8e−8 ≈ 0.28
2. Die Anzahl von abgesetzten Notebooks in einer beliebigen Woche in der gesamten PCKette Hypercom lässt sich durch eine Poisson-Verteilung mit Erwartungswert 640 beschreiben. Wie groß ist die Wahrscheinlichkeit, dass mindestens 565, aber höchstens 680
Geräte innerhalb einer Woche abgesetzt werden?
Bezeichne K die Anzahl an verkauften Notebooks der Kette in einer Woche.
λK = E(K) = 640
Approximationsregel erfüllt: λK = 640 > 9
P (565 ≤ K ≤ 680) = P (K ≤ 680) − P (K ≤ 564)
√
√
= P (Z ≤ 680−640+0.5
− P (Z ≤ 564−640+0.5
)
640
640
≈ Φ(1.60) − Φ(−2.98) ≈ 0.94
Aufgabe 6
(3 + 2 + 3 Punkte)
In den zwei Laboren A und B werden methodisch unterschiedliche Messungen der Lichtgeschwindigkeit c (in Kilometer pro Sekunde) durchgeführt. Die Messergebnisse von Labor A
sind normalverteilt mit Mittelwert 0.299 · 106 und Standardabweichung 0.01 · 106 . In Labor B
sind sie normalverteilt mit Mittelwert 0.3 · 106 und Standardabweichung 0.02 · 106 .
a) Mit welcher Wahrscheinlichkeit liegen die Messungen in den Laboren jeweils über 0.3·106 ?
A:
6 −0.299·106
P (A > 0.3 · 106 ) = P (Z > 0.3·100.01·10
) = Φ(−0.1) = 1 − Φ(0.1) ≈ 0.46
6
B:
P (B > 0.3 · 106 ) = 0.5 wegen Symmetrie.
b) Mit welcher Wahrscheinlichkeit liegen die Messungen von Labor A zwischen 0.29 · 106 und
0.301 · 106 ?
6
6
−0.299·10
) − P (Z <
P (0.297 · 106 ≤ A ≤ 0.301 · 106 ) = P (Z < 0.301·10
0.01·106
= Φ(0.2) − Φ(−0.2) = 2Φ(0.2) − 1 ≈ 0.159
0.301·106 −0.299·106
)
0.01·106
c) Bei einer Messung einer Geschwindigkeit von weniger als 0.295 · 106 in einem der beiden
Labore wird eine Neukalibrierung der gesamten Anlage nötig. Wenn zufällig mit gleicher
Wahrscheinlichkeit eines der Labore ausgewählt wird, mit welcher Wahrscheinlichkeit
muss dann nach dem nächsten Versuch eine Neukalibrierung durchgeführt werden?
P (“Neukalibrierung00 ) = 0.5 · P (A < 0.295 · 106 ) + 0.5P (B < 0.295 · 106 )
6 −0.3·106
6 −0.299·106
) + 0.5Φ( 0.295·10
)
= 0.5Φ( 0.295·10
0.01·106
0.02·106
= 0.5Φ(−4) − 0.5Φ(−2.5) ≈ 0.003
Herunterladen