Grundlagen der Wahrscheinlichkeitstheorie und Statistik für

Werbung
WS 2007/08
Blatt 4
INSTITUT FÜR STOCHASTIK
UNIVERSITÄT KARLSRUHE
Dr. B. Klar
Übungen zur Vorlesung
Grundlagen der Wahrscheinlichkeitstheorie und Statistik
für Studierende der Informatik
Musterlösungen
Aufgabe 12:
Es sei Ω = {(i, j) : i, j ∈ {1, 2, 3, 4}}. Die Zufallsvariablen X : Ω → R bzw. Y : Ω → R seien
definiert durch
X(i, j) := i
und
Y (i, j) := j
und die gemeinsame Zähldichte von X und Y fX,Y : Ω → R durch fX,Y (i, j) := c · (i + j) mit
einem noch zu bestimmenden c ∈ R.
a) Bestimmen Sie c ∈ R so, dass fX,Y eine Zähldichte auf Ω wird.
b) Bestimmen Sie fX und fY .
c) Welche Werte nimmt die Zufallsvariable Z := X · Y an?
d) Berechnen Sie P(Z ≤ 9).
Lösung:
a) Wir schreiben zur Abkürzung f := fX,Y . Damit f eine Zähldichte wird, muss gelten
1 =
X
ω∈Ω
f (ω) =
4 X
4
X
i=1 j=1
f (i, j) =
4 X
4
X
c · (i + j)
i=1 j=1
= c · ((1 + 1) + (1 + 2) + (1 + 3) + (1 + 4) + (2 + 1) + . . . + (4 + 4)) = 80 · c
und damit notwendig
1/80. Tatsächlich ist damit f eine Zähldichte: Es ist f (i, j) =
P4 P4 c =
i+j
i+j
≥ 0 und i=1 j=1 80 = 1.
80
b) Wegen (6.4) und (6.5) gilt für i, j = 1, . . . , 4
fX (i) =
4
X
k=1
fX,Y (i, k) =
(i + 1) + (i + 2) + (i + 3) + (i + 4)
4 · i + 10
i
1
=
=
+
80
80
20 8
und analog
fY (j) =
j
1
+ .
20 8
c) Da X und Y jeweils die Werte 1, 2, 3, 4 annehmen, nimmt Z = X · Y die Werte 1 · 1 =
1, . . . , 1 · 4 = 4, 2 · 3 = 6, 2 · 4 = 8, 3 · 3 = 9, 3 · 4 = 12 und 4 · 4 = 16 an. Der Wertebereich
von Z ist also {1, 2, 3, 4, 6, 8, 9, 12, 16}.
d)
{Z ≤ 9} = {(1, 1), (1, 2), (1, 3), (1, 4), (2, 1), (2, 2), (2, 3), (2, 4), (3, 1), (3, 2), (3, 3), (4, 1), (4, 2)}.
Damit
P(Z ≤ 9) = f (1, 1) + f (1, 2) + . . . + f (4, 2) =
58
= 0.725
80
Alternativ und etwas einfacher:
P(Z ≤ 9) = 1 − P(Z > 9) = 1 − P({(3, 4), (4, 3), (4, 4)})
22
58
= 1 − f (3, 4) − f (4, 3) − f (4, 4) = 1 −
=
= 0.725.
80
80
Aufgabe 13:
Eine Lieferung von 1000 Bauteilen eines bestimmten Typs darf laut Liefervertrag höchstens
3% Ausschuss haben. Um dies zu überprüfen, werden nacheinander 20 Bauteile rein zufällig
entnommen, getestet und die Lieferung abgelehnt, wenn unter den getesteten Bauteilen mindestens ein defektes ist.
a) Wie groß ist bei diesem Prüfverfahren die Wahrscheinlichkeit ungerechtfertigter Reklamation, indem eine Lieferung zurückgewiesen wird, obwohl sie den Lieferbedingungen
entspricht? Führen Sie ihre Rechnungen für den Fall durch, dass die Lieferung genau 30
defekte Bauteile, also 3% Ausschuss, enthält und ein getestetes Bauteil nicht noch einmal
getestet werden kann.
b) Welche Wahrscheinlichkeit ergibt sich, wenn im Gegensatz dazu ein getestetes Bauteil
wieder in die Lieferung zurückgelegt wird und erneut getestet werden kann?
c) Welche Werte ergeben sich in a) und b), wenn die Lieferung genau 10000 Bauteile enthält
und darunter genau 300 defekte Bauteile sind?
Lösung:
a) Sei X die zufällige Anzahl defekter Bauteile. Dann gilt X ∼ Hyp(n, r, s) mit
• n = Anzahl der getesteten Bauteile,
• r = tatsächliche Anzahl der defekten Bauteile,
• s = tatsächliche Anzahl intakter Bauteile.
Gesucht P( ungerechtfertigte Reklamation“) = P(X ≥ 1). Es ist hier mit n = 20, r = 30
”
und s = 970 nach dem Hinweis
s
r
·
P(X ≥ 1) = 1 − P(X ≤ 0) = 1 − fX (0) = 1 − 0 r+sn
n
= 1−
= 1−
970
20
1000
20
=1−
970 · 969 · . . . · 951 1000 · 999 · . . . · 981
/
20!
20!
970 · 969 · . . . · 951
4.464685 · 1059
=1−
= 0.4594.
1000 · 999 · . . . · 981
8.259284 · 1059
b) Wird ein getestetes Bauteil zurückgelegt, so liegt die Situation des Ziehens mit Zurückr
legen vor und es ist X ∼ Bin(n, r+s
) = Bin(20, 0.03). Es ist hier
P(X ≥ 1) = 1 − P(X = 0) = 1 − fX (0)
20
= 1−
· 0.030 · (1 − 0.03)20 = 1 − 0.9720 = 0.4562.
0
r
= 0.03 ist, ändert sich an
c) Es ist jetzt n = 20, r = 300 und s = 9700. Da weiterhin r+s
der Wahrscheinlichkeit in b) nichts. In a) erhalten wir
9700
9681
9700 9699
20
P(X ≥ 1) = 1 − 10000 = 1 −
·
·...·
= 1 − 0.5435 = 0.4565.
10000
9999
9981
20
Dieser Wert stimmt bis auf 3 Einheiten in der vierten Nachkommastelle mit dem Wert
0.4562 aus b) überein.
Aufgabe 14:
An einer E-Mail-Adresse treffen täglich X Spam-Mails ein. Aus Erfahrung weiß man, dass
X eine Zufallsvariable ist mit der Poisson-Verteilung P o(α) für ein α > 0. Weiter treffen
täglich genau c erwünschte E-Mails ein, c ∈ N.
a) Drücken Sie Y := Gesamtzahl der E-Mails, die täglich an der E-Mail-Adresse eintref”
fen“ mit Hilfe von X und c aus. Welche Werte kann Y annehmen? Bestimmen Sie die
Zähldichte von Y .
b) Bestimmen Sie P(Y ≤ 6) für den Fall α = 6 und c = 4.
c) Angenommen, X sei eine Zufallsvariable mit der Binomialverteilung Bin(100, 0.06). Bestimmen Sie wieder P(Y ≤ 6) für den Fall c = 4 und vergleichen Sie das Ergebnis mit
dem Ergebnis aus b), d.h. wie groß ist der prozentuale Unterschied beider Wahrscheinlichkeiten?
Lösung:
a) Es ist Y = X + c. Da X die Werte 0, 1, . . . annehmen kann, nimmt Y die Werte c, c +
1, c + 2, . . . an. Ferner
fY (k) = P(Y = k) = P(X + c = k) = P(X = k − c)
(
αk−c
e−α · (k−c)!
, k≥c
= fX (k − c) =
0
, sonst.
b) Wegen Y ≥ c = 4 gilt P(Y ≤ 6) = P(Y = 4) + P(Y = 5) + P(Y = 6), also wegen a)
α0
α1
α2
+ e−α ·
+ e−α ·
0!
1!
2!
2
α
= e−α · (1 + α + ) = 25 · e−6 = 0.06197.
2
P(Y ≤ 6) = e−α ·
c) Gilt X ∼ Bin(100, 0.06), so wegen a) mit p = 0.06
P(Y ≤ 6) = P(Y = 4) + P(Y = 5) + P(Y = 6) = fX (0) + fX (1) + fX (2)
100
100
100
0
100
1
99
=
· p · (1 − p) +
· p · (1 − p) +
· p2 · (1 − p)98
0
1
2
= 0.9498 · (0.942 + 100 · 0.06 · 0.94 + 4950 · 0.062 ) = 0.05661.
Das Ergebnis aus b) ist um 9.46% größer als das aus c).
Aufgabe 15:
Ein Programm soll (auf Korrektheit) getestet werden. Die Wahrscheinlichkeit, dass bei einem
Testdurchlauf ein (Laufzeit-) Fehler gefunden wird, sei p > 0. X sei die zufällige Anzahl der
Testdurchläufe ohne Fehler, bis der erste Fehler gefunden wird.
a) Welche Verteilung hat X?
b) Das Programm wird so lange getestet, bis ein Fehler gefunden wird, höchstens jedoch c
mal. Sei Y dabei die zufällige Anzahl der Testdurchläufe. Berechnen und skizzieren Sie
die Zähldichte der Zufallsvariablen Y für p = 0.1 und c = 7.
c) Z := 50 · Y + 100 seien die zufälligen Kosten für den Test. Berechnen Sie P(Z ≥ 200) für
p = 0.1 und c = 7.
d) Wie groß muss c ∈ N mindestens sein, damit für den Fall p = 0.1 ein Laufzeitfehler
mindestens mit Wahrscheinlichkeit 90% gefunden wird?
Lösung: Wir nehmen an, dass wie in Abschnitt 7.5 des Skriptums ein ideales Zufallsexperiment mit den zwei möglichen Ergebnissen Fehler gefunden“ (1) oder kein Fehler gefunden“
”
”
(0) solange unabhängig unter gleichen Bedingungen durchgeführt wird, bis der erste Fehler
gefunden wird.
a) X die geometrische Verteilung G(p) mit Parameter p.
b) X + 1 ist die zufällige Anzahl der Testdurchläufe bis der erste Fehler gefunden wird. Es
ist daher Y = min{X + 1, c}. Y nimmt also die Werte 1, 2, . . . , c an und es ist
{X + 1 = k} = {X = k − 1}, k = 1, 2, . . . , c − 1,
{Y = k} =
{X + 1 ≥ c} = {X ≥ c − 1} , k = c.
Wegen
P(X ≥ c − 1) =
∞
X
p · (1 − p)k = p · (1 − p)c−1 · [1 + (1 − p) + (1 − p)2 + . . .]
k=c−1
= p · (1 − p)c−1 ·
1
= (1 − p)c−1
1 − (1 − p)
gilt
fY (k) =
p · (1 − p)k−1
, k = 1, 2, . . . , c − 1
c−1
P(X ≥ c − 1) = (1 − p) , k = c
Speziell für p = 0.1 und c = 7 ergibt sich
k
1
2
3
4
5
6
7
fY (k) 0.100 0.090 0.081 0.073 0.066 0.059 0.531
mit dem Stabdiagramm
fY (k)
0.5
0.4
0.3
0.2
0.1
0
1
2
3
4
5
6
7
k
c)
P(Z ≥ 200) = P(50 · Y + 100 ≥ 200) = P(50 · Y ≥ 100) = P(Y ≥ 2)
= 1 − P(Y = 1) = 1 − fY (1) = 0.900.
d) Ein Laufzeitfehler wird genau dann gefunden, wenn X < c ist, denn andernfalls wird in
den ersten c Testdurchläufen kein Fehler gefunden. Gefordert ist P(X < c) ≥ 0.9, also
P(X ≥ c) ≤ 0.1. Wegen b) gilt (man ersetze dort c−1 durch c) P(X ≥ c) = (1−p)c = 0.9c .
Es muss also 0.9c ≤ 0.1 gelten, und damit äquivalent
⇐⇒ c · ln(0.9) ≤ ln(0.1)
⇐⇒ −0.10536 · c ≤ −2.30259
2.30259
⇐⇒ c ≥
= 21.854.
0.10536
Es muss also c ≥ 22 sein. (Natürlich kann man dieses Ergebnis auch erhalten, wenn man
für verschiedene c die Bedingung 0.9c ≤ 0.1 direkt überprüft.)
Herunterladen