WS 2007/08 Blatt 4 INSTITUT FÜR STOCHASTIK UNIVERSITÄT KARLSRUHE Dr. B. Klar Übungen zur Vorlesung Grundlagen der Wahrscheinlichkeitstheorie und Statistik für Studierende der Informatik Musterlösungen Aufgabe 12: Es sei Ω = {(i, j) : i, j ∈ {1, 2, 3, 4}}. Die Zufallsvariablen X : Ω → R bzw. Y : Ω → R seien definiert durch X(i, j) := i und Y (i, j) := j und die gemeinsame Zähldichte von X und Y fX,Y : Ω → R durch fX,Y (i, j) := c · (i + j) mit einem noch zu bestimmenden c ∈ R. a) Bestimmen Sie c ∈ R so, dass fX,Y eine Zähldichte auf Ω wird. b) Bestimmen Sie fX und fY . c) Welche Werte nimmt die Zufallsvariable Z := X · Y an? d) Berechnen Sie P(Z ≤ 9). Lösung: a) Wir schreiben zur Abkürzung f := fX,Y . Damit f eine Zähldichte wird, muss gelten 1 = X ω∈Ω f (ω) = 4 X 4 X i=1 j=1 f (i, j) = 4 X 4 X c · (i + j) i=1 j=1 = c · ((1 + 1) + (1 + 2) + (1 + 3) + (1 + 4) + (2 + 1) + . . . + (4 + 4)) = 80 · c und damit notwendig 1/80. Tatsächlich ist damit f eine Zähldichte: Es ist f (i, j) = P4 P4 c = i+j i+j ≥ 0 und i=1 j=1 80 = 1. 80 b) Wegen (6.4) und (6.5) gilt für i, j = 1, . . . , 4 fX (i) = 4 X k=1 fX,Y (i, k) = (i + 1) + (i + 2) + (i + 3) + (i + 4) 4 · i + 10 i 1 = = + 80 80 20 8 und analog fY (j) = j 1 + . 20 8 c) Da X und Y jeweils die Werte 1, 2, 3, 4 annehmen, nimmt Z = X · Y die Werte 1 · 1 = 1, . . . , 1 · 4 = 4, 2 · 3 = 6, 2 · 4 = 8, 3 · 3 = 9, 3 · 4 = 12 und 4 · 4 = 16 an. Der Wertebereich von Z ist also {1, 2, 3, 4, 6, 8, 9, 12, 16}. d) {Z ≤ 9} = {(1, 1), (1, 2), (1, 3), (1, 4), (2, 1), (2, 2), (2, 3), (2, 4), (3, 1), (3, 2), (3, 3), (4, 1), (4, 2)}. Damit P(Z ≤ 9) = f (1, 1) + f (1, 2) + . . . + f (4, 2) = 58 = 0.725 80 Alternativ und etwas einfacher: P(Z ≤ 9) = 1 − P(Z > 9) = 1 − P({(3, 4), (4, 3), (4, 4)}) 22 58 = 1 − f (3, 4) − f (4, 3) − f (4, 4) = 1 − = = 0.725. 80 80 Aufgabe 13: Eine Lieferung von 1000 Bauteilen eines bestimmten Typs darf laut Liefervertrag höchstens 3% Ausschuss haben. Um dies zu überprüfen, werden nacheinander 20 Bauteile rein zufällig entnommen, getestet und die Lieferung abgelehnt, wenn unter den getesteten Bauteilen mindestens ein defektes ist. a) Wie groß ist bei diesem Prüfverfahren die Wahrscheinlichkeit ungerechtfertigter Reklamation, indem eine Lieferung zurückgewiesen wird, obwohl sie den Lieferbedingungen entspricht? Führen Sie ihre Rechnungen für den Fall durch, dass die Lieferung genau 30 defekte Bauteile, also 3% Ausschuss, enthält und ein getestetes Bauteil nicht noch einmal getestet werden kann. b) Welche Wahrscheinlichkeit ergibt sich, wenn im Gegensatz dazu ein getestetes Bauteil wieder in die Lieferung zurückgelegt wird und erneut getestet werden kann? c) Welche Werte ergeben sich in a) und b), wenn die Lieferung genau 10000 Bauteile enthält und darunter genau 300 defekte Bauteile sind? Lösung: a) Sei X die zufällige Anzahl defekter Bauteile. Dann gilt X ∼ Hyp(n, r, s) mit • n = Anzahl der getesteten Bauteile, • r = tatsächliche Anzahl der defekten Bauteile, • s = tatsächliche Anzahl intakter Bauteile. Gesucht P( ungerechtfertigte Reklamation“) = P(X ≥ 1). Es ist hier mit n = 20, r = 30 ” und s = 970 nach dem Hinweis s r · P(X ≥ 1) = 1 − P(X ≤ 0) = 1 − fX (0) = 1 − 0 r+sn n = 1− = 1− 970 20 1000 20 =1− 970 · 969 · . . . · 951 1000 · 999 · . . . · 981 / 20! 20! 970 · 969 · . . . · 951 4.464685 · 1059 =1− = 0.4594. 1000 · 999 · . . . · 981 8.259284 · 1059 b) Wird ein getestetes Bauteil zurückgelegt, so liegt die Situation des Ziehens mit Zurückr legen vor und es ist X ∼ Bin(n, r+s ) = Bin(20, 0.03). Es ist hier P(X ≥ 1) = 1 − P(X = 0) = 1 − fX (0) 20 = 1− · 0.030 · (1 − 0.03)20 = 1 − 0.9720 = 0.4562. 0 r = 0.03 ist, ändert sich an c) Es ist jetzt n = 20, r = 300 und s = 9700. Da weiterhin r+s der Wahrscheinlichkeit in b) nichts. In a) erhalten wir 9700 9681 9700 9699 20 P(X ≥ 1) = 1 − 10000 = 1 − · ·...· = 1 − 0.5435 = 0.4565. 10000 9999 9981 20 Dieser Wert stimmt bis auf 3 Einheiten in der vierten Nachkommastelle mit dem Wert 0.4562 aus b) überein. Aufgabe 14: An einer E-Mail-Adresse treffen täglich X Spam-Mails ein. Aus Erfahrung weiß man, dass X eine Zufallsvariable ist mit der Poisson-Verteilung P o(α) für ein α > 0. Weiter treffen täglich genau c erwünschte E-Mails ein, c ∈ N. a) Drücken Sie Y := Gesamtzahl der E-Mails, die täglich an der E-Mail-Adresse eintref” fen“ mit Hilfe von X und c aus. Welche Werte kann Y annehmen? Bestimmen Sie die Zähldichte von Y . b) Bestimmen Sie P(Y ≤ 6) für den Fall α = 6 und c = 4. c) Angenommen, X sei eine Zufallsvariable mit der Binomialverteilung Bin(100, 0.06). Bestimmen Sie wieder P(Y ≤ 6) für den Fall c = 4 und vergleichen Sie das Ergebnis mit dem Ergebnis aus b), d.h. wie groß ist der prozentuale Unterschied beider Wahrscheinlichkeiten? Lösung: a) Es ist Y = X + c. Da X die Werte 0, 1, . . . annehmen kann, nimmt Y die Werte c, c + 1, c + 2, . . . an. Ferner fY (k) = P(Y = k) = P(X + c = k) = P(X = k − c) ( αk−c e−α · (k−c)! , k≥c = fX (k − c) = 0 , sonst. b) Wegen Y ≥ c = 4 gilt P(Y ≤ 6) = P(Y = 4) + P(Y = 5) + P(Y = 6), also wegen a) α0 α1 α2 + e−α · + e−α · 0! 1! 2! 2 α = e−α · (1 + α + ) = 25 · e−6 = 0.06197. 2 P(Y ≤ 6) = e−α · c) Gilt X ∼ Bin(100, 0.06), so wegen a) mit p = 0.06 P(Y ≤ 6) = P(Y = 4) + P(Y = 5) + P(Y = 6) = fX (0) + fX (1) + fX (2) 100 100 100 0 100 1 99 = · p · (1 − p) + · p · (1 − p) + · p2 · (1 − p)98 0 1 2 = 0.9498 · (0.942 + 100 · 0.06 · 0.94 + 4950 · 0.062 ) = 0.05661. Das Ergebnis aus b) ist um 9.46% größer als das aus c). Aufgabe 15: Ein Programm soll (auf Korrektheit) getestet werden. Die Wahrscheinlichkeit, dass bei einem Testdurchlauf ein (Laufzeit-) Fehler gefunden wird, sei p > 0. X sei die zufällige Anzahl der Testdurchläufe ohne Fehler, bis der erste Fehler gefunden wird. a) Welche Verteilung hat X? b) Das Programm wird so lange getestet, bis ein Fehler gefunden wird, höchstens jedoch c mal. Sei Y dabei die zufällige Anzahl der Testdurchläufe. Berechnen und skizzieren Sie die Zähldichte der Zufallsvariablen Y für p = 0.1 und c = 7. c) Z := 50 · Y + 100 seien die zufälligen Kosten für den Test. Berechnen Sie P(Z ≥ 200) für p = 0.1 und c = 7. d) Wie groß muss c ∈ N mindestens sein, damit für den Fall p = 0.1 ein Laufzeitfehler mindestens mit Wahrscheinlichkeit 90% gefunden wird? Lösung: Wir nehmen an, dass wie in Abschnitt 7.5 des Skriptums ein ideales Zufallsexperiment mit den zwei möglichen Ergebnissen Fehler gefunden“ (1) oder kein Fehler gefunden“ ” ” (0) solange unabhängig unter gleichen Bedingungen durchgeführt wird, bis der erste Fehler gefunden wird. a) X die geometrische Verteilung G(p) mit Parameter p. b) X + 1 ist die zufällige Anzahl der Testdurchläufe bis der erste Fehler gefunden wird. Es ist daher Y = min{X + 1, c}. Y nimmt also die Werte 1, 2, . . . , c an und es ist {X + 1 = k} = {X = k − 1}, k = 1, 2, . . . , c − 1, {Y = k} = {X + 1 ≥ c} = {X ≥ c − 1} , k = c. Wegen P(X ≥ c − 1) = ∞ X p · (1 − p)k = p · (1 − p)c−1 · [1 + (1 − p) + (1 − p)2 + . . .] k=c−1 = p · (1 − p)c−1 · 1 = (1 − p)c−1 1 − (1 − p) gilt fY (k) = p · (1 − p)k−1 , k = 1, 2, . . . , c − 1 c−1 P(X ≥ c − 1) = (1 − p) , k = c Speziell für p = 0.1 und c = 7 ergibt sich k 1 2 3 4 5 6 7 fY (k) 0.100 0.090 0.081 0.073 0.066 0.059 0.531 mit dem Stabdiagramm fY (k) 0.5 0.4 0.3 0.2 0.1 0 1 2 3 4 5 6 7 k c) P(Z ≥ 200) = P(50 · Y + 100 ≥ 200) = P(50 · Y ≥ 100) = P(Y ≥ 2) = 1 − P(Y = 1) = 1 − fY (1) = 0.900. d) Ein Laufzeitfehler wird genau dann gefunden, wenn X < c ist, denn andernfalls wird in den ersten c Testdurchläufen kein Fehler gefunden. Gefordert ist P(X < c) ≥ 0.9, also P(X ≥ c) ≤ 0.1. Wegen b) gilt (man ersetze dort c−1 durch c) P(X ≥ c) = (1−p)c = 0.9c . Es muss also 0.9c ≤ 0.1 gelten, und damit äquivalent ⇐⇒ c · ln(0.9) ≤ ln(0.1) ⇐⇒ −0.10536 · c ≤ −2.30259 2.30259 ⇐⇒ c ≥ = 21.854. 0.10536 Es muss also c ≥ 22 sein. (Natürlich kann man dieses Ergebnis auch erhalten, wenn man für verschiedene c die Bedingung 0.9c ≤ 0.1 direkt überprüft.)