WS 2006/07 INSTITUT FÜR STOCHASTIK UNIVERSITÄT KARLSRUHE Priv.-Doz. Dr. D. Kadelka Klausur Wahrscheinlichkeitstheorie und Statistik vom 2.3.2007 Musterlösungen Aufgabe A1: Gegeben sei eine Urliste mit den Paaren (x1 , y1), . . . , (x10 , y10 ) j xj yj a) 1 1 7.4 2 1.7 7.1 3 3.1 6.2 4 4.1 3.9 5 4.9 4.5 6 6.1 4.6 7 7.3 −0.5 9 9.1 0.4 10 9.7 −1.2 Berechnen Sie die Stichprobenmittel x̄, ȳ, die Stichproben-Standardabweichungen sx , sy und den empirischen Korrelationskoeffizienten rxy . Lösung: Direkt aus den Daten ergibt sich gemäß Definition 1.8 und Paragraph 1.5 unter Ausnützung der Beziehung n X (xj − x̄) · (yj − ȳ) = j=1 n X xj · yj − n · x̄ · ȳ j=1 x̄ = 5.51 ȳ = 3.48 rxy = − 0.929 b) 8 8.1 2.4 sx = 3.05 sy = 3.104 Bestimmen Sie die zugehörige Regressionsgerade y = a∗ + b∗ · x von y auf x. sy und a∗ = ȳ − b∗ · x̄, also Lösung: Nach Paragraph 1.5 ist b∗ = rxy · sx b∗ = −0.946 a∗ = 8.69 und die Regressionsgerade y = 8.69 − 0.946 · x. 6 4 0 2 y 2 4 6 8 10 x Punkte und Regressionsgerade y = a∗ + b∗ · x Für die Lösung der nächsten drei Aufgabenteile benötigen wir die aufsteigend sortierten y-Werte. Es ist y() = (−1.2, −0.5, 0.4, 2.4, 3.9, 4.5, 4.6, 6.2, 7.1, 7.4) c) Berechnen Sie das 0.2-getrimmte Stichprobenmittel ȳ0.2 von (y1 , . . . , y10 ). Lösung: Mit k = [10 · 0.2] = 2 ergibt sich ȳ0.2 = d) 1 · (y(3) + . . . + y(8) ) = 3.667 10 − 2 · 2 Bestimmen Sie das Stichproben-0.2-Quantil ỹ0.2 von (y1 , . . . , y10 ). Lösung: Da 10 · 0.2 = 2 ganzzahlig ist, ist mit k = [2] = 2 ỹ0.2 = y(2) + y(3) y(k) + y(k+1) = = −0.05 2 2 Aufgabe A2: Die Zufallsvariable X besitze die Verteilung N (8, 9) und die Zufallsvariable Y die Verteilung N (−3, 16). X und Y seien stochastisch unabhängig. a) Welche Verteilung besitzt Z := X + Y und welche Verteilung besitzt U := X − Y ? b) Bestimmen Sie die Varianz V (U) von U. c) Berechnen Sie die Kovarianz C(U, Y ) von U und Y . Sind U und Y positiv korreliert, negativ korreliert oder unkorreliert? d) Bestimmen Sie P(X ≥ 14). e) Berechnen Sie das 0.975-Quantil von Y . Lösung: a) Es ist −Y ∼ N (3, 16), also nach der Faltungsformel 11.16 Z ∼ N (8 − 3, 9 + 16) = N (5, 25), U = X + (−Y ) ∼ N (8 + 3, 9 + 16) = N (11, 25). b) Der zweite Parameter von N (µ, σ 2) ist die Varianz dieser Verteilung, also wegen b) V (Z) = 25. c) Wegen Satz 12.23 und der Unabhängigkeit von X und Y gilt C(U, Y ) = C(X − Y, Y ) = C(X, Y ) − C(Y, Y ) = 0 − V (Y ) = −16. Hieraus erhält man ohne Rechnung, dass ρ(U, Y ) < 0 ist. Daher sind U und Y negativ korreliert. d) Wegen der Stetigkeit von N (8, 9) gilt nach (9.6) und Tabelle A.1 14 − 8 P(X ≥ 14) = P(X > 14) = 1 − P(X ≤ 14) = 1 − Φ 3 = 1 − Φ(2) = 1 − 0.9772 = 0.0228. e) Nach Definition 12.19 gilt, dass t0.975 die Lösung ist von t0.975 − (−3) Φ−3,16 (t0.975 ) = Φ = 0.975. 4 Wegen Φ(1.96) = 0.975) gilt also und daraus t0.975 t0.975 + 3 = 1.96 4 = 4 · 1.96 − 3 = 4.84. (Man kann hierfür auch 12.20 c) benützen.) Aufgabe A3: Ein Arbeiter überwacht 3 Aggregate, die unabhängig voneinander arbeiten. Sei Ai das Ereignis, dass Aggregat i einer Überprüfung bedarf und pi = P(Ai ) die zugehörige Wahrscheinlichkeit, i = 1, 2, 3, mit p1 = 0.2, p2 = 0.4 und p3 = 0.6. Die Ereignisse A1 , A2 und A3 seien stochastisch unabhängig. B sei das Ereignis Mindestens ein Aggregat bedarf einer Überprüfung“. ” a) Berechnen Sie P(A1 ∩ A2 ∩ A3 ) und P(A1 ∪ A2 ). b) Stellen Sie B formelmäßig mit Hilfe von A1 , A2 , A3 dar. c) Berechnen Sie P(B). d) Berechnen Sie die (bedingte) Wahrscheinlichkeit P(A1 | B), dass Aggregat 1 einer Überprüfung bedarf, wenn mindestens ein Aggregat einer Überprüfung bedarf. Lösung: a) Da A1 , A2 und A3 unabhängig sind, gilt P(A1 ∩ A2 ∩ A3 ) = P(A1 ) · P(A2 ) · P(A3 ) = 0.048. Ferner gilt P(A1 ∪ A2 ) = P(A1 ) + P(A2 ) − P(A1 ∩ A2 ) A1 ,A2 unabhängig = p1 + p2 − P(A1 ) · P(A2 ) = p1 + p2 − p1 p2 = 0.52 b) Dass mindestens ein Aggregat der Überprüfung bedarf, ist gleichbedeutend damit, dass Aggregat 1 oder 2 oder 3 einer Überprüfung bedarf. Daher gilt B = A1 ∪ A2 ∪ A3 . c) Wegen der Formel des Ein- und Ausschließens gilt P(B) = P(A1 ) + P(A2 ) + P(A3 ) − P(A1 ∩ A2 ) − P(A1 ∩ A3 ) − P(A2 ∩ A3 ) + P(A1 ∩ A2 ∩ A3 ) = p1 + p2 + p3 − p1 p2 − p1 p3 − p2 p3 + p1 p2 p3 = 0.808 d) Nach Definition der bedingten Wahrscheinlichkeit gilt wegen A1 ⊂ B (wenn 1 einer Überprüfung bedarf, bedarf insbesondere mindestens ein Aggregat der Überprüfung) P(A1 | B) = P(A1 ∩ B) P(A1 ) 0.2 = = = 0.2475 P(B) P(B) 0.808 Aufgabe A4: Eine Messeinrichtung habe eine zufällige Lebensdauer mit Verteilung Exp(λ), λ > 0. Immer wenn eine Messeinrichtung ausfällt, wird sie durch eine gleichartige neue ersetzt. Das Ersetzen dauert genau 3 Zeiteinheiten. Die Lebensdauern X1 , X2 , . . . der einzelnen Messeinrichtungen seien unabhängig voneinander und identisch verteilt. Zn = n X Xi + 3n i=1 ist damit der Zeitpunkt, zu dem das (n+ 1)-te Messgerät mit den Messungen beginnt. Damit hat Zn − 3 · n die Verteilung Γ(n, λ). a) Bestimmen Sie P(Z1 > t) für t > 3. b) Bestimmen Sie die Verteilungsfunktion FZ2 (t) und eine Dichte fZ2 (t) von Z2 für t > 6. Hinweis: Die Γ(2, λ)-Verteilung hat die Verteilungsfunktion t → 1 − e−λt · (1 + λt), t ≥ 0. c) Die Ersetzung einer Messeinrichtung kostet c Euro, ferner fallen pro Zeiteinheit a > 0 Euro laufende Kosten an (auch während der Zeit, wenn eine Messeinrichtung ersetzt wird). c1 ) Die (zufälligen) Kosten Kn bis zum Zeitpunkt Zn sind von der Form Kn = bn + dn · n X Xi i=1 mit geeigneten Konstanten bn , dn . Bestimmen Sie bn und dn . c2 ) Berechnen Sie EKn und V (Kn ). P Lösung: Zn − 3n = ni=1 Xi ist die n-fache Faltung der Exp(λ) = Γ(1, λ)-verteilten Zufallsvariablen X1 , . . . , Xn . Wegen 11.16 gilt daher Zn − 3n ∼ Γ(n, λ). a) P(Z1 > t) = P(X1 + 3 > t) = P(X1 > t − 3) = 1 − (1 − e−λ(t−3) ) = e−λ(t−3) für t > 3, also t − 3 > 0. b) Wegen a) hat Y := Z2 − 6 die Verteilung Γ(2, λ). Insbesondere gilt Y > 0 und damit FZ2 (t) = P(Z2 ≤ t) = P(Y + 6 ≤ t) = P(Y ≤ t − 6) = 0 für t ≤ 6. Für t > 6 gilt dagegen FZ2 (t) = P(Y ≤ t − 6) = 1 − e−λ(t−6) · (1 + λ(t − 6)). Diese Verteilungsfunktion ist stetig und bis auf eventuell die Stelle t = 6 stetig differenzierbar (ob FZ2 auch an der einzelnen Stelle t = 6 differenzierbar ist, muss nicht überprüft werden). Wegen Satz 8.12 ist daher ( 0 , t≤6 fZ2 (t) = ′ −λ(t−6) −λ(t−6) 2 −λ(t−6) FZ2 (t) = λe · (1 + λ(t − 6)) − λe = λ (t − 6)e , t>6 eine Dichte von Z2 . c) Bis zum Zeitpunkt Zn liegen n Ersetzungen vor, daher sind die Kosten Kn = n · c + a · Zn = n · (c + 3 · a) + a · n X Xi , i=1 P wobei ni=1 Xi ∼ Γ(n, λ). Damit gilt c1 ) bn = n · (c + 3 · a) und dn = a. c2 ) Mit den Tabellen auf S. 124 und S. 128 ergibt sich ! n n X X n EKn = E n · (c + 3 · a) + a · Xi = n · (c + 3 · a) + a · E Xi = n · (c + 3 · a) + a λ i=1 i=1 und wegen Satz 12.11 c) V (Kn ) = V n · (c + 3 · a) + a · n X i=1 Xi ! =V a· n X i=1 Xi ! = a2 · V n X i=1 Xi ! = a2 · n . λ2 Aufgabe A5: Bei n = 200 Kontrollen wurde die zufällige Fehlerzahl xi bei jeweils 30 Vorgängen ermittelt, i = 1, . . . , n. Man nimmt an, dass die zufälligen Zahlen Xi der Fehler stochastisch unabhängig sind mit der Zähldichte 30−k k ϑ 30 ϑ · fϑ (k) = · 1− , k = 0, . . . , 30, k 30 30 ϑ ein unbekannter Parameter mit 0 < ϑ < 30. a) Welche Verteilung besitzen die zufälligen Zahlen der Fehler Xi , d.h. welche Verteilung hat gerade die Zähldichte fϑ ? (Geben Sie auch die Parameter an! ) b) Bestimmen Sie die Loglikelihood-Funktion Mx (ϑ) zur Stichprobe x = (x1 , . . . , xn ). c) Berechnen Sie einen Maximum-Likelihood-Schätzer ϑ̂(x) für ϑ. d) Insgesamt stellte man 40 mal 0 Fehler, 67 mal 1 Fehler, 60 mal 2 Fehler, 22 mal 3 Fehler, 9 mal 4 Fehler und 2 mal 5 Fehler fest. Berechnen Sie das Stichprobenmittel x̄ und die Stichprobenvarianz s2x . k ϑ Lösung: a) Es ist fϑ (k) = 30 · p · (1 − p)30−k mit p := 30 und dies ist gerade die Zähldichte k ϑ von Bin(30, p). Daher besitzt X1 die Verteilung Bin(30, 30 ). b) Wir berechnen die Loglikelihood-Funktion Mx (ϑ). Es gilt ln(fϑ (k)) = ln (30 − k) · ln(1 − ϑ/30) und damit Mx (ϑ) = n X i=1 30 k +k·ln(ϑ/30)+ n X 30 + xi · ln(ϑ/30) + (n − xi ) · ln(1 − ϑ/30) ln ln(fϑ (xi )) = xi i=1 n n n X X X 30 + ln(ϑ/30) · xi + ln(1 − ϑ/30) · (30 − xi ) = ln xi i=1 i=1 i=1 c) Mx besitzt die Ableitung Mx′ (ϑ) = = n n X 1 n · x̄ n · (30 − x̄) 1 X · xi − · (30 − xi ) = − ϑ i=1 30 − ϑ i=1 ϑ 30 − ϑ n · x̄ · (30 − ϑ) − n · (30 − x̄) · ϑ n · x̄ · 30 − n · 30 · ϑ 30 · n = = · (x̄ − ϑ) ϑ · (30 − ϑ) ϑ · (30 − ϑ) ϑ · (30 − ϑ) wobei wir Pn i=1 xi = n · x̄ benützt haben. Hierbei ist 30·n ϑ·(30−ϑ) > Mx′ (ϑ) = 0 genau dann, wenn < > 0 und damit < ϑ = x̄. > Dies bedeutet, dass die Funktion Mx unterhalb von ϑ̂(x) = x̄ steigt und oberhalb von ϑ̂(x) = x̄ fällt. Damit ist ϑ̂(x) die (einzige) Maximumstelle von Mx und ϑ̂(x) = x̄ der gesuchte Maximum-Likelihood-Schätzer. d) Zur P Berechnung von x̄ und s2x kann Satz 1.10 verwendet berechnet man P200 2werden.2Alternativ 200 2 direkt i=1 xi = 40·0+67·1+. . .+2·5 = 299 und i=1 xi = 40·0 +67·1 +. . .+2·52 = 699 und damit n 200 1 X 1 X 299 xi = · xi = = 1.495 und x̄ = · n i=1 200 i=1 200 !2 n n X X 1 2992 1 1 2 2 x − xi 699 − = 1.2663. = sx = n − 1 i=1 i n i=1 199 200 Aufgabe A6: Eine Firma besitzt 16 gleichartige Messgeräte, welche unabhängig voneinander und unter gleichen Bedingungen 2 Jahre lang ohne Wartung eingesetzt wurden. Bei der Überprüfung dieser Messgeräte stellt sich heraus, dass 10 dieser Messgeräte keine korrekten Messergebnisse mehr liefern. a) Es sei p die unbekannte Wahrscheinlichkeit, dass ein Messgerät auch nach 2 Jahren noch korrekte Messergebnisse liefert. Geben Sie ein Konfidenzintervall für die Wahrscheinlichkeit p zur Konfidenzwahrscheinlichkeit 0.90 an. Lösung: Nach Voraussetzung kann wie in Beispiel 18.5 ein ideales Zufallsexperiment mit den zwei möglichen Ergebnissen Keine korrekten Messergebnisse“ (Treffer) und Korrek” ” te Messergebnisse“ (Niete) und der Trefferwahrscheinlichkeit ϑ := p angesehen werden. Nach diesem Beispiel und wegen 18.6 ist mit n = 16 und x = 10 das gesuchte Konfidenzintervall [l(x), L(x)], wobei die Konfidenzgrenzen l(x) und L(x) für x = 10 und n − x = 6 und 1 − α = 0.9 aus Tabelle A.4 entnommen werden. Dies ergibt das Konfidenzintervall C1 (x) = [0.391 , 0.822] . b) Sie suchen jetzt ein Konfidenzintervall für p zum Konfidenzniveau 0.95. Ist dieses kleiner, gleich oder größer als das zur Konfidenzwahrscheinlichkeit 0.9? Lösung: Für das Konfidenzintervall zur Konfidenzwahrscheinlichkeit 0.95 erhält man aus Tabelle A.4 C2 (x) = [0.354 , 0.848] . Dieses ist größer als C1 (x). (Dies gilt allgemein: Wird die Konfidenzwahrscheinlichkeit (die Sicherheit) erhöht, so muss auch das Konfidenzintervall größer werden.)