Nachklausur Wahrscheinlichkeitstheorie und Inferenz II Sommersemester 2011 28. Oktober 2011 Prof. Dr. Torsten Hothorn Institut für Statistik Nachname: Vorname: Matrikelnummer: Anmerkungen: Schreiben Sie Ihren Namen und Ihre Matrikelnummer auf jeden Klausurbogen. Überprüfen Sie, ob Ihr Klausurexemplar vollständig ist. Die Klausur besteht aus fünf Aufgaben, einem Deckblatt und der Standardnormalverteilung im Anhang. Verwenden Sie für Ihre Lösungen ausschließlich den Klausurbogen (Vorder- und Rückseite), Zusatzblätter werden auf Anfrage ausgeteilt. Als Hilfsmittel zugelassen sind alle Mitschriften der Vorlesung und der Übung, das ausgedruckte Skript sowie Bücher und ein Taschenrechner. Die Bearbeitungszeit beträgt 120 Minuten. In den ersten 30 Minuten und in den letzten 15 Minuten ist keine vorzeitige Abgabe möglich. Halten Sie für die Ausweiskontrolle bitte Ihren Studentenausweis und einen Lichtbildausweis bereit. Es können 26 Punkte erreicht werden. Ich habe die Anmerkungen zur Kenntnis genommen und die Angabe auf Vollständigkeit überprüft. Unterschrift: . . . . . . . . . . . . . . . . . Aus . . . . . . % bearbeiteten Übungsaufgaben haben Sie . . . . . . Bonuspunkte erworben. Punkte: Note: Name: Matrikelnr.: Klausur Wahrscheinlichkeitstheorie und Inferenz II Aufgabe 1 Seien X1 , . . . , Xn unabhängig identisch verteilte Zufallsvariablen mit Dichte f (x) = θr r−1 x exp(−θx), Γ(r) x > 0. Es sei r = r0 bekannt. (a) Berechnen Sie den Maximum-Likelihood Schätzer für θ. (3 Pkt.) (b) Bestimmen Sie die approximative Verteilung des Maximum-Likelihood-Schätzers. (2 Pkt.) Lösung: (a) n Y θr0 r0 −1 L(θ; x) = x exp(−θxi ) Γ(r0 ) i i=1 n θr0 n Y r0 −1 = exp(−θx ) x i i Γ(r0 )n i=1 l(θ; x) = r0 n · log θ − n · log Γ(r0 ) + (r0 − 1) n X log x1 − θ i=1 n X xi i=1 r0 n X ! S(θ; x) = − xi = 0 θ r0 n X = xi ⇒ θ r0 n θ̂ML = P xi (b) r n r n ∂ 0 0 IX (θ) = E (− S(θ; x)) = E = 2 2 ∂θ θ θ r0 IX1 (θ) = 2 θ √ θ2 D n(θ̂ML − θ) −→ N (θ, ) r0 28. Oktober 2011 2 LMU München Name: Matrikelnr.: Klausur Wahrscheinlichkeitstheorie und Inferenz II Aufgabe 2 (a) Sei Z = (Z1 , . . . , Zn ) eine unabhängig identisch verteilte Stichprobe von exponentialverteilten Zufallsvariablen Zi ∼ Exp(λ), λ > 0. Zeigen Sie, dass der Schätzer !2 n 1X Ta (Z) = Zi = Z̄ 2 n i=1 1 kein erwartungstreuer Schätzer für γ(λ) = 2 ist. λ n P n n Hinweise: U = Zi ∼ Γ(n, λ), E (U ) = , V (U ) = 2 . λ λ i=1 2 2 V (X) = E (X ) − (E (X)) (2 Pkt.) 1 (b) Sei Y eine Poisson-verteilte Zufallsvariable mit Parameter λ = − log ϑ. 2 Zeigen Sie, dass Tb (Y ) = (−1)Y ein erwartungstreuer Schätzer für ϑ ist. ∞ X uk Hinweis: exp(u) = k! k=0 (2 Pkt.) (c) Sei X = (X1 , X2 , X3 ) eine unabhängig identisch verteilte Stichprobe von BernoulliExperimenten mit Erfolgswahrscheinlichkeit p, p ∈ (0, 1). Zeigen Sie mit Hilfe der bedingten Verteilung von X gegeben Tc (X) = t, dass die Statistik Tc (X) = X1 + 2X2 + X3 nicht suffizient ist. Es muss nicht die gesamte bedingte Verteilung berechnet werden, sondern es genügt eine ausgewählte bedingte Wahrscheinlichkeit zu betrachten (zum Beispiel P(X = (1, 0, 1) | Tc (X) = 2). (2 Pkt.) Lösung: (a) E (Ta (Z)) n 1X Zi E n i=1 = U= P = Xi U ∼Γ(n,λ) = = 28. Oktober 2011 !2 = 1E n2 n X !2 Zi i=1 1 1 E (U 2 ) = 2 (V (U ) + (E (U ))2 ) 2 n n 1 n n2 1 n(n + 1) · + = 2· 2 2 2 n λ λ n λ2 n+1 1 1 · 2 6= 2 n λ λ 3 LMU München Klausur Wahrscheinlichkeitstheorie und Inferenz II Name: Matrikelnr.: (b) E (Tb (Y )) ∞ X = y=0 ∞ X = = = Exponentialreihe = (−1)y · λy exp(−λ) y! (− 12 log ϑ)y 1 (−1) · exp(−(− log ϑ)) y! 2 y=0 √ ∞ y X √ ϑ)y y (−1) · (log (−1) · · exp(log ϑ) y! y=0 √ y ∞ y √ X ϑ) y (−1) · (log ϑ· (−1) · y! y=0 √ √ √ √ ϑ · exp(log( ϑ)) = ϑ · ϑ = ϑ y Alternativ: 1 λ = − log ϑ ⇔ ϑ = exp(−2λ) 2 ∞ X λy E (Tb (Y )) = (−1)y · exp(−λ) y! y=0 = exp(−λ) ∞ X −λy y=0 y! = exp(−λ) · exp(−λ) = exp(−2λ) = ϑ (c) Tc (x) = 2 ergibt sich für x = (1, 0, 1) und x = (0, 1, 0). Die zugehörigen Wahrscheinlichkeiten betragen P(X = (1, 0, 1)) = p2 (1 − p) und P(X = (0, 1, 0)) = p(1 − p)2 . Also: P(Tc (X) = 2) = p2 (1 − p) + p(1 − p)2 = p(1 − p). P(X = (1, 0, 1), Tc (X) = 2) Tc (X) = 2 P(X = (1, 0, 1)) p2 (1 − p) = = =p Tc (X) = 2 p(1 − p) P(X = (1, 0, 1) | Tc (X) = 2) = Da die bedingte Verteilung von X gegeben der Statistik Tc (X) vom unbekannten Parameter abhängt, ist Tc (X) nicht suffizient. 28. Oktober 2011 4 LMU München Klausur Wahrscheinlichkeitstheorie und Inferenz II Name: Matrikelnr.: Aufgabe 3 Sei X = (X1 , . . . , Xn ) eine unabhängig identisch verteilte Stichprobe einer auf dem Intervall [0; θ] stetig gleichverteilten Zufallsvariable. Wir betrachten die Hypothese H0 : θ ≤ θ0 versus H1 : θ > θ0 und den Test ϕ(x) = 1 falls x(n) > θ0 0 falls x(n) ≤ θ0 . (a) Bestimmen Sie die Gütefunktion des Tests. (3 Pkt.) (b) Wie groß ist die maximale Wahrscheinlichkeit für den Fehler 1. Art? (1 Pkt.) (c) Skizzieren Sie die Gütefunktion. (1 Pkt.) Lösung: x 1 · I[0;θ] (x) und F (x) = · I[0;θ] (x) θ θ Stetige Gleichverteilung auf [0; θ] ⇒ f (x) = (a) βϕ (θ) = P(ϕ(X) = 1) = P(X(n) > θ0 ) = 1 − P(X(n) ≤ θ0 ) n n n Y Y θ0 θ0 =1− = 1− P(Xi ≤ θ0 ) = 1 − θ θ i=1 i=1 (b) βϕ (θ0 ) = 1 − θ0 θ0 n = 0, d.h. es kann kein Fehler erster Art eintreten (vgl. auch Grafik der Gütefunktion in Teilaufgabe (c)) (c) 0 0.2 0.4 βφ(θ) 0.6 0.8 1 Guetefunktion θ0 θ 28. Oktober 2011 5 LMU München Name: Matrikelnr.: Klausur Wahrscheinlichkeitstheorie und Inferenz II Aufgabe 4 Die Zeiten zwischen den Ankünften von Flugzeugen auf dem Franz-Josef-Strauß Flughafen in München können als exponentialverteilt angesehen werden. Je größer der Parameter λ dieser Verteilung ist, desto häufiger wird der Flughafen angeflogen, d.h. kürzere Zwischenankunftszeiten λ1 . Im Rahmen einer Untersuchung über die Fluglärmbelästigung ermitteln Anwohnern 50 Zwischenankunftszeiten, die als unabhängig und identisch verteilt angesehen werden können. Die Stichprobe der Anwohner hat eine mittlere Zwischenankunftszeit von 8 Minuten ergeben. Kann man anhand dieser Stichprobe mit einer Irrtumswahrscheinlichkeit von 5% nachweisen, dass die erwarteten Flugankünfte häufiger als in 10-Minuten Abständen stattfinden (gleichbedeutend mit λ > 0.1)? – Stellen Sie die zur Fragestellung passende Nullhypothese & Alternativhypothese auf. – Konstruieren Sie einen approximativen Test für die aufgestellte Hypothese. – Führen Sie den Test durch. (6 Pkt.) Lösung: Bekannt: Xi ∼ Exp(λ) ⇒ Das Testproblem lautet: E (Xi ) = λ1 , H0 : λ ≤ 0.1 V (Xi ) = 1 . λ2 vs. H1 : λ > 0.1 vs. H1 : µ < 10. oder äquivalent dazu (mit µ = λ1 ): H0 : µ ≥ 10 Unter H0 gilt: E (Xi ) = 1 = µ0 = 10, λ0 V (Xi ) = und T (X) = 1 = µ20 = 100, 2 λ0 √ X̄ − E (Xi ) H0 n p ∼ N (0, 1). V (Xi ) Die Fragestellung lässt sich mit folgendem Test untersuchen: ( 1, T (x) < z0.05 φ(x) = 0, T (x) ≥ z0.05 mit zα dem α-Quantil der N (0, 1) Verteilung. Durchführung des Tests: P50 Xi X̄ = i=1 = 8. n ⇒ T (x) = √ 50 8 − 10 ≈ −1.41 > −1.64 = z0.05 . 10 ⇒ Die Nullhypothese kann nicht abgelehnt werden. 28. Oktober 2011 6 LMU München Klausur Wahrscheinlichkeitstheorie und Inferenz II Name: Matrikelnr.: Aufgabe 5 Entscheiden Sie, ob die folgenden Aussagen wahr oder falsch sind. (a) Zur Berechnung der Teststatistiken von Wald-Test, Score-Test und LikelihoodQuotienten-Test benötigt man den Maximum-Likelihood-Schätzer. (1 Pkt.) (b) Asymptotisch sind Wald-Konfidenzintervalle, Score-Konfidenzintervalle und Likelihood-Konfidenzintervalle gleich. (1 Pkt.) (c) Die Verteilung eines suffizienten Schätzers ist unabhängig vom zu schätzenden Parameter. (1 Pkt.) (d) Die Verteilung eines konsistenten Schätzers konzentriert sich mit wachsendem Stichprobenumfang am wahren Parameter. (1 Pkt.) Lösung: (a) Falsch. Für die Berechnung der Score-Teststatistik wird der Maximum-LikelihoodSchätzer nicht benötigt. (b) Richtig. (c) Falsch. Die Verteilung der Stichprobe bedingt auf einen suffizienten Schätzer ist unabhängig vom zu schätzenden Parameter. (d) Richtig. 28. Oktober 2011 7 LMU München Klausur Wahrscheinlichkeitstheorie und Inferenz II x 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00 Φ(x) 0.5199 0.5398 0.5596 0.5793 0.5987 0.6179 0.6368 0.6554 0.6736 0.6915 0.7088 0.7257 0.7422 0.7580 0.7734 0.7881 0.8023 0.8159 0.8289 0.8413 x 1.05 1.10 1.15 1.20 1.25 1.30 1.35 1.40 1.45 1.50 1.55 1.60 1.65 1.70 1.75 1.80 1.85 1.90 1.95 2.00 Φ(x) 0.8531 0.8643 0.8749 0.8849 0.8944 0.9032 0.9115 0.9192 0.9265 0.9332 0.9394 0.9452 0.9505 0.9554 0.9599 0.9641 0.9678 0.9713 0.9744 0.9772 x 2.05 2.10 2.15 2.20 2.25 2.30 2.35 2.40 2.45 2.50 2.55 2.60 2.65 2.70 2.75 2.80 2.85 2.90 2.95 3.00 Name: Matrikelnr.: Φ(x) 0.9798 0.9821 0.9842 0.9861 0.9878 0.9893 0.9906 0.9918 0.9929 0.9938 0.9946 0.9953 0.9960 0.9965 0.9970 0.9974 0.9978 0.9981 0.9984 0.9987 Tabelle 1: Verteilungsfunktion der Standardnormalverteilung. 28. Oktober 2011 Anhang LMU München