Universität zu Köln WS 2015/16 Institut für Mathematik Dozent: Prof. Dr. A. Drewitz Assistent: L. Schmitz Abgabe: 4.2. & 5.2. vor den Übungen 12. Übung Einführung in die Stochastik (Maximum-Likelihood-Schätzer, Cramér-Rao, Tests) Hausaufgaben 1. Aufgabe (4 Punkte) Man betrachte das Modell (X , A, (Pϑ )ϑ∈Θ ), wobei Pϑ die Verteilung eines Vektors (X1 , . . . , Xn ) auf (X , A) = (Rn , B(Rn )) bezeichnet und X1 , . . . , Xn unabhängige, identisch N (µ, σ 2)-verteilte Zufallsvariablen sind. Ferner seien dabei µ ∈ R und σ 2 > 0 unbekannt, d.h. Θ = R × (0, ∞) und wir setzen ϑ := (µ, σ 2 ) ∈ Θ. Bestimmen Sie den Maximum-Likelihood-Schätzer für τ (ϑ) = ϑ. Ist dieser erwartungstreu? 2. Aufgabe (6 Punkte) Man betrachte das Modell (X , A, (Pν )ν∈Θ ), wobei Pν die Verteilung eines Vekn tors (X1 , . . . , Xn ) auf (X , A) = Nn0 , 2N0 bezeichnet und X1 , . . . , Xn unabhängige, identisch Poiν -verteilte Zufallsvariablen sind. Dabei ist ν ∈ (0, ∞) = Θ unbekannt. a) Bestimmen Sie den Maximum-Likelihood-Schätzer ν̂ für τ (ν) = ν. (2 Punkte) b) Zeigen Sie, dass ν̂ aus a) erwartungstreu ist. (1 Punkt) c) Verifizieren Sie, dass (Nn0 , 2N0 , (Pν )ν∈Θ ) ein reguläres parametrisches Modell ist und zeigen Sie, dass im Falle von ν̂ aus a) die Cramér-RaoUngleichung (Display (2.1.13)) zu einer Gleichung wird. (3 Punkte) n 3. Aufgabe (0 Punkte) Es sei X die Anzahl der Unfälle in einer bestimmten Stadt in einer Woche. Wir nehmen dabei an, dass X Poiν -verteilt ist mit unbekanntem ν > 0. Wir wollen aus der Beobachtung von X die Wahrscheinlichkeit schätzen, dass in den folgenden drei Wochen kein Unfall geschieht, d.h. τ (ν) := (Pν (X = 0))3 . Zeigen Sie, dass jeder erwartungstreue Schätzer T keinen sinnvollen Schätzwert für τ (ν) liefert. Einführung in die Testtheorie Manchmal ist es nicht wichtig, Parameter genau zu bestimmen, sondern man interessiert sich für Bereiche, in denen sich der gesuchte Parameter mit möglichst großer, vorgegebener Wahrscheinlichkeit befindet. Man trifft also auf Grundlage einer Beobachtung x = (x1 , . . . , xn ) ∈ X eine Entscheidung zwischen zwei Hypothesen H : ϑ ∈ Θ0 , K : ϑ ∈ / Θ0 , wobei Θ0 ( Θ. Im einfachsten Fall (“nicht randomisiert”) wird die Entscheidung getroffen durch den Wert einer “Zweientscheidungsfunktion”ϕ mit ( 1, falls x ∈ S, , ϕ(x) = 0, falls x ∈ A = X \S. wobei S und A = X \S “geeignet“ zu wählen sind (s.u.). Mit Vorliegen der Beobachtung x gibt ϕ(x) die Wahrscheinlichkeit an, die Entscheidung für K zu treffen. Fehlentscheidungen sind dabei möglich. Üblicherweise unterscheidet man zwei Fehlerarten: • Fehler 1. Art: ϑ ∈ Θ0 , aber x ∈ S (oder ϕ(x) = 1). Man trifft also die falsche Entscheidung für K. • Fehler 2. Art: ϑ ∈ / Θ0 , aber x ∈ A (oder ϕ(x) = 0). Der Test wird nun so konstruiert (d.h. S darf nur so gewählt werden), dass die Fehlerw’keit 1. Art klein bleibt, d.h. ! Pϑ (ϕ(X) = 1) = Pϑ (X ∈ S) ≤ α ∀ϑ ∈ Θ0 , (1) wobei α klein ist (üblicherweise α = 0.1, 0.05, 0.01). Dann wird unter der Nebenbedingung (1) derjenigen Test ϕ∗ (oder derjenigen Bereich A∗ ) ausgewählt, der die Fehlerw’keit 2. Art minimiert, d.h. Pϑ (ϕ∗ (X) = 0) = min Pϑ (ϕ(X) = 0) = min Pϑ (X ∈ A) ∀ϑ ∈ / Θ0 . ϕ A⊂X (2) Gemäß (2) sollte also S = X \A möglichst groß gewählt werden, aber noch so klein, dass (1) erfüllt ist. Ein Test, welcher (1) und (2) erfüllt, wird auch Neyman-Person-Test zum Niveau α genannt. Das folgende Beispiel veranschaulicht, wie ein Test konkret konstruiert werden kann. Dabei verwendet der Test bereits als “gut“ (erwartungstreu, konsistent etc.) verifizierte Parameterschätzer ϑ̂, um zu entscheiden, ob der unbekannte Parameter ϑ in einem bestimmten Bereich liegt. Beispiel: X1 , . . . , Xn seien unabhängige und identisch Bin1,p -verteilte Zufallsvariablen, p ∈ (0, 1). Ein Neyman-Pearson-Test zum Niveau α = 0.1 für H : p ≤ p0 , K : p > p0 , wobei 0 < pP 0 < 1 bekannt ist, könnte wiefolgt aussehen: 1 Da X̄ = n ni=1 Xi eine “gute Schätzung“ für p ist, spricht ein großer Wert von X̄ für K, andernfalls spricht er für H. Wir würden also den Test folgendermaßen konstruieren: ( 1, falls x̄ > c ϕ(x) = ϕ(x1 , . . . , xn ) = 0, falls x̄ ≤ c, wobei c noch gewählt wird. Der Test muss dann so konstruiert werden, dass (1) und (2) eingehalten werden, d.h. Pp (ϕ(X) = 1) = Pp X̄ > c ≤ α ∀p ≤ p0 (3) und gleichzeitig c möglichst klein gewählt werden (unter Einhaltung von (3)), damit der Fehler 2. Art minimiert wird. Auf dieselbe Art kann die folgende Aufgabe bearbeitet werden: 4. Aufgabe (0 Punkte) Es seien X1 , . . . , Xn unabhängige, identisch Poiν -verteilte Zufallsvariablen, ν > 0. a) Konstruieren Sie einen Neyman-Pearson-Test zum Niveau α für die Hypothesen H : ν ≤ ν0 , K : ν > ν0 , wobei ν0 > 0 bekannt sei. b) Ein Zufallsgenerator liefert die folgenden Realisationen einer Poiν -verteilten Zufallsvariablen: 4, 2, 3, 5, 3, 3, 3, 3, 0, 2. Testen Sie die Hypothesen H : ν ≤ 2 gegen K : ν > 2 jeweils bei einem Niveau α = 0.05 bzw. α = 0.07. Hinweis zu a): Sie dürfen Pn verwenden, dass die Summe X1 + . . . + Xn Poinν 1 verteilt ist und dass n i=1 Xi ein guter Schätzer für Eν [X1 ] = ν ist. zu b): Für eine Poi20 -verteilte Zufallsvariable X gilt k 24 25 26 27 28 29 30 P20 (X ≤ k) 0.8432 0.8878 0.9221 0.9475 0.9657 0.9782 0.9865 Anmerkung: Es sind nur die Aufgaben einzureichen, welche strikt positive Punktzahlen haben. Sollten Sie für eine Aufgabe mehrere Blätter benötigen, so sind diese zusammenzuheften. Bitte beschriften Sie Ihre Lösungen in der ersten Zeile in der folgenden Reihenfolge: Gruppe, Name, Aufgabe. Gesamtpunktzahl: 10 4