SS 2006 Mathematische Statistik H. Walk, A. Meister Blatt 4 Aufgabe 12. Seien X1 , X2 , . . . unabhängige auf [0, ϑ] gleichverteilte Zufallsvariablen mit beobachteten Realisierungen x1 , x2 , . . .. Es soll die in Aufgabe 2b aufgetretene Schätzung mn := max{x1 , . . . , xn } für ϑ untersucht werden. a) Für Mn := max{X1 , . . . , Xn } zeige man Mn −→ ϑ f.s. . b) Zu ermitteln ist das asymptotische Verhalten von Zn := n(ϑ − Mn )/ϑ für n → ∞. Aufgabe 13. Die Zufallsvariablen X1 , X2 , . . . seien wie in Aufgabe 12. a) Zu ermitteln ist eine nichtrandomisierte Bayes-Schätzung δn (X1 , . . . , Xn ) von ϑ, wobei von einer a priori Verteilung von ϑ ausgegangen werden soll, die eine Dichte g mit g(ϑ) = e−ϑ , ϑ > 0, besitze. Die Verlustfunktion sei gegeben durch l(ϑ, a) = (ϑ − a)2 , a, ϑ > 0. b) Zeigen Sie, dass δn (X1 , . . . , Xn ) − max{X1 , . . . , Xn } für n → ∞ fast sicher gegen 0 konvergiert und dass somit (δn )n∈N eine stark konsistente Schätzerfolge für ϑ ist, d.h. δn (X1 , . . . , Xn ) gegen ϑ für n → ∞ fast sicher konvergiert. Aufgabe 14. Durch eine Meinungsumfrage soll ermittelt werden, welcher Anteil p der Bevölkerung einem bestimmten Gesetzesentwurf zustimmt. Dabei werden n Personen befragt, wobei Mehrfachbefragungen derselben Person nicht auszuschließen sind. Die Anzahl derjenigen Befragten, die dem Entwurf zustimmen, werde mit m bezeichnet. Ein naheliegender Schätzer für p ist p̂1 = m/n . Alternativ kann stratifiziert werden, d.h. die Bevölkerung in k disjunkte Teilmengen mit den Mächtigkeiten N1 , . . . , Nk eingeteilt werden, so dass N1 + · · · + Nk = N , die Größe der Gesamtbevölkerung, ergibt. Aus der j. Teilmenge werden nj Personen befragt, und man beobachtet mj zustimmende Antworten. Der Anteil aller Personen aus der j. Teilmenge, die dem Entwurf zustimmen, an Nj , sei mit pj bezeichnet. Als Schätzer für p wird p̂2 = k X N j mj j=1 N nj vorgeschlagen. Um beide Schätzer vergleichen zu können, wird n1 + · · · + nk = n vorausgesetzt, d.h. die Gesamtzahl der Befragten ist in beiden Fällen dieselbe. a) Zeigen Sie, dass beide Schätzer erwartungstreu sind, und berechnen Sie die Varianz beider Schätzer. b) Die Stichprobenumfänge werden proportional zur Größe der jeweiligen Teilmenge gewählt, d.h. nj = Nj n/N . Welcher der Schätzer p̂1 und p̂2 besitzt bzgl. der Gaußschen Verlustfunktion geringeres Risiko bei der Schätzung von p? Aufgabe 15. Es sei Q eine auf {1, . . . , m} konzentrierte Verteilung mit pk := Q({k}). Unter der Entropie der Verteilung Q versteht man die Größe H(Q) = − m X pk log2 pk k=1 mit der Konvention 0 · log2 0 = 0. Es werden jeweils Realisierungen der unabhängigen Zufallsvariablen X1 , . . . , Xn beobachtet, die Q als Verteilung besitzen. Als Schätzer für pk werde n 1X I{Xj =k} p̂k = n j=1 verwendet. Als empirische Version der Entropie definiere man Ĥ = − m X p̂k log2 p̂k . k=1 a) Zeigen Sie, dass die Entropie H(Q) im Mittel unterschätzt wird, d.h. E Ĥ ≤ H(Q) . Unter welchen Voraussetzungen ist Ĥ erwartungstreu? Hinweis: Es darf die Jensensche Ungleichung verwendet werden: Sei ϕ : R → R eine konvexe Funktion und X eine reelle integrierbare Zufallsvariable. Ist zudem ϕ(X) integrierbar, dann gilt ϕ(EX) ≤ Eϕ(X) . b) Zeigen Sie, dass für n → ∞ die empirische Entropie Ĥ fast sicher gegen Ĥ(Q) konvergiert. 2