8 Serie — Aufgaben zur Statistik Aufgabe 1. In einer Urne befindet sich eine unbekannte Anzahl ϑ von Kugeln, die mit den Zahlen 1, 2, · · · , ϑ nummeriert sind. Die Anzahl ϑ soll geschätzt werden. Dazu werden aus der Urne n Kugeln mit Zurücklegen gezogen. Die Zufallsgröße Xi (i = 1, . . . , n) beschreibe die Nummer der i−ten gezogenen Kugel. Die Zufallsgrößen Xi (i = 1, . . . , n) bilden offenbar eine mathematische Stichprobe. a) Bestimmen Sie die Verteilung von Xi und zeigen Sie, dass die Beziehungen EXi = ϑ+1 2 und V ar(Xi ) = ϑ2 − 1 12 gelten. b) Konstruieren Sie den Substitutionsschätzer Tn aus der Erwartung von Xi . c) Zeigen Sie, dass Vn := max(Xi : i = 1, . . . , n) der Maximum-Likelihood-Schätzer für ϑ ist. d) Zeigen Sie, dass Tn erwartungstreu ist und dass EVn < ϑ gilt. Weisen Sie nach, dass die Folge der Schätzfunktionen {Vn }n=1... asymptotisch erwartungstreu ist. e) Zeigen Sie, dass die Beziehungen V ar(Tn ) = ϑ2 − 1 3n und ϑ 1 X 2 n j [j − (j − 1)n ] − V ar(Vn ) = n ϑ j=1 ( ϑ 1 X j [j n − (j − 1)n ] ϑn j=1 )2 erfüllt sind. Untersuchen Sie mit SPSS oder R das Verhältnis der Varianzen von Tn und Vn für n = 1, . . . , 100 im Fall, dass für den Parameter ϑ = 50 gilt. f) Bestimmen Sie mit Hilfe der Inversionsmethode einen Algorithmus zur Erzeugung von Zufallszahlen zu der Verteilungsfunktion von Xi . g) Welche von den Schätzungen Tn und Vn ist vorzuziehen? Untersuchen Sie mit Hilfe von SPSS oder R die Güte beider Schätzungen für den Parameter ϑ = 50. Zu diesem Zweck erzeugen Sie N = 1000 Stichproben vom Umfang (i) n = 20. Bestimmen Sie für jede Stichprobe i = 1, 2, . . . , N die Schätzungen tn und (i) vn . Untersuchen Sie mit Methoden der explorativen Datenanalyse beide empirischen Verteilungen der Schätzungen. Berechnen Sie die empirischen Erwartungswerte und Varianzen der Schätzungen. Zeichnen Sie die Histogramme und Boxplots. Bestimmen Sie insbesondere den mittleren quadratischen Fehler beider Schätzungen. Aufgabe 2. a) Es sei U ∼ U (0, 1) und Y ∼ N (0, 1) unabhängige Zufallsgrößen. Weiter sei x eine gegebene Zahl und > 0. Zeigen Sie, dass x, wenn U < X= Y, wenn U > die Verteilungsfunktion (1 − )N (0, 1) + δx besitzt. b) Erzeugen Sie je 1000 Zufallszahlen zu den Verteilungsfunktion F1 = N (0, 1) und F2 = 0, 9N (0, 1) + 0, 1δx mit x = 1, 4, 10, 50. c) Bestimmen Sie für alle fünf Stichproben die Statistiken X̄n , X̄0,1;n , X̄0,2;n , X̄0,3;n , M edn und BHn . Diskutieren Sie die Eigenschaften dieser Schätzfunktionen. Aufgabe 3. Es sei Ui ∼ U (0, ϑ) i = 1, 2, ..., n. Zur Schätzung des Parameters ϑ werden zwei Stichprobenfunktionen verwendet, und zwar Tn = 2Ūn und Sn = n+1 max(U1 , U2 , U3 , ..., Un ). n Entscheiden Sie a) theoretisch und b) mit SPSS, welche Schätzfunktion besser ist.