Prof. Dr. Christine Müller 1 10 2 3 10 10 4 5 10 10 6 7 10 10 8 10 9 10 10 Gesamt: 10 100 Probeklausur “Statistik III - Schätzen und Testen“ Vorname: Name: Matrikel-Nummer: Bitte beachten Sie folgendes: 1) Die Klausur besteht aus 10 Aufgaben. Bitte überprüfen Sie die Vollständigkeit Ihres Exemplares. Bei der Korrektur werden nur Lösungen auf diesen Blättern berücksichtigt. Das Entfernen der Heftklammer ist nicht erlaubt. Die Lösungen dürfen nicht mit Bleistift geschrieben werden. 2) Die Klausur ist bestanden, wenn mindestens 40 Punkte erreicht worden sind. 3) Die Reihenfolge der Bearbeitung der Aufgaben kann beliebig gewählt werden. Die Lösungen sollen so erfolgen, dass der Lösungsweg deutlich erkennbar ist (kurze Kommentare! Angabe aller Voraussetzungen! Behauptungen begründen! benutzte Sätze zitieren!). Teillösungen werden gewertet. 4) Vereinfachen Sie Formeln und Brüche durch Kürzen etc. so weit wie möglich. 5) Als Hilfsmittel sind nur drei auf beiden Seiten handgeschriebene DIN-A4-Blätter zugelassen. Weitere Hilfsmittel sind nicht erlaubt. 6) Klausuren, die nicht unmittelbar nach der entsprechenden Aufforderung der Aufsichtspersonen abgegeben werden, können später nicht mehr berücksichtigt werden. 7) Klausurergebnis: Dieses finden Sie auf der Homepage zur Veranstaltung unter der Nummer von Ihrem Namensblatt. Bitte daher Nummer merken! 8) Klausureinsicht: Diese wird auf der Homepage zur Veranstaltung bekannt gegeben. Zur Kenntnis genommen und Prüfungsfähigkeit bestätigt: (Unterschrift) 1 Aufgabe 1: (10 Punkte) Die Zufallsgrößen X1 , . . . , XN seien unabhängig und besitzen jeweils eine Normalverteilung mit bekanntem Parameter µ0 und unbekanntem Parameter σ 2 , d.h. 1 fXn ,σ2 (xn ) = √2πσ exp(− 2σ12 (xn − µ0 )2 ) für n = 1, . . . , N. 2 a) Bestimmen Sie die Maximum-Likelihood-Schätzfunktion für σ 2 . 2 Fortsetzung von Aufgabe 1: b) Bestimmen Sie eine Momentenschätzfunktion für σ 2 . 3 Aufgabe 2: (10 Punkte) Geben Sie den Satz von Lehmann-Scheffé und dessen Beweis an. 4 Fortsetzung von Aufgabe 2: 5 Aufgabe 3: (10 Punkte) Von den Studenten einer Universität wurden 20 Studenten zufällig ausgewählt und danach befragt, ob sie Raucher sind. Es ergaben sich folgende Antworten: nein, ja, nein, nein, nein, ja, ja, nein, nein, nein, ja, ja, nein, nein, nein, ja, nein, ja, nein, nein. (a) Bestimmen Sie unter geeigneter Modellannahme zwei verschiedene erwartungstreue Schätzfunktionen für den Anteil der Raucher an der Universität und geben Sie die Schätzungen an. (b) Welche der beiden Schätzfunktionen hat die kleinere Varianz? Begründen Sie die Antwort. 6 Fortsetzung von Aufgabe 3: (c) Geben Sie ein 95%-Konfidenzintervall für den Anteil der Raucher an der Universität an. Benutzen Sie dazu eine geeignete Tabelle auf der letzten Seite. (d) Welche Aussagen sind für das 95%-Konfidenzintervall richtig? Tragen Sie R für Richtig und F für Falsch deutlich lesbar ein. Hinweis: Bei Multiple-Choice-Fragen führen falsche Antworten zu Punktabzügen in der Teilaufgabe. Die Konfidenzintervallschätzfunktion, die [ , ] geliefert hat, würde in höchstens 5% der Fälle nicht den wahren Anteil der Raucher der Universität enthalten, wenn sie ganz oft angewendet wird. Das Konfidenzintervall [ , ] überdeckt mit einer Wahrscheinlichkeit von mindestens 95% nicht den wahren Anteil der Raucher an der Universität. Mit Wahrscheinlichkeit von höchstens 5% liegt der Anteil der Raucher an der Universität nicht im Konfidenzintervall [ , ]. Das Konfidenzintervall [ , ] wurde mit einer Methode bestimmt, die mit einer Wahrscheinlichkeit von mindestens 95% ein Intervall liefert, das den wahren Anteil der Raucher der Universität enthält. 7 Aufgabe 4: (10 Punkte) Die Zufallsgrößen X1 , . . . , XN seien unabhängig und besitzen jeweils eine Rayleigh-Verteilung mit unbekanntem λ ∈ (0, ∞), d.h. fX1 ,λ (xn ) = 2λxn exp(−λx2n )1[0,∞) (xn ) für n = 1, . . . , N. PN 2 a) Zeigen Sie, dass T (X) gegeben durch T (x) = n=1 xn eine suffiziente und vollständige X Statistik für {Pλ ; λ ∈ (0, ∞)} ist. 8 Fortsetzung von Aufgabe 4: b) Bestimmen Sie die erwartungstreue Schätzfunktion für λ1 mit kleinster Varianz innerhalb aller erwartungstreuen Schätzfunktionen. Hinweis: Nutzen Sie ohne zu beweisen, dass Eλ (X12 ) = λ1 gilt. 9 Aufgabe 5: (10 Punkte) Beweisen Sie unter den Voraussetzungen für den Satz von Rao/Cramér/Frechêt für die Fisher’sche Information folgendes: Sind X1 , . . . , XN u.i.v., dann gilt (mit X = (X1 , . . . , XN )) Iθ (X) = N Iθ (X1 ) für alle θ ∈ Θ. 10 Aufgabe 6: (10 Punkte) Seien X1 , . . . , XN unabhängige und identische verteilte Zufallsgrößen mit Exponentialverteilung, d.h. fXn ,λ (xn ) = λe−λxn 1[0,∞) (xn ) für n = 1, . . . , N. Bestimmen Sie eine positive untere Schranke für die Varianz einer erwartungstreuen Schätzfunktion für λ. Beachten Sie dabei Aufgabe 5 und nutzen Sie ohne Beweis Eλ (X1 ) = λ1 und Eλ (X12 ) = λ22 . 11 Aufgabe 7: (10 Punkte) Die Zufallsgrößen X1 , . . . , XN mit N > 1 seien unabhängig und besitzen jeweils eine Normalverteilung mit bekannten Parametern µ0 und und unbekanntem σ 2 , d.h. fXn ,σ2 (xn ) = √ 1 exp(− 2σ12 (xn − µ0 )2 ) für n = 1, . . . , N. 2πσ2 a) Zeigen Sie, dass PσX2 ; σ 2 ∈ (0, ∞) eine 1-parametrische Exponential-Familie bildet. 12 Fortsetzung von Aufgabe 7: b) Bestimmen Sie den trennschärfsten Test für H0 : σ 2 ≤ 1 gegen H1 : σ 2 > 1. 13 Aufgabe 8: (10 Punkte) Bei einer Abmagerungskur wurde von fünf Personen das Gewicht xn [in kg] vor der Kur und das Gewicht yn [in kg] der Kur ermittelt.PFolgende Werte P wurden daraus berechnet: P5 P52 Jahre nach P 5 5 5 2 2 2 x = 466, y = 451, x = 8 000, y = 6 000, n=1 n n=1 n n=1 n n=1 n n=1 (yn − xn ) = 65. a) Untersuchen Sie, ob zwei Jahre nach der Abmagerungskur das Gewicht noch verringert war (α = 0.05), d.h. die Abmagerungskur langfristig wirkt und damit trotz eventueller Nebenwirkungen empfohlen werden kann. Nehmen Sie dazu eine Normalverteilung an, stellen Sie geeignete Null- und Alternative-Hypothesen auf, bestimmen Sie einen Test dazu und bestimmen Sie die Entscheidung. Benutzen sie dazu eine geeignete Tabelle auf der letzten Seite. 14 Fortsetzung von Aufgabe 8: b) Welche der folgenden Schlussfolgerungen können mit dem Test aufgrund der fünf Personen bezüglich der Gewichtsabnahme gezogen werden? Tragen Sie R für Richtig und F für Falsch deutlich lesbar ein. Hinweis: Bei Multiple-Choice-Fragen führen falsche Antworten zu Punktabzügen in der Teilaufgabe. Die Daten sprechen zum Signifikanzniveau von 5% signifikant für eine Reduzierung des mittleren Gewichtes nach zwei Jahren durch die Abmagerungskur. Mit Wahrscheinlichkeit von 5% erzielt die Abmagerungskur keine Abnahme des Gewichtes nach zwei Jahren. Zum Signifikanzniveau von 95% kann geschlossen werden, dass die Abmagerungskur keine Reduzierung des mittleren Gewichtes nach zwei Jahren bewirkt. Mit Wahrscheinlichkeit von 95% erzielt die Abmagerungskur keine Abnahme des Gewichtes nach zwei Jahren. Zum Signifikanzniveau von 5% kann geschlossen werden, dass die Abmagerungskur keine Reduzierung des mittleren Gewichtes nach zwei Jahren bewirkt. Mit Wahrscheinlichkeit von 5% erzielt die Abmagerungskur eine Abnahme des Gewichtes nach zwei Jahren. Es kann zum Signifikanzniveau 5% keine Aussage darüber gemacht werden, dass die Abmagerungskur eine Reduzierung des mittleren Gewichtes nach zwei Jahren bewirkt. Zum Signifikanzniveau 5% sprechen die Daten nicht für eine Reduzierung des mittleren Gewichtes nach zwei Jahren. 15 Aufgabe 9: (10 Punkte) Die Zufallsgrößen X1 , . . . , XN mit N > 1 seien unabhängig und besitzen jeweils eine Normalverteilung mit unbekannten Parametern µ und σ 2 , d.h. Xn ∼ N (µ, σ 2 ) für n = 1, . . . , N. Seien µ b1 , µ b2 : IRN →IR Schätzfunktionen für µ gegeben durch PN 1 µ b1 (x1 , . . . , xN ) = N 1 + n=1 xn , µ b2 (x1 , . . . , xN ) = 12 (x1 + xN ). Welche dieser Schätzfunktionen sind erwartungstreu und welche sind konsistent? Begründen Sie die Antworten! 16 Aufgabe 10: (10 Punkte) Bei einer theoretischen Führerscheinprüfung ist ein Fragebogen mit N Fragen zu bearbeiten. Zu jeder Frage sind a Antworten vorgegeben, von denen nur eine richtig ist. Sei x die Anzahl der von einem Prüfling richtig beantworteten Fragen. Definieren Sie ein geeignetes Testproblem für die Entscheidung, ob der Prüfling die Antworten geraten hat (p = 1/a) oder ein (positives) Wissen (p > 1/a) vorhanden ist, und zwar für den Fall, daß man sich mit Wahrscheinlichkeit α dagegen sichern will, dem Prüfling irrtümlich positives Wissen zu attestieren. Wie sieht die Entscheidung bei N = 20, a = 3, x = 10 und α = 0.01 aus? x 0 q(x) 0 1 2 3 3 14 43 Dabei ist q(x) = 1000 4 5 6 7 8 9 10 11 12 13 14 91 146 182 182 148 99 54 25 9 3 1 20 x 1 x 3 2 20−x . 3 17 15 0 Tabellen für Konfidenzintervalle und Quantile α = 0.1 x. pbu pbo x. pbu pbo α = 0.05 x. pbu pbo x. pbu pbo 0 0 0.14 11 0.35 0.74 0 0.00 0.17 11 0.32 0.77 1 0.00 0.22 12 0.39 0.78 1 0.00 0.25 12 0.36 0.81 2 0.02 0.28 13 0.44 0.82 2 0.01 0.32 13 0.41 0.85 3 0.04 0.34 14 0.49 0.86 3 0.03 0.38 14 0.46 0.88 4 0.07 0.40 15 0.54 0.90 4 0.06 0.44 15 0.51 0.91 5 0.10 0.46 16 0.60 0.93 5 0.09 0.49 16 0.56 0.94 6 0.14 0.51 17 0.66 0.96 6 0.12 0.54 17 0.62 0.97 7 0.18 0.56 18 0.72 0.98 7 0.15 0.59 18 0.68 0.99 8 0.22 0.61 19 0.78 1.00 8 0.19 0.64 19 0.75 1.00 9 0.26 0.65 20 0.86 1 9 0.23 0.68 20 0.83 1 10 0.30 0.70 10 0.27 0.73 Tabelle 1: Obere P und untere Grenzen der (1 − α)-Konfidenzintervalle bei Binomialverteilung für N = 20 (x. = N n=1 xn ). α uα 0.001 0.005 0.010 0.025 0.050 0.950 0.975 0.99 0.995 0.999 -3.090 -2.576 -2.326 -1.960 -1.645 1.645 1.960 2.326 2.576 3.090 Tabelle 2: α-Quantile der Standard-Normalverteilung. 2 3 4 5 14 15 16 17 38 39 n α = 0.95 2.920 2.353 2.132 2.015 1.761 1.753 1.746 1.740 1.686 1.685 α = 0.975 4.303 3.182 2.776 2.571 2.145 2.131 2.120 2.110 2.024 2.023 Tabelle 3: α-Quantile der tn -Verteilung. n α = 0.025 α = 0.05 α = 0.95 α = 0.975 1 0.001 0.004 3.841 5.024 2 0.051 0.103 5.991 7.378 3 4 5 6 7 8 9 10 0.216 0.484 0.831 1.237 1.690 2.180 2.700 3.247 0.352 0.711 1.145 1.635 2.167 2.733 3.325 3.940 7.815 9.488 11.070 12.592 14.067 15.507 16.919 18.307 9.348 11.143 12.833 14.449 16.013 17.535 19.023 20.483 Tabelle 4: α-Quantile der χ2n -Verteilung. α (n, m) = (2, 11) (n, m) = (6, 8) (n, m) = (8, 6) (n, m) = (7, 7) 0.01 0.010 0.123 0.157 0.143 0.025 0.025 0.179 0.215 0.200 0.05 0.052 0.241 0.279 0.264 0.1 0.106 0.335 0.375 0.143 0.9 2.860 2.668 2.983 2.785 0.95 3.982 3.581 4.147 3.787 Tabelle 5: α-Quantile der Fn,m -Verteilung. 18 0.975 5.256 4.652 5.600 4.995 0.99 7.206 6.371 8.102 6.993