Statistik II Februar 2004 Aufgabe 1 . Die Wahrscheinlichkeitsfunktion sei p 1 p (wobei 0 p 1 gelte) f x 10 Punkte Eine diskrete Zufallsvariable X habe den Wertebereich 1 2 3 x 1 a) Prüfen Sie unter Verwendung von ∑ qx 1 q ∞ 1 x 0 nach, ob für q 1 ∑ f x1 ∞ x 1 gilt. b) Eine einfache Stichprobe vom Umfang 5 aus einer Grundgesamtheit mit obiger Wahrscheinlichkeitsfunktion f x habe die Realisation x1 x5 34216 erbracht. Bestimmen Sie hieraus den Maximum–Likelihood–Schätzwert p̂ für p. Hinweis: Die zweite Ableitung muss nicht ausgewertet werden. Aufgabe 2 10 Punkte In der Lebensmittelabteilung eines Supermarktes werden über Wochen hinweg Kartoffelbeutel mit der Aufschrift ”Ein Kilo Kartoffeln aus Deutschland, festkochend” zum Verkauf angeboten. Bei 25 solcher (zufällig ausgewählter) Beutel wird nun der Inhalt nachgewogen; die in Gramm gemessenen Ergebnisse x1 x25 dieses Nachwiegens können als Realisierungen unabhängiger, identisch N µ ; σ verteilter Stichprobenvariablen X1 X25 angesehen werden. Bekannt von den xi sind die Werte ∑ xi 24750 ∑ x x̄ 864 sowie die Tatsache, dass lediglich neun der fünfundzwanzig x Werte größer oder gleich 1000 sind. a) Schätzen Sie den Erwartungswert µ der Stichprobenvariablen X durch ein symmetrisches Konfidenzintervall zum Konfidenzniveau 0 98. 1000 zum Signifikanzniveau 0 02 getestet werden. Zu welchem Ergebnis b) Nun soll H : µ 1000 gegen H : µ führt dieser Test? Im Folgenden soll die (von i nicht abhängende) Wahrscheinlichkeit p P X 1000durch ein symmetrisches Konfidenzintervall zum Konfidenzniveau 0 95 geschätzt werden. 25 i 1 und 1 25 25 i 2 i 1 i i 0 1 i c) Führen Sie (falls dies mit obiger Stichprobe möglich ist) diese Intervallschätzung durch. d) Welcher Stichprobenumfang n würde garantieren, dass die Länge des resultierenden Schätzintervalls für p höchstens 0 2 beträgt? 1 Aufgabe 3 10 Punkte Im Sommersemester 2003 wurde an den beiden Universitäten X und Y ein bestimmtes Fach mit identischen Klausuren geprüft. Dabei bestanden (bei Zugrundelegung desselben Bewertungsschemas an beiden Universitäten) 45 der 86 Kandidaten der Universität X, während an der Universität Y von den dort 100 Teilnehmern 35 nicht bestanden. Nicht bestandene Klausuren werden an beiden Universitäten mit der Note 5,0 bewertet. Bezüglich der an der Universität X bzw. Y erzielten Noten x1 x86 bzw. y1 y100 ist bekannt: ∑ x 341 9; ∑ x 1470 25; ∑ y 336 9; ∑ y ȳ 192 08 Ferner ist bekannt, dass in der Auflistung y y die Werte der Größe nach angeordnet sind (mit y 1 0; ; y 5 0), und dass dabei für die ersten 65 Werte gilt: ∑ y 161 9; ∑ y 452 1 86 86 i i 1 100 2 i 100 i i 1 i i 1 1 2 i 1 100 1 65 65 i i 1 100 2 i i 1 Interpretieren Sie die diesen Zahlen zu Grunde liegenden Noten als (hinreichend kardinalskalierte) Ergebnisse zweier einfacher Stichproben zu den Studienleistungen, die Studierende der beiden Universitäten zu erzielen im Stande sind. Im Folgenden werden drei Vermutungen bezüglich der Leistungsfähigkeit von Studierenden der beiden Universitäten formuliert (jeweils unter der Annahme eines einheitlichen Klausur-Schwierigkeitsgrades und eines einheitlichen Bewertungsschemas), nämlich: (I) Klausurteilnehmer der Universität X erzielen im Mittel schlechtere Noten als Klausurteilnehmer der Universität Y. (II) Nicht-Durchfaller (also Studierende mit einer Note ungleich 5,0) der Universität X erzielen im Mittel schlechtere Noten als Nicht-Durchfaller der Universität Y. (III) Die Wahrscheinlichkeit, eine Klausur nicht zu bestehen, ist für Studierende der Universität X größer als für Studierende der Universität Y. a) Klären Sie, zu welchen Signifikanzniveaus bei obigen Daten Vermutung (I) statistisch bestätigt werden kann. b) Klären Sie, zu welchen Signifikanzniveaus bei obigen Daten Vermutung (II) statistisch bestätigt werden kann. c) Kann (mit obigen Daten) die Vermutung (III) zum Signifikanzniveau 0,025 statistisch bestätigt werden? Aufgabe 4 10 Punkte Eine Gruppe von Studierenden zählt während einer sich über 15 Veranstaltungstermine hinziehenden Vorlesung eines Semesters jeweils die Anzahl der Versprecher des Dozenten. Da die Studierenden bei gleichzeitigem Aufpassen nicht weiter als bis 3 zählen können, halten sie alle über 2 hinausgehenden Anzahlen unter der Rubrik 3 fest. Folgende Tabelle gibt Auskunft über das gesammelte Datenmaterial: Versprecheranzahl Häufigkeit 0 2 1 3 2 4 3 6 Unterstellen Sie für die folgenden Aufgabenteile, dass eine einfache Stichprobe vorliegt. Die Gruppe vermutet zunächst, dass die Anzahl der Versprecher einer Verteilung auf der Menge 0 1 2 3 4 5 mit folgenden Werten der Wahrscheinlichkeitsfunktion genügt: 1 1 1 f 0 f 1 f 2 f 3 f 4 f 5 6 3 9 a) Kann die obige Hypothese mit dem vorliegenden Datenmaterial zum Niveau α 0 1 verworfen werden? b) Der Dozent selbst behauptet, dass seine Versprecheranzahl Poisson–verteilt mit λ 2 sei. Kann diese Hypothese zum Niveau α 0 1 verworfen werden? c) Sollte bei den 15 Vorlesungen eine genauere Erfassung der Anzahlen 3 erfolgen, wenn das Ablehnen der obigen Hypothesen angestrebt wird? (Mit Begründung!) Hinweis zur gesamten Aufgabe: Legen Sie, falls nötig, Klassen zusammen. 2 Aufgabe 5 10 Punkte Es gebe eine Zufallsvariable X mit dem unbekannten Erwartungswert µ E X . Es soll die Vermutung geprüft werden, ob µ 3; 5 ist. H0 : µ 3; 5 ; H1 : µ 3; 5 Dazu wurde eine Stichprobe vom Umfang n reich B gebildet mit der Eigenschaft 100 gezogen und eine Stichprobenfunktion V sowie ein Verwerfungsbe- 0 01 µ 10µ 9 für 1 µ 9 P V B µ 0 sonst 2 a) Wie groß ist die Wahrscheinlichkeit, die Nullhypothese abzulehnen, wenn 2 gilt? ii) µ 4 gilt? iii) µ 6 gilt? i) µ b) Für welche Werte von µ kann man keine Wahrscheinlichkeit für einen Fehler 2. Art berechnen? Falls die Berechnung jeweils möglich ist, berechnen Sie die Wahrscheinlichkeit für einen Fehler 2. Art an den Stellen: 2 ii) µ 4 iii) µ 6 i) µ c) Wie groß ist das Signifikanzniveau dieses Tests? d) Ist dieser Test unverfälscht zu dem in c) berechneten Signifikanzniveau? Lösung zu Aufgabe 1 1 p ∑p 1 p p ∑1 p p ∑1 p 1 p b) Likelihoodfunktion: f 3 4 2 1 6 p p 1 p 5 ln p 11 ln 1 ln f 3 4 2 1 6 p p p11p 5 5 p p̂ 03125 0 f 3 4 2 1 6 p ∞ ∞ x 1 x 1 a) ∑ f x x 1 ∞ x 1 5 p x 1 x 0 5 d dp ∞ x 1 3 1 11 1 p 4 1 6 1 p 1 p 5 11 5 16 Lösung zu Aufgabe 2 2 492; x̄ 990; s 30; 14 952 KI 975 048; 1004 952 b) Wegen 1000 975 048; 1004 952kann H nicht verworfen werden. c) Schätzung gem. 13.1.3: Voraussetzung 5 9 25 5 erfüllt; c 1 96; x̄ 0 36; σ̂ 0 36 0 64 0 48; 0 18816 KI 0 17184; 0 54816 97 d) 96 04 n sc n a) Schätzung gem. 13.1.2: c 0 9 25 σ̂ c n 1 96 2 02 3 Lösung zu Aufgabe 3 b) Wie Teil a), aber unter Vernachlässigung der Durchfaller, d.h. x̄ 3 042; ȳ 2 491; s 1470 25 41 5 45 3 042 0 655; 452 1 65 2 491 0 762; v 3 40 x α 0 0003 s c) approximativer Zweistichproben-Gaußtest 14.6.1, Voraussetzung 3 aus Fig. 51 erfüllt, Fall (117 c) α 0025; x̄ 0477; ȳ 035; ∑ x 41; ∑ y 35; v 176; B 196; ∞; v B a) approximativer Zweistichproben-Gaußtest 14.6.1, Voraussetzung 4 aus Fig. 51 erfüllt, Fall (117 c) 9 9 1 x̄ 341 3 976; ȳ 336 3 369; s21 85 1470 25 86 3 9762 1 302; s22 1929908 1 940; 86 100 v 3 2 7 x1 α α 0 0005 341 9 41 5 45 1 64 2 2 161 9 65 2 41 86 2 1 1 44 2 2 1 α 35 100 i i Die Vermutung kann nicht bestätigt werden. Lösung zu Aufgabe 4 a) Chi-Quadrat-Anpassungstest 14.8, Fall 120 a) 15 16 2 5 5 sind die ersten beiden Klassen zusammenzulegen. Dann: Wegen n f 0 Versprecherzahl hj pj v 0 4; B 4 61; ∞v B H nicht verwerfen 1 5 2 4 1 3 1 3 3 6 1 3 0 b) Chi-Quadrat-Anpassungstest 14.8, Fall 120 a) Bei vier Klassen: Versprecherzahl 0 1 2 3 pj 0 1353 0 2707 0 2707 0 3233 p , also: erste beiden und letzte beiden Klassen zusammenlegen. Dann: 15 p 5 Versprecherzahl 1 2 h 5 10 p 0 406 0 594 2 71; ∞v B H nicht verwerfen v 0 328; B Aber: np j j j 1 3 j j 0 c) Nein, da ohnehin Klassen zusammengelegt werden müssen. Lösung zu Aufgabe 5 B µ 20 07; P V B µ 40 15; P V B µ 60 15 b) Wahrscheinlichkeit für einen Fehler 2. Art nicht berechenbar für µ Θ 3; 5. P V B µ 2 1 P V B µ 2 0 93; P V B µ 6 1 P V B µ 6 0 85 c) α sup P V B µ P V B µ 5 0 16, da P V B µ für µ 3; 5streng monoton wächst. d) Nein, da P V B µ 6 0 15 0 16 α. a) P V 0 µ 3;5 4