Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. S. Rässler Klausur zu Methoden der Statistik II mit Lösung Sommersemester 2008 Aufgabe 1 Der landwirtschaftliche Betrieb KnusperKorn“ ist seit vielen Jahren bekannt für sei” ne hervorragenden Knuspermüslis aus kontrolliert biologischem Anbau. Obwohl man auf dem Land die Hektik der Stadt vergessen kann, muss auch Produktionsleiter Johannes B. Körner aus Wirtschaftlichkeitsgründen auf die Zeit achten. Er überprüft deshalb die Einfülldauer von Haferflocken in 500-Gramm-Papiertüten. Bei 101 unabhängigen Versuchen ergab sich ein Stichprobenmittelwert von X 101 = 5, 5 Sekunden und eine Stichproben2 = 1, 72 Sekunden2 . Aus langjähriger Erfahrung weiß Johannes B. Körner, varianz von S101 dass die Einfüllzeiten Xi einer 500-Gramm-Papiertüte mit i = 1, . . . , 101 annähernd normalverteilte Zufallsgrößen mit Parametern µ und σ 2 sind. a) Berechnen Sie mit einer Irrtumswahrscheinlichkeit von 5% jeweils das realisierte Konfidenzintervall für die Parameter µ und σ 2 . b) Johannes B. Körner wird stutzig, da sich bei den Überprüfungen der letzten Jahre eine durchschnittliche Einfülldauer von 5 Sekunden ergab. Helfen Sie Johannes B. Körner mittels eines geeigneten statistischen Verfahrens bei der Entscheidung, ob sich die mittlere Einfülldauer signifikant (α = 0, 05) verlängert hat. Aufgabe 2 Ein vom Internationalen Tischtennisverband ITTF zugelassener Tischtennisball hat seit dem Jahr 2000 einen Durchmesser von 40 mm. Bis zu diesem Zeitpunkt hatten Tischtennisbälle einen Durchmesser von 38 mm und waren dementsprechend leichter. Die Firmen BUTTERFLIEG, DUNIX und JOOGA sind Marktführer auf dem Markt für TischtennisEquipment. Bei einer Qualitätskontrolle wurde der Durchmesser von jeweils 1000 Tischtennisbällen dieser drei Hersteller gemessen. Die Anzahl der Tischtennisbälle mit normalen, zu geringen und zu großen Abmessungen sind in der folgenden Tabelle angegeben. BUTTERFLIEG DUNIX JOOGA Σ zu geringes Maß 250 510 290 1050 Normalmaß 500 420 580 1500 zu großes Maß 250 70 130 450 Σ 1000 1000 1000 3000 Überprüfen Sie mit einem geeigneten Test, ob die Genauigkeit des Durchmessers der Tischtennisbälle vom Hersteller abhängig ist (α = 0, 05). Aufgabe 3 a) Während des Endspiels der Fußball-Europameisterschaft treffen sich 11 Bamberger Studenten bei ihrem gemeinsamen Freund Jogi zum Grillen. In der Halbzeitpause stellen sie fest, dass nicht mehr genügend saubere Gabeln vorhanden sind. Da Jogi und seine 11 Freunde zu diesem Zeitpunkt allerdings nicht mehr in der Lage sind, in der allgemein üblichen Art und Weise Besteck zu spülen, werfen sie eine Hand” voll Besteck“ (5 Messer, 8 Gabeln, 7 Löffel) in eine Wanne mit trübem Spülwasser, rühren um und entnehmen zufällig und auf einmal 5 Besteckteile. Wie groß ist die Wahrscheinlichkeit, dass sich unter den zufällig entnommenen Besteckteilen mindestens 3 Gabeln befinden? b) Beim Public Viewing“ auf dem Bamberger Maxplatz“ stellt sich in der Halbzeit” ” pause ein ähnliches Problem. Jedoch befinden sich in einer größeren Spülwanne 700 Löffel, 507 Messer und 793 Gabeln. Wie groß ist die Wahrscheinlichkeit, dass sich unter 50 zufällig und auf einmal entnommenen Besteckteilen höchstens 20 Löffel befinden? c) Hannes Flick war einer der zahlreichen Zuschauer auf dem Bamberger Maxplatz“. ” Nach dem Genuss einiger alkoholischer Getränke und fränkischer Speisen während des Spiels, befinden sich nach dem Abpfiff noch drei 2e -Stücke und sieben 1e -Stücke in seiner Geldbörse. Um sich nun abschließend noch ein Jubel-Bier“ zu gönnen, ” nimmt er willkürlich eine Münze heraus und danach (ohne die erste zurückzulegen) eine zweite. c1) Bestimmen Sie die Wahrscheinlichkeit dafür, dass die erste gezogene Münze ein 1e -Stück ist? c2) Bestimmen Sie die Wahrscheinlichkeit dafür, dass die zweite gezogene Münze ein 2e -Stück ist? c3) Bestimmen Sie die Wahrscheinlichkeit dafür, dass die erste gezogene Münze ein 2e -Stück ist, unter der Bedingung, dass die zweite gezogene Münze ein 2e -Stück ist. Aufgabe 4 a) Die Zeit zwischen der Ankunft von Bienen auf einer Kirschblüte sei exponentialverteilt mit Parameter λ. Es bezeichne X die Wartezeit der Kirschblüte auf die nächste Biene (in Minuten). a1) Wie groß ist die Wahrscheinlichkeit, dass die Wartezeit der Kirschblüte auf die nächste Biene genau zwei Minuten beträgt? a2) Welcher Zusammenhang besteht zwischen dem Erwartungswert und der Varianz der Wartezeit einer Kirschblüte auf die nächste Biene? a3) Wie groß ist die Wahrscheinlichkeit, dass die Wartezeit der Kirschblüte auf die nächste Biene überdurchschnittlich lang ist? b) Die Anzahl Yi der ankommenden Bienen auf den Kirschblüten i = 1, . . . , n eines Baumes pro Tag seien unabhängig identisch Poisson-verteilte Zufallsvariablen mit Parameter λ. b1) Schätzen Sie den Parameter λ mit der Maximum-Likelihood-Methode. Stellen Sie dazu zunächst die Likelihoodfunktion und die Log-Likelihoodfunktion auf und ermitteln dann den Maximum-Likelihood-Schätzer für λ. b2) Auf den insgesamt 125 Blüten eines Kirschbaums zählte Biologin Sabine Honig mit einem speziellen Gerät zusammen 12500 Bienen. Welchen Wert nimmt der in b1) bestimmte Schätzer demnach an? Hinweis: Falls Sie den Maximum-Likelihood-Schätzer für λ in Teilaufgabe b1) nicht bestimmen können, verwenden Sie zur Lösung von b2) den Schätzer b = y. λ Aufgabe 5 (R-Aufgabe) I. In einem Spiel dürfen die Spieler sieben Mal mit einer fairen 1e -Münze werfen. Die Zufallsvariable X bezeichnet die Anzahl der geworfenen Köpfe. Durch folgenden Befehl werden die Würfe von 15 Spielern simuliert: anzahl.koepfe=rbinom(n=15,size=7,prob=1/2) Die Ausgabe lautet: >anzahl.koepfe [1] 5 2 5 1 2 5 3 4 3 4 2 4 3 3 4 a) Wie kann man mit R den Mittelwert und die Varianz der Variable anzahl.koepfe berechnen? b) Wie hoch ist der Anteil der Spieler, die überdurchschnittlich oft Kopf geworfen haben in dieser konkreten Stichprobe? c) Wie lautet der entsprechende Befehl, wenn die 15 Spieler anstelle einer Münze nun einen fairen Würfel werfen und dabei jeweils ausschließlich die Anzahl ihrer geworfenen Sechser zählen? II. Das Geburtsgewicht Elefant.Afrika“ eines afrikanischen Elefanten kann eben” so wie das Geburtsgewicht Elefant.Indien“ eines indischen Elefanten nähe” rungsweise als normalverteilte Zufallsvariable angesehen werden. Die Ergebnisse für Messungen aus verschiedenen Zoos weltweit haben für die afrikanischen Elefanten ein durchschnittliches Geburtsgewicht von 120 kg ergeben und für die indischen Elefanten einen Wert von 100 kg. Vereinfachend gehen wir davon aus, dass die Varianz des Geburtsgewichts bei beiden Elefantenarten gleich groß ist. a) Mit welchem R-Befehl können Sie die Korrelation zwischen den Geburtsgewichten beider Elefantenarten berechnen? Zum Vergleich des Geburtsgewichts indischer und afrikanischer Elefanten wurde ein Test durchgeführt. Der Sachverhalt wurde mit folgendem R-Befehl getestet: t.test(Elefant.Afrika,Elefant.Indien,alternative=’’greater’’, mu=20,paired=FALSE,var.equal=TRUE,conf.level=0.95) b) Erläutern Sie kurz die Argumente dieses R-Befehls. c) Handelt es sich bei den Stichproben Elefant.Afrika“ und Elefant.Indien“ ” ” um verbundene oder unverbundene Stichproben? Begründen Sie Ihre Antwort. Auf der folgenden Seite finden Sie den zugehörigen R-Output! Der R–Output ist: Two Sample t-test data: Elefant.Afrika and Elefant.Indien t = 1.1618, df = 108, p-value = 0.1239 alternative hypothesis: true difference in means is greater than 20 95 percent confidence interval: 19.04073 Inf sample estimates: mean of x mean of y 120.97311 98.73218 d) Um welchen Test handelt es sich hierbei? e) Formulieren Sie das getestete Hypothesenpaar. f) Wie viele Elefantenbabys wurden insgesamt für diesen Test gewogen? g) Wie lautet die Testentscheidung? Begründen Sie Ihre Antwort sowohl mit Hilfe des p-Werts, als auch anhand des Konfidenzintervalls. Lösung zu Aufgabe 1: a) Konfidenzintervall für den Mittelwert bei unbekannter Varianz: KI = [5, 1644; 5, 8356] Konfidenzintervall für die Varianz bei unbekanntem Mittelwert gilt: KI = [2, 2299; 3, 8949] b) Mittelwerttest bei unbekannter Varianz: 2, 9558 > 1, 660 ⇒ Nullhypothese ablehnen, d.h. Stichprobe stützt Vermutung Lösung zu Aufgabe 2: - χ2 -Unabhängigkeitstest ⇒ Approximationsregeln erfüllt - 249, 6001 > 9, 49 ⇒ Nullhypothese wird verworfen, d.h. Stichprobe deutet auf Zusammenhang hin Lösung zu Aufgabe 3: a) G = Anzahl der Gabeln G ∼ Hyp(5, 20, 8) P (G ≥ 3) = 0, 2962 b) L = Anzahl der Löffel L ∼ Hyp(50, 2000, 700) - Approximationsbedingungen prüfen P (L ≤ 20) = 0, 8159 (Stetigkeitskorrektur beachten) c) Geldbörse: 3 × 2e und 7 × 1e , d.h. 10 Geldstücke c1) P (1. Münze = 1e ) = 0, 7. c2) P (2. Münze = 2e ) = 0, 3. c3) P(1. M.=2 Euro —2. M. = 2 Euro ) = 0,2222 Lösung zu Aufgabe 4: a) X ∼ exp(λ) a1) P (X = 2) = 0, da Punktwahrscheinlichkeit gesucht und X stetig a2) Var(X) = 1 λ2 = 1 2 λ = (E(X))2 a3) P (X > λ1 ) = 0, 3679 b) b1) Likelihoodfunktion n P yi λ e−nλ L(λ; y) = y1 ! · . . . · yn ! i=1 Log-Likelihoodfunktion ln L(λ; y) = n X yi ln λ − nλ − ln(y1 ! · . . . · yn !) i=1 ML-Schätzer für λ n P ∂ ln L(λ;y) ∂λ = n P ⇒ λ̂ = i=1 n yi i=1 λ ! −n=0 yi =y b2) λ̂ = 100 Lösung zu Aufgabe 5: I. a) mean(anzahl.koepfe) var(anzahl.koepfe) b) 7 15 = 0, 4667 c) anzahl.koepfe=rbinom(n=15,size=7,prob=1/6) II. a) corr(Elefant.Afrika,Elefant.Indien) b) alternative=’’greater’’ ⇒ Differenz der Mittelwerte größer als mu mu=20 ⇒ belegt Wert mu mit Wert 20 paired=FALSE ⇒ t-Test für unverbundene Stichproben var.equal=TRUE ⇒ gleiche Varianz in der Grundgesamtheit der afrikanischen und indischen Elefanten - conf.level=0.95 ⇒ 95% Konfidenzintervall - c) unverbundene Stichproben d) Mittelwertdifferenzentest bei unverbundenen Stichproben e) H0 : δ ≤ 20 gegen HA : δ > 20 f) 110 g) - p-Wert (0, 1239) größer α = 0, 05 ⇒ Nullhypothese nicht ablehnen - µ = 20 liegt im Konfidenzintervall ⇒ Nullhypothese nicht ablehnen