Aufgabe 1 - Universität Bamberg

Werbung
Lehrstuhl für Statistik und Ökonometrie
der Otto-Friedrich-Universität Bamberg
Prof. Dr. S. Rässler
Klausur zu Methoden der Statistik II mit Lösung
Sommersemester 2008
Aufgabe 1
Der landwirtschaftliche Betrieb KnusperKorn“ ist seit vielen Jahren bekannt für sei”
ne hervorragenden Knuspermüslis aus kontrolliert biologischem Anbau. Obwohl man auf
dem Land die Hektik der Stadt vergessen kann, muss auch Produktionsleiter Johannes
B. Körner aus Wirtschaftlichkeitsgründen auf die Zeit achten. Er überprüft deshalb die
Einfülldauer von Haferflocken in 500-Gramm-Papiertüten. Bei 101 unabhängigen Versuchen ergab sich ein Stichprobenmittelwert von X 101 = 5, 5 Sekunden und eine Stichproben2 = 1, 72 Sekunden2 . Aus langjähriger Erfahrung weiß Johannes B. Körner,
varianz von S101
dass die Einfüllzeiten Xi einer 500-Gramm-Papiertüte mit i = 1, . . . , 101 annähernd normalverteilte Zufallsgrößen mit Parametern µ und σ 2 sind.
a) Berechnen Sie mit einer Irrtumswahrscheinlichkeit von 5% jeweils das realisierte
Konfidenzintervall für die Parameter µ und σ 2 .
b) Johannes B. Körner wird stutzig, da sich bei den Überprüfungen der letzten Jahre
eine durchschnittliche Einfülldauer von 5 Sekunden ergab. Helfen Sie Johannes B.
Körner mittels eines geeigneten statistischen Verfahrens bei der Entscheidung, ob
sich die mittlere Einfülldauer signifikant (α = 0, 05) verlängert hat.
Aufgabe 2
Ein vom Internationalen Tischtennisverband ITTF zugelassener Tischtennisball hat seit
dem Jahr 2000 einen Durchmesser von 40 mm. Bis zu diesem Zeitpunkt hatten Tischtennisbälle einen Durchmesser von 38 mm und waren dementsprechend leichter. Die Firmen
BUTTERFLIEG, DUNIX und JOOGA sind Marktführer auf dem Markt für TischtennisEquipment. Bei einer Qualitätskontrolle wurde der Durchmesser von jeweils 1000 Tischtennisbällen dieser drei Hersteller gemessen. Die Anzahl der Tischtennisbälle mit normalen,
zu geringen und zu großen Abmessungen sind in der folgenden Tabelle angegeben.
BUTTERFLIEG
DUNIX
JOOGA
Σ
zu geringes Maß
250
510
290
1050
Normalmaß
500
420
580
1500
zu großes Maß
250
70
130
450
Σ
1000
1000
1000
3000
Überprüfen Sie mit einem geeigneten Test, ob die Genauigkeit des Durchmessers der Tischtennisbälle vom Hersteller abhängig ist (α = 0, 05).
Aufgabe 3
a) Während des Endspiels der Fußball-Europameisterschaft treffen sich 11 Bamberger
Studenten bei ihrem gemeinsamen Freund Jogi zum Grillen. In der Halbzeitpause
stellen sie fest, dass nicht mehr genügend saubere Gabeln vorhanden sind. Da Jogi
und seine 11 Freunde zu diesem Zeitpunkt allerdings nicht mehr in der Lage sind,
in der allgemein üblichen Art und Weise Besteck zu spülen, werfen sie eine Hand”
voll Besteck“ (5 Messer, 8 Gabeln, 7 Löffel) in eine Wanne mit trübem Spülwasser,
rühren um und entnehmen zufällig und auf einmal 5 Besteckteile. Wie groß ist die
Wahrscheinlichkeit, dass sich unter den zufällig entnommenen Besteckteilen mindestens 3 Gabeln befinden?
b) Beim Public Viewing“ auf dem Bamberger Maxplatz“ stellt sich in der Halbzeit”
”
pause ein ähnliches Problem. Jedoch befinden sich in einer größeren Spülwanne 700
Löffel, 507 Messer und 793 Gabeln. Wie groß ist die Wahrscheinlichkeit, dass sich
unter 50 zufällig und auf einmal entnommenen Besteckteilen höchstens 20 Löffel befinden?
c) Hannes Flick war einer der zahlreichen Zuschauer auf dem Bamberger Maxplatz“.
”
Nach dem Genuss einiger alkoholischer Getränke und fränkischer Speisen während
des Spiels, befinden sich nach dem Abpfiff noch drei 2e -Stücke und sieben 1e -Stücke
in seiner Geldbörse. Um sich nun abschließend noch ein Jubel-Bier“ zu gönnen,
”
nimmt er willkürlich eine Münze heraus und danach (ohne die erste zurückzulegen)
eine zweite.
c1) Bestimmen Sie die Wahrscheinlichkeit dafür, dass die erste gezogene Münze ein
1e -Stück ist?
c2) Bestimmen Sie die Wahrscheinlichkeit dafür, dass die zweite gezogene Münze
ein 2e -Stück ist?
c3) Bestimmen Sie die Wahrscheinlichkeit dafür, dass die erste gezogene Münze
ein 2e -Stück ist, unter der Bedingung, dass die zweite gezogene Münze ein
2e -Stück ist.
Aufgabe 4
a) Die Zeit zwischen der Ankunft von Bienen auf einer Kirschblüte sei exponentialverteilt mit Parameter λ. Es bezeichne X die Wartezeit der Kirschblüte auf die nächste
Biene (in Minuten).
a1) Wie groß ist die Wahrscheinlichkeit, dass die Wartezeit der Kirschblüte auf die
nächste Biene genau zwei Minuten beträgt?
a2) Welcher Zusammenhang besteht zwischen dem Erwartungswert und der Varianz der Wartezeit einer Kirschblüte auf die nächste Biene?
a3) Wie groß ist die Wahrscheinlichkeit, dass die Wartezeit der Kirschblüte auf die
nächste Biene überdurchschnittlich lang ist?
b) Die Anzahl Yi der ankommenden Bienen auf den Kirschblüten i = 1, . . . , n eines
Baumes pro Tag seien unabhängig identisch Poisson-verteilte Zufallsvariablen mit
Parameter λ.
b1) Schätzen Sie den Parameter λ mit der Maximum-Likelihood-Methode. Stellen
Sie dazu zunächst die Likelihoodfunktion und die Log-Likelihoodfunktion auf
und ermitteln dann den Maximum-Likelihood-Schätzer für λ.
b2) Auf den insgesamt 125 Blüten eines Kirschbaums zählte Biologin Sabine Honig
mit einem speziellen Gerät zusammen 12500 Bienen. Welchen Wert nimmt der
in b1) bestimmte Schätzer demnach an?
Hinweis: Falls Sie den Maximum-Likelihood-Schätzer für λ in Teilaufgabe b1)
nicht bestimmen können, verwenden Sie zur Lösung von b2) den Schätzer
b = y.
λ
Aufgabe 5 (R-Aufgabe)
I. In einem Spiel dürfen die Spieler sieben Mal mit einer fairen 1e -Münze werfen. Die
Zufallsvariable X bezeichnet die Anzahl der geworfenen Köpfe. Durch folgenden Befehl werden die Würfe von 15 Spielern simuliert:
anzahl.koepfe=rbinom(n=15,size=7,prob=1/2)
Die Ausgabe lautet:
>anzahl.koepfe
[1] 5 2 5 1 2 5 3 4 3 4 2 4 3 3 4
a) Wie kann man mit R den Mittelwert und die Varianz der Variable
anzahl.koepfe berechnen?
b) Wie hoch ist der Anteil der Spieler, die überdurchschnittlich oft Kopf
geworfen haben in dieser konkreten Stichprobe?
c) Wie lautet der entsprechende Befehl, wenn die 15 Spieler anstelle einer
Münze nun einen fairen Würfel werfen und dabei jeweils ausschließlich die
Anzahl ihrer geworfenen Sechser zählen?
II. Das Geburtsgewicht Elefant.Afrika“ eines afrikanischen Elefanten kann eben”
so wie das Geburtsgewicht Elefant.Indien“ eines indischen Elefanten nähe”
rungsweise als normalverteilte Zufallsvariable angesehen werden. Die Ergebnisse für Messungen aus verschiedenen Zoos weltweit haben für die afrikanischen
Elefanten ein durchschnittliches Geburtsgewicht von 120 kg ergeben und für die
indischen Elefanten einen Wert von 100 kg. Vereinfachend gehen wir davon aus,
dass die Varianz des Geburtsgewichts bei beiden Elefantenarten gleich groß ist.
a) Mit welchem R-Befehl können Sie die Korrelation zwischen den Geburtsgewichten beider Elefantenarten berechnen?
Zum Vergleich des Geburtsgewichts indischer und afrikanischer Elefanten wurde ein Test durchgeführt. Der Sachverhalt wurde mit folgendem R-Befehl getestet:
t.test(Elefant.Afrika,Elefant.Indien,alternative=’’greater’’,
mu=20,paired=FALSE,var.equal=TRUE,conf.level=0.95)
b) Erläutern Sie kurz die Argumente dieses R-Befehls.
c) Handelt es sich bei den Stichproben Elefant.Afrika“ und Elefant.Indien“
”
”
um verbundene oder unverbundene Stichproben? Begründen Sie Ihre Antwort.
Auf der folgenden Seite finden Sie den zugehörigen
R-Output!
Der R–Output ist:
Two Sample t-test
data: Elefant.Afrika and Elefant.Indien
t = 1.1618, df = 108, p-value = 0.1239
alternative hypothesis: true difference in means is greater than 20
95 percent confidence interval:
19.04073 Inf
sample estimates:
mean of x mean of y
120.97311 98.73218
d) Um welchen Test handelt es sich hierbei?
e) Formulieren Sie das getestete Hypothesenpaar.
f) Wie viele Elefantenbabys wurden insgesamt für diesen Test gewogen?
g) Wie lautet die Testentscheidung? Begründen Sie Ihre Antwort sowohl mit
Hilfe des p-Werts, als auch anhand des Konfidenzintervalls.
Lösung zu Aufgabe 1:
a) Konfidenzintervall für den Mittelwert bei unbekannter Varianz:
KI = [5, 1644; 5, 8356]
Konfidenzintervall für die Varianz bei unbekanntem Mittelwert gilt:
KI = [2, 2299; 3, 8949]
b) Mittelwerttest bei unbekannter Varianz:
2, 9558 > 1, 660 ⇒ Nullhypothese ablehnen, d.h. Stichprobe stützt Vermutung
Lösung zu Aufgabe 2:
- χ2 -Unabhängigkeitstest
⇒ Approximationsregeln erfüllt
- 249, 6001 > 9, 49 ⇒ Nullhypothese wird verworfen, d.h. Stichprobe deutet auf Zusammenhang hin
Lösung zu Aufgabe 3:
a) G = Anzahl der Gabeln
G ∼ Hyp(5, 20, 8)
P (G ≥ 3) = 0, 2962
b) L = Anzahl der Löffel
L ∼ Hyp(50, 2000, 700)
- Approximationsbedingungen prüfen
P (L ≤ 20) = 0, 8159 (Stetigkeitskorrektur beachten)
c) Geldbörse: 3 × 2e und 7 × 1e , d.h. 10 Geldstücke
c1) P (1. Münze = 1e ) = 0, 7.
c2) P (2. Münze = 2e ) = 0, 3.
c3) P(1. M.=2 Euro —2. M. = 2 Euro ) = 0,2222
Lösung zu Aufgabe 4:
a) X ∼ exp(λ)
a1) P (X = 2) = 0, da Punktwahrscheinlichkeit gesucht und X stetig
a2) Var(X) =
1
λ2
=
1 2
λ
= (E(X))2
a3) P (X > λ1 ) = 0, 3679
b) b1) Likelihoodfunktion
n
P
yi
λ
e−nλ
L(λ; y) =
y1 ! · . . . · yn !
i=1
Log-Likelihoodfunktion
ln L(λ; y) =
n
X
yi ln λ − nλ − ln(y1 ! · . . . · yn !)
i=1
ML-Schätzer für λ
n
P
∂ ln L(λ;y)
∂λ
=
n
P
⇒ λ̂ =
i=1
n
yi
i=1
λ
!
−n=0
yi
=y
b2) λ̂ = 100
Lösung zu Aufgabe 5:
I.
a) mean(anzahl.koepfe)
var(anzahl.koepfe)
b)
7
15
= 0, 4667
c) anzahl.koepfe=rbinom(n=15,size=7,prob=1/6)
II.
a) corr(Elefant.Afrika,Elefant.Indien)
b)
alternative=’’greater’’ ⇒ Differenz der Mittelwerte größer als mu
mu=20 ⇒ belegt Wert mu mit Wert 20
paired=FALSE ⇒ t-Test für unverbundene Stichproben
var.equal=TRUE ⇒ gleiche Varianz in der Grundgesamtheit der afrikanischen und indischen Elefanten
- conf.level=0.95 ⇒ 95% Konfidenzintervall
-
c) unverbundene Stichproben
d) Mittelwertdifferenzentest bei unverbundenen Stichproben
e) H0 : δ ≤ 20 gegen HA : δ > 20
f) 110
g)
- p-Wert (0, 1239) größer α = 0, 05 ⇒ Nullhypothese nicht ablehnen
- µ = 20 liegt im Konfidenzintervall ⇒ Nullhypothese nicht ablehnen
Herunterladen