Aufgabe 1 - Universität Bamberg

Werbung
Lehrstuhl für Statistik und Ökonometrie
der Otto-Friedrich-Universität Bamberg
Prof. Dr. Susanne Rässler
Klausur zu Methoden der Statistik II (mit Kurzlösung)
Sommersemester 2015
Aufgabe 1
Zum Ende des traditionellen Sommerfestes einer Stadt kündigt die Presse ein Feuerwerk
an. Nicole ist leidenschaftliche Hobbyfotografin und beschließt daher, einige farbenprächtige Motive mit ihrer Kamera aufzunehmen. Von ihren letzten Fotoabenden weiß sie, dass
sie bei jedem Versuch einen zufriedenstellenden Schnappschuss mit einer Wahrscheinlichkeit von 30 Prozent ablichten kann. An besagtem Abend drückt Nicole insgesamt 250 mal
auf den Auslöser.
a) Wie und mit welchem/(n) Parameter(n) ist die Zufallsvariable X := Anzahl der
zufriedenstellenden Schnappschüsse verteilt?
b) Ihr bisheriges Glanzstück liegt bei 70 zufriedenstellenden Fotos. Berechnen Sie die
approximative Wahrscheinlichkeit dafür, dass Nicole am besagten Abend ihren
Rekord noch übertreffen kann.
Aus fundierten Angaben eines Pyrotechnik-Portals weiß Nicole, dass die Sichtbarkeit der
Effekte durchschnittlich µ = 3,2 Sek beträgt bei einer Varianz σ 2 = 2,4 Sek 2 .
c) Wie groß ist die Wahrscheinlichkeit, dass bei n = 120 rein zufällig betrachteten
Feuerwerksmotiven an diesem Abend die Dauer der Sichtbarkeit durchschnittlich
größer ist als 3,5 Sekunden? Gehen Sie von einer einfachen Zufallsstichprobe aus.
Die Wartezeit zwischen zwei Feuerwerkseffekten sei exponentialverteilt mit Parameter λ.
d) Ihnen ist bekannt, dass die Wahrscheinlichkeit für eine Wartezeit von mehr als 2
Minuten auf das nächste Feuerwerk nur 1,83% beträgt. Mit welchem Parameter λ ist
entsprechend die Zufallsvariable Y := Wartezeit zwischen zwei Feuerwerkseffekten
(in Minuten) verteilt?
e) Bestimmen Sie die Wahrscheinlichkeit dafür, dass die Wartezeit zwischen zwei Feuerwerkseffekten genau eine Minute beträgt.
Aufgabe 2
Peter steht mit seinem Team Smokey Heat“ unmittelbar vor der erstmaligen Teilnahme an
”
einer regionalen BBQ-Meisterschaft. Um optimal vorbereitet zu sein, beabsichtigt Peter die
durchschnittliche Brenndauer seiner Holzbriketts auf Basis einer Zufallsstichprobe geeignet
zu schätzen. Er ermittelt bei gleichbleibender Hitze und Luftzufuhr für n = 34 zufällig
ausgewählte Briketts die Brenndauern und erhält ein Stichprobenmittel von 4, 86 Stunden
bei einer Stichprobenvarianz von 1, 25 Stunden2 .
a) Überprüfen Sie mit Hilfe eines geeigneten Tests, ob die mittlere Brenndauer signifikant (α = 0, 05) größer ist als 4, 50 Stunden. Gehen Sie davon aus, dass die Brenndauern von Holzbriketts (approximativ) normalverteilt sind. Welche Entscheidung
treffen Sie? Interpretieren Sie Ihre Entscheidung inhaltlich.
b) Wie fällt Ihre Testentscheidung in Teilaufgabe a) aus, wenn Sie mit einer Irrtumswahrscheinlichkeit von 1% testen?
Peter findet online einen günstigen Anbieter für Holzbriketts. Er vermutet, dass sich der
niedrigere Preis für Holzbriketts des Onlineanbieters auch in einer kürzeren Brenndauer
bemerkbar macht. Er zieht eine weitere Zufallsstichprobe von m = 18 Briketts des günstigen Onlineanbieters und ermittelt bei gleichbleibender Hitze und Luftzufuhr eine mittlere
Brenndauer von 4, 20 Stunden bei einer Stichprobenvarianz von 2, 15 Stunden2 .
c) Bestimmen Sie ein Konfidenzintervall für die Differenz der mittleren Brenndauern
der beiden von Peter verwendeten Brikettarten (α = 0, 05). Gehen Sie davon aus,
dass die Varianzen in der Grundgesamtheit zwar unbekannt, aber identisch verteilt
sind.
d) Würden Sie anhand der Berechnungen aus Teilaufgabe c) sagen, dass sich die Brenndauer der beiden von Peter verwendeten Brikettarten statistisch signifikant unterscheidet? Begründen Sie Ihre Antwort kurz (1-2 Sätze).
Aufgabe 3
Anna besucht zusammen mit ihrer Freundin zum ersten Mal einen Open-Air-Kinofilm des
Kino-Sommers ihrer Stadt. Aus Erfahrung weiß man, dass 22% der Teilnehmer solcher
Veranstaltungen Erstbesucher (E) sind. Da der Film erst bei Einbruch der Dämmerung
beginnt, haben einige Teilnehmer gegen die Kälte vorgesorgt und eine Kuscheldecke (K)
mitgebracht. Insgesamt sind 4,5% der Teilnehmer Erstbesucher und haben eine Kuscheldecke mitgebracht. Von den Teilnehmern, die schon häufiger im Open-Air-Kino waren,
haben 63% daran gedacht, eine Kuscheldecke einzupacken.
a) Bestimmen Sie die Wahrscheinlichkeit dafür, dass
i) ...ein zufällig ausgewählter Erstbesucher keine Kuscheldecke mitgebracht hat.
ii) ...ein zufällig ausgewählter Teilnehmer eine Kuscheldecke eingepackt hat.
Vor dem Kinofilm und in der Pause werden den Besuchern Getränke und Snacks angeboten. Anna vermutet, dass sich die Präferenzen der Besucher gleichmäßig auf die angebotenen Snacks verteilen. Sie erfragt auf Basis einer einfachen Zufallsstichprobe vom
Umfang n = 72 den bevorzugten Snack der Besucher. Die nachstehende Tabelle zeigt ihre
Ergebnisse:
Stichprobenumfang
72
Brezeln
13
bevorzugter Snack
Gummibärchen Popcorn
11
27
Eis
21
b) Überprüfen Sie Annas Vermutung mit Hilfe eines χ2 -Anpassungstests (α = 0, 05).
Welche Entscheidung treffen Sie? Interpretieren Sie Ihre Entscheidung inhaltlich.
Anna ist aufgefallen, dass ihre Freundin weniger für Snacks und Getränke ausgegeben hat,
als sie. Sie interessiert sich jetzt für die mittleren Ausgaben für Snacks und Getränke pro
Besucher. Die Ausgaben Ai in Euro seien stochastisch unabhängig und normalverteilt mit
Erwartungswert E(Ai ) = µ und Varianz V ar(Ai ) = σ 2 für i = 1, . . . , n. Anna hat sich die
folgende Schätzfunktion überlegt:
T = A1 +
1
1
· A2 + · A3
2
3
c) Zeigen Sie, dass die obige Schätzfunktion T nicht erwartungstreu ist.
d) Bestimmen Sie den Bias und die Varianz der obigen Schätzfunktion T .
e) Unter welcher Bedingung ist ein erwartungstreuer Schätzer T1 effizienter als ein
erwartungstreuer Schätzer T2 ?
Aufgabe 4
Michael ist ein begeisterter Regnitzschwimmer und unter seinen Freunden dafür bekannt,
auch dann an der Hainbadestelle in den Fluss zu springen, wenn alle anderen sich lieber
nur sonnen. Sein Kumpel Fred hat bei fünf Hainbadestellenbesuchen die Wassertemperatur notiert und gestoppt, wie lange es Michael in der Regnitz ausgehalten hat.
Fred möchte den Zusammenhang zwischen Wassertemperatur und Schwimmdauer mit
einem linearen Modell der Form
Yi = β 0 + β 1 x i + U i
mit Ui ∼ N (0, σ 2 ) und stochastisch unabhängig für i = 1, 2, . . . , n
darstellen. Er fertigt eine Datentabelle an, die folgende Angaben zur Modellschätzung
enthält:
i
1
2
3
4
5
SUMME
Temperatur
(◦ C)
Schwimmdauer
(sec)
xi
16
13
10
15
17,5
71,5
yi
90
95
92
85
97
459
xi · yi
1440
1235
920
1275
1697,5
6567,5
x2i
256
169
100
225
306,25
1056,25
yi2
8100
9025
8464
7225
9409
42223
2
Ubi
3,9645
11,1964
0,4669
47,3165
23,4285
86,3728
a) Schätzen Sie die Parameter des linearen Regressionsmodells mit Hilfe der Methode
der kleinsten Quadrate.
(Ersatzergebnis: Sollten Sie zu keiner Lösung gelangen, verwenden Sie im Folgenden
βb0 = 50 und βb1 = 0, 5.)
b) Interpretieren Sie die in Teilaufgabe a) geschätzten Parameter inhaltlich.
c) Sagen Sie mit dem linearen Regressionsmodell voraus, wie lange es Michael bei einer
Wassertemperatur von 8◦ C in der Regnitz aushalten würde.
d) In welchem Intervall liegt der wahre Steigungskoeffizient mit einer Irrtumswahrscheinlichkeit von 10%? Interpretieren Sie das Ergebnis inhaltlich.
(Ersatzergebnis: Sollten Sie zu keiner Lösung gelangen, verwenden Sie für die Interpretation das Intervall [0, 02; 0, 98].)
e) Nennen Sie zwei Annahmen des einfachen linearen Regressionsmodells.
Lösung zu Aufgabe 1
a) X ∼ Bin(n = 250; p = 0,3)
b) Prüfen der Approximationsbedingungen:
Binomialverteilung → Normalverteilung
P (X > 70) = 1 − P (X ≤ 70) = 0, 7324.
c) P (X > 3, 5) = 1 − P (X ≤ 3, 5) = 0, 017
Die Wahrscheinlichkeit, dass in einer Stichprobe vom Umfang n = 120 eine durchschnittliche Sichtbarkeit von mehr als 3, 5 Sek auftritt, beträgt approximativ 1, 7%.
d) 1 − (1 − e−2λ ) = 0, 0183
λ = 2, 00042
⇒ Y ∼ P oi(λ = 2) Die Zufallsvariable Y : Wartezeit zwischen zwei Feuerwerkef”
fekten (in Minuten)“ ist damit exponentialverteilt mit dem Parameter λ = 2.
e) P(Y = 1) = 0
Lösung zu Aufgabe 2
a) Geeigneter Test: Mittelwerttest bei unbekannter Varianz
H0 : µX ≤ 4, 5
HA : µX > 4, 5 (Vermutung)
Prüfgröße:
√ X n −µ0
n Sn > t1−α;n−1
Entscheidungsregel :
λ1−α = λ0,95 = 1, 6448
Rechnung:
Z = 1, 8775
Entscheidung und Interpretation:
Da 1, 8775 > 1, 6448, kann die Nullhypothese H0 mit einer Irrtumswahrscheinlichkeit
von α = 0, 05 verworfen werden. Die vorliegende Stichprobe stützt die Vermutung,
dass die mittlere Brenndauer der Briketts größer ist als 4,5 Stunden.
b) Wenn α = 0, 01 ⇒ λ0,99 = 2, 3263
Da 1, 8742 < 2, 3263, kann die H0 auf einem Konfidenzniveau von 99% nicht verworfen werden.
q
p
c) P X n − Y m − t1− α ;n+m−2 · S 2 · n+m
≤ µX − µ Y
m·n
2
mit
S 2 = 1, 556
t1− α2 ;n+m−2 = 2, 009
U G = −0, 0705
OG = 1, 3905
KI = [-0,0705; 1,3905]
d) Da der Wert 0 “im KI enthalten ist, kann man sagen, dass die wahre Differenz
”
der mittleren Brenndauern auch 0 “sein könnte und sich demnach die mittleren
”
Brenndauern der Briketts nicht signifikant (α = 0, 05) voneinander unterscheiden.
Lösung zu Aufgabe 3
a)
i) P (K̄|E) = 1 − P (K|E) = 0, 7955
ii) P (K) = P (E ∩ K) + P (Ē ∩ K)
= P (E ∩ K) + P (Ē) · P (K|Ē)
= 0, 5364
b) χ2 -Anpassungstest
X:= bevorzugter Snack der Besucher
Gegeben: n = 72; k = 4; α = 0, 05
1. Hypothesen:
H0 : pi = p0i = 0, 25 (= Gleichverteilung)
HA : pi 6= p0i = 0, 25
2. Approximationsregeln:
k=4≤8
und
np0i = 72 · 0,25 = 18 ≥ 4
(Approx.bed. erfüllt!)
3. Verteilung:
Unter H0 ist das Prüfmaß approximativ χ2 -verteilt mit k − 1 = 4 − 1 = 3
Freiheitsgraden.
4. Entscheidungsregel :
Die Nullhypothese ist zu verwerfen, falls die Prüffunktion größer ist als χ21−α;(k−1) =
χ20,95;3 = 7, 81
5. Rechnung:
Verteilung
Stichprobenverteilung
Gleichverteilung
Brezeln
13
0, 25 · 72
=18
bevorzugte Snack
Gummibärchen Popcorn
11
27
0, 25 · 72
0, 25 · 72
=18
=18
Eis
21
0, 25 · 72
=18
P
72
72
Prüfgröße:
χ2 =
(13 − 18)2 (11 − 18)2 (27 − 18)2 (21 − 18)2
+
+
+
18
18
18
18
= 9, 1111
6. Entscheidung und Interpretation:
Da 9, 1111 > 7, 81, wird die H0 auf einem Signifikanzniveau von α = 0,05 verworfen. Die vorliegende Stichprobe deutet also nicht darauf hin, dass sich die
Präferenz der Kunden auf die Snacks gleichverteilt.
c) E(T ) = µ + 21 · µ +
= 11
6 · µ 6= µ
1
3
·µ
d) Bias(T ) = − 65 µ
V ar(T ) =
49 2
36 σ
e) Effizienter, wenn V ar(T 1) < V ar(T 2)
Lösung zu Aufgabe 4
a) βb1 =
xy−x·y
x2 −x2
= 0, 1124
βb0 = y − βb1 · x = 90, 1927
Yi = 90, 1927 + 0, 1124 · xi
b) βb0 : Bei einer Wassertemperatur von 0◦ C sollte es Michael im Mittel gut 90,2 Sekunden im Wasser aushalten.
βb1 : Steigt die Wassertemperatur um 1◦ C hält es Michael im Mittel um 0,11 Sekunden länger im Fluss aus.
c) Yb (xi ) = βb0 + βb1 · xi = 91, 0919
c2 = 28, 7909
d) σ
Vd
ar(βb1 ) = 0, 8518
t0,95;3 = 2, 35
q
βb1 ± t0,95;3 · Vd
ar(βb1 ) = 0, 1124 ± 2, 1688
Untergrenze: 0, 1124 − 2, 1688 = −2, 0564
Obergrenze: 0, 1124 + 2, 1688 = 2, 2812
[−2.0564; 2.2812]
Der wahre aber unbekannte Steigungskoeffizient liegt mit einer Irrtumswahrscheinlichkeit von 10% im Intervall [-2,0564; 2,2812]. Da dieses Konfidenzintervall die Null
enthält hat die Wassertemperatur wohl keinen Einfluss auf die Schwimmdauer.
e) Zwei korrekte Antworten aus:
– Das Regressionsmodell bildet den wahren Zusammenhang funktional korrekt
ab
– Das Modell ist im Mittel wahr: die Störterme heben sich im Mittel auf
– Homoskedastie: die Störterme streuen gleichmäßig
– Keine Autokorrelation: die Störterme sind unabhängig voneinander
– Die Störterme sind normalverteilt, auch: Ui ∼ N (0, σ 2 )
– Keine Kollinearität
Herunterladen