Statistik 2

Werbung
Statistik 2
A
2. Klausur
Sommersemester 2013
Hamburg, 25.09.2013
BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Nachname: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Vorname: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Matrikelnummer:
Studienfach: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fachsemester:
Art der Anmeldung:
STiNE
Zulassung unter Vorbehalt
Sonstiges
Mit Ihrer nachfolgenden Unterschrift bestätigen Sie die Klausur auf Vollständigkeit überprüft zu haben. Diese Klausur besteht aus 8 Aufgaben und aus 14 Seiten.
Unterschrift der/des Studierenden:
Bemerkungen:
Aufgabe
1
2
3
4
5
6
7
8
Summe
max. Pkt. err. Pkt.
30
20
8
7
7
9
10
9
100
Klausur Statistik 2
Hamburg, 25.09.2013
Lösungstabelle für die Aufgaben 1 und 2
Hinweise für die Aufgaben 1.1 bis 1.10:
• Es ist exakt eine Antwortmöglichkeit korrekt.
• Zur Punktevergabe:
(a) Wird ausschließlich die korrekte Antwort angekreuzt, so erhält man die volle
Punktezahl.
(b) In allen Fällen – außer der in (a) beschriebenen Situation – erhält man 0 Punkte.
Hinweise für die Aufgaben 2.1 bis 2.5:
• Es ist mindestens eine Antwortmöglichkeit korrekt.
• Zur Punktevergabe:
– Werden ausschließlich alle korrekten Antwortmöglichkeiten angekreuzt, so erhält
man die volle Punktezahl.
– Werden unter anderem korrekte Antwortmöglichkeiten angekreuzt, jedoch nicht
ausschließlich alle korrekten Antwortmöglichkeiten, so erhält man 1 Punkt.
Allgemeiner Hinweis: Falls Sie Ihre bereits gewählte Antwort revidieren möchten, so kreuzen
Sie alle Felder der entsprechenden Zeile an und schreiben die korrekte(n) Antwort(en)
neben die entsprechende Tabellenzeile.
Aufgabe
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
1.10
2.1
2.2
2.3
2.4
2.5
(a) (b) (c) (d)
×
×
×
×
×
×
×
×
×
×
×
×
×
×
×
× ×
×
-2-
Klausur Statistik 2
Hamburg, 25.09.2013
Aufgabe 1 (30 Punkte)
Hinweise:
• In den Aufgaben 1.1 bis 1.10 ist exakt eine Antwortmöglichkeit korrekt.
• Markieren Sie die korrekte Antwort durch ein Kreuz in der „Lösungstabelle für die
Aufgaben 1 und 2“ auf Seite 2.
Aufgabe 1.1 (3 Punkte)
Gegeben sei die Funktion g durch
2
g:R →R
(x, y) 7→

1


 27
1
9


0
falls x ∈ {0, 1, 2} ∧ y ∈ {0, 2, 4}
falls x ∈ {3, 4} ∧ y ∈ {1, 3, 5}
sonst
Welche der nachfolgenden Aussagen ist korrekt?
(a) Die Funktion g erfüllt alle Eigenschaften einer Wahrscheinlichkeitsfunktion.
(b) Die Funktion g erfüllt alle Eigenschaften einer Dichtefunktion.
(c) Die Funktion g erfüllt alle Eigenschaften einer Verteilungsfunktion.
(d) Die Funktion g erfüllt keine der bisher genannten Eigenschaften.
Aufgabe 1.2 (3 Punkte)
Gegeben sei ein dreidimensionaler Zufallsvektor X = (X1 , X2 , X3 )T . Aus welcher der
nachfolgenden Angaben lässt sich die Korrelationsmatrix Corr(X) eindeutig berechnen?
(a) E(X) sowie V ar(X1 ), V ar(X2 ) und V ar(X3 ).
(b) Cov(X).
(c) Cov(X1 , X2 ), Cov(X1 , X3 ) und Cov(X2 , X3 ).
(d) Aus keiner der bisherigen Angaben lässt sich Corr(X) berechnen.
Aufgabe 1.3 (3 Punkte)
Welche der nachfolgenden Beziehungen bzgl. zweier stetiger Zufallsvariablen ist nicht
möglich?
(a) V ar(X) = V ar(Y ) und ρX,Y > 0.5
(b) V ar(X) > V ar(Y ) und Cov(X, Y ) < 0
(c) V ar(X + Y ) < V ar(X) + V ar(Y )
(d) Alle bisherigen Beziehungen sind möglich.
Dateipfad: mc/aufgabe1.tex
-3-
Klausur Statistik 2
Hamburg, 25.09.2013
Aufgabe 1.4 (3 Punkte)
Der Zufallsvektor (X, Y )T sei bivariat normalverteilt mit V ar(X) > 0 und V ar(Y ) > 0.
Aus welcher der nachfolgenden Angaben lässt sich auf die stochastische Unabhängigkeit
der beiden Zufallsvariablen X und Y schließen?
(a) Es gilt fX (x) · fY (y) = fX,Y (x, y) für alle x, y ∈ R.
(b) Es gilt Cov(X, Y ) = V ar(X) = V ar(Y ) = 1.
(c) Es gilt Cov(X, Y ) = V ar(X) · V ar(Y ).
(d) Aus keiner der bisherigen Angaben folgt die stochastische Unabhängigkeit.
Aufgabe 1.5 (3 Punkte)
Es sollen die Momentenmethode und die Maximum-Likelihood-Methode (ML-Methode) zur
Parameterschätzung miteinander verglichen werden. Welche der nachfolgenden Aussagen
ist korrekt?
(a) Die ML-Methode ist „schwieriger“ als die Momentenmethode.
(b) Momentenmethode und ML-Methode müssen nicht notwendigerweise dieselben Parameterschätzer liefern.
(c) Die ML-Methode wird angewendet, wenn die Momentenmethode zu keinem Resultat
führt.
(d) Die Momentenmethode und die ML-Methode liefern immer unverzerrte Parameterschätzer.
Aufgabe 1.6 (3 Punkte)
Betrachtet wird der Annahmebereich sowie der Ablehnungsbereich beim statistischen
Hypothesen testen. Welche der nachfolgenden Aussagen ist korrekt?
(a) Der Ablehnungsbereich ist immer größer als der Annahmebereich.
(b) Es existiert ein Element, welches sowohl im Annahmebereich als auch im Ablehnungsbereich vorkommt. Dieses Element stellt die Grenze zwischen beiden Bereichen
dar.
(c) Annahmebereich und Ablehnungsbereich sind immer überschneidungsfrei.
(d) Annahmebereich und Ablehnungsbereich sind immer gleichgroß.
Dateipfad: mc/aufgabe1.tex
-4-
Klausur Statistik 2
Hamburg, 25.09.2013
Aufgabe 1.7 (3 Punkte)
Betrachtet wird der χ2 -Anpassungstest. Welche der nachfolgenden Aussagen ist korrekt?
(a) Die Parameter der in der Nullhypothese unterstellten Verteilung müssen immer über
Momentenmethode oder Maximum-Likelihood-Methode geschätzt werden.
(b) Der Test kann nur für stetige Verteilungen durchgeführt werden.
(c) Der Ablehnungsbereich ist immer einseitig.
(d) Keine der bisherigen Aussagen ist korrekt.
Aufgabe 1.8 (3 Punkte)
Betrachtet wird das lineare Einfachregressionsmodell. Welche der nachfolgenden Aussagen
ist korrekt?
˜ β̂˜ und σ̂
˜ 2 niemals die
(a) Für einen gegebenen Datensatz treffen die Schätzfunktionen α̂,
wahren Parameter α, β und σ 2 .
˜ β̂˜ und σ̂
˜ 2 sind unverzerrt.
(b) Die Parameterschätzfunktionen α̂,
˜ 2 besitzt keine Varianz, da sie selbst ein Varianzschät(c) Die Parameterschätzfunktion σ̂
zer ist.
(d) Keine der bisherigen Aussagen ist korrekt.
Aufgabe 1.9 (3 Punkte)
Gegeben sei nachfolgender R-Output für ein multiples lineares Regressionsmodell mit drei
unabhängigen Variablen A, B und C.
Coefficients:
Estimate t value Pr(>|t|)
(Intercept) -610.42387 -59.539 0.123248
A
65.29308 100.922
< 2e-16
B
8.35889 139.454 0.038655
C
0.77610
3.709 0.000213
Die Regressionsgleichung lautet: Yi = β0 +β1 Ai +β2 Bi +β3 Ci +˜i .Welche der nachfolgenden
Aussagen ist korrekt?
(a) Die Nullhypothese H0 : β0 = 0 kann auf dem 10%-Signifikanzniveau abgelehnt
werden.
(b) Die Nullhypothese H0 : β1 = 0 kann auf dem 10%, dem 1% und dem 0.1%Signifikanzniveau abgelehnt werden.
(c) Die Nullhypothese H0 : β2 = 0 kann auf dem 1%-Signifikanzniveau abgelehnt werden.
(d) Keine der bisherigen Aussagen ist korrekt.
Dateipfad: mc/aufgabe1.tex
-5-
Klausur Statistik 2
Hamburg, 25.09.2013
Aufgabe 1.10 (3 Punkte)
Betrachtet werden stochastische Zeitreihenmodelle. Welche der nachfolgenden Aussagen
ist korrekt?
(a) Starke Stationarität impliziert schwache Stationarität.
(b) Schwache Stationarität impliziert starke Stationarität.
(c) Starke und schwache Stationarität sind synonyme Begriffe.
(d) Keine der bisherigen Aussagen ist korrekt.
Dateipfad: mc/aufgabe1.tex
-6-
Klausur Statistik 2
Hamburg, 25.09.2013
Aufgabe 2 (20 Punkte)
Hinweise:
• In den Aufgaben 2.1 bis 2.5 ist mindestens eine Antwortmöglichkeit korrekt.
• Markieren Sie die korrekte(n) Antwort(en) durch ein Kreuz bzw. mehrere Kreuze in
der „Lösungstabelle für die Aufgaben 1 und 2“ auf Seite 2.
Aufgabe 2.1 (4 Punkte)
Welche der nachfolgenden (sich gegenseitig ausschließenden) Bedingungen führen dazu,
dass die Summe der Varianzen verschiedener Zufallsvariablen X1 , . . . , Xn gleich der Varianz
der Summe dieser Zufallsvariablen X1 , . . . , Xn ist?
(a) Cov(Xi , Xj ) = 0 für alle i, j = 1, . . . , n.
(b) Cov(Xi , Xj ) = 0 für alle i 6= j.
(c) Cov(Xi , Xj ) = 0 für alle i = j.
(d) Cov(Xi , Xj ) = 0 für mindestens ein (i, j)-Paar.
Aufgabe 2.2 (4 Punkte)
Betrachtet wird die Maximum-Likelihood-Methode (ML-Methode). Welche der nachfolgenden Aussagen sind korrekt?
(a) Die Likelihoodfunktion muss differenzierbar sein um analytisch einen Schätzer für
den unbekannten Parametervektor θ bestimmen zu können.
(b) Die Wahrscheinlichkeits- bzw. Dichtefunktion der zugrundeliegenden Zufallsvariablen
muss bekannt sein um die Likelihoodfunktion aufstellen zu können.
(c) Die Likelihoodfunktion muss integrierbar sein um analytisch einen Schätzer für den
unbekannten Parametervektor θ bestimmen zu können.
(d) Keine der bisherigen Aussagen ist korrekt.
Aufgabe 2.3 (4 Punkte)
Betrachtet werden allgemeine Konfidenzintervalle. Welche der nachfolgenden Aussagen
sind korrekt?
(a) Die Grenzen eines Konfidenzintervalls erhält man durch die Anwendung einer Schätzfunktion auf zwei unterschiedliche Datensätze.
(b) Die Wahrscheinlichkeit, dass der wahre Parameter innerhalb eines Konfidenzintervalls
liegt ist größer oder gleich Eins minus Irrtumswahrscheinlichkeit.
(c) Ein Konfidenzintervall liegt immer symmetrisch um den wahren Parameter.
(d) Der wahre, aber unbekannte Parameter liegt immer innerhalb des Konfidenzintervalls.
Dateipfad: mc/aufgabe2.tex
-7-
Klausur Statistik 2
Hamburg, 25.09.2013
Aufgabe 2.4 (4 Punkte)
Betrachtet wird das Signifikanzniveau α0 eines Hypothesentests. Welche der nachfolgenden
Aussagen sind korrekt?
(a) Das Signifikanzniveau ist die Wahrscheinlichkeit, mit der ein α-Fehler eines Hypothesentests maximal auftreten kann.
(b) Das Signifikanzniveau kann den Wert 0 annehmen.
(c) Das Signifikanzniveau kann den Wert 1 annehmen.
(d) Keine der bisherigen Aussagen ist korrekt
Aufgabe 2.5 (4 Punkte)
Betrachtet wird eine multiple lineare Regression mit zwei unabhängigen (bezeichnet mit
X1 und X2 ) und einer abhängigen (bezeichnet mit Y ) Variablen, wie in der Vorlesung
eingeführt. Welche der nachfolgenden Aussagen sind korrekt?
(a) Es existieren exakt zwei Regressionskoeffizienten (β1 und β2 ) welche aus den Daten
geschätzt werden müssen.
(b) Das Produkt X T X ist eine Matrix mit zwei Zeilen und so vielen Spalten, wie es
Beobachtungen gibt.
(c) Wurden die Regressionskoeffizienten geschätzt, so ist die empirische Varianz der
Residuen Null.
(d) Keine der bisherigen Aussagen ist korrekt.
Dateipfad: mc/aufgabe2.tex
-8-
Klausur Statistik 2
Hamburg, 25.09.2013
Aufgabe 3 (8 Punkte)
Gegeben seien die beiden diskreten Zufallsvariablen X und Y sowie nachfolgende gemeinsame Warhscheinlichkeitstabelle.
X
2
1 0.1
3 0.1
4 0.2
Y
4
0.1
0.1
0.1
6
0.1
0.1
0.1
Berechnen Sie den Korrelationskoeffizienten von X und Y .
Lösung von Aufgabe 3
Es ist:
E(X) = 1 · 0.3 + 3 · 0.3 + 4 · 0.4 = 2.8
E(Y ) = 2 · 0.4 + 4 · 0.3 + 6 · 0.3 = 3.8
E(X 2 ) = 12 · 0.3 + 32 · 0.3 + 42 · 0.4 = 9.4
E(Y 2 ) = 22 · 0.4 + 42 · 0.3 + 62 · 0.3 = 17.2
Damit erhält man:
V ar(X) = E(X 2 ) − E 2 (X) = 9.4 − 2.82 = 1.56
V ar(Y ) = E(Y 2 ) − E 2 (Y ) = 17.2 − 3.82 = 2.76
Für die Kovarianz gilt:
E(X · Y ) = 1 · 2 · 0, 1 + . . . + 4 · 6 · 0.1 = 10.4
Cov(X, Y ) = E(X · Y ) − E(X) · E(Y ) = 10.4 − 2.8 · 3.8 = −0.24
Damit erhält man für den Korrelationskoeffizienten:
ρX,Y = q
Cov(X, Y )
V ar(X) · V ar(Y )
Dateipfad: rechenaufg/aufgabe1.tex
=√
-9-
−0.24
= −0.115663
1.56 · 2.76
Klausur Statistik 2
Hamburg, 25.09.2013
Aufgabe 4 (7 Punkte)
Gegeben sei eine stetige Zufallsvariable X mit nachfolgender Dichtefunktion.

1
3
fX (x) =  a
0
x2 +
2
3a
für x ∈ [0, a]
sonst
Für den Datensatz mit den Werten 1, 2, 2, 2, 2, 6 berechne man mittels Momentenmethode
einen Schätzer für den unbekannten Parameter a > 0.
Lösung von Aufgabe 4
Für den Erwartungswert berechnet man:
E(X) =
Z a
0
fX (x) · xdx =
Z a
0
1 3
1 4
2
1
x + xdx =
x + x2
3
3
a
3a
4a
3a
a
0
a a
7a
= + =
4 3
12
Damit erhält man für den Momentenschätzer:
7â
= x̄
12
⇔
â =
12 · x̄
7
Dateipfad: rechenaufg/aufgabe2.tex
⇔
-10-
â =
12 · 15
30
6
=
= 4.285714
7
7
Klausur Statistik 2
Hamburg, 25.09.2013
Aufgabe 5 (7 Punkte)
Aus einer normalverteilten Grundgesamtheit wird eine uneingeschränkte Zufallsstichprobe
vom Umfang n = 30 gezogen. Dabei resultierten nachfolgende Ergebnisse:
30
X
30
X
xi = 315
i=1
x2i = 439056
i=1
Berechnen Sie ein 95%-Konfidenzintervall für die Varianz der Grundgesamtheit.
Lösung von Aufgabe 5
Für das arith. Mittel sowie die erwartungstreue Varianzschätzung erhält man:
315
= 10.5
30
30
1 X
1
30
n
2
š =
x̄2 =
· 439056 −
· 10.52 ≈ 15025.81
x2i −
n − 1 i=1
n−1
29
29
x̄ =
Mit χ20.025 (29) = 16.047 und χ20.975 (29) = 45.722 erhält man als 95%-Konfidenzintervall:
29 · 15025.81 29 · 15025.81
;
≈ [9530.39 ; 27154.51]
45.722
16.047
Dateipfad: rechenaufg/aufgabe3.tex
-11-
Klausur Statistik 2
Hamburg, 25.09.2013
Aufgabe 6 (9 Punkte)
Für zwei gemeinsam normalverteilte Zufallsvariablen (X, Y ) soll der Korrelationstest
betrachtet werden. Welcher Stichprobenumfang ist mindestens nötig, damit bei einem
empirischen Korrelationskoeffizienten von rx,y = 0.557 die Nullhypothese
H0 : ρ = 0.5
gegen die Alternativhypothese
H1 : ρ 6= 0.5
auf dem 5%-Signifikanzniveau abgelehnt wird?
Lösung von Aufgabe 6
Prüfgröße nach n auflösen liefert:
"
Gρ0 6=0
1 + RX,Y
1
ln
=
2
1 − RX,Y
!
1 + ρ0
− ln
1 − ρ0
!#
√
n−3
2

G

i 
n =  1 h 1+RX,Y  +3
1+ρ0
ln 1−RX,Y − ln 1−ρ0
2
⇔
Einsetzen ergibt (z0.975 = 1.96):

2
1.96
i  + 3 = 615.9473
n =  1 h 1+0.557 1+0.5
ln
−
ln
2
1−0.557
1−0.5
Ab einer Stichprobengröße von n = 616 wird obige Nullhypothese auf dem 5%-Signifikanzniveau abgelehnt.
Dateipfad: rechenaufg/aufgabe4.tex
-12-
Klausur Statistik 2
Hamburg, 25.09.2013
Aufgabe 7 (10 Punkte)
Es soll untersucht werden, ob eine bestimmte Grundgesamtheit als geometrisch verteilt
angesehen werden kann. Eine Stichprobe vom Umfang n = 80 lieferte:
xi
ni
1
20
2
22
3
20
4 5
14 4
Führen Sie einen χ2 -Anpassungstest auf einem 5%-Signifikanzniveau durch und begründen
Sie Ihr Vorgehen.
Hinweis: Eine geometrisch verteilte Zufallsvariable X besitzt die Wahrscheinlichkeitsfunktion (p ∈ (0, 1))
P (X = x) = p(1 − p)x−1
für x = 1, 2, 3, . . .
sowie nachfolgenden Erwartungswert und Varianz:
E(X) =
1
p
V ar(X) =
1−p
p2
Lösung von Aufgabe 7
Es muss zuerst der Parameter p geschätzt werden (Momentenmethode):
p̂ =
n
80
80
1
= P80
=
=
= 0.4
x̄
20 + 44 + 60 + 56 + 20
200
i=1 xi
Nun werden die theoretischen Häufigkeiten ermittelt.
N1
N2
N3
N4
N5
= 0.4(1 − 0.4)1−1 ·
= 0.4(1 − 0.4)2−1 ·
= 0.4(1 − 0.4)3−1 ·
= 0.4(1 − 0.4)4−1 ·
= 0.4(1 − 0.4)5−1 ·
80 = 32
80 = 19.2
80 = 11.52
80 = 6.912
80 = 4.1472
Damit sind die Voraussetzungen für die Anwendung des χ2 -Anpassungstests erfüllt.
Für die Prüfgröße erhält man:
g=
(20 − 32)2
(4 − 4.1472)2
+ ... +
= 18.4243
32
4.1472
Da χ20.95 (5 − 1 − 1) = χ20.95 (3) = 7.815 < 18.4243 = g gilt, folgt, dass H0 auf dem
5%-Signifikanzniveau abgelehnt werden kann.
Dateipfad: rechenaufg/aufgabe5.tex
-13-
Klausur Statistik 2
Hamburg, 25.09.2013
Aufgabe 8 (9 Punkte)
Für einen bivariaten Datensatz, bestehend aus n = 30 Wertepaaren, seien nachfolgende
Größen gegeben:
x̄ = 12
š2x = 100
30
X
ȳ = 36
š2y = 256
xi yi = 1200
i=1
Es wird ein lineares Einfachregressionsmodell (siehe Vorlesung) zwischen X (unabhängige
Variable) und Y (abhängige Variable) unterstellt.
(a) Berechnen Sie die Ausgleichsgerade.
(b) Geben Sie ein 95%-Konfidenzintervall für den Parameter α an. Hierbei sei die
geschätzte Varianz der Residuen durch σ̂ 2 = 88 gegeben.
Lösung von Aufgabe 8
(a) Man berechnet:
P30
i=1 (xi
− x̄)2 = 29 · 100 = 2900. Damit erhält man:
1200 − 30 · 12 · 36
= −4.055172
2900
α̂ = 36 − (−4.055172) · 12 = 84.66206
β̂ =
Damit lautet die Ausgleichsgerade:
ŷ = 84.66206 − 4.055172 · x
(b) Man berechnet:
P30
i=1
x2i = 2900 + n · x̄2 = 2900 + 30 · 122 = 7220. Damit erhält man:
σ̂α̂2˜ = 88 ·
7220
= 7.302989
30 · 2900
Für das Konfidenzintervall ergibt sich somit (t0.975 (28) = 2.048):
h
i
√
84.66206 − 7.302989 · 2.048 ; 84.66206 + . . . = [79.12754 ; 90.19658]
Dateipfad: rechenaufg/aufgabe6.tex
-14-
Zugehörige Unterlagen
Herunterladen