1. Klausur

Werbung
Statistik 1
A
1. Klausur
Wintersemester 2012/2013
Hamburg, 12.02.2013
BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN!
Nachname: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Vorname: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Matrikelnummer:
Studienfach: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fachsemester:
Art der Anmeldung:
STiNE
Zulassung unter Vorbehalt
Sonstiges
Mit Ihrer nachfolgenden Unterschrift bestätigen Sie die Klausur auf Vollständigkeit überprüft zu haben. Diese Klausur besteht aus 8 Aufgaben und aus 15 Seiten.
Unterschrift der/des Studierenden:
Bemerkungen:
Aufgabe
1
2
3
4
5
6
7
8
Summe
max. Pkt. err. Pkt.
30
20
8
8
10
7
9
8
100
Klausur Statistik 1
Hamburg, 12.02.2013
Lösungstabelle für die Aufgaben 1 und 2
Hinweise für die Aufgaben 1.1 bis 1.10:
• Es ist exakt eine Antwortmöglichkeit korrekt.
• Zur Punktevergabe:
(a) Wird ausschließlich die korrekte Antwort angekreuzt, so erhält man die volle
Punktezahl.
(b) In allen Fällen – außer der in (a) beschriebenen Situation – erhält man 0 Punkte.
Hinweise für die Aufgaben 2.1 bis 2.5:
• Es ist mindestens eine Antwortmöglichkeit korrekt.
• Zur Punktevergabe:
– Werden ausschließlich alle korrekten Antwortmöglichkeiten angekreuzt, so erhält
man die volle Punktezahl.
– Werden unter anderem korrekte Antwortmöglichkeiten angekreuzt, jedoch nicht
ausschließlich alle korrekten Antwortmöglichkeiten, so erhält man 1 Punkt.
Allgemeiner Hinweis: Falls Sie Ihre bereits gewählte Antwort revidieren möchten, so kreuzen
Sie alle Felder der entsprechenden Zeile an und schreiben die korrekte(n) Antwort(en)
neben die entsprechende Tabellenzeile.
Aufgabe
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
1.10
2.1
2.2
2.3
2.4
2.5
(a) (b) (c) (d)
×
×
×
×
×
×
×
×
×
×
×
× ×
× ×
×
× ×
×
-2-
Klausur Statistik 1
Hamburg, 12.02.2013
Aufgabe 1 (30 Punkte)
Hinweise:
• In den Aufgaben 1.1 bis 1.10 ist exakt eine Antwortmöglichkeit korrekt.
• Markieren Sie die korrekte Antwort durch ein Kreuz in der „Lösungstabelle für die
Aufgaben 1 und 2“ auf Seite 2.
Aufgabe 1.1 (3 Punkte)
Welche der nachfolgenden Aussagen ein Kreisdiagramm betreffend ist korrekt?
(a) Multipliziert man die absoluten Häufigkeiten eines Merkmals mit 360◦ , so erhält man
die zugehörigen Winkel für das Kreisdiagramm.
(b) Der Winkel eines „Kuchenstücks“ im Kreisdiagramm ist äquivalent zur relativen
Häufigkeit.
(c) Die Fläche eines „Kuchenstücks“ im Kreisdiagramm ist die relative Häufigkeit.
(d) Die Summe aller Fläche im Kreisdiagramm ist gleich Eins.
Aufgabe 1.2 (3 Punkte)
Welche der nachfolgenden Aussagen die Transformationsregel betreffend ist korrekt?
(a) Die Transformationsregel gilt nur für Datensätze ohne negative Merkmalsausprägungen.
(b) Die Transformationsregel gilt nur für Datensätze mit einem arithmetischen Mittel
ungleich Null (x̄ 6= 0).
(c) Die Transformationsregel gilt nur für Datensätze mit einer Varianz kleiner als Null
(s2x < 0).
(d) Keine der bisherigen Aussagen ist korrekt.
Aufgabe 1.3 (3 Punkte)
Welche der nachfolgenden Aussagen die Kleinste-Quadrate-Schätzung (KQ-Regressionsgerade) betreffend ist zutreffend?
(a) Die KQ-Regressionsgerade minimiert die Summe der horizontalen Abstände zwischen
ihr und den bivariaten Daten.
(b) Die KQ-Regressionsgerade minimiert die Summe der vertikalen Abstände zwischen
ihr und den bivariaten Daten.
(c) Die KQ-Regressionsgerade minimiert die Summe der quadrierten horizontalen Abstände zwischen ihr und den bivariaten Daten.
(d) Keine der bisherigen Aussagen ist korrekt.
Dateipfad: mc/aufgabe1.tex
-3-
Klausur Statistik 1
Hamburg, 12.02.2013
Aufgabe 1.4 (3 Punkte)
Gegeben sei ein – nicht notwendigerweise fairer – Würfel, d.h. Ω = {1, 2, 3, 4, 5, 6}. Welche
der nachfolgenden Aussagen ist korrekt?
(a) Die Wahrscheinlichkeit eine gerade Zahl zu würfeln ist immer so groß wie die Wahrscheinlichkeit eine ungerade Zahl zu würfeln.
(b) Die Wahrscheinlichkeit eine gerade Zahl zu würfeln muss sich mit der Wahrscheinlichkeit eine ungerade Zahl zu würfeln nicht immer zu Eins addieren.
(c) Die Wahrscheinlichkeit eine Zahl kleiner oder gleich Vier zu würfeln ist immer größer
als die Wahrscheinlichkeit eine Zahl echt größer als Vier zu würfeln.
(d) Keine der bisherigen Aussagen ist korrekt.
Aufgabe 1.5 (3 Punkte)
Der Ausdruck
P (A) =
n
X
P (A | Bi ) · P (Bi )
i=1
beschreibt den Satz von der totalen Wahrscheinlichkeit. Welche der nachfolgenden Aussagen
diesbezüglich ist korrekt?
(a) Der Satz gilt nur, falls das Ereignis A von den Ereignissen Bi (i = 1, . . . , n) stochastisch unabhängig ist.
(b) Der Satz gilt nur, falls für mindestens eine (i, j)-Kombination mit i 6= j gilt, dass der
Schnitt aus Bi und Bj nicht leer ist.
(c) Der Satz gilt nur, falls
Pn
i=1
P (A ∩ Bi ) = 1 Gültigkeit besitzt.
(d) Keine der bisherigen Aussagen ist korrekt.
Aufgabe 1.6 (3 Punkte)
Betrachtet wird die Zufallsvariable X ∼ χ2 (n). Welche der nachfolgenden Aussagen ist
korrekt?
(a) Der Erwartungswert der Zufallsvariablen X ist für alle n ∈ N kleiner als die Varianz
der Zufallsvariablen X.
(b) Ist die Anzahl der Freiheitsgrade sehr groß, so kann die Verteilungsfunktion Werte
größer als Eins annehmen.
(c) Die Dichtefunktion der Zufallsvariablen X ist symmetrisch zur ersten Winkelhalbierenden.
(d) Keine der bisherigen Aussagen ist korrekt.
Dateipfad: mc/aufgabe1.tex
-4-
Klausur Statistik 1
Hamburg, 12.02.2013
Aufgabe 1.7 (3 Punkte)
Sie möchten einen Spezialfall der Ungleichung von Markow anwenden, nämlich
P (X ≥ ) ≤
E(X)
für eine nichtnegative Zufallsvariable X auf einem Wahrscheinlichkeitsraum (Ω, A , P ) mit
> 0. Für welche der nachfolgenden Aussagen erhalten Sie für obige Ungleichung eine
triviale Information?
(a) Für E(X) < V ar(X).
(b) Für 0 ≤ ≤ 1.
(c) Für E(X) ≥ .
(d) Keine der bisherigen Aussagen liefert eine triviale Information.
Aufgabe 1.8 (3 Punkte)
Welche der nachfolgenden Aussagen bzgl. des 50%-Quantils z0.5 ist korrekt?
(a) Das 50%-Quantil teilt einen gegebenen Datensatz niemals so auf, dass gleich viele
Merkmalsausprägungen kleiner bzw. größer als das 50%-Quantil sind.
(b) Das 50%-Quantil teilt einen gegebenen Datensatz immer so auf, dass gleich viele
Merkmalsausprägungen kleiner bzw. größer als das 50%-Quantil sind.
(c) Das 50%-Quantil kann einen gegebenen Datensatz nicht aufteilen.
(d) Keine der bisherigen Aussagen ist korrekt.
Aufgabe 1.9 (3 Punkte)
Gegeben sei die Menge Ω := {3, 7, 8}. Welche der nachfolgende gegebenen Mengen A ⊆
P(Ω) ist keine σ-Algebra?
(a) A := {∅, {3}, {7, 8}, Ω}.
(b) A := {∅, {3}, {7}, {8}, {3, 7}, {3, 8}, {7, 8}, Ω}.
(c) A := {∅, Ω}.
(d) Alle obigen Mengen erfüllen die Eigenschaften einer σ-Algebra.
Dateipfad: mc/aufgabe1.tex
-5-
Klausur Statistik 1
Hamburg, 12.02.2013
Aufgabe 1.10 (3 Punkte)
Gegeben sei nachfolgende Funktion:


0

für x < −1
g(x) := −x + 1 für − 1 ≤ x ≤ 0



1
für x > 0
2
Welche der nachfolgenden Aussagen ist korrekt?
(a) Die Funktion g ist eine Wahrscheinlichkeitsfunktion.
(b) Die Funktion g ist eine Dichtefunktion.
(c) Die Funktion g ist eine Verteilungsfunktion.
(d) Keine der bisherigen Aussagen ist korrekt.
Dateipfad: mc/aufgabe1.tex
-6-
Klausur Statistik 1
Hamburg, 12.02.2013
Aufgabe 2 (20 Punkte)
Hinweise:
• In den Aufgaben 2.1 bis 2.5 ist mindestens eine Antwortmöglichkeit korrekt.
• Markieren Sie die korrekte(n) Antwort(en) durch ein Kreuz bzw. mehrere Kreuze in
der „Lösungstabelle für die Aufgaben 1 und 2“ auf Seite 2.
Aufgabe 2.1 (4 Punkte)
Welche der nachfolgenden Antworten die Schiefe γ1,M bzw. die Wölbung γ2 betreffend sind
korrekt?
(a) Ist die Wölbung gegeben, so lässt sich daraus die Schiefe bestimmen.
(b) Ist die Schiefe gegeben, so lässt sich daraus die Wölbung bestimmen.
(c) Die Schiefe kann negative Werte annehmen, die Wölbung nicht.
(d) Die Wölbung kann negative Werte annehmen, die Schiefe nicht.
Aufgabe 2.2 (4 Punkte)
Welche der nachfolgenden Aussagen bzgl. des Gini-Koeffizienten G und normiertem GiniKoeffizient G∗ sind korrekt.
(a) Für einen gegebenen Datensatz gilt immer: G∗ < G.
(b) Für einen gegebenen Datensatz gilt immer: G∗ > G.
(c) Sind zwei Datensätze (xi )ni=1 und (yj )m
j=1 gegeben, so ist es möglich, dass Gx < Gy
und G∗x > G∗y gilt.
(d) Sind zwei Datensätze (xi )ni=1 und (yj )m
j=1 gegeben, so ist es möglich, dass Gx < Gy
und G∗x < G∗y gilt.
Aufgabe 2.3 (4 Punkte)
Gegeben sei ein Wahrscheinlichkeitsraum (Ω, A , P ) sowie drei Ereignisse A, B, C ∈ A .
Weiterhin sei bekannt, dass:
P (A) = 0.6
P (A | B) = 0.6
P (B) = 0.4
Welche der jeweils nachfolgend gemachten zusätzlichen Angaben führt zur paarweisen
Unabhängigkeit der drei Ereignisse A, B und C?
(a) P (C) = 0.2, P (A ∩ C) = 0.5, P (B ∩ C) = 0.5.
(b) P (C) = 0.6, P (A | C) = 0.6, P (B ∩ C) = 0.4.
(c) P (C) = 0.5, P (C | A) = 0.5, P (C | B) = 0.5.
(d) P (C) = 0.5, P (C | A) = 0.5, P (B | C) = 0.4.
Dateipfad: mc/aufgabe2.tex
-7-
Klausur Statistik 1
Hamburg, 12.02.2013
Aufgabe 2.4 (4 Punkte)
Gegeben sei die Funktion g mit:
g : R → {0, 1}

1
x 7→ 
für „Bedingung A“
0 für „Bedingung B“
Welche der nachfolgenden Aussagen sind korrekt?
(a) Aus
„Bedingung A“: x ∈ [−1, 0]
„Bedingung B“: sonst
folgt, dass g eine Dichtefunktion ist.
(b) Aus
„Bedingung A“: x ∈ {0, 1}
„Bedingung B“: sonst
folgt, dass g eine Wahrscheinlichkeitsfunktion ist.
(c) Aus
„Bedingung A“: x ≥ 5
„Bedingung B“: sonst
folgt, dass g eine Verteilungsfunktion ist.
(d) Aus
„Bedingung A“: x = 0
„Bedingung B“: x ∈ R\{0}
folgt, dass g eine Wahrscheinlichkeitsfunktion ist.
Aufgabe 2.5 (4 Punkte)
Betrachtet werden momenterzeugende Funktionen beliebiger Zufallsvariablen. Welche der
nachfolgenden Aussagen sind korrekt?
(a) Es gibt keine Zufallsvariable X, für die die momenterzeugende Funktion MX nicht
existiert.
(b) Die momenterzeugende Funktion MX einer Zufallsvariablen X existiert immer.
(c) Die momenterzeugende Funktion MX der Zufallsvariablen X erhält man, sofern sie
existiert, indem man den Erwartungswert der transformierten Zufallsvariablen etX
bestimmt.
(d) Die momenterzeugende Funktion MX der Zufallsvariablen X ist, sofern sie existiert,
eine Linearkombination aus E(X), E(X 2 ) und E(X 3 ).
Dateipfad: mc/aufgabe2.tex
-8-
Klausur Statistik 1
Hamburg, 12.02.2013
Aufgabe 3 (8 Punkte)
Für n = 115 Merkmalsausprägungen wurden Klassengrenzen x∗k , absolute Häufigkeiten nk
sowie Varianzen der jeweiligen Klasse s2k gemäß nachfolgender Tabelle ermittelt.
k
x∗k
nk
s2k
0
−100
1
50
15
900
2
150
30
1000
3
200
50
1200
4
300
20
1600
Man ermittle eine Schätzung für das gesamte arithmetische Mittel sowie eine Schätzung
für die Gesamtvarianz (Hinweis: Man verwende die Klassenmitten als Schätzung für die
arithmetischen Mittel der Klassen).
Lösung von Aufgabe 3
Man verwendet nachfolgende Arbeitstabelle:
k
x∗k
nk
s2k
1
(x∗k + x∗k−1 )
2
0
−100
1
2
50
150
15
30
900 1000
−25 100
3
200
50
1200
175
4
300
20
1600
250
Man berechnet:
K
1
1X
nk · x̄k =
(15 · (−25) + 30 · 100 + 50 · 175 + 20 · 250) = 142.3913043
x̄ ≈
n k=1
115
K
K
2
1X
1X
nk · s2k +
nk 12 (x∗k + x∗k−1 ) − x̄
n k=1
n k=1
1
· (15 · 900 + 30 · 1000 + 50 · 1200 + 20 · 1600)
=
115
1 +
· 15 · (−25 − 142.39)2 + . . . + 20 · (250 − 142.39)2
115
= 7777.977316
s2 ≈
Dateipfad: rechenaufg/aufgabe1.tex
-9-
Klausur Statistik 1
Hamburg, 12.02.2013
Aufgabe 4 (8 Punkte)
In einem Gebiet mit 100 Einwohnern beträgt das Gesamteinkommen 1000 GE (Geldeinheiten). 50% der Einwohner hat ein Gesamteinkommen von 400 GE. Weitere 20 Einwohner
haben ein Gesamteinkommen von 300 GE.
Geben Sie eine Tabelle an, aus der die Abszissenwerte sowie die Ordinatenwerte der zugehörigen Lorenzkurve hervorgehen (Lorenzkurve muss nicht gezeichnet werden). Berechnen
Sie den Gini-Koeffizienten sowie den normierten Gini-Koeffizienten.
Hinweis: Es sollen die Gini-Koeffizienten aller Einwohner unter der Annahme berechnet
werden, dass das Einkommen in der jeweiligen Bevölkerungsgruppe gleichmäßig verteilt
ist.
Lösung von Aufgabe 4
Man geht von nachfolgender Arbeitstabelle aus:
j
0
1
2
3
P
Bev.
Eink. Anteil Bev.
50
30
20
100
400
300
300
1000
Anteil Eink.
Eink./Bev.
0.4
0.3
0.3
1
8
10
15
0.5
0.3
0.2
1
uj
0
0.5
0.8
1
vj Steigung
0
0.4
0.8
0.7
1
1
1.5
Damit erhält man nachfolgende Lorenzkurve:
1
0.7
0.4
0
0
0.5
0.8
1
Für den Gini-Koeffizienten erhält man:
G=1−
n
X
(vj + vj−1 )(uj − uj−1 )
j=1
= 1 − [(0.4 + 0)(0.5 − 0) + (0.7 + 0.4)(0.8 − 0.5) + (1 + 0.7)(1 − 0.8)]
= 1 − 0.87 = 0.13
Dateipfad: rechenaufg/aufgabe2.tex
-10-
Klausur Statistik 1
Hamburg, 12.02.2013
Für den normierten Gini-Koeffizienten erhält man damit:
G∗ =
100
n
·G=
· 0.13 = 0.13
n−1
99
Dateipfad: rechenaufg/aufgabe2.tex
-11-
Klausur Statistik 1
Hamburg, 12.02.2013
Aufgabe 5 (10 Punkte)
Gegeben sei nachfolgende unvollständige Kontingenztabelle:
nk,l
y1
x1
10
P
y3
10
40
x2
P
y2
20
120
160
Tragen Sie die fehlenden Werte in die Tabelle ein und berechnen Sie daraus den χ2 Koeffizienten, sowie den Kontingenzkoeffizienten C und den normierten Kontingenzkoeffizienten C ∗ .
Lösung von Aufgabe 5
Ausgefüllte Tabelle und „Unabhängigkeitstabelle“ sind:
nk,l
x1
x2
P
y1
10
10
20
y2
80
40
120
P
y3
10 100
10 60
20 160
ñk,l
x1
x2
P
y1
12.5
7.5
20
y2
y3
75 12.5
45 7.5
120 20
P
100
60
160
Damit erhält man für den χ2 -Koeffizienten:
χ2 =
2 X
3
X
k=1 l=1
(nk,l − ñk,l )2
(10 − 12.5)2
(10 − 7.5)2
=
+ ... +
= 3.5 ≈ 3.5556
ñk,l
12.5
7.5
Für den Kontingenzkoeffizienten C bzw. den normierten Kontingenzkoeffizienten C ∗ erhält
man:
s
C=
C∗ = r
χ2
=
χ2 + n
C
min{K,L}−1
min{K,L}
Dateipfad: rechenaufg/aufgabe3.tex
s
3.5556
= 0.1474
3.5556 + 160
0.1474
= q
= 0.2085
2−1
2
-12-
Klausur Statistik 1
Hamburg, 12.02.2013
Aufgabe 6 (7 Punkte)
Gegeben sei nachfolgende Dichtefunktion der Zufallsvariablen X:

4x3
fX (x) := 
0
für 0 ≤ x ≤ 1
sonst
Berechnen Sie die ersten beiden nicht-zentrierten Momente (E(X) und E(X 2 )) der Zufallsvariablen X, sowie die Varianz von X (V ar(X)).
Lösung von Aufgabe 6
E(X) =
Z 1
x · 4x3 dx =
0
2
E(X ) =
Z 1
x2 · 4x3 dx =
0
V ar(X) = E(X 2 ) − E 2 (X) =
Dateipfad: rechenaufg/aufgabe4.tex
-13-
h
h
i1
4 5
x
5
0
i1
4 6
x
6
0
=
h
=
i1
2 6
x
3
0
2
2
4
−
3
5
4
5
=
=
2
3
2 16
2
−
=
3 25
75
Klausur Statistik 1
Hamburg, 12.02.2013
Aufgabe 7 (9 Punkte)
Es sei V ∼ N (7, 16), W ∼ χ2 (5), X ∼ t(6) und Y ∼ F (13, 4).
Geben Sie folgende Größen an:
(a) P (V ≥ 6)
(b) P (W ≤ 1.61)
(c) P (−2.447 < X ≤ 3.707)
(d) P (8.71 > Y > 0.25)
(e) 2.5%-Quantil der Zufallsvariablen V .
(f) 2.5%-Quantil der Zufallsvariablen Y .
Lösung von Aufgabe 7
Es ist (mit Z ∼ N (0, 1) und U ∼ F (4, 13)):
(a) P (V ≥ 6) = 1 − P (V < 6) = 1 − FV (6) = 1 − FZ
1 − (1 − FZ (0.25)) = FZ (0.25) = 0.5987
6−7
4
= 1 − FZ (−0.25) =
(b) P (W ≤ 1.61) = 0.1
(c) P (−2.447 < X ≤ 3.707) = FX (3.707)−FX (−2.447) = FX (3.707)−(1−FX (2.447)) =
0.995 + 0.975 − 1 = 0.97
(d) P (8.71 > Y > 0.25) = P (0.25 < Y < 8.71) = FY (8.71) − FY (0.25) = FY (8.71) −
(1 − FU (4)) = 0.975 − (1 − 0.975) = 0.95
(0,1)
(e) z0.025 = −1.96
(13,4)
(f) F0.025 =
1
(4,13)
F0.975
⇒
=
1
4.00
(7,16)
z0.025 = −1.96 · 4 + 7 = −0.84
= 0.25
Dateipfad: rechenaufg/aufgabe5.tex
-14-
Klausur Statistik 1
Hamburg, 12.02.2013
Aufgabe 8 (8 Punkte)
Für eine stetige Zufallsvariable X sei für t ∈ R die momenterzeugende Funktion MX
gegeben durch:
2
MX (t) = exp(t2 + t) = et +t
Berechnen Sie für die Zufallsvariable Y := 2X + 3 den Erwartungswert und die Varianz.
Lösung von Aufgabe 8
Es werden zwei Möglichkeiten aufgezeigt:
(a) Aus der momenterzeugenden Funktion MX erkennt man, dass es sich bei der Zufallsvariablen X um eine normalverteilte Zufallsvariable mit Parametern µX = 1
2
und σX
= 2 handelt. Daraus erhält man sofort, dass Y ebenfalls normalverteilt mit
Parametern µY = 2 · 1 + 3 = 5 und σY2 = 22 · 2 = 8. Damit ergibt sich: E(Y ) = 5
und V ar(Y ) = 8.
(b) Für die momenterzeugende Funktion von Y gilt:
2 +2t
MY (t) = e3t e(2t)
2 +2t
= e3t e4t
2 +5t
= e4t
Für die ersten beiden Ableitungen erhält man:
2 +5t
MY0 (t) = (8t + 5)e4t
2 +5t
MY00 (t) = 8e4t
2 +5t
+ (8t + 5)2 e4t
2 +5t
= e4t
8 + (8t + 5)2
Damit erhält man für die ersten beiden Momente:
E(Y ) = MY0 (0) = 5
E(Y 2 ) = MY00 (0) = 8 + 52 = 33
Die Varianz ist damit:
V ar(Y ) = E(Y 2 ) − E 2 (Y ) = 33 − 52 = 8
Dateipfad: rechenaufg/aufgabe6.tex
-15-
Herunterladen