Aufgabe 1 (2 + 4 + 2 + 1 Punkte) Gegeben sei folgende

Werbung
Aufgabe 1
(2 + 4 + 2 + 1 Punkte)
Gegeben sei folgende zweidimensionale Wahrscheinlichkeitsdichtefunktion zweier Zufallsvariablen X und Y :
2x + 23 y für − 0.5 ≤ x ≤ 0.5, 1 ≤ y ≤ 2
f (x, y) =
0
sonst.
a) Berechnen Sie die Randdichte f (y).
R 0.5
0.5
= 23 y
f (y) = −0.5 f (x, y) dx = [x2 + 23 xy]−0.5
b) Berechnen Sie die Varianz von Y .
R2
E(Y ) = 1 y 23 y dy = [ 29 y 3 ]21 = 1.56
R2
E(Y 2 ) = 1 y 2 32 y dy = [ 16 y 4 ]21 = 2.5
var(Y ) = 2.5 − 1.562 = 0.066
c) Leiten Sie die bedingte Dichtefunktion f (x|Y = y) her.
f (x|Y = y) =
f (x,y)
f (x)
=
2x+ 32 y
2
y
3
= 3 xy + 1
d) Sind X und Y stochastisch unabhängig?
X und Y sind stochastisch abhänging, da die Unabhängikeitsbedingung
f (x, y) = f (x) · f (y) nicht erfüllt werden kann.
Aufgabe 2
(6 Punkte)
Ein Unternehmen befüllt Päckchen mit Zucker. Das Gewicht X der Päckchen habe Mittelwert
2
µX und Varianz σX
. Um die mittlere Füllmenge zu überprüfen, sieht die Arbeitsanweisung vor,
dass regelmäßig Stichproben vom Umfang n entnommen werden und das Gewicht X gemessen
wird. Hiermit sind die Mitarbeiter A und B beauftragt.
• Mitarbeiter A entnimmt nach Vorschrift eine Stichprobe der Länge n, misst das Gewicht
X und gibt den Mittelwert seiner Beobachtungen weiter.
• Mitarbeiter B entnimmt nur die Hälfte der vorgeschriebenen Stichprobe, notiert dann
allerdings jeden der gemessenen Werte zweimal, so dass seine Vorgesetzten nicht merken,
dass er zu wenig Päckchen gemessen hat. Anschließend gibt er den Mittelwert seiner
Beobachtungen weiter.
a) Berechnen Sie die Erwartungswerte der geschätzten Mittelwerte der Mitarbeiter A und
B.
P
P
E(Â) = E( n1 ni=1 Xi = n1 ni=1 E(Xi ) = n1 n µX = µX
P
Pn/2
1
1
E B̂) = E( n1 n/2
i=1 2 · Xi = n
i=1 2 · E(Xi ) = n 2 · n/2 µX = µX
b) Berechnen Sie die Varianzen der geschätzten Mittelwerte der Mitarbeiter A und B.
P
var(Â) = var( n1 ni=1 Xi ) = n12 n var(X) = n1 σ 2
P
Pn/2
1
4 n
2 2
var(B̂) = var( n1 n/2
i=1 2 · Xi ) = n2
i=1 var 2Xi = n2 2 var(X) = n σ
c) Sind die geschätzten Mittelwerte konsistent? (Begründung!)
Sowohl  als auch B̂ sind erwartungstreu. Ebenfalls geht bei beiden
Schätzern die Varianz für n → ∞ gegen 0. Somit sind Sie konsistent.
Aufgabe 3
(5 + 2 + 1 Punkte)
Betrachten Sie die Zufallsvariable X mit folgender Dichtefunktion, c ∈ R:
1 −1 x
e c
x≥0
c
f (x) =
0
sonst.
Außerdem ist E(X) = c. Gegeben sei nun eine stochastisch unabhängig, identisch verteilte
Stichprobe aus der Verteilung von X vom Umfang n.
a) Zeigen Sie, dass für den Maximum-Likelihood-Schätzer von c gilt:
n
1X
xi
ĉ =
n i=1
Q
1
L = ni=1 1c e− c xi
P
P
1 − 1c xi
ln L = ni=1 ln(
) = −n ln c − 1c ni=1 xi
e
Pc
d ln L
n
= −P
+ c2xi = 0
dc
c
⇒ c = n1 ni=1 xi
b) Zeigen Sie die Erwartungstreue von ĉ.
P
P
E(ĉ) = E( n1 ni=1 Xi ) = n1 ni=1 E(Xi ) =
1
n
nc = c
c) Bekanntlich sind Maximum-Likelihood-Schätzer asymptotisch erwartungstreu. Erläutern
Sie kurz diese Eigenschaft.
Für unendlich große Stichprobenumfänge ist der Erwartungswert des
Schätzers der wahre Parameter.
Aufgabe 4
(1 + 6 + 2 Punkte)
Bei einem Kaufhaus werden an einem Samstag minütlich die Kunden gezählt, die das Kaufhaus
betreten. Dadurch erhält man eine Stichprobe des Umfangs n. Gehen sie im Folgenden davon
aus, dass n als sehr groß betrachtet werden kann. Als mittlere minütliche Kundenanzahl wird
am Ende des Tages x̄ = 7 ermittelt.
a) Bestimmen Sie den Stichprobenumfang n bei einer Öffnungszeit von 9 Uhr bis 20 Uhr.
11 Stunden a 60 Minuten, d.h. n = 660
b) Bestimmen Sie das Konfidenzintervall zu α = 0.1 der minütlichen Kundenanzahl unter
der Annahme, dass die Kundenanzahl pro Minute poissonverteilt ist.
z0.95 = 1.65, damit
"
√ #
√
7
7
; 7 + 1.65 · √
= [6.83, 7.17]
7 − 1.65 · √
660
660
c) Wie könnten Sie ein Konfidenzintervall erstellen, wenn Sie nur n = 10 Beobachtungen
hätten? (Nur Idee, keine Rechnung)
Berechnung des KI über Tschebycheff.
Aufgabe 5
(6 + 2 + 2 Punkte)
Bei einer Untersuchung wurde die Bearbeitungszeit einer Statistikaufgabe bei n = 14 Studierenden gemessen. Gehen Sie davon aus, dass die Bearbeitungszeiten stochastisch unabhängig
und identisch normalverteilt sind. Es ergaben
ein Mittelwert von x̄ = 42 Minuten und eine
q sich
P14
1
∗
gemessene Standardabweichung von s = 13 i=1 (xi − x̄)2 = 7 Minuten.
a) Bestimmen Sie das Konfidenzintervall zu α = 0.1.
−1
T13
(0.95) = 1.771 und damit
7
7
I := 42 − 1.771 ∗ √ ; 42 + 1.65 ∗ √
= [38.687; 45.3132]
14
14
b) Wie ändert sich (bei ansonsten unveränderten Bedingungen) obiges Konfidenzintervall,
falls
1) nur bei 10 Studierenden die Bearbeitungszeit gemessen wird?
Das KI wird breiter.
2) die Standardabweichung 14 Minuten beträgt?
Das KI wird breiter (doppelt so breit).
(Nur Begründung, keine Rechnung)
c) Entscheiden Sie anhand des in a) berechneten Konfidenzintervalls über folgende Hypothese zum Niveau α = 0.1:
H0 : µ = 40
gegen
H1 : µ 6= 40
Beibehaltung der Nullhypothese, da 40 ∈ I.
Aufgabe 6
(4 + 4 Punkte)
Ein Schraubenhersteller behauptet, dass seine Maschine Schrauben der Länge 20mm und
Varianz 0.3mm2 produziert. Eine stochastisch unabhägig, identisch verteilte Stichprobe der
Länge n = 9 ergab:
9
x̄ = 19.85
s
2∗
1X
(xi − x̄)2 = 0.42mm2
=
8 i=1
Gehen Sie im Folgenden davon aus, dass die Schraubenlänge normalverteilt ist.
a) Testen Sie mit der Fehlerwahrscheinlichkeit α = 0.01 die folgende Hypothese:
H0 : σ 2 ≤ 0.3
T =
(n−1)s2
= 8·0.42
0.3
σ02
(χ2 )−1
(1
−
α)
n−1
gegen
H1 : σ 2 > 0.3.
= 11.2
k=
= (χ2 )−1
8 = 20.1
Die Nullhypothese kann mit α = 0.01 nicht abgelehnt werden.
b) Testen Sie mit der Fehlerwahrscheinlichkeit α = 0.01 die folgende Hypothese:
H1 : µ = 20
gegen
µ 6= 20.
√ 19.85−20
√
0
|
=
|
9 √0.42 | = | − 0.694| = 0.694
T = | n x̄−µ
s
−1
k = Tn−1
(1 − α/2) = T8−1 (0.995) = 3.36
Die Nullhypothese kann mit α = 0.01 nicht abgelehnt werden.
Aufgabe 7
(7 Punkte)
Es soll der Zusammenhang zwischen der Wahl eines Fahrzeugtyps und der Anzahl an Strafmandaten, die vom jeweiligen Fahrer innerhalb eines Jahres “eingefahren” hat, untersucht werden.
Eine Stichprobe von 100 Fahrzeughaltern, die über ein Jahr lang beobachtet wurden, ergab
folgende Ergebnisse:
Strafmandate
höchstens 1
2 oder 3
mehr als 3
Kleinwagen
30
20
10
Mittelklasse
0
10
20
Luxusklasse
0
0
10
Testen Sie mit einer Fehlerwahrscheinlichkeit α = 0.1 folgendes Hypothesenpaar:
H0 : Fahrzeugtyp und Anzahl an Strafmandaten sind stochastisch unabhängig.
gegen
H1 : Fahrzeugtyp und Anzahl an Strafmandaten sind stochastisch abhängig.
Damit die Regel np̂i· p̂·j > 5 erfüllt ist, müssen Mittel- und Luxusklasse zusammengelegt
werden.
Pk P
2
2
2
(nij −np̂i· p̂·j )2
2
χemp = i=1 m
= (30−100·0.3·0.6)
+ (0−100·0.3·0.4)
+ . . . + (30−100·0.4·0.4)
=
j=1
p̂i· p̂·j
100·0.3·0.6
100·0.3·0.4
100·0.4·0.4
8 + 12 + 0.22 + 0.33 + 8.17 + 12.25 = 40.97
2 −1
k = (χ2 )−1
(k−1)(l−1) (1 − α) = (χ )(3−1)·(2−1) (0.9) = 4.6052
Die Nullhypothese kann mit α = 0.1 abgelehnt werden.
Aufgabe 8
(3 + 2 + 2 + 5 + 1 Punkte)
Es soll untersucht werden, ob ein linearer Zusammenhang zwischen dem Alter (X) und dem
Einkommen (Y ) einer Person besteht. Hierfür stehen folgende Daten zur Verfügung:
Student i
Alter (xi )
Einkommen (in Tausend Euro) (yi )
1 2 3
35 23 29
38 22 31
4
49
54
5
38
39
P
174
184
Daraus werden folgende Statistiken berechnet:
5
X
x2i = 6440,
i=1
5
X
yi2 = 7326,
i=1
5
X
xi yi = 6863.
i=1
Unterstellen Sie das lineare Regressionsmodell:
Yi = a + bxi + Ui
mit unabhängig normalverteilten Zufallsvariablen Ui mit Erwartungswert E(Ui ) = 0 und Varianz σU2 .
a) Zeigen Sie, dass für obigen Datensatz gilt: â = −4.78 und b̂ = 1.195.
x̄ = 34.8 x¯2 = 1288 s2x = 1288 − 34.82 = 76.96
ȳ = 36.8 y¯2 = 1465 s2y = 1465 − 36.82 = 110.76
xy
¯ = 1372.6 sxy = 1372.6 − 34.8 · 36.8 = 91.96
92.4
b̂ = ssxy2 = 76.96
= 1.1949
x
â = ȳ − b̂x̄ = 36.8 − 1.195 · 34.8 = −4.78
b) Interpretieren Sie â und b̂ am Sachverhalt.
Ein Alter von 0 Jahren würde ein Einkommen von -4.78. Für jedes Jahr,
dass man älter wird, steigt das Einkommen um 1.195 an.
c) Bestimmen Sie die geschätzte Residuenvarianz σ̂U2 .
σ̂ 2 =
n
(s2
n−2 y
− b̂sxy ) = 53 (110.76 − 1.195 · 91.496) = 1.78
d) Testen Sie mit einer Fehlerwahrscheinlichkeit von α = 0.05, ob das Alter einen signifikanten Einfluss auf das Einkommen hat.
Hypothesen: H0 : b = 0
σ̂ 2
1.78
σ̂b2 = ns
2 = 5·76.96 = 0.00463
gegen
H1 : b 6= 0
x
0
Teststatistik: b̂−b
= √1.195−0
= 17.57
σ̂b
0.00463
−1
Kritische Schranke k: Tn−2 (1 − α/2) = T3−1 (0.975) = 3.18
Testentscheidung: H0 kann mit α = 0.05 abgelehnt werden, da 17.57 > 3.18.
e) Welches Einkommen wird nach diesem Modell eine Person erzielen, die 32 Jahre alt ist?
y(32) = −4.78 + 1.195 · 32 = 33.46
Zugehörige Unterlagen
Herunterladen