Lösungsvorschlag zur Klausur vom 07.05.2016

Werbung
Zulassungsprüfung Stochastik, 07.05.16
Wir gehen stets von einem Maßraum (Ω, A, µ) bzw. einem Wahrscheinlichkeitsraum (Ω, A, P ) aus. Die Borel σ-Algebra auf Rn wird mit B n bezeichnet, das
Lebesgue-Maß auf Rn wird mit λn bezeichnet.
Sollten Ihnen in Teilaufgaben Ergebnisse fehlen, dann treffen Sie eine plausible
Annahme dafür.
Aufgabe 1 (12 Punkte)
Sei X : Ω −→ [0, ∞) eine Zufallsvariable. Zeigen Sie
Z
X dP ≥ 0.
Ω
Hinweis: Beweisen Sie diese Ungleichung zuerst für Treppenfunktionen.
Aufgabe 2 (30 Punkte)
(a) Sei k ∈ N, X ∼ Γ(α, λ) mit α > k. Beweisen Sie, dass
λk
1
=
E
k
X
(α − 1) . . . (α − k)
gilt.
Für die Gamma-Funktion Γ : (0, ∞) → (0, ∞) mit Γ(x) :=
gilt die Identität Γ(x) = (x − 1) . . . (x − k)Γ(x − k), x > k.
R∞
0
tx−1 e−t dt
(b) Gegeben seien X1 , . . . , Xn ∼ Exp(λ) unabhängig mit n ≥ 3 und unbekanntem λ > 0. Der Mittelwert der Xi wird mit
n
X :=
bezeichnet. Zeigen Sie, dass λ̂ =
λ ist.
1X
Xi
n i=1
1
ein Maximum Likelihood Schätzer für
X
(c) Seien X1 , . . . , Xn und X wie in (b).
(i) Begründen Sie X ∼ Γ(n, nλ).
Hinweis: Verwenden Sie die Eigenschaften der Gammaverteilung in
der Formelsammlung!
(ii) Bestimmen Sie Erwartungswert
und Varianz des Schätzers λ̂ aus (b).
2
nλ
n
λ2
· n−2
n−1 und
n−1
(iii) Geben Sie eine erwartungstreue Modifikation λ∗ des Schätzers λ̂ an
und bestimmen Sie Var(λ∗ ).
(iv) Für welchen Schätzer λ̂, λ∗ würden Sie sich entscheiden? Begründen
Sie Ihre Antwort mit dem mittleren quadratischen Fehler.
Für einen Schätzer T von λ ist der mittlere quadratische Fehler gegeben durch mse(T ) = E((T − λ)2 ) = (E(T ) − λ)2 + Var(T ).
1
Aufgabe 3 (12 Punkte)
Seien X, Y Zufallsvariablen mit E(X), Var(X) ∈ R. Die Zufallsvariablen A, B
seien σ(Y ) messbar, d.h. es gibt messbare Funktionen f, g : R −→ R mit A =
f (Y ) und B = g(Y ). Beweisen Sie
E(AX + B|Y ) = AE(X|Y ) + B,
Var(AX + B|Y ) = A2 Var(X|Y ).
Aufgabe 4 (36 Punkte)
Max fährt täglich um 07:30 in die Hochschule, Vorlesungsbeginn ist 08:00. Die
Anfahrtzeit T in Minuten sei normalverteilt.
(a) Es gelte T ∼ N (25, 16).
(i) Bestimmen Sie die Wahrscheinlichkeit, dass er zwischen 07:45 und
08:05 ankommt.
(ii) Wie groß ist die Wahrscheinlichkeit des Zuspätkommens?
(iii) An wievielen Vorlesungstagen im Jahr (150 Tage pro Jahr) wird er
im Mittel zu spät kommen?
(iv) Welchen Abfahrtszeitpunkt (minutengenau) schlagen Sie vor, damit
Max bei unveränderter Anfahrtszeit T im Mittel an höchstens 2 Tagen im Jahr zu spät kommt?
(b) Max will weiterhin erst um 07:30 starten und probiert eine neue Route.
Die Anfahrtzeit sei weiter normalverteilt. An 10 Tagen kommt er im Mittel
um 07:50 an, die empirische Varianz beträgt 12,25.
(i) Max vermutet, dass sich seine Anfahrtzeit verkürzt hat. Überprüfen Sie anhand einer geeigneten Nullhypothese seine Vermutung zum
Niveau von 5 %.
(ii) Geben Sie für den Erwartungswert der Anfahrtzeit ein Konfidenzintervall zum Niveau 5 % an.
(c) Kommentieren Sie Normalverteilungsannahme.
2
Lösungsvorschläge
AufgabeP1 [12]
n
Sei X = i=1 αi 1Ai , αi ≥ 0, Ai ∈ A, i = 1, . . . , n eine Treppenfunktion. Dann
gilt
Z
n
X
αi P (Ai )
X dP =
Ω
i=1
R
und damit Ω X dP ≥ 0.
Sei nun X ≥ 0 beliebig. Dann gibt es eine monoton wachsende Folge (Xn )n∈N
von Treppenfunktionen mit Xn ≥ 0 und limn→∞ Xn = X. Es gilt mit dem Satz
von der monotonen Konvergenz
Z
Z
Xn dP,
X dP = lim
Ω
n→∞
und aus dem vorher Gezeigten folgt nun
R
Ω
Ω
X dP ≥ 0.
Aufgabe 2 [a) 5 b) 7 c) 3+5+5+5]
Zu (a)
Es gilt
Z ∞
λα α−1 −λx
1
x−k
=
x
e
dx
E
k
X
Γ(α)
0
Z
λα Γ(α − k) ∞ λα−k
=
xα−k−1 e−λx dx
Γ(α) λα−k
Γ(α
−
k)
{z
}
|0
=1
λk
λk Γ(α − k)
=
.
=
Γ(α)
(α − 1) . . . (α − k)
Die Gleichung in der zweiten Zeile folgt, da der Intergrand die Dichte der
Γ(α−k, λ)-Verteilung ist. In der letzten Gleichung wurde der Hinweis verwendet.
Zu (b)
Aufgrund der Unabhängigkeit der Xi , i = 1, . . . , n gilt für die LikelihoodFunktion
!
n
X
xi , x1 , . . . , xn > 0.
L(λ; x1 , . . . , xn ) = λe−λx1 · . . . · λe−λxn = λn exp −λ
i=1
Für die Loglikelihood-Funktion ℓ mit ℓ(λ) := ln(L(λ)) ergibt sich
ℓ(λ)
:=
ln L(λ) = ln(λn ) − λ
n
ℓ′ (λ)
=
ℓ′′ (λ)
=
n X
xi
−
λ i=1
n
− 2 <0
λ
3
n
X
i=1
xi = n ln(λ) − λ
n
X
i=1
xi
n
ein Maximum der Likelihoodfunktion vor. Damit ist
und somit liegt in P
n
xi
i=1
n
1
ein Maximum Likelihood Schätzer.
die Zufallsvariable λ̂ = P
=
n
X
Xi
i=1
Zu (c)
Pn
(i) Es gilt Xi ∼ Γ(1, λ) = Exp(λ). Da die Xi unabhängig sind, gilt k=1 Xi ∼
1 Pn
Γ(n, λ) und somit
Xi ∼ Γ(n, nλ).
n k=1
(ii) Mit (a) und (i) gilt
1
nλ
E(λ̂) = E
=
n−1
X
n2 λ2
1
2
=
E(λ̂ ) = E
2
X (n − 1)(n − 2)
n2 λ2
n2 λ2
1
=
−
Var(λ̂) = Var
(n − 1)(n − 2) (n − 1)2
X
n−1−n+2
= n2 λ2 ·
(n − 1)2 (n − 2)
2
λ2
n
n2 λ2
·
=
=
(n − 1)2 (n − 2)
n−1
n−2
(iii) Wegen (ii) ist λ̂ nicht erwartungstreu. Dagegen ist offenbar
λ∗ =
n−1
n−1
λ̂ =
n
nX
ein erwartungstreuer Schätzer von λ. Es gilt
Var(λ∗ ) =
(n − 1)2
(n − 1)2
n2 λ2
λ2
Var(λ̂) =
·
=
.
2
2
2
n
n
(n − 1) (n − 2)
n−2
(iv) Vergleicht man (ii) und (iii) ergibt sich Var(λ̂) > Var(λ∗ ). Da λ̂ nicht
erwartungstreu ist, während λ∗ erwartungstreu ist, gilt
mse(λ̂) = (E(λ̂) − λ)2 +Var(λ̂) > Var(λ̂) > Var(λ∗ ) = (E(λ∗ ) − λ)2 + Var(λ∗ )
|
{z
}
>0
= mse(λ∗ ).
λ∗ weist einen kleineren mse auf als λ̂, somit wird man λ∗ den Vorzug geben.
Aufgabe 3 [12]
Es gilt
E(AX + B|Y ) = E(AX|Y ) + E(B|Y ) = AE(X|Y ) + BE(1|Y )
= AE(X|Y ) + B.
Die erste Gleichheit gilt wegen der Linearität der bedingten Erwartung, die
zweite, da A, B jeweils σ(Y )-messbar sind.
4
Mit der gleichen Argumentation erhalten wir
Var(AX + B|Y )
= E((AX + B)2 |Y )) − (E(AX + B|Y ))
2
= E(A2 X 2 + 2ABX + B 2 |Y ) − (AE(X|Y ) + B)
2
= E(A2 X 2 |Y ) + E(2ABX|Y ) + E(B 2 |Y ) − A2 E(X|Y )2 + 2ABE(X|Y ) + B 2
= A2 E(X 2 |Y ) + 2ABE(X|Y ) + B 2 − A2 E(X|Y )2 − 2ABE(X|Y ) − B 2
= A2 E(X 2 |Y ) − A2 E(X|Y )2
= A2 (E(X 2 |Y ) − E(X|Y )2 )
= A2 Var(X|Y ).
Aufgabe 4 [a) 5+3+5+9=22, b) 5+5=10, c) 4]
Zu (a)
(i) Ankunftszeit liegt zwischen 07:45 und 08:00 genau dann wenn T ∈ [15, 30]
gilt.
30 − 25
15 − 25
P (15 ≤ T ≤ 30) = P (T ≤ 30) − P (T ≤ 15) = Φ
−Φ
4
4
= Φ (1, 25) − Φ (−1, 52) = 0, 9938 − (1 − 0, 9938) = 0, 9876.
(ii) Max verspätet sich genau dann wenn T > 30 gilt.
P (T > 30) = 1 − P (T ≤ 30) = 1 − Φ (1, 25) = 0, 1056.
(iii) Bezeichnet man mit N die Anzahl der Tage, an denen sich Max verspätet,
und setzt man p := 0, 1056, dann gilt nach (ii) N ∼ B(150, p) und damit
E(N ) = 150p = 15, 84.
Im Mittel kommt Max an 16 Tagen im Jahr zu spät.
(iv) Die Wahrscheinlichkeit q, dass Max sich verspätet, soll so bestimmt werden,
1
dass 150q ≤ 2 gilt, also q ≤
. Sei t0 die Reisezeit, die mit einer Wahrschein75
1
überschritten wird, also
lichkeit von maximal
75
P (T > t0 ) =
1
.
75
Wegen
P (T > t0 ) = 1 − P (T ≤ t0 ) = 1 − Φ
ergibt sich zunächst
Φ
und damit (näherungsweise)
t0 − 25
4
=
t0 − 25
4
74
≈ 0, 9867
75
t0 = 25 + 4u0, 74
≈ 25 + 4 · 2, 23 = 33, 92 ≈ 34.
75
5
Max sollte also um 07:26 starten.
Zu (b)
(i) Zu testen ist die Nullhypothese H0 : µ ≤ µ0 mit µ0 := 25. Es handelt sich
um einen einseitigen t-Test, Testgröße ist
T =
x − µ0 √
n
s
und besitzt bei den vorliegenden Daten den Wert
20 − 25 √
10 = −4, 52.
3, 5
Die Hypothese wird im Fall T > t9;0,95 = 1, 833 abgelehnt. Also wird H0 nicht
verworfen.
√
(ii) Das Schätzintervall lautet mit t9;0,975 = 2, 262, s = 12, 25 = 3, 5:
s · t9;0,975
s · t9;0,975
= [17, 5; 22, 5] .
,x + √
x− √
10
10
Zu (c)
Unter der Annahme der Normalverteilung gilt P (T < 0) > 0. Die Annahme der
Normalverteilung kann daher nur näherungsweise erfüllt sein.
6
Herunterladen