Lösungsvorschlag zur Klausur vom 05.10.2007

Werbung
Eingangsprüfung Stochastik, 5. Oktober 2007
Wir gehen stets von einem Wahrscheinlichkeitsraum (Ω, A, P) aus.
Aufgabe 1 (6 Punkte)
Sind die folgenden auf [−1, 1] definierten Funktionen messbar? Begründen Sie
Ihre Antwort:
(
1
x≥0
(a) sgn(x) =
−1 x < 0.
(
sin x1
(b) f (x) =
0
x 6= 0
x = 0.
(c) sgn (f (x)).
Lösung
Zu (a)
Es gilt
sgn = (−1) · 1[−1,0) + 1[0,1] .
Also ist sgn eine Treppenfunktion und somit messbar.
Zu (b)

 1 x 6= 0
gilt
Für g(x) = x
0 x = 0

1


[−1,
0]
∪
,
∞


α

{g < α} =
(−∞,
0)


1



,0
α
α>0
α=0
α<0
d.h. für alle α ist {g < α} ein Intervall oder die Vereinigung zweier Intervalle.
Somit ist g messbar. Da stetige Funktionen messbar sind, ist sin messbar und
somit ist f = sin ◦g als Verkettung messbarer Funktionen messbar.
Zu (c)
Wegen (a) und (b) ist sgn ◦ f als Verkettung messbarer Funktionen messbar.
Aufgabe 2 (10 Punkte)
Gegeben sei eine eine Stichprobe x1 , x2 , . . . , xn , d.h. n unabhängige Realisierungen einer Zufallsvariablen X : Ω −→ R. Die xi , i = 1, . . . , n seien paarweise verschieden. Wir betrachten die empirische Verteilungsfunktion Fn : R −→ [0, 1],
n
Fn (x) :=
# {j = 1, . . . , n|xj ≤ x}
1X
.
1(−∞,x] (xj ) =
n j=1
n
Sei Y : Ω −→ R eine Zufallsvariable mit der Verteilungsfunktion Fn .
(a) Welche Werte nimmt Y mit welcher Wahrscheinlichkeit an? Begründen
Sie Ihre Antwort.
1
(b) Bestimmen Sie Erwartungswert und Varianz von Y .
(c) Bestimmen Sie für die messbare Funktion g : R −→ R
Z
g(x)dFn (x).
R
Lösung
Zu (a)
Es werden die Werte x1 , . . . , xn mit der Wahrscheinlichkeit
P(Y = xi ) = Fn (xi ) − Fn (xi − 0) =
1
angenommen:
n
1
1
(#{j|xj ≤ xi } − #{j|xj < xi }) = .
n
n
Zu (b)
E(Y )
=
n
X
xi P(Y = xi ) =
Var(Y )
=
i=1
n
xi
i=1
i=1
n
X
n
X
1
1X
=
xi = x
n
n i=1
n
(xi − x)2 P(Y = xi ) =
1X
(xi − x)2 .
n i=1
Zu (c)
Sei δxi das Dirac Maß. Wegen
δxi (−∞, x] = 1(−∞,x] (xi ),
folgt
n
Fn (x) =
1X
δx (−∞, x],
n i=1 i
Das durch Fn induzierte Maß ist also
messbar:
Z
Z
gd
g dFn (x) =
R
x∈R
R
n
1X
δx
n i=1 i
!
n
1 P
δx . Somit gilt für g : R −→ R
n i=1 i
n
(x) =
x ∈ R.
1X
n i=1
Z
R
n
g dδxi (x) =
1X
g(xi ).
n i=1
Aufgabe 3 (20 Punkte)
Sei B ⊂ R2 das Innere des Dreiecks mit den Ecken (0, 0), (0, 1) und (1, 1) und
f : R2 −→ R,
(
√1
(x, y) ∈ B
f (x, y) := 2 xy
0
sonst
die gemeinsame Dichte zweier Zufallsvariablen X, Y : Ω −→ R.
(a) Weisen Sie nach, dass f eine Dichte ist.
(b) Weisen Sie nach, dass fX : R −→ R, fY : R −→ R
(
( √
1−
√ x
x ∈ (0, 1)
1 y ∈ (0, 1)
x
,
fY (y) :=
fX (x) :=
0 sonst
0
sonst
die Dichten von X, Y sind.
2
(c) Bestimmen Sie die bedingten Dichten f (x|y) und f (y|x) und den bedingten Erwartungswert E(X|Y ).
(d) Sind X, Y unabhängig? Begründen Sie Ihre Antwort.
Lösung
Zu (a)
Z
f (x, y) dxdy
=
Z
=
Z
R2
1
0
0
1
1
1 √ √
y dx
x
x
0
x
1
√
√ 1
√ (1 − x) dx = 2 x − 1 = 1.
x
0
Z
1
1
√ dydx =
2 xy
Z
1
Zu (b)
Die Randdichten erhält man durch Integration
Z
fX (x) =
f (x, y) dy
ZR
f (x, y) dx.
fY (y) =
R
Für x ∈ (0, 1) bzw. y ∈ (0, 1) ergibt sich
Z 1
1
fX (x) =
√ dy =
2
xy
x
Z y
1
fY (y) =
√ dx =
0 2 xy
1
√
1 √ 1− x
√
y = √
x x
x
y
1 √ √ x = 1.
y
0
Für x 6∈ (0, 1) bzw. y 6∈ (0, 1) gilt fX (x) = fY (y) = 0.
Zu (c)
Für (x, y) ∈ B gilt
f (x|y) =
f (y|x) =
f (x, y)
1
= √
fY (y)
2 xy
√
f (x, y)
x
1
1
√ = √
√ .
= √ ·
fX (x)
2 xy 1 − x
2 y(1 − x)
Daraus folgt nun für y ∈ (0, 1)
Z
Z y
xf (x|y) dx =
E(X|Y = y) =
0
0
also
E(X|Y ) =
y
y
1 1 3/2 1
y
x √ dx = √ x =
2 xy
y3
3
0
Y
.
3
Zu (d)
Wären X, Y unabhängig, dann würde
√
1− x
1
fX (x)fY (y) = √
= √ = f (x, y) f.ü.
2 xy
x
3
gelten. Auf B gilt aber
√ 2
√
1 1+ x
1− x
1
√
= √ ⇐⇒ y =
2 xy
4
1−x
x
√ 2 x
also fX (·)fY (·) =
6 f auf B \ N mit N := (x, y) ∈ B|y = 4 1+
. N ist
1−x
Teilmenge eines Funktionsgraphen, also eine Nullmenge. Also sind X, Y nicht
unabhängig.
Aufgabe 4 (26 Punkte)
In n = 14 Jahren, wurden folgende Schadenhäufigkeiten (SH) pro Tausend versicherter Kfz und die mittlere Anzahl der gefahrenen Tausend Kilometer pro
Kfz bestimmt:
Nr.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
xi - Tkm
12,154
13,877
14,150
13,355
13,280
13,244
13,163
13,118
13,217
13,378
13,060
12,989
13,016
12,939
yi - SH
109
105
103
98
94
91
86 ,
83
83
85
78
75
72
69
P
P 2
xi yi = 16279, 39.
x2i = 2445, 75,
yi = 110289, x = 13, 21, y = 87, 93,
Unterstellt wird folgender Zusammenhang zwischen den gefahrenen Kilometern
x und der Zufallsvariablen Schadenhäufigkeit Y :
P
Yi = axi + εi ,
i = 1, . . . , 14
wobei εi ∼ N (0, σ 2 ) und unabhängig sind und σ 2 bekannt sei.
(a) Bestimmen Sie Erwartungswert und Varianz von Yi .
(b) Sei
n
P
Yi xi
.
 := i=1
n
P
x2i
i=1
Weisen Sie nach, dass  ∼ N
σ2
a, P 2
xi
gilt.
(c) Weisen Sie nach, dass  ein ML-Schätzer für a ist.
(d) Bestimmen Sie mit obigen Werten einen Schätzwert für a.
4
(e) Bestimmen Sie mit σ = 12 aus den obigen Daten ein 95 % - Konfidenzintervall für a.
Hinweis: Man zeige P(a ∈ [Â − δ, Â + δ]) = P(Â ∈ [a − δ, a + δ])
Lösung
Zu (a)
E(Yi )
Var(Yi )
= E(axi + εi ) = axi + E(εi ) = axi ,
=
Var(axi + εi ) = Var(εi ) = σ 2 .
Zu (b)
Es gilt Yi ∼ N (axi , σ 2 ), da Yi Summe einer normalverteilten Zufallsvariablen
und einer Konstanten ist. Somit ist  normalverteilt, da  eine Linearkombination normalverteilter Zufallsvariablen ist.

P
n
Yx
n
n
X
 i=1 i i 
1 X 2
= 1
E(Y
)x
=
axi = a.
E(Â) = E 
i
i
n
n
n

 P
P
P
x2i
x2i i=1
x2i i=1
i=1
i=1
i=1
Da die εi unabhängig sind, trifft dies auch auf die Yi xi zu, und es folgt
n

P
n
n
n
P
P
P
Var (Yi xi )
x2i σ 2
Yi xi
Var
Yi xi

 i=1
i=1
i=1
i=1


=
Var(Â) = Var  P
2 = n
2
n
 = P
n
n
P 2 2
P
2
2
x2i
x
x
x
i=1
=
i
i=1
i=1
i
σ2
.
n
P
x2i
i=1
i
i=1
Zu (c)
Da die εi unabhängig sind, trifft dies auch auf die Yi zu. Dann ist die Likelihood
L durch
2 !
n
Y
1 yi − axi
1
√
exp −
L(a) =
2
σ
2πσ 2
i=1
gegeben. Es folgt:
ℓ(a)
:=
ℓ′ (a)
=
ℓ′′ (a)
=
ln L(a) = −
n
n
1 X
2
ln(2πσ 2 ) − 2
(yi − axi )
2
2σ i=1
n
1 X
xi (yi − axi )
σ 2 i=1
−
n
1 X 2
x < 0.
σ 2 i=1 i
ℓ′ besitzt also in
â =
n
P
yi xi
i=1
n
P
i=1
5
x2i
ein globales Maximum.
Zu (d)
â =
16279, 39
= 6, 656.
2445, 75
Zu (e)
Der Hinweis folgt so:
P(a ∈ [Â − δ, Â + δ])
= P(Â − δ ≤ a ≤ Â + δ)
= P(−a − δ ≤ −Â ≤ −a + δ)
= P(a − δ ≤ Â ≤ a + δ)
= P(Â ∈ [a − δ, a + δ)
Gesucht ist ein δ > 0 mit
= P Â ∈ [a − δ, a + δ] .
0, 95

Es gilt wegen  ∼ N a,
σ
n
P
2
i=1
P Â ∈ [a − δ, a + δ]
x2i


= P Â ≤ a + δ − P Â ≤ a − δ
 s

s
n
n
P
P
2
xi 
x2i




 i=1
i=1

δ
= Φ
 − Φ −

σ
σ



=
Somit reicht es
n
P 2 1/2
xi
i=1
σ
s


2Φ 


n
P
i=1
x2i
σ

σ
n
P
i=1
[6, 180, 7, 132].
6


δ




δ
 − 1.

δ = u0,975 = 1, 96 =⇒ δ = 1, 96 · zu wählen, es ergibt sich das Intervall

x2i
1/2 = 0, 476
Herunterladen