4 Punkte - Ruhr-Universität Bochum

Werbung
Prof. Dr. Holger Dette
Dr. Melanie Birke
Sommersemester 2009
Blatt 5
Musterlösung Statistik I
Aufgabe 1:
(4 Punkte)
Sei X eine Poisson(λ)–verteilte Zufallsvariable mit λ > 0, und die Verlustfunktion L sei definiert durch
2
L(λ̃, λ) = (λ̃−λ)
1+λ2 .
(a) Man betrachte den linearen Schätzer λ̂(x) = a + bx für a, b ≥ 0 und bestimmen dessen Risiko
Ra,b (λ) zur Verlustfunktion L.
(b) Man zeige folgende Äquivalenz:
lim Ra,b (λ) = 0 ⇔ b = 1.
λ→∞
(c) Man zeichne die Risikofunktion zu folgenden Schätzern:
√
x + 0.5
√ ; λ̂3 (x) = 2x; λ̂4 (x) = 0; λ̂5 (x) = 1.
λ̂1 (x) = x; λ̂2 (x) =
1 + 0.5
Lösung: (a) Es sei λ̂(x) = a + bx, a, b ≥ 0. Dann gilt
L(λ̂(x), λ)
=
b2 x2 + 2b(a − λ)x + (a − λ)2
(a + bx − λ)2
=
1 + λ2
1 + λ2
und für das Risiko erhalten wir
Ra,b (λ)
=
Eλ [L(λ̂(X), λ)] = Eλ
b2 X 2 + 2b(a − λ)X + (a − λ)2
1 + λ2
1
(b2 Eλ [X 2 ] + 2b(a − λ)Eλ [X] + (a − λ)2 )
1 + λ2
Linearität
=
Eλ [X]=λ
Eλ [X 2 ]=λ(1−λ)
=
1
(b2 λ(1 − λ) + 2b(a − λ)λ + (a − λ)2 )
1 + λ2
(b) Es ist
2
Ra,b (λ)
=
b2 − 2b + 1 + bλ + 2ab
λ +
1
1 + λ2
a2
λ2
−
2a
λ
und
lim Ra,b (λ)
λ→∞
=
(b − 1)2 .
Damit sieht man leicht, dass der Grenzwert 0 ist genau dann, wenn b = 1 gilt.
(c) Die Risikofunktionen zu den 5 Schätzern sind
R1 (λ)
=
R4 (λ)
=
λ
λ(4 + λ)
0.5
√
, R3 (λ) =
, R2 (λ) =
2
1 + λ2
1 + λ2
(1 + 0.5)
2
2
λ
(1 − λ)
, R5 (λ) =
.
2
1+λ
1 + λ2
3
2.5
R3
R4
R5
R2
R1
2
1.5
1
0.5
1
2
3
4
5
6
7
(blau)
(gelb)
(hellblau)
(grün)
(rot)
Aufgabe 2:
(4 Punkte)
2
Seien X1 , . . . , Xn , Y1 , . . . , Ym unabhängige Zufallsvariablen mit Xi ∼ N (µ1 , σ ) (1 ≤ i ≤ n) und Yi ∼
N (µ2 , σ 2 ) (1 ≤ i ≤ m) für unbekannte Parameter µ1 , µ2 , σ 2 .
(a) Man bestimme den Maximum Likelihood Schätzer für θ = (µ1 , µ2 , σ 2 ).
(b) Man zeige, dass für jedes α ∈ [0, 1]
2
Sα2 := αSX
+ (1 − α)SY2 ,
Pn
1
2
2
2
wobei SX
und X̄ durch SX
:= n−1
i=1 (Xi − X̄) und X̄ =
m) definiert sind, ein erwartungstreuer Schätzer für σ 2 ist.
1
n
Pn
i=1
Xi (SY2 , Ȳ entsprechend für
(c) Man berechne das Riskio von Sα2 für α ∈ [0, 1].
(d) Man zeige, dass der Schätzer S 2 := Sα2 ′ mit α′ :=
in {Sα2 : α ∈ [0, 1]} hat.
n−1
m+n−2
das kleinste Riskio von allen Schätzern
Lösung: (a) Die gemeinsame Dichte ist
f (x1 , . . . , xn , y1 , . . . , yn )
=
1
√
2πσ 2
n+m
1
exp − 2
2σ
( n
X
i=1
2
(xi − µ1 ) +
m
X
i=1
2
(yi − µ2 )
)!
und die Loglikelihood-Funktion somit
log f (x1 , . . . , xn , y1 , . . . , yn )
( n
X
1
n+m
(log(σ 2 ) + log(2π)) − 2
= −
2
2σ
i=1
2
(xi − µ1 ) +
m
X
i=1
2
(yi − µ2 )
)
.
Die partiellen ersten Ableitungen ergeben
1
∂
log f (x1 , . . . , xn , y1 , . . . , yn ) = − 2
∂µ1
σ
1
∂
log f (x1 , . . . , xn , y1 , . . . , yn ) = − 2
∂µ2
σ
n
X
i=1
m
X
xi + nµ1
!
yi + mµ2
i=1
n+m
1
∂
log f (x1 , . . . , xn , y1 , . . . , yn ) = −
+
∂σ 2
2σ 2
2(σ 2 )2
!
( n
X
i=1
2
(xi − µ1 ) +
m
X
i=1
2
(yi − µ2 )
)
.
Als Nullstellen erhält man daraus die Maximum-Likelihood-Schätzer
µ̂1
σ̂ 2
= X̄n , µ̂2 = Ȳm ,
( n
)
m
X
X
1
n−1 2
m−1 2
2
2
=
(Yi − Ȳm )
(Xi − X̄n ) +
=
SX +
S
n + m i=1
n
+
m
n
+m Y
i=1
(mit den Bezeichnungen aus Teil (b)).
(b) Der Erwartungswert von Sα2 ist
2
E[Sα2 ] = αE[SX
] + (1 − α)E[SY2 ].
2
Wir zeigen nun noch, dass SX
und SY2 erwartungstreu für σ 2 sind. Von Blatt 2, Aufgabe 3 wissen wir,
n−1 2
m−1 2
2
dass σ2 SX ∼ χn−1 und σ2 SY ∼ χ2m−1 gilt. Der Erwartungswert einer χ2 -verteilten Zufallsvariablen
mit k Freiheitsgraden ist k, deren Varianz (brauchen wir später) 2k.
σ2
n−1 2
σ2
2
E
S
(n − 1) = σ 2
E[SX
] =
X =
2
n−1
σ
n−1
m−1 2
σ2
σ2
E
S
(m − 1) = σ 2
E[SY2 ] =
Y =
2
m−1
σ
m−1
(c) das Risiko von Sα2 ist
{Xi },{Yi }unabh.
Rα (σ 2 )E[(Sα2 − σ 2 )2 ] =
2
V(Sα2 )
=
α2 V(SX
) + (1 − α)2 V(SY2 )
4
σ4
n−1 2
m−1 2
σ
2
2
+ (1 − α)
V
S
V
SY
= α
(n − 1)
σ2 X
(m − 1)2
σ2
2
α
(1 − α)2
= 2σ 4
+
n−1
m−1
(d) Man erhält leicht
2α(m + n − 2) − 2(n − 1)
∂
Rα (σ 2 ) =
∂α
(n − 1)(m − 1)
und erhält daraus die Minimalstelle α =
n−1
m+n−2 .
Aufgabe 3:
(4 Punkte)
Seien X1 , . . . , Xn unabhängig, identisch verteilt mit Xi ∼ P oisson(λ) (1 ≤ i ≤ n) mit unbekanntem
Parameter λ > 0.
(a) Zeigen Sie, dass X1 · X2 ein erwartungstreuer Schätzer für λ2 ist.
(b) Verbessern Sie den obigen Schätzer durch Anwendung der Rao–Blackwell Prozedur mit der Statistik
Pn
S = i=1 Xi . (Zur Kontrolle: Man erhält den Schätzer S(S−1)
.)
n2
Hinweis: Bestimmen Sie die bedingte Verteilung von (X1 , . . . , Xn ) bzgl. S.
Lösung: (a) Es ist
Eλ [X1 · X2 ] = Eλ [X1 ]Eλ [X2 ] = λ · λ = λ2 .
Somit ist X1 · X2 erwartungstreu für λ2 .
(b) Wir sehen schnell mit der Neyman-Charakterisierung
n
fλ (x1 , . . . , xn ) = e−nλ λΣi=1 xi
n
Y
IIN (xi )
i=1
dass S =
Pn
i=1
xi !
,
Xi suffizient für λ ist. Die bedingte Verteilung von (X1 , . . . , Xn ) gegeben S = k ist
P (X1 = x1 , . . . , Xn = xn |S = k) =
=
=
n−1
P(X1 = x1 , . . . , Xn = xn , S = k)
xi )
P(X1 = x1 , . . . , Xn = k − Σi=1
=
P(S = k)
P(S = k)
k!
e−nλ λk
n−1
−nλ
(nλ)k
x1 ! · . . . · xn−1 !(k − Σi=1 xi )! e
k
1
k!
.
n−1
n
x1 ! · . . . · xn−1 !(k − Σi=1 xi )!
Damit ist P(X1 ,...,Xn )|S=k M k, n1 , . . . , n1 -verteilt. Die gemeinsame Verteilung von (X1 , X2 )T gegeben
S = k ist damit
k
X
k!
1
P (X1 = x1 , X2 = x2 |S = k) =
n−1
n
x
)!
x
!
·
.
.
.
·
x
!(k
−
Σ
1
n−1
x3 ,...,xn
i=1 i
Σn xi =k−x1 −x2
i=3
=
=
x1 +x2 k−x1 −x2
2
1
k!
1−
x1 !x2 !(k − x1 − x2 )! n
n
k!
x1 !x2 !(k − x1 − x2 )!
X
x3 ,...,xn
Σn xi =k−x1 −x2
i=3
|
x1 +x2 k−x1 −x2
2
1
1−
.
n
n
=1da
(k − x1 − x2 )!
x3 ! · . . . · xn−1 !xn !
1
n−2
k−x1 −x2
{z
1
1
,..., n−2
(k−x1 −x2 , n−2
)-Verteilung
Dichte derM
}
Der bedingte Erwartungswert ergibt damit
Eλ [X1 · X2 |S = k]
=
k!
x1 x2
x1 !x2 !(k − x1 − x2 )!
X
k!
(x1 − 1)!(x2 − 1)!(k − x1 − x2 )!
x1 ,x2 ∈IN0
x1 +x2 ≤k
=
x1 ,x2 ∈IN
x1 +x2 ≤k
1
= k(k − 1) 2
n
=
x1 +x2 k−x1 −x2
2
1
1−
n
n
X
k(k − 1)
n2
X
x1 ,x2 ∈IN0
x1 +x2 ≤k−2
x1 +x2 k−x1 −x2
2
1
1−
n
n
(k − 2)!
x1 x2
x1 !x2 !(k − 2 − x1 − x2 )!
|
=1da
x1 +x2 k−2−x1 −x2
2
1
1−
n
n
{z
(k−2, n1 , n1 ,1− n2 )-Verteilung
Dichte derM
Mit Rao-Blackwell ist also
T ∗ (X)
=
E[X1 · X2 |S] =
1
S(S − 1)
n2
ein erwartungstreuer Schätzer mit gleichmäßig kleinerem Risiko als X1 · X2 .
Aufgabe 4:
(4 Punkte)
Seien X1 , . . . , Xn unabhängig, identisch verteilt mit Xi ∼ U (0, θ) (1 ≤ i ≤ n) und unbekanntem Parameter θ > 0.
1. Man betrachte den Maximum Likelihoodschätzer
M (X1 . . . , Xn ) = max Xi
1≤i≤n
und zeige, dass
T ∗ (X1 , . . . , Xn ) =
n+1
max Xi
n 1≤i≤n
ein UMVU-Schätzer für θ ist.
2. Man finde einen Schätzer T mit
R(θ, T ) < min{R(θ, M ), R(θ, T ∗ )}
und kommentiere kurz, welche weiteren Eigenschaften T besitzt und weshalb sein kleineres Risiko
nicht im Widerspruch zu der UMVU-Eigenschaft von T ∗ steht. (Hinweis: Man verwende den Ansatz
T = αM , und wähle α geschickt).
Lösung: 1. Wir wenden den Satz von Lehmann-Scheffé an. Dafür benötigen wir einen erwartungstreuen
Pn
Schätzer für θ und eine suffiziente und vollständige Statistik für θ. Beispiel 2.24 zeigt, dass n2 i=1 Xi
erwartungstreu ist für θ. Nach Beispiel 2.31 ist
#
" n
2 X ∗
T (X1 , . . . , Xn ) = E
Xi M (X1 . . . , Xn )
n i=1
und M (X1 . . . , Xn ) ist suffizient für θ. Wir zeigen nun, dass M (X1 . . . , Xn ) auch vollständig ist, dann
folgt mit Lehmann-Scheffé, dass T ∗ (X1 , . . . , Xn ) UMVU-Schätzer ist. Es sei
Eθ [g(M (X1 . . . , Xn ))] = Eθ [g( max Xi )] =
1≤i≤n
n
θn
Z
0
θ
g(t)tn−1 dt = 0 für alle θ ∈ IR+ .
Mit Lebesgue-Integration folgt dann, dass g(t) = 0 fast überall ist. Das bedeutet P(g(max1≤i≤n Xi ) =
0) = 1 und damit ist M (X1 . . . , Xn ) vollständig.
}
2. Das Risiko von M bzw. T ∗ ist nach Beispiel 2.24
M SEθ (M )
=
M SEθ (T ∗ )
e-treu
Für n = 1 sind beide Risiken gleich
θ2
n(n+2)
=
θ2
3 ,
2θ2
(n + 1)(n + 2)
2
n+1
θ2
∗
Vθ (T ) =
V(M ) =
.
n
n(n + 2)
für n ≥ 2 ist das Minimum
θ2
n(n+2) .
Um nun einen Schätzer mit
kleinerem Risiko als
zu finden, berechnen wir zuerst für aM , a > 0 das Risiko in Abhängigkeit
von a und vergleichen mit dem Risiko von T ∗
M SEθ (aM )
=
=
2
n
nθ2
Vθ (aM ) + (biasθ (aM )) = a
+ a
θ−θ
(n + 1)2 (n + 2)
n+1
1
a2 n(n + 1) − 2an(n + 2) + (n + 1)(n + 2) 2
θ <
θ2 .
(n + 2)(n + 1)
n(n + 2)
2
Die Ungleichung ist erfüllt für a ∈
insbesondere für a0 =
n+2
n+1 .
n+2
n+1
−
r
n+2
n+1
2
2
−
n(n+2)−1 n+2
, n+1
n2
−
r
n+2
n+1
2
−
n(n+2)−1
n2
!
, also
1
(n+1)2 . Das steht nicht im
n(n+2)
(n+1)2 θ. Damit ist a0 M nicht
Wir erhalten in diesem Fall M SEθ (a0 M ) =
Widerspruch zu der UMVU-Eigenschaft von T ∗ , denn es gilt Eθ [a0 M ] =
erwartungstreu, liegt also nicht in der Klasse von Schätzern, in denen der UMVU-Schätzer kleinstes Risiko
hat.
Herunterladen