EM-Algorithmus

Werbung
Schätzen und Testen I
Sonja Greven, Christian Heumann, Sarah Brockhaus, David Rügamer
Übungsblatt 7
WiSe 2015/16
Aufgabe 14 ( EM-Algorithmus)
Seien Ti , i = 1, . . . , n+m, unabhängige und identisch exponentialverteilte Überlebenszeiten
mit Verteilungsfunktion F (T |λ), Dichte f (T |λ) und Rate λ > 0, die der Größe nach geordnet
sind. Gehen Sie im Folgenden davon aus, dass für i = n + 1, . . . , n + m nicht die tatsächlichen
Lebensdauern sondern nur die rechtszensierten Größen Yi = min(Ti , c), c ∈ R+ erhoben
werden können (n ist demnach so definiert ist, dass c dem n/(n + m)-Quantil entspricht).
(a) Zeigen Sie, dass die in der kten Iteration zu berechnende Größe im E-Schritt des EMAlgorithmus sich folgendermaßen schreiben lässt:
!
Z ∞
n
X
m
(k)
Q(λ, λ ) =
[log f (u|λ)] f (u|λ(k) ) du.
(1)
log f (Ti |λ) +
(k) )
1
−
F
(c|λ
c
i=1
Gehen Sie dazu wie folgt vor:
(1) Nutzen Sie die Eigenschaften der Logarithmus-Funktion aus, um die Definition von
Q(λ, λ(k) ) = E(log f (T1 , . . . , Tn+m |λ) | T1 , . . . , Tn , λ(k) ) zu vereinfachen.
(2) Teilen Sie das Resultat aus (1) in einen beobachtbaren und einen unbeobachtbaren
Teil auf.
(3) Leiten Sie anschließend das Ergebnis in Gleichung (1) her, indem Sie den bedingten
Erwartungswert E(log f (Ti |λ)|Y1 , . . . , Yn , λ(k) ) für i = n + 1, . . . , n + m in
Z ∞
1
[log f (u|λ)] f (u|λ(k) ) du
1 − F (c|λ(k) ) c
umformen.
Hinweis: Beachten Sie die Verteilung, bezüglich welcher der Erwartungswert berechnet
wird (vgl. Vorlesungsfolie 300).
(b) Wie lautet ∂Q(λ, λ(k) )/∂λ unter der Annahme, dass Differentation und Integration in
diesem Fall vertauschbar sind?
(c) Leiten Sie nun die explizite Form von f (T |λ), S(T |λ) = 1 − F (T |λ),
∂f (T |λ)
1
für die gegebene Exponentialverteilung her.
∂λ
f (T |λ)
∂f (T |λ)
∂λ
und
(d) Leiten Sie das im M-Schritt zu berechnende Maximum λ(k+1) für die gegebene
Verteilung her, also berechnen Sie die explizite Form von ∂Q(λ, λ(k) )/∂λ aus Aufgabe
(b) und lösen Sie die Gleichung
∂Q(λ, λ(k) )
=0
(2)
∂λ
nach λ auf. Zeigen Sie, dass sich das Maximum zu
!−1
m (1/λ(k) + c) + nT
(3)
m+n
P
mit T = n−1 ni=1 Ti ergibt.
Datum: Freitag, 04.12.2015
Seite 1 von 2
(e) Überlegen Sie sich, wie der EM-Algorithmus auf Basis der vorangegangenen Erkenntnisse
implementiert werden kann und überprüfen Sie Ihre Vermutungen anhand eines Beispiels
in R.
Aufgabe 15 (Maximum-Likelihood-Inferenz: Konfidenzintervalle)
Sei x = (x1 , . . . , xn )> eine i.i.d. Stichprobe einer exponentialverteilten Zufallsvariablen
X ∼ Exp(λ), wobei λ > 0 unbekannt ist.
(a) Bestimmen Sie den Maximum-Likelihood-Schätzer für λ.
(b) Konstruieren Sie für λ ein asymptotisches Konfidenzintervall zum Niveau 1 − α.
Verwenden Sie dazu asymptotische Eigenschaften für Maximum-Likelihood-Schätzer.
Aufgabe 16 (Fehlspezifikation: Kullback-Leibler-Distanz)
Sei X doppelexponentialverteilt mit unbekannten Parametern µ0 ∈ R und σ0 > 0, d.h.
X ∼ DE(µ0 , σ0 ) mit Dichtefunktion
1
|x − µ0 |
g(x) =
exp −
.
2σ0
σ0
Bei einer Analyse wird das Modell jedoch fehlspezifiziert: Für X wird eine Normalverteilung
angenommen, d.h. X ∼ N(µ, σ 2 ) mit Dichtefunktion fµ,σ2 .
Berechnen Sie denjenigen Parametervektor θ = (µ, σ 2 )> , der die Kullback-Leibler-Distanz
D(g, fθ ) minimiert.
Hinweis: Benutzen Sie, dass für X ∼ DE(µ0 , σ0 ) gilt: E(X) = µ0 und Var(X) = 2σ02 .
∗ Aufgabe
10 (Kullback-Leibler-Distanz)
Sei X t-verteilt mit Lokationsparameter m ∈ R, Skalenparameter s > 0 und ν > 2
Freiheitsgraden, d.h. X ∼ t(m, s, ν). Die Dichte der t-Verteilung lautet
2 !− ν+1
2
Γ ν+1
1
x
−
m
2
g(x) =
1
+
√
ν
s
Γ ν2
νπs
für x ∈ R. Es gilt E(X) = m und Var(X) =
ν
ν−2
s2 .
Im Folgenden sei der Parameter m bekannt, der Parameter s2 soll geschätzt werden. Bei
der Analyse wird das Modell jedoch fehlspezifiziert: Für X wird eine Normalverteilung
angenommen, d.h. X ∼ N(µ, σ 2 ) mit Dichtefunktion fσ2 , wobei der Erwartungswert
µ = m = E(X) hier fest ist.
(a) Zeigen Sie, dass gilt:
1
1
Eg log fσ2 (X) = − log(2πσ 2 ) − 2
2
2σ
ν
2
2
2
s + m − 2µm + µ .
ν−2
(b) Berechnen Sie dasjenige σ 2 > 0, das die Kullback-Leibler-Distanz D(g, fσ2 ) minimiert.
Interpretieren Sie Ihr Ergebnis.
Datum: Freitag, 04.12.2015
Seite 2 von 2
Herunterladen