TU DORTMUND Robuste Statistik

Werbung
TU DORTMUND
Sommersemester 2017
Fakultät Statistik
14.06.2017
Prof. Dr. Christine Müller
M.Sc. Melanie Dagge
Robuste Statistik
Blatt 9
Aufgabe 9.1: (2 Punkte)
Zeigen Sie die beiden in der Vorlesung nicht bewiesenen Gleichheiten von Satz 5.2.2a). Das heißt, zeigen Sie,
dass sich die empirische Kovarianzmatrix von Beobachtungen y 1 , ..., y n auch folgendermaßen darstellen lässt:
N
P
a) S y = N 1−1
y n y Tn − N ȳ ȳ T
b) S y = N 1−1 y T y − N ȳ ȳ T
n=1
Aufgabe 9.2: (6 Punkte)
Betrachten Sie den Datensatz
y1 =
!
1.27
,
6.01
y9 =
y2 =
!
0.53
,
4.77
!
0.7
,
4.35
y 10 =
y3 =
!
1.58
,
6.23
!
0.36
,
3.59
y 11 =
y4 =
!
1.53
,
6.42
!
1.03
,
5.72
y 12 =
y5 =
!
1.11
,
4.8
!
0.77
,
3.94
y6 =
y 13 =
!
1.39
,
5.75
!
1.07
,
5.46
y7 =
y 14 =
!
3.01
,
6.02
!
0.68
,
4.44
y 15 =
y8 =
!
0.66
,
4.9
!
1.14
.
6.26
a) Schätzen Sie die Kovarianzmatrix mittels empirischer Kovarianz, der MVE-Schätzung, der MCD-Schätzung
und der räumlichen Vorzeichen-Kovarianz-Schätzung.
!
0.2 0.3
b) Die wahre Kovarianzmatrix sei gegeben durch
. Plotten Sie eine Verfälschungsfunktion zu
0.3 0.6
dieser Matrix, indem Sie die vier Schätzer aus a) ausgewertet auf einem Datensatz durch Hinzufügen einer
Beobachtung darstellen. Dabei müssen Sie insbesondere ein geeignetes Distanzmaß von der Schätzung zur
tatsächlichen Matrix definieren, damit Ihre Verfälschungsfunktion von den reellen Zahlen in die reellen
T
Zahlen abbildet. Die hinzugefügte Beobachtung soll folgende Gestalt aufweisen: (i) c c ,
T
T
(ii) 1.122 c , (iii) c 5.244 , jeweils für geeignete Werte von c. Interpretieren Sie Ihre Ergebnisse!
Aufgabe 9.3: (2 Punkte)
Erzeugen Sie sich einen Klassifikations-Datensatz mit zwei Einflussvariablen, indem Sie folgenden R-Code
ausführen:
library(mlbench)
set.seed(1)
dat <- mlbench.spirals(1000, 1, 0.1)
data <- data.frame(x = dat$x, class = dat$classes)
Zeichnen Sie für diese Daten DD-Plots (wie in der Vorlesung definiert) für die Halbraum- und Simplex-Tiefe.
Zeichnen Sie jeweils auch die Klassifikationsgrenze mit ein.
Abgabe bis spätestens 19.06.2017.
Herunterladen