Multivariate Statistik Aufgaben zur Klausurvorbereitung

Werbung
Prof. Dr. E. Mammen
B. Haag
SS 2004
Multivariate Statistik
Aufgaben zur Klausurvorbereitung
Aufgabe 1
Gegeben sei die Kovarianzmatrix


3 2 1
Σ = 2 4 2
1 2 3
a) Führen Sie für diese Matrix eine Hauptkomponentenanalyse durch. Berechnen Sie die Standardabweichungen und Ladungen der Komponenten. Wie viele Komponenten sind notwendig, um mindestens 75 % der Gesamtvarianz zu
erklären?
b) Führen Sie für diese Matrix eine Faktorenanalyse mit einem Faktor durch.
Stellen Sie ein formales Modell auf und bestimmen Sie alle Parameter.
Aufgabe 2
Sei X = (X1 , X2 )0 ∼ N2 (0, 1), d. h. ein bivariat normalverteilter Zufallsvektor
mit Identitäts-Kovarianzmatrix.
a) Was ist die gemeinsame Verteilung von (X1 , X1 + X2 )0 ?
b) Bestimmen Sie die bedingte Verteilung von X1 gegeben X1 + X2 .
Aufgabe 3
Eine Zufallsvariable X sei doppelt exponentiell verteilt, d. h. die Dichte ist gegeben durch
f (x) = 12 exp(−|x − µ|)
wobei der Parameter µ zwei unterschiedliche Werte µ1 oder µ2 annimmt. Nehmen
Sie an, man beobachtet µ1 = 0 mit Wahrscheinlichkeit π1 = 41 und µ2 = 1 mit
Wahrscheinlichkeit π2 = 34 . Bestimmen Sie die Bayes-Regel zur Trennung der
beiden Gruppen? Interpretieren Sie Ihr Ergebnis.
Aufgabe 4
Seien X und Y Zufallsvariablen mit gemeinsamer Dichte
(
3
(x + 3x2 y 2 ) −1 ≤ y ≤ 1, 0 ≤ x ≤ 1
fX,Y (x, y) = 5
0
sonst
Berechnen Sie die marginalen Dichten von X und Y .
Aufgabe 5
Folgende Berechnungen wurden mit dem Statistikprogramm R durchgeführt:
> mat2
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] 1.000 0.318 0.403 0.468 0.321 0.335 0.304
[2,] 0.318 1.000 0.317 0.230 0.285 0.234 0.157
[3,] 0.403 0.317 1.000 0.305 0.247 0.268 0.223
[4,] 0.468 0.230 0.305 1.000 0.227 0.327 0.335
[5,] 0.321 0.285 0.247 0.227 1.000 0.622 0.656
[6,] 0.335 0.234 0.268 0.327 0.622 1.000 0.722
[7,] 0.304 0.157 0.223 0.335 0.656 0.722 1.000
> erg <- princomp(mat2)
> summary(erg)
Importance of components:
Comp.1
Comp.2
Comp.3
Comp.4
Standard deviation
0.4954206 0.3151390 0.2495612 0.20102729
Proportion of Variance 0.5149734 0.2083729 0.1306745 0.08479042
Cumulative Proportion 0.5149734 0.7233463 0.8540208 0.93881122
Comp.5
Comp.6 Comp.7
Standard deviation
0.13803436 0.10054704
0
Proportion of Variance 0.03997709 0.02121169
0
Cumulative Proportion 0.97878831 1.00000000
1
> loadings(erg)
Loadings:
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7
[1,] 0.195 0.364
0.867 0.144
-0.236
[2,] 0.283 -0.625 -0.428
0.178
-0.560
[3,] 0.289 0.825 -0.151
-0.457
[4,] 0.145 0.652 -0.360 -0.404 -0.179 -0.178 -0.444
[5,] -0.474 -0.197
0.241 -0.710 -0.307 -0.282
[6,] -0.493
0.624 -0.585 -0.144
[7,] -0.557 0.106
0.149 0.726 -0.353
a) Erläutern Sie die ausgegebenen Werte. Welches statistische Verfahren wird
hier angewendet?
b) Wie ist das Ergebnis von summary(erg) zu interpretieren?
c) Was ist in den beigefügten Grafiken dargestellt?
−0.4
−0.2
0.0
0.2
0.6
−0.6
0.4
0.6
0.6
4
0.4
0.4
Var 4
0.2
6
0.0
7
Var 3
3
−0.2
Var 5
5
−0.4
0.0
Var 7
Var 6
−0.4
−0.2
Comp.2
0.2
1
Var 1
−0.6
−0.6
Var 2
2
−0.6
−0.4
−0.2
0.0
0.2
0.4
0.6
Comp.1
0.0
0.5
0.8
−0.5
1.0
Var 4
0.0
Var 1
1
Var 2
−0.5
7Var
Var
76 565
Var
−0.2
0.0
0.2
0.5
Var 3
−0.4
Comp.3
0.4
0.6
1.0
3
4
2
−0.4
−0.2
0.0
0.2
Comp.1
0.4
0.6
0.8
Herunterladen