Prof. Dr. E. Mammen B. Haag SS 2004 Multivariate Statistik Aufgaben zur Klausurvorbereitung Aufgabe 1 Gegeben sei die Kovarianzmatrix 3 2 1 Σ = 2 4 2 1 2 3 a) Führen Sie für diese Matrix eine Hauptkomponentenanalyse durch. Berechnen Sie die Standardabweichungen und Ladungen der Komponenten. Wie viele Komponenten sind notwendig, um mindestens 75 % der Gesamtvarianz zu erklären? b) Führen Sie für diese Matrix eine Faktorenanalyse mit einem Faktor durch. Stellen Sie ein formales Modell auf und bestimmen Sie alle Parameter. Aufgabe 2 Sei X = (X1 , X2 )0 ∼ N2 (0, 1), d. h. ein bivariat normalverteilter Zufallsvektor mit Identitäts-Kovarianzmatrix. a) Was ist die gemeinsame Verteilung von (X1 , X1 + X2 )0 ? b) Bestimmen Sie die bedingte Verteilung von X1 gegeben X1 + X2 . Aufgabe 3 Eine Zufallsvariable X sei doppelt exponentiell verteilt, d. h. die Dichte ist gegeben durch f (x) = 12 exp(−|x − µ|) wobei der Parameter µ zwei unterschiedliche Werte µ1 oder µ2 annimmt. Nehmen Sie an, man beobachtet µ1 = 0 mit Wahrscheinlichkeit π1 = 41 und µ2 = 1 mit Wahrscheinlichkeit π2 = 34 . Bestimmen Sie die Bayes-Regel zur Trennung der beiden Gruppen? Interpretieren Sie Ihr Ergebnis. Aufgabe 4 Seien X und Y Zufallsvariablen mit gemeinsamer Dichte ( 3 (x + 3x2 y 2 ) −1 ≤ y ≤ 1, 0 ≤ x ≤ 1 fX,Y (x, y) = 5 0 sonst Berechnen Sie die marginalen Dichten von X und Y . Aufgabe 5 Folgende Berechnungen wurden mit dem Statistikprogramm R durchgeführt: > mat2 [,1] [,2] [,3] [,4] [,5] [,6] [,7] [1,] 1.000 0.318 0.403 0.468 0.321 0.335 0.304 [2,] 0.318 1.000 0.317 0.230 0.285 0.234 0.157 [3,] 0.403 0.317 1.000 0.305 0.247 0.268 0.223 [4,] 0.468 0.230 0.305 1.000 0.227 0.327 0.335 [5,] 0.321 0.285 0.247 0.227 1.000 0.622 0.656 [6,] 0.335 0.234 0.268 0.327 0.622 1.000 0.722 [7,] 0.304 0.157 0.223 0.335 0.656 0.722 1.000 > erg <- princomp(mat2) > summary(erg) Importance of components: Comp.1 Comp.2 Comp.3 Comp.4 Standard deviation 0.4954206 0.3151390 0.2495612 0.20102729 Proportion of Variance 0.5149734 0.2083729 0.1306745 0.08479042 Cumulative Proportion 0.5149734 0.7233463 0.8540208 0.93881122 Comp.5 Comp.6 Comp.7 Standard deviation 0.13803436 0.10054704 0 Proportion of Variance 0.03997709 0.02121169 0 Cumulative Proportion 0.97878831 1.00000000 1 > loadings(erg) Loadings: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 [1,] 0.195 0.364 0.867 0.144 -0.236 [2,] 0.283 -0.625 -0.428 0.178 -0.560 [3,] 0.289 0.825 -0.151 -0.457 [4,] 0.145 0.652 -0.360 -0.404 -0.179 -0.178 -0.444 [5,] -0.474 -0.197 0.241 -0.710 -0.307 -0.282 [6,] -0.493 0.624 -0.585 -0.144 [7,] -0.557 0.106 0.149 0.726 -0.353 a) Erläutern Sie die ausgegebenen Werte. Welches statistische Verfahren wird hier angewendet? b) Wie ist das Ergebnis von summary(erg) zu interpretieren? c) Was ist in den beigefügten Grafiken dargestellt? −0.4 −0.2 0.0 0.2 0.6 −0.6 0.4 0.6 0.6 4 0.4 0.4 Var 4 0.2 6 0.0 7 Var 3 3 −0.2 Var 5 5 −0.4 0.0 Var 7 Var 6 −0.4 −0.2 Comp.2 0.2 1 Var 1 −0.6 −0.6 Var 2 2 −0.6 −0.4 −0.2 0.0 0.2 0.4 0.6 Comp.1 0.0 0.5 0.8 −0.5 1.0 Var 4 0.0 Var 1 1 Var 2 −0.5 7Var Var 76 565 Var −0.2 0.0 0.2 0.5 Var 3 −0.4 Comp.3 0.4 0.6 1.0 3 4 2 −0.4 −0.2 0.0 0.2 Comp.1 0.4 0.6 0.8