Übungsklausur Lineare Modelle Prof. Dr. H. Toutenburg Aufgabe 1 Ein lineares Regressionsmodell mit der abhängigen Variablen ‘Körpergröße’ und der unabhängigen Variablen ‘Geschlecht’ wurde einmal mit der dummykodierten Variablen ‘Geschlecht’ (‘0’= weiblich) und einmal mit der effektkodierten Variablen ‘Geschlecht’ (‘-1’= weiblich) gerechnet. Die beiden folgenden Tabellen enthalten einen Teil der daraus resultierenden SPSS–Outputs. Model 1 (Constant) dummy Coefficientsa Unstandardized Standardized Coefficients Coefficients B Std. Error Beta 170.000 .707 10.000 1.000 .962 t 240.416 10.000 Sig. .000 .000 t 350.000 10.000 Sig. .000 .000 a. Dependent Variable: GROESSE (Körpergröße) Model 1 (Constant) effect Coefficientsa Unstandardized Standardized Coefficients Coefficients B Std. Error Beta 175.000 .500 5.000 .500 .962 a. Dependent Variable: GROESSE (Körpergröße) a) • Wie lautet das Regressionsmodell in Output 1? • Wie lautet die mittlere Körpergröße b) • Wie lautet das Regressionsmodell in Output 2? • Was bedeutet constant = 175? 2 c) Wie lauten die beiden Modelle, wenn männlich als Referenzkategorie gewählt wird? d) Ändern sich die Signifikanzen der Teststatistiken bei Wechsel der Referenzkategorie? ° ja ° nein Wenn ja, wie? e) Der Wert der t-Statistik der Konstante in der Tabelle der Dummykodierung entspricht einem t-Test zur Hypothese H0 : x̄weiblich = 0. ° ja ° nein 3 Aufgabe 2 Bei einer Studentenbefragung wurde u.a. das Studienfach und das monatlich zur Verfügung stehende Budget (in DM) erfragt. Im folgenden wird beim Studienfach nur noch zwischen n1 = 120 Studenten mit naturwissenschaftlichem Studium (NWStud) und n2 = 133 Studenten der Wirtschaftswissenschaften (WiWiStud) unterschieden. Der unten dargestellte SPSS-Output (1) enthält zunächst die Ergebnisse der linearen Regression des Studienfachs auf das monatliche Budget, wenn man das Studienfach dummy-kodiert (Referenzkategorie WiWiStud). Danach ist der Regressions-Output unter Verwendung der Effektkodierung (Referenzkategorie WiWiStud) dargestellt (Output (2)). Im dritten SPSS-Output wurde zusätzlich die Variable ‘Bafög’ ins Modell aufgenommen, die angibt, ob der jeweilige Student Bafög erhält oder nicht. Die Variable ‘Bafög’ ist dummykodiert mit der Referenzkategorie ‘kein Bafög’. Das Studienfach ist wie in Output (1) dummykodiert. Interpretieren Sie die SPSS-Outputs. Beantworten Sie dabei folgende Fragen (mit Begründung!): a) Was ist das Ergebnis von Output (1)? Wie stark sind Budget und Studienfach korreliert? b) Kann aufgrund der Outputs (1) und (2) für die Variable ‘monatliches Budget’ die Hypothese H0 : µWiWiStud = µNWStud geprüft werden? Wie lauten die Teststatistik und die Testentscheidung? c) Welche Faktoren sind gemäß Output (3) für die Höhe des monatlichen Budgets ausschlaggebend? d) Wie würden Sie weiter vorgehen? (Beachte R2 adjusted!) 4 Output (1): Model Summary R Model 1 R Square .009 a Std. Error of the Estimate Adjusted R Square .000 -.004 210.39 a. Predictors: (Constant), Studienfach ANOVAb Sum of Squares 1 F 826.438 1 826.438 Residual 11110589.372 251 44265.296 Total 11111415.810 252 Regression Model Mean Square df Sig. .891 a .019 a. Predictors: (Constant), Studienfach b. Dependent Variable: monatliches Budget (in DM) Coefficientsa (Constant) Model 1 Studienfach Unstandardized Coefficients Stan dardi zed Coef ficie nts B Beta Std. Error 1088.599 14.623 -4.686 34.295 a. Dependent Variable: monatliches Budget (in DM) 5 -.009 t Sig. 74.443 .000 -.137 .891 Output (2): Model Summary R Model 1 R Square .009 a Std. Error of the Estimate Adjusted R Square .000 -.004 210.39 a. Predictors: (Constant), Studienfach ANOVAb Sum of Squares 1 F 826.438 1 826.438 Residual 11110589.372 251 44265.296 Total 11111415.810 252 Regression Model Mean Square df Sig. .891 a .019 a. Predictors: (Constant), Studienfach b. Dependent Variable: monatliches Budget (in DM) Coefficientsa (Constant) Model 1 Studienfach Unstandardized Coefficients Stan dardi zed Coef ficie nts B Beta Std. Error 1086.256 17.147 -2.343 17.147 a. Dependent Variable: monatliches Budget (in DM) 6 -.009 t Sig. 63.348 .000 -.137 .891 Output (3): Model Summary R Model 1 R Square .475 a Std. Error of the Estimate Adjusted R Square .225 .219 185.56 a. Predictors: (Constant), Bafög-Empfänger, Studienfach ANOVAb Sum of Squares 1 F 36.347 2 1251544.078 8608327.654 250 34433.311 11111415.810 252 Residual Total Mean Square 2503088.156 Regression Model df Sig. .000 a a. Predictors: (Constant), Bafög-Empfänger, Studienfach b. Dependent Variable: monatliches Budget (in DM) Coefficientsa 1 B Beta Std. Error 1015.764 15.471 Studienfach -72.969 31.290 Bafög-Empfänger 209.402 24.564 (Constant) Model Unstandardized Coefficients Stan dardi zed Coef ficie nts a. Dependent Variable: monatliches Budget (in DM) 7 t Sig. 65.657 .000 -.134 -2.332 .020 .491 8.525 .000 Aufgabe 3 In einem Konzern sollen die Auswirkungen von Weiterbildung in Qualitätsmanagement (Variable X) auf die Kosten für Nacharbeit und Reklamationen untersucht werden (Variable Y ). Es ergab sich bei einem Stichprobenumfang von n = 10 folgendes Ergebnis: ȳ = 10, x̄ = 5, Syy = 200, Sxx = 50, Sxy = −200, s2 = 4 a) Bestimmen Sie die KQ–Schätzung β̂ 0 = (β̂0 , β̂1 ) im einfachen linearen Regressionsmodell yi = β0 + β1 xi + ²i , ²i ∼ N (0, σ 2 ). b) Bestimmen Sie das 95%-Konfidenzintervall für β1 . ausgewählte tn;0.975 -Quantile: t8 = 2.3060 t9 = 2.2622 t10 = 2.2281 c) Berechnen Sie das Bestimmtheitsmaß. 8 Aufgabe 4 a) Sei Rang(A(m,n) ) = m ≤ n und seien B(m,m) und C(n,n) regulär. Dann gilt Rang(BAC) = . . . Wann ist BAC regulär? Was ist mit CAB? b) Sei A(n,n) quadratisch und symmetrisch. Die Eigenwertgleichung lautet . . . Die Anzahl der Nicht–Null–Eigenwerte ist gleich . . . c) Sei A zusätzlich nichtnegativ definit, dann lautet die Spektralzerlegung . . . Wie viele Eigenwerte sind – Null – negativ – positiv Wie lauten die Eigenwerte von A1/2 A−1/2 A2 A + 3I d) Sei M eine symmetrische m × m-Matrix. (i) Seien λmin (M ) = λ1 ≤ · · · ≤ λm = λmax (M ) die der Größe nach geordneten Eigenwerte von M . Dann gilt ≤ 9 x0 M x x0 x ≤ (ii) Wie lautet die Spektralzerlegung von M ? (iii) Sei a ein Skalar. Geben Sie die Spektralzerlegung von aM an! (iv) Sei M nun darüberhinaus regulär. Wie lautet dann die Spektralzerlegung von M −1 ? e) Seien M, N quadratische m × m–Matrizen, a ein Skalar und v, w (n × 1)–Vektoren. Dann gilt: (i) Die Inverse M −1 existiert genau dann, wenn (ii) (aM )−1 = (iii) |(aM )−1 | = (iv) (aI + 21 I)−1 = 10 f) Sei M eine quadratische m × m-Matrix und seien λ1 , . . . , λm die Eigenwerte von M . Dann gilt: (i) | M + 2I |= (ii) Sei A eine reguläre Matrix, dann gilt | AM A−1 |= (iii) Sei M nun zusätzlich nichtnegativ definit. Geben Sie die Eigenwerte an von M2 = M 1/2 = M −1/2 = M + 4I = 11 g) Seien v und w zwei n×1-Vektoren. Dann gilt die Cauchy-SchwarzscheUngleichung (i) (v 0 w)2 ≤ . . . . . . (ii) Sei M > 0. Zeigen Sie die Gültigkeit der Ungleichung (v 0 w)2 ≤ (v 0 M v)(w0 M −1 w) (iii) Sei M ≥ 0 eine n × n-Matrix. Zeigen Sie die Gültigkeit der Ungleichung (v 0 M w)2 ≤ (v 0 M v)(w0 M w) 12 Aufgabe 5 a) Die folgende Matrix läßt sich als Produkt zweier Vektoren darstellen: µ ¶ 1 1 J2 = = aa0 1 1 mit a0 = . . .. Es gilt Rang(J2 ) = . . .. b) Sei e01 = (1, 0) und e02 = (0, 1). Dann gilt e1 e01 + e2 e02 = . . . c) Sei µ A= 2 4 4 3 ¶ µ , B= 7 2 2 11 Dann ist spur(AB) = spur(BA) = spur(3A) = Rang(A) = spur(Im ) = spur(Jm ) = spur(Im + Jm ) = spur(I3 + J4 ) = 13 ¶ Aufgabe 6 Die Anfälligkeit eines Werkstoffs soll durch Zusatzstoffe 1 bzw. 2 oder deren Kombination gesenkt werden. Als Vergleichsgruppe wird kein Zusatz verwendet. Die einfaktorielle Varianzanalyse zeigt folgendes Ergebnis. 5,5 5,0 Anfälligkeit 4,5 4,0 3,5 3,0 2,5 16 2,0 1,5 N= 6 6 6 6 kein Zusatz Stoff 1 Stoff 2 Stoff 1 und 2 Zusatzstoff 14 ANOVA ANFÄLL Anfälligkeit -------------------------------------------------------------| Sum of | | | | | | Squares |df |Mean Square | F | Sig. | -------------------------------------------------------------Between Groups | 3.953 | 3 | 1.318 | 3.345 | .040 | Within Groups | 7.880 | 20 | 0.394 | | | Total | 11.833 | 23 | | | | -------------------------------------------------------------- a) Hat der Faktor Zusatzstoff mit den Stufen kein, Stoff 1, Stoff 2 und Kombination einen Einfluss auf die Zielgröße? Descriptive Statistics -------------------------------------------------------------------------| ZUSATZ Zusatzstoff | | N | Mean | Std.Dev | -------------------------------------------------------------------------| 1.00 kein Zusatz | ANFÄLL Anfälligkeit | 6 | 4.2500 | 0.60000 | -------------------------------------------------------------------------| 2.00 Stoff 1 | ANFÄLL Anfälligkeit | 6 | 4.0000 | 0.50000 | -------------------------------------------------------------------------| 3.00 Stoff 2 | ANFÄLL Anfälligkeit | 6 | 3.5000 | 0.70000 | -------------------------------------------------------------------------| 4.00 Stoff 1 und 2 | ANFÄLL Anfälligkeit | 6 | 3.0000 | 0.60000 | -------------------------------------------------------------------------- b) Prüfen Sie mit einem 2–Stichproben t Test, ob sich unter Annahme gleicher Varianzen die Kontrollgruppe vom Durchschnitt der drei anderen unterscheidet. Hinweis: Die gepoolte Varianz aus 3 Stichproben berechnet sich als (n −1)s21 +(n2 −1)s22 +(n3 −1)s23 s2 = 1 . n1 +n2 +n3 −3 ausgewählte t–Quantile: df 0.95 0.975 20 1.72 2.09 30 1.70 2.04 15