Ubungsklausur

Werbung
Übungsklausur
Lineare Modelle
Prof. Dr. H. Toutenburg
Aufgabe 1
Ein lineares Regressionsmodell mit der abhängigen Variablen ‘Körpergröße’
und der unabhängigen Variablen ‘Geschlecht’ wurde einmal mit der dummykodierten Variablen ‘Geschlecht’ (‘0’= weiblich) und einmal mit der
effektkodierten Variablen ‘Geschlecht’ (‘-1’= weiblich) gerechnet. Die beiden folgenden Tabellen enthalten einen Teil der daraus resultierenden
SPSS–Outputs.
Model
1
(Constant)
dummy
Coefficientsa
Unstandardized
Standardized
Coefficients
Coefficients
B Std. Error
Beta
170.000
.707
10.000
1.000
.962
t
240.416
10.000
Sig.
.000
.000
t
350.000
10.000
Sig.
.000
.000
a. Dependent Variable: GROESSE (Körpergröße)
Model
1
(Constant)
effect
Coefficientsa
Unstandardized
Standardized
Coefficients
Coefficients
B Std. Error
Beta
175.000
.500
5.000
.500
.962
a. Dependent Variable: GROESSE (Körpergröße)
a)
• Wie lautet das Regressionsmodell in Output 1?
• Wie lautet die mittlere Körpergröße
b)
• Wie lautet das Regressionsmodell in Output 2?
• Was bedeutet constant = 175?
2
c) Wie lauten die beiden Modelle, wenn männlich als Referenzkategorie
gewählt wird?
d) Ändern sich die Signifikanzen der Teststatistiken bei Wechsel der Referenzkategorie?
° ja
° nein
Wenn ja, wie?
e) Der Wert der t-Statistik der Konstante in der Tabelle der Dummykodierung entspricht einem t-Test zur Hypothese H0 : x̄weiblich = 0.
° ja
° nein
3
Aufgabe 2
Bei einer Studentenbefragung wurde u.a. das Studienfach und das monatlich zur Verfügung stehende Budget (in DM) erfragt. Im folgenden
wird beim Studienfach nur noch zwischen n1 = 120 Studenten mit naturwissenschaftlichem Studium (NWStud) und n2 = 133 Studenten der
Wirtschaftswissenschaften (WiWiStud) unterschieden. Der unten dargestellte SPSS-Output (1) enthält zunächst die Ergebnisse der linearen Regression des Studienfachs auf das monatliche Budget, wenn man das Studienfach dummy-kodiert (Referenzkategorie WiWiStud). Danach ist der
Regressions-Output unter Verwendung der Effektkodierung (Referenzkategorie WiWiStud) dargestellt (Output (2)). Im dritten SPSS-Output
wurde zusätzlich die Variable ‘Bafög’ ins Modell aufgenommen, die angibt, ob der jeweilige Student Bafög erhält oder nicht. Die Variable
‘Bafög’ ist dummykodiert mit der Referenzkategorie ‘kein Bafög’. Das
Studienfach ist wie in Output (1) dummykodiert.
Interpretieren Sie die SPSS-Outputs. Beantworten Sie dabei folgende Fragen (mit Begründung!):
a) Was ist das Ergebnis von Output (1)?
Wie stark sind Budget und Studienfach korreliert?
b) Kann aufgrund der Outputs (1) und (2) für die Variable ‘monatliches
Budget’ die Hypothese H0 : µWiWiStud = µNWStud geprüft werden?
Wie lauten die Teststatistik und die Testentscheidung?
c) Welche Faktoren sind gemäß Output (3) für die Höhe des monatlichen
Budgets ausschlaggebend?
d) Wie würden Sie weiter vorgehen? (Beachte R2 adjusted!)
4
Output (1):
Model Summary
R
Model
1
R Square
.009 a
Std. Error
of the
Estimate
Adjusted
R Square
.000
-.004
210.39
a. Predictors: (Constant), Studienfach
ANOVAb
Sum of
Squares
1
F
826.438
1
826.438
Residual
11110589.372
251
44265.296
Total
11111415.810
252
Regression
Model
Mean
Square
df
Sig.
.891 a
.019
a. Predictors: (Constant), Studienfach
b. Dependent Variable: monatliches Budget (in DM)
Coefficientsa
(Constant)
Model
1
Studienfach
Unstandardized
Coefficients
Stan
dardi
zed
Coef
ficie
nts
B
Beta
Std. Error
1088.599
14.623
-4.686
34.295
a. Dependent Variable: monatliches Budget (in DM)
5
-.009
t
Sig.
74.443
.000
-.137
.891
Output (2):
Model Summary
R
Model
1
R Square
.009 a
Std. Error
of the
Estimate
Adjusted
R Square
.000
-.004
210.39
a. Predictors: (Constant), Studienfach
ANOVAb
Sum of
Squares
1
F
826.438
1
826.438
Residual
11110589.372
251
44265.296
Total
11111415.810
252
Regression
Model
Mean
Square
df
Sig.
.891 a
.019
a. Predictors: (Constant), Studienfach
b. Dependent Variable: monatliches Budget (in DM)
Coefficientsa
(Constant)
Model
1
Studienfach
Unstandardized
Coefficients
Stan
dardi
zed
Coef
ficie
nts
B
Beta
Std. Error
1086.256
17.147
-2.343
17.147
a. Dependent Variable: monatliches Budget (in DM)
6
-.009
t
Sig.
63.348
.000
-.137
.891
Output (3):
Model Summary
R
Model
1
R Square
.475 a
Std. Error
of the
Estimate
Adjusted
R Square
.225
.219
185.56
a. Predictors: (Constant), Bafög-Empfänger, Studienfach
ANOVAb
Sum of
Squares
1
F
36.347
2
1251544.078
8608327.654
250
34433.311
11111415.810
252
Residual
Total
Mean
Square
2503088.156
Regression
Model
df
Sig.
.000 a
a. Predictors: (Constant), Bafög-Empfänger, Studienfach
b. Dependent Variable: monatliches Budget (in DM)
Coefficientsa
1
B
Beta
Std. Error
1015.764
15.471
Studienfach
-72.969
31.290
Bafög-Empfänger
209.402
24.564
(Constant)
Model
Unstandardized
Coefficients
Stan
dardi
zed
Coef
ficie
nts
a. Dependent Variable: monatliches Budget (in DM)
7
t
Sig.
65.657
.000
-.134
-2.332
.020
.491
8.525
.000
Aufgabe 3
In einem Konzern sollen die Auswirkungen von Weiterbildung in Qualitätsmanagement (Variable X) auf die Kosten für Nacharbeit und Reklamationen untersucht werden (Variable Y ). Es ergab sich bei einem
Stichprobenumfang von n = 10 folgendes Ergebnis:
ȳ = 10, x̄ = 5, Syy = 200, Sxx = 50, Sxy = −200, s2 = 4
a) Bestimmen Sie die KQ–Schätzung β̂ 0 = (β̂0 , β̂1 ) im einfachen linearen
Regressionsmodell
yi = β0 + β1 xi + ²i ,
²i ∼ N (0, σ 2 ).
b) Bestimmen Sie das 95%-Konfidenzintervall für β1 .
ausgewählte tn;0.975 -Quantile:
t8 = 2.3060
t9 = 2.2622
t10 = 2.2281
c) Berechnen Sie das Bestimmtheitsmaß.
8
Aufgabe 4
a) Sei Rang(A(m,n) ) = m ≤ n und seien B(m,m) und C(n,n) regulär. Dann
gilt Rang(BAC) = . . .
Wann ist BAC regulär?
Was ist mit CAB?
b) Sei A(n,n) quadratisch und symmetrisch. Die Eigenwertgleichung lautet . . .
Die Anzahl der Nicht–Null–Eigenwerte ist gleich . . .
c) Sei A zusätzlich nichtnegativ definit, dann lautet die Spektralzerlegung . . .
Wie viele Eigenwerte sind
– Null
– negativ
– positiv
Wie lauten die Eigenwerte von
A1/2
A−1/2
A2
A + 3I
d) Sei M eine symmetrische m × m-Matrix.
(i) Seien λmin (M ) = λ1 ≤ · · · ≤ λm = λmax (M ) die der Größe nach
geordneten Eigenwerte von M . Dann gilt
≤
9
x0 M x
x0 x
≤
(ii) Wie lautet die Spektralzerlegung von M ?
(iii) Sei a ein Skalar. Geben Sie die Spektralzerlegung von aM an!
(iv) Sei M nun darüberhinaus regulär. Wie lautet dann die Spektralzerlegung von M −1 ?
e) Seien M, N quadratische m × m–Matrizen, a ein Skalar und v, w (n ×
1)–Vektoren.
Dann gilt:
(i) Die Inverse M −1 existiert genau dann,
wenn
(ii) (aM )−1 =
(iii) |(aM )−1 | =
(iv) (aI + 21 I)−1 =
10
f) Sei M eine quadratische m × m-Matrix und seien λ1 , . . . , λm die Eigenwerte von M .
Dann gilt:
(i) | M + 2I |=
(ii) Sei A eine reguläre Matrix, dann gilt
| AM A−1 |=
(iii) Sei M nun zusätzlich nichtnegativ definit. Geben Sie die Eigenwerte an von
M2 =
M 1/2 =
M −1/2 =
M + 4I =
11
g) Seien v und w zwei n×1-Vektoren. Dann gilt die Cauchy-SchwarzscheUngleichung
(i) (v 0 w)2 ≤ . . . . . .
(ii) Sei M > 0. Zeigen Sie die Gültigkeit der Ungleichung
(v 0 w)2 ≤ (v 0 M v)(w0 M −1 w)
(iii) Sei M ≥ 0 eine n × n-Matrix. Zeigen Sie die Gültigkeit der
Ungleichung
(v 0 M w)2 ≤ (v 0 M v)(w0 M w)
12
Aufgabe 5
a) Die folgende Matrix läßt sich als Produkt zweier Vektoren darstellen:
µ
¶
1 1
J2 =
= aa0
1 1
mit a0 = . . .. Es gilt Rang(J2 ) = . . ..
b) Sei e01 = (1, 0) und e02 = (0, 1). Dann gilt e1 e01 + e2 e02 = . . .
c) Sei
µ
A=
2 4
4 3
¶
µ
,
B=
7 2
2 11
Dann ist
spur(AB) =
spur(BA) =
spur(3A) =
Rang(A) =
spur(Im ) =
spur(Jm ) =
spur(Im + Jm ) =
spur(I3 + J4 ) =
13
¶
Aufgabe 6
Die Anfälligkeit eines Werkstoffs soll durch Zusatzstoffe 1 bzw. 2 oder deren Kombination gesenkt werden. Als Vergleichsgruppe wird kein Zusatz
verwendet. Die einfaktorielle Varianzanalyse zeigt folgendes Ergebnis.
5,5
5,0
Anfälligkeit
4,5
4,0
3,5
3,0
2,5
16
2,0
1,5
N=
6
6
6
6
kein Zusatz
Stoff 1
Stoff 2
Stoff 1 und 2
Zusatzstoff
14
ANOVA ANFÄLL Anfälligkeit
-------------------------------------------------------------| Sum of |
|
|
|
|
| Squares |df |Mean Square |
F
| Sig. |
-------------------------------------------------------------Between Groups |
3.953 | 3 |
1.318 | 3.345 | .040 |
Within Groups
|
7.880 | 20 |
0.394 |
|
|
Total
| 11.833 | 23 |
|
|
|
--------------------------------------------------------------
a) Hat der Faktor Zusatzstoff mit den Stufen kein, Stoff 1, Stoff 2 und
Kombination einen Einfluss auf die Zielgröße?
Descriptive Statistics
-------------------------------------------------------------------------| ZUSATZ Zusatzstoff |
| N | Mean | Std.Dev
|
-------------------------------------------------------------------------| 1.00 kein Zusatz
| ANFÄLL Anfälligkeit | 6 | 4.2500 | 0.60000
|
-------------------------------------------------------------------------| 2.00 Stoff 1
| ANFÄLL Anfälligkeit | 6 | 4.0000 | 0.50000
|
-------------------------------------------------------------------------| 3.00 Stoff 2
| ANFÄLL Anfälligkeit | 6 | 3.5000 | 0.70000
|
-------------------------------------------------------------------------| 4.00 Stoff 1 und 2 | ANFÄLL Anfälligkeit | 6 | 3.0000 | 0.60000
|
--------------------------------------------------------------------------
b) Prüfen Sie mit einem 2–Stichproben t Test, ob sich unter Annahme
gleicher Varianzen die Kontrollgruppe vom Durchschnitt der drei anderen unterscheidet.
Hinweis: Die gepoolte Varianz aus 3 Stichproben berechnet sich als
(n −1)s21 +(n2 −1)s22 +(n3 −1)s23
s2 = 1
.
n1 +n2 +n3 −3
ausgewählte t–Quantile:
df 0.95 0.975
20 1.72 2.09
30 1.70 2.04
15
Herunterladen