Allgemeines Lineares Modell (2x2)

5
Metrische Einflußgrößen: Polynomiale Regression,
Trigonometrische Polynome, Regressionssplines,
Transformationen.
6
Modelldiagnose
7
Variablenselektion
0
Das allgemeine lineare Modell: Gewichtete KQ-Methode,
Autokorrelierte und heteroskedastische Störterme
0
Das logistische Regressionsmodell
10
Das gemischte lineare Regressionsmodell ( Linear mixed
”
Model“)
Vorlesung: Lineare Modelle
Prof. Dr. Helmut Küchenhoff
Institut für Statistik, LMU München
SoSe 2014
Das allgemeine lineare Modell
Der gewichtete KQ-Schätzer
Das lineare Modell mit heteroskedastischen Störgrößen ist gegeben durch:
:=
β̂W
Y
= Xβ + ε
(8.1)
ε
2
(8.2)
V
∼ N(0, σ V )
=
diag(v1 , v2 , . . . , vn )
(8.3)
V bekannte Matrix zur Beschreibung der Varianzstruktur
−1/2
Gewichtsmatrix: W = V −1/2 = diag (v1
Lineare Modelle SoSe 2014
−1/2
, v2
−1/2
, . . . , vn
Helmut Küchenhoff (Institut für Statistik, LMU)
σ̂
2
=
(X 0 V −1 X )−1 X 0 V −1 Y
0
(ε̂ V
−1
0
ε̂)/(n − p )
(8.5)
β̂W ist ML-Schätzer und minimiert die gewichtete
Residuenquadratsumme
(Y − X β)0 V −1 (Y − X β).
)
176 / 236
(8.4)
Lineare Modelle SoSe 2014
Helmut Küchenhoff (Institut für Statistik, LMU)
(8.6)
177 / 236
Herleitung durch Transformation
Verallgemeinerte KQ-Methode
Das lineare Modell mit allgemeiner Varianzstruktur ist gegeben durch:
Das Modell (8.1)-(8.3) lässt sich in ein gewöhnliches lineares Modell
transformieren:
Y
Y∗
:= WY
(8.7)
X∗
:= WX
(8.8)
ε∗
:= W ε
(8.9)
Xβ + ε
(8.12)
ε ∼
2
(8.13)
N(0, σ V )
V ∈ R n×n : beliebige bekannte Kovarianzmatrix mit vollem Rang
Dann gibt es eine invertierbare Matrix T mit
Dann gilt:
TT 0 = V , W = T −1 Gewichtsmatrix.
Y∗
= X ∗ β + ε∗
∗
2
∼ N(0, σ I )
ε
(8.10)
(8.11)
Der verallgemeinerte KQ-Schätzer ist gegeben durch:
σ̂
Helmut Küchenhoff (Institut für Statistik, LMU)
:=
β̂W
β̂W ist KQ-Schätzer im transformierten Modell
Lineare Modelle SoSe 2014
=
178 / 236
Lineare Modelle SoSe 2014
2
=
(X 0 V −1 X )−1 X 0 V −1 Y
0
(ε̂ V
−1
0
ε̂)/(n − p )
Helmut Küchenhoff (Institut für Statistik, LMU)
(8.14)
(8.15)
179 / 236
Eigenschaften des verallgemeinerten KQ-Schätzers
Das Modell (8.12)-(8.13) lässt sich wie oben in ein gewöhnliches lineares
Modell transformieren:
Gegeben sei das Modell (8.12) bis (8.13).
Y∗
:= WY
(8.16)
∗
:= WX
(8.17)
ε∗
:= W ε
(8.18)
= X ∗ β + ε∗
(8.19)
X
Dann gilt:
E (β̂W )
V (β̂W )
= β
(8.21)
2
0
= σ (X V
−1
X)
−1
(8.22)
Dann gilt:
Y∗
∗
ε
Lineare Modelle SoSe 2014
2
∼ N(0, σ I )
Helmut Küchenhoff (Institut für Statistik, LMU)
(8.20)
180 / 236
Alle Testverfahren und Quadratsummenzerlegungen lassen sich im Modell
Y ∗ = X ∗ β + ε∗ betrachten und damit auf den Fall homogener Varianzen
zurückführen.
Lineare Modelle SoSe 2014
Helmut Küchenhoff (Institut für Statistik, LMU)
181 / 236
Allgemeines Gauss-Markov-Theorem
Beispiele für Varianzstrukturen
Sei das Modell
Y
= X β + ε,
E (ε)
=
V (ε)
= σ2 V
rg X = p 0
0
AR(1) (allgemeine Zeitreihenstruktur)
Longitudinale Daten (Mehrdimensionale Zeitreihen) Blockdiagonale
Struktur
gegeben.
Symmetrische Struktur (gemischte Modelle)
Dann ist β̂W unter den erwartungstreuen linearen Schätzern derjenige
mit der kleinsten Varianz:
β̂W ist BLUE-Schätzer (best linear unbiased estimator).
Lineare Modelle SoSe 2014
Helmut Küchenhoff (Institut für Statistik, LMU)
182 / 236
Weitere Schätzstrategien
Lineare Modelle SoSe 2014
Helmut Küchenhoff (Institut für Statistik, LMU)
183 / 236
ML und REML-Schätzung I
Sei das Modell
Im Allgemeinen müssen die Parameter der Varianzstruktur geschätzt
werden.
Dazu gibt es verschiedene Verfahren:
Y
= X β + ε,
E (ε)
=
V (ε)
= σ 2 V (ϑ)
rg X = p 0
0
ML
gegeben. Der Parameter(vektor) ϑ ist zu schätzen.
Als Log-Likelihood ergibt sich (von additiven Konstanten abgesehen):
REML (Restricted Maximum Likelihood)
Robuste Varianzschätzung mit Working correlation“
”
Lineare Modelle SoSe 2014
Helmut Küchenhoff (Institut für Statistik, LMU)
l(β, ϑ ) = −
184 / 236
Lineare Modelle SoSe 2014
1
ϑ)| + (Y
Y − X β)0 V −1 (ϑ
ϑ)(Y
Y − X β)
ln |V (ϑ
2
Helmut Küchenhoff (Institut für Statistik, LMU)
(8.23)
185 / 236
ML und REML-Schätzung II
ML und REML-Schätzer
Ist ϑ bekannt, so ist der MLE von β bedingt auf ϑ (gewichteter
KQ-Schätzer:)
−1
ϑ) = X 0 V (ϑ
ϑ)−1 X
ϑ)Y .
β̂(ϑ
X 0 V −1 (ϑ
(8.24)
Maximieren von (10.22) bezüglich ϑ liefert ML-Schätzer.
Da dieser nicht erwartungstreu ist, verwendet man häufig den
sogenannten restringierten ML-Schätzer:
Dieser maximiert
1
ϑ)−1 X |
ϑ) = l(ϑ
ϑ) − ln|X 0 V (ϑ
LR (ϑ
2
Einsetzen liefert die Profil-Log-Likelihood:
ϑ) = −
l(ϑ
1
ϑ)| + (Y
Y − X β(ϑ
ϑ))0 V −1 (ϑ
ϑ)(Y
Y − X β(ϑ
ϑ))
ln |V (ϑ
2
Lineare Modelle SoSe 2014
Helmut Küchenhoff (Institut für Statistik, LMU)
(8.25)
186 / 236
(8.26)
Im einfachen linearen Modell entspricht der REML-Schätzer dem
erwartungstreuen Schätzer von σ 2 .
Lineare Modelle SoSe 2014
Helmut Küchenhoff (Institut für Statistik, LMU)
187 / 236
Beispiele
Inferenz bezüglich von β
Es gilt: β̂(ϑ) einer multivariaten Normalverteilung mit Erwartungswert β und
Kovarianzmatrix
β)
var(β̂
=
(X 0 V −1 X )−1
(8.27)
Da V unbekannt ist, wird es durch den (RE)ML-Schätzer V (ϑ̂) ersetzt.
Zur Konstruktion von Konfidenzintervallen und entsprechenden Tests nimmt
man an, dass β asymptotisch normalverteilt ist. Für spezielle Modelle ist dies
bewiesen, aber eine allgemeingültige asymptotische Normalverteilungsaussage
ist nicht nachgewiesen.
Wildzeitreihen:
Varianzstruktur: Unabhängigkeit der Einzelzeitreihen, aber
AR(1)-Struktur für jede einzelne Zeitreihe
Schuldaten mit Korrelation innerhalb einer Klasse
Da die Varianzmatrix V nur geschätzt wird, werden in der Praxis deshalb häufig
approximative t-Tests und entsprechende Konfidenzintervalle benutzt, die die
Verteilung von (β̂j − βj )/s.e.(
ˆ β̂j ) durch eine t-Verteilung approximieren und die
zugehörigen Freiheitsgrade geeignet schätzen.
Lineare Modelle SoSe 2014
Helmut Küchenhoff (Institut für Statistik, LMU)
188 / 236
Lineare Modelle SoSe 2014
Helmut Küchenhoff (Institut für Statistik, LMU)
189 / 236
Korrelationsmatrix Wilddaten






































1
ρ
1
Lineare Modelle SoSe 2014
ρ2
...

ρk
1
.
0
.
0
.
1
1
ρ
0
ρ2
.
.
.
.
.
.
ρk
ρ
1
ρ2
ρ
...
ρ2
...
...
1
..
.
.
...
...
...
.
.
...
ρk
ρk−1
.
.
.
.
.
.
.
.
.
1
0
.
0
0
Helmut Küchenhoff (Institut für Statistik, LMU)
.
.





































190 / 236

Zugehörige Unterlagen

Vorlesung: Lineare Modelle

Zweiter Zettel

Allgemeines Lineares Modell (2x2)

Zugehörige Unterlagen

Produkte

Unterstützung

Allgemeines Lineares Modell (2x2)

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können