PowerPoint-Präsentation

Werbung
Mehrebenen-Modelle:
Methodische Ansätze und Schätzung
Reinhard Hujer
J.W.Goethe-Universität Frankfurt/M.
Nürnberg, 30. Oktober 2008
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
www.wiwi.uni-frankfurt.de
Seite 1
Problemstellung (1)
Mikrodatensätze haben eine hierarchische Struktur, z.B. 3 Ebenen:
•
Beschäftigte:
i = 1, …, N
•
Betriebe:
j = 1, …, J
•
Sektoren
m = 1, …, M
Datenlage:
•
Die abhängige Variable Y wird auf Ebene 1 gemessen
•
Die unabhängigen Variablen werden auf allen Ebenen erhoben
•
Gruppen auf den unterschiedlichen Ebenen können
unterschiedliche Größe haben
•
Auf jeder Ebene werden spezifische Modellgleichungen erstellt
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 2
Problemstellung (2)
Probleme bei Nichtberücksichtigung der Mehrebenenstruktur:
•
Beobachtungen innerhalb einer Gruppe sind im allgemeinen nicht
unabhängig voneinander, d.h. sie können untereinander stärker
korrelieren als Beobachtungen aus anderen Gruppen, z.B.
Kontexteffekte, gemeinsame Sozialisation
•
Statistische Standardmethoden sind nicht robust gegenüber der
Verletzung der Unabhängigkeitsannahme
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 3
Modellvarianten der
Mehrebenen-Ansätze
Zwei grundsätzliche, weitgehend unabhängige Modell-Entwicklungen:
•
In der Soziologie, Psychologie, Pädagogik, Politikwissenschaft:
Random-Coefficient-Modelle mit mehr als 2 Ebenen
•
In der Ökonomie: Fixed Effects Panel-Modelle im Rahmen der
ökonometrischen Analyse von Linked Employer-EmployeeDatensätzen (z.B. LIAB)
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 4
Random Coefficient-Modelle (1)
Zwei-Ebenen-Modelle:
Regressionsgleichung auf Ebene 1:
Yij   0 j  1 j X ij  eij
mit
i = Index für Ebene 1 (z.B. Beschäftigte)
j = Index für Ebene 2 (z.B. Betrieb)
eij = individuenspezifischer Fehlerterm
β0j und β1j variieren über die Ebenen-2-Einheiten:
 0 j   00   01Z j  u0 j
1 j   10   11Z j  u1 j
u0j und u1j sind gruppenspezifische Zufallsvariablen.
Deshalb: „Random Coefficient“-Modell
Beispiel: Yij = Einkommen
Xij = Qualifikationsniveau
Zj = Betriebsgröße
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 5
Random Coefficient-Modelle (2)
Zwei-Ebenen-Modelle:
Yij   00   01Z j  u0 j    10 X 1 j   11Z j X 1 j  u1 j X 1 j   eij
Nach Umformen:
Yij   00   01Z j   10 X ij   11Z j X ij   u1 j X ij  u0 j  eij 
 
fixer Teil
zufälliger Teil
mit  11Z j X ij = Cross-Level-Interaktion
u1 j X ij = Heteroskedastizität
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 6
Random Coefficient-Modelle (3)
Varianzen und Kovarianzen:
Vareij    2 ; Eeij   0
Var u0 j    00 ; E u0 j   0
Var u1 j    11; E u1 j   0
Covu0 j , u1 j    01
Coveij , u j   0
Varianz in der abhängigen Variablen kann auf folgende Ursachen
zurückgeführt werden:
•
Level-1-Zufallseinflüsse eij
•
Level-2-spezifische Zufallseffekte u j
•
Systematische Effekte von Level-1-Prädiktoren
•
Systematische Gruppeneffekte von Level-2-Prädiktoren
•
Interaktionen zwischen Level-1- und Level-2-Prädiktoren
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 7
Schätzung eines allgemeinen linearen
2-Ebenen-Modells (1)
Modell-Ansatz:

Yij  X ij'  j   ij mit  ij ~ N 0,  2

i = 1, …, N Individuen
j = 1, …, J Betriebe
βj : (K*1)-Vektor der Parameter variiert über Betriebe
Xij : (K*1)-Vektor von erklärende Variablen (Konstante
und (K-1) individuelle Charakteristika)
Annahme: βj variiert nicht nur zufällig über die Betriebe,
sondern ist auf der Ebene 2 abhängig von einem
(1*L)-Vektor zj (Betriebsmerkmale). Mit
Z j  I k  z j als (K*K·L)-Matrix ergibt sich:
wobei
 j  Z j  u j
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 8
Schätzung eines allgemeinen linearen
2-Ebenen-Modells (2)
mit γ als (K·L*1) Parameter-Vektor
u j ~ N 0, T 
 00
 .

T  Var  u j    .

 .
 u 0
.
.
.
.
.  0K 





.  KK 
Für die Kovarianzen gilt:
Cov ij , ukj   0
Covxkij ,  ij   0
CovZ lj ,  ij   0
Covxkij , ukj   0
CovZ lj , u kj   0
für alle k, k´ und l und mit k=1,…,K und l = 1,…,L.
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 9
Schätzung eines allgemeinen linearen
2-Ebenen-Modells (3)
Schätzmethoden (Raudenbush,Bryk (2002), S.408ff.):
•
•
•
•
Da T und σ2 nicht bekannt sind, ist eine GLS-Schätzung nicht
möglich
Full Maximum Likelihood-Schätzung (FML) in Abhängigkeit von
γ,σ2 und T. Jedoch: Varianzen und Kovarianzen sind abhängig von
den Regressionsparametern
Deshalb: Restricted Maximum Likelihood-Schätzung (RML):
Berücksichtigt die Korrektur um die Anzahl der Freiheitsgrade bei
2
der Schätzung von ˆ
Unterschiede zwischen FML und RML bei Level-1-Schätzung
gering, jedoch größer bei der Schätzung von T (auf Level 2),
insbesondere wenn die Anzahl der Level-2-Einheiten klein ist
(höhere Werte für die Varianzen von T)
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 10
Schätzung eines allgemeinen linearen
2-Ebenen-Modells (4)
Schätzmethoden in HLM:
•
•
Full Maximum Likelihood
Restricted Maximum Likelihood
Schätzmethoden in MLwiN:
•
•
Iterative Generalized Least Squares (IGLS)
Markov Chain Monte Carlo (MCMC)
Schätzmethoden in STATA:
Maximum Likelihood (im Programm gllam)
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 11
Weitere Modellansätze (1)
Discrete Choice-Modelle:
•
Logit-Modelle:
Yij~Bin(1,Πij) oder gruppiert Bin(nij, Πij)
f ( ij )   0  1 xij  u j
mit
z.B. Logit:
•
log
 ij
  0  1 xij  u j
1   ij
Count-Data-Modelle:
Yij ~Poisson(λij) oder gruppiertes Poisson (nij, λij)
z.B.
ij  exp   0  1 X 1ij   ij 
 0 j   0  u0 j
•
Multinomiale Modelle mit geordneten Kategorien (q):
(s)
ij
E (Y
)
s
(s)
ij
   ij( n )
n 1
mit s=1,…, q-1, undγij(s): kumulative Wahrscheinlichkeit
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 12
Weitere Modellansätze (2)
Logit-Link (proportional odds)
  ij( s ) 
log 
  ( s )  1 xij  u(s)

j
(
s
)
1 
ij 

•
Mit α(s) thresholds
Multinomiale Modelle mit ungeordneten Kategorien:
Yij~(1,2,…, q) ungeordnete Kategorien
Link-Funktion:
  ij( s ) 
log  ( q )    0( s )  1( s ) xij  u (js )
 
 ij 
mit s=1,…, q-1
q

n 1
Wirtschaftswissenschaften
(n)
ij
1
www.wiwi.uni-frankfurt.de
Seite 13
Weitere Modellansätze (3)
Verweildauer-Modelle:
•
Semi-parametrisches Cox-Modell
h(tij , xij )   (tij ) exp( xij  j )
•
Diskretes Hazardraten-Modell
 h 
log  tij    t  xtij  j  u j
1 h 
tij 

Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 14
Schätzmethoden für Discrete Choice
und Verweildauer-Modelle
In HLM:
•
Penalized Quasi-Maximum Liklihood (PQL) (siehe Raudenbush, Bryk
(2002),S.454ff.; Leeuw, Meijer (2008), S.348ff.)
•
High-Order Laplace (Siehe Raudenbush, Bryk (2002),S.460ff.; Leeuw,
Meijer (2008), S.357ff.)
In MLwiN:
•
Penalized Quasi Maximum Likelihood (PQL)
•
Marginal Quasi Maximum Likelihood (MQL) (Raudenbush, Bryk (2002),
•
S.460ff.)
•
Markov Chain Monte Carlo (MCMC) oder Gibbs Sampling
(Raudenbush,Bryk (2002), S.427ff.; Leeuw, Meijer (2008),S.365ff.)
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 15
Linked Employer-Employee-Modelle (1)
In der ökonometrischen Forschung:
Linked Employer-Employee-Modelle (LEEP) als 2-Ebenen-Ansatz
mit i=1,2,…,N. Individuen und j=1,2,…,j Betrieben über die Zeit,
t=1,…, T
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 16
Linked Employer-Employee-Modelle (2)
Das LEEP-Modell ist eine Verallgemeinerung des traditionellen
Paneldaten-Modells:
y = xβ+Dθ+Fψ+ε (1)
wobei:
y = (N·T×1)-Vektor
x = (N·T×K)-Matrix mit K erklärenden Variablen
D = (N·T×N)-Matrix von (0;1)-Indikatoren für N Beschäftigte
F = (N·T×J)-Matrix von (0;1)-Indikatoren für J Betriebe, in denen N
Personen in T Perioden arbeiten
ε= Störvariable mit
E(εit∣i,t,x) = 0
Var(εit∣i,t,x) < ∞
und orthogonal zu allen anderen Effekten.
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 17
Linked Employer-Employee-Modelle (3)
Personen- bzw. Firmeneffekt kann zerlegt werden in:
θi = αi + uiη
ψi = Φj+qjρ
Mit αi: unbeobachtete individuelle Heterogenität
ui: Vektor von zeitinvarianten individuellen Charakteristika
Φj: unbeobachtete Firmenheterogenität
qj: Vektor von zeitinvarianten Firmen-Charakteristika
Da αi und Φj sind korreliert mit den beobachtbaren Variablen,
deshalb: Random effects-Methoden führen zu inkonsistenten
Schätzern und fixed effects-Ansätze sind notwendig.
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 18
Schätzung: Fixed Effects-Ansatz (1)
Die Normalgleichungen für eine Kleinst-Quadrate-Schätzung haben
das Problem einer hohen Dimensionalität zu lösen. Statistische
Approximationen haben Abowd, Kramarz und Margolis (1999) und
Abowd, Finer und Kramarz (1999) vorgeschlagen. Abowd, Creecy
und Kramarz (2002) haben einen Algorithmus entwickelt, der eine
exakte Kleinstquadrate-Schätzung erlaubt. Die vollständige OLSSchätzung für Gleichung(1) lautet:
X ' X
D' X

 F ' X
Wirtschaftswissenschaften
X 'D
D'D
F 'D
X ' F     X ' y
D ' F       D ' y  (2)
  

F ' F     F ' y 
www.wiwi.uni-frankfurt.de
Seite 19
Schätzung: Fixed Effects-Ansatz (2)
Identifikation der Individual- und Firmeneffekte durch Gruppenbildung:
•
Anwendung der Graphentheorie zur Bildung von verbundenen
Personen und Firmen (Kovarianzanalyse)
•
Eine Gruppe von Personen und Firmen ist verbunden, wenn die
Gruppe alle Beschäftigten enthält, die jemals für irgendeine Firma
in der Gruppe gearbeitet haben, und alle Firmen enthält, bei denen
irgendein Beschäftigter jemals gearbeitet hat (Mobilitätsnetwork)
•
Unter statistischem Aspekt führen vorhandene Gruppen von
Beschäftigten und Firmen zu einer block-diagonalen Struktur der
Normalgleichungen und erlauben präzise Identifikationskriterien
(Searle, et al. (1992))
•
In jeder Gruppe g ist der Gruppenmittelwert y und Ng-1+Jg-1
Personen- und Firmeneffekten identifiziert. Nach der Konstruktion
von G Gruppen sind (N+J-G) Effekte zu schätzen.
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 20
Schätzung: Fixed Effects-Ansatz (3)
Firma
Person
Gruppe
Firma
Person
1
1
1
1
1
1
2
1
2
2
2
1
1
3
3
2
3
1
4
4
3
3
1
5
5
3
4
1
4
5
2
5
5
2
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 21
Schätzung: Fixed Effects-Ansatz (4)
Normalgleichungen nach Gruppierung:
 X 'X
D 'X
 1
 F1 ' X

 D2 ' X
 F2 ' X


 DG ' X

 FG ' X
X 'D
D1 ' D1
F1 ' D1
0
0
X ' F1
D1 ' F1
F1 ' F1
0
0
X ' D2
0
0
D2 ' D2
F2 ' D2
X ' F2
0
0
D2 ' F2
F2 ' F2
X ' DG
0
0
0
0
0
0
0
0
0
0
0
0
DG ' DG
FG ' DG
Wirtschaftswissenschaften
    X ' y 
  D ' y
 1   1 
  1   F1 ' y 
  


D
'
y
2
2
   

  2   F2 ' y 
  

  

DG ' FG   G   DG ' y 
  

FG ' FG   G   FG ' y 
X ' FG
0
0
0
0
www.wiwi.uni-frankfurt.de
Seite 22
Schätzung: Fixed Effects-Ansatz (5)
Es wird ein „fixed effects“ – Ansatz mit Gradienten-Verfahren von
Dongarra, et al.(1991) verwendet.
Alternativer Ansatz: Spell-fixed effects (Andrews, Schank, Upward
(2004)). Für jeden Beschäftigten innerhalb einer Firma („spell“) variiert
weder θi noch ψj:
λs = θi + ψj „spell“ – Heterogenität
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 23
Schätzung: Mixed Effects–Methoden (1)
Mixed effects-Modelle enthalten zufällige und fixe Effekte, sind im
Sinne von Paneldatenmodellen reine random effects-Modelle. Es gilt:
E i   0
und
 
E X   0
 
und
V  i    i
 
V X 
 
Das Gleichungssystem für das Mixed Modell (Searle, Casella and
McCulloch (1992)) lautet:
 X '  1 X

  D '  1
  F '  X
 
Wirtschaftswissenschaften
     X '  1 y 
  



D
'


 D '  1


1


-  
 F '    D F  +       F '   y 

 
    
X '  1  D F 
www.wiwi.uni-frankfurt.de
Seite 24
Schätzung: Mixed Effects–Methoden (2)
Die Vektoren [θ‘ , ψ’] folgen multivariaten Normalverteilungen und sind
mit ML zu schätzen.
Correlated random effects-Modell (Chamberlain(1984), Mundlak(1978))
xit  vi   it
Corr vi ,  i   0
V  it   
und
Wirtschaftswissenschaften
Corr  it ,  ns   0
www.wiwi.uni-frankfurt.de
Seite 25
Schätzung: Mixed Effects–Methoden (3)
Einsetzen in Ausgangsgleichung (1) ergibt für jedes Individuum i in
Periode t:
 yit   i  J (i ,t )   it 
x   

v


i
it
 it  

wobei  i   i  vi  and  it   it   it 
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 26
Methoden – Vergleich (1)
Random effects-Modelle werden gegenüber fixed effects-Modellen bei
Hausman-Test üblicherweise abgelehnt, da Abhängigkeiten zwischen
Regressoren und Störterm.
Fixed effects-Schätzer lassen dagegen kein Berücksichtigung von
Dummy-Variablen zu
Daher: Kombination zwischen beiden Ansätzen (Hübler(2006)) durch
Ersetzen des zufälligen individuellen Effekts durch den geschätzten
fixed effect.
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 27
Methoden – Vergleich (2)
Beispiel: Zwei-Ebenen-Modell ohne reinen Individualeffekt
Yij = X‘ijβ+ψj+εij
mit ψ j allgemeiner Firmeneffekt
Grundgedanke: Falls die Abhängigkeit zwischen den Regressoren und
Störgrößen allein auf ψ j zurückzuführen ist, kann der bedingte
Erwartungswert von ψ j explizit als deterministische Größe modelliert
werden und als Within-Schätzer eines FEM ermittelt werden:
ˆ j  y j  y   x *j  x * '  *
mit β* als Koeffizientenvektor ohne Konstante.
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 28
Methoden – Vergleich (3)
Im zweiten Schritt wird die Ausgangsgleichung um ein Vielfaches
der Schätzung von
E  j   ˆ j
erweitert:
ˆ j   j
Eine konsistente Schätzung erfolgt durch einen FE-Ansatz, wobei
die Abweichungen (ˆ j  1) gegen Null konvergieren sollten.
Bei signifikanten Abweichungen liegt Fehlspezifikation vor.
Die OLS-Schätzung
Yij  X ij    jˆ j   ij
führt zu neuen Schätzungen für den Firmeneffekt ˆ j usw., bis der
geschätzte Koeffizientenvektor ˆ( s ) gegen 1 tendiert.
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 29
Fazit
•
Unabhängige methodische Entwicklungen in der Ökonomie
einerseits, in der Soziologie, Politikwissenschaft, Pädagogik
•
Fixed effects-Panelmodelle vs. Random coefficient-Modelle
•
Fixed effects-Modelle berücksichtigen im Längsschnitt 2
Ebenen (Beschäftigte und Betrieb)
•
Random coefficient-Modelle berücksichtigen mehr als 2
Ebenen, jedoch Korrelation zwischen erklärenden Variablen
und Störterm
Wirtschaftswissenschaften
www.wiwi.uni-frankfurt.de
Seite 30
Herunterladen