Mehrebenen-Modelle: Methodische Ansätze und Schätzung Reinhard Hujer J.W.Goethe-Universität Frankfurt/M. Nürnberg, 30. Oktober 2008 Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de www.wiwi.uni-frankfurt.de Seite 1 Problemstellung (1) Mikrodatensätze haben eine hierarchische Struktur, z.B. 3 Ebenen: • Beschäftigte: i = 1, …, N • Betriebe: j = 1, …, J • Sektoren m = 1, …, M Datenlage: • Die abhängige Variable Y wird auf Ebene 1 gemessen • Die unabhängigen Variablen werden auf allen Ebenen erhoben • Gruppen auf den unterschiedlichen Ebenen können unterschiedliche Größe haben • Auf jeder Ebene werden spezifische Modellgleichungen erstellt Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 2 Problemstellung (2) Probleme bei Nichtberücksichtigung der Mehrebenenstruktur: • Beobachtungen innerhalb einer Gruppe sind im allgemeinen nicht unabhängig voneinander, d.h. sie können untereinander stärker korrelieren als Beobachtungen aus anderen Gruppen, z.B. Kontexteffekte, gemeinsame Sozialisation • Statistische Standardmethoden sind nicht robust gegenüber der Verletzung der Unabhängigkeitsannahme Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 3 Modellvarianten der Mehrebenen-Ansätze Zwei grundsätzliche, weitgehend unabhängige Modell-Entwicklungen: • In der Soziologie, Psychologie, Pädagogik, Politikwissenschaft: Random-Coefficient-Modelle mit mehr als 2 Ebenen • In der Ökonomie: Fixed Effects Panel-Modelle im Rahmen der ökonometrischen Analyse von Linked Employer-EmployeeDatensätzen (z.B. LIAB) Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 4 Random Coefficient-Modelle (1) Zwei-Ebenen-Modelle: Regressionsgleichung auf Ebene 1: Yij 0 j 1 j X ij eij mit i = Index für Ebene 1 (z.B. Beschäftigte) j = Index für Ebene 2 (z.B. Betrieb) eij = individuenspezifischer Fehlerterm β0j und β1j variieren über die Ebenen-2-Einheiten: 0 j 00 01Z j u0 j 1 j 10 11Z j u1 j u0j und u1j sind gruppenspezifische Zufallsvariablen. Deshalb: „Random Coefficient“-Modell Beispiel: Yij = Einkommen Xij = Qualifikationsniveau Zj = Betriebsgröße Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 5 Random Coefficient-Modelle (2) Zwei-Ebenen-Modelle: Yij 00 01Z j u0 j 10 X 1 j 11Z j X 1 j u1 j X 1 j eij Nach Umformen: Yij 00 01Z j 10 X ij 11Z j X ij u1 j X ij u0 j eij fixer Teil zufälliger Teil mit 11Z j X ij = Cross-Level-Interaktion u1 j X ij = Heteroskedastizität Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 6 Random Coefficient-Modelle (3) Varianzen und Kovarianzen: Vareij 2 ; Eeij 0 Var u0 j 00 ; E u0 j 0 Var u1 j 11; E u1 j 0 Covu0 j , u1 j 01 Coveij , u j 0 Varianz in der abhängigen Variablen kann auf folgende Ursachen zurückgeführt werden: • Level-1-Zufallseinflüsse eij • Level-2-spezifische Zufallseffekte u j • Systematische Effekte von Level-1-Prädiktoren • Systematische Gruppeneffekte von Level-2-Prädiktoren • Interaktionen zwischen Level-1- und Level-2-Prädiktoren Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 7 Schätzung eines allgemeinen linearen 2-Ebenen-Modells (1) Modell-Ansatz: Yij X ij' j ij mit ij ~ N 0, 2 i = 1, …, N Individuen j = 1, …, J Betriebe βj : (K*1)-Vektor der Parameter variiert über Betriebe Xij : (K*1)-Vektor von erklärende Variablen (Konstante und (K-1) individuelle Charakteristika) Annahme: βj variiert nicht nur zufällig über die Betriebe, sondern ist auf der Ebene 2 abhängig von einem (1*L)-Vektor zj (Betriebsmerkmale). Mit Z j I k z j als (K*K·L)-Matrix ergibt sich: wobei j Z j u j Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 8 Schätzung eines allgemeinen linearen 2-Ebenen-Modells (2) mit γ als (K·L*1) Parameter-Vektor u j ~ N 0, T 00 . T Var u j . . u 0 . . . . . 0K . KK Für die Kovarianzen gilt: Cov ij , ukj 0 Covxkij , ij 0 CovZ lj , ij 0 Covxkij , ukj 0 CovZ lj , u kj 0 für alle k, k´ und l und mit k=1,…,K und l = 1,…,L. Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 9 Schätzung eines allgemeinen linearen 2-Ebenen-Modells (3) Schätzmethoden (Raudenbush,Bryk (2002), S.408ff.): • • • • Da T und σ2 nicht bekannt sind, ist eine GLS-Schätzung nicht möglich Full Maximum Likelihood-Schätzung (FML) in Abhängigkeit von γ,σ2 und T. Jedoch: Varianzen und Kovarianzen sind abhängig von den Regressionsparametern Deshalb: Restricted Maximum Likelihood-Schätzung (RML): Berücksichtigt die Korrektur um die Anzahl der Freiheitsgrade bei 2 der Schätzung von ˆ Unterschiede zwischen FML und RML bei Level-1-Schätzung gering, jedoch größer bei der Schätzung von T (auf Level 2), insbesondere wenn die Anzahl der Level-2-Einheiten klein ist (höhere Werte für die Varianzen von T) Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 10 Schätzung eines allgemeinen linearen 2-Ebenen-Modells (4) Schätzmethoden in HLM: • • Full Maximum Likelihood Restricted Maximum Likelihood Schätzmethoden in MLwiN: • • Iterative Generalized Least Squares (IGLS) Markov Chain Monte Carlo (MCMC) Schätzmethoden in STATA: Maximum Likelihood (im Programm gllam) Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 11 Weitere Modellansätze (1) Discrete Choice-Modelle: • Logit-Modelle: Yij~Bin(1,Πij) oder gruppiert Bin(nij, Πij) f ( ij ) 0 1 xij u j mit z.B. Logit: • log ij 0 1 xij u j 1 ij Count-Data-Modelle: Yij ~Poisson(λij) oder gruppiertes Poisson (nij, λij) z.B. ij exp 0 1 X 1ij ij 0 j 0 u0 j • Multinomiale Modelle mit geordneten Kategorien (q): (s) ij E (Y ) s (s) ij ij( n ) n 1 mit s=1,…, q-1, undγij(s): kumulative Wahrscheinlichkeit Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 12 Weitere Modellansätze (2) Logit-Link (proportional odds) ij( s ) log ( s ) 1 xij u(s) j ( s ) 1 ij • Mit α(s) thresholds Multinomiale Modelle mit ungeordneten Kategorien: Yij~(1,2,…, q) ungeordnete Kategorien Link-Funktion: ij( s ) log ( q ) 0( s ) 1( s ) xij u (js ) ij mit s=1,…, q-1 q n 1 Wirtschaftswissenschaften (n) ij 1 www.wiwi.uni-frankfurt.de Seite 13 Weitere Modellansätze (3) Verweildauer-Modelle: • Semi-parametrisches Cox-Modell h(tij , xij ) (tij ) exp( xij j ) • Diskretes Hazardraten-Modell h log tij t xtij j u j 1 h tij Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 14 Schätzmethoden für Discrete Choice und Verweildauer-Modelle In HLM: • Penalized Quasi-Maximum Liklihood (PQL) (siehe Raudenbush, Bryk (2002),S.454ff.; Leeuw, Meijer (2008), S.348ff.) • High-Order Laplace (Siehe Raudenbush, Bryk (2002),S.460ff.; Leeuw, Meijer (2008), S.357ff.) In MLwiN: • Penalized Quasi Maximum Likelihood (PQL) • Marginal Quasi Maximum Likelihood (MQL) (Raudenbush, Bryk (2002), • S.460ff.) • Markov Chain Monte Carlo (MCMC) oder Gibbs Sampling (Raudenbush,Bryk (2002), S.427ff.; Leeuw, Meijer (2008),S.365ff.) Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 15 Linked Employer-Employee-Modelle (1) In der ökonometrischen Forschung: Linked Employer-Employee-Modelle (LEEP) als 2-Ebenen-Ansatz mit i=1,2,…,N. Individuen und j=1,2,…,j Betrieben über die Zeit, t=1,…, T Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 16 Linked Employer-Employee-Modelle (2) Das LEEP-Modell ist eine Verallgemeinerung des traditionellen Paneldaten-Modells: y = xβ+Dθ+Fψ+ε (1) wobei: y = (N·T×1)-Vektor x = (N·T×K)-Matrix mit K erklärenden Variablen D = (N·T×N)-Matrix von (0;1)-Indikatoren für N Beschäftigte F = (N·T×J)-Matrix von (0;1)-Indikatoren für J Betriebe, in denen N Personen in T Perioden arbeiten ε= Störvariable mit E(εit∣i,t,x) = 0 Var(εit∣i,t,x) < ∞ und orthogonal zu allen anderen Effekten. Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 17 Linked Employer-Employee-Modelle (3) Personen- bzw. Firmeneffekt kann zerlegt werden in: θi = αi + uiη ψi = Φj+qjρ Mit αi: unbeobachtete individuelle Heterogenität ui: Vektor von zeitinvarianten individuellen Charakteristika Φj: unbeobachtete Firmenheterogenität qj: Vektor von zeitinvarianten Firmen-Charakteristika Da αi und Φj sind korreliert mit den beobachtbaren Variablen, deshalb: Random effects-Methoden führen zu inkonsistenten Schätzern und fixed effects-Ansätze sind notwendig. Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 18 Schätzung: Fixed Effects-Ansatz (1) Die Normalgleichungen für eine Kleinst-Quadrate-Schätzung haben das Problem einer hohen Dimensionalität zu lösen. Statistische Approximationen haben Abowd, Kramarz und Margolis (1999) und Abowd, Finer und Kramarz (1999) vorgeschlagen. Abowd, Creecy und Kramarz (2002) haben einen Algorithmus entwickelt, der eine exakte Kleinstquadrate-Schätzung erlaubt. Die vollständige OLSSchätzung für Gleichung(1) lautet: X ' X D' X F ' X Wirtschaftswissenschaften X 'D D'D F 'D X ' F X ' y D ' F D ' y (2) F ' F F ' y www.wiwi.uni-frankfurt.de Seite 19 Schätzung: Fixed Effects-Ansatz (2) Identifikation der Individual- und Firmeneffekte durch Gruppenbildung: • Anwendung der Graphentheorie zur Bildung von verbundenen Personen und Firmen (Kovarianzanalyse) • Eine Gruppe von Personen und Firmen ist verbunden, wenn die Gruppe alle Beschäftigten enthält, die jemals für irgendeine Firma in der Gruppe gearbeitet haben, und alle Firmen enthält, bei denen irgendein Beschäftigter jemals gearbeitet hat (Mobilitätsnetwork) • Unter statistischem Aspekt führen vorhandene Gruppen von Beschäftigten und Firmen zu einer block-diagonalen Struktur der Normalgleichungen und erlauben präzise Identifikationskriterien (Searle, et al. (1992)) • In jeder Gruppe g ist der Gruppenmittelwert y und Ng-1+Jg-1 Personen- und Firmeneffekten identifiziert. Nach der Konstruktion von G Gruppen sind (N+J-G) Effekte zu schätzen. Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 20 Schätzung: Fixed Effects-Ansatz (3) Firma Person Gruppe Firma Person 1 1 1 1 1 1 2 1 2 2 2 1 1 3 3 2 3 1 4 4 3 3 1 5 5 3 4 1 4 5 2 5 5 2 Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 21 Schätzung: Fixed Effects-Ansatz (4) Normalgleichungen nach Gruppierung: X 'X D 'X 1 F1 ' X D2 ' X F2 ' X DG ' X FG ' X X 'D D1 ' D1 F1 ' D1 0 0 X ' F1 D1 ' F1 F1 ' F1 0 0 X ' D2 0 0 D2 ' D2 F2 ' D2 X ' F2 0 0 D2 ' F2 F2 ' F2 X ' DG 0 0 0 0 0 0 0 0 0 0 0 0 DG ' DG FG ' DG Wirtschaftswissenschaften X ' y D ' y 1 1 1 F1 ' y D ' y 2 2 2 F2 ' y DG ' FG G DG ' y FG ' FG G FG ' y X ' FG 0 0 0 0 www.wiwi.uni-frankfurt.de Seite 22 Schätzung: Fixed Effects-Ansatz (5) Es wird ein „fixed effects“ – Ansatz mit Gradienten-Verfahren von Dongarra, et al.(1991) verwendet. Alternativer Ansatz: Spell-fixed effects (Andrews, Schank, Upward (2004)). Für jeden Beschäftigten innerhalb einer Firma („spell“) variiert weder θi noch ψj: λs = θi + ψj „spell“ – Heterogenität Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 23 Schätzung: Mixed Effects–Methoden (1) Mixed effects-Modelle enthalten zufällige und fixe Effekte, sind im Sinne von Paneldatenmodellen reine random effects-Modelle. Es gilt: E i 0 und E X 0 und V i i V X Das Gleichungssystem für das Mixed Modell (Searle, Casella and McCulloch (1992)) lautet: X ' 1 X D ' 1 F ' X Wirtschaftswissenschaften X ' 1 y D ' D ' 1 1 - F ' D F + F ' y X ' 1 D F www.wiwi.uni-frankfurt.de Seite 24 Schätzung: Mixed Effects–Methoden (2) Die Vektoren [θ‘ , ψ’] folgen multivariaten Normalverteilungen und sind mit ML zu schätzen. Correlated random effects-Modell (Chamberlain(1984), Mundlak(1978)) xit vi it Corr vi , i 0 V it und Wirtschaftswissenschaften Corr it , ns 0 www.wiwi.uni-frankfurt.de Seite 25 Schätzung: Mixed Effects–Methoden (3) Einsetzen in Ausgangsgleichung (1) ergibt für jedes Individuum i in Periode t: yit i J (i ,t ) it x v i it it wobei i i vi and it it it Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 26 Methoden – Vergleich (1) Random effects-Modelle werden gegenüber fixed effects-Modellen bei Hausman-Test üblicherweise abgelehnt, da Abhängigkeiten zwischen Regressoren und Störterm. Fixed effects-Schätzer lassen dagegen kein Berücksichtigung von Dummy-Variablen zu Daher: Kombination zwischen beiden Ansätzen (Hübler(2006)) durch Ersetzen des zufälligen individuellen Effekts durch den geschätzten fixed effect. Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 27 Methoden – Vergleich (2) Beispiel: Zwei-Ebenen-Modell ohne reinen Individualeffekt Yij = X‘ijβ+ψj+εij mit ψ j allgemeiner Firmeneffekt Grundgedanke: Falls die Abhängigkeit zwischen den Regressoren und Störgrößen allein auf ψ j zurückzuführen ist, kann der bedingte Erwartungswert von ψ j explizit als deterministische Größe modelliert werden und als Within-Schätzer eines FEM ermittelt werden: ˆ j y j y x *j x * ' * mit β* als Koeffizientenvektor ohne Konstante. Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 28 Methoden – Vergleich (3) Im zweiten Schritt wird die Ausgangsgleichung um ein Vielfaches der Schätzung von E j ˆ j erweitert: ˆ j j Eine konsistente Schätzung erfolgt durch einen FE-Ansatz, wobei die Abweichungen (ˆ j 1) gegen Null konvergieren sollten. Bei signifikanten Abweichungen liegt Fehlspezifikation vor. Die OLS-Schätzung Yij X ij jˆ j ij führt zu neuen Schätzungen für den Firmeneffekt ˆ j usw., bis der geschätzte Koeffizientenvektor ˆ( s ) gegen 1 tendiert. Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 29 Fazit • Unabhängige methodische Entwicklungen in der Ökonomie einerseits, in der Soziologie, Politikwissenschaft, Pädagogik • Fixed effects-Panelmodelle vs. Random coefficient-Modelle • Fixed effects-Modelle berücksichtigen im Längsschnitt 2 Ebenen (Beschäftigte und Betrieb) • Random coefficient-Modelle berücksichtigen mehr als 2 Ebenen, jedoch Korrelation zwischen erklärenden Variablen und Störterm Wirtschaftswissenschaften www.wiwi.uni-frankfurt.de Seite 30