Zur Erinnerung: Annahmen Vorlesung 5: Spezifikation der Regressionsfunktion 1. 2. Definition: Linearität und Additivität Nicht-lineare Modelle a. b. c. 3. Nicht-additive Modelle a. b. 4. 5. Einige Beispiele Transformation in ein lineares Regressionsmodell Interpretation der Regressionskoeffizienten ausgewählter nichtlinearer Modelle Interaktionseffekte mit kategorialen Variablen Interaktionseffekte mit kontinuierlichen Variablen Auswirkungen einer Fehlspezifikation Tests auf Fehlspezifikation der funktionalen Form a. b. c. Vergleich hierarchischer Modelle (F Test) Vergleich nicht hierarchischer Modelle (Davidson-MacKinnon Test) Regression Specification Error Test (RESET) von Ramsey (1969) Teil 1 Definition Linearität und Additivität Linearität 15 y 10 5 0 0 1 2 3 4 5 4 5 x nicht-linear: y = √(x) 1.5 y 1 .5 0 ¾ Unabhängigkeit von der Größe von x 2 2.5 • Der Effekt der unabhängigen Variablen x ist immer gleich groß, egal welchen Wert die Variable x aufweist. 20 linear: y = 2 + 3*x 0 1 2 3 x Additivität 15 y 10 5 0 0 1 2 3 4 5 x nicht-additiv: y = 2 + 0,5*x1 *x2 10 • Der Effekt der unabhängigen Variablen xi hängt nicht davon ab, welche Werte andere unabhängige Variablen xj haben. 20 additiv: y = 2 + 3*x1 – 1,5*x2 8 6 x2=2 4 y x2=1 2 ¾ Unabhängigkeit von anderen Variablen xj x2=3 0 1 2 3 x 4 5 Zusammenfassung Linear-additive Modelle implizieren kontextunabhängige Effekte! Effekte sind unabhängig – von der Größe der jeweiligen unabhängigen Variablen – von den Werten der anderen unabhängigen Variablen Teil 2 Nicht-lineare Modelle Teil 2.a Einige Beispiele Polynomregression y = β 0 + β1 x1 + β 2 x12 + β 3 x13 + K + β m x1m + u 60 • erlaubt zunehmende, abnehmende und sich umkehrende Effekte von x 0 10 20 y 30 40 50 y = 30 − 9 x + 3 x 2 0 1 2 3 x 4 5 Exponentialmodell (Typ 1) y = β 0 ⋅ x1β1 ⋅ x2β 2 ⋅ u ⇔ ln y = ln β 0 + β1 ln x1 + β 2 ln x2 + ln u 60 • erlaubt zunehmende oder abnehmende Effekte • entspricht Modell mit Logarithmen • auch bei schiefer Verteilung, Heteroskedaszität 0 10 20 y 30 40 50 β1 > 1 β1 = 1 β1 < 1 0 .5 1 x 1.5 2 Exponentialmodell (Typ 2) y = exp( β 0 + β1 x1 + β 2 x2 + u ) ⇔ ln y = β 0 + β1 x1 + β 2 x2 + u 60 • erlaubt zunehmende oder abnehmende Effekte • entspricht semi-logarithmischem Modell • auch bei schiefer Verteilung, Heteroskedaszität 10 20 y 30 40 50 β1 > 0 0 β1 < 0 0 .5 1 x 1.5 2 Teil 2.b Transformation in ein lineares Modell Polynomregression Modell y = β 0 + β1 x1 + β 2 x12 + β 3 x13 + K + β m x1m + u Definiere z1 = x1 z 2 = x12 z3 = x13 z m = x1m OLS - Schätzung mit transformierten Variablen y = δ 0 + δ 1 z1 + δ 2 z 2 + δ 3 z3 + K + δ m z m + v Koeffizientenvergleich δ 0 = β 0 δ 1 = β1 δ 2 = β 2 δ 3 = β 3 δ m = β m Exponentialmodell (Typ 1) Modell y = β 0 ⋅ x1β1 ⋅ x2β 2 ⋅ u ⇔ ln y = ln β 0 + β1 ln x1 + β 2 ln x2 + ln u Definiere y * = ln y z1 = ln x1 z 2 = ln x2 OLS − Schätzung mit transformierten Variablen y * = δ 0 + δ 1 z1 + δ 2 z 2 + v Koeffizientenvergleich δ 0 = ln β 0 δ 1 = β1 δ 2 = β 2 Exponentialmodell (Typ 2) Modell y = exp( β 0 + β1 x1 + β 2 x2 + u ) ⇔ ln y = β 0 + β1 x1 + β 2 x2 + u Definiere y * = ln y OLS − Schätzung mit transformierten Variablen y * = δ 0 + δ 1 x1 + δ 2 x2 + v Koeffizientenvergleich δ 0 = β 0 δ 1 = β1 δ 2 = β 2 Nicht transformierbar y = β 0 ⋅ x1β1 + u ⇔ ln y = ln( β 0 ⋅ x1β1 + u ) wegen additivem Fehlerterm • Alle nicht-linearen Modelle, die sich nicht durch Variablentransformation in ein linear-additives Modell (mit additivem Fehlerterm) überführen lassen, können nicht mit OLS geschätzt werden. • Genauer: Alle nicht-linearen Modelle, bei denen die Optimierungsfunktion keine lineare Funktion der Regressionskoeffizienten ist, können nicht mit OLS geschätzt werden. Teil 2.c Interpretation der Regressionskoeffizienten nicht-linearer Modelle Quadratische Terme y = β 0 + β1 x1 + β 2 x12 + u Effekt β1 + 2 β 2 x1 Minimum / Maximum − β1 2 β 2 60 Modell 50 1,5 = − (−9) 2 ⋅ 3 30 40 Beispiel : y = 30 − 9 x + 3 x 2 0 10 20 y y = −9 + 2 ⋅ 3 x 0 1 2 3 x 4 5 Logarithmierte Variablen Modell Abhängig Unabhängig Interpretation a y x ∆y = β1∆x b y log x ∆y = ( β1 / 100)%∆x c log y x %∆y = (100 β1 )∆x d log y log x %∆y = β1 %∆x Wenn man x um eine Einheit erhöht, verändert sich y um β1 Einheiten. b. Näherungsweise (wenn β1 < 0,25): Wenn man x um ein Prozent erhöht, verändert sich y um β1/100 Einheiten. c. Näherungsweise (wenn β1 < 0,25): Wenn man x um eine Einheit erhöht, verändert sich y um 100β1 Prozent (SemiElastizität). d. Wenn man x um ein Prozent erhöht, verändert sich y um β1 Prozent (Elastizität). a. Teil 3 Nicht-additive Modelle Interaktion mit einer kategorialen Variablen Beispiel: Bildungsrenditen nach Geschlecht income = 3,70 + 1,37 ⋅ educ − 0,46 ⋅ sex − 0,98 ⋅ iakt mit iakt = sex ⋅ educ Geschlechterunterschied (Niveau) : − 0,46 Bildungseffekt (Männer) : 1,37 30 Bildungseffekt (Frauen) : 1,37 − 0,98 = 0,39 income/Fitted values 15 20 25 Männer 5 10 Frauen 8 10 12 14 educ 16 18 Interaktion mit einer kontinuierlichen Variablen Beispiel: Bildung und Berufserfahrung wage = 271,9 + 35,1 ⋅ educ − 32,7 ⋅ exper − 3,9 ⋅ iakt mit iakt = exper ⋅ educ = 271,9 + 35,1 ⋅ educ + (−32,7 − 3,9 ⋅ educ) ⋅ exper = 271,9 + (35,1 − 3,9 ⋅ exper ) ⋅ educ − 32,7 ⋅ exper Effekt Education | Experience -60 -100 -40 -90 -20 e duc e xper 0 -80 20 -70 40 Effekt Experience | Education 8 10 12 14 x 16 18 0 5 10 15 x 20 25 Teil 4 Auswirkungen einer Fehlspezifikation der funktionalen Form Verzerrung durch Unterspezifikation income = β 0 + β1educ + β 2 sex + β 3 ⋅ sex ⋅ educ • Wenn geschlechtsspezifische Bildungsrenditen existieren, vernachlässigt folgendes Modell eine wichtige Variable: income = β 0 + β1educ + β 2 sex wage = β 0 + β1educ + β 2 exper + β 3 ⋅ exper ⋅ educ • Wenn die Effekte von Ausbildung und Berufserfahrung gegenseitig voneinander abhängen, vernachlässigt folgendes Modell eine wichtige Variable: wage = β 0 + β1educ + β 2 exper Heteroskedastizität 5 -10 10 -5 r esidwrong 0 income/Fitted values 15 20 5 25 30 10 • Fehlspezifikation: Ignorierung der Geschlechterunterschiede in den Bildungsrenditen. • Die Fehlerterme sind weiterhin im Mittel Null, aber die Varianz der Fehlerterme steigt mit zunehmender Bildung. 8 10 12 14 educ 16 18 8 10 12 14 educ 16 18 Teil 5 Tests auf Fehlspezifikation der funktionalen Form Exkurs: Hierarchische Modelle • Zwei Modelle A und a sind hierarchisch (nested), wenn die Parameter des Modells a eine Teilmenge der Parameter des Modells A sind. • Das (restringierte) Modell a ergibt sich aus dem (nicht restringierten) Modell A, indem man für die Parameter in A lineare Restriktionen formuliert. (nicht restringiertes) Modell A : y = β 0 + β1 x1 + β 2 x2 + β 3 x3 + u Zwei Restriktionen : β 2 = 0 und β 3 = 0 ergibt (restringiertes) Modell a : y = β 0 + β1 x1 + u Exkurs: Test linearer Restriktionen mit einem F-Test (nicht restringiertes) Modell A : y = β 0 + β1 x1 + β 2 x2 + β 3 x3 + u Zwei Restriktionen : β 2 = 0 und β 3 = 0 ergibt (restringiertes) Modell a : y = β 0 + β1 x1 + u H 0 : β 2 = 0 und β 3 = 0 F= H1: H 0 trifft nicht zu ( SSRr − SSRur ) q SSRur (n − k − 1) q = Anzahl der Restriktionen SSRr = Summe der quadrierten Residuen im restringierten Modell a SSRur = Summe der quadrierten Residuen im nicht restringierten Modell A k = Anzahl der Regressionskoeffizienten (ohne Konstante) in Modell A n = Stichprobenumfang Anwendung: Test auf Fehlspezifikation der funktionalen Form 1. Test auf Weglassung quadratischer, kubischer usw. Terme der x-Variablen 2. Test auf Weglassung allgemeiner nichtlinearer Abhängigkeiten (Trick: Test auf Weglassung quadratischer, kubischer usw. Terme der Modellprognosen als x-Variablen) ¾ Regression Specification Error Test (RESET) von Ramsey (1969) - einfach möglich mit Stata: Kommando ovtest Anwendung: Test auf Fehlspezifikation der funktionalen Form 1. Weglassung x-Variablen y = β 0 + β1 x1 + β 2 x12 + β 3 x13 + β 4 x2 + β 5 x22 + β 6 x23 + u H 0 : β2 = β3 = β5 = β6 = 0 2. Weglassung Modellprognosen y = β 0 + β1 x1 + β 2 x2 + β 3 x3 + u Prognose : yˆ = βˆ0 + βˆ1 x1 + βˆ2 x2 + βˆ3 x3 Schritt 1 : Schritt 2 : y = δ 0 + δ 1 x1 + δ 2 x2 + δ 3 x3 + δ 4 yˆ 2 + δ 5 yˆ 3 + v H0 : δ 4 = δ5 = 0 Vergleich nicht hierarchischer Modelle • Nicht hierarchische Modelle: Modell B ergibt sich nicht durch lineare Parameterrestriktionen aus Modell A • Modell A : y = β 0 + β1 x1 + β 2 x2 + u Modell B : y = δ 0 + δ 1 ln x1 + δ 2 ln x2 + u • Test von Davidson / MacKinnon (1981) – weitere Einzelheiten bei WO (294-295) Zum Schluss Zusammenfassung Linear-additive Modelle Alternativen Folgen einer Fehlspezifikation Gegenmaßnahmen Kontextunabhängigkeit Nicht-lineare Funktionen Interaktionseffekte Verzerrungen Heteroskedastizität Theorie Spezifikationstests Wichtige Fachausdrücke Deutsch Englisch Deutsch Englisch linear-additives Modell linear-additive model restringiertes Modell restricted model nicht-lineares Modell non-linear model nicht restringiertes Modell unrestricted model Interaktionseffekt interaction effect Restriktion restriction hierarchisches Modell nested model Spezifikationstest specification test Weiterführende Literatur • Berry / Feldman 1985 – Kapitel 5 (BF 51-72): Fehlspezifikation der funktionalen Form gewidmet • Wooldridge (2003) – Abschnitt 6.2 (WO 187-196): Überblick über nicht-lineare Funktionen und die Modellierung nicht-additiver Effekte mit Interaktionen unabhängiger Variablen. – Abschnitt 7.4 (WO 232-240): Interaktionseffekte mit kategorialen Variablen – Abschnitt 9.1 (WO 289-295): Tests auf Fehlspezifikation der funktionalen Form – Zum Verständnis benötigt man Kenntnisse des F-Testes: Abschnitt 4.5 (WO 142-154), für alle Teilnehmer kopiert. – Anhang A.4 (WO 682-689): mathematische Grundlagen quadratischer, logarithmischer und exponentieller Funktionen