2. - Universität Freiburg

Werbung
6. Sitzung
Probleme der Modellspezifikation
Wichtige Spezifikationsprobleme:
1. Nicht-Berücksichtigung einer relevanten Variable
2. Berücksichtigung einer überflüssigen Variable
3. Falsche funktionale Form der Schätzgleichung
1
Alexander Spermann
Universität Freiburg
6. Sitzung
Probleme der Modellspezifikation
1. Nicht-Berücksichtigung einer relevanten Variable, die eigentlich in
der Schätzgleichung sein sollte:
1. y=α+β1x1+ β2x2+u
aber man berücksichtigt nicht, dass x2 auch eine Rolle
spielt und schätzt:
2. y=α+β1x1+ u
 es kommt zu einer Verzerrung
Konsequenzen: s.e. und t-Test sind ungültig
2
Alexander Spermann
Universität Freiburg
6. Sitzung
Probleme der Modellspezifikation
reg Lohn Schuljahre Berufserfahrung
Betriebszugehörigkeit
Source |
SS
df
MS
-------------+-----------------------------Model | 882.487532
3 294.162511
Residual | 3494.11654 22636 .154361042
-------------+-----------------------------Total | 4376.60407 22639
.19332144
Number of obs
F( 3, 22636)
Prob > F
R-squared
Adj R-squared
Root MSE
=
22640
= 1905.68
= 0.0000
= 0.2016
= 0.2015
= .39289
-----------------------------------------------------------------------------Lohn |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------Schuljahre |
.0590488
.0010871
54.32
0.000
.0569181
.0611795
Berufserfa~g | -.0003357
.0002757
-1.22
0.223
-.0008761
.0002046
Betriebszu~t |
.0132637
.0003219
41.20
0.000
.0126326
.0138947
_cons |
2.150714
.015924
135.06
0.000
2.119502
2.181926
-----------------------------------------------------------------------------reg Lohn Schuljahre Berufserfahrung
Source |
SS
df
MS
-------------+-----------------------------Model | 629.788755
2 314.894377
Residual | 3861.75221 22944 .168312073
-------------+-----------------------------Total | 4491.54096 22946 .195743962
Number of obs
F( 2, 22944)
Prob > F
R-squared
Adj R-squared
Root MSE
=
22947
= 1870.90
= 0.0000
= 0.1402
= 0.1401
= .41026
y=α+β1x1+ β2x2 +β3x3+u
Lohn= α+ β1Schuljahre + β2Berufserf
+ β3Betriebszug + u
-----------------------------------------------------------------------------Lohn |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------Schuljahre |
.0633375
.0011209
56.51
0.000
.0611405
.0655345
Berufserfa~g |
.0058886
.000238
24.74
0.000
.0054222
.0063551
_cons |
2.108452
.0164341
128.30
0.000
2.07624
2.140664
-----------------------------------------------------------------------------reg Lohn Schuljahre
Betriebszugehörigkeit
Source |
SS
df
MS
-------------+-----------------------------Model | 880.364848
2 440.182424
Residual | 3522.75625 22778 .154656082
-------------+-----------------------------Total | 4403.12109 22780 .193288898
Number of obs
F( 2, 22778)
Prob > F
R-squared
Adj R-squared
Root MSE
=
22781
= 2846.20
= 0.0000
= 0.1999
= 0.1999
= .39326
-----------------------------------------------------------------------------Lohn |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------Schuljahre |
.0589361
.0010812
54.51
0.000
.0568169
.0610553
Betriebszu~t |
.0129839
.0002677
48.50
0.000
.0124593
.0135086
_cons |
2.148751
.0150927
142.37
0.000
2.119168
2.178334
------------------------------------------------------------------------------
3
Alexander Spermann
Universität Freiburg
6. Sitzung
Probleme der Modellspezifikation
Wirkungen der Nichtberücksichtigung einer relevanten Variablen:
1.Beispiel: 1.
Wenn Betriebszug. fehlt, dann entsteht
eine
Verzerrung:
E(b2) =β2+Verzerrung
und x3
2. b2 = -0,0003357, bei einer Schätzung von x1, x2
b2 = 0,0058886 bei einer Schätzung von x1, x2
Ergebnisse: - b2 ist nach oben verzerrt bei einer Schätzung ohne
x3
- Überschätzung des Einflusses der erklärenden
Variable
- Grund: positive Korrelation zwischen x2 und x3
Verzerrung hängt ab von der Korrelation zwischen x2 und x3.
Je höher die Korrelation, desto größer die Verzerrung, d.h. keine
Verzerrung bei einer Korrelation von 0.
Alexander Spermann
4
Universität Freiburg
6. Sitzung
Probleme der Modellspezifikation
reg Lohn Schuljahre Berufserf Betriebszug West
Source |
SS
df
MS
-------------+-----------------------------Model | 1243.42509
4 310.856272
Residual | 3170.06138 22753 .139324985
-------------+-----------------------------Total | 4413.48646 22757 .193939731
Number of obs
F( 4, 22753)
Prob > F
R-squared
Adj R-squared
Root MSE
=
22758
= 2231.16
= 0.0000
= 0.2817
= 0.2816
= .37326
-----------------------------------------------------------------------------Lohn |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------Schuljahre |
.0647688
.0010347
62.60
0.000
.0627407
.0667969
Berufserf |
.0011065
.0002613
4.23
0.000
.0005944
.0016186
Betriebszug |
.0108213
.0003075
35.19
0.000
.0102186
.011424
West |
.3207218
.0063453
50.54
0.000
.3082845
.333159
_cons |
1.810839
.0165128
109.66
0.000
1.778473
1.843206
------------------------------------------------------------------------------
y=α+β1x1+ β2x2 +β3x3+β4x4+u
Lohn= α+ β1Schuljahre + β2Berufserf
+ β3Betriebszug + β4West+ u
reg Lohn Schuljahre Berufserf Betriebszug
Source |
SS
df
MS
-------------+-----------------------------Model | 887.482375
3 295.827458
Residual | 3526.00409 22754 .154961945
-------------+-----------------------------Total | 4413.48646 22757 .193939731
Number of obs
F( 3, 22754)
Prob > F
R-squared
Adj R-squared
Root MSE
=
22758
= 1909.03
= 0.0000
= 0.2011
= 0.2010
= .39365
-----------------------------------------------------------------------------Lohn |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------Schuljahre |
.059183
.001085
54.55
0.000
.0570564
.0613097
Berufserf | -.0004615
.0002736
-1.69
0.092
-.0009977
.0000748
Betriebszug |
.0132101
.0003204
41.23
0.000
.012582
.0138381
_cons |
2.151206
.0159009
135.29
0.000
2.120039
2.182373
------------------------------------------------------------------------------
5
Alexander Spermann
Universität Freiburg
6. Sitzung
Probleme der Modellspezifikation
2.Beispiel: 1. Fehlt die Dummyvariable „West“ in der Spezifikation, so entsteht
folgende Verzerrung:
E(b1) =β1+Verzerrung
2. b1 = 0,0647688 , bei einer Schätzung von x1, x2, x3 und x4
b1 = 0,059183 , bei einer Schätzung von x1, x2 und x3
Ergebnisse:
6
- b1 ist nach unten verzerrt
- Unterschätzung des Einflusses der erklärenden Variable
- Grund: negative Korrelation zwischen x1 und x4 (Westdeutsche
haben durchschnittlich weniger Schuljahre als Ostdeutsche)
Alexander Spermann
Universität Freiburg
6. Sitzung
Probleme der Modellspezifikation
Ausweg für das Problem fehlender Variablen bei fehlender Datenverfügbarkeit:
Proxy Variable.
Idee:
Es ist besser eine fehlende Variable durch eine Ersatzvariable, für die
Daten vorliegen, zu schätzen als die Variable vollständig zu ignorieren.
Beispiel:
Fähigkeit eines Arbeitnehmers ist schwer zu messen.
Proxy ist z.B. Bildungsabschluss
Wahres ökonometrisches Modell:
y=α+β1x1+ β2x2 +…+βkxk+u
Es liegen aber keine Daten für x1 vor, sondern nur für z.
 x1=λ+μz
Annahme:
Zwischen z und x1 besteht eine lineare Beziehung.
Neuformulierung des Modells:
y=α+β1(λ+μz)+ β2x2 +…+βkxk+u
=α+β1λ+ β1μz+ β2x2 +…+βkxk+u
7
Alexander Spermann
Universität Freiburg
6. Sitzung
Probleme der Modellspezifikation
Eigenschaften von Proxies:
1.
Die Koeffizienten von x2,...,xk werden gleich sein, als ob x1
anstelle von z eingesetzt worden wäre.
2.
Der Standardfehler und die t-Statistik der Koeffizienten x2,...,xk
werden gleich sein, als ob x1 anstelle von z eingesetzt worden
wäre.
3.
R2 wird gleich sein, als ob x1 anstelle von z eingesetzt worden
wäre.
4.
Der Koeffizient von z wird ein Schätzer von 1 sein.
5.
Jedoch ist die t-Statistik für z die gleiche wie die, die man für x1
erhalten hätte, so dass man die Signifikanz von x1 beurteilen
kann, selbst wenn man nicht in der Lage ist, den Koeffizienten zu
schätzen.
8
Alexander Spermann
Universität Freiburg
6. Sitzung
Probleme der Modellspezifikation
2. Effekt der Schätzung einer überflüssigen Variablen
Wahres ökonometrisches Modell:
y=α+β1x1+ β2x2 +u
Schätzung:
Ergebnis:
y=α+β1x1+u
Koeffizienten sind unverzerrt, aber ineffizient.
Dichtefunktion
 1 nutzt die Information,
dass  2  0
 1 nutzt nicht die Information,
dass  2  0
Quelle: Dougherty
9
Alexander Spermann
Universität Freiburg
6. Sitzung
Probleme der Modellspezifikation
Gefahr:
Alle Variablen, die zur Verfügung stehen, werden in die
Regressionsanalysen einbezogen und alle signifikanten Variablen
werden als relevant erklärt.
Weshalb ist das gefährlich?
-> Theorie muss die Auswahl der Variablen leiten!
Zur Beurteilung der Relevanz der Variablen werden t-Werte, F-Test und
R ² herangezogen und die Störgrößen untersucht.
3. Falsche funktionale Form der Schätzgleichung
Unter Umständen kann auch die funktionale Form der Gleichung falsch sein:
10
Alexander Spermann
Universität Freiburg
6. Sitzung
Probleme der Modellspezifikation
Einfacher Ramsey Reset Test:
RESET= Regression Specification Error Test
1. y=α+β1x1+u
2. Aus dieser Schätzgleichung erhalten wir einen Schätzwert ŷ
3. Neue Spezifikation (fiktives Beispiel)y    1x1  2 yˆ ²  3 yˆ ³,
4.
ŷ² und ŷ³ enthalten nicht-lineare Funktionen von x1
5. Vergleich der R² der beiden Schätzungen
F
(R ² neu  R ² alt ) / Anzahl der Regressore n
(1 - R ² neu ) /(N  Parametera nzahl im neuen Modell)
6. Ist der berechnete F-Wert signifikant, kann die Nullhypothese (=
altes Modell ist nicht fehlspezifiziert) verworfen werden. (Intuition:
Je größer Term im Zähler, desto besser scheint neues Modell y zu
erklären)
11
Alexander Spermann
Universität Freiburg
6. Sitzung
Probleme der Modellspezifikation
Beispiel:
1.
2.
3.
4.
12
y=166.467+19993x1
(19.021) (3.066)
R2=0.8409
y=2140.7723 + 476.6987x1 - 0.09189ŷ² + 0.000118ŷ³
(132.0044) (33.3951) (0.00620) (0.0000074) R2=0.9983
F
(0.9983  0.8409) / 2
 281.07
(1 0.9983) /(10  4)
Da F > F crit wird die Nullhypothese verworfen.
 altes Modell ist fehlspezifiziert.
Alexander Spermann
Universität Freiburg
6. Sitzung
Probleme der Modellspezifikation
Weitere Spezifikationstests (werden hier nur nachrichtlich genannt)
 Likelihood Ratio Test
 Wald Test
 Lagrange Multiplier Test
 Hausman Test
13
Alexander Spermann
Universität Freiburg
Herunterladen