Alte Aufgaben (mit Lösungen) File

Werbung
Département d’Économie Quantitative
Departement für Quantitative Wirtschaftsforschung
Übungsaufgaben
Angewandte Ökonometrie I
c Séminaire de Statistique – Université de Fribourg
c Seminar für Statistik – Universität Freiburg
1
Übungen „Angewandte Ökonometrie I“
Übungsaufgaben
Aufgabe 1: Log-Transformation
In einer schweizerischen Zeitung wurden Ende Juli 2001 im Anzeigeteil 33 VW-Golf 3 angeboten.
Für alle 33 Autos sind die Variablen Alter (in Jahren), Kilometer (Gefahrene Kilometer in
tausend) und Preis (Angebotspreis in CHF) angegeben.
Zur Erklärung des Angebotspreises werden folgende Regressionsmodelle vorgeschlagen:
Preis = β1 + β2 · Kilometer + β2 · Alter + u.
(1)
ln(Preis) = γ1 + γ2 · Kilometer + γ2 · Alter + u.
(2)
Die Schätzungen der Modelle (3) und (2) auf der Grundlage der vorliegenden Stichprobe ergaben
die in Abbildung 1 und 2 dargestellten Computer-Outputs.
1. Erläutern Sie die Vorzüge von Modellen mit logarithmierten Variablen.
2. Wie verändert sich die Variable Preis in den beiden Regressionsmodellen, wenn die Variable Kilometer oder Alter um eine Einheit steigt. Erläutern Sie, warum man beim
Modell (2) für die Veränderung der endogenen Variablen Prozentangaben erhält.
3. Entnehmen Sie den Computer-Outputs die Bestimmtheitsmasse dieser Regressionen und
interpretieren sie deren Werte. Können die Bestimmtheitsmasse der beiden Regressionen
verglichen werden?
4. Schätzen Sie den Preis eines vier Jahre alten VW-Golfs 3 mit 96’000 gefahrenen Kilometern mit beiden geschätzten Modellen. Setzen Sie sich kritisch mit der Qualität der
Preisschätzung mit Hilfe von Modell (2) auseinander. (Annahme: u ∼ N(0, σ 2 ) für beide
Modelle. σ̂1 = 1554 für Modell (3) und σ̂2 = 0.09077 für Modell (2).)
Call:
lm(formula = Preis ~ Kilometer + Alter)
Residuals:
Min
1Q
-2752.1 -941.2
Median
-145.2
3Q
856.1
Max
4037.3
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 24965.06
897.58 27.814 < 2e-16 ***
Kilometer
-36.07
13.59 -2.654
0.0126 *
Alter
-1421.48
239.04 -5.947 1.62e-06 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1554 on 30 degrees of freedom
Multiple R-Squared: 0.781,
Adjusted R-squared: 0.7664
F-statistic: 53.48 on 2 and 30 DF, p-value: 1.282e-10
Abbildung 1: Computeroutput der Schätzung vom Regressionsmodell (3)
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
2
Übungen „Angewandte Ökonometrie I“
Call:
lm(formula = log(Preis) ~ Kilometer + Alter)
Residuals:
Min
1Q
Median
-0.18211 -0.05614 -0.01965
3Q
0.07329
Max
0.17923
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.226816
0.052436 195.033 < 2e-16 ***
Kilometer
-0.002260
0.000794 -2.846
0.0079 **
Alter
-0.089949
0.013965 -6.441 4.09e-07 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.09077 on 30 degrees of freedom
Multiple R-Squared: 0.8062,
Adjusted R-squared: 0.7933
F-statistic: 62.41 on 2 and 30 DF, p-value: 2.041e-11
Abbildung 2: Computeroutput der Schätzung vom Regressionsmodell (2)
Aufgabe 2: Binäre unabhängige Variablen (Dummies)
Ein Verein für die Gleichstellung von Frau und Mann im Berufsleben möchte wissen, ob es
zwischen den Geschlechtern Lohnunterschiede gibt. Auf der Grundlage einer Stichprobe von 526
Personen, davon 252 Frauen, untersuchte ein Forschungsinstitut den Zusammenhang zwischen
wage (Durchschnittlicher Stundenlohn in USD), educ (Ausbildung (in Jahren)) und f emale
(=1 falls weiblich) und erhielt die folgenden geschätzten Regressionsmodelle (in Klammern
stehen die Standardfehler!):
wage
[
= 0.2005 + 0.5395educ − 1.1985f emale − 0.08600f emale · educ
(0.8436) (0.0642)
(1.3250)
(0.1036)
R2 = 0.2598, SSR = 5300.17
wage
[
= −0.9049 + 0.5414educ
(0.6850) (0.0533)
R2 = 0.1648, SSR = 5980.682
1. Wie verändern sich die durchschnittlichen Stundenlöhne einer Frau und eines Mannes,
wenn diese ein zusätzliches Jahr in ihre Ausbildung investieren? Skizzieren Sie das erstgenannte Regressionsmodell für Frauen und Männer im nachfolgenden Graphen.
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
3
Übungen „Angewandte Ökonometrie I“
wage
✻
✲
educ
2. Berechnen Sie für die beiden Modellschätzungen das korrigierte Bestimmtheitsmass und
vergleichen Sie die Resultate. Wieso eignet sich das korrigierte Bestimmtheitsmass besser
für einen solchen Vergleich als das Bestimmtheitsmass?
3. Berechnen Sie für alle Regressionskoeffizienten die t-Werte und interpretieren Sie die
Ergebnisse?
4. Auf der Grundlage der Resultate aus Teilaufgebe c) wird behauptet, dass es keinen signifikanten Unterschied zwischen Frauen und Männern bezüglich des Stundenlohns gibt. Ist
diese Behauptung richtig? Begründen Sie ihre Antwort mit Hilfe eines geeigneten Tests.
(F0.95,2,522 = 3.012991)
Aufgabe 3: Standardisierung und Reskalierung
Ein Schweizer möchte nach Amerika auswandern. Auf der Suche nach einem geeigneten Haus in
einer bestimmten Stadt interessiert er sich für den Zusammenhang zwischen dem Preise (price
in 1000 USD) eines Hauses und seiner Grösse (sqrf t), der Anzahl seiner Schlafzimmer (bdrms)
sowie der Grundstücksgrösse (lotsize). Eine Schätzung des entsprechenden Regressionsansatzes
(n=88) lieferte folgendes Resultat (in Klammern sind die Standardfehler der Koeffizientenschätzungen angegeben):
[ =
price
−21.77 + 0.1228 sqrf t + 13.85 bdrms + 0.002068 lotsize
(29.48) (0.01324)
(9.010)
(0.0006421)
mit σ̂e2 = 3456.595.
Die Ermittlung der empirischen Varianzen der Variablen dieses Modells ergab folgende Werte:
2
2
2
2
σ̂price
= 10550.05; σ̂sqrf
t = 333150.1; σ̂bdrms = 0.7079415; σ̂lotsize = 103513337.
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
4
Übungen „Angewandte Ökonometrie I“
1. Man möchte wissen, welche der exogenen Variablen im oben beschriebenen Regressionsmodell den grössten Einfluss auf die Variable price besitzt. Ermitteln Sie diese Variable
und begründen Sie Ihr Vorgehen.
2. Berechnen Sie für alle Regressionskoeffizienten die t-Werte und interpretieren Sie die Ergebnisse. Wie verändern sich die t-Werte bei einer Standardisierung der Variablenwerte?
Begründen Sie Ihre Aussage.
3. Berechnen Sie das Bestimmtheitsmass des Modelles und das korrigierte Bestimmtheitsmass. Wie verändern sich Bestimmtheitsmass und korrigiertes Bestimmtheitsmass bei
einer Standardisierung der Variablenwerte?
4. Der auswanderungswillige Schweizer möchte lieber in Schweizer Franken als in USD rechnen (1 USD=1.2 CHF). Wie verändern sich Regressionskoeffizienten, Standardabweichungen und t-Werte im oben geschätzen Modell, wenn mit Schweizer Franken statt USD
gerechnet wird?
Aufgabe 4: Anpassungsgüte
Auf der Grundlage einer Stichprobe von 526 Personen, davon 252 Frauen, untersuchte ein
Forschungsinstitut den Zusammenhang zwischen dem durchschnittlichen Stundenlohn (wage
in USD), der Ausbildung (educ in Jahren) und dem Geschlecht (f emale =1 falls weiblich) und
erhielt die vier folgenden geschätzten Regressionsmodelle:
wage
[
wage
[
wage
[
wage
[
=
=
=
=
0.6228 + 0.5065
0.2005 + 0.5395
5.6071 − 0.4164
5.4138 − 0.3961
educ − 2.2734
educ − 1.1985
educ − 2.1264
educ − 1.7579
f emale
(3)
f emale − 0.0860 f emale · educ
(4)
2
f emale + 0.0395 educ
(5)
2
f emale − 0.0296 f emale · educ + 0.0391 educ (6)
mit
SSR1
SSR2
SSR3
SSR4
=
=
=
=
5307.161
5300.170
5141.607
5140.795
für
für
für
für
Modell
Modell
Modell
Modell
(1),
(2),
(3),
(4).
Darüber hinaus gilt SST = 7160.414.
1. Berechnen Sie für alle vier Regressionsansätze das Bestimmtheitsmass und bestimmen
Sie das Modell, welches die Variation von wage am besten erklärt. Begründen Sie Ihre
Antwort.
2. Welche Probleme sind mit dem Bestimmtheitsmass verbunden? Was bedeutet das für die
Wahl des „besten“ Modells in Teilaufgabe a)?
3. Erläutern Sie die Eigenschaften des korrigierten Bestimmtheitsmasses. Ist dieses besser
geeignet, um die Anpassungsgüte der vier Modellansätze zu vergleichen? Begründen Sie
Ihre Antwort.
4. Berechnen Sie das korrigierte Bestimmtheitsmass für alle vier Regressionsmodelle und
bestimmen Sie das Modell mit der besten Anpassungsgüte. Vergleichen Sie das erhaltene
Resultat mit dem aus Teilaufgabe a). Begründen Sie Ihre Antworten.
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
5
Übungen „Angewandte Ökonometrie I“
Aufgabe 5: Binäre unabhängige Variablen (Dummies)
Auf der Grundlage einer Stichprobe von 526 Personen, davon 54 Nichtweisse, untersuchte
ein Forschungsinstitut den Zusammenhang zwischen durchschnittlichem Stundenlohn (wage
in USD), Ausbildung (educ in Jahren) und Hautfarbe (nonwhite= 1 falls keine weisse Hautfarbe) einer Person und erhielt folgendes geschätztes Regressionsmodell (in Klammern stehen die
Standardfehler):
wage
[ = −0.8937 + 0.5409 educ − 0.0509 nonwhite
(0.6939) (0.0535)
(0.4875)
(7)
R2 = 0.1648, SSR = 5980.558
1. Wie verändern sich auf der Grundlage des Modells (7) die durchschnittlichen Stundenlöhne von Weissen und Nichtweissen, wenn diese ein zusätzliches Jahr in ihre Ausbildung
investieren? Skizzieren Sie das Regressionsmodell für Personen mit weisser Hautfarbe
und solchen ohne weisser Hautfarbe im nachfolgenden Koordinatensystem.
wage
✻
✲
educ
2. Oft werden Löhne am Ende einer Woche ausbezahlt. Deshalb hat sich das Forschungsinstitut entschlossen, für die Variable wage statt des Stundenlohns den Wochenlohn anzusetzen
(1 Arbeitswoche = 45 Arbeitsstunden). Berechnen Sie die Regressionskoeffizienten und
die zugehörigen t-Werte des Modells (7), wenn als endogene Grösse statt des durchschnittlichen Stundenlohns der durchschnittliche Wochenlohn verwendet wird. Interpretieren Sie
die erhaltenen Resultate.
Ein Mitarbeiter argumentierte, dass bei Personen mit verschiedener Hautfarbe der Lohnunterschied bei schlechterer Ausbildung höher anzusetzen sei als bei besserer. Um diesen Umstand im
Modell (7) zu berücksichtigen, wurde es um einen Interaktionsterm erweitert. Eine Schätzung
dieses erweiterten Modells lieferte folgendes Ergebnis:
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
6
Übungen „Angewandte Ökonometrie I“
wage
[ = −1.2647 + 0.5702 educ + 2.3553 nonwhite − 0.2008 nonwhite · educ
(0.7476) (0.0579)
(1.8775)
(0.1513)
(8)
R2 = 0.1676, SSR = 5960.448
1. Wie verändern sich die durchschnittlichen Stundenlöhne von Weissen und Nichtweissen
im Modell (8), wenn diese jeweils ein zusätzliches Jahr in ihre Ausbildung investieren?
Skizzieren Sie das Regressionsmodell (8) für Personen mit weisser Hautfarbe und solche
ohne weisser Hautfarbe im nachfolgenden Koordinatensystem.
wage
✻
✲
educ
2. Erklärt das geschätzte Modell (8) mit Interaktionsterm den durchschnittlichen Stundenlohn besser als das Modell (7) ohne Interaktionsterm? Begründen Sie Ihre Antwort anhand des korrigierten Bestimmtheitsmasses.
3. Auf der Grundlage der Resultate aus Teilaufgabe b) wird behauptet, dass es zwischen
Weissen und Nichtweissen keinen signifikanten Lohnunterschied gibt. Ist diese Behauptung für das Modell (8) mit Interaktionsterm noch richtig? Begründen Sie ihre Antwort
mit Hilfe eines geeigneten Tests. (F(0.95,2,522) = 3.012991; SSRr = 5980.682)
Aufgabe 6: Binäre abhängige Variable
Im Rahmen einer Untersuchung zur Nachfrage nach ökologisch produzierten Äpfeln führte ein
Marktforschungsinstitut bei 660 Personen eine Telefonumfrage durch. Dabei wurden die Personen zufällig mit verschiedenen Preisen von "normalen"Äpfeln (regprc: in CHF pro Stück)
und ökologisch produzierten (ecoprc: in CHF pro Stück) konfrontiert und befragt, ob sie bei
diesen Preisen ökologisch produzierte oder normale Äpfeln kaufen würden (ecobuy = 1, falls
ökologisch produzierte Äpfeln gewählt wurden und = 0 sonst). Zusätzlich wurden Einkommen
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
7
Übungen „Angewandte Ökonometrie I“
(income: in tausend CHF), Ausbildung (educ: in Anzahl Jahren) und Alter (age: in Jahren)
der befragten Personen erhoben.
Der Einfluss der betrachteten Variablen auf die Kaufentscheidung (ecobuy) wurde anhand eines
linearen Wahrscheinlichkeitsmodells (LWM) und eines Logit-Modells (Logit) geschätzt. Dabei
ergaben sich für die Regressionskoeffizienten der beiden Modelle und die zugehörigen Standardabweichungen (in Klammern) die in der folgenden Tabelle 1 angegebenen Werte:
Unabhängige
Variablen
ecoprc
regprc
income
educ
age
constant
Log-Likelihood
Wert
LWM
Logit
-0.8045
(0.1096)
0.7207
(0.1319)
0.0007
(0.0005)
0.0228
(0.0083)
-0.0013
(0.0012)
0.5500
(0.1513)
-3.6705
(0.5315)
3.2682
(0.6280)
0.0033
(0.0026)
0.1083
(0.0400)
-0.0058
(0.0056)
0.1784
(0.7151)
-
-400.9329
Logit
(restringiert)
-3.6706
(0.5306)
3.2401
(0.6269)
0.1256
(0.0383)
-0.1289
(0.6636)
-402.3873
Tabelle 1: LWM und Logit Schätzwerte.
1. Interpretieren Sie die geschätzten Regressionskoeffizienten der Variablen ecoprc, regprc
und educ des linearen Wahrscheinlichkeitsmodells (LWM). Welche dieser Variablen beeinflusst den Kauf von ökologisch produzierten Äpfeln am stärksten?
2. Welche drei gewichtigen Nachteile besitzt das lineare Wahrscheinlichkeitsmodell? Werden
alle diese Nachteile beim Logit-Modell behoben?
3. Bestimmen Sie den durchschnittlichen partiellen Einfluss der exogenen Variablen ecoprice, regprc und educ auf die Response-Wahrscheinlichkeit des Logit-Modells P (ecobuy =
P
1 | x) (verwenden Sie dabei n1 ni=1 g(β̂0 + xi β̂) = 0.2097). Interpretieren Sie die erhaltenen Resultate und vergleichen Sie diese mit den geschätzten Regressionskoeffizienten des
linearen Wahrscheinlichkeitsmodells (LWM).
4. Vergleichen Sie das lineare Wahrscheinlichkeitsmodell und das Logit-Modell im Hinblick
auf ihre Anpassungsgüte. Bestimmen Sie dazu den Prozentsatz der korrekt prognostizierten ecobuy-Werte des lineare Wahrscheinlichkeitsmodells sowie des Logit-Modells für die
folgenden zehn Beobachtungen:
5. Haben die beiden exogenen Variablen income und age gemeinsam betrachtet einen signifikanten Einfluss auf die Response-Wahrscheinlichkeit? Formulieren Sie die Nullhypothese
eines geeigneten Tests und führen Sie diesen unter Verwendung der Angaben in Tabelle 1 bei einem Signifikanzniveau von α = 0.05 durch. Interpretieren Sie das erhaltene
Resultat.
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
8
Übungen „Angewandte Ökonometrie I“
Beobachtung
1
2
3
4
5
6
7
8
9
10
ecobuy
\ LW M
ecobuy
1
0
0
1
1
1
1
0
1
1
0.35 0.38 0.55
0.50 0.74 0.68 0.53 0.62 0.60 0.51
\ Logit
ecobuy
0.33 0.37 0.51
0.51 0.74 0.69 0.53 0.63 0.61 0.51
Aufgabe 7: Binäre Variablen
Eine amerikanische Organisation gegen Diskriminierung beauftragte ein Forschungsinstitut die
Situation von ausländischen Frauen auf dem Arbeitsmarkt zu untersuchen. Dabei wurde in einem ersten Teil der Studie untersucht, ob ein Zusammenhang zwischen dem durchschnittlichen
Stundenlohn (wage; in USD) und der Ausbildung (educ; in Jahren), der Hautfarbe (black= 1
falls dunkle Hautfarbe) sowie der lateinamerikanischen Herkunft (hispanic= 1 falls die Person
aus Lateinamerika stammt) besteht. Auf der Grundlage einer Stichprobe von 3286 erwerbstätigen Frauen ergab sich folgendes geschätztes Regressionsmodell (in Klammern stehen die
Standardabweichungen der geschätzten Regressionskoeffizienten):
\
log(wage)
= 0.9390 + 0.0939 educ − 0.0287 black + 0.0075 hispanic
(0.0474) (0.0034)
(0.0346)
(0.0367)
(9)
mit SSR = 733.3739.
1. Wie verändern sich die durchschnittlichen Stundenlöhne von Frauen mit dunkler Hautfarbe und solchen ohne dunkler Hautfarbe im Modell (9), wenn diese jeweils ein zusätzliches
Jahr in ihre Ausbildung investieren? Skizzieren Sie das Regressionsmodell für Frauen mit
dunkler Hautfarbe und solche ohne dunkler Hautfarbe im nachfolgenden Koordinatensystem.
log(wage)
✻
✲
educ
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
Übungen „Angewandte Ökonometrie I“
9
2. Man stellt sich die Frage, ob die beiden exogenen Variablen black und hispanic gemeinsam
betrachtet einen signifikanten Einfluss auf den durchschnittlichen Stundenlohn haben.
Formulieren Sie die Nullhypothese eines geeigneten Tests für diese Fragestellung und
führen Sie diesen bei einem Signifikanzniveau von α = 0.05 durch. Interpretieren Sie das
erhaltene Resultat. (Es gilt: SSRr = 733.5411 und F0.95,2,3284 = 2.9985.)
Im zweiten Teil der Studie wird untersucht, ob die Variablen Ausbildung (educ; in Jahren),
Hautfarbe (black= 1 falls dunkle Hautfarbe), lateinamerikanische Herkunft (hispanic= 1 falls
die Person aus Lateinamerika stammt), Arbeitserfahrung (exper; Anzahl Jahre) sowie nicht
von der Frau erwirtschaftetes Haushaltseinkommen (nwifeinc; in 1000 USD) einen Einfluss
auf die Erwerbstätigkeit der Frauen (inlf= 1 falls erwerbstätig) besitzen. Der Einfluss der
betrachteten Variablen auf die Erwerbstätigkeit von Frauen wurde auf der Grundlage einer
Stichprobe von 5634 Frauen anhand eines Probit-Modells geschätzt. Dabei ergaben sich für
die Regressionskoeffizienten und deren Standardabweichungen (in Klammern) des Modells die
folgenden Werte:
d = Φ[−0.7271 + 0.1059 educ + 0.0250 black
inlf
(0.1150) (0.0077)
(0.0748)
−0.1500 hispanic − 0.0074 exper − 0.0088 nwifeinc]
(0.0701)
(0.0017)
(0.0006)
mit Log-Likelihood Wert L = −3611.719
3. Welche drei gewichtigen Nachteile besitzt das lineare Wahrscheinlichkeitsmodell? Werden
alle diese Nachteile beim Probit-Modell behoben?
4. Bestimmen Sie den durchschnittlichen partiellen Einfluss der exogenen Variablen educ,
exper sowie nwifeinc auf die Response-Wahrscheinlichkeit des Probit-Modells P (inlf = 1 |
P
x) (verwenden Sie dabei n1 ni=1 g(β̂0 +xi β̂) = 0.3668) und interpretieren Sie die erhaltenen
Resultate.
5. Haben die beiden exogenen Variablen black und hispanic gemeinsam betrachtet einen
signifikanten Einfluss auf die Response-Wahrscheinlichkeit? Formulieren Sie die Nullhypothese eines geeigneten Tests und führen Sie diesen bei einem Signifikanzniveau von
α = 0.05 durch. Interpretieren Sie das erhaltene Resultat. (Es gilt: Lr = −3614.128.)
Aufgabe 8: Zeitreihen und Autokorrelation
Es sei gprice die monatliche Wachstumsrate des Preisniveaus und gwage die monatliche Wachstumsrate der Stundenlöhne für die USA. Auf der Grundlage historischer Daten (t = 1, ..., 286)
wurde folgendes distributed lag Modell mit der OLS-Methode sowie der feasible GLS-Methode
geschätzt:
OLS
\t
gprice
= −0.0009 + 0.1190 gwaget + 0.0972 gwaget−1 + 0.0400 gwaget−2
+0.0383 gwaget−3 + 0.0813 gwaget−4 + 0.1069 gwaget−5 + 0.0950 gwaget−6
+0.1038 gwaget−7 + 0.1026 gwaget−8 + 0.1585 gwaget−9 + 0.1104 gwaget−10
+0.1033 gwaget−11 + 0.0157 gwaget−12
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
10
Übungen „Angewandte Ökonometrie I“
F GLS
\t
gprice
= −0.0007 + 0.0933 gwaget + 0.0758 gwaget−1 + 0.0235 gwaget−2
+0.0362 gwaget−3 + 0.0795 gwaget−4 + 0.1130 gwaget−5 + 0.1023 gwaget−6
+0.0994 gwaget−7 + 0.1085 gwaget−8 + 0.1608 gwaget−9 + 0.1115 gwaget−10
+0.1002 gwaget−11 + 0.0206 gwaget−12
Des Weiteren erhielt man für die Residuen der beiden Schätzungen folgende AR(1)-Beziehungen
(in Klammern stehen die Standardabweichungen der geschätzten Regressionskoeffizienten):
ûOLS
= 0.5027 ûOLS
t
t−1
(0.0523)
GLS
ûFt GLS = 0.0023 ûFt−1
(0.0612)
1. Welche Bedingungen muss ein stochastischer Prozess mit endlichem zweiten Moment im
Allgemeinen erfüllen, damit dieser schwach stationär ist? Erläutern Sie zusätzlich, welche
Anforderung der Regressionskoeffizient eines AR(1)-Prozesses erfüllen muss, damit dieser
schwach stationär ist und überprüfen Sie, ob dies bei den AR(1)-Beziehungen der Residuen
der OLS- sowie der FGLS-Schätzung der Fall ist.
2. Bestimmen Sie für OLS- und FGLS-Schätzung des distributed lag Modells die impact multipliers sowie die long-run multipliers. Interpretieren und vergleichen Sie die erhaltenen
Resultate.
3. Erklären Sie kurz, wann in einem Regressionsmodell Autokorrelation vorliegt sowie Idee
und Nullhypothese eines geeigneten Tests auf Autokorrelation. Führen Sie diesen Test
für die OLS- sowie für die FGLS-Schätzung des distributed lag Modells durch und interpretieren Sie die Resultate. Welche Bedeutung haben die beiden Resultate für die in der
Aufgabenstellung berechneten Regressionskoeffizienten von OLS- bzw. FGLS-Schätzung.
4. Mit der so genannten geschätzten verallgemeinerten KQ-Schätzung (engl.: Feasible Generalized Least Squares Estimation (FGLS)) können asymptotisch effiziente Schätzer bei
unbekannter Form der Autokorrelation ermittelt werden. Erläutern Sie allgemein die
Schritte dieser Schätzmethode beim Cochrane-Orcutt-Verfahren und dessen Unterschied
zum Prais-Winston-Verfahren.
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
11
Übungen „Angewandte Ökonometrie I“
Lösungen zu den Übungsaufgaben
Aufgabe 1: Log-Transformation
1. Vorzüge von Modellen mit logarithmierten Variablen:
• β-Koeffizienten sind unabhängig der Skalierung.
• Die KQ-Annahmen sind bei ln(y)-Modellen oft besser erfüllt als bei Modellen mit
y, wegen:
– Reduktion von Heteroskedastizität
– Symmetrisierung
• Die Spannweite der Beobachtungen wird reduziert, dies bedeutet:
– eine reduzierte Ausreisser-Empfindlichkeit der Schätzer.
2. ∆Kilometer = 1:
• Modell (1): ∆Preis = −36.07DM
• Modell (2): ∆Preis = −0.23%
∆Alter = 1:
• Modell (1): ∆Preis = −1421.48DM
• Modell (2): ∆Preis = −8.99%
Im Modell (2) kann βk als Halb-Elastizität von y bezüglich xk interpretiert werden. Differenzbildung und Multiplikation mit 100 führt nämlich zu:
%∆y ≈ 100∆ln(y) = (100 · βk )∆xk
und daraus folgt:
%∆y/∆xk = 100βk
Die Halb-Elastizität von y bzgl. xk
%∆y/∆x
gibt an, um wie viel Prozent sich y ändert, wenn x um eine Einheit wächst.
3. Modell (1): R2 = 0.781
Modell (2): R2 = 0.8062
Das Bestimmtheitsmass gibt den Prozentsatz an, zu dem die beobachtete y-Varianz durch
die Regression „erklärt “wird.
R2 -Werte von ln(y)-Modellen dürfen nicht mit solchen von y-Modellen verglichen werden.
Erklärung: Durch die Logarithmisierung entsteht eine neue, nicht mit der ursprünglichen
vergleichbar, endogene Variable.
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
12
Übungen „Angewandte Ökonometrie I“
[ = 24965.06 − 36.07 · 96 − 1421.48 · 4 = 15816.06
4. Modell (1): Preis
\ = 10.226816 − 0.002260 · 96 − 0.0089949 · 4 = 9.650052
Modell (2): ln(Preis)
\
[ = e(σ̂2 /2) · eln(Preis) = e(0.090772 /2) · e9.65 = 15586.68
Preis
Bei Modellen mit endogener Variablen ln(y) sind Prognosen von y aufwändiger. Die
[ ist schwächer als bei KQ-Methode üblich, denn die
Prognosequalität von ŷ = f (ln(y))
durch Rücktransformation gewonnene Prognose
d
ŷ = exp(logy)
unterschätzt y systematisch! Falls das ln(y)-Model den Annahmen des klassischen linearen Models genügt, erhält man allerdings eine konsistente Prognose von y mit:
d
ŷ = exp(σ̂ 2 /2)exp(lny)
dabei ist σ̂ 2 der unverzerrte Schätzer für σ 2 . Ist σ̂ 2 kein unverzerrter Schätzer so berechnet
man:
α := E(exp(u))
und setzt dies ein in:
d
ŷ = α̂exp(lny)
Aufgabe 2: Binäre unabhängige Variablen (Dummies)
1. ∆educ = 1:
∆wage(Männer) = 0.5395USD/h
∆wage(F rauen) = 0.5395 − 0.08600 = 0.4535USD/h
Die zu skizzierenden Funktionen sind:
wage(Männer)
[
= 0.2005 + 0.5395educ
wage(Frauen)
[
= 0.2005 + 0.5395educ − 1.1985f emale − 0.08600f emale · educ
2. Korrigiertes Bestimmtheitsmass:
R̄2 := 1 −
Schätzung (1): R̄2 := 1 −
Schätzung (2): R̄2 := 1 −
526−1
526−4
526−1
526−2
N −1
(1 − R2 )
N −K
(1 − 0.2598) = 0.2555
(1 − 0.1648) = 0.1632
Schätzung (1) erklärt wage besser.
R̄2 bestraft das Hinzufügen von zusätzlichen Variablen in ein Modell. Da R2 mit der
Anzahl der Regressoren monoton wächst,
3. Faustregel: | t |> 2 für Signifikanz.
Schätzung (1):
• t1 = 0.2005/0.8436 = 0.2377
• t2 = 0.5395/0.0642 = 8.403
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
13
Übungen „Angewandte Ökonometrie I“
• t3 = 1.1985/1.3250 = 0.9405
• t4 = 0.08600/0.1036 = 0.8301
Schätzung (2):
• t1 = 0.9049/0.6850 = 1.321
• t2 = 0.5414/0.0533 = 10.16
Nur educ hat bei beiden Modellen einen signifikanten Einfluss. Alle anderen Regressoren
sind nicht signifikant.
4. Auf der bisherigen Grundlage kann keine Aussage über den Lohnunterschied zwischen
Frauen und Männern getroffen werden, weil sich die t-Werte nur auf die einzelnen Regressoren beziehen und nicht die beiden Terme mit der Variable f emale berücksichtigen.
Man muss deshalb zusätzlich die folgende simultane Hypothese prüfen:
H0 : βf emale = 0, βf emale·educ = 0
Dazu benötigt man die F-Statistik:
(SSRr − SSRur )/q
SSRur /(n − K)
(5980.682 − 5300.17)/2
=
5300.17/(526 − 4)
= 33.51095 > F4,521 = 2.389
F =
H0 wird demzufolge verworfen, d.h. es gibt einen signifikanten Lohnunterschied zwischen
Frauen und Männer. Die Behauptung ist somit falsch.
Aufgabe 3: Standardisierung und Reskalierung
1. Weil die exogenen Variablen unterschiedlich skaliert sind, müssen alle Variablenwerte
standardisiert werden, damit die Frage korrekt beantwortet werden kann.
Dabei gilt:
σ̂k
βk∗ = β̂k
σ̂y
0
· (−21.77) = 0
10550.05
s
333150.1
=
· 0.1228 = 0.6899
10550.05
β0∗ = √
∗
βsqrf
t
∗
βbdrms
=
∗
βlotsize
=
s
s
0.7079415
· 13.85 = 0.1135
10550.05
103513337
· 0.002068 = 0.2048
10550.05
Die exogene Variable sqrf t besitzt den grössten standardisierten Regressionskoeffizienten
und hat somit den grössten Einfluss der betrachteten Variablen auf die endogene Variable
price.
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
14
Übungen „Angewandte Ökonometrie I“
2. t-Test:
β̂k
t-Wert = q
V ar(β̂k )
Faustregel: | t-Wert |> 2 −→ Regressionskoeffizient ist signifikant von Null verschieden!
−21.77
= −0.739 −→ Nicht signifikant!
29.48
0.1228
=
= 9.275 −→ Signifikant!
0.01324
13.85
=
= 1.537 −→ Nicht signifikant!
9.010
0.002068
=
= 3.220 −→ Signifikant!
0.0006421
t0 =
tsqrf t
tbdrms
tlotsize
Nur die Variablen sqrf t und lotsize haben einen signifikanten Einfluss auf die endogene
Variable price.
Bei der Standardisierung der Variablenwerte bleiben die t-Werte unverändert (gleich),
wegen:
t∗k
=
q
βk∗
V ar(βk∗ )
β̂k ·
= r 2
σ̂k
σ̂y
3. Bestimmtheitsmass:
σ̂k
σ̂y
=
r
β̂k ·
σ̂k
σ̂y
V ar(β̂k ·
σ̂k
)
σ̂y
β̂k
= tk
=q
V ar(β̂k )
V ar(β̂k )
s2e
3456.595
R =1− 2 =1−
= 0.6724
sy
10550.05
2
Korrigiertes Bestimmtheitsmass:
N −1
R̄ = 1 −
(1 − R2 ) = 0.6607
N −k
2
Bei der Standardisierung der Variablenwerte verändern sich beide Bestimmtheitsmasse
nicht. Man erhält die selben oben berechneten Werte.
4. Regressionskoeffizienten:
β̂kneu = β̂k · 1.2
β̂0neu = −21.77 · 1.2 = −26.12
neu
β̂sqrf
t = 0.1473
neu
β̂bdrms
= 16.62
neu
β̂lotsize
= 0.002481
Standardabweichungen:
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
ŝneu
= ŝk · 1.2
k
15
Übungen „Angewandte Ökonometrie I“
ŝneu
= 35.37
0
neu
ŝsqrf t = 0.001588
ŝneu
bdrms = 10.81
neu
ŝlotsize = 0.0007706
t-Werte:
tneu
=
k
β̂k · 1.2
β̂k
β̂kneu
=
=
= tk
neu
ŝk
ŝk · 1.2
ŝk
t-Werte verändern sich bei einer Reskalierung nicht.
Aufgabe 4: Anpassungsgüte
1. Bestimmtheitsmasse:
R2 = 1 −
SSR
SST
5307.161
7160.414
5300.170
R22 = 1 −
7160.414
5141.607
R32 = 1 −
7160.414
5140.795
R42 = 1 −
7160.414
R12 = 1 −
= 0.2588
= 0.2598
= 0.2819
= 0.2820
Weil das Bestimmtheitsmass für das vierte Modell am grössten ist, erklärt dieses die
Variation von wage am besten.
2.
• R2 ist eine Zufallsvariable, welche nicht dem wahren Wert ρ2 = 1−σe2 /σy2 entsprechen
muss.
• R2 erfasst nur lineare Zusammenhänge.
• R2 wächst monoton mit der Anzahl der erklärenden Variablen.
Regressionsmodell (4) erklärt die Variation von wage möglicherweise nur deshalb am
besten, weil es die grösste Anzahl von erklärenden Variablen besitzt. R2 favorisiert Modell
(4) a priori.
3. R̄2 bestraft das Hinzufügen von zusätzlichen hoch insignifikanten Variablen in ein
Modell.
R̄2 steigt, wenn der t-Wert einer zusätzlichen Variablen grösser als 1 ist.
• R̄2 ist nicht wie R2 interpretierbar.
• R̄2 ≤ R2 für k > 1.
• R̄2 kann für kleine R2 und kleine N − k sogar negativ werden.
• R2 = 1 −→ R̄2 = 1
R̄2 ist besser geeignet, weil die vier Modelle unterschiedliche Anzahl von Regressoren
besitzen.
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
16
Übungen „Angewandte Ökonometrie I“
4. Korrigiertes Bestimmtheitsmass:
N −1
R̄ = 1 −
(1 − R2 )
N −k
2
526 − 1
=1−
(1 − 0.2588) = 0.2560
526 − 3
526 − 1
R̄22 = 1 −
(1 − 0.2598) = 0.2555
526 − 4
526 − 1
R̄32 = 1 −
(1 − 0.2819) = 0.2778
526 − 4
526 − 1
2
R̄4 = 1 −
(1 − 0.2820) = 0.2765
526 − 5
R̄12
Im Sinne des korrigierten Bestimmtheitsmass hat Modell (3) die beste Anpassungsgüte.
Modell (4) hat das grösste Bestimmtheitsmass, weil es die gleichen Regressoren wie Modell
(3) plus einen Interaktionsterm besitzt. Der Interaktionsterm besitzt allerdings keinen
relevanten Einfluss.
Aufgabe 5: Binäre unabhängige Variablen (Dummies)
1. Die zu skizzierenden Funktionen sind:
wage(white)
[
= −0.8937 + 0.5409 educ
wage(nonwhite)
[
= −0.8937 + 0.5409 educ − 0.0509 nonwhite
= −0.9446 + 0.5409 educ
wage
5
4
3
2
1
0
0
1
2
3
4
5
6
7
8
9
10
∆educ = 1:
∆wage(white) = +0.5409USD/h
∆wage(nonwhite) = +0.5409USD/h
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
educ
17
Übungen „Angewandte Ökonometrie I“
2. Regressionskoeffizienten:
β̂ ∗ = cβ̂
β̂1∗ = 45 · (−0.8937) = −40.2165
β̂2∗ = 45 · 0.5409 = 24.3405
β̂3∗ = 45 · (−0.0509) = −2.2905
t-Werte:
t∗ =
β̂ ∗
β̂ · 45
β̂
=
= =t
∗
ŝ
ŝ · 45
ŝ
−0.8937
= −1.288
0.6939
0.5409
t2 =
= 10.112
0.0535
−0.0509
t3 ==
= −0.104
0.4875
t1 =
Die Regressionskoeffizienten werden alle mit dem Faktor 45 (Anzahl Stunden pro Woche)
multipliziert.
Die t-Werte bleiben die gleichen.
Es zeigt sich, dass nur gerade die Variable educ einen signifikanten Einfluss auf den
durchschnittlichen Stundenlohn bzw. Wochenlohn besitzt.
1. Die zu skizzierenden Funktionen sind:
wage(white)
[
= −1.2647 + 0.5702 educ
wage(nonwhite)
[
= −1.2647 + 0.5702 educ + 2.3553 nonwhite − 0.2008 nonwhite · educ
= 1.0906 + 0.3694 educ
wage
5
4
3
2
1
0
0
1
2
3
4
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
5
6
7
8
9
10
11
12
educ
18
Übungen „Angewandte Ökonometrie I“
∆educ = 1:
∆wage(white) = +0.5702USD/h
∆wage(nonwhite) = 0.5702 − 0.2008 = +0.3694USD/h
2. Korrigierte Bestimmtheitsmass:
N −1
R =1−
(1 − R2 )
N −K
∗
N = 526
526 − 1
=1−
(1 − 0.1648) = 0.1616
526 − 3
526 − 1
∗
R2 = 1 −
(1 − 0.1676) = 0.1628
526 − 4
R1∗
Modell (8) erklärt den durchschnittlichen Stundenlohn besser, weil das korrigierte Bestimmtheitsmass grösser ist.
3. Um die Frage zu beantworten, muss zusätzlich die folgende simultane Hypothese geprüft
werden:
H0 : βnonwhite = 0, βnonwhite·educ = 0
Dazu benötigt man die F-Statistik:
(SSRr − SSRur )/q
SSRur /(n − K)
(5980.682 − 5960.448)/2
=
5960.448/(526 − 4)
= 0.8860 < F2,522 = 3.012991
F =
H0 wird demzufolge nicht verworfen, d.h. es gibt keinen signifikanten Lohnunterschied
zwischen Weissen und Nichtweissen.
Aufgabe 6: Binäre abhängige Variable
1. Interpretationen:
• ecoprc: Die Wahrscheinlichkeit des Kaufs eines ökologisch produzierten Apfels sinkt
um 80.45 %, wenn der Preis des ökologisch produzierten Apfels (ecoprc: in CHF pro
Stück) um eine Einheit steigt.
• regprc: Die Wahrscheinlichkeit des Kaufs eines ökologisch produzierten Apfels steigt
um 72.07 %, wenn der Preis des normal produzierten Apfels (regprc: in CHF pro
Stück) um eine Einheit steigt.
• educ: Die Wahrscheinlichkeit des Kaufs eines ökologisch produzierten Apfels steigt
um 2.28 %, wenn die Anzahl Jahre der Ausbildung (educ) um eine Einheit steigt.
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
19
Übungen „Angewandte Ökonometrie I“
Den grössten Einfluss auf den Kauf eines ökologisch produzierten Apfels hat die Variable
ecoprc bzw. der Preis des ökologisch produzierten Apfels.
2. Nachteile:
• W-keitsprognosen kleiner 0 und grösser 1 sind möglich.
• Die Erfolgsw-keit kann nicht linear abhängig sein von den x-Variablen für alle möglichen x-Werte.
• Im LWM liegt stets Heteroskedastizität vor!
Alle Nachteile werden beim Logit-Modell behoben!
3. Durchschnittlicher Einfluss und Interpretation:
• ecoprc:
n
1X
g(β̂0 + xi β̂)] · βecoprc · △ecoprc
n i=1
= 0.2097 · (−3.6705) = −0.7697
△P (ecobuy = 1 | x) ≈ [
Die Response Wahrscheinlichkeit des Kaufs eines ökologisch produzierten Apfels
sinkt durchschnittlich um 76.97 %, wenn der Preis des ökologisch produzierten
Apfels (ecoprc: in CHF pro Stück) um eine Einheit steigt. Etwa 3.46 Prozentpunkte
kleiner Einfluss auf Response Wahrscheinlichkeit als beim LWM.
• regprc:
△P (ecobuy = 1 | x) ≈ 0.2097 · (3.2682) = 0.6853
Die Response Wahrscheinlichkeit des Kaufs eines ökologisch produzierten Apfels
steigt durchschnittlich um 68.53 %, wenn der Preis des normal produzierten Apfels (regprc: in CHF pro Stück) um eine Einheit steigt. Etwa 3.54 Prozentpunkte
kleiner Einfluss auf Response Wahrscheinlichkeit als beim LWM.
• educ:
△P (ecobuy = 1 | x) ≈ 0.2097 · (0.1083) = 0.0227
Die Response Wahrscheinlichkeit des Kaufs eines ökologisch produzierten Apfels
steigt durchschnittlich um 2.27 %, wenn die Anzahl Jahre der Ausbildung (educ)
um eine Einheit steigt. Entspricht dem Regressionskoeffizienten aus dem LWM für
educ.
Die durchschnittlich partiellen Einflusse dieser Variablen sind in etwa vergleichbar mit
den Regressionskoeffizienten des LWM.
4. Prognosen:
Beobachtung
1
2 3 4
5 6
7 8 9
10
ecobuy
^ LW M
ecobuy
1
0 0 1
1 1
1 0 1
1
0
0 1 1
1 1
1 1 1
1
^ Logit
ecobuy
0
0 1 1
1 1
1 1 1
1
Anteil korrekt prognostizierte Werte beim LWM: 7/10 = 0.7
Anteil korrekt prognostizierte Werte beim Logit-Modell: 7/10 = 0.7
Die beiden Werte sind identisch, d.h. beide Modelle prognostizieren den Kauf eines
ökologisch produzierten Apfels gleich gut.
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
20
Übungen „Angewandte Ökonometrie I“
5. Simultane Nullhypothese:
H0 : βincome = 0; βage = 0
Prüfgrösse:
LR = 2(Lur − Lr ) = 2(−400.9329 − (−402.3873)) = 2.9088
Ablehnungsbereich: R =]χ22 ; +∞[=]5.991; +∞[
LR ∈ R → H0 wird nicht verworfen , d.h. die beiden Variablen haben keinen signifikanten Einfluss auf die Response Wahrscheinlichkeit.
Aufgabe 7: Binäre Variablen
1. Die zu skizzierenden Funktionen sind:
\
log(wage)(black
= 0) = 0.9390 + 0.0939 educ
\
log(wage)(black
= 1) = 0.9390 + 0.0939 educ − 0.0287 black = 0.9103 + 0.0939 educ
log(wage)
5
4
3
2
1
0
0
1
2
3
4
5
6
7
8
9
10
educ
△educ = 1:
△wage(black = 0)
= 100 · β̂educ = 9.39%
△educ
△wage(black = 1)
= 100 · β̂educ = 9.39%
△educ
2. Um die Frage zu beantworten, muss die folgende simultane Nullhypothese geprüft werden:
H0 : βblack = 0, βhispanic = 0
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
21
Übungen „Angewandte Ökonometrie I“
Dazu benötigt man die F-Statistik:
(SSRr − SSRur )/q
SSRur /(n − K)
(733.5411 − 733.3739)/2
=
733.3739/(3286 − 4)
= 0.3741 < F0.95,2,3282 = 2.9985
F =
H0 wird demzufolge nicht verworfen, d.h. beide Variablen haben zusammen keinen signifikanten Einfluss auf die endogene Variable wage.
3. Nachteile:
• Wahrscheinlichkeitsprognosen kleiner 0 und grösser 1 sind möglich.
• Die Erfolgswahrscheinlichkeit kann nicht linear abhängig sein von den x-Variablen
für alle möglichen x-Werte.
• Im LWM liegt stets Heteroskedastizität vor!
Alle Nachteile werden beim Probit-Modell behoben.
4. Durchschnittlicher Einfluss und Interpretation:
• educ:
n
1X
g(β̂0 + xi β̂)] · βeduc · △educ
n i=1
= 0.3668 · 0.1059 = 0.0388
△P (inlf = 1 | x) ≈ [
Die Response Wahrscheinlichkeit der Erwerbstätigkeit einer Frau steigt durchschnittlich um 3.88 %, wenn diese sich ein Jahr zusätzlich ausbilden lässt.
• exper:
△P (inlf = 1 | x) ≈ 0.3668 · (−0.0074) = −0.0027
Die Response Wahrscheinlichkeit der Erwerbstätigkeit einer Frau sinkt durchschnittlich um 0.27 %, wenn diese ein Jahr mehr Arbeitserfahrung gesammelt hat.
• nwifeinc:
△P (inlf = 1 | x) ≈ 0.3668 · (−0.0088) = −0.0032
Die Response Wahrscheinlichkeit der Erwerbstätigkeit einer Frau sinkt durchschnittlich um 0.32 %, wenn das nicht von der Frau erwirtschaftete Haushaltseinkommen um eine Einheit bzw. 1000 USD steigt.
5. Um die Frage zu beantworten, muss die folgende simultane Nullhypothese geprüft werden:
H0 : βblack = 0, βhispanic = 0
Prüfgrösse:
LR = 2(Lur − Lr ) = 2(−3611.719 − (−3614.128)) = 4.818
Ablehnungsbereich: R =]χ22 ; +∞[=]5.991; +∞[
LR ∈
/ R → H0 wird nicht verworfen, d.h. die beiden Variablen haben zusammen keinen
signifikanten Einfluss auf die Response Wahrscheinlichkeit.
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
22
Übungen „Angewandte Ökonometrie I“
Aufgabe 8: Zeitreihen und Autokorrelation
1. Ein stochastischer Prozess {xt : t = 1, 2, ...} mit einem endlichen zweiten Moment heisst
kovarianz- oder schwach stationär falls gilt:
(a) E(xt ) ist konstant
(b) V ar(xt ) ist ist konstant und
(c) für alle t, h ≥ 1 hängt Cov(xt , xt+h ) nur von h und nicht von t ab.
Die Regressionskoeffizienten der AR(1)-Prozesse müssen absolut kleiner Eins (|ρ| < 1)
sein, damit diese schwach stationär sind. Bei beiden AR(1) Beziehungen der Residuen ist
dies der Fall.
2.
• Impact multipliers (propensity) :
IP OLS = δ0OLS = 0.1190
IP F GLS = δ0F GLS = 0.0933
Der impact multiplier zeigt den direkten Einfluss auf die endogene Variable einer
Veränderung des Regressors im Zeitpunkt t. Bei der OLS-Schätzung ist der impact
multiplier minimal grösser als bei der FGLS-Schätzung.
• Long-run multipliers (propensity) :
OLS
LRP OLS = δ0OLS + δ1OLS + ... + δ13
= 1.1720
F GLS
F GLS
F GLS
F GLS
LRP
= δ0
+ δ1
+ ... + δ13
= 1.1246
Der long-run multiplier gibt den gesamten Effekt einer Veränderung des Regressors
auf die endogene Variable an. Wiederum ist bei der OLS-Schätzung der multiplier
minimal grösser als bei der FGLS-Schätzung.
3. Autokorrelation liegt vor, wenn die Annahme:
E(ut us |xt , xs ) = 0 für alle t 6= s
nicht erfüllt sit, d.h. die Residuen sind nicht unabhängig von ihren verzögerten Werten.
Idee und Nullhypothese eines geeigneten Tests: Man überprüft die Nullhypothese
H0 : ρ = 0 mit einem t-Test für den AR(1)-Prozess:
ût = ρût−1 + et
wobei û die Residuen des geschätzten Modells sind und et white noise ist.
t-Statistik für ρ:
ρ̂OLS
0.5027 (1)
=
= 9.6119
OLS
s(ρ̂
)
0.0523 (1)
ρ̂F GLS
0.0023 (1)
=
=
= 0.0376
F
GLS
s(ρ̂
)
0.0612 (1)
t̂OLS =
t̂F GLS
Nach der Faustregel |t̂| > 2 für einen signifikant von Null verschiedener Regressionskoeffizient ist ρOLS signifikant und ρF GLS nicht signifikant von Null verschiedenen, d.h. es liegt
bei der OLS-Schätzung Autokorrelation und bei der FGLS-Schätzung keine Autokorrelation vor. Für die Regressionskoeffizienten bedeutet dies, dass die FGLS-Schätzer die
BLUE-Eigenschaften erfüllen jedoch die OLS-Schätzer nicht (keine effiziente Schätzer).
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
23
Übungen „Angewandte Ökonometrie I“
4.
1. Bestimmen Sie die Residuen ût des OLS-geschätzten Regressionsmodells aus der
Problemstellung.
2. Schätzen Sie den Regressionsparameter ρ für:
ût = ρût−1 + ǫt
3. Korrigieren Sie Designmatrix und die endogene Variable des Modells aus der Problemstellung mit:
X∗t = Xt − ρXt−1
y∗t = yt − ρyt−1
4. Schätzen Sie nun das Modell:
y∗t = X∗t β ∗ + ut
Die erhaltenen Regressionsparameter β ∗ sind die FGLS-Schätzer.
Bei Cochrane-Orcutt-Verfahren werden nur die Beobachtungen t = 2, ..., n korrigiert,
beim Prais-Winston-Verfahren wird zusätzlich t = 1 wie folgt korrigiert:
ỹ1 = (1 − ρ2 )1/2 y1 , x̃1i = (1 − ρ2 )1/2 x1i
c 2011 Seminar für Statistik – Universität Freiburg Schweiz
Herunterladen