3 Statistische Eigenschaften des KQ

Werbung
Methoden der Ökonometrie — 3 Statistische Eigenschaften des KQ-Schätzers — U Regensburg — Okt. 2009
3 Statistische Eigenschaften des KQ-Schätzers:
Erwartungswert und Kovarianz
• Das multiple lineare Regressionsmodell (2.1):
Alternative Schreibweisen:
yt = β1xt1 + β2xt2 + · · · + βk xtk + ut,
yt = Xtβ + ut,
y = Xβ + u.
• KQ-Schätzer (2.2):
t = 1, . . . , n,
t = 1, . . . , n,
wobei Xt = xt1 · · · xtk ,
β̂ = (XT X)−1XT y.
72
Methoden der Ökonometrie — 3 Statistische Eigenschaften des KQ-Schätzers — U Regensburg — Okt. 2009
73
• Zur Beantwortung vieler Fragen ist die Kenntnis der algebraischen und geometrischen Eigenschaften des KQ-Schätzers (Kapitel 2) nicht ausreichend, sondern die
Kenntnis der statistischen Eigenschaften des KQ-Schätzers notwendig.
Beispiele:
– Angenommen, Ihnen stehen neben den k Regressoren noch weitere n − k
mögliche Erklärungsvariablen zur Verfügung.
∗ Können Sie die Residuenquadratsumme SSR (2.24) weiter reduzieren, indem
Sie zu den k Regressoren weitere Regressoren aufnehmen? Wenn ja wieweit?
∗ Wenn ja, können Sie dadurch yt besser erklären? Was verstehen Sie unter
besser erklären”?
”
– Angenommen, Ihnen liegt eine weitere Stichprobe mit k Regressoren zu derselben Fragestellung vor.
∗ Warum unterscheiden sich die beiden KQ-Schätzungen vermutlich?
∗ Welche der beiden KQ-Schätzungen wählen Sie?
Methoden der Ökonometrie — 3 Statistische Eigenschaften des KQ-Schätzers — U Regensburg — Okt. 2009
74
∗ Sollen Sie die KQ-Ergebnisse beider Stichproben zusammenfügen?
Die Analyse statistischer Eigenschaften erfordert zusätzliche Annahmen. Die Annahmen beziehen sich auf die Art der Datengenerierung, bzw. auf
die Eigenschaften der Grundgesamtheit.
Für die Analyse statistischer Eigenschaften sind die Konzepte datengenerierender Prozesse und ökonometrischer Modelle sehr hilfreich, siehe folgenden
Abschnitt.
Methoden der Ökonometrie — 3.1 Datengenerierende Prozesse & ökonometrische Modelle — U Regensburg — Okt. 2009
75
3.1 Datengenerierende Prozesse und ökonometrische
Modelle
• Grundgesamtheit (population): Menge aller Einheiten, über die man (statistische) Aussagen gewinnen möchte und aus der bei einer Stichprobenerhebung
gezogen werden kann.
Beispiele:
– Menge aller abhängig Beschäftigten in einem Land.
– Anzahl von Verspätungen von mehr als 10 Minuten pro Tag und Bahnhof.
Im zweiten Fall ist die Grundgesamtheit unendlich. Anstelle einer Grundgesamtheit
ist es u.U. verständlicher, sich einen stochastischen Mechanismus” vorzustellen,
”
der die Stichprobenwerte oder Stichprobendaten erzeugt haben könnte.
Dieser kann mit einer Wahrscheinlichkeitsdichtefunktion dargestellt werden.
Methoden der Ökonometrie — 3.1 Datengenerierende Prozesse & ökonometrische Modelle — U Regensburg — Okt. 2009
76
• Wiederholung aus der Wahrscheinlichkeitstheorie (Davidson & MacKinnon
2004, Section 1.2):
– Marginale Wahrscheinlichkeitsverteilung (marginal probability distribution, cumulative distribution function (CDF)) für eine Zufallsvariable X:
F (x) ≡ P (X ≤ x).
(3.1)
– Gemeinsame Wahrscheinlichkeitsverteilung (joint probability distribution function) für zwei oder mehr Zufallsvariablen X1, . . . , Xm:
F (x1, x2, . . . , xm) ≡ P ((X1 ≤ x1) ∩ · · · ∩ (Xm ≤ xm))
= P (X1 ≤ x1, . . . , Xm ≤ xm),
(3.2)
Methoden der Ökonometrie — 3.1 Datengenerierende Prozesse & ökonometrische Modelle — U Regensburg — Okt. 2009
77
– Beachte: Für jede stetige Zufallsvariable X ∈ R gilt P (X = x) = 0.
Wieso?
Deshalb Betrachtung von Wahrscheinlichkeitsdichten.
– Wahrscheinlichkeitsdichtefunktion (probability density function)
(PDF): Für eine stetige Zufallsvariable mit differenzierbarer Wahrscheinlichkeitsverteilung F (x) wird die Ableitung erster Ordnung Wahrscheinlichkeitsdichtefunktion genannt
dF (x)
,
(3.3)
f (x) ≡
dx
Z x
f (z)dz = F (x).
(3.4)
−∞
Interpretation: Die marginale Wahrscheinlichkeitsdichte f (x) für die Zufallsvariable X gibt die Rate an, mit der sich die Wahrscheinlichkeit P (X ≤ x) für
das Intervall (−∞, x] verändert, wenn das genannte Intervall um eine winzige
Intervalllänge (x, x + δ] zu (−∞, x + δ] verlängert wird:
P (x < X ≤ x + δ) = P (X ≤ x + δ) − P (X ≤ x) ≈ f (x)δ.
Siehe Eine kurze Einführung in die Wahrscheinlichkeitstheorie Sommer 2009”.
”
Methoden der Ökonometrie — 3.1 Datengenerierende Prozesse & ökonometrische Modelle — U Regensburg — Okt. 2009
78
– Marginale Wahrscheinlichkeitsdichtefunktion für eine stetige Zufallsvariable X: (3.3)
– Gemeinsame Wahrscheinlichkeitsdichtefunktion (joint density function) für zwei oder mehr stetige und Zufallsvariablen X1, . . . , Xm ∈ R mit
partiell differenzierbarer CDF:
∂ mF (x1, x2, . . . , xm)
f (x1, x2, . . . , xm) ≡
,
∂x
∂x
·
·
·
∂x
Z Z1 2 Z m
x1
x2
F (x1, . . . , xm) =
−∞
−∞
(3.5)
xm
···
−∞
F (x1) = F (x1, ∞, . . . , ∞).
f (z1 , z2, . . . , zm) dz1dz2 · · · dzm,
(3.6)
(3.7)
Zusammenhang zwischen marginalen und gemeinsamen Dichten:
Es gilt, z.B. im Fall von drei Zufallsvariablen
Z ∞Z ∞
f (x1) =
f (x1, z2, z3) dz2dz3.
(3.8)
−∞
−∞
Methoden der Ökonometrie — 3.1 Datengenerierende Prozesse & ökonometrische Modelle — U Regensburg — Okt. 2009
79
– Bedingte Wahrscheinlichkeitsdichte (conditional probability distribution function) für Zufallsvariable X1 gegeben eine Zufallsvariable X2 oder
mehrere Zufallsvariablen X2, . . . , Xm:
f (x1, x2)
,
f (x1|x2) ≡
f (x2)
vorausgesetzt, dass f (x2) > 0,
f (x1, x2, . . . , xm)
f (x1|x2, . . . , xm) ≡
,
f (x2, . . . , xm)
vorausgesetzt, dass f (x2, . . . , xm) > 0.
(3.9)
(3.10)
– Gilt
F (x1, x2) = F (x1, ∞)F (∞, x2) = P (X1 ≤ x1) P (X2 ≤ x2),
(3.11)
werden die Zufallsvariablen X1 und X2 als statistisch unabhängig oder
unabhängig bezeichnet und es gilt
f (x1, x2) = f (x1) f (x2).
(3.12)
Entsprechende Faktorisierungen gelten für mehr als zwei Zufallsvariablen.
Methoden der Ökonometrie — 3.1 Datengenerierende Prozesse & ökonometrische Modelle — U Regensburg — Okt. 2009
80
• Datengenerierender Mechanismus (data generating mechanism) (DGP)
in der Ökonometrie/Statistik:
– Stochastischer Mechanismus, der einen Teil oder alle beobachteten Stichprobendaten erzeugt haben kann.
– Ein stochastischer Mechanismus wird vollständig durch eine gemeinsame
Wahrscheinlichkeitsdichte f (·) der n Stichprobenbeobachtungen beschrieben
f (y1, X1, y2, X2, . . . , yn, Xn) = f (y, X).
(3.13)
– Es gilt wegen (3.10)
f (y, X) = f (y|X) f (X).
(3.14)
Ist für die interessierende (ökonomische) Fragestellung ausschließlich die Kenntnis des stochastischen Mechanismus von y gegeben X relevant und nicht wie
X generiert wird, so genügt die Analyse der bedingten Wahrscheinlichkeitsdichte
f (y|X) = f (y1 , y2, . . . , yn|X1, X2, . . . , Xn).
Methoden der Ökonometrie — 3.1 Datengenerierende Prozesse & ökonometrische Modelle — U Regensburg — Okt. 2009
81
Dies ist der für die klassische Regressionsanalyse typische Fall.
– Liegt eine Zufallsstichprobe vor, gilt wegen (3.12)
f (y, X) = f (y1, X1) f (y2, X2) · · · f (yn, Xn)
= f (y1|X1) f (X1 ) · · · f (yn |Xn) f (Xn )
(3.15)
und es ist ausreichend, die bedingte Dichte
f (yt |Xt),
t = 1, . . . , n,
zu betrachten.
– Liegen (univariate) Zeitreihendaten vor, ist es sinnvoll, die gemeinsame Dichte
(3.13) als
f (y) = f (y1 , y2, . . . , yn)
= f (yn |yn−1, . . . , y1)f (yn−1|yn−2, . . . , y1)
· · · f (y3|y2, y1) f (y2|y1) f (y1)
zu schreiben, wobei (3.10) mehrmals angewendet wird.
(3.16)
Herunterladen