Die Regressionsanalyse

Werbung
Die Regressionsanalyse
• Zielsetzung:
Untersuchung und Quantifizierung funktionaler Abhängigkeiten
zwischen metrisch skalierten Variablen
• eine unabhängige Variable
¾ Einfachregression
• mehr als eine unabhängige Variable
¾ Mehrfach-/ Multiple Regressionsanalyse
Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie
Grundlagen der Einfachregression
• Ausgangspunkt: ein unterstellter Kausalzusammenhang der
Form
Y=a+b*X
• Realität: nicht nur systematische Einflüsse der erklärenden
Variablen X, sondern eine Reihe weiterer Einflüsse
¾ Beobachtungen liegen selten auf der Regressionsgeraden
¾ Residuen
• Bestimmung der Regressionsparameter: mittels der
Methode der Kleinsten Quadrate (KQ, englisch OLS)
• Gütekriterium der Regression: Bestimmtheitsmaß bzw. R2
Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie
Induktive Verwendung der Regressionsanalyse I
• additive Überlagerung von systematischer Komponente und
zufälliger Fehlervariablen
¾ abhängige Variable wird zur Zufallsvariablen
¾ Modell des wahren Zusammenhangs in der GG
Yi = α + βX + εi
• Aussagen über die wahren Parameter α, β erfordern Informationen oder Annahmen zu den Störeinflüssen εi
Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie
Induktive Verwendung der Regressionsanalyse II
Gängige Annahmen zu den Störeinflüssen
•
εi ist eine zufällige Größe
•
E(εi/x) = 0
•
Var(εi/x) = Var(εi) = σ2 (Homoskedastizität)
•
Normalverteilung
Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie
Induktive Verwendung der Regressionsanalyse III
Aufbauend auf diesen Annahmen wird es möglich
•
Regressionskoeffizienten zu schätzen
•
Test des Regressionsmodell und der Regressionskoeffizienten
•
Prognose des Werts der abhängigen Variable anhand
vorgegebener Werte der unabhängigen Variable
¾ Berechnung der Regressionsparameter:
gängige Verfahren: KQ oder Maximum Likelihood
¾ Wichtig:
Kontrolle der getroffenen Annahmen über Residuen
Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie
Grundlagen der Mehrfachregression
• Zwei oder mehr unabhängige Variablen
• Modell:
Yi = α + β1X1 + β2X2 + β3X3 + ... + βmXm + εi
• Voraussetzung:
möglichst geringe Abhängigkeiten/Korrelationen unter den
unabhängigen Variablen
¾ sonst: Problem der Multikollinearität
• Ansonsten prinzipiell gleiche Schätzmethoden: KQ, ML
Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie
Auswahl der einzubeziehenden Variablen
1) Theorie liegt vor:
¾ Einschluss aller theoretisch relevanter Variablen
2) Theorie fehlt, Strategie des „Fischens“ mit dem Ziel eines
möglichst guten Schätzmodells:
a) Einschluss
b) Rückwärts
c) Vorwärts
d) Schrittweise
Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie
Mögliche Probleme der Regressionsanalyse
¾ insbesondere bei Verletzung der Annahmen des Modells
– Autokorrelation der Residuen
– Multikollinearität
– Heteroskedastizität
– keine Normalverteilung der Residuen
– Ausreißer
¾ Inhaltlicher Art
– Identifikationsproblem
– Ökologischer Fehlschluss
Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie
Ablauf einer Regressionsanalyse
1) Theoretische Überlegungen
2) Überprüfung des Zusammenhangs
3) Rechnen der Regression
4) Überprüfung der Voraussetzungen, gegebenenfalls zurück zu 1)
5) Inhaltliche Interpretation
Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie
Einbeziehung nicht metrisch skalierter Variablen
¾ für kategoriale Variablen möglich und sinnvoll, z.B. bei
– zeitlichen Strukturbrüchen
– inhaltlichen Strukturbrüchen innerhalb der Beobachtungen
Wie?
• Einführung von Dummy-Variablen für die x-1 Kategorien,
jeweils mit den Ausprägungen 0 oder 1
• Wegen Übersichtlichkeit nur sinnvoll bei wenigen Kategorien
der kategorialen Variablen
Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie
Weitere Ansätze bei anderen Konstellationen
und Skalenniveaus
Unabhängige Variablen
Abhängige
Variable
metrisch
kategorial
alle metrisch
gemischt
alle diskret
keine
Mehrfachregression
Regressionsanalyse mit
Dummy-Variablen
Varianzanalyse
multiple Korrelationsanalyse
Logit-, Probit-, log-lineare Ansätze
Quelle: Bahrenberg/Giese/Nipper 1992, S. 14.
Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie
log-linearer
Ansatz
Anwendung der Regressionsanalyse
¾ Bei Kenntnissen/Vermutungen über kausale Beziehungen
• Rein deskriptiv zur systematischen Zusammenfassung von Datenmaterial
vs. induktive Verwendung
• Ursachenanalyse (z.B. zur Erklärung raumbezogene Verhaltensweisen)
• Wirkungsanalyse (z.B. als Grundlage räumlicher Politiken)
• Hilfsmethode zahlreicher anderer Verfahren, z.B. Grundlage
zeitreihenanalytischer Verfahren (Æ Prognose!)
• Anwendungsbeispiele:
Schätzung regionaler Produktionsfunktionen, regionaler Kosten-,
Nachfrage- und Angebotsfunktionen für öffentliche Infrastruktur etc.
¾ Sehr breites Anwendungsspektrum, Arbeitspferd der empirischen Arbeit
Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie
Herunterladen