Die Regressionsanalyse • Zielsetzung: Untersuchung und Quantifizierung funktionaler Abhängigkeiten zwischen metrisch skalierten Variablen • eine unabhängige Variable ¾ Einfachregression • mehr als eine unabhängige Variable ¾ Mehrfach-/ Multiple Regressionsanalyse Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie Grundlagen der Einfachregression • Ausgangspunkt: ein unterstellter Kausalzusammenhang der Form Y=a+b*X • Realität: nicht nur systematische Einflüsse der erklärenden Variablen X, sondern eine Reihe weiterer Einflüsse ¾ Beobachtungen liegen selten auf der Regressionsgeraden ¾ Residuen • Bestimmung der Regressionsparameter: mittels der Methode der Kleinsten Quadrate (KQ, englisch OLS) • Gütekriterium der Regression: Bestimmtheitsmaß bzw. R2 Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie Induktive Verwendung der Regressionsanalyse I • additive Überlagerung von systematischer Komponente und zufälliger Fehlervariablen ¾ abhängige Variable wird zur Zufallsvariablen ¾ Modell des wahren Zusammenhangs in der GG Yi = α + βX + εi • Aussagen über die wahren Parameter α, β erfordern Informationen oder Annahmen zu den Störeinflüssen εi Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie Induktive Verwendung der Regressionsanalyse II Gängige Annahmen zu den Störeinflüssen • εi ist eine zufällige Größe • E(εi/x) = 0 • Var(εi/x) = Var(εi) = σ2 (Homoskedastizität) • Normalverteilung Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie Induktive Verwendung der Regressionsanalyse III Aufbauend auf diesen Annahmen wird es möglich • Regressionskoeffizienten zu schätzen • Test des Regressionsmodell und der Regressionskoeffizienten • Prognose des Werts der abhängigen Variable anhand vorgegebener Werte der unabhängigen Variable ¾ Berechnung der Regressionsparameter: gängige Verfahren: KQ oder Maximum Likelihood ¾ Wichtig: Kontrolle der getroffenen Annahmen über Residuen Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie Grundlagen der Mehrfachregression • Zwei oder mehr unabhängige Variablen • Modell: Yi = α + β1X1 + β2X2 + β3X3 + ... + βmXm + εi • Voraussetzung: möglichst geringe Abhängigkeiten/Korrelationen unter den unabhängigen Variablen ¾ sonst: Problem der Multikollinearität • Ansonsten prinzipiell gleiche Schätzmethoden: KQ, ML Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie Auswahl der einzubeziehenden Variablen 1) Theorie liegt vor: ¾ Einschluss aller theoretisch relevanter Variablen 2) Theorie fehlt, Strategie des „Fischens“ mit dem Ziel eines möglichst guten Schätzmodells: a) Einschluss b) Rückwärts c) Vorwärts d) Schrittweise Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie Mögliche Probleme der Regressionsanalyse ¾ insbesondere bei Verletzung der Annahmen des Modells – Autokorrelation der Residuen – Multikollinearität – Heteroskedastizität – keine Normalverteilung der Residuen – Ausreißer ¾ Inhaltlicher Art – Identifikationsproblem – Ökologischer Fehlschluss Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie Ablauf einer Regressionsanalyse 1) Theoretische Überlegungen 2) Überprüfung des Zusammenhangs 3) Rechnen der Regression 4) Überprüfung der Voraussetzungen, gegebenenfalls zurück zu 1) 5) Inhaltliche Interpretation Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie Einbeziehung nicht metrisch skalierter Variablen ¾ für kategoriale Variablen möglich und sinnvoll, z.B. bei – zeitlichen Strukturbrüchen – inhaltlichen Strukturbrüchen innerhalb der Beobachtungen Wie? • Einführung von Dummy-Variablen für die x-1 Kategorien, jeweils mit den Ausprägungen 0 oder 1 • Wegen Übersichtlichkeit nur sinnvoll bei wenigen Kategorien der kategorialen Variablen Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie Weitere Ansätze bei anderen Konstellationen und Skalenniveaus Unabhängige Variablen Abhängige Variable metrisch kategorial alle metrisch gemischt alle diskret keine Mehrfachregression Regressionsanalyse mit Dummy-Variablen Varianzanalyse multiple Korrelationsanalyse Logit-, Probit-, log-lineare Ansätze Quelle: Bahrenberg/Giese/Nipper 1992, S. 14. Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie log-linearer Ansatz Anwendung der Regressionsanalyse ¾ Bei Kenntnissen/Vermutungen über kausale Beziehungen • Rein deskriptiv zur systematischen Zusammenfassung von Datenmaterial vs. induktive Verwendung • Ursachenanalyse (z.B. zur Erklärung raumbezogene Verhaltensweisen) • Wirkungsanalyse (z.B. als Grundlage räumlicher Politiken) • Hilfsmethode zahlreicher anderer Verfahren, z.B. Grundlage zeitreihenanalytischer Verfahren (Æ Prognose!) • Anwendungsbeispiele: Schätzung regionaler Produktionsfunktionen, regionaler Kosten-, Nachfrage- und Angebotsfunktionen für öffentliche Infrastruktur etc. ¾ Sehr breites Anwendungsspektrum, Arbeitspferd der empirischen Arbeit Dipl.-Vw. Lutz Benson, Volkswirtschaftslehre, insbes. Stadt- und Regionalökonomie