Vorlesung: Empirische Wirtschaftsforschung Prof. Dr. Michael Berlemann Bachelor Empirische Wirtschaftsforschung (WS-16-V-05.2) FT 2010 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 1 / 265 Organisatorisches Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 2 / 265 Organisatorisches Vorlesungskonzept Anwendungsorientierte Einführung in die empirische Wirtschaftsforschung Verwendete Ökonometriesoftware: EViews Prüfung: 60-minütige Abschlussklausur Downloads (auf Internetseite der Professur) Vorlesungsfolien Verwendete Datensätze Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 3 / 265 Organisatorisches Begleitübung Zwei inhaltsgleiche Begleitübungen im PC Labor WiSo: Dienstag, 15:45 bis 17:15 Uhr Dienstag, 17:30 bis 19:00 Uhr Übungen finden unregelmäßig nach Ankündigung in Vorlesung und Internet statt Teilnahme ist freiwillig, wird aber empfohlen Da Computerkapazität begrenzt, ist vorab zwingend Anmeldung bei Herrn Hielscher nötig Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 4 / 265 Grobgliederung der Vorlesung I 1. Grundlagen 2. Datenquellen der empirischen Wirtschaftsforschung 3. Einführung in EViews 4. Häufigkeitsverteilungen 5. Maßzahlen für einzelne Merkmale 6. Maßzahlen für den Zusammenhang zwischen Merkmalen 7. Zufallsvariablen und deren Eigenschaften 8. Stichproben 9. Grundlagen des Testens von Hypothesen 10. Verteilungs-Tests 11. Mittelwert-Tests 12. Lineare Einfachregression 13. Lineare Mehrfachregression 14. Koeffizienten- und Spezifikationstests 15. Schätzprobleme und deren Lösung 16. Regressionen bei diskreten abhängigen Variablen 17. Einführung in die Zeitreihenanalyse Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 5 / 265 Grundlagen 1. Grundlagen 1.1 1.2 1.3 1.4 Gegenstand der empirischen Wirtschaftsforschung Überprüfung modellgestützter Hypothesen Evaluierung von Politikmaßnahmen Prognose Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 6 / 265 Grundlagen 1.1 Gegenstand der empirischen Wirtschaftsforschung Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 7 / 265 Grundlagen 1.2 Überprüfung modellgestützter Hypothesen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 8 / 265 Grundlagen 1.2 Überprüfung modellgestützter Hypothesen Kritischer Rationalismus Sir Karl Popper * 28. Juli 1902 in Wien † 17. September 1994 in London Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 9 / 265 Grundlagen Überprüfung modellgestützter Hypothesen 1.2 Überprüfung modellgestützter Hypothesen Beispiel Konsumentenverhalten bei Preisänderungen Menge x2 x2opt U1 x1opt Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung Menge x1 FT 2010 10 / 265 Grundlagen 1.2 Überprüfung modellgestützter Hypothesen Überprüfung modellgestützter Hypothesen Beispiel Konsumentenverhalten bei Preisänderungen Menge x2 Konsequenzen eines Preisanstiegs bei Gut x1 x2opt U1 x1opt Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung Menge x1 FT 2010 11 / 265 Grundlagen 1.3 Evaluierung von Politikmaßnahmen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 12 / 265 Grundlagen 1.3 Evaluierung von Politikmaßnahmen Beispiel: Tabaksteuererhöhung 2004 Bundeskanzler Gerhard Schröder Tabaksteuerreform 2004 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 13 / 265 luierung von Politikmaßnahmen 1.3 Evaluierung von Politikmaßnahmen Grundlagen Laffer-Kurve Steueraufkommen Laffer-Kurve Steuersatz τ=0% Prof. Dr. Michael Berlemann (HSU) τ* Empirische Wirtschaftsforschung τ = 100 % FT 2010 14 / 265 Grundlagen 1.3 Evaluierung von Politikmaßnahmen Deutsche Tabaksteuer-Einnahmen 1949-2009 in Mio. Euro (Quelle: Statistisches Bundesamt) 16000 14000 12000 10000 8000 6000 4000 2000 0 1949 1954 1959 1964 Prof. Dr. Michael Berlemann (HSU) 1969 1974 1979 1984 1989 Empirische Wirtschaftsforschung 1994 1999 2004 FT 2010 2009 15 / 265 Grundlagen 1.3 Evaluierung von Politikmaßnahmen Beispiel: Tabaksteuererhöhung Tabaksteuererhöhung 2004 ”Misslungene” Tabaksteuererhöhung 2004 als „Misslungene Misslungene“ Tabaksteuererhöhung von von 2004 als schönes praktisches Beispiel für die empirischer Folgen mangelnder oder falscher Folge mangelnder oder falscher empirischer Abschätzungen der Folgen wirtschaftspolitischer Abschätzung derMaßnahmen Folgen einer "R i t "Resistenz d der R Raucher" h " kann k man mit it "geringer " i di direkter kt wirtschaftspolitischer Maßnahme Preiselastizität der Nachfrage" übersetzen. Dass der Finanzminister weniger Einnahmen aus der (Steuererhöhung) Tabaksteuer fürchten muss, kommt der Aussage gleich, dass sich der Markt für Tabakwaren fallenden Bereich der ”Resistenz der Raucher” kann manim mit ”geringer Laffer-Kurve befindet. direkter Preiselastizität der Nachfrage” übersetzen. Dass der Finanzminister weniger Einnahmen aus der Tabaksteuer fürchten muss, kommt der Aussage gleich, dass sich der Markt für Tabakwaren im fallenden Bereich der Laffer-Kurve befindet. aus: Schaumburger Nachrichten, 11.2.2004 FT 2009 Prof. Dr. Michael Berlemann (HSU) Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung" Quelle: Schaumburger Nachrichten, 11.2.2004 Empirische Wirtschaftsforschung FT 2010 16 / 265 Grundlagen 1.4 Prognose Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 17 / 265 Grundlagen 1.4 Prognose Bevölkerungsprognose 2007 bis 2025 für Deutschland regional (Quelle: BBSR) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 18 / 265 Grundlagen Literaturhinweise Literaturhinweise zum 1. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 19 / 265 Grundlagen Literaturhinweise Literaturhinweise zum 1. Kapitel Hujer, R. und R. Cremer (1978): Methoden der empirischen Wirtschaftsforschung, Verlag Vahlen, München [insbes. Kapitel 1 Abschnitt I]. Laffer, A. B. (1981): Government Exactions and Revenue Deficiencies, in: Cato Journal, Vol. 1, Nr. 1, S. 1-21. Mosler, K. und F. Schmid (2006): Beschreibende Statistik und Wirtschaftsstatistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 0]. Winker, P. (2007): Empirische Wirtschaftsforschung und Ökonometrie, 2. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 1]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 20 / 265 Datenquellen der empirischen Wirtschaftsforschung 2. Datenquellen der empirischen Wirtschaftsforschung 2.1 2.2 2.3 2.4 2.5 2.6 2.7 Grundbegriffe Merkmalstypen Skalierung von Merkmalen Datenerhebung Datensätze Sekundärdatenquellen und Datenbanken Datenverarbeitung und Software Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 21 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.1 Grundbegriffe Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 22 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.1 Grundbegriffe Grundgesamtheit und Untersuchungseinheit Definition Die Objekte, auf die sich eine empirische Analyse bezieht, werden auch als Untersuchungseinheiten (ω) bezeichnet Definition Alle Untersuchungseinheiten zusammen ergeben die sog. Grundgesamtheit (Ω). Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 23 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.1 Grundbegriffe Merkmal, Merkmalsausprägungen und Merkmalsraum Definition Bestimmte Eigenschaften der Untersuchungsobjekte bezeichnet man auch als Merkmale (X) (oder auch als statistische Variable). Definition Jedes Merkmal kann in der Regel mehrere (k) unterschiedliche Merkmalsausprägungen a1 , a2 ,· · · , ak aufweisen. Definition Als Merkmalsraum (S) (oder auch: Zustandsraum) bezeichnet man die Menge aller mögliche Ausprägungen eines Merkmals (alle Werte, die eine statistische Variable annehmen kann). Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 24 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.2 Merkmalstypen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 25 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.2 Merkmalstypen Merkmalstypen M k l Merkmale Qualitative Merkmale Quantitative Merkmale Ausprägungen unterscheiden sich artmässig Ausprägungen können durch Zahlen angegeben werden Diskrete Merkmale abzählbarer b ählb Zustandsraum Z t d Stetige Merkmale nicht abzählbarer Zustandsraum Gruppierte Merkmale Ab ählb durch Abzählbar d h Gruppenbildung G bild FT 2009 Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung" Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung 27 FT 2010 26 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.3 Skalierung von Merkmalen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 27 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.3 Skalierung von Merkmalen Skalierung von Merkmalen Skalentypen Nominalskala Ordinalskala (Rangskala) nur Unterscheidung, keine Ordnung Reihenfolge, aber keine Abstände interpretierbar Metrische Skala Reihenfolge, Abstände interpretierbar Intervallskala nur Abstände interpretierbar Stetige Merkmale natürlicher Nullpunkt, Verhältnisse interpretierbar Absolutskala natürlicher Nullpunkt & natürliche Maßeinheit FT 2009 Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung" Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung 29 FT 2010 28 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.4 Datenerhebung Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 29 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.5 Datensätze Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 30 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.5 Datensätze Bruttoinlandsprodukt je Einwohner in Deutschland 1991 bis 2007 nach Bundesländern (preisbereinigt, verkettet, in Prozent relativ zum Vorjahr) Bruttoinlandsprodukt je Einwohner in Deutschland 1991 bis 2007 nach Bundesländern (preisbereinigt, verkettet, in Prozent relativ zum Vorjahr) BW BY BE BB HB HH HE MV NI NW RP SL SN ST SH TH D 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Quelle: Arbeitsgruppe VGR der Länder (2009) FT 2009 Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung" Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung 36 FT 2010 31 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.5 Datensätze Querschnittsdaten Querschnittdaten (Cross section data) (Cross section data) BW BY BE BB HB HH HE MV NI NW RP SL SN ST SH TH D , 3,2 4,9 , 1,4 , 3,2 , 4,9 , 3,5 , 3,2 , 1,0 , 2,4 , 2,3 , 2,7 , 4,8 , 1,3 , 2,5 , 2,4 , 2,7 , 3,1 , 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Quelle: Arbeitsgruppe VGR der Länder (2009) FT 2009 Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung" Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung 37 FT 2010 32 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.5 Datensätze Längsschnittdaten, Längsschnittdaten Zeitreihe Längsschnittdaten, Zeitreihe (Time series data) (Time series data) BW BY BE BB HB HH 1992 −0,1 1993 −0,8 1994 08 0,8 1995 1,0 1996 1,2 1997 1,8 1998 1,1 1999 0,8 2000 , 3,5 2001 3,4 2002 −0,2 2003 −3,3 2004 0,3 2005 1,3 2006 2,4 2007 2,1 HE MV NI NW RP SL SN ST SH TH D Quelle: Arbeitsgruppe VGR der Länder (2009) FT 2009 Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung" Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung 38 FT 2010 33 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.5 Datensätze Paneldaten Paneldaten (Panel data) (Panel data) BW BY BE BB HB HH HE MV NI NW RP SL SN ST SH TH D 1992 −0,5 1,3 3,0 10,1 −0,2 −0,1 0,6 11,5 0,4 0,1 −1,4 −0,4 11,3 11,6 0,5 19,9 1,5 1993 −5,3 −2,9 2,2 12,4 −2,8 −0,8 −3,0 12,7 −2,2 −3,1 −4,1 −4,7 13,3 14,1 −1,8 14,1 −1,5 1994 16 1,6 15 1,5 09 0,9 12 3 12,3 17 1,7 08 0,8 06 0,6 13 4 13,4 13 1,3 08 0,8 10 1,0 30 3,0 13 7 13,7 11 4 11,4 06 0,6 13 2 13,2 23 2,3 1995 1,2 0,6 2,0 7,5 0,4 1,0 1,0 8,4 −1,2 1,4 0,9 3,0 8,3 5,1 1,6 3,8 1,6 1996 1,5 1,3 −1,6 2,7 0,2 1,2 2,0 3,2 −0,3 −0,8 −1,2 −2,9 3,4 3,3 0,7 3,3 0,7 1997 2,0 1,9 −1,3 1,3 1,6 3,4 1,8 1,3 2,1 1,2 1,5 1,4 2,4 0,7 3,6 1,0 4,2 1,6 1998 2,3 3,7 0,7 0,3 1,8 1,1 1,4 0,4 2,2 2,1 0,9 3,4 1,3 1,4 0,2 2,3 2,1 1999 2,3 2,6 −0,1 3,6 1,1 0,8 3,1 3,9 1,0 0,8 2,4 2,4 3,0 2,8 1,2 4,0 1,9 2000 , 3,2 4,9 , 1,4 , 3,2 , 4,9 , 3,5 , 3,2 , 1,0 , 2,4 , 2,3 , 2,7 , 4,8 , 1,3 , 2,5 , 2,4 , 2,7 , 3,1 , 2001 2,1 1,4 −1,2 0,6 1,3 3,4 1,4 1,1 −1,1 0,6 −1,4 1,6 2,6 1,4 0,5 2,3 1,1 2002 −1,9 0,8 −1,8 0,2 1,3 −0,2 −1,2 1,0 −1,1 −0,1 0,9 −1,0 3,3 3,4 −2,4 1,1 −0,2 2003 −0,7 0,0 −2,2 0,1 0,3 −3,3 0,4 0,6 −0,0 −0,9 −0,5 −0,5 2,2 1,0 −0,1 2,6 −0,3 2004 0,2 1,8 −2,0 1,4 0,2 0,3 0,2 2,0 0,9 1,2 2,2 3,8 2,3 1,6 0,8 2,5 1,1 2005 0,3 1,5 0,8 1,2 0,2 1,3 0,9 0,6 2,1 0,1 −0,4 3,2 0,8 0,9 0,1 1,0 0,8 2006 4,3 3,1 1,0 1,7 1,8 2,4 3,1 2,2 2,6 2,7 2,6 2,6 3,4 2,9 2,4 3,6 3,0 2007 2,7 2,6 1,8 2,5 2,8 2,1 2,4 3,4 2,0 2,8 2,7 3,0 3,1 3,3 1,3 3,0 2,6 Quelle: Arbeitsgruppe VGR der Länder (2009) FT 2009 Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung" Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung 39 FT 2010 34 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.6 Sekundärdatenquellen und Datenbanken Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 35 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.6 Sekundärdatenquellen und Datenbanken Sekundärdatenquellen Sekundärdatenquellen S k dä d Sekundärdaten amtliche Statistik nicht-amtliche Statistik von staatlichen Institutionen erhobene Daten von privaten Institutionen erhobene Daten national national d Inland das I l d betreffend b t ff d d Inland das I l d betreffend b t ff d international international im Ländervergleich im Ländervergleich Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 36 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.6 Sekundärdatenquellen und Datenbanken Nationale amtliche Statistik Statistisches Bundesamt / Statistische Landesämter: Statistisches Jahrbuch, Fachserien, Zeitschriften Wichtigste Daten sind im Internet frei oder gegen geringe Gebühr zugänglich: http://www.destatis.de/ http://www.vgrdl.de/Arbeitskreis VGR/ Deutsche Bundesbank: Monatsberichte, Statistische Beihefte, Geschäftsberichte Internetangebot: http://www.bundesbank.de/statistik/statistik.php Bundesregierung / Landesregierungen: Regelmäßige Berichte (Jahreswirtschaftsbericht, Finanzbericht, Sozialbericht etc.) Internet Bundeswirtschaftsministerium: http://www.bmwi.de/BMWi/Navigation/wirtschaft.html Bundesagentur für Arbeit / Landesarbeitsagenturen: Internet: http://www1.arbeitsamt.de/hst/services/statistik/index.html Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 37 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.6 Sekundärdatenquellen und Datenbanken Nationale nicht-amtliche Statistik Öffentlich geförderte Wirtschaftsforschungsinstitute: Deutsches Institut für Wirtschaftsforschung (DIW), Berlin Internet: http://www.diw.de ifo Institut für Wirtschaftsforschung, München Internet: http://www.ifo.de Institut für Weltwirtschaft (IfW), Kiel Internet: http://www.ifw-kiel.de Rheinisch-Westfälisches Institut für Wirtschaftsforschung (RWI), Essen Internet: http://www.rwi-essen.de Institut für Wirtschaftsforschung Halle (IWH), Halle Internet: http://www.iwh-halle.de Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 38 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.6 Sekundärdatenquellen und Datenbanken Nationale nicht-amtliche Statistik Privat finanzierte Wirtschaftsforschungsinstitute Zentrum für Europäische Wirtschaftsforschung (ZEW), Mannheim Internet: http://www.zew.de Hamburger Weltwirtschafts-Institut (HWWI), Hamburg Internet: http://www.hwwi.org Institut der Deutschen Wirtschaft (IdW), Köln Internet: http://www.idw.de Institut für Makroökonomie und Konjunkturforschung (IMK), Düsseldorf Internet: http://www.boeckler.de/31923.html Sachverständigenrat zur Begutachtung der gesamtwirtschaftlichen Entwicklung Internet: http://www.sachverstaendigenrat-wirtschaft.de Monopolkommission Internet: http://www.monopolkommission.de Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 39 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.6 Sekundärdatenquellen und Datenbanken Nationale nicht-amtliche Statistik Marktforschungsinstitute Gesellschaft für Konsumforschung (GfK) Internet: http://www.gfk.com/group/index.de.html Meinungsforschungsinstitute Institut für Demoskopie Allensbach Internet: http://www.ifd-allensbach.de Emnid Internet: http://www.tns-emnid.com Forsa Internet: http://www.forsa.de Forschungsgruppe Wahlen http://www.forschungsgruppe.de/Startseite Infas http://www.infas.de Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 40 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.6 Sekundärdatenquellen und Datenbanken Internationale amtliche Statistik Statistisches Amt der Europäischen Union (Eurostat) Internet: http://epp.eurostat.ec.europa.eu Europäische Zentralbank (EZB) Internet: http://www.ecb.int/stats/html/index.en.html Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 41 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.6 Sekundärdatenquellen und Datenbanken Internationale nicht-amtliche Statistik Organisation for Economic Development and Co-Ordination (OECD): Internet: http://www.oecd.org Weltbank Internet: http://www.worldbank.org Bank für Internationalen Zahlungsausgleich (Basel) Internet: http://www.bis.org Vereinte Nationen (UN): Internet: http://www.un.org/Pubs International Monetary Fund (IMF): Internet: http://www.imf.org/external/data.htm International Labor Organization (ILO): Internet: http://www.ilo.org/global/lang–en/index.htm Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 42 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.6 Sekundärdatenquellen und Datenbanken Internationale nicht-amtliche Statistik Datenbanken sind Sammlungen von Daten, unter Umständen auch aus ganz unterschiedlichen Datenquellen Datenbanken der amtlichen Statistik: Genesis Online (Statistisches Bundesamt) Bundesstatistik: Internet: https://www-genesis.destatis.de/genesis/online/logon Regionalstatistik: Internet: https://www.regionalstatistik.de/genesis/online/logon Arbeitsgruppe VGR der Länder: Internet: http://www.vgrdl.de/Arbeitskreis VGR Sehr umfangreiche Datenbanken: Penn World Tables (Freier Zugang über University of Pennsylvania): http://pwt.econ.upenn.edu Statistik-Netz (Zugang HSU HH über Bibliothek WiSo) Datastream (Zugang HSU HH, derzeit im Aufbau) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 43 / 265 Datenquellen der empirischen Wirtschaftsforschung 2.7 Datenverarbeitung und Software Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 44 / 265 Datenquellen der empirischen Wirtschaftsforschung Literaturhinweise Literaturhinweise zum 2. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 45 / 265 Datenquellen der empirischen Wirtschaftsforschung Literaturhinweise Literaturhinweise zum 2. Kapitel Mosler, K. und F. Schmid (2006): Beschreibende Statistik und Wirtschaftsstatistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 1]. Winker, P. (2007): Empirische Wirtschaftsforschung und Ökonometrie, 2. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 2]. Toutenburg, H. und C. Heumann (2006): Deskriptive Statistik. Eine Einführung in Methoden und Anwendungen mit SPSS, 5. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 1]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 46 / 265 Einführung in EViews 3. Einführung in EViews Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 47 / 265 Häufigkeitsverteilungen 4. Häufigkeitsverteilungen 4.1 Absolute und relative Häufigkeiten 4.2 Empirische Verteilungsfunktion 4.3 Grafische Darstellung Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 48 / 265 Häufigkeitsverteilungen 4.1 Absolute und relative Häufigkeiten Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 49 / 265 Häufigkeitsverteilungen 4.1 Absolute und relative Häufigkeiten ... bei qualitativen Merkmalen Ausgangssituation: Untersucht wird das qualitative Merkmal X. Dazu wird aus der Grundgesamtheit eine Stichprobe der Größe N gezogen. Somit erhält man für jede Beobachtung x1 , x2 , ..., xN eine qualitative Merkmalsausprägung a1 , a2 , ..., aN . Insgesamt gibt es k Merkmalsausprägungen. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 50 / 265 Häufigkeitsverteilungen 4.1 Absolute und relative Häufigkeiten ... bei qualitativen Merkmalen Definition Die absoluten Häufigkeiten nj geben an, wie oft jede qualitative Merkmalsausprägung aj mit j = 1, ..., k eines Merkmals in der Stichprobe auftritt. Die Summe der absoluten Häufigkeiten ergibt die Gesamtanzahl der Beobachtungen: k X nj = N j=1 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 51 / 265 Häufigkeitsverteilungen 4.1 Absolute und relative Häufigkeiten ... bei qualitativen Merkmalen Definition Die relativen Häufigkeiten fj geben an, welchen Anteil jede Merkmalsausprägung an der Gesamtanzahl der Beobachtungen hat Die Summe der relativen Häufigkeiten ergibt ergibt 100%: k X j=1 Prof. Dr. Michael Berlemann (HSU) fj = k X nj j=1 N =1 Empirische Wirtschaftsforschung FT 2010 52 / 265 Häufigkeitsverteilungen 4.2 Empirische Verteilungsfunktion Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 53 / 265 Häufigkeitsverteilungen 4.2 Empirische Verteilungsfunktion Definition Die empirische Verteilungsfunktion eines Merkmals ergibt sich aus den kumulierten relativen Häufigkeiten. Um den Wert der empirischen Verteilungsfunktion zu berechnen, müssen zunächst die Beobachtungen ihrer Größe nach von klein nach groß geordnet werden. Der Wert der empirische Verteilungsfunktion für die Beobachtung x ergibt sich dann als die Summe der kumulierten relativen Häufigkeiten aller Merkmalsausprägungen, die kleiner oder gleich x sind: X F (x) = f (aj ) aj <x Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 54 / 265 Häufigkeitsverteilungen 4.2 Empirische Verteilungsfunktion Beispiel empirische Verteilungsfunktion 1,00 kumulierte relative Häufigkeiten 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 0 10.000 20.000 30.000 40.000 50.000 60.000 70.000 80.000 90.000 Bruttojahreseinkommen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 55 / 265 Häufigkeitsverteilungen 4.3 Grafische Darstellung Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 56 / 265 Häufigkeitsverteilungen 4.3 Grafische Darstellung Grafische Darstellungsmöglichkeiten von Häufigkeiten Bereits kennen gelernt: Empirische Verteilungsfunktion Zusätzlich häufig verwendet: Häufigkeitstabellen (absolut, relativ), ggfs. klassifiziert Balkendiagramme Kreisdiagramme Histogramme Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 57 / 265 Häufigkeitsverteilungen 4.3 Grafische Darstellung Häufigkeitstabellen Klassen 1 2 3 4 5 6 7 Einkommensintervall (EURO) bis 9999 10000 bis 19999 20000 bis 29999 30000 bis 39999 40000 bis 49999 50000 bis 59999 60000 und mehr Prof. Dr. Michael Berlemann (HSU) Absolute Häufigkeit 5 6 9 12 10 5 3 Relative Häufigkeit 0,1 0,12 0,18 0,24 0,2 0,1 0,06 Empirische Wirtschaftsforschung Kum. relative Häufigkeit 0,1 0,22 0,4 0,64 0,84 0,94 1,00 FT 2010 58 / 265 Häufigkeitsverteilungen 4.3 Grafische Darstellung Balkendiagramm bei stetigen, gruppierten Daten 7 0,06 6 0,1 5 0,2 4 0,24 3 0,18 2 0,12 1 0,1 0 0,05 Prof. Dr. Michael Berlemann (HSU) 0,1 0,15 Empirische Wirtschaftsforschung 0,2 0,25 0,3 FT 2010 59 / 265 Häufigkeitsverteilungen 4.3 Grafische Darstellung Kreisdiagramm bei stetigen, gruppierten Daten 7 6% 6 10% 1 10% 2 12% 5 20% 3 18% 4 24% Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 60 / 265 Häufigkeitsverteilungen 4.3 Grafische Darstellung Histogramm bei stetigen, gruppierten Daten 0,3 0,25 0,24 0,2 0,2 0,18 0,15 0,12 0,1 0,1 0,1 0,06 0,05 0 1 2 Prof. Dr. Michael Berlemann (HSU) 3 4 5 Empirische Wirtschaftsforschung 6 7 FT 2010 61 / 265 Häufigkeitsverteilungen Literaturhinweise Literaturhinweise zum 4. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 62 / 265 Häufigkeitsverteilungen Literaturhinweise Literaturhinweise zum 4. Kapitel Duller, C. (2006): Einführung in die Statistik mit Excel und SPSS, Physica-Verlag, Heidelberg [insbes. Kapitel 6]. Kazmier, L. J. (1996): Wirtschaftsstatistik, Übersetzung der 3. Auflage, McGraw-Hill International Ltd., London [insbes. Kapitel 2]. Quatember, A. (2005): Statistik ohne Angst vor Formeln. Ein Lehrbuch für Wirtschafts- und Sozialwissenschaftler [insbes. Kapitel 1.2]. Toutenburg, H. und C. Heumann (2006): Deskriptive Statistik. Eine Einführung in Methoden und Anwendungen mit SPSS, 5. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 2]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 63 / 265 Maßzahlen für einzelne Merkmale 5. Maßzahlen für einzelne Merkmale 5.1 5.2 5.3 5.4 Lagemaße Streuungsmaße Schiefe, Wölbung und Exzess Konzentrationsmaße Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 64 / 265 Maßzahlen für einzelne Merkmale 5.1 Lagemaße Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 65 / 265 Maßzahlen für einzelne Merkmale 5.1 Lagemaße Modus / Modalwert Definition Als Modus bezeichnet man diejenige Markmalsausprägung, die am häufigsten auftritt. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 66 / 265 Maßzahlen für einzelne Merkmale 5.1 Lagemaße Quantil Definition Sei α eine Zahl zwischen null und eins. Als α-Quantil wird dann derjenige Wert x̃α bezeichnet, für den die Verteilungsfunktion F gerade den Wert α annimmt, d.h. F (x̃α ) = α. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 67 / 265 Maßzahlen für einzelne Merkmale 5.1 Lagemaße Quartile Definition Als Quartile bezeichnet man diejenigen Quantilswerte, die zu einer Unterteilung der Daten in vier gleich große Gruppen führen: F (x̃α=0,25 ) = 0, 25 F (x̃α=0,50 ) = 0, 50 F (x̃α=0,75 ) = 0, 75 Dabei bezeichnet man das 0,25-Quartil auch als unteres und das 0,75-Quartil als oberes Quartil Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 68 / 265 Maßzahlen für einzelne Merkmale 5.1 Lagemaße Median Definition Der Median (auch: Zentralwert) beschreibt das Zentrum einer geordneten Reihe aller Beobachtungen (aufsteigend, absteigend) und ist ein Spezialfall eines Quantils. Für den Median gilt, dass höchstens 50 % der Beobachtungen kleiner oder gleich und höchstens 50% größer oder gleich diesem Wert sein dürfen (d.h. α = 0.5). Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 69 / 265 Maßzahlen für einzelne Merkmale 5.1 Lagemaße Arithmetisches Mittel (Mittelwert) Definition Das arithmetische Mittel ist der ungewichtete Durchschnittswert aller Beobachtungen N 1 X xi X̄ = N i=1 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 70 / 265 Maßzahlen für einzelne Merkmale 5.1 Lagemaße Geometrisches Mittel Definition Das geometrische Mittel berechnet sich als v ! N1 uN N uY Y N t xi = xi X̄G = i=1 Prof. Dr. Michael Berlemann (HSU) i=1 Empirische Wirtschaftsforschung FT 2010 71 / 265 Maßzahlen für einzelne Merkmale 5.1 Lagemaße Geometrisches Mittel: Datenbeispiel Jahr 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 Wachstumsrate Bruttoinlandsprodukt 0.13% 2.02% 2.79% 1.51% 2.97% 2.38% 0.15% 3.21% 1.49% 2.16% 1.81% 0.87% 1.15% 3.29% Prof. Dr. Michael Berlemann (HSU) Wachstum zur Basis 1995 1.001 1.022 1.050 1.066 1.097 1.124 1.125 1.161 1.179 1.204 1.226 1.237 1.251 1.292 Empirische Wirtschaftsforschung X̄G 1.018 FT 2010 72 / 265 Maßzahlen für einzelne Merkmale 5.1 Lagemaße Harmonisches Mittel Definition Das harmonische Mittel lässt sich berechnen als PK ω1 + ω2 + ... + ωK i=1 ωi X̄H = ω1 ωK = PK ω2 ωi x1 + x2 + ... + xK i=1 ωi xi ωi Prof. Dr. Michael Berlemann (HSU) = Ni N Empirische Wirtschaftsforschung FT 2010 73 / 265 Maßzahlen für einzelne Merkmale 5.1 Lagemaße Harmonisches Mittel: Datenbeispiel Land 1 2 3 4 5 6 7 8 9 10 BIP pro Kopf 23456 21473 16873 31274 28736 21538 19836 11837 34263 20001 Gesamtbevölkerung: Prof. Dr. Michael Berlemann (HSU) Bevölkerung (in Mio.) 12.34 33.32 17.56 76.23 198.23 22.34 44.32 4.32 51.75 98.62 Gewicht 0.022 0.060 0.031 0.136 0.355 0.040 0.079 0.008 0.093 0.176 Gewicht · BIP/Kopf 517.77 1279.86 530.01 4264.56 10189.68 860.70 1572.60 91.47 3171.76 3528.43 X̄H 26006.85 559.030 Empirische Wirtschaftsforschung FT 2010 74 / 265 Maßzahlen für einzelne Merkmale 5.2 Streuungsmaße Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 75 / 265 Maßzahlen für einzelne Merkmale 5.2 Streuungsmaße Spannweite Definition Bei einer der Größe nach geordneten Beobachtungsreihe berechnet sich die Spannweite S als S = xN − x1 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 76 / 265 Maßzahlen für einzelne Merkmale 5.2 Streuungsmaße Quartilsabstand Definition Der Quartilsabstand misst die Differenz zwischen dem oberen und dem unteren Quartilswert und somit den zentralen Teil der Verteilung der Beobachtungen: dQ = x̃0,75 − x̃0,25 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 77 / 265 Maßzahlen für einzelne Merkmale 5.2 Streuungsmaße Varianz und Standardabweichung Definition Die Varianz misst die mittlere quadratische Abweichung der beobachteten Merkmalsausprägungen vom arithmetischen Mittel N 1 X V ar[X] = σ = · (xi − X̄)2 N i=1 2 Definition Die Standardabweichung ergibt sich als Wurzel aus der Varianz v u N u1 X t Stdabw[X] = σ = · (xi − X̄)2 N i=1 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 78 / 265 Maßzahlen für einzelne Merkmale 5.3 Schiefe, Wölbung und Exzess Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 79 / 265 Maßzahlen für einzelne Merkmale 5.3 Schiefe, Wölbung und Exzess Schiefe Definition Die Schiefe einer Verteilung ist definiert als 1 g1 = rN 1 N Prof. Dr. Michael Berlemann (HSU) · PN − X̄)3 PN − X̄)2 · i=1 (xi i=1 (xi Empirische Wirtschaftsforschung 3 FT 2010 80 / 265 Maßzahlen für einzelne Merkmale 5.3 Schiefe, Wölbung und Exzess Wölbung (Kurtosis) Definition Die Wölbung (Kurtosis) einer Verteilung ist definiert als 1 N g2 = r Prof. Dr. Michael Berlemann (HSU) 1 N · PN − X̄)4 PN − X̄)2 · i=1 (xi i=1 (xi Empirische Wirtschaftsforschung 4 FT 2010 81 / 265 Maßzahlen für einzelne Merkmale 5.3 Schiefe, Wölbung und Exzess Exzess Definition Der Exzess einer Verteilung misst die Abweichung einer empirischen Verteilung von der Normalverteilung mit gleichem arithmetischen Mittel und gleicher Varianz: g3 = g2 − 3 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 82 / 265 Maßzahlen für einzelne Merkmale 5.4 Konzentrationsmaße Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 83 / 265 Maßzahlen für einzelne Merkmale 5.4 Konzentrationsmaße Lorenzkurve Berechnung der Lorenzkurve 1 Ordnung der Beobachtungen nach ihrer Größe, wobei mit dem kleinsten Wert begonnen wird. 2 Berechnung der Gesamtsumme aller Merkmalswerte: N X xi = n · X̄ i=1 3 Berechnung der kumulierten Summe der Beobachtungen für jede Merkmalsausprägung, Bildung der Relation zur Gesamtsumme der Beobachtungen: Pi j=1 x(j) j=1 x(j) υi = PN 4 mit i = 1, ..., N υ0 := 0 Wiederholung des Vorgehens für den Fall einer Gleichverteilung mit identischer Gesamtsumme der Beobachtungen. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 84 / 265 Maßzahlen für einzelne Merkmale 5.4 Konzentrationsmaße Lorenzkurve: Zahlenbeispiel Haushalt 1 2 3 4 5 6 7 8 9 10 Summe Tatsächliche Verteilung Eink. Kumul. Eink. kumul. Anteil 0 0 0 150 150 0,03 240 390 0,08 270 660 0,14 300 960 0,21 400 1360 0,29 670 2030 0,43 800 2830 0,6 800 3630 0,78 1050 4680 1 4680 Prof. Dr. Michael Berlemann (HSU) Gleichverteilung Eink. Kumul. Eink. kumul. Anteil 468 468 0,1 468 936 0,2 468 1404 0,3 468 1872 0,4 468 2340 0,5 468 2808 0,6 468 3276 0,7 468 3744 0,8 468 4212 0,9 468 4680 1 4680 Empirische Wirtschaftsforschung FT 2010 85 / 265 Maßzahlen für einzelne Merkmale 5.4 Konzentrationsmaße Lorenzkurve: Grafische Darstellung 5000 4500 kumuliertes Einkommen k 4000 3500 3000 2500 2000 1500 1000 500 0 0,00 1 2 3 4 5 6 7 8 9 10 Haushalt Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 86 / 265 Maßzahlen für einzelne Merkmale 5.4 Konzentrationsmaße Gini-Koeffizient Definition Der Gini-Koeffizient lässt sich berechnen als G=1− Prof. Dr. Michael Berlemann (HSU) N 1 X · (υi−1 + υi ) N i=1 Empirische Wirtschaftsforschung FT 2010 87 / 265 Maßzahlen für einzelne Merkmale Literaturhinweise Literaturhinweise zum 5. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 88 / 265 Maßzahlen für einzelne Merkmale Literaturhinweise Literaturhinweise zum 5. Kapitel Toutenburg, H. und C. Heumann (2006): Deskriptive Statistik. Eine Einführung in Methoden und Anwendungen mit SPSS, 5. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 3]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 89 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6. Maßzahlen für den Zusammenhang zwischen Merkmalen 6.1 6.2 6.3 6.4 Verteilung zweidimensionaler Merkmale Zusammenhang nominaler Merkmale Zusammenhang ordinaler Merkmale Zusammenhang stetiger Merkmale Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 90 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6.1 Verteilung zweidimensionaler Merkmale Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 91 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6.1 Verteilung zweidimensionaler Merkmale Beispiel Scatterplot 50 000 45 000 40 000 Y 35 000 30 000 25 000 20 000 15 000 10 000 10 000 12 000 14 000 16 000 18 000 20 000 22 000 24 000 26 000 28 000 30 000 X Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 92 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6.2 Zusammenhang nominaler Merkmale Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 93 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6.2 Zusammenhang nominaler Merkmale 2 Pearsons χ -Statistik Definition Die χ2 -Statistik berechnet sich als K X L X χ2 = N · i=1 j=1 Ni+ = L X 2 Ni,j − 1 Ni+ · N+j Ni,j j=1 Nj+ = K X Ni,j i=1 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 94 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6.3 Zusammenhang ordinaler Merkmale Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 95 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6.3 Zusammenhang ordinaler Merkmale Rangkorrelationskoeffizient von Spearman Definition Für den Fall, dass keine Bindungen auftreten, lautet der Rangkorrelationskoeffizient von Spearman: R=1− Prof. Dr. Michael Berlemann (HSU) 6· PN i=1 (R(xi ) − R(yi )) N · (N 2 − 1) Empirische Wirtschaftsforschung FT 2010 96 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6.4 Zusammenhang stetiger Merkmale Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 97 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6.4 Zusammenhang stetiger Merkmale Kovarianz Definition Das einfachste Maß des Zusammenhangs der Ausprägungen zweier stetiger Merkmale, die Kovarianz, ist definiert als Cov[X, Y ] = Prof. Dr. Michael Berlemann (HSU) N 1 X · (xi − X̄) · (yi − Ȳ ) N i=1 Empirische Wirtschaftsforschung FT 2010 98 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6.4 Zusammenhang stetiger Merkmale positive Kovarianz 50 000 45 000 40 000 Y 35 000 30 000 25 000 20 000 15 000 10 000 10 000 12 000 14 000 16 000 18 000 20 000 22 000 24 000 26 000 28 000 30 000 X Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 99 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6.4 Zusammenhang stetiger Merkmale negative Kovarianz 60 000 55 000 50 000 45 000 Y 40 000 35 000 30 000 25 000 20 000 15 000 10 000 4,0 6,0 8,0 10,0 12,0 14,0 16,0 18,0 20,0 X Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 100 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6.4 Zusammenhang stetiger Merkmale keine Kovarianz 6000000 5000000 Y 4000000 3000000 2000000 1000000 0 4,0 6,0 8,0 10,0 12,0 14,0 16,0 18,0 20,0 X Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 101 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen 6.4 Zusammenhang stetiger Merkmale Korrelationskoeffizient nach Bravais-Pearson Definition Der Korrelationskoeffizient von Bravais-Pearson ist definiert als PN (xi − X̄) · (yi − Ȳ ) Corr[X, Y ] = r = qP i=1 PN N 2 2 i=1 (xi − X̄) · i=1 (yi − Ȳ ) = Prof. Dr. Michael Berlemann (HSU) Cov[X, Y ] p V ar[X] · V ar[Y ] Empirische Wirtschaftsforschung FT 2010 102 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen Literaturhinweise Literaturhinweise zum 6. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 103 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen Literaturhinweise Literaturhinweise zum 6. Kapitel Duller, C. (2006): Einführung in die Statistik mit EXCEL und SPSS. Ein anwendungsorientiertes Lehr- und Arbeitsbuch, Physica-Verlag, Heidelberg [insbes. Kapitel 8]. Toutenburg, H. und C. Heumann (2006): Deskriptive Statistik. Eine Einführung in Methoden und Anwendungen mit SPSS, 5. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 4]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 104 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen Übung Übungsaufgaben zu den Kapiteln 4 bis 6 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 105 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen Übung Übungsaufgaben zu den Kapiteln 4 bis 6 Verwendet wird der ”Datensatz 1”. Dieser enthält für alle NUTS-II-Regionen in Deutschland das verfügbare Einkommen (Yv ), das Bruttoinlandsprodukt(Y ), die Arbeitslosenquote (U ), die Einwohnerzahl (E) sowie eine nominale Variable, die den Wert ’1’ annimmt, wenn es sich um eine ostdeutsche und ’0’, wenn es sich um eine westdeutsche Region handelt. 1 Erstellen Sie ein EViews-Workfile mit den relevanten Daten. 2 Generieren Sie neue Variablen, die das verfügbare Einkommen pro Kopf (yv ) und das Bruttoinlandsprodukt pro Kopf y enthalten. 3 Stellen Sie in Excel die Lorenzkurve des verfügbaren Einkommens pro Kopf dar. 4 Stellen Sie die empirische Verteilung von y und U mit Hilfe eines Histogramms dar und bestimmen Sie in EViews den Mittelwert, die Varianz, die Spannweite, die Schiefe und die Wölbung. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 106 / 265 Maßzahlen für den Zusammenhang zwischen Merkmalen Übung Übungsaufgaben zu den Kapiteln 4 bis 6 5 Vergleichen Sie die Mittelwerte des verfübaren Einkommens der NUTS-II-Regionen in Ost- und Westdeutschland. 6 Stellen Sie die Variaben (i) U und yv sowie (ii) y und E mit Hilfe eines Scatterplots gegenüber und bestimmen Sie für beide Fälle die Kovarianz und die Korrelationskoeffizienten nach Bravais-Pearson. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 107 / 265 Zufallsvariablen und deren Eigenschaften 7. Zufallsvariablen und deren Eigenschaften 7.1 7.2 7.3 7.4 Zufallsvariablen und deren Wahrscheinlichkeitverteilung Mittelwert, Standardabweichung und Varianz von Zufallsvariablen Unabhängigkeit von Zufallsvariablen Einige wichtige Verteilungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 108 / 265 Zufallsvariablen und deren Eigenschaften 7.1 Zufallsvariablen und deren Wahrscheinlichkeitverteilung Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 109 / 265 Zufallsvariablen und deren Eigenschaften 7.1 Zufallsvariablen und Wahrscheinlichkeitverteilung Wahrscheinlichkeitsverteilung von diskreten Zufallsvariablen Definition Für eine diskrete Zufallsvariable X ist der Wert der Wahrscheinlichkeitsfunktion f (x) die Wahrscheinlichkeit, dass die Zufallsvariable X gerade die Ausprägung x annimmt: f (x) = P (X = x) mit 0 ≤ f (x) ≤ 1 Für die Summe der Eintrittswahrscheinlichkeiten der einzelnen Zustände j (Anzahl der Ausprägungen: J) muss gelten: J X f (xj ) = 1 ⇔ f (x1 ) + f (x2 ) + ... + f (xJ ) = 1 j=1 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 110 / 265 Zufallsvariablen und deren Eigenschaften 7.1 Zufallsvariablen und Wahrscheinlichkeitverteilung Wahrscheinlichkeitsverteilung von stetigen Zufallsvariablen Eigenschaften von Dichtefunktionen stetiger Zufallsvariablen Die Wahrscheinlichkeit dafür, dass eine stetige Zufallsvariable X einen Wert zwischen x0 und x1 annimmt, lässt sich über die Dichtefunktion berechnen als: Z x1 P (x0 ≤ X ≤ x1 ) = f (x) · dx ≥ 0. x0 Die Dichtefunktion ist an jeder Stelle positiv: f (x) ≥ 0. Zudem muss das Integral über die Dichtefunktion stets eins betragen: Z ∞ f (x) · dx = 1. −∞ Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 111 / 265 Zufallsvariablen und deren Eigenschaften 7.1 Zufallsvariablen und Wahrscheinlichkeitverteilung Wahrscheinlichkeitsverteilung von stetigen Zufallsvariablen Definition Die kumulierte Dichtefunktion an der Stelle x1 ist definiert als Z x1 F (x1 ) = P (X ≤ x1 ) = f (x) · dx −∞ Die Ableitung der kumulierten Dichtefunktion an der Stelle x1 ist gerade der Wert der Dichtefunktion an der Stelle x1 : f (x1 ) = Prof. Dr. Michael Berlemann (HSU) dF (x1 ) dx Empirische Wirtschaftsforschung FT 2010 112 / 265 Zufallsvariablen und deren Eigenschaften 7.1 Zufallsvariablen und Wahrscheinlichkeitverteilung Dichtefunktion einer hypothetischen, hypothetischen stetigen Zufallsvariable Dichtefunktion einer hypothetischen, stetigen Zufallsvariable Wert der Dichtefunktion Wahrscheinlichkeit für Ausprägungen der Zufallsvariable zwischen X0 und X1. X0 FT 2009 X1 Ausprägungen Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung" Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung 169 FT 2010 113 / 265 Zufallsvariablen und deren Eigenschaften 7.1 Zufallsvariablen und Wahrscheinlichkeitverteilung Kumulierte Dichtefunktion einer hypothetischen, hypothetischen stetigen Zufallsvariable Kumulierte Dichtefunktion einer hypothetischen, stetigen Zufallsvariable 1 Wert der VerteiVertei lungsfunktion X0 FT 2009 X1 Ausprägungen Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung" Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung 170 FT 2010 114 / 265 Zufallsvariablen und deren Eigenschaften 7.2 Mittelwert, Standardabweichung und Varianz Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 115 / 265 Zufallsvariablen und deren Eigenschaften 7.2 Mittelwert, Standardabweichung und Varianz Erwartungswert einer Zufallsvariablen Definition Bei diskrete Zufallsvariablen kann der Erwartungswert als Summe der mit den Eintrittswahrscheinlichkeiten gewichteten Zustände berechnet werden: J J X X E[X] = xj · P (X = xj ) = xj · f (xj ) j=1 j=1 Definition Bei stetigen Zufallsvariablen errechnet sich der Erwartungswert als Integral über die mit den Zuständen multiplizierte Dichtefunktion Z ∞ x · f (x) · dx E[X] = −∞ Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 116 / 265 Zufallsvariablen und deren Eigenschaften 7.2 Mittelwert, Standardabweichung und Varianz Varianz einer Zufallsvariablen Definition Die Varianz einer diskreten Zufallsvariable berechnet sich als V ar[X] = 2 σX = J X 2 P (X = xj ) · (xj − E[X]) = j=1 J X f (xj ) · (xj − E[X])2 j=1 Definition Die Varianz einer stetigen Zufallsvariable ergibt sich als Z ∞ 2 V ar[X] = σX = (xj − E[x])2 · f (x) · dx −∞ Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 117 / 265 Zufallsvariablen und deren Eigenschaften 7.2 Mittelwert, Standardabweichung und Varianz Standardabweichung einer Zufallsvariablen Definition Die Standardabweichung einer diskreten Zufallsvariable ergibt sich als Quadratwurzel aus der Varianz q p 2 Stdabw[X] = σX = V ar[X] = σX Definition Die Standardabweichung einer stetigen Zufallsvariable berechnet sich als Quadratwurzel aus der Varianz q p 2 Stdabw[X] = σX = V ar[X] = σX Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 118 / 265 Zufallsvariablen und deren Eigenschaften 7.3 Unabhängigkeit von Zufallsvariablen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 119 / 265 Zufallsvariablen und deren Eigenschaften 7.3 Unabhängigkeit von Zufallsvariablen Kovarianz von Zufallsvariablen Definition Für diskrete Zufallsvariablen X und Y mit der gemeinsamen Wahrscheinlichkeitsfunktion f (x, y) ist die Kovarianz definiert als Cov(X, Y ) = J X K X (xj − E[X]) · (yk − E[Y ]) · f (X = xj , Y = yk ) j=1 k=1 Definition Für stetige Zufallsvariablen X und Y mit der gemeinsamen Dichtefunktion f (x, y) ist die Kovarianz definiert als Z ∞Z ∞ (x − E[X]) · (y − E[Y ]) · f (x, y) · dx · dy Cov(X, Y ) = −∞ Prof. Dr. Michael Berlemann (HSU) −∞ Empirische Wirtschaftsforschung FT 2010 120 / 265 Zufallsvariablen und deren Eigenschaften 7.3 Unabhängigkeit von Zufallsvariablen Korrelationskoeffizient von Zufallsvariablen Definition Der Korrelationskoeffizient (nach Bravais-Pearson) zweier Zufallsvariablen X und Y ist definiert als Corr(X, Y ) = p Prof. Dr. Michael Berlemann (HSU) Cov(X, Y ) V ar[X] · V ar[Y ] Empirische Wirtschaftsforschung FT 2010 121 / 265 Zufallsvariablen und deren Eigenschaften 7.4 Einige wichtige Verteilungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 122 / 265 Zufallsvariablen und deren Eigenschaften 7.4 Einige wichtige Verteilungen Stetige Gleichverteilung 0,14 Wert der Dichtefunktion W 0,12 0,10 0,08 0,06 0,04 0,02 0,00 0 1 2 3 4 5 6 7 8 9 10 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 123 / 265 Zufallsvariablen und deren Eigenschaften 7.4 Einige wichtige Verteilungen Stetige Gleichverteilung Wert d der kumulierten Dichtefunktion 1,20 1,00 0,80 0,60 0,40 0,20 0,00 0 1 2 3 4 5 6 7 8 9 10 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 124 / 265 Zufallsvariablen und deren Eigenschaften 7.4 Einige wichtige Verteilungen Normalverteilung Definition Eine normalverteilte Zufallsvariable mit dem Erwartungswert µX 2 und der Varianz σX 2 X ∼ N (µX , σX ) hat die über den gesamten reellen Wertebereich definierte Dichtefunktion: f (x) = Prof. Dr. Michael Berlemann (HSU) σX · 1 √ x−µX 2 −0.5· σ 2·π ·e Empirische Wirtschaftsforschung X FT 2010 125 / 265 Zufallsvariablen und deren Eigenschaften 7.4 Einige wichtige Verteilungen Normalverteilung: N (µ = 5, σ = 0, 5) 0,90 0,80 Wert der Dichtefunktion W 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 0 1 2 3 4 5 6 7 8 9 10 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 126 / 265 Zufallsvariablen und deren Eigenschaften 7.4 Einige wichtige Verteilungen Normalverteilung: N (µ = 5, σ = 0, 5) Wert d der kumulierten Dichtefunktion 1,20 1,00 0,80 0,60 0,40 0,20 0,00 0 1 2 3 4 5 6 7 8 9 10 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 127 / 265 Zufallsvariablen und deren Eigenschaften 7.4 Einige wichtige Verteilungen Standardnormalverteilung Definition Eine Zufallsvariable heisst standardnormalverteilt, wenn sie einer 2 Normalverteilung mit Erwartungswert µX = 0 und einer Varianz σX =1 folgt: 2 X ∼ N (µX = 0, σX = 1) Sie hat dann die Dichtefunktion: f (x) = √ 2 1 · e−0.5·x 2·π Transformationsregel Jede normalverteilte Zufallsvariable lässt sich in eine standardnormalverteilte Zufallsvariable wie folgt transformieren: Z= Prof. Dr. Michael Berlemann (HSU) X − µX σX Empirische Wirtschaftsforschung FT 2010 128 / 265 Zufallsvariablen und deren Eigenschaften 7.4 Einige wichtige Verteilungen Standardnormalverteilung: N (µ = 0, σ = 1) 0,45 0,40 Wert der Dichtefunktion W 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 -5 -4 -3 -2 -1 0 1 2 3 4 5 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 129 / 265 Zufallsvariablen und deren Eigenschaften 7.4 Einige wichtige Verteilungen Standardnormalverteilung: N (µ = 0, σ = 1) Wert d der kumulierten Dichtefunktion 1,20 1,00 0,80 0,60 0,40 0,20 0,00 -5 -4 -3 -2 -1 0 1 2 3 4 5 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 130 / 265 Zufallsvariablen und deren Eigenschaften 7.4 Einige wichtige Verteilungen Exponentialverteilung Definition Die Dichtefunktion der Exponentialverteilung ist nur über den positiven Wertebereich definiert und lautet: f (x) = λ · e−λ·x für x ≥ 0 Die kumulierte Dichtefunktion der Exponentialverteilung ist gegeben durch: Z x Z x F (x) = f (t) · dt = λ · e−λ·t · dt = −e−λ·x 0 Prof. Dr. Michael Berlemann (HSU) 0 Empirische Wirtschaftsforschung FT 2010 131 / 265 Zufallsvariablen und deren Eigenschaften 7.4 Einige wichtige Verteilungen Exponentialverteilung: λ = 0, 75 0,80 0,70 Wert der Dichtefunktion W 0,60 0,50 0,40 0,30 0,20 0,10 0,00 0 1 2 3 4 5 6 7 8 9 10 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 132 / 265 Zufallsvariablen und deren Eigenschaften 7.4 Einige wichtige Verteilungen Exponentialverteilung: λ = 0, 75 Wert d der kumulierten Dichtefunktion 1,20 1,00 0,80 0,60 0,40 0,20 0,00 0 1 2 3 4 5 6 7 8 9 10 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 133 / 265 Zufallsvariablen und deren Eigenschaften Literaturhinweise Literaturhinweise zum 7. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 134 / 265 Zufallsvariablen und deren Eigenschaften Literaturhinweise Literaturhinweise zum 7. Kapitel Bamberg, G. und F. Baur (2006): Statistik, 12. Auflage, Oldenbourg Verlag, München [insbes. Kapitel 8,9]. Bauer, T., M. Fertig und C. Schmidt (2009): Empirische Wirtschaftsforschung. Eine Einführung, Springer-Verlag, Berlin u.a. [insbes. Kapitel 1]. Duller, C. (2006): Einführung in die Statistik mit EXCEL und SPSS. Ein anwendungsorientiertes Lehr- und Arbeitsbuch, Physica-Verlag, Heidelberg [insbes. Kapitel 11,12]. Mosler, K. und F. Schmid (2008): Wahrscheinlichkeitsrechnung und schließende Statistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 1,2]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 135 / 265 Stichproben 8. Stichproben Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 136 / 265 Stichproben 8. Stichproben Stichprobe und Grundgesamtheit Alternative Stichprobenverfahren: Schichtenauswahl Klumpenauswahl Quotenstichprobe Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 137 / 265 Stichproben 8. Stichproben Stichprobenfunktionen und deren Erwartungswerte und Varianzen Wichtige Stichprobenfunktionen und ihre Momente Stichprobenfunktion PN i=1 xi P X̄s = N1 · N x √i=1 i X̄s −µ · N Pσ 1 · N (xi − µ)2 N P i=1 1 · N (xi − X̄s )2 i=1P N 1 V ars = n−1 · N (x − X̄s )2 i=1 √ i stdabws = V ars Bezeichnung Erwartungswert Varianz Merkmalssumme Stichprobenmittel Gauß-Statistik MQA bezüglich µ MQA Varianz Stdabw. N ·µ µ 0 σ2 N −1 · σ2 N 2 σ σ N · σ2 σ2 N 1 MQA: mittlere quadratische Abweichung Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 138 / 265 Stichproben Literaturhinweise Literaturhinweise zum 8. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 139 / 265 Stichproben Literaturhinweise Literaturhinweise zum 8. Kapitel Mosler, K. und F. Schmid (2008): Wahrscheinlichkeitsrechnung und schließende Statistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 4]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 140 / 265 Grundlagen des Testens von Hypothesen 9. Grundlagen des Testens von Hypothesen 9.1 Hypothesenformulierung 9.2 Testgröße, Prüfgröße, Annahme- und Ablehnungsbereich 9.3 Wichtige Testverteilungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 141 / 265 Grundlagen des Testens von Hypothesen 9.1 Hypothesenformulierung Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 142 / 265 Grundlagen des Testens von Hypothesen 9.1 Hypothesenformulierung Arbeitshypothese, Nullhypothese und Alternativhypothese Definition Als Arbeitshypothese bezeichnet man diejenige Hypothese, die man ex ante, also vor Durch führung eines Hypothesentests, für korrekt hält. Definition Als Nullhypothese (H0 ) formuliert man die Gegenhypothese der Arbeitshypothese, also gerade das Gegenteil dessen, was man ex ante für korrekt hält. Mit Hilfe des Hypothesentests versucht man, die Nullhypothese verwerfen zu können. Definition Die Alternativhypothese (HA ) ist die Gegenhypothese der Nullhypothese. Wird die Nullhypothese verworfen, so erlangt die Alternativhypothese Gültigkeit. Die Alternativhypothese ist identisch mit der Arbeitshypothese. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 143 / 265 Grundlagen des Testens von Hypothesen 9.1 Hypothesenformulierung Fehler 1. und 2. Art Definition Wird die Nullhypothese fälschlicherweise abgelehnt, so handelt es sich um einen sog. Fehler 1. Art. Definition Wird hingegen eine Nullhypothese fälschlicherweise angenommen, so handelt es sich um einen Fehler 2. Art. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 144 / 265 Grundlagen des Testens von Hypothesen 9.1 Hypothesenformulierung Fehler 1. und 2. Art Fehler 1. und 2. Art H0 angenommen H0 abgelehnt Prof. Dr. Michael Berlemann (HSU) H0 korrekt kein Fehler Fehler 1. Art Empirische Wirtschaftsforschung H0 falsch Fehler 2. Art kein Fehler FT 2010 145 / 265 Grundlagen des Testens von Hypothesen 9.2 Testgröße, Prüfgröße, Annahme- und Ablehnbereich Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 146 / 265 Grundlagen des Testens von Hypothesen 9.2 Testgröße, Prüfgröße, Annahme- und Ablehnbereich Test Definition Als Test bezeichnet man ein Verfahren, um auf Basis der vorliegenden Stichprobe zu entscheiden, ob die Nullhypothese zugunsten der Alternativhypothese abgelehnt werden kann oder nicht. Im Rahmen eines Tests wird zunächst aus den Beobachtungen der Stichprobe eine Prüfgröße (auch: Testgröße) berechnet. Fällt die Prüfgröße in den so genannten Ablehnungsbereich, so wird die Nullhypothese zurück gewiesen, andernfalls beibehalten. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 147 / 265 Grundlagen des Testens von Hypothesen 9.2 Testgröße, Prüfgröße, Annahme- und Ablehnbereich Verteilung der Testgröße bei alternativen Stichproben 0,30 0,25 0 20 0,20 Verteilungg der Testgröße 0,15 0,10 0,05 0,00 10,00 10,50 11,00 11,50 12,00 12,50 13,00 13,50 14,00 14,50 15,00 15,50 16,00 16,50 17,00 17,50 18,00 18,50 19,00 19,50 20,00 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 148 / 265 Grundlagen des Testens von Hypothesen 9.2 Testgröße, Prüfgröße, Annahme- und Ablehnbereich Annahme und Ablehnung bei einseitigen Tests 0,30 0,25 0 20 0,20 Verteilungg der Testgröße Wahrscheinlichkeit eines Fehlers 1. Art 0,15 0,10 Kritischer Wert 0,05 0,00 10,00 10,50 11,00 11,50 12,00 12,50Annahmebereich 13,00 13,50 14,00 14,50 15,00 15,50 16,00 16,50 17,00 Ablehnungsbereich 17,50 18,00 18,50 19,00 19,50 20,00 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 149 / 265 Grundlagen des Testens von Hypothesen 9.2 Testgröße, Prüfgröße, Annahme- und Ablehnbereich Annahme und Ablehnung bei zweiseitigen Tests 0,30 0,25 0 20 0,20 Verteilungg der Testgröße Wahrscheinlichkeit eines Fehlers 1. Art 0,15 Kritische Werte 0,10 0,05 0,00 Ablehnungsbereich Ablehnungsbereich 10,00 10,50 11,00 11,50 12,00 12,50 13,00 13,50 14,00 Annahmebereich 14,50 15,00 15,50 16,00 16,50 17,00 17,50 18,00 18,50 19,00 19,50 20,00 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 150 / 265 Grundlagen des Testens von Hypothesen 9.2 Testgröße, Prüfgröße, Annahme- und Ablehnbereich Irrtumswahrscheinlichkeit und Signifikanzniveau Definition Als Signifikanzniveau bezeichnet man die bei einem Hypothesentest tolerierte Irrtumswahrscheinlichkeit für einen Fehler 1. Art. Übliche Werte für das Signifikanzniveau sind 10, 5 oder 1%. Definition Die Vertrauenswahrscheinlichkeit (Konfidenzniveau) ergibt sich wenn man die Signifikanznveau von 1 subtrahiert. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 151 / 265 Grundlagen des Testens von Hypothesen 9.3 Wichtige Testverteilungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 152 / 265 Grundlagen des Testens von Hypothesen 9.3 Wichtige Testverteilungen Überblick Wichtige Verteilungen von Teststatistiken: χ2 -Verteilung (Chi-Quadrat-Verteilung) t-Verteilung F-Verteilung Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 153 / 265 Grundlagen des Testens von Hypothesen 9.3 Wichtige Testverteilungen 2 χ -Verteilung Definition Quadriert und addiert man die N Beobachtungen einer standardnormalverteilten Zufallsvariablen X (X ∼ N (0, 1)), so folgt das Ergebnis einer Chi-Quadrat-Verteilung mit N Freiheitsgraden: N X x2i ∼ χ2N i=1 Die Dichtefunktion der χ2 -Verteilung ist nur über den positiven Wertebereich definiert. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 154 / 265 Grundlagen des Testens von Hypothesen 9.3 Wichtige Testverteilungen 2 Verteilungsfunktion der χ -Verteilung 1,00 Wert d der kumulierten Dichtefunktion 0,90 0,80 0,70 0,60 0,50 0,40 0 30 0,30 0,20 0,10 0,00 0 1 2 3 4 5 6 7 8 9 10 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 155 / 265 Grundlagen des Testens von Hypothesen 9.3 Wichtige Testverteilungen t-Verteilung (Student-Verteilung) Definition Seien X und Y zwei stochastisch unabhängige Zufallsvariablen, wobei X standardnormalverteilt sei (X ∼ N (0, 1)) und Y einer χ2 -Verteilung mit N Freiheitsgraden folge (Y ∼ χ2N ), so folgt der Quotient X q ∼ t(N ) Y N einer t-Verteilung mit N Freiheitsgraden. Die Dichtefunktion der t-Verteilung nur über den positiven Wertebereich definiert. Mit einer zunehmenden Anzahl an Freiheitsgraden konvergiert die t-Verteilung gegen die Normalverteilung (ab N = 30 gute Approximation). Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 156 / 265 Grundlagen des Testens von Hypothesen 9.3 Wichtige Testverteilungen Verteilungsfunktion der t-Verteilung Wert d der kumulierten Dichtefunktion 1,20 1,00 0,80 0,60 0,40 0,20 0,00 -5 -4 -3 -2 -1 0 1 2 3 4 5 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 157 / 265 Grundlagen des Testens von Hypothesen 9.3 Wichtige Testverteilungen F -Verteilung Teilt man zwei χ2 -verteilte Zufallsvariablen X ∼ χ2N und Y ∼ χ2M mit N bzw. M Freiheitsgraden durcheinander X N Y M ∼ F (N, M ) so erhält man eine F -verteilte Zufallsvariable mit N, M Freiheitsgraden. Die F -Verteilung ist nur über den positiven Wertebereich definiert. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 158 / 265 Grundlagen des Testens von Hypothesen 9.3 Wichtige Testverteilungen Verteilungsfunktion der F -Verteilung Wert d der kumulierten Dichtefunktion 1,20 1,00 0,80 0,60 0,40 0,20 0,00 0 1 2 3 4 5 6 7 8 9 10 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 159 / 265 Grundlagen des Testens von Hypothesen Literaturhinweise Literaturhinweise zum 9. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 160 / 265 Grundlagen des Testens von Hypothesen Literaturhinweise Literaturhinweise zum 9. Kapitel Mosler, K. und F. Schmid (2008): Wahrscheinlichkeitsrechnung und schließende Statistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 6]. Sachs, L. und J. Hedderich (2006): Angewandte Statistik, 12. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 7]. Studenmund, A. H. (2006): Using Econometrics. A Practical Guide, 5th Edition, Pearson/Addison Welsey, International Edition, Boston [insbes. Kapitel 5]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 161 / 265 Verteilungstests 10. Verteilungstests Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 162 / 265 Verteilungstests 10. Verteilungstests In Eviews sind einige empirische Verteilungstests implementiert Kolmogorov-Smirnov-Test Lilliefors-Test Cramer-von Mises-Test Anderson-Darling-Test Watson-Test Mit Hilfe dieser Tests kann u.a. auf folgende Verteilungsformen geprüft werden: Normalverteilung χ2 Gleichverteilung Exponentialverteilung Logistische Verteilung ... Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 163 / 265 Verteilungstests Literaturhinweise Literaturhinweise zum 10. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 164 / 265 Verteilungstests Literaturhinweise Literaturhinweise zum 10. Kapitel Bühl, A. (2006): SPSS 14. Einführung in die moderne Datenanalyse, 10. Auflage, Pearson Studium, München u.a. [insbes. Kapitel 13.5]. Sachs, L. und J. Hedderich (2006): Angewandte Statistik. Methodensammlung mit R, 12. Auflage, Springer Verlag, Berlin u.a. [insbes. Kapitel 7.2]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 165 / 265 Mittelwert-Tests 11. Mittelwert-Tests 11.1 11.2 11.3 11.4 11.5 Grundlagen Gauß-Mittelwert-Test bei einer Stichprobe t-Test auf Mittelwert bei einer Stichprobe Gauß-Mittelwert-Test bei zwei Stichproben t-Test auf Mittelwert bei zwei Stichproben Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 166 / 265 Mittelwert-Tests Grundlagen 11.1 Grundlagen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 167 / 265 Mittelwert-Tests Grundlagen 11.1 Grundlagen Typen von Mittelwerttests 1 Überprüfung von Hypothesen über den Mittelwert einer Grundgesamtheit auf der Basis einer einzigen Stichprobe. 2 Überprüfung von Hypothesen über die Relation zweier Mittelwerte unterschiedlicher Grundgesamtheiten auf der Basis zweier unabhängiger Stichproben. 3 Überprüfung von Hypothesen über die Relation zweier Mittelwerte aus abhängigen (verbundenen) Stichproben. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 168 / 265 Mittelwert-Tests Grundlagen 11.1 Grundlagen Zentraler Grenzwertsatz Zentraler Grenzwertsatz Bei einer großen Anzahl von Beobachtungen folgt jede zufällige Auswahl einer Stichprobe aus einer beliebig verteilten Grundgesamtheit einer Normalverteilung Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 169 / 265 Mittelwert-Tests Grundlagen 11.1 Grundlagen Behandelte Testtypen Parametrische Mittelwert-Tests bei normalverteilter Grundgesamtheit: 1 Gauß-Test: Dieser Test kann verwendet werden, wenn die Varianz der Grundgesamtheit bekannt ist. 2 T-Test: Dieser Test kann verwendet werden, wenn die Varianz der Grundgesamtheit nicht bekannt ist. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 170 / 265 Mittelwert-Tests 11.2 Gauß-Mittelwert-Test bei einer Stichprobe Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 171 / 265 Mittelwert-Tests 11.2 Gauß-Mittelwert-Test bei einer Stichprobe (Zweiseitiges) Testproblem beim Gauß-Test: Nullhypothese H0 : µ = µ0 Alternativhypothese HA : µ 6= µ0 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 172 / 265 Mittelwert-Tests 11.2 Gauß-Mittelwert-Test bei einer Stichprobe Testgröße des Gauß-Tests: Beim Gauß-Test wird das standardisierte Stichprobenmittel als Testgröße verwendet: √ (X̄ − µ0 ) · N T (x1 , x2 , ..., xN ) = σ Falls die Nullhypothese zutrifft, gilt µ = µ0 und damit auch: √ √ (X̄ − µ0 ) · N (X̄ − µ) · N = ∼ N (0, 1) σ σ Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 173 / 265 Mittelwert-Tests 11.2 Gauß-Mittelwert-Test bei einer Stichprobe 0,45 0,40 Wert der Dichtefunktion W 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 -5 -4 -3 -2 -1 0 1 2 3 4 5 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 174 / 265 Mittelwert-Tests 11.2 Gauß-Mittelwert-Test bei einer Stichprobe Ablehnungsbereich Ablehnungsbereich des Gauß-Tests: Die Nullhypothese wird zurück gewiesen, wenn der Betrag der Testgröße einen kritischen Wert k überschreitet: (X̄ − µ ) · √N 0 >k σ Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 175 / 265 Mittelwert-Tests 11.2 Gauß-Mittelwert-Test bei einer Stichprobe Einstichproben-Gauß-Test 0,45 0,40 Wert der Dichtefunktion W 0,35 Kritische Werte 0,30 0,25 0,20 0,15 0,10 α/2 α/2 0,05 0,00 -5 -4 -3 -2 -1 0 1 2 3 4 5 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 176 / 265 Mittelwert-Tests 11.2 Gauß-Mittelwert-Test bei einer Stichprobe Einstichproben-Gauß-Test: Zusammenfassung Testgrößen und Ablehnungsbereiche beim Gauß-Test: Annahmen: H0 : HA : Prüfgröße H0 wird abgelehnt, wenn: Grundgesamtheit normalverteilt, µ unbekannt, σ bekannt µ = µ0 µ ≤ µ0 µ ≥ µ0 µ 6= µ0 µ > µ0 √ µ < µ0 T = (X̄−µσ0 )· N |T | größer als T größer als T kleiner als (1 − 0, 5 · α)-Quantil (1 − α)-Quantil (1 − α)-Quantil·(−1) der Normalverteilung (N-1 Freiheitsgrade) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 177 / 265 Mittelwert-Tests 11.3 t-Test auf Mittelwert bei einer Stichprobe Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 178 / 265 Mittelwert-Tests 11.3 t-Test auf Mittelwert bei einer Stichprobe (Zweiseitiges) Testproblem beim t-Test: Nullhypothese H0 : µ = µ0 Alternativhypothese HA : µ 6= µ0 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 179 / 265 Mittelwert-Tests 11.3 t-Test auf Mittelwert bei einer Stichprobe Testgröße des t-Tests: Beim t-Test wird wiederum das standardisierte Stichprobenmittel als Testgröße verwendet: √ √ (X̄ − µ0 ) · N (X̄ − µ0 ) · N qP ∼ t(N − 1) T (x1 , x2 , · · · , xN ) = p = N 1 V ar[X] 2 (x − X̄) i i=1 N −1 (1) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 180 / 265 Mittelwert-Tests 11.3 t-Test auf Mittelwert bei einer Stichprobe Einstichproben-t-Test: Zusammenfassung Testgrößen und Ablehnungsbereiche beim t-Test: Annahmen: H0 : HA : Prüfgröße: Grundgesamtheit normalverteilt, µ unbekannt, σ unbekannt µ = µ0 µ ≤ µ0 µ ≥ µ0 µ 6= µ0 µ > µ0 √ µ < µ0 √ 0 )· N T = (X̄−µ H0 wird abgelehnt, wenn: |T | größer als T größer als T kleiner als (1 − 0, 5 · α)-Quantil (1 − α)-Quantil (1 − α)-Quantil·(−1) der t-Verteilung (N-1 Freiheitsgrade) V ar[X] Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 181 / 265 Mittelwert-Tests 11.4 Gauß-Mittelwert-Test bei zwei Stichproben Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 182 / 265 Mittelwert-Tests 11.4 Gauß-Mittelwert-Test bei zwei Stichproben (Zweiseitiges) Testproblem beim Gauß-Test: Nullhypothese H0 : µX = µY Alternativhypothese HA : µX 6= µY Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 183 / 265 Mittelwert-Tests 11.4 Gauß-Mittelwert-Test bei zwei Stichproben Testgröße des Gauß-Tests: Beim Zweistichproben-Gauß-Test wird die Differenz der arithmetischen Mittel aus den beiden Stichproben verwendet: X̄ − Ȳ T (x1 , x2 , ..., xN , y1 , y2 , ..., yM ) = q 2 2 σX σY N + M Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 184 / 265 Mittelwert-Tests 11.4 Gauß-Mittelwert-Test bei zwei Stichproben Testgröße des Gauß-Tests: Da die beiden Zufallsvariablen annahmegemäß stochastisch unabhängig sind, gilt (X̄ − Ȳ ) − (µX − µY ) q 2 2 σX σY N + M Sind die tatsächlichen Mittelwerte beider Grundgesamtheiten gleich groß, d.h. µX = µY , so gilt auch (X̄ − Ȳ ) q 2 ∼ N (0, 1) 2 σX σY + N M Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 185 / 265 Mittelwert-Tests 11.4 Gauß-Mittelwert-Test bei zwei Stichproben Testgrößen und Ablehnungsbereiche beim Gauß-Test: Annahmen: H0 : HA : Prüfgröße: Grundges. normalvert., µ unbekannt, σ bekannt, unabhängig µX = µY µX ≤ µ Y µX ≥ µY µX 6= µY µX > µ Y µX < µ Y (X̄−Ȳ ) r T = 2 2 H0 wird abgelehnt, wenn |T | größer als T größer als T kleiner als (1 − 0, 5 · α)-Quantil (1 − α)-Quantil (1 − α)-Quantil·(−1) der Standardnormalverteilung σ X N Prof. Dr. Michael Berlemann (HSU) σ Y + M Empirische Wirtschaftsforschung FT 2010 186 / 265 Mittelwert-Tests 11.5 t-Test auf Mittelwert bei zwei Stichproben Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 187 / 265 Mittelwert-Tests 11.5 t-Test auf Mittelwert bei zwei Stichproben (Zweiseitiges) Testproblem beim t-Test: Nullhypothese H0 : µX = µY Alternativhypothese HA : µX 6= µY Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 188 / 265 Mittelwert-Tests 11.5 t-Test auf Mittelwert bei zwei Stichproben Testgröße des t-Tests: Beim t-Test lautet das standardisierte Stichprobenmittel, welches wieder als Testgröße verwendet wird: p N · M · (N + M − 2) T = N +M X̄ − Ȳ −p ∼ t(N + M − 2) (N − 1) · V ar[X] + (M − 1) · V ar[Y ] Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 189 / 265 Mittelwert-Tests 11.5 t-Test auf Mittelwert bei zwei Stichproben Testgrößen und Ablehnungsbereiche beim t-Test: Annahmen: H0 : HA : Prüfgröße: H0 wird abgelehnt, wenn Grundges. normalvert., µ unbekannt, σ unbekannt, unabhängig µX = µY µX ≤ µY µX ≥ µY µX 6=√ µY µX > µ Y µX < µ Y T = N ·M ·(N +M −2) N +M −√ X̄−Ȳ (N −1)·V ar[X]+(M −1)·V ar[Y ] |T | größer als T größer als T kleiner als (1 − 0, 5 · α)-Quantil (1 − α)-Quantil (1 − α)-Quantil·(−1) der t-Verteilung mit N+M-2 Freiheitsgraden Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 190 / 265 Mittelwert-Tests Literaturhinweise Literaturhinweise zum 11. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 191 / 265 Mittelwert-Tests Literaturhinweise Literaturhinweise zum 11. Kapitel Bühl, A. (2006): SPSS 14. Einführung in die moderne Datenanalyse, 10. Auflage, Pearson Studium, München u.a. [insbes. Kapitel 12]. Mosler, K. und F. Schmid (2008): Wahrscheinlichkeitsrechnung und schließende Statistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 6]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 192 / 265 Lineare Einfachregression 12. Lineare Einfachregression 12.1 Idee des Regressionsansatzes 12.2 Die Methode der kleinsten Quadrate 12.3 Beurteilung der Güte einer Regression Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 193 / 265 Lineare Einfachregression 12.1 Idee des Regressionsansatzes Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 194 / 265 Lineare Einfachregression 12.1 Idee des Regressionsansatzes Lineare Einfachregression Geradengleichung Y = β0 + β1 · X Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 195 / 265 Lineare Einfachregression 12.1 Idee des Regressionsansatzes Tausende Beispiel lineare Einfachregression 50 45 BIP/Kopf (2006) 40 35 30 25 20 15 14 15 16 17 18 19 20 Verfügbares Einkommen/Kopf (2006) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung 21 22 23 24 Tausende FT 2010 196 / 265 Lineare Einfachregression 12.1 Idee des Regressionsansatzes Lineare Einfachregression 180,0 160 0 160,0 Y = 10 + 1,5 ⋅ X zu erklärend de Variable (Y) 140,0 Steigung = β1 = ΔY/ΔX 120,0 100,0 Achsenabschnitt = β0 = 10 80,0 ΔY 60,0 ΔX 40,0 20,0 00 0,0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 erklärende Variable (X) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 197 / 265 Lineare Einfachregression 12.2 Methode der kleinsten Quadrate Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 198 / 265 Lineare Einfachregression 12.2 Methode der Kleinsten Quadrate Regressionsgleichung Die Regressionsgleichung einer linearen Einfachregression lautet: y i = β0 + β1 · x i + i Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 199 / 265 Lineare Einfachregression 12.2 Methode der Kleinsten Quadrate Nicht-erklärte Residuen 180,0 160 0 160,0 zu erklärend de Variable (Y) 140,0 120,0 100,0 80,0 60,0 ε1 40,0 ε2 20,0 0,0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 erklärende Variable (X) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 200 / 265 Lineare Einfachregression 12.2 Methode der Kleinsten Quadrate Prognosegleichung Die geschätzten Regressionsparameter können verwendet werden, um unter Vorgabe der erklärenden Variable Schätzwerte für die zu erklärende Variable zu berechnen: ŷi = β̂0 + β̂1 · xi Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 201 / 265 Lineare Einfachregression 12.2 Methode der Kleinsten Quadrate OLS-Methode OLS-Schätzung Mit Hilfe der OLS-Methode werden die Schätzwerte nun so berechnet, dass dabei die Summe der quadrierten Residuen minimiert wird: ! N N X X min i = (yi − ŷi ) β0 ,β1 i=1 i=1 wobei N die Anzahl der Beobachtungen darstellt. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 202 / 265 Lineare Einfachregression 12.2 Methode der Kleinsten Quadrate OLS-Schätzer OLS-Schätzung Unter Verwendung der OLS-Technik ergeben sich die beiden Schätzparameter als: β̂1 = Cov[X, Y ] = V ar[X] PN i=1 (xi − X̄) · (yi − PN 2 i=1 (xi − X̄) Ȳ ) β̂0 = Ȳ − β̂1 · X̄ Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 203 / 265 Lineare Einfachregression 12.2 Methode der Kleinsten Quadrate Gauß-Markov-Bedingungen (Teil 1): Es handelt sich um ein korrekt spezifiziertes (es fehlt keine wichtige erklärende Variable) lineares Regressionsmodell des Typs: yi = β0 + β1 · xi + i Der Störterm hat den Mittelwert null: E[yi ] = E[β0 + β1 · xi ] ⇒ E[i ] = 0 Es gibt keine serielle Korrelation der Störterme (und damit auch keine serielle Korrelation der zu erklärenden Variable) Cov[yi , yj ] = Cov[i , j ] = 0 ∀i 6= j ∧ i, j = 1, ..., N Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 204 / 265 Lineare Einfachregression 12.2 Methode der Kleinsten Quadrate Gauß-Markov-Bedingungen (Teil 2): Der Störterm hat (genauso wie die zu erklärende Variable) eine konstante Varianz (Homoskedastizität) σY2 = σ2 = const Die Ausprägungen von X sind nicht selbst zufällig und haben zumindest 2 unterschiedliche Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 205 / 265 Lineare Einfachregression 12.2 Methode der Kleinsten Quadrate Gauß-Markov-Bedingungen 0,45 0,40 Wert der Dichtefunktion W 0,35 Bedingung: Mittelwert der Verteilung der Störterme ist null Verteilung des Störterms E [ yi ] = E [β 0 + β1 ⋅ yi ] ⇒ E [ε i ] = 0 0,30 0,25 0,20 0,15 0,10 0,05 0,00 -5 -4 -3 -2 -1 0 1 2 3 4 5 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 206 / 265 Lineare Einfachregression 12.2 Methode der Kleinsten Quadrate Gauß-Markov-Bedingungen 180,0 160 0 160,0 Bedingung: Homoskedastizität (hier nicht erfüllt) zu erklärend de Variable (Y) 140,0 120,0 geringe Varianz des Störterms 100,0 80,0 hohe Varianz des Störterms 60,0 40,0 Yˆ = βˆ0 + βˆ1 ⋅ X 20,0 00 0,0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 erklärende Variable (X) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 207 / 265 Lineare Einfachregression 12.3 Beurteilung der Güte einer Regression Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 208 / 265 Lineare Einfachregression 12.3 Beurteilung der Güte einer Regression Varianzzerlegung Maß für die beobachtete Variation der zu erklärenden Variable: Summe der quadratischen Abweichungen der tatsächlichen Ausprägungen von Y vom Mittelwert (Total sum of squares, TSS): PN T SS = i=1 (yi − Ȳ )2 Maß für die erklärte Abweichung der zu erklärenden Variable: Summe der quadratischen Abweichungen der für Y prognostizierten Abweichungen vom Mittelwert (Explained Sum of Squares, ESS): PN ESS = i=1 (ŷi − Ȳ )2 Maß für die nicht erklärte Abweichung der zu erklärenden Variable: Summe der quadratischen Abweichungen der für Y prognostizierten Abweichungen von den tatsächlichen Ausprägungen (Residual Sum of Squares, RSS): PN PN RSS = i=1 (ŷi − yi )2 = i=1 2i Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 209 / 265 Lineare Einfachregression 12.3 Beurteilung der Güte einer Regression Varianzzerlegung Die Abweichung eines jeden Wertes von seinem Mittelwert lässt sich darstellen als die Summe der Abweichung der tatsächlichen Werte von den geschätzten Werten und der Abweichung der geschätzten Werte vom Mittelwert. Dies gilt auch für die summierten Werte: T SS ⇔ N X (yi − Ȳ )2 i=1 i=1 N X ⇔ (yi − Ȳ )2 i=1 Prof. Dr. Michael Berlemann (HSU) = RSS + ESS N N X X = (ŷi − yi )2 + (ŷi − Ȳ )2 i=1 N N X X = (ŷi − yi )2 + 2i i=1 Empirische Wirtschaftsforschung i=1 FT 2010 210 / 265 Lineare Einfachregression 12.2 Methode der Kleinsten Quadrate Varianzzerlegung 180,0 160 0 160,0 zu erklärend de Variable (Y) 140,0 Tatsächliche Beobachtung Y = βˆ0 + βˆ1 ⋅ X 120,0 100,0 Prognostizierter Wert Unerklärte Abweichung Mittelwert Mittelwertabweichung 80,0 Erklärte Abweichung 60,0 Y 40,0 X 20,0 0,0 00 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 erklärende Variable (X) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 211 / 265 Lineare Einfachregression 12.3 Beurteilung der Güte einer Regression Bestimmtheitsmaß Definition Das Bestimmtheitsmaß (R2 ) einer linearen Regression ist definiert als PN 2 ESS RSS R = =1− = 1 − PN i=1 i 2 T SS T SS i=1 (yi − Ȳ ) 2 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 212 / 265 Lineare Einfachregression 12.2 Methode der Kleinsten Quadrate Beispiel: Hohes Bestimmtheitsmaß 180,0 160 0 160,0 zu erklärend de Variable (Y) 140,0 120,0 100,0 80,0 60,0 40,0 20,0 00 0,0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 erklärende Variable (X) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 213 / 265 Lineare Einfachregression 12.2 Methode der Kleinsten Quadrate Beispiel: Niedriges Bestimmtheitsmaß 180,0 160 0 160,0 zu erklärend de Variable (Y) 140,0 120,0 100,0 80,0 60,0 40,0 20,0 00 0,0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 erklärende Variable (X) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 214 / 265 Lineare Einfachregression Literaturhinweise Literaturhinweise zum 12. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 215 / 265 Lineare Einfachregression Literaturhinweise Literaturhinweise zum 12. Kapitel Von Auer, L. (2007): Ökonometrie. Eine Einführung, 4. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 1-4]. Gujarati, D. N. (1995): Basic Econometrics, 3rd. Edition, McGraw-Hill, International Edition, New York [insbes. Kapitel 2-4]. Hackl, P. (2005): Einführung in die Ökonometrie, Pearson, München [insbes. Kapitel 3-5]. Hill, R. C., W. E. Griffiths und G. G. Judge (2001): Undergraduate Econometrics, 2nd Edition, Wiley & Sons, Hoboken [insbes. Kapitel 3,4 und 6]. Studenmund, A. H. (2006): Using Econometrics. A Practical Guide, 5th Edition, Pearson/Addison Welsey, International Edition, Boston [insbes. Kapitel 1,2 und 4]. Verbeek, M. (2004): A Guide to Modern Econometrics, 2. Auflage, Wiley & Sons, Hoboken [insbes. Kapitel 1]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 216 / 265 Lineare Mehrfachregression 13. Lineare Mehrfachregression 13.1 Idee der linearen Mehrfachregression 13.2 OLS-Methode bei Mehrfachregressionen 13.3 Beurteilung der Güte einer linearen Mehrfachregression Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 217 / 265 Lineare Mehrfachregression 13.1 Idee der linearen Mehrfachregression Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 218 / 265 Lineare Mehrfachregression 13.1 Idee der linearen Mehrfachregression Modellgleichung Das einer linearen Mehrfachregression mit k erklärenden Variablen zugrunde liegende Modell lautet: Y = β0 + β1 · X1 + β2 · X2 + · · · + βk · Xk Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 219 / 265 Lineare Mehrfachregression 13.2 OLS-Methode bei Mehrfachregressionen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 220 / 265 Lineare Mehrfachregression 13.2 OLS-Methode bei Mehrfachregressionen Regressionsgleichung einer linearen Mehrfachregression yi = β0 + β1 · x1,i + β2 · x2,i + · · · + βk · xk,i + i Prognosegleichung Mit Hilfe der geschätzten Werte für die Regressionsparameter können über die folgende Gleichung Schätzwerte für die zu erklärende Variable berechnet werden: ŷi = β̂0 + β̂1 · x1,i + β̂2 · x2,i + · · · + β̂k · xk,i Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 221 / 265 Lineare Mehrfachregression 13.2 OLS-Methode bei Mehrfachregressionen Standardisierter Regressionskoeffizient Wird ein Regressionskoeffizient mit der Standardabweichung der zugehörigen erklärenden Variablen multipliziert und durch die Standardabweichung der zu erklärenden Variable geteilt, so erhält man den standardisierten Regressionskoeffizienten βks = βk · Prof. Dr. Michael Berlemann (HSU) Stdabw[Xk ] Stdabw[Y ] Empirische Wirtschaftsforschung FT 2010 222 / 265 Lineare Mehrfachregression 13.2 OLS-Methode bei Mehrfachregressionen Gauß-Markov-Bedingungen für Mehrfachregressionen (Teil 1): Es handelt sich um ein korrekt spezifiziertes (es fehlt keine wichtige erklärende Variable) lineares Regressionsmodell des Typs: yi = β0 + β1 · xi + i Der Störterm hat den Mittelwert null: E[yi ] = E[β0 + β1 · xi ] ⇒ E[i ] = 0 Es gibt keine serielle Korrelation der Störterme (und damit auch keine serielle Korrelation der zu erklärenden Variable) Cov[yi , yj ] = Cov[i , j ] = 0 ∀i 6= j ∧ i, j = 1, ..., N Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 223 / 265 Lineare Mehrfachregression 13.2 OLS-Methode bei Mehrfachregressionen Gauß-Markov-Bedingungen für Mehrfachregressionen (Teil 2): Der Störterm hat (genauso wie die zu erklärende Variable) eine konstante Varianz (Homoskedastizität) σY2 = σ2 = const Die Ausprägungen von X sind nicht selbst zufällig und haben zumindest 2 unterschiedliche Ausprägungen. Keine der erklärenden Variablen ist eine perfekt lineare Funktion einer anderen erklärenden Variablen (d.h. es gibt keine perfekte Multikollinearität). Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 224 / 265 Lineare Mehrfachregression 13.3 Beurteilung der Güte einer linearen Mehrfachregression Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 225 / 265 Lineare Mehrfachregression 13.3 Beurteilung der Güte einer linearen Mehrfachregression Bestimmtheitsmaß R2 = PN 2 ESS RSS =1− = 1 − PN i=1 i 2 T SS T SS i=1 (yi − Ȳ ) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 226 / 265 Lineare Mehrfachregression 13.3 Beurteilung der Güte einer linearen Mehrfachregression Adjustiertes Bestimmtheitsmaß Definition Das adjustierte Bestimmtheitsmaß (adj.R2 ) ist definiert als: adj.R2 = 1 − RSS N −(K+1) T SS N −1 =1− PN 2 i=1 i N −(K+1) PN 2 i=1 (yi −Ȳ ) N −1 mit N als Anzahl der Beobachtungen und K + 1 als Anzahl der geschätzten Koeffizienten (inkl. Konstante). Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 227 / 265 Lineare Mehrfachregression Literaturhinweise Literaturhinweise zum 13. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 228 / 265 Lineare Mehrfachregression Literaturhinweise Literaturhinweise zum 13. Kapitel Von Auer, L. (2007): Ökonometrie. Eine Einführung, 4. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 1-4]. Gujarati, D. N. (1995): Basic Econometrics, 3rd. Edition, McGraw-Hill, International Edition, New York [insbes. Kapitel 2-4]. Hackl, P. (2005): Einführung in die Ökonometrie, Pearson, München [insbes. Kapitel 3-5]. Hill, R. C., W. E. Griffiths und G. G. Judge (2001): Undergraduate Econometrics, 2nd Edition, Wiley & Sons, Hoboken [insbes. Kapitel 3,4 und 6]. Studenmund, A. H. (2006): Using Econometrics. A Practical Guide, 5th Edition, Pearson/Addison Welsey, International Edition, Boston [insbes. Kapitel 1,2 und 4]. Verbeek, M. (2004): A Guide to Modern Econometrics, 2. Auflage, Wiley & Sons, Hoboken [insbes. Kapitel 1]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 229 / 265 Koeffizienten- und Spezifikationstests 14. Koeffizienten- und Spezifikationstests 14.1 Wozu Koeffizienten- und Spezifikationstests? 14.2 Koeffiziententests 14.3 Spezifikationstests Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 230 / 265 Koeffizienten- und Spezifikationstests 14.1 Wozu Koeffizienten- und Spezifikationstests? Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 231 / 265 Koeffizienten- und Spezifikationstests 14.1 Wozu Koeffizienten- und Spezifikationstests? Nachdem man eine lineare Regression geschätzt hat, liegt ein vollständig spezifiertes Schätzmodell vor: ŷi = β̂0 + β̂1 · x1,i + β̂2 · x2,i + · · · + β̂K · xK,i Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 232 / 265 Koeffizienten- und Spezifikationstests 14.2 Koeffiziententests Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 233 / 265 Koeffizienten- und Spezifikationstests 14.2 Koeffiziententests Vorgehensweise Koeffiziententest (für jeden geschätzten Koeffizienten βk mit k = 1 · · · , K getrennt): 1 Zunächst wird die Nullhypothese und die Alternativhypothese formuliert (hier zweiseitiger Test): H0 : βk = 0 (der unerwartete Fall) HA : βk 6= 0 (der erwartete Fall) 2 Festlegung des Signifikanzniveaus (α = 0.1, α = 0.05, α = 0.01). 3 Berechnung der Testgröße (t-Wert). Überprüfung, ob Testgröße in Annahme- oder Ablehnungsbereich der Nullhypothese fällt, die sich aus dem vorgegebenen Signifikanzniveau ergeben. 4 Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 234 / 265 Koeffizienten- und Spezifikationstests 14.3 Spezifikationstests Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 235 / 265 Koeffizienten- und Spezifikationstests 14.3 Spezifikationstests F-Test auf gemeinsame Signifikanz aller Regressoren F-Test Bei einer linearen Regression wird üblicherweise die Hypothese überprüft, ob alle geschätzten Koeffizienten der erklärenden Variablen (nicht die Konstante) gleichzeitig null sind: H0 : β1 = β2 = · · · = βK = 0 HA : H0 ist falsch Testgröße des F-Tests (F-Wert): F = ESS K RSS N −K−1 Prof. Dr. Michael Berlemann (HSU) PN i=1 (ŷi −Ȳ =1− K PN 2 i=1 i N −K−1 )2 ∼ F (N − K − 1) Empirische Wirtschaftsforschung FT 2010 236 / 265 Koeffizienten- und Spezifikationstests Literaturhinweise Literaturhinweise zum 14. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 237 / 265 Koeffizienten- und Spezifikationstests Literaturhinweise Literaturhinweise zum 14. Kapitel Mosler, K. und F. Schmid (2008): Wahrscheinlichkeitsrechnung und schließende Statistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 6]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 238 / 265 Schätzprobleme 15. Schätzprobleme 15.1 Heteroskedastizität 15.2 Multikollinearität Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 239 / 265 Schätzprobleme 15.1 Heteroskedastizität Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 240 / 265 Schätzprobleme 15.1 Heteroskedastizität Heteroskedastie im Streudiagramm 180,0 160 0 160,0 Bedingung: Homoskedastizität (hier nicht erfüllt) zu erklärend de Variable (Y) 140,0 120,0 geringe Varianz des Störterms 100,0 80,0 hohe Varianz des Störterms 60,0 40,0 Yˆ = βˆ0 + βˆ1 ⋅ X 20,0 00 0,0 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 erklärende Variable (X) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 241 / 265 Schätzprobleme 15.1 Heteroskedastizität Diagnose Test auf Heteroskedastizität 1 Goldfeldt-Quandt-Test 2 Breusch-Pagan-Test 3 White-Test Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 242 / 265 Schätzprobleme 15.1 Heteroskedastizität Vorgehen beim Goldfeldt-Quandt-Test 1 Teilen des Samples S in zwei Sub-Samples S1 und S2 . 2 Schätzung einer linearen Regressionsgerade für jedes Sub-Sample. PN1 2 PN2 2 Berechnung der Summe der quadrierten Residuen i=1 i,1 und i=1 i,2 . 3 4 Aufstellen der Hypothesen: H0 : Quadratsummen der Residuen ist identisch. HA : Quadratsummen der Residuen unterscheiden sich. 5 Vergleich der Varianzen der Residuen mit Hilfe eines F-Tests (größere Quadratsumme im Zähler): PN1 F = 6 i=1 i,1 N1 −K PN2 i=1 i,2 N2 −K F (N1 − K, N2 − K) Übersteigt nun der Wert der Teststatistik den kritischen Wert der F-Verteilung mit N1 − K und N2 − K Freitheitsgraden, kann die Nullhypothese abgelehnt und die Alternativhypothese angenommen werden. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 243 / 265 Schätzprobleme 15.1 Heteroskedastizität Vorgehen beim Breusch-Pagan-Test 1 Aufstellen der Hypothesen: H0 : Es liegt Homoskedastizität vor. HA : Es liegt keine Homoskedastizität vor. 2 Schätzung einer linearen Regression. 3 Festlegung, welche Variablen für eine mögliche Heteroskedasie verantwortlich sein könnten 4 Schätzung einer weiteren Regressionsgerade, bei der die quadrierten Residuen aus der ersten Regression durch diese Variablen erklärt werden. 5 Berechnung des Bestimmtheitsmaß R2 für diese Regression. 6 Die Prüfgröße N · R2 ist asymptotisch χ2 -verteilt mit K Freiheitsgraden. 7 Übersteigt die Prüfgröße den kritischen Wert der χ2 -Verteilung, kann die Nullhypothese der Homoskedastizität abgelehnt werden. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 244 / 265 Schätzprobleme 15.1 Heteroskedastizität Lösung des Problems Lösungsansätze für Hetroskedastizität 1 Varianztransformation (bei bekannter Varianz) 2 3 Weighted Least Squares Feasible Generalized Least Squares 4 White-Korrektur (heteroskedastieresistente Standardfehler) Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 245 / 265 Schätzprobleme 15.2 Multikollinearität Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 246 / 265 Schätzprobleme 15.2 Multikollinearität Definition Definition Liegt zwischen zwei Regressoren einer multiplen linearen Regression yi = β0 + β1 · x1,i + β2 · x2,i + i eine lineare Beziehung vor, d.h. x2 = c + γ · x1 bzw. x1 = x2 c − γ γ so liegt perfekte Multikollinearität vor. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 247 / 265 Schätzprobleme 15.2 Multikollinearität Folgen perfekter Multikollinearität Einsetzen von x2 = c + γ · x1 in die Regressionsgleichung ergibt y = β0 + β1 · x1 + β2 · (c + γ1 · x1 ) + ⇔y = (β0 + β2 · c) + (β1 + β2 · γ) · x1 + Einsetzen von x1 = x2 γ − c γ in die Regressionsgleichung ergibt x2 c − + β2 · x 2 + = β0 + β1 · γ γ c β1 = β0 − β1 · + + β2 · x 2 + γ γ y ⇔y Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 248 / 265 Schätzprobleme 15.2 Multikollinearität Venn-Diagramme Fall 1: keine Multikollinearität Fall 2 / 3: imperfekte Multikollinearität (geringe: Fall 2 / hohe: Fall 3) Fall 4: perfekte Multikollinearität 1. 2. stdabw(Y) stdabw(X1) stdabw(Y) stdabw(X2) 3. stdabw(X1) stdabw(X2) 4. stdabw(Y) stdabw(Y) stdabw(X2)= stdabw(X1) stdabw(X1) Prof. Dr. Michael Berlemann (HSU) stdabw(X2) Empirische Wirtschaftsforschung FT 2010 249 / 265 Schätzprobleme 15.2 Multikollinearität Hilfsregressionen Beispiel: drei erklärende Variablen x1 , x2 und x3 : yi = β0 + β1 · x1,i + β2 · x2,i + β3 · x3,i + i Hilfsregressionen: x1,i = α0 + α1 · x2,i + α2 · x3,i + 1,i x2,i = δ0 + δ1 · x1,i + δ2 · x3,i + 2,i x3,i = γ0 + γ1 · x1,i + γ2 · x2,i + 3,i Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 250 / 265 Schätzprobleme 15.2 Multikollinearität Variance Inflation Factors Häufig wird auch der Variance Inflation Factor (VIF) jeder Hilfsregression k zur Diagnose von Multikollinearität genutzt: V IFk = 1 1 − Rk2 Faustregel: Ist der V IF größer als zehn (Rk2 > 0, 9), deutet das auf sehr starke Multikollinearität. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 251 / 265 Schätzprobleme 15.2 Multikollinearität Möglichkeiten der Ausschaltung von Multikollinearität Ausschluß von Variablen Einbindung zusätzlicher Informationen Zusammenfassung von Variablen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 252 / 265 Schätzprobleme Literaturhinweise Literaturhinweise zum 15. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 253 / 265 Schätzprobleme Literaturhinweise Literaturhinweise zum 15. Kapitel Von Auer, L. (2007): Ökonometrie. Eine Einführung, 4. Auflage, Springer-Verlag, Berlin [insbes. Kapitel 17-21]. Wooldridge, J.M. (2006): Introductury Econometrics: A Modern Approach, 3. Auflage, Thomson. [insbes. Kapitel 8]. Backhaus et al. (2006): Multivariate Analysemethoden: eine anwendungsorientierte Einführung, 11. Auflage, Springer, Berlin-Heidelberg. [insbes. Kapitel 1]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 254 / 265 Regression bei diskreten abhängigen Variablen 16. Regression bei diskreten abhängigen Variablen 16.1 Überblick 16.2 Lineares Wahrscheinlichkeitsmodell bei binär abhängigen Variablen 16.3 Logit-/Probit-Schätzung Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 255 / 265 Regression bei diskreten abhängigen Variablen Überblick 16.1 Überblick Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 256 / 265 Regression bei diskreten abhängigen Variablen 16.2 Lineares Wahrscheinlichkeitsmodell bei binär abhängigen Variablen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 257 / 265 Regression bei diskreten abhängigen Variablen 16.2 Lineares Wahrscheinlichkeitsmodell Schätzung mit OLS Gegeben sei folgendes Beispiel: Es soll analysiert werden, wovon es abhängt, ob ein Student die Prüfung besteht oder nicht. Dazu wird die zu erklärende Variable Y folgendermaßen definiert: 0 wenn Student i die Prüfung bestanden hat yi = 1 wenn Student i die Prüfung nicht bestanden hat Als erklärende Variablen sollen das Alter (A), der Lernaufwand in Stunden pro Woche (L) und die Ergebnisse eines IQ-Tests (I) verwendet werden. Es soll folgendes Modell geschätzt werden: yi = β0 + β1 · Ai + β2 · Li + β3 · Ii + i Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 258 / 265 Regression bei diskreten abhängigen Variablen 16.2 Lineares Wahrscheinlichkeitsmodell Schätzung mit OLS Der bedingte Erwartungswert (der erwartete Wert von yi , gegeben der Werte der erklärenden Variablen) kann auch als Wahrscheinlichkeit interpretiert werden: E[yi |Ai , Li , Ii ] = 1 · P (yi = 1 |Ai , Li , Ii ) +0 · P (yi = 0 |Ai , Li , Ii ) = 1 · P (yi = 1 |Ai , Li , Ii ) ⇒ ŷi = Prof. Dr. Michael Berlemann (HSU) β̂0 + β̂1 · Ai + β̂2 · Li + β̂3 · Ii = P (yi = 1) Empirische Wirtschaftsforschung FT 2010 259 / 265 Regression bei diskreten abhängigen Variablen 16.2 Lineares Wahrscheinlichkeitsmodell binäre Variab ble, kumulierte Dichtefunktion Schätzung mit OLS: Grafische Darstellung 1,00 0,00 0 1 2 3 4 5 6 7 8 9 10 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 260 / 265 Regression bei diskreten abhängigen Variablen 16.3 Logit-/Probit-Schätzung Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 261 / 265 Regression bei diskreten abhängigen Variablen 16.3 Logit-/Probit-Schätzung binäre Variab ble, kumulierte Dichtefunktion Anpassung einer Verteilungsfunktion 1,00 0,00 0 1 2 3 4 5 6 7 8 9 10 Ausprägungen Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 262 / 265 Regression bei diskreten abhängigen Variablen 16.3 Logit-/Probit-Schätzung Logit- / Probit-Modelle Logit-Modelle legen nun der Schätzung eine logistische Verteilung zugrunde: exp(β0 + β1 · xi ) P (yi = 1) = 1 + exp(β0 + β1 · xi ) Probit-Modelle legen nun der Schätzung eine Standardnormalverteilung zugrunde: 2 Z β0 +β1 ·xi 1 −z P (yi = 1) = Φ(β0 + β1 · xi ) = · exp dz 2·π 2 −∞ Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 263 / 265 Regression bei diskreten abhängigen Variablen Literaturhinweise Literaturhinweise zum 16. Kapitel Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 264 / 265 Regression bei diskreten abhängigen Variablen Literaturhinweise Literaturhinweise zum 16. Kapitel Agresti, A. (1990): Categorical Data Analysis, 4. Auflage, Wiley & Sons. [insbes. Kapitel 4.1 und 4.2]. Wooldridge, J.M. (2006): Introductury Econometrics: A Modern Approach, 3. Auflage, Thomson. [insbes. Kapitel 17]. Backhaus et al. (2006): Multivariate Analysemethoden: eine anwendungsorientierte Einführung, 11. Auflage, Springer, Berlin-Heidelberg. [insbes. Kapitel 7]. Prof. Dr. Michael Berlemann (HSU) Empirische Wirtschaftsforschung FT 2010 265 / 265