Vorlesung: Empirische Wirtschaftsforschung

Werbung
Vorlesung: Empirische Wirtschaftsforschung
Prof. Dr. Michael Berlemann
Bachelor
Empirische Wirtschaftsforschung (WS-16-V-05.2)
FT 2010
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
1 / 265
Organisatorisches
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
2 / 265
Organisatorisches
Vorlesungskonzept
Anwendungsorientierte Einführung in die empirische Wirtschaftsforschung
Verwendete Ökonometriesoftware: EViews
Prüfung: 60-minütige Abschlussklausur
Downloads (auf Internetseite der Professur)
Vorlesungsfolien
Verwendete Datensätze
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
3 / 265
Organisatorisches
Begleitübung
Zwei inhaltsgleiche Begleitübungen im PC Labor WiSo:
Dienstag, 15:45 bis 17:15 Uhr
Dienstag, 17:30 bis 19:00 Uhr
Übungen finden unregelmäßig nach Ankündigung in Vorlesung und
Internet statt
Teilnahme ist freiwillig, wird aber empfohlen
Da Computerkapazität begrenzt, ist vorab zwingend Anmeldung bei
Herrn Hielscher nötig
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
4 / 265
Grobgliederung der Vorlesung I
1. Grundlagen
2. Datenquellen der empirischen Wirtschaftsforschung
3. Einführung in EViews
4. Häufigkeitsverteilungen
5. Maßzahlen für einzelne Merkmale
6. Maßzahlen für den Zusammenhang zwischen Merkmalen
7. Zufallsvariablen und deren Eigenschaften
8. Stichproben
9. Grundlagen des Testens von Hypothesen
10. Verteilungs-Tests
11. Mittelwert-Tests
12. Lineare Einfachregression
13. Lineare Mehrfachregression
14. Koeffizienten- und Spezifikationstests
15. Schätzprobleme und deren Lösung
16. Regressionen bei diskreten abhängigen Variablen
17. Einführung in die Zeitreihenanalyse
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
5 / 265
Grundlagen
1. Grundlagen
1.1
1.2
1.3
1.4
Gegenstand der empirischen Wirtschaftsforschung
Überprüfung modellgestützter Hypothesen
Evaluierung von Politikmaßnahmen
Prognose
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
6 / 265
Grundlagen
1.1 Gegenstand der empirischen Wirtschaftsforschung
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
7 / 265
Grundlagen
1.2 Überprüfung modellgestützter Hypothesen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
8 / 265
Grundlagen
1.2 Überprüfung modellgestützter Hypothesen
Kritischer Rationalismus
Sir Karl Popper
* 28. Juli 1902 in Wien
† 17. September 1994 in London
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
9 / 265
Grundlagen
Überprüfung
modellgestützter
Hypothesen
1.2 Überprüfung
modellgestützter Hypothesen
Beispiel Konsumentenverhalten bei Preisänderungen
Menge x2
x2opt
U1
x1opt
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
Menge x1
FT 2010
10 / 265
Grundlagen
1.2 Überprüfung
modellgestützter Hypothesen
Überprüfung
modellgestützter
Hypothesen
Beispiel Konsumentenverhalten bei Preisänderungen
Menge x2
Konsequenzen eines Preisanstiegs bei Gut x1
x2opt
U1
x1opt
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
Menge x1
FT 2010
11 / 265
Grundlagen
1.3 Evaluierung von Politikmaßnahmen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
12 / 265
Grundlagen
1.3 Evaluierung von Politikmaßnahmen
Beispiel: Tabaksteuererhöhung 2004
Bundeskanzler Gerhard Schröder
Tabaksteuerreform 2004
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
13 / 265
luierung
von Politikmaßnahmen
1.3 Evaluierung
von Politikmaßnahmen
Grundlagen
Laffer-Kurve
Steueraufkommen
Laffer-Kurve
Steuersatz
τ=0%
Prof. Dr. Michael Berlemann (HSU)
τ*
Empirische Wirtschaftsforschung
τ = 100 %
FT 2010
14 / 265
Grundlagen
1.3 Evaluierung von Politikmaßnahmen
Deutsche Tabaksteuer-Einnahmen 1949-2009 in Mio. Euro (Quelle: Statistisches Bundesamt)
16000
14000
12000
10000
8000
6000
4000
2000
0
1949
1954
1959
1964
Prof. Dr. Michael Berlemann (HSU)
1969
1974
1979
1984
1989
Empirische Wirtschaftsforschung
1994
1999
2004
FT 2010
2009
15 / 265
Grundlagen
1.3 Evaluierung von Politikmaßnahmen
Beispiel: Tabaksteuererhöhung
Tabaksteuererhöhung 2004
”Misslungene”„ Tabaksteuererhöhung
2004
als
„Misslungene
Misslungene“ Tabaksteuererhöhung von
von 2004
als schönes
praktisches
Beispiel
für die empirischer
Folgen mangelnder oder falscher
Folge mangelnder
oder
falscher
empirischer Abschätzungen der Folgen wirtschaftspolitischer
Abschätzung derMaßnahmen
Folgen einer
„
"R i t
"Resistenz
d
der R
Raucher"
h " kann
k
man mit
it "geringer
" i
di
direkter
kt
wirtschaftspolitischer
Maßnahme
Preiselastizität der Nachfrage" übersetzen.
„
Dass der Finanzminister weniger Einnahmen aus der
(Steuererhöhung)
Tabaksteuer fürchten muss, kommt der Aussage gleich, dass
sich der Markt für
Tabakwaren
fallenden
Bereich der
”Resistenz der Raucher”
kann
manim mit
”geringer
Laffer-Kurve befindet.
direkter Preiselastizität der Nachfrage”
übersetzen.
Dass der Finanzminister weniger Einnahmen aus
der Tabaksteuer fürchten muss, kommt der
Aussage gleich, dass sich der Markt für
Tabakwaren im fallenden Bereich der Laffer-Kurve
befindet.
aus: Schaumburger Nachrichten, 11.2.2004
FT 2009
Prof. Dr. Michael Berlemann (HSU)
Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung"
Quelle: Schaumburger
Nachrichten, 11.2.2004
Empirische Wirtschaftsforschung
FT 2010
16 / 265
Grundlagen
1.4 Prognose
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
17 / 265
Grundlagen
1.4 Prognose
Bevölkerungsprognose 2007 bis 2025 für Deutschland regional (Quelle: BBSR)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
18 / 265
Grundlagen
Literaturhinweise
Literaturhinweise zum 1. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
19 / 265
Grundlagen
Literaturhinweise
Literaturhinweise zum 1. Kapitel
Hujer, R. und R. Cremer (1978): Methoden der empirischen
Wirtschaftsforschung, Verlag Vahlen, München [insbes. Kapitel 1
Abschnitt I].
Laffer, A. B. (1981): Government Exactions and Revenue Deficiencies, in:
Cato Journal, Vol. 1, Nr. 1, S. 1-21.
Mosler, K. und F. Schmid (2006): Beschreibende Statistik und
Wirtschaftsstatistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel
0].
Winker, P. (2007): Empirische Wirtschaftsforschung und Ökonometrie, 2.
Auflage, Springer-Verlag, Berlin [insbes. Kapitel 1].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
20 / 265
Datenquellen der empirischen Wirtschaftsforschung
2. Datenquellen der empirischen
Wirtschaftsforschung
2.1
2.2
2.3
2.4
2.5
2.6
2.7
Grundbegriffe
Merkmalstypen
Skalierung von Merkmalen
Datenerhebung
Datensätze
Sekundärdatenquellen und Datenbanken
Datenverarbeitung und Software
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
21 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.1 Grundbegriffe
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
22 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.1 Grundbegriffe
Grundgesamtheit und Untersuchungseinheit
Definition
Die Objekte, auf die sich eine empirische Analyse bezieht, werden auch
als Untersuchungseinheiten (ω) bezeichnet
Definition
Alle Untersuchungseinheiten zusammen ergeben die sog.
Grundgesamtheit (Ω).
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
23 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.1 Grundbegriffe
Merkmal, Merkmalsausprägungen und Merkmalsraum
Definition
Bestimmte Eigenschaften der Untersuchungsobjekte bezeichnet man auch
als Merkmale (X) (oder auch als statistische Variable).
Definition
Jedes Merkmal kann in der Regel mehrere (k) unterschiedliche
Merkmalsausprägungen a1 , a2 ,· · · , ak aufweisen.
Definition
Als Merkmalsraum (S) (oder auch: Zustandsraum) bezeichnet man die
Menge aller mögliche Ausprägungen eines Merkmals (alle Werte, die eine
statistische Variable annehmen kann).
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
24 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.2 Merkmalstypen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
25 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.2 Merkmalstypen
Merkmalstypen
M k l
Merkmale
Qualitative Merkmale
Quantitative Merkmale
Ausprägungen unterscheiden sich artmässig
Ausprägungen können durch Zahlen angegeben werden
Diskrete Merkmale
abzählbarer
b ählb
Zustandsraum
Z t d
Stetige Merkmale
nicht abzählbarer Zustandsraum
Gruppierte Merkmale
Ab ählb durch
Abzählbar
d h Gruppenbildung
G
bild
FT 2009
Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung"
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
27
FT 2010
26 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.3 Skalierung von Merkmalen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
27 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.3 Skalierung von Merkmalen
Skalierung von Merkmalen
Skalentypen
Nominalskala
Ordinalskala (Rangskala)
nur Unterscheidung, keine Ordnung
Reihenfolge, aber keine Abstände interpretierbar
Metrische Skala
Reihenfolge, Abstände interpretierbar
Intervallskala
nur Abstände interpretierbar
Stetige Merkmale
natürlicher Nullpunkt, Verhältnisse interpretierbar
Absolutskala
natürlicher Nullpunkt & natürliche Maßeinheit
FT 2009
Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung"
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
29
FT 2010
28 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.4 Datenerhebung
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
29 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.5 Datensätze
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
30 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.5 Datensätze
Bruttoinlandsprodukt je Einwohner in Deutschland
1991 bis 2007 nach Bundesländern (preisbereinigt, verkettet, in Prozent
relativ
zum Vorjahr)
Bruttoinlandsprodukt
je Einwohner in Deutschland 1991 bis 2007 nach Bundesländern
(preisbereinigt, verkettet, in Prozent relativ zum Vorjahr)
BW
BY
BE
BB
HB
HH
HE
MV
NI
NW
RP
SL
SN
ST
SH
TH
D
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
Quelle: Arbeitsgruppe VGR der Länder (2009)
FT 2009
Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung"
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
36
FT 2010
31 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.5 Datensätze
Querschnittsdaten
Querschnittdaten (Cross section data)
(Cross section data)
BW
BY
BE
BB
HB
HH
HE
MV
NI
NW
RP
SL
SN
ST
SH
TH
D
,
3,2
4,9
,
1,4
,
3,2
,
4,9
,
3,5
,
3,2
,
1,0
,
2,4
,
2,3
,
2,7
,
4,8
,
1,3
,
2,5
,
2,4
,
2,7
,
3,1
,
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
Quelle: Arbeitsgruppe VGR der Länder (2009)
FT 2009
Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung"
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
37
FT 2010
32 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.5 Datensätze
Längsschnittdaten,
Längsschnittdaten
Zeitreihe
Längsschnittdaten, Zeitreihe
(Time series data)
(Time series data)
BW
BY
BE
BB
HB
HH
1992
−0,1
1993
−0,8
1994
08
0,8
1995
1,0
1996
1,2
1997
1,8
1998
1,1
1999
0,8
2000
,
3,5
2001
3,4
2002
−0,2
2003
−3,3
2004
0,3
2005
1,3
2006
2,4
2007
2,1
HE
MV
NI
NW
RP
SL
SN
ST
SH
TH
D
Quelle: Arbeitsgruppe VGR der Länder (2009)
FT 2009
Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung"
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
38
FT 2010
33 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.5 Datensätze
Paneldaten
Paneldaten (Panel data)
(Panel data)
BW
BY
BE
BB
HB
HH
HE
MV
NI
NW
RP
SL
SN
ST
SH
TH
D
1992
−0,5
1,3
3,0
10,1
−0,2
−0,1
0,6
11,5
0,4
0,1
−1,4
−0,4
11,3
11,6
0,5
19,9
1,5
1993
−5,3
−2,9
2,2
12,4
−2,8
−0,8
−3,0
12,7
−2,2
−3,1
−4,1
−4,7
13,3
14,1
−1,8
14,1
−1,5
1994
16
1,6
15
1,5
09
0,9
12 3
12,3
17
1,7
08
0,8
06
0,6
13 4
13,4
13
1,3
08
0,8
10
1,0
30
3,0
13 7
13,7
11 4
11,4
06
0,6
13 2
13,2
23
2,3
1995
1,2
0,6
2,0
7,5
0,4
1,0
1,0
8,4
−1,2
1,4
0,9
3,0
8,3
5,1
1,6
3,8
1,6
1996
1,5
1,3
−1,6
2,7
0,2
1,2
2,0
3,2
−0,3
−0,8
−1,2
−2,9
3,4
3,3
0,7
3,3
0,7
1997
2,0
1,9
−1,3
1,3
1,6
3,4
1,8
1,3
2,1
1,2
1,5
1,4
2,4
0,7
3,6
1,0
4,2
1,6
1998
2,3
3,7
0,7
0,3
1,8
1,1
1,4
0,4
2,2
2,1
0,9
3,4
1,3
1,4
0,2
2,3
2,1
1999
2,3
2,6
−0,1
3,6
1,1
0,8
3,1
3,9
1,0
0,8
2,4
2,4
3,0
2,8
1,2
4,0
1,9
2000
,
3,2
4,9
,
1,4
,
3,2
,
4,9
,
3,5
,
3,2
,
1,0
,
2,4
,
2,3
,
2,7
,
4,8
,
1,3
,
2,5
,
2,4
,
2,7
,
3,1
,
2001
2,1
1,4
−1,2
0,6
1,3
3,4
1,4
1,1
−1,1
0,6
−1,4
1,6
2,6
1,4
0,5
2,3
1,1
2002
−1,9
0,8
−1,8
0,2
1,3
−0,2
−1,2
1,0
−1,1
−0,1
0,9
−1,0
3,3
3,4
−2,4
1,1
−0,2
2003
−0,7
0,0
−2,2
0,1
0,3
−3,3
0,4
0,6
−0,0
−0,9
−0,5
−0,5
2,2
1,0
−0,1
2,6
−0,3
2004
0,2
1,8
−2,0
1,4
0,2
0,3
0,2
2,0
0,9
1,2
2,2
3,8
2,3
1,6
0,8
2,5
1,1
2005
0,3
1,5
0,8
1,2
0,2
1,3
0,9
0,6
2,1
0,1
−0,4
3,2
0,8
0,9
0,1
1,0
0,8
2006
4,3
3,1
1,0
1,7
1,8
2,4
3,1
2,2
2,6
2,7
2,6
2,6
3,4
2,9
2,4
3,6
3,0
2007
2,7
2,6
1,8
2,5
2,8
2,1
2,4
3,4
2,0
2,8
2,7
3,0
3,1
3,3
1,3
3,0
2,6
Quelle: Arbeitsgruppe VGR der Länder (2009)
FT 2009
Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung"
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
39
FT 2010
34 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.6 Sekundärdatenquellen und Datenbanken
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
35 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.6 Sekundärdatenquellen und Datenbanken
Sekundärdatenquellen
Sekundärdatenquellen
S k dä d
Sekundärdaten
amtliche Statistik
nicht-amtliche Statistik
von staatlichen Institutionen erhobene Daten
von privaten Institutionen erhobene Daten
national
national
d Inland
das
I l d betreffend
b t ff d
d Inland
das
I l d betreffend
b t ff d
international
international
im Ländervergleich
im Ländervergleich
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
36 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.6 Sekundärdatenquellen und Datenbanken
Nationale amtliche Statistik
Statistisches Bundesamt / Statistische Landesämter:
Statistisches Jahrbuch, Fachserien, Zeitschriften
Wichtigste Daten sind im Internet frei oder gegen geringe Gebühr
zugänglich:
http://www.destatis.de/
http://www.vgrdl.de/Arbeitskreis VGR/
Deutsche Bundesbank:
Monatsberichte, Statistische Beihefte, Geschäftsberichte
Internetangebot:
http://www.bundesbank.de/statistik/statistik.php
Bundesregierung / Landesregierungen:
Regelmäßige Berichte (Jahreswirtschaftsbericht, Finanzbericht,
Sozialbericht etc.)
Internet Bundeswirtschaftsministerium:
http://www.bmwi.de/BMWi/Navigation/wirtschaft.html
Bundesagentur für Arbeit / Landesarbeitsagenturen:
Internet:
http://www1.arbeitsamt.de/hst/services/statistik/index.html
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
37 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.6 Sekundärdatenquellen und Datenbanken
Nationale nicht-amtliche Statistik
Öffentlich geförderte Wirtschaftsforschungsinstitute:
Deutsches Institut für Wirtschaftsforschung (DIW), Berlin
Internet: http://www.diw.de
ifo Institut für Wirtschaftsforschung, München
Internet: http://www.ifo.de
Institut für Weltwirtschaft (IfW), Kiel
Internet: http://www.ifw-kiel.de
Rheinisch-Westfälisches Institut für Wirtschaftsforschung (RWI), Essen
Internet: http://www.rwi-essen.de
Institut für Wirtschaftsforschung Halle (IWH), Halle
Internet: http://www.iwh-halle.de
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
38 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.6 Sekundärdatenquellen und Datenbanken
Nationale nicht-amtliche Statistik
Privat finanzierte Wirtschaftsforschungsinstitute
Zentrum für Europäische Wirtschaftsforschung (ZEW), Mannheim
Internet: http://www.zew.de
Hamburger Weltwirtschafts-Institut (HWWI), Hamburg
Internet: http://www.hwwi.org
Institut der Deutschen Wirtschaft (IdW), Köln
Internet: http://www.idw.de
Institut für Makroökonomie und Konjunkturforschung (IMK), Düsseldorf
Internet: http://www.boeckler.de/31923.html
Sachverständigenrat zur Begutachtung der gesamtwirtschaftlichen
Entwicklung
Internet: http://www.sachverstaendigenrat-wirtschaft.de
Monopolkommission
Internet: http://www.monopolkommission.de
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
39 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.6 Sekundärdatenquellen und Datenbanken
Nationale nicht-amtliche Statistik
Marktforschungsinstitute
Gesellschaft für Konsumforschung (GfK)
Internet: http://www.gfk.com/group/index.de.html
Meinungsforschungsinstitute
Institut für Demoskopie Allensbach
Internet: http://www.ifd-allensbach.de
Emnid
Internet: http://www.tns-emnid.com
Forsa
Internet: http://www.forsa.de
Forschungsgruppe Wahlen
http://www.forschungsgruppe.de/Startseite
Infas
http://www.infas.de
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
40 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.6 Sekundärdatenquellen und Datenbanken
Internationale amtliche Statistik
Statistisches Amt der Europäischen Union (Eurostat)
Internet: http://epp.eurostat.ec.europa.eu
Europäische Zentralbank (EZB)
Internet: http://www.ecb.int/stats/html/index.en.html
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
41 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.6 Sekundärdatenquellen und Datenbanken
Internationale nicht-amtliche Statistik
Organisation for Economic Development and Co-Ordination (OECD):
Internet: http://www.oecd.org
Weltbank
Internet: http://www.worldbank.org
Bank für Internationalen Zahlungsausgleich (Basel)
Internet: http://www.bis.org
Vereinte Nationen (UN):
Internet: http://www.un.org/Pubs
International Monetary Fund (IMF):
Internet: http://www.imf.org/external/data.htm
International Labor Organization (ILO):
Internet: http://www.ilo.org/global/lang–en/index.htm
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
42 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.6 Sekundärdatenquellen und Datenbanken
Internationale nicht-amtliche Statistik
Datenbanken sind Sammlungen von Daten, unter Umständen auch aus
ganz unterschiedlichen Datenquellen
Datenbanken der amtlichen Statistik:
Genesis Online (Statistisches Bundesamt)
Bundesstatistik: Internet:
https://www-genesis.destatis.de/genesis/online/logon
Regionalstatistik: Internet:
https://www.regionalstatistik.de/genesis/online/logon
Arbeitsgruppe VGR der Länder:
Internet: http://www.vgrdl.de/Arbeitskreis VGR
Sehr umfangreiche Datenbanken:
Penn World Tables (Freier Zugang über University of Pennsylvania):
http://pwt.econ.upenn.edu
Statistik-Netz (Zugang HSU HH über Bibliothek WiSo)
Datastream (Zugang HSU HH, derzeit im Aufbau)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
43 / 265
Datenquellen der empirischen Wirtschaftsforschung
2.7 Datenverarbeitung und Software
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
44 / 265
Datenquellen der empirischen Wirtschaftsforschung
Literaturhinweise
Literaturhinweise zum 2. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
45 / 265
Datenquellen der empirischen Wirtschaftsforschung
Literaturhinweise
Literaturhinweise zum 2. Kapitel
Mosler, K. und F. Schmid (2006): Beschreibende Statistik und
Wirtschaftsstatistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel
1].
Winker, P. (2007): Empirische Wirtschaftsforschung und Ökonometrie, 2.
Auflage, Springer-Verlag, Berlin [insbes. Kapitel 2].
Toutenburg, H. und C. Heumann (2006): Deskriptive Statistik. Eine
Einführung in Methoden und Anwendungen mit SPSS, 5. Auflage,
Springer-Verlag, Berlin [insbes. Kapitel 1].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
46 / 265
Einführung in EViews
3. Einführung in EViews
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
47 / 265
Häufigkeitsverteilungen
4. Häufigkeitsverteilungen
4.1 Absolute und relative Häufigkeiten
4.2 Empirische Verteilungsfunktion
4.3 Grafische Darstellung
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
48 / 265
Häufigkeitsverteilungen
4.1 Absolute und relative Häufigkeiten
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
49 / 265
Häufigkeitsverteilungen
4.1 Absolute und relative Häufigkeiten
... bei qualitativen Merkmalen
Ausgangssituation:
Untersucht wird das qualitative Merkmal X.
Dazu wird aus der Grundgesamtheit eine Stichprobe der Größe N
gezogen.
Somit erhält man für jede Beobachtung x1 , x2 , ..., xN eine qualitative
Merkmalsausprägung a1 , a2 , ..., aN .
Insgesamt gibt es k Merkmalsausprägungen.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
50 / 265
Häufigkeitsverteilungen
4.1 Absolute und relative Häufigkeiten
... bei qualitativen Merkmalen
Definition
Die absoluten Häufigkeiten nj geben an, wie oft jede qualitative
Merkmalsausprägung aj mit j = 1, ..., k eines Merkmals in der Stichprobe
auftritt.
Die Summe der absoluten Häufigkeiten ergibt die Gesamtanzahl der
Beobachtungen:
k
X
nj = N
j=1
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
51 / 265
Häufigkeitsverteilungen
4.1 Absolute und relative Häufigkeiten
... bei qualitativen Merkmalen
Definition
Die relativen Häufigkeiten fj geben an, welchen Anteil jede
Merkmalsausprägung an der Gesamtanzahl der Beobachtungen hat
Die Summe der relativen Häufigkeiten ergibt ergibt 100%:
k
X
j=1
Prof. Dr. Michael Berlemann (HSU)
fj =
k
X
nj
j=1
N
=1
Empirische Wirtschaftsforschung
FT 2010
52 / 265
Häufigkeitsverteilungen
4.2 Empirische Verteilungsfunktion
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
53 / 265
Häufigkeitsverteilungen
4.2 Empirische Verteilungsfunktion
Definition
Die empirische Verteilungsfunktion eines Merkmals ergibt sich aus
den kumulierten relativen Häufigkeiten.
Um den Wert der empirischen Verteilungsfunktion zu berechnen, müssen
zunächst die Beobachtungen ihrer Größe nach von klein nach groß
geordnet werden.
Der Wert der empirische Verteilungsfunktion für die
Beobachtung x ergibt sich dann als die Summe der kumulierten
relativen Häufigkeiten aller Merkmalsausprägungen, die kleiner oder
gleich x sind:
X
F (x) =
f (aj )
aj <x
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
54 / 265
Häufigkeitsverteilungen
4.2 Empirische Verteilungsfunktion
Beispiel empirische Verteilungsfunktion
1,00
kumulierte relative Häufigkeiten
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,00
0
10.000
20.000
30.000
40.000
50.000
60.000
70.000
80.000
90.000
Bruttojahreseinkommen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
55 / 265
Häufigkeitsverteilungen
4.3 Grafische Darstellung
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
56 / 265
Häufigkeitsverteilungen
4.3 Grafische Darstellung
Grafische Darstellungsmöglichkeiten von Häufigkeiten
Bereits kennen gelernt:
Empirische Verteilungsfunktion
Zusätzlich häufig verwendet:
Häufigkeitstabellen (absolut, relativ), ggfs. klassifiziert
Balkendiagramme
Kreisdiagramme
Histogramme
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
57 / 265
Häufigkeitsverteilungen
4.3 Grafische Darstellung
Häufigkeitstabellen
Klassen
1
2
3
4
5
6
7
Einkommensintervall
(EURO)
bis 9999
10000 bis 19999
20000 bis 29999
30000 bis 39999
40000 bis 49999
50000 bis 59999
60000 und mehr
Prof. Dr. Michael Berlemann (HSU)
Absolute
Häufigkeit
5
6
9
12
10
5
3
Relative
Häufigkeit
0,1
0,12
0,18
0,24
0,2
0,1
0,06
Empirische Wirtschaftsforschung
Kum. relative
Häufigkeit
0,1
0,22
0,4
0,64
0,84
0,94
1,00
FT 2010
58 / 265
Häufigkeitsverteilungen
4.3 Grafische Darstellung
Balkendiagramm bei stetigen, gruppierten Daten
7
0,06
6
0,1
5
0,2
4
0,24
3
0,18
2
0,12
1
0,1
0
0,05
Prof. Dr. Michael Berlemann (HSU)
0,1
0,15
Empirische Wirtschaftsforschung
0,2
0,25
0,3
FT 2010
59 / 265
Häufigkeitsverteilungen
4.3 Grafische Darstellung
Kreisdiagramm bei stetigen, gruppierten Daten
7
6%
6
10%
1
10%
2
12%
5
20%
3
18%
4
24%
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
60 / 265
Häufigkeitsverteilungen
4.3 Grafische Darstellung
Histogramm bei stetigen, gruppierten Daten
0,3
0,25
0,24
0,2
0,2
0,18
0,15
0,12
0,1
0,1
0,1
0,06
0,05
0
1
2
Prof. Dr. Michael Berlemann (HSU)
3
4
5
Empirische Wirtschaftsforschung
6
7
FT 2010
61 / 265
Häufigkeitsverteilungen
Literaturhinweise
Literaturhinweise zum 4. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
62 / 265
Häufigkeitsverteilungen
Literaturhinweise
Literaturhinweise zum 4. Kapitel
Duller, C. (2006): Einführung in die Statistik mit Excel und SPSS,
Physica-Verlag, Heidelberg [insbes. Kapitel 6].
Kazmier, L. J. (1996): Wirtschaftsstatistik, Übersetzung der 3. Auflage,
McGraw-Hill International Ltd., London [insbes. Kapitel 2].
Quatember, A. (2005): Statistik ohne Angst vor Formeln. Ein Lehrbuch
für Wirtschafts- und Sozialwissenschaftler [insbes. Kapitel 1.2].
Toutenburg, H. und C. Heumann (2006): Deskriptive Statistik. Eine
Einführung in Methoden und Anwendungen mit SPSS, 5. Auflage,
Springer-Verlag, Berlin [insbes. Kapitel 2].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
63 / 265
Maßzahlen für einzelne Merkmale
5. Maßzahlen für einzelne Merkmale
5.1
5.2
5.3
5.4
Lagemaße
Streuungsmaße
Schiefe, Wölbung und Exzess
Konzentrationsmaße
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
64 / 265
Maßzahlen für einzelne Merkmale
5.1 Lagemaße
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
65 / 265
Maßzahlen für einzelne Merkmale
5.1 Lagemaße
Modus / Modalwert
Definition
Als Modus bezeichnet man diejenige Markmalsausprägung, die am
häufigsten auftritt.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
66 / 265
Maßzahlen für einzelne Merkmale
5.1 Lagemaße
Quantil
Definition
Sei α eine Zahl zwischen null und eins. Als α-Quantil wird dann
derjenige Wert x̃α bezeichnet, für den die Verteilungsfunktion F gerade
den Wert α annimmt, d.h. F (x̃α ) = α.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
67 / 265
Maßzahlen für einzelne Merkmale
5.1 Lagemaße
Quartile
Definition
Als Quartile bezeichnet man diejenigen Quantilswerte, die zu einer
Unterteilung der Daten in vier gleich große Gruppen führen:
F (x̃α=0,25 ) = 0, 25
F (x̃α=0,50 ) = 0, 50
F (x̃α=0,75 ) = 0, 75
Dabei bezeichnet man das 0,25-Quartil auch als unteres und das
0,75-Quartil als oberes Quartil
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
68 / 265
Maßzahlen für einzelne Merkmale
5.1 Lagemaße
Median
Definition
Der Median (auch: Zentralwert) beschreibt das Zentrum einer
geordneten Reihe aller Beobachtungen (aufsteigend, absteigend) und ist
ein Spezialfall eines Quantils.
Für den Median gilt, dass höchstens 50 % der Beobachtungen kleiner oder
gleich und höchstens 50% größer oder gleich diesem Wert sein dürfen (d.h.
α = 0.5).
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
69 / 265
Maßzahlen für einzelne Merkmale
5.1 Lagemaße
Arithmetisches Mittel (Mittelwert)
Definition
Das arithmetische Mittel ist der ungewichtete Durchschnittswert aller
Beobachtungen
N
1 X
xi
X̄ =
N i=1
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
70 / 265
Maßzahlen für einzelne Merkmale
5.1 Lagemaße
Geometrisches Mittel
Definition
Das geometrische Mittel berechnet sich als
v
! N1
uN
N
uY
Y
N
t
xi =
xi
X̄G =
i=1
Prof. Dr. Michael Berlemann (HSU)
i=1
Empirische Wirtschaftsforschung
FT 2010
71 / 265
Maßzahlen für einzelne Merkmale
5.1 Lagemaße
Geometrisches Mittel: Datenbeispiel
Jahr
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
Wachstumsrate
Bruttoinlandsprodukt
0.13%
2.02%
2.79%
1.51%
2.97%
2.38%
0.15%
3.21%
1.49%
2.16%
1.81%
0.87%
1.15%
3.29%
Prof. Dr. Michael Berlemann (HSU)
Wachstum zur
Basis 1995
1.001
1.022
1.050
1.066
1.097
1.124
1.125
1.161
1.179
1.204
1.226
1.237
1.251
1.292
Empirische Wirtschaftsforschung
X̄G
1.018
FT 2010
72 / 265
Maßzahlen für einzelne Merkmale
5.1 Lagemaße
Harmonisches Mittel
Definition
Das harmonische Mittel lässt sich berechnen als
PK
ω1 + ω2 + ... + ωK
i=1 ωi
X̄H = ω1
ωK = PK
ω2
ωi
x1 + x2 + ... + xK
i=1 ωi xi
ωi
Prof. Dr. Michael Berlemann (HSU)
=
Ni
N
Empirische Wirtschaftsforschung
FT 2010
73 / 265
Maßzahlen für einzelne Merkmale
5.1 Lagemaße
Harmonisches Mittel: Datenbeispiel
Land
1
2
3
4
5
6
7
8
9
10
BIP
pro Kopf
23456
21473
16873
31274
28736
21538
19836
11837
34263
20001
Gesamtbevölkerung:
Prof. Dr. Michael Berlemann (HSU)
Bevölkerung
(in Mio.)
12.34
33.32
17.56
76.23
198.23
22.34
44.32
4.32
51.75
98.62
Gewicht
0.022
0.060
0.031
0.136
0.355
0.040
0.079
0.008
0.093
0.176
Gewicht ·
BIP/Kopf
517.77
1279.86
530.01
4264.56
10189.68
860.70
1572.60
91.47
3171.76
3528.43
X̄H
26006.85
559.030
Empirische Wirtschaftsforschung
FT 2010
74 / 265
Maßzahlen für einzelne Merkmale
5.2 Streuungsmaße
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
75 / 265
Maßzahlen für einzelne Merkmale
5.2 Streuungsmaße
Spannweite
Definition
Bei einer der Größe nach geordneten Beobachtungsreihe berechnet sich
die Spannweite S als
S = xN − x1
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
76 / 265
Maßzahlen für einzelne Merkmale
5.2 Streuungsmaße
Quartilsabstand
Definition
Der Quartilsabstand misst die Differenz zwischen dem oberen und dem
unteren Quartilswert und somit den zentralen Teil der Verteilung der
Beobachtungen:
dQ = x̃0,75 − x̃0,25
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
77 / 265
Maßzahlen für einzelne Merkmale
5.2 Streuungsmaße
Varianz und Standardabweichung
Definition
Die Varianz misst die mittlere quadratische Abweichung der
beobachteten Merkmalsausprägungen vom arithmetischen Mittel
N
1 X
V ar[X] = σ =
·
(xi − X̄)2
N i=1
2
Definition
Die Standardabweichung ergibt sich als Wurzel aus der Varianz
v
u
N
u1 X
t
Stdabw[X] = σ =
·
(xi − X̄)2
N i=1
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
78 / 265
Maßzahlen für einzelne Merkmale
5.3 Schiefe, Wölbung und Exzess
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
79 / 265
Maßzahlen für einzelne Merkmale
5.3 Schiefe, Wölbung und Exzess
Schiefe
Definition
Die Schiefe einer Verteilung ist definiert als
1
g1 = rN
1
N
Prof. Dr. Michael Berlemann (HSU)
·
PN
− X̄)3
PN
− X̄)2
·
i=1 (xi
i=1 (xi
Empirische Wirtschaftsforschung
3
FT 2010
80 / 265
Maßzahlen für einzelne Merkmale
5.3 Schiefe, Wölbung und Exzess
Wölbung (Kurtosis)
Definition
Die Wölbung (Kurtosis) einer Verteilung ist definiert als
1
N
g2 = r
Prof. Dr. Michael Berlemann (HSU)
1
N
·
PN
− X̄)4
PN
− X̄)2
·
i=1 (xi
i=1 (xi
Empirische Wirtschaftsforschung
4
FT 2010
81 / 265
Maßzahlen für einzelne Merkmale
5.3 Schiefe, Wölbung und Exzess
Exzess
Definition
Der Exzess einer Verteilung misst die Abweichung einer empirischen
Verteilung von der Normalverteilung mit gleichem arithmetischen Mittel
und gleicher Varianz:
g3 = g2 − 3
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
82 / 265
Maßzahlen für einzelne Merkmale
5.4 Konzentrationsmaße
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
83 / 265
Maßzahlen für einzelne Merkmale
5.4 Konzentrationsmaße
Lorenzkurve
Berechnung der Lorenzkurve
1
Ordnung der Beobachtungen nach ihrer Größe, wobei mit dem kleinsten
Wert begonnen wird.
2
Berechnung der Gesamtsumme aller Merkmalswerte:
N
X
xi = n · X̄
i=1
3
Berechnung der kumulierten Summe der Beobachtungen für jede
Merkmalsausprägung, Bildung der Relation zur Gesamtsumme der
Beobachtungen:
Pi
j=1
x(j)
j=1
x(j)
υi = PN
4
mit i = 1, ..., N υ0 := 0
Wiederholung des Vorgehens für den Fall einer Gleichverteilung mit
identischer Gesamtsumme der Beobachtungen.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
84 / 265
Maßzahlen für einzelne Merkmale
5.4 Konzentrationsmaße
Lorenzkurve: Zahlenbeispiel
Haushalt
1
2
3
4
5
6
7
8
9
10
Summe
Tatsächliche Verteilung
Eink.
Kumul.
Eink. kumul.
Anteil
0
0
0
150
150
0,03
240
390
0,08
270
660
0,14
300
960
0,21
400
1360
0,29
670
2030
0,43
800
2830
0,6
800
3630
0,78
1050
4680
1
4680
Prof. Dr. Michael Berlemann (HSU)
Gleichverteilung
Eink.
Kumul.
Eink. kumul.
Anteil
468
468
0,1
468
936
0,2
468
1404
0,3
468
1872
0,4
468
2340
0,5
468
2808
0,6
468
3276
0,7
468
3744
0,8
468
4212
0,9
468
4680
1
4680
Empirische Wirtschaftsforschung
FT 2010
85 / 265
Maßzahlen für einzelne Merkmale
5.4 Konzentrationsmaße
Lorenzkurve: Grafische Darstellung
5000
4500
kumuliertes Einkommen
k
4000
3500
3000
2500
2000
1500
1000
500
0
0,00
1
2
3
4
5
6
7
8
9
10
Haushalt
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
86 / 265
Maßzahlen für einzelne Merkmale
5.4 Konzentrationsmaße
Gini-Koeffizient
Definition
Der Gini-Koeffizient lässt sich berechnen als
G=1−
Prof. Dr. Michael Berlemann (HSU)
N
1 X
·
(υi−1 + υi )
N i=1
Empirische Wirtschaftsforschung
FT 2010
87 / 265
Maßzahlen für einzelne Merkmale
Literaturhinweise
Literaturhinweise zum 5. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
88 / 265
Maßzahlen für einzelne Merkmale
Literaturhinweise
Literaturhinweise zum 5. Kapitel
Toutenburg, H. und C. Heumann (2006): Deskriptive Statistik. Eine
Einführung in Methoden und Anwendungen mit SPSS, 5. Auflage,
Springer-Verlag, Berlin [insbes. Kapitel 3].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
89 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6. Maßzahlen für den Zusammenhang zwischen
Merkmalen
6.1
6.2
6.3
6.4
Verteilung zweidimensionaler Merkmale
Zusammenhang nominaler Merkmale
Zusammenhang ordinaler Merkmale
Zusammenhang stetiger Merkmale
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
90 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6.1 Verteilung zweidimensionaler Merkmale
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
91 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6.1 Verteilung zweidimensionaler Merkmale
Beispiel Scatterplot
50 000
45 000
40 000
Y
35 000
30 000
25 000
20 000
15 000
10 000
10 000
12 000
14 000
16 000
18 000
20 000
22 000
24 000
26 000
28 000
30 000
X
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
92 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6.2 Zusammenhang nominaler Merkmale
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
93 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6.2 Zusammenhang
nominaler Merkmale
2
Pearsons χ -Statistik
Definition
Die χ2 -Statistik berechnet sich als

K X
L
X
χ2 = N · 
i=1 j=1
Ni+
=
L
X

2
Ni,j
− 1
Ni+ · N+j
Ni,j
j=1
Nj+
=
K
X
Ni,j
i=1
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
94 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6.3 Zusammenhang ordinaler Merkmale
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
95 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6.3 Zusammenhang ordinaler Merkmale
Rangkorrelationskoeffizient von Spearman
Definition
Für den Fall, dass keine Bindungen auftreten, lautet der
Rangkorrelationskoeffizient von Spearman:
R=1−
Prof. Dr. Michael Berlemann (HSU)
6·
PN
i=1 (R(xi ) − R(yi ))
N · (N 2 − 1)
Empirische Wirtschaftsforschung
FT 2010
96 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6.4 Zusammenhang stetiger Merkmale
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
97 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6.4 Zusammenhang stetiger Merkmale
Kovarianz
Definition
Das einfachste Maß des Zusammenhangs der Ausprägungen zweier
stetiger Merkmale, die Kovarianz, ist definiert als
Cov[X, Y ] =
Prof. Dr. Michael Berlemann (HSU)
N
1 X
·
(xi − X̄) · (yi − Ȳ )
N i=1
Empirische Wirtschaftsforschung
FT 2010
98 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6.4 Zusammenhang stetiger Merkmale
positive Kovarianz
50 000
45 000
40 000
Y
35 000
30 000
25 000
20 000
15 000
10 000
10 000
12 000
14 000
16 000
18 000
20 000
22 000
24 000
26 000
28 000
30 000
X
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
99 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6.4 Zusammenhang stetiger Merkmale
negative Kovarianz
60 000
55 000
50 000
45 000
Y
40 000
35 000
30 000
25 000
20 000
15 000
10 000
4,0
6,0
8,0
10,0
12,0
14,0
16,0
18,0
20,0
X
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
100 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6.4 Zusammenhang stetiger Merkmale
keine Kovarianz
6000000
5000000
Y
4000000
3000000
2000000
1000000
0
4,0
6,0
8,0
10,0
12,0
14,0
16,0
18,0
20,0
X
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
101 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
6.4 Zusammenhang stetiger Merkmale
Korrelationskoeffizient nach Bravais-Pearson
Definition
Der Korrelationskoeffizient von Bravais-Pearson ist definiert als
PN
(xi − X̄) · (yi − Ȳ )
Corr[X, Y ] = r = qP i=1
PN
N
2
2
i=1 (xi − X̄) ·
i=1 (yi − Ȳ )
=
Prof. Dr. Michael Berlemann (HSU)
Cov[X, Y ]
p
V ar[X] · V ar[Y ]
Empirische Wirtschaftsforschung
FT 2010
102 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
Literaturhinweise
Literaturhinweise zum 6. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
103 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
Literaturhinweise
Literaturhinweise zum 6. Kapitel
Duller, C. (2006): Einführung in die Statistik mit EXCEL und SPSS. Ein
anwendungsorientiertes Lehr- und Arbeitsbuch, Physica-Verlag,
Heidelberg [insbes. Kapitel 8].
Toutenburg, H. und C. Heumann (2006): Deskriptive Statistik. Eine
Einführung in Methoden und Anwendungen mit SPSS, 5. Auflage,
Springer-Verlag, Berlin [insbes. Kapitel 4].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
104 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
Übung
Übungsaufgaben zu den Kapiteln 4 bis 6
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
105 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
Übung
Übungsaufgaben zu den Kapiteln 4 bis 6
Verwendet wird der ”Datensatz 1”. Dieser enthält für alle NUTS-II-Regionen
in Deutschland das verfügbare Einkommen (Yv ), das
Bruttoinlandsprodukt(Y ), die Arbeitslosenquote (U ), die Einwohnerzahl (E)
sowie eine nominale Variable, die den Wert ’1’ annimmt, wenn es sich um eine
ostdeutsche und ’0’, wenn es sich um eine westdeutsche Region handelt.
1
Erstellen Sie ein EViews-Workfile mit den relevanten Daten.
2
Generieren Sie neue Variablen, die das verfügbare Einkommen pro Kopf
(yv ) und das Bruttoinlandsprodukt pro Kopf y enthalten.
3
Stellen Sie in Excel die Lorenzkurve des verfügbaren Einkommens pro
Kopf dar.
4
Stellen Sie die empirische Verteilung von y und U mit Hilfe eines
Histogramms dar und bestimmen Sie in EViews den Mittelwert, die
Varianz, die Spannweite, die Schiefe und die Wölbung.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
106 / 265
Maßzahlen für den Zusammenhang zwischen Merkmalen
Übung
Übungsaufgaben zu den Kapiteln 4 bis 6
5
Vergleichen Sie die Mittelwerte des verfübaren Einkommens der
NUTS-II-Regionen in Ost- und Westdeutschland.
6
Stellen Sie die Variaben (i) U und yv sowie (ii) y und E mit Hilfe eines
Scatterplots gegenüber und bestimmen Sie für beide Fälle die Kovarianz
und die Korrelationskoeffizienten nach Bravais-Pearson.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
107 / 265
Zufallsvariablen und deren Eigenschaften
7. Zufallsvariablen und deren Eigenschaften
7.1
7.2
7.3
7.4
Zufallsvariablen und deren Wahrscheinlichkeitverteilung
Mittelwert, Standardabweichung und Varianz von Zufallsvariablen
Unabhängigkeit von Zufallsvariablen
Einige wichtige Verteilungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
108 / 265
Zufallsvariablen und deren Eigenschaften
7.1 Zufallsvariablen und deren
Wahrscheinlichkeitverteilung
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
109 / 265
Zufallsvariablen und deren Eigenschaften
7.1 Zufallsvariablen und Wahrscheinlichkeitverteilung
Wahrscheinlichkeitsverteilung von diskreten Zufallsvariablen
Definition
Für eine diskrete Zufallsvariable X ist der Wert der
Wahrscheinlichkeitsfunktion f (x) die Wahrscheinlichkeit, dass die
Zufallsvariable X gerade die Ausprägung x annimmt:
f (x) = P (X = x) mit 0 ≤ f (x) ≤ 1
Für die Summe der Eintrittswahrscheinlichkeiten der einzelnen Zustände
j (Anzahl der Ausprägungen: J) muss gelten:
J
X
f (xj ) = 1 ⇔ f (x1 ) + f (x2 ) + ... + f (xJ ) = 1
j=1
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
110 / 265
Zufallsvariablen und deren Eigenschaften
7.1 Zufallsvariablen und Wahrscheinlichkeitverteilung
Wahrscheinlichkeitsverteilung von stetigen Zufallsvariablen
Eigenschaften von Dichtefunktionen stetiger Zufallsvariablen
Die Wahrscheinlichkeit dafür, dass eine stetige Zufallsvariable X einen
Wert zwischen x0 und x1 annimmt, lässt sich über die Dichtefunktion
berechnen als:
Z x1
P (x0 ≤ X ≤ x1 ) =
f (x) · dx ≥ 0.
x0
Die Dichtefunktion ist an jeder Stelle positiv:
f (x) ≥ 0.
Zudem muss das Integral über die Dichtefunktion stets eins betragen:
Z ∞
f (x) · dx = 1.
−∞
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
111 / 265
Zufallsvariablen und deren Eigenschaften
7.1 Zufallsvariablen und Wahrscheinlichkeitverteilung
Wahrscheinlichkeitsverteilung von stetigen Zufallsvariablen
Definition
Die kumulierte Dichtefunktion an der Stelle x1 ist definiert als
Z x1
F (x1 ) = P (X ≤ x1 ) =
f (x) · dx
−∞
Die Ableitung der kumulierten Dichtefunktion an der Stelle x1 ist
gerade der Wert der Dichtefunktion an der Stelle x1 :
f (x1 ) =
Prof. Dr. Michael Berlemann (HSU)
dF (x1 )
dx
Empirische Wirtschaftsforschung
FT 2010
112 / 265
Zufallsvariablen und deren Eigenschaften
7.1 Zufallsvariablen und Wahrscheinlichkeitverteilung
Dichtefunktion einer hypothetischen,
hypothetischen stetigen
Zufallsvariable
Dichtefunktion einer hypothetischen, stetigen Zufallsvariable
Wert der
Dichtefunktion
Wahrscheinlichkeit für Ausprägungen
der Zufallsvariable zwischen X0 und X1.
X0
FT 2009
X1
Ausprägungen
Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung"
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
169
FT 2010
113 / 265
Zufallsvariablen und deren Eigenschaften
7.1 Zufallsvariablen und Wahrscheinlichkeitverteilung
Kumulierte Dichtefunktion einer hypothetischen,
hypothetischen
stetigen Zufallsvariable
Kumulierte Dichtefunktion einer hypothetischen, stetigen Zufallsvariable
1
Wert der VerteiVertei
lungsfunktion
X0
FT 2009
X1
Ausprägungen
Prof. Dr. M. Berlemann: Vorlesung "Empirische Wirtschaftsforschung"
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
170
FT 2010
114 / 265
Zufallsvariablen und deren Eigenschaften
7.2 Mittelwert, Standardabweichung und Varianz
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
115 / 265
Zufallsvariablen und deren Eigenschaften
7.2 Mittelwert, Standardabweichung und Varianz
Erwartungswert einer Zufallsvariablen
Definition
Bei diskrete Zufallsvariablen kann der Erwartungswert als Summe
der mit den Eintrittswahrscheinlichkeiten gewichteten Zustände berechnet
werden:
J
J
X
X
E[X] =
xj · P (X = xj ) =
xj · f (xj )
j=1
j=1
Definition
Bei stetigen Zufallsvariablen errechnet sich der Erwartungswert als
Integral über die mit den Zuständen multiplizierte Dichtefunktion
Z ∞
x · f (x) · dx
E[X] =
−∞
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
116 / 265
Zufallsvariablen und deren Eigenschaften
7.2 Mittelwert, Standardabweichung und Varianz
Varianz einer Zufallsvariablen
Definition
Die Varianz einer diskreten Zufallsvariable berechnet sich als
V ar[X] =
2
σX
=
J
X
2
P (X = xj ) · (xj − E[X]) =
j=1
J
X
f (xj ) · (xj − E[X])2
j=1
Definition
Die Varianz einer stetigen Zufallsvariable ergibt sich als
Z ∞
2
V ar[X] = σX
=
(xj − E[x])2 · f (x) · dx
−∞
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
117 / 265
Zufallsvariablen und deren Eigenschaften
7.2 Mittelwert, Standardabweichung und Varianz
Standardabweichung einer Zufallsvariablen
Definition
Die Standardabweichung einer diskreten Zufallsvariable ergibt sich
als Quadratwurzel aus der Varianz
q
p
2
Stdabw[X] = σX = V ar[X] = σX
Definition
Die Standardabweichung einer stetigen Zufallsvariable berechnet
sich als Quadratwurzel aus der Varianz
q
p
2
Stdabw[X] = σX = V ar[X] = σX
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
118 / 265
Zufallsvariablen und deren Eigenschaften
7.3 Unabhängigkeit von Zufallsvariablen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
119 / 265
Zufallsvariablen und deren Eigenschaften
7.3 Unabhängigkeit von Zufallsvariablen
Kovarianz von Zufallsvariablen
Definition
Für diskrete Zufallsvariablen X und Y mit der gemeinsamen
Wahrscheinlichkeitsfunktion f (x, y) ist die Kovarianz definiert als
Cov(X, Y ) =
J X
K
X
(xj − E[X]) · (yk − E[Y ]) · f (X = xj , Y = yk )
j=1 k=1
Definition
Für stetige Zufallsvariablen X und Y mit der gemeinsamen
Dichtefunktion f (x, y) ist die Kovarianz definiert als
Z ∞Z ∞
(x − E[X]) · (y − E[Y ]) · f (x, y) · dx · dy
Cov(X, Y ) =
−∞
Prof. Dr. Michael Berlemann (HSU)
−∞
Empirische Wirtschaftsforschung
FT 2010
120 / 265
Zufallsvariablen und deren Eigenschaften
7.3 Unabhängigkeit von Zufallsvariablen
Korrelationskoeffizient von Zufallsvariablen
Definition
Der Korrelationskoeffizient (nach Bravais-Pearson) zweier
Zufallsvariablen X und Y ist definiert als
Corr(X, Y ) = p
Prof. Dr. Michael Berlemann (HSU)
Cov(X, Y )
V ar[X] · V ar[Y ]
Empirische Wirtschaftsforschung
FT 2010
121 / 265
Zufallsvariablen und deren Eigenschaften
7.4 Einige wichtige Verteilungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
122 / 265
Zufallsvariablen und deren Eigenschaften
7.4 Einige wichtige Verteilungen
Stetige Gleichverteilung
0,14
Wert der Dichtefunktion
W
0,12
0,10
0,08
0,06
0,04
0,02
0,00
0
1
2
3
4
5
6
7
8
9
10
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
123 / 265
Zufallsvariablen und deren Eigenschaften
7.4 Einige wichtige Verteilungen
Stetige Gleichverteilung
Wert d
der kumulierten Dichtefunktion
1,20
1,00
0,80
0,60
0,40
0,20
0,00
0
1
2
3
4
5
6
7
8
9
10
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
124 / 265
Zufallsvariablen und deren Eigenschaften
7.4 Einige wichtige Verteilungen
Normalverteilung
Definition
Eine normalverteilte Zufallsvariable mit dem Erwartungswert µX
2
und der Varianz σX
2
X ∼ N (µX , σX
)
hat die über den gesamten reellen Wertebereich definierte
Dichtefunktion:
f (x) =
Prof. Dr. Michael Berlemann (HSU)
σX ·
1
√
x−µX 2
−0.5·
σ
2·π
·e
Empirische Wirtschaftsforschung
X
FT 2010
125 / 265
Zufallsvariablen und deren Eigenschaften
7.4 Einige wichtige Verteilungen
Normalverteilung: N (µ = 5, σ = 0, 5)
0,90
0,80
Wert der Dichtefunktion
W
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,00
0
1
2
3
4
5
6
7
8
9
10
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
126 / 265
Zufallsvariablen und deren Eigenschaften
7.4 Einige wichtige Verteilungen
Normalverteilung: N (µ = 5, σ = 0, 5)
Wert d
der kumulierten Dichtefunktion
1,20
1,00
0,80
0,60
0,40
0,20
0,00
0
1
2
3
4
5
6
7
8
9
10
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
127 / 265
Zufallsvariablen und deren Eigenschaften
7.4 Einige wichtige Verteilungen
Standardnormalverteilung
Definition
Eine Zufallsvariable heisst standardnormalverteilt, wenn sie einer
2
Normalverteilung mit Erwartungswert µX = 0 und einer Varianz σX
=1
folgt:
2
X ∼ N (µX = 0, σX
= 1)
Sie hat dann die Dichtefunktion:
f (x) = √
2
1
· e−0.5·x
2·π
Transformationsregel
Jede normalverteilte Zufallsvariable lässt sich in eine
standardnormalverteilte Zufallsvariable wie folgt transformieren:
Z=
Prof. Dr. Michael Berlemann (HSU)
X − µX
σX
Empirische Wirtschaftsforschung
FT 2010
128 / 265
Zufallsvariablen und deren Eigenschaften
7.4 Einige wichtige Verteilungen
Standardnormalverteilung: N (µ = 0, σ = 1)
0,45
0,40
Wert der Dichtefunktion
W
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
-5
-4
-3
-2
-1
0
1
2
3
4
5
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
129 / 265
Zufallsvariablen und deren Eigenschaften
7.4 Einige wichtige Verteilungen
Standardnormalverteilung: N (µ = 0, σ = 1)
Wert d
der kumulierten Dichtefunktion
1,20
1,00
0,80
0,60
0,40
0,20
0,00
-5
-4
-3
-2
-1
0
1
2
3
4
5
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
130 / 265
Zufallsvariablen und deren Eigenschaften
7.4 Einige wichtige Verteilungen
Exponentialverteilung
Definition
Die Dichtefunktion der Exponentialverteilung ist nur über den
positiven Wertebereich definiert und lautet:
f (x) = λ · e−λ·x für x ≥ 0
Die kumulierte Dichtefunktion der Exponentialverteilung ist gegeben
durch:
Z x
Z x
F (x) =
f (t) · dt =
λ · e−λ·t · dt = −e−λ·x
0
Prof. Dr. Michael Berlemann (HSU)
0
Empirische Wirtschaftsforschung
FT 2010
131 / 265
Zufallsvariablen und deren Eigenschaften
7.4 Einige wichtige Verteilungen
Exponentialverteilung: λ = 0, 75
0,80
0,70
Wert der Dichtefunktion
W
0,60
0,50
0,40
0,30
0,20
0,10
0,00
0
1
2
3
4
5
6
7
8
9
10
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
132 / 265
Zufallsvariablen und deren Eigenschaften
7.4 Einige wichtige Verteilungen
Exponentialverteilung: λ = 0, 75
Wert d
der kumulierten Dichtefunktion
1,20
1,00
0,80
0,60
0,40
0,20
0,00
0
1
2
3
4
5
6
7
8
9
10
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
133 / 265
Zufallsvariablen und deren Eigenschaften
Literaturhinweise
Literaturhinweise zum 7. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
134 / 265
Zufallsvariablen und deren Eigenschaften
Literaturhinweise
Literaturhinweise zum 7. Kapitel
Bamberg, G. und F. Baur (2006): Statistik, 12. Auflage, Oldenbourg
Verlag, München [insbes. Kapitel 8,9].
Bauer, T., M. Fertig und C. Schmidt (2009): Empirische
Wirtschaftsforschung. Eine Einführung, Springer-Verlag, Berlin u.a.
[insbes. Kapitel 1].
Duller, C. (2006): Einführung in die Statistik mit EXCEL und SPSS. Ein
anwendungsorientiertes Lehr- und Arbeitsbuch, Physica-Verlag,
Heidelberg [insbes. Kapitel 11,12].
Mosler, K. und F. Schmid (2008): Wahrscheinlichkeitsrechnung und
schließende Statistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel
1,2].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
135 / 265
Stichproben
8. Stichproben
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
136 / 265
Stichproben
8. Stichproben
Stichprobe und Grundgesamtheit
Alternative Stichprobenverfahren:
Schichtenauswahl
Klumpenauswahl
Quotenstichprobe
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
137 / 265
Stichproben
8. Stichproben
Stichprobenfunktionen und deren Erwartungswerte und Varianzen
Wichtige Stichprobenfunktionen und ihre Momente
Stichprobenfunktion
PN
i=1 xi
P
X̄s = N1 · N
x
√i=1 i
X̄s −µ
·
N
Pσ
1
· N (xi − µ)2
N P i=1
1
· N
(xi − X̄s )2
i=1P
N
1
V ars = n−1 · N
(x − X̄s )2
i=1
√ i
stdabws = V ars
Bezeichnung
Erwartungswert
Varianz
Merkmalssumme
Stichprobenmittel
Gauß-Statistik
MQA bezüglich µ
MQA
Varianz
Stdabw.
N ·µ
µ
0
σ2
N −1
· σ2
N
2
σ
σ
N · σ2
σ2
N
1
MQA: mittlere quadratische Abweichung
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
138 / 265
Stichproben
Literaturhinweise
Literaturhinweise zum 8. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
139 / 265
Stichproben
Literaturhinweise
Literaturhinweise zum 8. Kapitel
Mosler, K. und F. Schmid (2008): Wahrscheinlichkeitsrechnung und
schließende Statistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel
4].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
140 / 265
Grundlagen des Testens von Hypothesen
9. Grundlagen des Testens von Hypothesen
9.1 Hypothesenformulierung
9.2 Testgröße, Prüfgröße, Annahme- und Ablehnungsbereich
9.3 Wichtige Testverteilungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
141 / 265
Grundlagen des Testens von Hypothesen
9.1 Hypothesenformulierung
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
142 / 265
Grundlagen des Testens von Hypothesen
9.1 Hypothesenformulierung
Arbeitshypothese, Nullhypothese und Alternativhypothese
Definition
Als Arbeitshypothese bezeichnet man diejenige Hypothese, die man ex
ante, also vor Durch führung eines Hypothesentests, für korrekt hält.
Definition
Als Nullhypothese (H0 ) formuliert man die Gegenhypothese der
Arbeitshypothese, also gerade das Gegenteil dessen, was man ex ante für
korrekt hält. Mit Hilfe des Hypothesentests versucht man, die
Nullhypothese verwerfen zu können.
Definition
Die Alternativhypothese (HA ) ist die Gegenhypothese der
Nullhypothese. Wird die Nullhypothese verworfen, so erlangt die
Alternativhypothese Gültigkeit. Die Alternativhypothese ist identisch mit
der Arbeitshypothese.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
143 / 265
Grundlagen des Testens von Hypothesen
9.1 Hypothesenformulierung
Fehler 1. und 2. Art
Definition
Wird die Nullhypothese fälschlicherweise abgelehnt, so handelt es sich um
einen sog. Fehler 1. Art.
Definition
Wird hingegen eine Nullhypothese fälschlicherweise angenommen, so
handelt es sich um einen Fehler 2. Art.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
144 / 265
Grundlagen des Testens von Hypothesen
9.1 Hypothesenformulierung
Fehler 1. und 2. Art
Fehler 1. und 2. Art
H0 angenommen
H0 abgelehnt
Prof. Dr. Michael Berlemann (HSU)
H0 korrekt
kein Fehler
Fehler 1. Art
Empirische Wirtschaftsforschung
H0 falsch
Fehler 2. Art
kein Fehler
FT 2010
145 / 265
Grundlagen des Testens von Hypothesen
9.2 Testgröße, Prüfgröße, Annahme- und Ablehnbereich
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
146 / 265
Grundlagen des Testens von Hypothesen
9.2 Testgröße, Prüfgröße, Annahme- und Ablehnbereich
Test
Definition
Als Test bezeichnet man ein Verfahren, um auf Basis der vorliegenden
Stichprobe zu entscheiden, ob die Nullhypothese zugunsten der
Alternativhypothese abgelehnt werden kann oder nicht.
Im Rahmen eines Tests wird zunächst aus den Beobachtungen der
Stichprobe eine Prüfgröße (auch: Testgröße) berechnet.
Fällt die Prüfgröße in den so genannten Ablehnungsbereich, so wird
die Nullhypothese zurück gewiesen, andernfalls beibehalten.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
147 / 265
Grundlagen des Testens von Hypothesen
9.2 Testgröße, Prüfgröße, Annahme- und Ablehnbereich
Verteilung der Testgröße bei alternativen Stichproben
0,30
0,25
0 20
0,20
Verteilungg
der Testgröße
0,15
0,10
0,05
0,00
10,00 10,50 11,00 11,50 12,00 12,50 13,00 13,50 14,00 14,50 15,00 15,50 16,00 16,50 17,00 17,50 18,00 18,50 19,00 19,50 20,00
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
148 / 265
Grundlagen des Testens von Hypothesen
9.2 Testgröße, Prüfgröße, Annahme- und Ablehnbereich
Annahme und Ablehnung bei einseitigen Tests
0,30
0,25
0 20
0,20
Verteilungg
der Testgröße
Wahrscheinlichkeit
eines Fehlers 1. Art
0,15
0,10
Kritischer Wert
0,05
0,00
10,00 10,50 11,00 11,50 12,00 12,50Annahmebereich
13,00 13,50 14,00 14,50 15,00 15,50 16,00 16,50 17,00 Ablehnungsbereich
17,50 18,00 18,50 19,00 19,50 20,00
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
149 / 265
Grundlagen des Testens von Hypothesen
9.2 Testgröße, Prüfgröße, Annahme- und Ablehnbereich
Annahme und Ablehnung bei zweiseitigen Tests
0,30
0,25
0 20
0,20
Verteilungg
der Testgröße
Wahrscheinlichkeit
eines Fehlers 1. Art
0,15
Kritische Werte
0,10
0,05
0,00
Ablehnungsbereich
Ablehnungsbereich
10,00 10,50 11,00
11,50 12,00 12,50 13,00 13,50 14,00 Annahmebereich
14,50 15,00 15,50 16,00 16,50 17,00
17,50 18,00 18,50 19,00 19,50 20,00
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
150 / 265
Grundlagen des Testens von Hypothesen
9.2 Testgröße, Prüfgröße, Annahme- und Ablehnbereich
Irrtumswahrscheinlichkeit und Signifikanzniveau
Definition
Als Signifikanzniveau bezeichnet man die bei einem Hypothesentest
tolerierte Irrtumswahrscheinlichkeit für einen Fehler 1. Art.
Übliche Werte für das Signifikanzniveau sind 10, 5 oder 1%.
Definition
Die Vertrauenswahrscheinlichkeit (Konfidenzniveau) ergibt sich
wenn man die Signifikanznveau von 1 subtrahiert.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
151 / 265
Grundlagen des Testens von Hypothesen
9.3 Wichtige Testverteilungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
152 / 265
Grundlagen des Testens von Hypothesen
9.3 Wichtige Testverteilungen
Überblick
Wichtige Verteilungen von Teststatistiken:
χ2 -Verteilung (Chi-Quadrat-Verteilung)
t-Verteilung
F-Verteilung
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
153 / 265
Grundlagen des Testens von Hypothesen
9.3
Wichtige Testverteilungen
2
χ -Verteilung
Definition
Quadriert und addiert man die N Beobachtungen einer
standardnormalverteilten Zufallsvariablen X (X ∼ N (0, 1)), so folgt das
Ergebnis einer Chi-Quadrat-Verteilung mit N Freiheitsgraden:
N
X
x2i ∼ χ2N
i=1
Die Dichtefunktion der χ2 -Verteilung ist nur über den positiven
Wertebereich definiert.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
154 / 265
Grundlagen des Testens von Hypothesen
9.3 Wichtige Testverteilungen
2
Verteilungsfunktion der χ -Verteilung
1,00
Wert d
der kumulierten Dichtefunktion
0,90
0,80
0,70
0,60
0,50
0,40
0 30
0,30
0,20
0,10
0,00
0
1
2
3
4
5
6
7
8
9
10
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
155 / 265
Grundlagen des Testens von Hypothesen
9.3 Wichtige Testverteilungen
t-Verteilung (Student-Verteilung)
Definition
Seien X und Y zwei stochastisch unabhängige Zufallsvariablen, wobei X
standardnormalverteilt sei (X ∼ N (0, 1)) und Y einer χ2 -Verteilung mit
N Freiheitsgraden folge (Y ∼ χ2N ), so folgt der Quotient
X
q ∼ t(N )
Y
N
einer t-Verteilung mit N Freiheitsgraden.
Die Dichtefunktion der t-Verteilung nur über den positiven Wertebereich
definiert.
Mit einer zunehmenden Anzahl an Freiheitsgraden konvergiert die
t-Verteilung gegen die Normalverteilung (ab N = 30 gute Approximation).
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
156 / 265
Grundlagen des Testens von Hypothesen
9.3 Wichtige Testverteilungen
Verteilungsfunktion der t-Verteilung
Wert d
der kumulierten Dichtefunktion
1,20
1,00
0,80
0,60
0,40
0,20
0,00
-5
-4
-3
-2
-1
0
1
2
3
4
5
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
157 / 265
Grundlagen des Testens von Hypothesen
9.3 Wichtige Testverteilungen
F -Verteilung
Teilt man zwei χ2 -verteilte Zufallsvariablen X ∼ χ2N und Y ∼ χ2M mit N
bzw. M Freiheitsgraden durcheinander
X
N
Y
M
∼ F (N, M )
so erhält man eine F -verteilte Zufallsvariable mit N, M Freiheitsgraden.
Die F -Verteilung ist nur über den positiven Wertebereich definiert.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
158 / 265
Grundlagen des Testens von Hypothesen
9.3 Wichtige Testverteilungen
Verteilungsfunktion der F -Verteilung
Wert d
der kumulierten Dichtefunktion
1,20
1,00
0,80
0,60
0,40
0,20
0,00
0
1
2
3
4
5
6
7
8
9
10
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
159 / 265
Grundlagen des Testens von Hypothesen
Literaturhinweise
Literaturhinweise zum 9. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
160 / 265
Grundlagen des Testens von Hypothesen
Literaturhinweise
Literaturhinweise zum 9. Kapitel
Mosler, K. und F. Schmid (2008): Wahrscheinlichkeitsrechnung und
schließende Statistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel
6].
Sachs, L. und J. Hedderich (2006): Angewandte Statistik, 12. Auflage,
Springer-Verlag, Berlin [insbes. Kapitel 7].
Studenmund, A. H. (2006): Using Econometrics. A Practical Guide, 5th
Edition, Pearson/Addison Welsey, International Edition, Boston [insbes.
Kapitel 5].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
161 / 265
Verteilungstests
10. Verteilungstests
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
162 / 265
Verteilungstests
10. Verteilungstests
In Eviews sind einige empirische Verteilungstests implementiert
Kolmogorov-Smirnov-Test
Lilliefors-Test
Cramer-von Mises-Test
Anderson-Darling-Test
Watson-Test
Mit Hilfe dieser Tests kann u.a. auf folgende Verteilungsformen geprüft
werden:
Normalverteilung
χ2
Gleichverteilung
Exponentialverteilung
Logistische Verteilung
...
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
163 / 265
Verteilungstests
Literaturhinweise
Literaturhinweise zum 10. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
164 / 265
Verteilungstests
Literaturhinweise
Literaturhinweise zum 10. Kapitel
Bühl, A. (2006): SPSS 14. Einführung in die moderne Datenanalyse, 10.
Auflage, Pearson Studium, München u.a. [insbes. Kapitel 13.5].
Sachs, L. und J. Hedderich (2006): Angewandte Statistik.
Methodensammlung mit R, 12. Auflage, Springer Verlag, Berlin u.a.
[insbes. Kapitel 7.2].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
165 / 265
Mittelwert-Tests
11. Mittelwert-Tests
11.1
11.2
11.3
11.4
11.5
Grundlagen
Gauß-Mittelwert-Test bei einer Stichprobe
t-Test auf Mittelwert bei einer Stichprobe
Gauß-Mittelwert-Test bei zwei Stichproben
t-Test auf Mittelwert bei zwei Stichproben
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
166 / 265
Mittelwert-Tests
Grundlagen
11.1 Grundlagen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
167 / 265
Mittelwert-Tests
Grundlagen
11.1 Grundlagen
Typen von Mittelwerttests
1
Überprüfung von Hypothesen über den Mittelwert einer Grundgesamtheit
auf der Basis einer einzigen Stichprobe.
2
Überprüfung von Hypothesen über die Relation zweier Mittelwerte
unterschiedlicher Grundgesamtheiten auf der Basis zweier unabhängiger
Stichproben.
3
Überprüfung von Hypothesen über die Relation zweier Mittelwerte aus
abhängigen (verbundenen) Stichproben.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
168 / 265
Mittelwert-Tests
Grundlagen
11.1 Grundlagen
Zentraler Grenzwertsatz
Zentraler Grenzwertsatz
Bei einer großen Anzahl von Beobachtungen folgt jede zufällige Auswahl
einer Stichprobe aus einer beliebig verteilten Grundgesamtheit einer
Normalverteilung
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
169 / 265
Mittelwert-Tests
Grundlagen
11.1 Grundlagen
Behandelte Testtypen
Parametrische Mittelwert-Tests bei normalverteilter Grundgesamtheit:
1
Gauß-Test:
Dieser Test kann verwendet werden, wenn die Varianz der
Grundgesamtheit bekannt ist.
2
T-Test:
Dieser Test kann verwendet werden, wenn die Varianz der
Grundgesamtheit nicht bekannt ist.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
170 / 265
Mittelwert-Tests
11.2 Gauß-Mittelwert-Test bei einer Stichprobe
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
171 / 265
Mittelwert-Tests
11.2 Gauß-Mittelwert-Test bei einer Stichprobe
(Zweiseitiges) Testproblem beim Gauß-Test:
Nullhypothese H0 : µ = µ0
Alternativhypothese HA : µ 6= µ0
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
172 / 265
Mittelwert-Tests
11.2 Gauß-Mittelwert-Test bei einer Stichprobe
Testgröße des Gauß-Tests:
Beim Gauß-Test wird das standardisierte Stichprobenmittel als Testgröße
verwendet:
√
(X̄ − µ0 ) · N
T (x1 , x2 , ..., xN ) =
σ
Falls die Nullhypothese zutrifft, gilt µ = µ0 und damit auch:
√
√
(X̄ − µ0 ) · N
(X̄ − µ) · N
=
∼ N (0, 1)
σ
σ
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
173 / 265
Mittelwert-Tests
11.2 Gauß-Mittelwert-Test bei einer Stichprobe
0,45
0,40
Wert der Dichtefunktion
W
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
-5
-4
-3
-2
-1
0
1
2
3
4
5
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
174 / 265
Mittelwert-Tests
11.2 Gauß-Mittelwert-Test bei einer Stichprobe
Ablehnungsbereich
Ablehnungsbereich des Gauß-Tests:
Die Nullhypothese wird zurück gewiesen, wenn der Betrag der Testgröße
einen kritischen Wert k überschreitet:
(X̄ − µ ) · √N 0
>k
σ
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
175 / 265
Mittelwert-Tests
11.2 Gauß-Mittelwert-Test bei einer Stichprobe
Einstichproben-Gauß-Test
0,45
0,40
Wert der Dichtefunktion
W
0,35
Kritische Werte
0,30
0,25
0,20
0,15
0,10
α/2
α/2
0,05
0,00
-5
-4
-3
-2
-1
0
1
2
3
4
5
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
176 / 265
Mittelwert-Tests
11.2 Gauß-Mittelwert-Test bei einer Stichprobe
Einstichproben-Gauß-Test: Zusammenfassung
Testgrößen und Ablehnungsbereiche beim Gauß-Test:
Annahmen:
H0 :
HA :
Prüfgröße
H0 wird
abgelehnt,
wenn:
Grundgesamtheit normalverteilt, µ unbekannt, σ bekannt
µ = µ0
µ ≤ µ0
µ ≥ µ0
µ 6= µ0
µ > µ0 √
µ < µ0
T = (X̄−µσ0 )· N
|T | größer als
T größer als
T kleiner als
(1 − 0, 5 · α)-Quantil (1 − α)-Quantil (1 − α)-Quantil·(−1)
der Normalverteilung (N-1 Freiheitsgrade)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
177 / 265
Mittelwert-Tests
11.3 t-Test auf Mittelwert bei einer Stichprobe
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
178 / 265
Mittelwert-Tests
11.3 t-Test auf Mittelwert bei einer Stichprobe
(Zweiseitiges) Testproblem beim t-Test:
Nullhypothese H0 : µ = µ0
Alternativhypothese HA : µ 6= µ0
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
179 / 265
Mittelwert-Tests
11.3 t-Test auf Mittelwert bei einer Stichprobe
Testgröße des t-Tests:
Beim t-Test wird wiederum das standardisierte Stichprobenmittel als
Testgröße verwendet:
√
√
(X̄ − µ0 ) · N
(X̄ − µ0 ) · N
qP
∼ t(N − 1)
T (x1 , x2 , · · · , xN ) = p
=
N
1
V ar[X]
2
(x
−
X̄)
i
i=1
N −1
(1)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
180 / 265
Mittelwert-Tests
11.3 t-Test auf Mittelwert bei einer Stichprobe
Einstichproben-t-Test: Zusammenfassung
Testgrößen und Ablehnungsbereiche beim t-Test:
Annahmen:
H0 :
HA :
Prüfgröße:
Grundgesamtheit normalverteilt, µ unbekannt, σ unbekannt
µ = µ0
µ ≤ µ0
µ ≥ µ0
µ 6= µ0
µ > µ0 √
µ < µ0
√ 0 )· N
T = (X̄−µ
H0 wird
abgelehnt,
wenn:
|T | größer als
T größer als
T kleiner als
(1 − 0, 5 · α)-Quantil (1 − α)-Quantil (1 − α)-Quantil·(−1)
der t-Verteilung (N-1 Freiheitsgrade)
V ar[X]
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
181 / 265
Mittelwert-Tests
11.4 Gauß-Mittelwert-Test bei zwei Stichproben
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
182 / 265
Mittelwert-Tests
11.4 Gauß-Mittelwert-Test bei zwei Stichproben
(Zweiseitiges) Testproblem beim Gauß-Test:
Nullhypothese H0 : µX = µY
Alternativhypothese HA : µX 6= µY
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
183 / 265
Mittelwert-Tests
11.4 Gauß-Mittelwert-Test bei zwei Stichproben
Testgröße des Gauß-Tests:
Beim Zweistichproben-Gauß-Test wird die Differenz der arithmetischen
Mittel aus den beiden Stichproben verwendet:
X̄ − Ȳ
T (x1 , x2 , ..., xN , y1 , y2 , ..., yM ) = q 2
2
σX
σY
N + M
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
184 / 265
Mittelwert-Tests
11.4 Gauß-Mittelwert-Test bei zwei Stichproben
Testgröße des Gauß-Tests:
Da die beiden Zufallsvariablen annahmegemäß stochastisch unabhängig
sind, gilt
(X̄ − Ȳ ) − (µX − µY )
q 2
2
σX
σY
N + M
Sind die tatsächlichen Mittelwerte beider Grundgesamtheiten gleich groß,
d.h. µX = µY , so gilt auch
(X̄ − Ȳ )
q 2
∼ N (0, 1)
2
σX
σY
+
N
M
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
185 / 265
Mittelwert-Tests
11.4 Gauß-Mittelwert-Test bei zwei Stichproben
Testgrößen und Ablehnungsbereiche beim Gauß-Test:
Annahmen:
H0 :
HA :
Prüfgröße:
Grundges. normalvert., µ unbekannt, σ bekannt, unabhängig
µX = µY
µX ≤ µ Y
µX ≥ µY
µX 6= µY
µX > µ Y
µX < µ Y
(X̄−Ȳ )
r
T =
2
2
H0 wird
abgelehnt,
wenn
|T | größer als
T größer als
T kleiner als
(1 − 0, 5 · α)-Quantil (1 − α)-Quantil (1 − α)-Quantil·(−1)
der Standardnormalverteilung
σ
X
N
Prof. Dr. Michael Berlemann (HSU)
σ
Y
+ M
Empirische Wirtschaftsforschung
FT 2010
186 / 265
Mittelwert-Tests
11.5 t-Test auf Mittelwert bei zwei Stichproben
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
187 / 265
Mittelwert-Tests
11.5 t-Test auf Mittelwert bei zwei Stichproben
(Zweiseitiges) Testproblem beim t-Test:
Nullhypothese H0 : µX = µY
Alternativhypothese HA : µX 6= µY
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
188 / 265
Mittelwert-Tests
11.5 t-Test auf Mittelwert bei zwei Stichproben
Testgröße des t-Tests:
Beim t-Test lautet das standardisierte Stichprobenmittel, welches wieder
als Testgröße verwendet wird:
p
N · M · (N + M − 2)
T =
N +M
X̄ − Ȳ
−p
∼ t(N + M − 2)
(N − 1) · V ar[X] + (M − 1) · V ar[Y ]
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
189 / 265
Mittelwert-Tests
11.5 t-Test auf Mittelwert bei zwei Stichproben
Testgrößen und Ablehnungsbereiche beim t-Test:
Annahmen:
H0 :
HA :
Prüfgröße:
H0 wird
abgelehnt,
wenn
Grundges. normalvert., µ unbekannt, σ unbekannt, unabhängig
µX = µY
µX ≤ µY
µX ≥ µY
µX 6=√
µY
µX > µ Y
µX < µ Y
T =
N ·M ·(N +M −2)
N +M
−√
X̄−Ȳ
(N −1)·V ar[X]+(M −1)·V ar[Y ]
|T | größer als
T größer als
T kleiner als
(1 − 0, 5 · α)-Quantil (1 − α)-Quantil (1 − α)-Quantil·(−1)
der t-Verteilung mit N+M-2 Freiheitsgraden
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
190 / 265
Mittelwert-Tests
Literaturhinweise
Literaturhinweise zum 11. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
191 / 265
Mittelwert-Tests
Literaturhinweise
Literaturhinweise zum 11. Kapitel
Bühl, A. (2006): SPSS 14. Einführung in die moderne Datenanalyse, 10.
Auflage, Pearson Studium, München u.a. [insbes. Kapitel 12].
Mosler, K. und F. Schmid (2008): Wahrscheinlichkeitsrechnung und
schließende Statistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel
6].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
192 / 265
Lineare Einfachregression
12. Lineare Einfachregression
12.1 Idee des Regressionsansatzes
12.2 Die Methode der kleinsten Quadrate
12.3 Beurteilung der Güte einer Regression
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
193 / 265
Lineare Einfachregression
12.1 Idee des Regressionsansatzes
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
194 / 265
Lineare Einfachregression
12.1 Idee des Regressionsansatzes
Lineare Einfachregression
Geradengleichung
Y = β0 + β1 · X
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
195 / 265
Lineare Einfachregression
12.1 Idee des Regressionsansatzes
Tausende
Beispiel lineare Einfachregression
50
45
BIP/Kopf (2006)
40
35
30
25
20
15
14
15
16
17
18
19
20
Verfügbares Einkommen/Kopf (2006)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
21
22
23
24
Tausende
FT 2010
196 / 265
Lineare Einfachregression
12.1 Idee des Regressionsansatzes
Lineare Einfachregression
180,0
160 0
160,0
Y = 10 + 1,5 ⋅ X
zu erklärend
de Variable (Y)
140,0
Steigung = β1 = ΔY/ΔX
120,0
100,0
Achsenabschnitt = β0 = 10
80,0
ΔY
60,0
ΔX
40,0
20,0
00
0,0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
erklärende Variable (X)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
197 / 265
Lineare Einfachregression
12.2 Methode der kleinsten Quadrate
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
198 / 265
Lineare Einfachregression
12.2 Methode der Kleinsten Quadrate
Regressionsgleichung
Die Regressionsgleichung einer linearen Einfachregression lautet:
y i = β0 + β1 · x i + i
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
199 / 265
Lineare Einfachregression
12.2 Methode der Kleinsten Quadrate
Nicht-erklärte Residuen
180,0
160 0
160,0
zu erklärend
de Variable (Y)
140,0
120,0
100,0
80,0
60,0
ε1
40,0
ε2
20,0
0,0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
erklärende Variable (X)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
200 / 265
Lineare Einfachregression
12.2 Methode der Kleinsten Quadrate
Prognosegleichung
Die geschätzten Regressionsparameter können verwendet werden, um
unter Vorgabe der erklärenden Variable Schätzwerte für die zu erklärende
Variable zu berechnen:
ŷi = β̂0 + β̂1 · xi
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
201 / 265
Lineare Einfachregression
12.2 Methode der Kleinsten Quadrate
OLS-Methode
OLS-Schätzung
Mit Hilfe der OLS-Methode werden die Schätzwerte nun so berechnet,
dass dabei die Summe der quadrierten Residuen minimiert wird:
!
N
N
X
X
min
i =
(yi − ŷi )
β0 ,β1
i=1
i=1
wobei N die Anzahl der Beobachtungen darstellt.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
202 / 265
Lineare Einfachregression
12.2 Methode der Kleinsten Quadrate
OLS-Schätzer
OLS-Schätzung
Unter Verwendung der OLS-Technik ergeben sich die beiden
Schätzparameter als:
β̂1 =
Cov[X, Y ]
=
V ar[X]
PN
i=1 (xi − X̄) · (yi −
PN
2
i=1 (xi − X̄)
Ȳ )
β̂0 = Ȳ − β̂1 · X̄
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
203 / 265
Lineare Einfachregression
12.2 Methode der Kleinsten Quadrate
Gauß-Markov-Bedingungen (Teil 1):
Es handelt sich um ein korrekt spezifiziertes (es fehlt keine wichtige erklärende
Variable) lineares Regressionsmodell des Typs:
yi = β0 + β1 · xi + i
Der Störterm hat den Mittelwert null:
E[yi ] = E[β0 + β1 · xi ] ⇒ E[i ] = 0
Es gibt keine serielle Korrelation der Störterme (und damit auch keine serielle
Korrelation der zu erklärenden Variable)
Cov[yi , yj ] = Cov[i , j ] = 0 ∀i 6= j ∧ i, j = 1, ..., N
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
204 / 265
Lineare Einfachregression
12.2 Methode der Kleinsten Quadrate
Gauß-Markov-Bedingungen (Teil 2):
Der Störterm hat (genauso wie die zu erklärende Variable) eine konstante
Varianz (Homoskedastizität)
σY2 = σ2 = const
Die Ausprägungen von X sind nicht selbst zufällig und haben zumindest 2
unterschiedliche Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
205 / 265
Lineare Einfachregression
12.2 Methode der Kleinsten Quadrate
Gauß-Markov-Bedingungen
0,45
0,40
Wert der Dichtefunktion
W
0,35
Bedingung: Mittelwert
der Verteilung der
Störterme ist null
Verteilung des Störterms
E [ yi ] = E [β 0 + β1 ⋅ yi ] ⇒ E [ε i ] = 0
0,30
0,25
0,20
0,15
0,10
0,05
0,00
-5
-4
-3
-2
-1
0
1
2
3
4
5
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
206 / 265
Lineare Einfachregression
12.2 Methode der Kleinsten Quadrate
Gauß-Markov-Bedingungen
180,0
160 0
160,0
Bedingung:
Homoskedastizität
(hier nicht erfüllt)
zu erklärend
de Variable (Y)
140,0
120,0
geringe Varianz
des Störterms
100,0
80,0
hohe Varianz
des Störterms
60,0
40,0
Yˆ = βˆ0 + βˆ1 ⋅ X
20,0
00
0,0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
erklärende Variable (X)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
207 / 265
Lineare Einfachregression
12.3 Beurteilung der Güte einer Regression
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
208 / 265
Lineare Einfachregression
12.3 Beurteilung der Güte einer Regression
Varianzzerlegung
Maß für die beobachtete Variation der zu erklärenden Variable:
Summe der quadratischen Abweichungen der tatsächlichen Ausprägungen
von Y vom Mittelwert (Total sum of squares, TSS):
PN
T SS = i=1 (yi − Ȳ )2
Maß für die erklärte Abweichung der zu erklärenden Variable:
Summe der quadratischen Abweichungen der für Y prognostizierten
Abweichungen vom Mittelwert (Explained Sum of Squares, ESS):
PN
ESS = i=1 (ŷi − Ȳ )2
Maß für die nicht erklärte Abweichung der zu erklärenden Variable:
Summe der quadratischen Abweichungen der für Y prognostizierten
Abweichungen von den tatsächlichen Ausprägungen (Residual Sum of
Squares, RSS):
PN
PN
RSS = i=1 (ŷi − yi )2 = i=1 2i
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
209 / 265
Lineare Einfachregression
12.3 Beurteilung der Güte einer Regression
Varianzzerlegung
Die Abweichung eines jeden Wertes von seinem Mittelwert lässt sich
darstellen als die Summe der Abweichung der tatsächlichen Werte von
den geschätzten Werten und der Abweichung der geschätzten Werte vom
Mittelwert.
Dies gilt auch für die summierten Werte:
T SS
⇔
N
X
(yi − Ȳ )2
i=1
i=1
N
X
⇔
(yi − Ȳ )2
i=1
Prof. Dr. Michael Berlemann (HSU)
= RSS + ESS
N
N
X
X
=
(ŷi − yi )2 +
(ŷi − Ȳ )2
i=1
N
N
X
X
=
(ŷi − yi )2 +
2i
i=1
Empirische Wirtschaftsforschung
i=1
FT 2010
210 / 265
Lineare Einfachregression
12.2 Methode der Kleinsten Quadrate
Varianzzerlegung
180,0
160 0
160,0
zu erklärend
de Variable (Y)
140,0
Tatsächliche Beobachtung
Y = βˆ0 + βˆ1 ⋅ X
120,0
100,0 Prognostizierter Wert
Unerklärte Abweichung
Mittelwert
Mittelwertabweichung
80,0
Erklärte Abweichung
60,0
Y
40,0
X
20,0
0,0
00
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
erklärende Variable (X)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
211 / 265
Lineare Einfachregression
12.3 Beurteilung der Güte einer Regression
Bestimmtheitsmaß
Definition
Das Bestimmtheitsmaß (R2 ) einer linearen Regression ist definiert als
PN 2
ESS
RSS
R =
=1−
= 1 − PN i=1 i
2
T SS
T SS
i=1 (yi − Ȳ )
2
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
212 / 265
Lineare Einfachregression
12.2 Methode der Kleinsten Quadrate
Beispiel: Hohes Bestimmtheitsmaß
180,0
160 0
160,0
zu erklärend
de Variable (Y)
140,0
120,0
100,0
80,0
60,0
40,0
20,0
00
0,0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
erklärende Variable (X)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
213 / 265
Lineare Einfachregression
12.2 Methode der Kleinsten Quadrate
Beispiel: Niedriges Bestimmtheitsmaß
180,0
160 0
160,0
zu erklärend
de Variable (Y)
140,0
120,0
100,0
80,0
60,0
40,0
20,0
00
0,0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
erklärende Variable (X)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
214 / 265
Lineare Einfachregression
Literaturhinweise
Literaturhinweise zum 12. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
215 / 265
Lineare Einfachregression
Literaturhinweise
Literaturhinweise zum 12. Kapitel
Von Auer, L. (2007): Ökonometrie. Eine Einführung, 4. Auflage,
Springer-Verlag, Berlin [insbes. Kapitel 1-4].
Gujarati, D. N. (1995): Basic Econometrics, 3rd. Edition, McGraw-Hill,
International Edition, New York [insbes. Kapitel 2-4].
Hackl, P. (2005): Einführung in die Ökonometrie, Pearson, München
[insbes. Kapitel 3-5].
Hill, R. C., W. E. Griffiths und G. G. Judge (2001): Undergraduate
Econometrics, 2nd Edition, Wiley & Sons, Hoboken [insbes. Kapitel 3,4
und 6].
Studenmund, A. H. (2006): Using Econometrics. A Practical Guide, 5th
Edition, Pearson/Addison Welsey, International Edition, Boston [insbes.
Kapitel 1,2 und 4].
Verbeek, M. (2004): A Guide to Modern Econometrics, 2. Auflage, Wiley
& Sons, Hoboken [insbes. Kapitel 1].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
216 / 265
Lineare Mehrfachregression
13. Lineare Mehrfachregression
13.1 Idee der linearen Mehrfachregression
13.2 OLS-Methode bei Mehrfachregressionen
13.3 Beurteilung der Güte einer linearen Mehrfachregression
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
217 / 265
Lineare Mehrfachregression
13.1 Idee der linearen Mehrfachregression
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
218 / 265
Lineare Mehrfachregression
13.1 Idee der linearen Mehrfachregression
Modellgleichung
Das einer linearen Mehrfachregression mit k erklärenden Variablen
zugrunde liegende Modell lautet:
Y = β0 + β1 · X1 + β2 · X2 + · · · + βk · Xk
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
219 / 265
Lineare Mehrfachregression
13.2 OLS-Methode bei Mehrfachregressionen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
220 / 265
Lineare Mehrfachregression
13.2 OLS-Methode bei Mehrfachregressionen
Regressionsgleichung einer linearen Mehrfachregression
yi = β0 + β1 · x1,i + β2 · x2,i + · · · + βk · xk,i + i
Prognosegleichung
Mit Hilfe der geschätzten Werte für die Regressionsparameter können
über die folgende Gleichung Schätzwerte für die zu erklärende Variable
berechnet werden:
ŷi = β̂0 + β̂1 · x1,i + β̂2 · x2,i + · · · + β̂k · xk,i
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
221 / 265
Lineare Mehrfachregression
13.2 OLS-Methode bei Mehrfachregressionen
Standardisierter Regressionskoeffizient
Wird ein Regressionskoeffizient mit der Standardabweichung der
zugehörigen erklärenden Variablen multipliziert und durch die
Standardabweichung der zu erklärenden Variable geteilt, so erhält man
den standardisierten Regressionskoeffizienten
βks = βk ·
Prof. Dr. Michael Berlemann (HSU)
Stdabw[Xk ]
Stdabw[Y ]
Empirische Wirtschaftsforschung
FT 2010
222 / 265
Lineare Mehrfachregression
13.2 OLS-Methode bei Mehrfachregressionen
Gauß-Markov-Bedingungen für Mehrfachregressionen (Teil 1):
Es handelt sich um ein korrekt spezifiziertes (es fehlt keine wichtige erklärende
Variable) lineares Regressionsmodell des Typs:
yi = β0 + β1 · xi + i
Der Störterm hat den Mittelwert null:
E[yi ] = E[β0 + β1 · xi ] ⇒ E[i ] = 0
Es gibt keine serielle Korrelation der Störterme (und damit auch keine serielle
Korrelation der zu erklärenden Variable)
Cov[yi , yj ] = Cov[i , j ] = 0 ∀i 6= j ∧ i, j = 1, ..., N
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
223 / 265
Lineare Mehrfachregression
13.2 OLS-Methode bei Mehrfachregressionen
Gauß-Markov-Bedingungen für Mehrfachregressionen (Teil 2):
Der Störterm hat (genauso wie die zu erklärende Variable) eine konstante
Varianz (Homoskedastizität)
σY2 = σ2 = const
Die Ausprägungen von X sind nicht selbst zufällig und haben zumindest 2
unterschiedliche Ausprägungen.
Keine der erklärenden Variablen ist eine perfekt lineare Funktion einer anderen
erklärenden Variablen (d.h. es gibt keine perfekte Multikollinearität).
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
224 / 265
Lineare Mehrfachregression
13.3 Beurteilung der Güte einer linearen
Mehrfachregression
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
225 / 265
Lineare Mehrfachregression
13.3 Beurteilung der Güte einer linearen
Mehrfachregression
Bestimmtheitsmaß
R2 =
PN 2
ESS
RSS
=1−
= 1 − PN i=1 i
2
T SS
T SS
i=1 (yi − Ȳ )
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
226 / 265
Lineare Mehrfachregression
13.3 Beurteilung der Güte einer linearen
Mehrfachregression
Adjustiertes Bestimmtheitsmaß
Definition
Das adjustierte Bestimmtheitsmaß (adj.R2 ) ist definiert als:
adj.R2 = 1 −
RSS
N −(K+1)
T SS
N −1
=1−
PN
2
i=1 i
N −(K+1)
PN
2
i=1 (yi −Ȳ )
N −1
mit N als Anzahl der Beobachtungen und K + 1 als Anzahl der
geschätzten Koeffizienten (inkl. Konstante).
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
227 / 265
Lineare Mehrfachregression
Literaturhinweise
Literaturhinweise zum 13. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
228 / 265
Lineare Mehrfachregression
Literaturhinweise
Literaturhinweise zum 13. Kapitel
Von Auer, L. (2007): Ökonometrie. Eine Einführung, 4. Auflage,
Springer-Verlag, Berlin [insbes. Kapitel 1-4].
Gujarati, D. N. (1995): Basic Econometrics, 3rd. Edition, McGraw-Hill,
International Edition, New York [insbes. Kapitel 2-4].
Hackl, P. (2005): Einführung in die Ökonometrie, Pearson, München
[insbes. Kapitel 3-5].
Hill, R. C., W. E. Griffiths und G. G. Judge (2001): Undergraduate
Econometrics, 2nd Edition, Wiley & Sons, Hoboken [insbes. Kapitel 3,4
und 6].
Studenmund, A. H. (2006): Using Econometrics. A Practical Guide, 5th
Edition, Pearson/Addison Welsey, International Edition, Boston [insbes.
Kapitel 1,2 und 4].
Verbeek, M. (2004): A Guide to Modern Econometrics, 2. Auflage, Wiley
& Sons, Hoboken [insbes. Kapitel 1].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
229 / 265
Koeffizienten- und Spezifikationstests
14. Koeffizienten- und Spezifikationstests
14.1 Wozu Koeffizienten- und Spezifikationstests?
14.2 Koeffiziententests
14.3 Spezifikationstests
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
230 / 265
Koeffizienten- und Spezifikationstests
14.1 Wozu Koeffizienten- und Spezifikationstests?
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
231 / 265
Koeffizienten- und Spezifikationstests
14.1 Wozu Koeffizienten- und Spezifikationstests?
Nachdem man eine lineare Regression geschätzt hat, liegt ein vollständig
spezifiertes Schätzmodell vor:
ŷi = β̂0 + β̂1 · x1,i + β̂2 · x2,i + · · · + β̂K · xK,i
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
232 / 265
Koeffizienten- und Spezifikationstests
14.2 Koeffiziententests
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
233 / 265
Koeffizienten- und Spezifikationstests
14.2 Koeffiziententests
Vorgehensweise Koeffiziententest (für jeden geschätzten Koeffizienten βk mit
k = 1 · · · , K getrennt):
1
Zunächst wird die Nullhypothese und die Alternativhypothese formuliert
(hier zweiseitiger Test):
H0 : βk = 0 (der unerwartete Fall)
HA : βk 6= 0 (der erwartete Fall)
2
Festlegung des Signifikanzniveaus (α = 0.1, α = 0.05, α = 0.01).
3
Berechnung der Testgröße (t-Wert).
Überprüfung, ob Testgröße in Annahme- oder Ablehnungsbereich der
Nullhypothese fällt, die sich aus dem vorgegebenen Signifikanzniveau
ergeben.
4
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
234 / 265
Koeffizienten- und Spezifikationstests
14.3 Spezifikationstests
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
235 / 265
Koeffizienten- und Spezifikationstests
14.3 Spezifikationstests
F-Test auf gemeinsame Signifikanz aller Regressoren
F-Test
Bei einer linearen Regression wird üblicherweise die Hypothese überprüft,
ob alle geschätzten Koeffizienten der erklärenden Variablen (nicht die
Konstante) gleichzeitig null sind:
H0 : β1 = β2 = · · · = βK = 0
HA : H0 ist falsch
Testgröße des F-Tests (F-Wert):
F =
ESS
K
RSS
N −K−1
Prof. Dr. Michael Berlemann (HSU)
PN
i=1 (ŷi −Ȳ
=1−
K
PN
2
i=1 i
N −K−1
)2
∼ F (N − K − 1)
Empirische Wirtschaftsforschung
FT 2010
236 / 265
Koeffizienten- und Spezifikationstests
Literaturhinweise
Literaturhinweise zum 14. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
237 / 265
Koeffizienten- und Spezifikationstests
Literaturhinweise
Literaturhinweise zum 14. Kapitel
Mosler, K. und F. Schmid (2008): Wahrscheinlichkeitsrechnung und
schließende Statistik, 3. Auflage, Springer-Verlag, Berlin [insbes. Kapitel
6].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
238 / 265
Schätzprobleme
15. Schätzprobleme
15.1 Heteroskedastizität
15.2 Multikollinearität
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
239 / 265
Schätzprobleme
15.1 Heteroskedastizität
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
240 / 265
Schätzprobleme
15.1 Heteroskedastizität
Heteroskedastie im Streudiagramm
180,0
160 0
160,0
Bedingung:
Homoskedastizität
(hier nicht erfüllt)
zu erklärend
de Variable (Y)
140,0
120,0
geringe Varianz
des Störterms
100,0
80,0
hohe Varianz
des Störterms
60,0
40,0
Yˆ = βˆ0 + βˆ1 ⋅ X
20,0
00
0,0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
erklärende Variable (X)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
241 / 265
Schätzprobleme
15.1 Heteroskedastizität
Diagnose
Test auf Heteroskedastizität
1
Goldfeldt-Quandt-Test
2
Breusch-Pagan-Test
3
White-Test
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
242 / 265
Schätzprobleme
15.1 Heteroskedastizität
Vorgehen beim Goldfeldt-Quandt-Test
1
Teilen des Samples S in zwei Sub-Samples S1 und S2 .
2
Schätzung einer linearen Regressionsgerade für jedes Sub-Sample.
PN1 2
PN2 2
Berechnung der Summe der quadrierten Residuen i=1
i,1 und i=1
i,2 .
3
4
Aufstellen der Hypothesen:
H0 : Quadratsummen der Residuen ist identisch.
HA : Quadratsummen der Residuen unterscheiden sich.
5
Vergleich der Varianzen der Residuen mit Hilfe eines F-Tests (größere
Quadratsumme im Zähler):
PN1
F =
6
i=1 i,1
N1 −K
PN2
i=1 i,2
N2 −K
F (N1 − K, N2 − K)
Übersteigt nun der Wert der Teststatistik den kritischen Wert der
F-Verteilung mit N1 − K und N2 − K Freitheitsgraden, kann die
Nullhypothese abgelehnt und die Alternativhypothese angenommen
werden.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
243 / 265
Schätzprobleme
15.1 Heteroskedastizität
Vorgehen beim Breusch-Pagan-Test
1
Aufstellen der Hypothesen:
H0 : Es liegt Homoskedastizität vor.
HA : Es liegt keine Homoskedastizität vor.
2
Schätzung einer linearen Regression.
3
Festlegung, welche Variablen für eine mögliche Heteroskedasie
verantwortlich sein könnten
4
Schätzung einer weiteren Regressionsgerade, bei der die quadrierten
Residuen aus der ersten Regression durch diese Variablen erklärt werden.
5
Berechnung des Bestimmtheitsmaß R2 für diese Regression.
6
Die Prüfgröße N · R2 ist asymptotisch χ2 -verteilt mit K Freiheitsgraden.
7
Übersteigt die Prüfgröße den kritischen Wert der χ2 -Verteilung, kann die
Nullhypothese der Homoskedastizität abgelehnt werden.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
244 / 265
Schätzprobleme
15.1 Heteroskedastizität
Lösung des Problems
Lösungsansätze für Hetroskedastizität
1
Varianztransformation (bei bekannter Varianz)
2
3
Weighted Least Squares
Feasible Generalized Least Squares
4
White-Korrektur (heteroskedastieresistente Standardfehler)
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
245 / 265
Schätzprobleme
15.2 Multikollinearität
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
246 / 265
Schätzprobleme
15.2 Multikollinearität
Definition
Definition
Liegt zwischen zwei Regressoren einer multiplen linearen Regression
yi = β0 + β1 · x1,i + β2 · x2,i + i
eine lineare Beziehung vor, d.h.
x2 = c + γ · x1
bzw.
x1 =
x2
c
−
γ
γ
so liegt perfekte Multikollinearität vor.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
247 / 265
Schätzprobleme
15.2 Multikollinearität
Folgen perfekter Multikollinearität
Einsetzen von x2 = c + γ · x1 in die Regressionsgleichung ergibt
y
=
β0 + β1 · x1 + β2 · (c + γ1 · x1 ) + ⇔y
=
(β0 + β2 · c) + (β1 + β2 · γ) · x1 + Einsetzen von x1 =
x2
γ
−
c
γ
in die Regressionsgleichung ergibt
x2
c
−
+ β2 · x 2 + = β0 + β1 ·
γ
γ
c
β1
=
β0 − β1 ·
+
+ β2 · x 2 + γ
γ
y
⇔y
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
248 / 265
Schätzprobleme
15.2 Multikollinearität
Venn-Diagramme
Fall 1: keine Multikollinearität
Fall 2 / 3: imperfekte Multikollinearität (geringe: Fall 2 / hohe: Fall 3)
Fall 4: perfekte Multikollinearität
1. 2.
stdabw(Y) stdabw(X1) stdabw(Y) stdabw(X2) 3. stdabw(X1)
stdabw(X2) 4.
stdabw(Y)
stdabw(Y) stdabw(X2)= stdabw(X1) stdabw(X1) Prof. Dr. Michael Berlemann (HSU)
stdabw(X2) Empirische Wirtschaftsforschung
FT 2010
249 / 265
Schätzprobleme
15.2 Multikollinearität
Hilfsregressionen
Beispiel: drei erklärende Variablen x1 , x2 und x3 :
yi = β0 + β1 · x1,i + β2 · x2,i + β3 · x3,i + i
Hilfsregressionen:
x1,i
= α0 + α1 · x2,i + α2 · x3,i + 1,i
x2,i
= δ0 + δ1 · x1,i + δ2 · x3,i + 2,i
x3,i
= γ0 + γ1 · x1,i + γ2 · x2,i + 3,i
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
250 / 265
Schätzprobleme
15.2 Multikollinearität
Variance Inflation Factors
Häufig wird auch der Variance Inflation Factor (VIF) jeder
Hilfsregression k zur Diagnose von Multikollinearität genutzt:
V IFk =
1
1 − Rk2
Faustregel: Ist der V IF größer als zehn (Rk2 > 0, 9), deutet das auf sehr
starke Multikollinearität.
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
251 / 265
Schätzprobleme
15.2 Multikollinearität
Möglichkeiten der Ausschaltung von Multikollinearität
Ausschluß von Variablen
Einbindung zusätzlicher Informationen
Zusammenfassung von Variablen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
252 / 265
Schätzprobleme
Literaturhinweise
Literaturhinweise zum 15. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
253 / 265
Schätzprobleme
Literaturhinweise
Literaturhinweise zum 15. Kapitel
Von Auer, L. (2007): Ökonometrie. Eine Einführung, 4. Auflage,
Springer-Verlag, Berlin [insbes. Kapitel 17-21].
Wooldridge, J.M. (2006): Introductury Econometrics: A Modern
Approach, 3. Auflage, Thomson. [insbes. Kapitel 8].
Backhaus et al. (2006): Multivariate Analysemethoden: eine
anwendungsorientierte Einführung, 11. Auflage, Springer,
Berlin-Heidelberg. [insbes. Kapitel 1].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
254 / 265
Regression bei diskreten abhängigen Variablen
16. Regression bei diskreten abhängigen Variablen
16.1 Überblick
16.2 Lineares Wahrscheinlichkeitsmodell bei binär abhängigen Variablen
16.3 Logit-/Probit-Schätzung
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
255 / 265
Regression bei diskreten abhängigen Variablen
Überblick
16.1 Überblick
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
256 / 265
Regression bei diskreten abhängigen Variablen
16.2 Lineares Wahrscheinlichkeitsmodell bei binär
abhängigen Variablen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
257 / 265
Regression bei diskreten abhängigen Variablen
16.2 Lineares Wahrscheinlichkeitsmodell
Schätzung mit OLS
Gegeben sei folgendes Beispiel:
Es soll analysiert werden, wovon es abhängt, ob ein Student die Prüfung
besteht oder nicht.
Dazu wird die zu erklärende Variable Y folgendermaßen definiert:
0
wenn Student i die Prüfung bestanden hat
yi =
1
wenn Student i die Prüfung nicht bestanden hat
Als erklärende Variablen sollen das Alter (A), der Lernaufwand in
Stunden pro Woche (L) und die Ergebnisse eines IQ-Tests (I) verwendet
werden.
Es soll folgendes Modell geschätzt werden:
yi = β0 + β1 · Ai + β2 · Li + β3 · Ii + i
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
258 / 265
Regression bei diskreten abhängigen Variablen
16.2 Lineares Wahrscheinlichkeitsmodell
Schätzung mit OLS
Der bedingte Erwartungswert (der erwartete Wert von yi , gegeben der
Werte der erklärenden Variablen) kann auch als Wahrscheinlichkeit
interpretiert werden:
E[yi |Ai , Li , Ii ]
=
1 · P (yi = 1 |Ai , Li , Ii )
+0 · P (yi = 0 |Ai , Li , Ii ) = 1 · P (yi = 1 |Ai , Li , Ii )
⇒ ŷi
=
Prof. Dr. Michael Berlemann (HSU)
β̂0 + β̂1 · Ai + β̂2 · Li + β̂3 · Ii = P (yi = 1)
Empirische Wirtschaftsforschung
FT 2010
259 / 265
Regression bei diskreten abhängigen Variablen
16.2 Lineares Wahrscheinlichkeitsmodell
binäre Variab
ble, kumulierte Dichtefunktion
Schätzung mit OLS: Grafische Darstellung
1,00
0,00
0
1
2
3
4
5
6
7
8
9
10
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
260 / 265
Regression bei diskreten abhängigen Variablen
16.3 Logit-/Probit-Schätzung
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
261 / 265
Regression bei diskreten abhängigen Variablen
16.3 Logit-/Probit-Schätzung
binäre Variab
ble, kumulierte Dichtefunktion
Anpassung einer Verteilungsfunktion
1,00
0,00
0
1
2
3
4
5
6
7
8
9
10
Ausprägungen
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
262 / 265
Regression bei diskreten abhängigen Variablen
16.3 Logit-/Probit-Schätzung
Logit- / Probit-Modelle
Logit-Modelle legen nun der Schätzung eine logistische Verteilung
zugrunde:
exp(β0 + β1 · xi )
P (yi = 1) =
1 + exp(β0 + β1 · xi )
Probit-Modelle legen nun der Schätzung eine Standardnormalverteilung
zugrunde:
2 Z β0 +β1 ·xi
1
−z
P (yi = 1) = Φ(β0 + β1 · xi ) =
· exp
dz
2·π
2
−∞
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
263 / 265
Regression bei diskreten abhängigen Variablen
Literaturhinweise
Literaturhinweise zum 16. Kapitel
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
264 / 265
Regression bei diskreten abhängigen Variablen
Literaturhinweise
Literaturhinweise zum 16. Kapitel
Agresti, A. (1990): Categorical Data Analysis, 4. Auflage, Wiley & Sons.
[insbes. Kapitel 4.1 und 4.2].
Wooldridge, J.M. (2006): Introductury Econometrics: A Modern
Approach, 3. Auflage, Thomson. [insbes. Kapitel 17].
Backhaus et al. (2006): Multivariate Analysemethoden: eine
anwendungsorientierte Einführung, 11. Auflage, Springer,
Berlin-Heidelberg. [insbes. Kapitel 7].
Prof. Dr. Michael Berlemann (HSU)
Empirische Wirtschaftsforschung
FT 2010
265 / 265
Zugehörige Unterlagen
Herunterladen