Ubungsblatt 1 Prof. Dr. Isabel Schnabel Johannes Gutenberg-Universit at Mainz Sommersemester 2008 Aufgabe 1: Monte-Carlo-Simulation zur Illustration des Gesetzes der Groen Zahlen und des Zentralen Grenzwertsatzes In dieser Aufgabe wollen wir die Abbildungen 2.8 und 2.9 aus Stock/Watson (2007) selbst mit Hilfe von Simulationen erzeugen, um so das Konzept der Stichprobenverteilung des Stichprobenmittels und deren Eigenschaften besser zu verstehen. Man spricht auch von einer \Monte-Carlo-Simulation". Das in der Ubung verwendete Programm Figure2 8.do wird auf der Homepage bereitgestellt. Bitte beachten Sie, dass die Details der Programmierung in diesem Fall nicht so wichtig sind. Wichtig ist, dass Sie das Prinzip der Simulationen verstehen. Wir werden in dieser Aufgabe selbst eine Zufallsstichprobe Y1 ; Y2 ; :::Yn generieren. Wir nehmen an, dass die Yi identisch und unabhangig verteilt sind gema einer Bernoulli-Verteilung mit p = 0; 78 (d. h., die Zufallsvariable nimmt mit Wahrscheinlichkeit 0,78 den Wert 1 an und mit Wahrscheinlichkeit 0,22 den Wert 0). Das Besondere an einer Simulation ist, dass wir die Verteilung der Zufallsvariablen kennen, da wir sie selbst bestimmen. Das ist bei den Daten, die wir in der realen Welt beobachten, nicht der Fall. Die Simulation in Figure2 8.do ist folgendermaen aufgebaut: Schritt 1: Zunachst denieren wir eine Prozedur (d. h., ein kleines Programm), mit dem wir Bernoulli-Variablen mit den gewunschten Eigenschaften erzeugen konnen. Schritt 2: Dann ziehen wir zufallig n Realisationen der beschriebenen Zufallsvariable und berechnen den Mittelwert dieser Realisationen. n beschreibt die Anzahl der Ziehungen. 1 Empirische Wirtschaftsforschung { Ubungsblatt 1 2 Schritt 3: Um die Stichprobenverteilung des Stichprobenmittelwerts zu ermitteln, wiederholen wir diesen Schritt 10:000-mal. Beachten Sie, dass 10.000 die Anzahl der Simulationen ist und nicht die Anzahl der Ziehungen! Jede Simulation fuhrt zu einer neuen Zufallsstichprobe und daher auch zu einem neuen Stichprobenmittelwert, der jeweils abgespeichert wird. Nach 10.000 Wiederholungen haben wir also 10.000 Stichproben mit je n Beobachtungen gezogen und 10.000 Stichprobenmittelwerte errechnet. Schritt 4: Anschlieend betrachten wir die Verteilung des Stichprobenmittelwerts uber die 10.000 Simulationen und analysieren deren Eigenschaften. 1. Setzen Sie n = 1, und fuhren Sie die beschriebene Simulation durch, indem Sie das Programm Figure2 8.do laufen lassen. Setzen Sie hierbei die Anzahl der Beobachtungen gleich 1: simulate mean=r(mean), reps(10000): bernoulli, obs(1) Wie ist das sich ergebende Histogramm zu interpretieren? 2. Berechnen Sie den Erwartungswert, die Varianz und die Standardabweichung der Zufallsvariable Yi . 3. Berechnen Sie den Erwartungswert, die Varianz und die Standardabweichung des Stichprobenmittels Y fur eine Stichprobe der Groe n. 4. Setzen Sie n = 2, und berechnen Sie die Stichprobenverteilung des Mittelwerts. Fuhren Sie anschlieend eine Simulation durch mit: simulate mean=r(mean), reps(10000): bernoulli, obs(2) 5. Wiederholen Sie die Simulation mit n = 5, n = 25, n = 100 und n = 10:000. Stellen Sie die Stichprobenverteilung jeweils als Histogramm dar mit dem Befehl: hist mean, start(0) bin(90) Interpretieren Sie das Ergebnis. 6. Fuhren Sie dieselben Simulationen nun fur den standardisierten Mittelwert durch (d. h., Sie ziehen den Erwartungswert des Stichprobenmittels ab und teilen durch die Standardabweichung des Stichprobenmittels): replace `z' = (`z'-0.78)/0.4142*sqrt(n) simulate mean=r(mean), reps(10000): bernoulli, obs(n) Empirische Wirtschaftsforschung { Ubungsblatt 1 3 Fur n mussen Sie hier die entsprechende Beobachtungszahl (Anzahl der Ziehungen) eintragen. Betrachten Sie wieder die Histogramme mit dem Befehl: hist mean, start(-5) bin(90) Interpretieren Sie das Ergebnis. Aufgabe 2: Einkommensunterschiede zwischen Mannern und Frauen in den USA Wir verwenden nun den Datensatz CPS92 04.dta. Dieser Datensatz enthalt Einkommensdaten fur vollbeschaftigte Manner und Frauen im Alter zwischen 25 und 34 Jahren fur die Jahre 1992 und 2004. Die Daten werden in der Datei CPS92 04 Description.pdf genauer beschrieben. Ziel dieser Aufgabe ist es herauszunden, ob Manner in den USA mehr verdienen als Frauen und wie sich dieser Unterschied zwischen 1992 und 2004 verandert hat. Hinweis: Einen Teil der Losungen zu dieser Aufgabe nden Sie in Tabelle 3.1 in Stock/Watson (2007) und dem zugehorigen Kasten. Variablen des Datensatzes: female: Dummyvariable, 1 f ur Frauen, 0 fur Manner year: Jahr, 1992 oder 2004 ahe: Durchschnittliche Stundenlohne (average hourly earnings ) bachelor: Dummyvariable, 1 f ur Personen mit Bachelor-Abschluss, 0 sonst 1. Wir wollen hier nur die Personen betrachten, die einen Bachelor-Abschluss haben. Loschen Sie die ubrigen Personen aus der Stichprobe: keep if bachelor == 1 (alternativ: drop if bachelor == 0) 2. Rechnen Sie die Einkommensvariable von 1992 in US-Dollar von 2004 um. Verwenden Sie hierzu den Konsumentenpreisindex (CPI, consumer price index ). Dieser betrug im Jahre 1992 140,3, im Jahre 2004 188,9. Warum ist diese Umrechnung wichtig? 3. Berechnen Sie die durchschnittlichen Einkommen von Mannern und Frauen jeweils fur die Jahre 1992 und 2004 sowie deren Standardabweichungen. Empirische Wirtschaftsforschung { Ubungsblatt 1 4 4. Berechnen Sie die Unterschiede der Einkommen zwischen Mannern und Frauen jeweils fur die Jahre 1992 und 2004 und uberprufen Sie, ob diese Unterschiede signikant von Null verschieden sind. Fuhren Sie hierzu einen t-Test auf einem Signikanzniveau von 5 Prozent durch, berechnen Sie den p-Wert und bestimmen Sie ein 95%-Kondenzintervall. 5. Hat sich der Einkommensunterschied zwischen 1992 und 2004 signikant erhoht? 6. Interpretieren Sie Ihre Ergebnisse. Gibt es Hinweise auf Diskriminierung? Diskutieren Sie, warum Ihre Schatzungen den Diskriminierungseekt unter- oder uberschatzen konnten.