Statistik II – SoSe 2006 immer von 8:00-9:30 Uhr • • • • Was machen wir in der Vorlesung? Testen und Lineares Modell Was machen wir zu Beginn: Wir wiederholen und vertiefen einige Teile aus der Statistik I: • Konvergenzarten – Grenzwertsätze – Eigenschaften von Punkt- und Intervallschätzern Statistik II - 21.4.2006 1 Wiederholung Statistik I Wichtige Grenzwertsätze und asymptotische Eigenschaften von Punktschätzern Statistik II - 21.4.2006 2 Konvergenz in Verteilung • Sei eine Zufallsvariable mit Verteilungsfunktion • Sei eine Sequenz von Zufallsvariablen mit Verteilungsfunktion . Beispiele: Stichprobenmittel, empirische Verteilungsfunktion Statistik II - 21.4.2006 3 Definition: konvergiert in Verteilung zu , falls gilt: Dann schreibt man: Statistik II - 21.4.2006 4 Konvergenz in Wahrscheinlichkeit Definition: Sei eine Sequenz von Zufallsvariablen, dann konvergiert in Wahrscheinlichkeit gegen , falls für jedes gilt: Man schreibt: Statistik II - 21.4.2006 5 Fast sichere Konvergenz Definition: Sei eine Sequenz von Zufallsvariablen, dann konvergiert fast sicher gegen , falls gilt: Man schreibt: Statistik II - 21.4.2006 6 Was folgt woraus? • Aus folgt und daraus folgt . • Was nicht folgt: • folgt nicht • folgt nicht • es folgt nicht: Statistik II - 21.4.2006 7 Gleichmäßige Konvergenz • Bisherige Konzepte: punktweise • Wir stellen uns nun vor, wir hätten eine Sequenz von Zufallsvariablen, die wir an mehreren Punkten beobachten, z.B. die Verteilungsfunktion , eine stochastische Funktion. • Wenn die Konvergenz an allen beobachtet wird, dann haben wir eine gleichmäßige Konvergenz. Statistik II - 21.4.2006 8 Warum braucht man das? • Es handelt sich um eine formale Darstellung von statistischen Eigenschaften, die uns die Zuverlässigkeit unserer Herangehensweise ausdrücken. • Deshalb zielen viele Beweise darauf ab, diese Eigenschaften zu zeigen. Statistik II - 21.4.2006 9 Gesetze der gr. Zahlen • Bsp.: Sei nun das Stichprobenmittel die Zufallsvariable, die aus i.i.d. Zufallsvariablen berechnet wurde. Es gelte ferner und . Dann zeigt das schwache Gesetz der großen Zahl gerade: Statistik II - 21.4.2006 10 • Andere Varianten des Gesetzes der großen Zahl kommen mit anderen bzw. schwächeren Annahmen aus und zeigen die fast sichere Konvergenz des Stichprobenmittels: Starke Gesetze der großen Zahl von Kolmogorov. • Mehr Details: siehe z.B. Rao (1973), S.114-115 Statistik II - 21.4.2006 11 Was passiert ? Simulation: Sei 1. Wir ziehen 100 Beobachtungen 2. Wir berechnen . 3. Wir wiederholen 1. und 2. je 100 mal und erhalten so . Statistik II - 21.4.2006 12 • Wie sind die 100 Stichprobenmittel verteilt? 100 Beobachtungen, 100 Wiederholungen 1 0.8 0.6 0.4 0.2 0 −0.2 −0.4 −0.6 −0.8 −1 −0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2 0.25 Stichprobenmittel Statistik II - 21.4.2006 13 Jetzt nehmen wir mehr Beobachtungen…1000 1000 Beobachtungen, 100 Wiederholungen 1 0.8 0.6 0.4 0.2 0 −0.2 −0.4 −0.6 −0.8 −1 −0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2 0.25 Stichprobenmittel Statistik II - 21.4.2006 14 1 Million….. 1 Mio. Beobachtungen, 100 Wiederholungen 1 0.8 0.6 0.4 0.2 0 −0.2 −0.4 −0.6 −0.8 −1 −0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2 0.25 Stichprobenmittel Statistik II - 21.4.2006 15 Zentraler Grenzwertsatz • Wir wissen durch die Gesetze der großen Zahlen, dass die Verteilung des Stichprobenmittels gegen eine asymptotische Verteilung mit Mittelwert und Varianz konvergiert. Bloß, wie sieht diese Verteilung aus? • Dies sagt uns der zentrale Grenzwertsatz. Statistik II - 21.4.2006 16 Führe zuerst eine Standardisierung durch: hat den Erwartungswert 0 und Varianz 1. Dann gilt nach dem ZGW von Lindeberg und Lévy oder für Statistik II - 21.4.2006 17 • Man kann aber auch schreiben: • In statistischen Anwendungen ist es häufig einfacher, die Konvergenz in Wahrscheinlichkeit zu zeigen. Die exakte Herleitung der asymptotischen Verteilung macht mehr Probleme. (-> Advanced Econometrics, Prof. Fitzenberger). Statistik II - 21.4.2006 18 Was passiert genau? Simulation: Sei wieder 1. Wir ziehen 100 Beobachtungen 2. Wir berechnen . 3. Wir wiederholen 1. und 2. je 100 mal und erhalten so . 4. Standardisiere die geschätzten Mittelwerte: Statistik II - 21.4.2006 19 100 Beobachtungen, 100 Wiederholungen 1 Z i 0.9 Fn FSt 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 Z i Die Verteilung von Z_i konvergiert gegen die Standardnormalverteilung. Statistik II - 21.4.2006 20 1000 Beobachtungen, 1000 Wiederholungen 1 0.9 Zi 0.8 F Fn St 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 −4 −3 −2 −1 0 1 2 3 4 Zi • In der Simulation muss man allerdings auch die Anzahl der Wiederholungen vergrößern, da anhand der geschätzten geschätzt wird. Statistik II - 21.4.2006 21 Normalverteilung als Näherungsverteilung • Damit können wir approximativ sagen: • damit sind auch Intervalle abschätzbar: Statistik II - 21.4.2006 22 Eigenschaften von Punktschätzern • Punktschätzer: z.B. • (Asymptotische) Unverzerrtheit: • Mittlerer Quadratischer Fehler: Statistik II - 21.4.2006 23 • Konsistenz:(Asymptotische) Unverzerrtheit und die Varianz der Schätzung verschwindet asymptotisch. • D.h. • Dies bezeichnet man auch als Konvergenz im r-ten Moment, d.h. oder mit Statistik II - 21.4.2006 24 • Aus Beweis:… folgt • Ein Schätzer ist effizienter als ein Schätzer , falls gilt: Statistik II - 21.4.2006 25 Beispiel • Wir haben eine i.i.d. Stichprobe • Die empirische Verteilungsfunktion ist ein konsistenter Schätzer der Verteilungsfunktion von . • Ist stetig, dann ist die Konsistenz gleichmäßig. Statistik II - 21.4.2006 26 Allgemeine Hinweise • Die Vorlesung ist immer 8:00-9:30 Uhr statt. • Infokasten des Lehrstuhl Hujer beachten. • Organisatorisches: Frau Andres-Kreiner Lehrstuhl Hujer, Raum 135B • Webseite: Lehrstuhl Hujer Dort werden auch die Folien abgelegt sein. • Achtung: es wird nicht jede Woche Folien geben. Statistik II - 21.4.2006 27 • Sprechstunde: immer direkt nach der Vorlesung im Hörsaal…. oder nach Mannheim kommen… • Bitte das „Forum“ benutzen. Statistik II - 21.4.2006 28 • Es gibt ab nächster Woche wöchentlich 10 Tutorien, in denen Übungen zur Statistik I und II durchgenommen werden. • Vor dem Hörsaal hängen ab heute für eine Woche Teilnahmelisten für die Tutorien aus. Bitte eintragen! (nicht mehr als 30 Teilnehmer pro Tutorium) • Bitte immer nur das gewählte Tutorium besuchen, damit die Tutoren sich besser auf euch einstellen können. Statistik II - 21.4.2006 29 Die Tutoren • Puriya Abbassi Mittwoch 12-14h in Raum H B Donnerstag 8-10h in Raim H 10. • Sascha Becker Dienstag 12:00 - 14:00 Hörsaal H 1 Donnerstag 08:00 - 10:00 Hörsaal H 3 • Christian Bergner Dienstag 10:00 - 12:00 Hörsaal H 13 Donnerstag 10:00 - 12:00 Hörsaal H 10 Statistik II - 21.4.2006 30 … • Roman Steurer Montag 12:00 - 14:00 Hörsaal H 11 Montag 14:00 - 16:00 Hörsaal H 3 • Nina Wollbold Dienstag 10:00 - 12:00 Hörsaal H 14 Freitag14:00 - 16:00 Hörsaal H 8 • Marcel Loginow (Web+Spezialeinsätze) Statistik II - 21.4.2006 31 Wer bin ich? • Name: Ralf Wilke • Institution: ZEW, Mannheim • Forschungsschwerpunkte: angewandte Ökonometrie, Ökonometrie, empirische Arbeitsmarktforschung • Ab September: University of Leicester, UK Statistik II - 21.4.2006 32 Unser Extra-Service… • Es findet in einigen Wochen zusätzlich zur Vorlesung ein Gross-Tutorium statt: donnerstags, 10-12 Uhr , H8 Ankündigungen beachten! 27.4.,4.5. Crash-Kurs Statistik I mit Puriya Abbassi • Danach bei Bedarf zur Vertiefung (Beweise) oder Wiederholung der Vorlesung. Statistik II - 21.4.2006 33 MTB-Vorschlag • Wer will mit mir am Wochenende 10./11.6. die Feldberg-o-mania (Taunus) fahren? Länge:61,50 km Fahrzeit:4:30:00 h Höhenmeter:1750 m 2 Mal den großen Feldberg rauf: www.mtb-rheinmain.de/touren/feldberg2Dia.html Statistik II - 21.4.2006 34 Andere Vorschläge? Fragen? Statistik II - 21.4.2006 35