Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Einfache Zufallsstichprobe • Stock & Watson: Kap. 2.5-3.6 • Definition einer einfachen Zufallsstichprobe von n Zufallsvariablen: Y1, . . . Yn sind identisch und unabhängig verteilte Zufallsvariablen o Wir haben n unabhängige Ziehungen (Ziehen mit Zurücklegen) aus einer Verteilung ⇒ ,,i.i.d. draws” o identisch: Yi0s folgen gleicher Verteilung o unabhängig: Yi0s sind unabhängig voneinander 1 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Einfache Zufallsstichprobe • Beispiele und Gegenbeispiele o zufällige Auswahl von 20 Arbeitstagen aus dem letzten Jahr zur Ermittlung der durchschnittlichen Pendlerfahrzeit o Auswahl von 20 aufeinander folgenden Arbeitstagen zur Ermittlung der durchschnittlichen Pendlerfahrzeit: Unabhängigkeit? o unabhängige Auswahl von Arbeitnehmer für Arbeitsmarktstudie: Identische Verteilung? 2 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Schätzer • Wofür können wir einfache Zufallsstichproben nutzen? o Um etwas über die Eigenschaften der Verteilung bzw. die interessierende Grundgesamtheit zu lernen, die durch die Verteilung beschrieben wird. Z.B. Erwartungswert • Wie können wir etwas lernen? o Durch die Anwendung von (sinnvollen) Schätzern bzw. Schätzregeln. Pn Z.B. Stichprobenmittel Ȳ = 1/n i=1 Yi • Wie können wir Schätzer interpretieren? • Welche Eigenschaften von Schätzern sind wichtig? 3 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Interpretation von Schätzern • Schätzer ist eine Funktion von Zufallsvariablen • Beispiel für Schätzer: Stichprobenmittel Ȳ = 1/n Pn i=1 Yi • Ȳ ist unser Schätzer bzw. Schätzregel o Ȳ ist eine Zufallsvariable! da (lineare) Funktion von Zufallsvariablen • Schätzung bzw. Schätzergebnis ȳ = 1/n Pn i=1 yi o ȳ ist keine Zufallsvariable, sondern ein Zahlenwert! da auf Daten basierend • Merke: Schätzer sind Zufallsvariablen, Schätzungen nicht! 4 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Eigenschaften von Schätzern • Wichtige Eigenschaften von Schätzern (in endlichen Stichproben) o Erwartungswert ⇒ Erwartungstreue o Varianz ⇒ Effizienz o Verteilung ⇒ Hypothesentests • Eigenschaften von Schätzern werden bestimmt durch Annahmen über die Stichprobe Y1, . . . Yn • Annahme: einfache Zufallsstichprobe 5 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Asymptotische Eigenschaften von Schätzern • Eigenschaften in großen Stichproben: Stichprobenumfang n → ∞ o Asymptotischer Erwartungswert und Asymptotische Varianz o Asymptotische Verteilung o Konsistenz 6 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Erwartungstreue • Ein Schätzer θ̂ ist erwartungstreu (unverzerrt) bzgl. eines Parameters θ, falls E(θ̂) = θ • Erwartungstreue = Wir machen im Mittel keinen Fehler (wenn wir unendlich oft Stichproben vom Umfang n ziehen könnten) • Verzerrung (Bias): E(θ̂) − θ • Beispiel: Stichprobenmittel o Einfache Zufallsstichprobe Y1, . . . Yn aus einer Verteilung mit Erwartungswert µY und Varianz σY2 : E(Yi) = µY und Var(Yi) = σY2 Pn o Schätzer Ȳ = 1/n i=1 Yi o Man kann zeigen: E(Ȳ ) = µY 7 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Effizienz • Ein erwartungstreuer Schätzer ist effizient, falls es keinen anderen erwartungstreuen Schätzer gibt, der eine kleinere Varianz hat • Zwei erwartungstreue Schätzer θ̂ und θ̃ o θ̂ ist effizient, falls Var(θ̂) ≤ Var(θ̃) o θ̂ ist effizienter als θ̃, falls Var(θ̂) < Var(θ̃) o θ̂ und θ̃ sind effizient, falls Var(θ̂) = Var(θ̃) • Effizienzaussagen immer nur für bestimmte Modellannahmen möglich o Einfache Zufallsstichprobe: Ȳ ist der beste lineare unverzerrte Schätzer (BLUE) für µY o Var(Ȳ ) = σȲ2 = σY2 /n 8 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Verteilung • Exakte Verteilung bzw. Verteilung in endlichen Stichproben eines Schätzers o Verteilung, die die Eigenschaften des Schätzers für eine Stichprobe vom Umfang n beschreibt • Ableitung der exakten Verteilung eines Schätzers ist häufig sehr schwierig • Ableitung wird vereinfacht durch explizite Verteilungsannahme bzgl. Grundgesamtheit (z.B. Normalverteilung) • Beispiel: Yi ∼ iidN (µY , σY2 ), i = 1, . . . , n Pn o Ȳ = 1/n i=1 Yi ist normalverteilt, da (gewichtete) Summe von n unabhängig normalverteilten Zufallsvariablen o Ȳ ∼ N (µY , σȲ2 ) 9 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Asymptotische Analyse • Bestimmung der exakten Eigenschaften (Erwartungswert, Varianz, Verteilung) von Schätzern für endliche Stichproben o ist oft sehr schwierig abzuleiten oder gar unmöglich (insbesondere Verteilung) o ist oft nur für sehr strenge Annahmen möglich (z.B. bei Normalverteilungsannahme) o führt oft zu nicht brauchbaren Ergebnissen (z.B. Verteilung, die von unbekannten Paramtern abhängt) • Ausweg: asymptotische Analyse o Eigenschaften der Schätzer für n → ∞ 10 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Asymptotische Analyse • Asymptotische Analyse o Bestimmung der Eigenschaften für sehr große Stichproben: n → ∞ o Herleitung vereinfacht sich oft o Weniger strenge Annahmen nötig (z.B. keine Normalverteilungsannahme) • Beachte: Nur approximative Eigenschaften • Wie gut funktioniert asymptotische Approximation? o Keine generelle Aussagen möglich o Simulationen mit generierten Daten ermöglichen gewisse Abschätzung • Hilfsmittel asymptotischer Analyse: o Gesetz der großen Zahlen und Zentraler Grenzwertsatz 11 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Konsistenz/ Konvergenz von Schätzern • Schätzer θ̂ ist konsistent, falls sich θ̂ dem Parameter θ für größer werdende Stichproben immer mehr annähert o limn→∞ P (|θ̂ − θ| ≤ c) = 1 o θ̂ konvergiert (in Wahrscheinlichkeit) gegen θ p o plim θ̂ = θ oder θ̂ −→ θ o Für n → ∞ schätzen wir θ (mit einer Stichprobe) korrekt, nicht nur im Mittel • Nachweis der Konsistenzeigenschaft o Falls E(θ̂) und Var(θ̂) existieren θ̂ ist konsistent, falls limn→∞ E(θ̂) = θ und limn→∞ Var(θ̂) = 0 o Gesetz der Großen Zahl je nach getroffenen Annahmen bezüglich Stichprobe von Zufallsvariablen 12 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Konsistenz des Stichprobenmittels • Einfache Zufallsstichprobe: Yi ∼ i.i.d.(µY , σY2 ) o Zusätzliche Annahme: σY2 < ∞ • Ȳ = 1/n Pn 2 Y mit E( Ȳ ) = µ und Var( Ȳ ) = σ i Y Y /n i=1 o limn→∞ E(Ȳ ) = µY o limn→∞ Var(Ȳ ) = 0 o Folglich ist Ȳ ein konsistenter Schätzer für µY p o Ȳ −→ µY • Gesetz der Großen Zahl für einfache Zufalsstichprobe p o Falls Yi ∼ i.i.d.(µY , σY2 ) und σY2 < ∞, folgt Ȳ −→ µY 13 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Asymptotische Verteilung des Stichprobenmittels • Zentraler Grenzwertsatz besagt, dass Verteilung von Ȳ sehr gut durch eine Normalverteilung approximiert werden kann, falls n sehr groß ist o Ȳ konvergiert (in Verteilung) gegen eine Normalverteilung für n → ∞ d o ,,Ȳ −→ N (µY , σȲ2 )”, mit σȲ2 = σY2 /n o Da limn→∞ σȲ2 = 0, wird oft die standardisierte Version von Ȳ verwendet: Ȳ − µY d −→ N (0, 1) σȲ • Beachte: Normalverteilungsannahme für Yi nicht notwendig o Voraussetzung lediglich Yi ∼ i.i.d.(µY , σY2 ) und σY2 < ∞ • Zentrale Grenzwertsätze existieren auch für andere Formen von Stichproben 14 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Hypothesentests • Hypothesentests bzgl. Erwartungswertes der Grundgesamtheit • Typische Fragestellungen o Entspricht der durchschnittliche Stundenlohn eines Hochschulabsolventen 20 Euro? o Verdienen Männer mehr als Frauen? • Fragen können unter Verwendung von Daten mit Hilfe von Hypothesentests bezüglich µY beantwortet werden • ,,Bestandteile” eines Hypothesentests o Null- und Alternativhypothesen o Teststatistik o Verteilung der Teststatistik (wenn Nullhypothese gilt) 15 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Null- und Alternativhypothese • Nullhypothese: H0 : E(Y ) = µY = µY,0 o Interessierende Hypothese, die überprüft werden soll o Es wird getestet, ob der Erwartungswert einer ZV/Grundgesamtheit einem bestimmten Wert µY,0 enstpricht o µY,0 ist der überprüfte Wert, z.B. 20e Stundenlohn • Alternativhypothese: H1 : E(Y ) = µY 6= µY,0 o Spezifiziert, was im Fall der Ungültigkeit von H0 gilt o Zweiseitige Alternativhypothese: µY > µY,0 oder µY < µY,0 • Ziel: Auf Basis der Daten entscheiden, ob Nullhypothese zu Gunsten der Alternativhypothese abgelehnt werden muss oder nicht o Nullhypothese wird nicht angenommen, sonder nur nicht abgelehnt 16 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Wann sollen wir Nullhypothese ablehnen? • Beispiel: Stichprobe zu Stundenlöhnen von Hochschulabsolventen o Nullhypothese: H0 : µY = 20e o Schätzergebnis ȳ = 22.64e o Brauchen Referenz um entscheiden zu können, ob 22.64e signifikant verschieden von 20e ist o Anders formuliert: Wie (un)wahrscheinlich ist es einen Stundenlohn von 22.64e zu beobachten, falls der wahre Durchschnittslohn 20e ist? • Referenz: Verteilung von Ȳ unter Nullyhpothese (wenn Nullhypothese gilt) • Zentraler Grenzwertsatz: falls n groß ist, gilt Ȳ − µY,0 d d Ȳ −→ N (µY,0, σȲ2 ) bzw. z = −→ N (0, 1) σȲ 17 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Teststatistik, Verteilung und p-Wert • Berechne mit Hilfe der Normalverteilung, wie (un)wahrscheinlich es ist einen Stundenlohn von 22.64e zu beobachten o Bevorzuge Standardnormalverteilung • z ist Teststatistik und N (0, 1) ist Verteilung von z unter H0 ¯ ¯ ¯¶ µ¯ ¯ Ȳ − µY,0 ¯ ¯ ȳ − µY,0 ¯ ¯>¯ ¯ = p-Wert • Zweiseitiger Test: Berechne P ¯¯ ¯ ¯ σ ¯ σȲ Ȳ • Bei welchem p-Wert ist ȳ ist unwahrscheinlich? o Häufigste Wahl: Wenn p-Wert ≤ 5%, Alternativen: 10% oder 1% o Signifikanzniveau • Beispiel: µY,0 = 20, n = 200 und ȳ = 22.64: Welche Information fehlt? 18 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Varianzschätzung √ • σȲ2 = σY2 /n bzw. σȲ = σY / n muss geschätzt werden o σȲ ist Standardfehler von Ȳ • Stichprobenvarianz s2Y ist Schätzer für Varianz der Grundgesamtheit σY2 1 Pn 2 o = (Y − Ȳ ) i n − 1 i=1 o Teile durch n − 1 wegen Schätzung von µY durch Ȳ : Verlust eines Freiheitsgrades und es gilt E(s2Y ) = σY2 s2Y p o s2Y ist ein konsistenter Schätzer: s2Y −→ σY2 √ • Schätze Standardfehler von Ȳ durch σ̂Ȳ = sY / n 19 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz t-Statistik • Neue Teststatistik t = Ȳ − µY,0 d −→ N (0, 1) σ̂Ȳ o Verteilung von t folgt aus ZGS und Konsistenz von σ̂Ȳ • Name kommt von t-Verteilung: t-Statistik ist t-verteilt, falls Yi’s normalverteilt sind ¯ ¯ ¯¶ µ¯ ¯ Ȳ − µY,0 ¯ ¯ ȳ − µY,0 ¯ ¯>¯ ¯ = p-Wert • Zweiseitiger Test: Berechne P ¯¯ ¯ ¯ σ̂Ȳ σȲ ¯ • Beispiel: µY,0 = 20, ȳ = 22.64, sY = 18.14, n = 200 √ √ o σ̂Ȳ = sY / n = 18.14/ 200 = 1.28 o tact = (22.64 − 20)/1.28 = 2.06, p-Wert = 0.039 20 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Alternative Testanwendung: Kritische Werte • Vergleich von Wert der Teststatistik und kritischem Wert • Kritischer Wert ergibt sich aus Verteilung, Signifikanzniveau und zweiseitiger Alternativhypothese • Standardnormalverteilung N (0, 1) o 5%-Signifikanzniveau: kritischer Wert 1.96 • Lehne H0 ab, falls |tact| ≥ 1.96 • Approximation durch Normalverteilung kann in kleinen Stichproben inadäquat sein 21 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Einseitige Tests • Spezifische Alternativhypothese: z.B. H1 : µY > 0 o Beachte: Nullhypothese ändert sich zu H0 : µY ≤ 0 • p-Wert Berechnung bezieht sich nur auf eine Seite der Verteilung µ • Einseitiger Test: Berechne P Ȳ − µY,0 ȳ − µY,0 > σ̂Ȳ σȲ ¶ = p-Wert o Kritischer Wert für 5%-Signifikanzniveau ist 1.645 o Äquivalent für Alternativhypothese H1 : µY < 0 22 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Fehler 1. und 2. Art • Fehler 1. Art: Ablehnung richtiger Nullhypothese • Fehler 2. Art: Nichtablehnung falscher Nullhypothese • Signifikanzniveau entspricht vorgegebener Wahscheinlichkeit des Fehler 1. Art o Beachte: Gilt in unserem Fall nur für n −→ ∞ • Größe eines Tests: Wahrscheinlichkeit, richtige Nullhypothese abzulehnen • Güte eines Tests: Wahrscheinlichkeit, falsche Nullhypothese abzulehnen 23 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Test auf Mittelwertunterschiede • Ökonomische Frage: Verdienen Männer mehr als Frauen? • Statistische Frage: Ist der Erwartungswert der Lohnverteilung der Männer (Grundgesamtheit 1) höher als der der Frauen (Grundgesamtheit 2)? • Null- und Alternativhypothese: H0 : µm − µw = d0 vs. H1 : µm − µw 6= d0 • d0 = 0: Männer und Frauen verdienen im Mittel gleich viel • Probleme: Zwei unbekannte Erwartungswerte und Verteilung o Schätzer: Ȳm und Ȳw ⇒ Ȳm − Ȳw ist Schätzer von µm − µw d d 2 2 o ZGS: Ȳm −→ N (µm, σm /nm) und Ȳw −→ N (µw , σw /nw ) Annahme: Ȳm und Ȳw unabhängig d 2 2 ⇒ (Ȳm − Ȳw ) −→ N [(µm − µw ), (σm /nm + σw /nw )] 24 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Test auf Mittelwertunterschiede • Verteilung unter H0 : µm − µw = d0 d 2 2 o (Ȳm − Ȳw ) −→ N [d0, (σm /nm + σw /nw )] 2 2 /nm + σw /nw • Schätzer für σm o s2m/nm + s2w /nw q s2 s2w o σ̂mw = nm + nw m • t-Statistik (Ȳm − Ȳw ) − d0 d t= −→ N (0, 1) σ̂mw • Testanwendung wie für übliche t-Tests (p-Werte, ein- oder zweiseitiger Test etc.) 25 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Test auf Mittelwertunterschiede • Tests auf Mittelwertunterschiede können zur Feststellung von kausalen Effekten angewendet werden • Beispiel: Erntemenge bei Düngemitteleinsatz o Behandlungsgruppe: Felder mit Düngemitteleinsatz o Kontrollgruppe: Felder ohne Düngemitteleinsatz o Randomisiertes Experiment: Gruppen sind zufällig ausgewählt • Düngemitteleinsatz steigert Ernteertrag: [E(Yb) = µb] > [E(Yk ) = µk ] • Führe t-Test für H0 : µb − µk = d0 = 0 durch o Ein- oder zweiseitiger Test sinnvoll? • Kausaler Effekt = Differenz von Bedingten Erwartungswert o E(Y |X = 1) − E(Y |X = 0) = Ernte mit Dünger - Ernte ohne Dünger 26 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Intervallschätzung für µY • Ȳ : Punktschätzer ⇒ keine Angabe der Schätzunsicherheit • σȲ2 gibt Schätzunsicherheit an o Schätzunsicherheit kann durch σ̂Ȳ2 geschätzt werden • Ziel: Gebe Intervall(schätzer) an, der Unsicherheit erfasst o Kombination von Ȳ und σȲ2 Ȳ − µY ∼ N (0, 1) • ZGS: z = σȲ o P (Ȳ − zα/2σȲ ≤ µY ≤ Ȳ + zα/2σȲ ) = 1 − α o zα/2 ist (zweiseitiger) kritischer Wert aus N (0, 1)-Verteilung zum Signfikanzniveau α 27 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Intervallschätzung für µY • Ersetze σȲ durch σ̂Ȳ • Intervallschätzer für µY zum Vertrauensniveau 1 − α: {Ȳ ± zα/2σ̂Ȳ } o {Ȳ ± zα/2σ̂Ȳ }: (1-α)-Konfidenzintervall • Beispiel: α = 0.05 o zα/2 = 1.96 ⇒ 95%-Konfidenzintervall für µY = {Ȳ ± 1.96σ̂Ȳ } • {Ȳ ± zα/2σ̂Ȳ } ist Intervallschätzer, d.h. eine Zufallsvariable • Werden für Ȳ und σ̂Ȳ Schätzergebnisse eingesetzt erhalten wir die Intervallschätzung für µY basierend auf unseren Daten 28 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Intervallschätzung: Interpretationen • Konkrete Intervallschätzung zu 95%-Konfidenzniveau • Falsche Interpretation o Der wahre Erwartungswert µY liegt mit 95%-Wahrscheinlichkeit im errechneten Intervall o Wieso: konkrete Intervallschätzung ist keine Zufallsvariable • Richtige Interpretation o Wenn wir unendlich viele Stichproben hätten und unendlich viele Intervallschätzungen bestimmen könnten, dann liegt in 95% der Fälle µY im geschätzten Intervall • 95%-Konfidenzintervall umfasst alle Werte µY,0 für die H0 : µY = µY,0 eines zweiseitigen t-Test nicht zum 5%-Signfikanzniveau abgelehnt wird 29 Empirischen Volkswirtschaftslehre 1.6.3 Inferenz Schätzung der Kovarianz und Korrelation • Einfache Zufallsstichprobe: (Xi, Yi), i = 1, . . . , n • Kovarianz und Korrelation sind Eigenschaften der gemeinsamen Verteilung von X und Y • Stichprobenkovarianz sXY ist Schätzer von σXY 1 Pn o sXY = (Xi − X̄)(Yi − Ȳ ) n − 1 i=1 p o sXY −→ σXY • Stichprobenkorrelation rXY ist Schätzer von ρXY sXY o rXY = sX sY p o rXY −→ ρXY 30