Document

Werbung
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Einfache Zufallsstichprobe
• Stock & Watson: Kap. 2.5-3.6
• Definition einer einfachen Zufallsstichprobe von n Zufallsvariablen:
Y1, . . . Yn sind identisch und unabhängig verteilte Zufallsvariablen
o Wir haben n unabhängige Ziehungen (Ziehen mit Zurücklegen) aus
einer Verteilung ⇒ ,,i.i.d. draws”
o identisch: Yi0s folgen gleicher Verteilung
o unabhängig: Yi0s sind unabhängig voneinander
1
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Einfache Zufallsstichprobe
• Beispiele und Gegenbeispiele
o zufällige Auswahl von 20 Arbeitstagen aus dem letzten Jahr zur
Ermittlung der durchschnittlichen Pendlerfahrzeit
o Auswahl von 20 aufeinander folgenden Arbeitstagen zur Ermittlung der
durchschnittlichen Pendlerfahrzeit: Unabhängigkeit?
o unabhängige Auswahl von Arbeitnehmer für Arbeitsmarktstudie:
Identische Verteilung?
2
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Schätzer
• Wofür können wir einfache Zufallsstichproben nutzen?
o Um etwas über die Eigenschaften der Verteilung bzw. die
interessierende Grundgesamtheit zu lernen, die durch die Verteilung
beschrieben wird.
Z.B. Erwartungswert
• Wie können wir etwas lernen?
o Durch die Anwendung von (sinnvollen) Schätzern bzw. Schätzregeln.
Pn
Z.B. Stichprobenmittel Ȳ = 1/n i=1 Yi
• Wie können wir Schätzer interpretieren?
• Welche Eigenschaften von Schätzern sind wichtig?
3
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Interpretation von Schätzern
• Schätzer ist eine Funktion von Zufallsvariablen
• Beispiel für Schätzer: Stichprobenmittel Ȳ = 1/n
Pn
i=1 Yi
• Ȳ ist unser Schätzer bzw. Schätzregel
o Ȳ ist eine Zufallsvariable! da (lineare) Funktion von Zufallsvariablen
• Schätzung bzw. Schätzergebnis ȳ = 1/n
Pn
i=1 yi
o ȳ ist keine Zufallsvariable, sondern ein Zahlenwert! da auf Daten
basierend
• Merke: Schätzer sind Zufallsvariablen, Schätzungen nicht!
4
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Eigenschaften von Schätzern
• Wichtige Eigenschaften von Schätzern (in endlichen Stichproben)
o Erwartungswert ⇒ Erwartungstreue
o Varianz ⇒ Effizienz
o Verteilung ⇒ Hypothesentests
• Eigenschaften von Schätzern werden bestimmt durch Annahmen über die
Stichprobe Y1, . . . Yn
• Annahme: einfache Zufallsstichprobe
5
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Asymptotische Eigenschaften von Schätzern
• Eigenschaften in großen Stichproben: Stichprobenumfang n → ∞
o Asymptotischer Erwartungswert und Asymptotische Varianz
o Asymptotische Verteilung
o Konsistenz
6
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Erwartungstreue
• Ein Schätzer θ̂ ist erwartungstreu (unverzerrt) bzgl. eines Parameters θ,
falls E(θ̂) = θ
• Erwartungstreue = Wir machen im Mittel keinen Fehler
(wenn wir unendlich oft Stichproben vom Umfang n ziehen könnten)
• Verzerrung (Bias): E(θ̂) − θ
• Beispiel: Stichprobenmittel
o Einfache Zufallsstichprobe Y1, . . . Yn aus einer Verteilung mit
Erwartungswert µY und Varianz σY2 :
E(Yi) = µY und Var(Yi) = σY2
Pn
o Schätzer Ȳ = 1/n i=1 Yi
o Man kann zeigen: E(Ȳ ) = µY
7
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Effizienz
• Ein erwartungstreuer Schätzer ist effizient, falls es keinen anderen
erwartungstreuen Schätzer gibt, der eine kleinere Varianz hat
• Zwei erwartungstreue Schätzer θ̂ und θ̃
o θ̂ ist effizient, falls Var(θ̂) ≤ Var(θ̃)
o θ̂ ist effizienter als θ̃, falls Var(θ̂) < Var(θ̃)
o θ̂ und θ̃ sind effizient, falls Var(θ̂) = Var(θ̃)
• Effizienzaussagen immer nur für bestimmte Modellannahmen möglich
o Einfache Zufallsstichprobe: Ȳ ist der beste lineare unverzerrte
Schätzer (BLUE) für µY
o Var(Ȳ ) = σȲ2 = σY2 /n
8
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Verteilung
• Exakte Verteilung bzw. Verteilung in endlichen Stichproben eines
Schätzers
o Verteilung, die die Eigenschaften des Schätzers für eine Stichprobe
vom Umfang n beschreibt
• Ableitung der exakten Verteilung eines Schätzers ist häufig sehr schwierig
• Ableitung wird vereinfacht durch explizite Verteilungsannahme
bzgl. Grundgesamtheit (z.B. Normalverteilung)
• Beispiel: Yi ∼ iidN (µY , σY2 ), i = 1, . . . , n
Pn
o Ȳ = 1/n i=1 Yi ist normalverteilt, da (gewichtete) Summe von
n unabhängig normalverteilten Zufallsvariablen
o Ȳ ∼ N (µY , σȲ2 )
9
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Asymptotische Analyse
• Bestimmung der exakten Eigenschaften (Erwartungswert, Varianz,
Verteilung) von Schätzern für endliche Stichproben
o ist oft sehr schwierig abzuleiten oder gar unmöglich (insbesondere
Verteilung)
o ist oft nur für sehr strenge Annahmen möglich (z.B. bei
Normalverteilungsannahme)
o führt oft zu nicht brauchbaren Ergebnissen (z.B. Verteilung, die von
unbekannten Paramtern abhängt)
• Ausweg: asymptotische Analyse
o Eigenschaften der Schätzer für n → ∞
10
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Asymptotische Analyse
• Asymptotische Analyse
o Bestimmung der Eigenschaften für sehr große Stichproben: n → ∞
o Herleitung vereinfacht sich oft
o Weniger strenge Annahmen nötig (z.B. keine Normalverteilungsannahme)
• Beachte: Nur approximative Eigenschaften
• Wie gut funktioniert asymptotische Approximation?
o Keine generelle Aussagen möglich
o Simulationen mit generierten Daten ermöglichen gewisse Abschätzung
• Hilfsmittel asymptotischer Analyse:
o Gesetz der großen Zahlen und Zentraler Grenzwertsatz
11
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Konsistenz/ Konvergenz von Schätzern
• Schätzer θ̂ ist konsistent, falls sich θ̂ dem Parameter θ für größer
werdende Stichproben immer mehr annähert
o limn→∞ P (|θ̂ − θ| ≤ c) = 1
o θ̂ konvergiert (in Wahrscheinlichkeit) gegen θ
p
o plim θ̂ = θ oder θ̂ −→ θ
o Für n → ∞ schätzen wir θ (mit einer Stichprobe) korrekt, nicht nur im
Mittel
• Nachweis der Konsistenzeigenschaft
o Falls E(θ̂) und Var(θ̂) existieren
θ̂ ist konsistent, falls limn→∞ E(θ̂) = θ und limn→∞ Var(θ̂) = 0
o Gesetz der Großen Zahl je nach getroffenen Annahmen bezüglich
Stichprobe von Zufallsvariablen
12
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Konsistenz des Stichprobenmittels
• Einfache Zufallsstichprobe: Yi ∼ i.i.d.(µY , σY2 )
o Zusätzliche Annahme: σY2 < ∞
• Ȳ = 1/n
Pn
2
Y
mit
E(
Ȳ
)
=
µ
und
Var(
Ȳ
)
=
σ
i
Y
Y /n
i=1
o limn→∞ E(Ȳ ) = µY
o limn→∞ Var(Ȳ ) = 0
o Folglich ist Ȳ ein konsistenter Schätzer für µY
p
o Ȳ −→ µY
• Gesetz der Großen Zahl für einfache Zufalsstichprobe
p
o Falls Yi ∼ i.i.d.(µY , σY2 ) und σY2 < ∞, folgt Ȳ −→ µY
13
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Asymptotische Verteilung des Stichprobenmittels
• Zentraler Grenzwertsatz besagt, dass Verteilung von Ȳ sehr gut durch
eine Normalverteilung approximiert werden kann, falls n sehr groß ist
o Ȳ konvergiert (in Verteilung) gegen eine Normalverteilung für n → ∞
d
o ,,Ȳ −→ N (µY , σȲ2 )”, mit σȲ2 = σY2 /n
o Da limn→∞ σȲ2 = 0, wird oft die standardisierte Version von Ȳ
verwendet:
Ȳ − µY d
−→ N (0, 1)
σȲ
• Beachte: Normalverteilungsannahme für Yi nicht notwendig
o Voraussetzung lediglich Yi ∼ i.i.d.(µY , σY2 ) und σY2 < ∞
• Zentrale Grenzwertsätze existieren auch für andere Formen von
Stichproben
14
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Hypothesentests
• Hypothesentests bzgl. Erwartungswertes der Grundgesamtheit
• Typische Fragestellungen
o Entspricht der durchschnittliche Stundenlohn eines
Hochschulabsolventen 20 Euro?
o Verdienen Männer mehr als Frauen?
• Fragen können unter Verwendung von Daten mit Hilfe von
Hypothesentests bezüglich µY beantwortet werden
• ,,Bestandteile” eines Hypothesentests
o Null- und Alternativhypothesen
o Teststatistik
o Verteilung der Teststatistik (wenn Nullhypothese gilt)
15
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Null- und Alternativhypothese
• Nullhypothese: H0 : E(Y ) = µY = µY,0
o Interessierende Hypothese, die überprüft werden soll
o Es wird getestet, ob der Erwartungswert einer ZV/Grundgesamtheit
einem bestimmten Wert µY,0 enstpricht
o µY,0 ist der überprüfte Wert, z.B. 20e Stundenlohn
• Alternativhypothese: H1 : E(Y ) = µY 6= µY,0
o Spezifiziert, was im Fall der Ungültigkeit von H0 gilt
o Zweiseitige Alternativhypothese: µY > µY,0 oder µY < µY,0
• Ziel: Auf Basis der Daten entscheiden, ob Nullhypothese zu Gunsten der
Alternativhypothese abgelehnt werden muss oder nicht
o Nullhypothese wird nicht angenommen, sonder nur nicht abgelehnt
16
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Wann sollen wir Nullhypothese ablehnen?
• Beispiel: Stichprobe zu Stundenlöhnen von Hochschulabsolventen
o Nullhypothese: H0 : µY = 20e
o Schätzergebnis ȳ = 22.64e
o Brauchen Referenz um entscheiden zu können, ob 22.64e signifikant
verschieden von 20e ist
o Anders formuliert: Wie (un)wahrscheinlich ist es einen Stundenlohn
von 22.64e zu beobachten, falls der wahre Durchschnittslohn 20e ist?
• Referenz: Verteilung von Ȳ unter Nullyhpothese (wenn Nullhypothese gilt)
• Zentraler Grenzwertsatz: falls n groß ist, gilt
Ȳ − µY,0 d
d
Ȳ −→ N (µY,0, σȲ2 ) bzw. z =
−→ N (0, 1)
σȲ
17
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Teststatistik, Verteilung und p-Wert
• Berechne mit Hilfe der Normalverteilung, wie (un)wahrscheinlich es ist
einen Stundenlohn von 22.64e zu beobachten
o Bevorzuge Standardnormalverteilung
• z ist Teststatistik und N (0, 1) ist Verteilung von z unter H0
¯ ¯
¯¶
µ¯
¯ Ȳ − µY,0 ¯ ¯ ȳ − µY,0 ¯
¯>¯
¯ = p-Wert
• Zweiseitiger Test: Berechne P ¯¯
¯ ¯ σ
¯
σȲ
Ȳ
• Bei welchem p-Wert ist ȳ ist unwahrscheinlich?
o Häufigste Wahl: Wenn p-Wert ≤ 5%, Alternativen: 10% oder 1%
o Signifikanzniveau
• Beispiel: µY,0 = 20, n = 200 und ȳ = 22.64: Welche Information fehlt?
18
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Varianzschätzung
√
• σȲ2 = σY2 /n bzw. σȲ = σY / n muss geschätzt werden
o σȲ ist Standardfehler von Ȳ
• Stichprobenvarianz s2Y ist Schätzer für Varianz der Grundgesamtheit σY2
1 Pn
2
o
=
(Y
−
Ȳ
)
i
n − 1 i=1
o Teile durch n − 1 wegen Schätzung von µY durch Ȳ :
Verlust eines Freiheitsgrades und es gilt E(s2Y ) = σY2
s2Y
p
o s2Y ist ein konsistenter Schätzer: s2Y −→ σY2
√
• Schätze Standardfehler von Ȳ durch σ̂Ȳ = sY / n
19
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
t-Statistik
• Neue Teststatistik t =
Ȳ − µY,0 d
−→ N (0, 1)
σ̂Ȳ
o Verteilung von t folgt aus ZGS und Konsistenz von σ̂Ȳ
• Name kommt von t-Verteilung: t-Statistik ist t-verteilt, falls Yi’s
normalverteilt sind
¯ ¯
¯¶
µ¯
¯ Ȳ − µY,0 ¯ ¯ ȳ − µY,0 ¯
¯>¯
¯ = p-Wert
• Zweiseitiger Test: Berechne P ¯¯
¯
¯
σ̂Ȳ
σȲ ¯
• Beispiel: µY,0 = 20, ȳ = 22.64, sY = 18.14, n = 200
√
√
o σ̂Ȳ = sY / n = 18.14/ 200 = 1.28
o tact = (22.64 − 20)/1.28 = 2.06, p-Wert = 0.039
20
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Alternative Testanwendung: Kritische Werte
• Vergleich von Wert der Teststatistik und kritischem Wert
• Kritischer Wert ergibt sich aus Verteilung, Signifikanzniveau und
zweiseitiger Alternativhypothese
• Standardnormalverteilung N (0, 1)
o 5%-Signifikanzniveau: kritischer Wert 1.96
• Lehne H0 ab, falls |tact| ≥ 1.96
• Approximation durch Normalverteilung kann in kleinen Stichproben
inadäquat sein
21
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Einseitige Tests
• Spezifische Alternativhypothese: z.B. H1 : µY > 0
o Beachte: Nullhypothese ändert sich zu H0 : µY ≤ 0
• p-Wert Berechnung bezieht sich nur auf eine Seite der Verteilung
µ
• Einseitiger Test: Berechne P
Ȳ − µY,0 ȳ − µY,0
>
σ̂Ȳ
σȲ
¶
= p-Wert
o Kritischer Wert für 5%-Signifikanzniveau ist 1.645
o Äquivalent für Alternativhypothese H1 : µY < 0
22
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Fehler 1. und 2. Art
• Fehler 1. Art: Ablehnung richtiger Nullhypothese
• Fehler 2. Art: Nichtablehnung falscher Nullhypothese
• Signifikanzniveau entspricht vorgegebener Wahscheinlichkeit des Fehler
1. Art
o Beachte: Gilt in unserem Fall nur für n −→ ∞
• Größe eines Tests: Wahrscheinlichkeit, richtige Nullhypothese
abzulehnen
• Güte eines Tests: Wahrscheinlichkeit, falsche Nullhypothese abzulehnen
23
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Test auf Mittelwertunterschiede
• Ökonomische Frage: Verdienen Männer mehr als Frauen?
• Statistische Frage: Ist der Erwartungswert der Lohnverteilung der Männer
(Grundgesamtheit 1) höher als der der Frauen (Grundgesamtheit 2)?
• Null- und Alternativhypothese: H0 : µm − µw = d0 vs. H1 : µm − µw 6= d0
• d0 = 0: Männer und Frauen verdienen im Mittel gleich viel
• Probleme: Zwei unbekannte Erwartungswerte und Verteilung
o Schätzer: Ȳm und Ȳw ⇒ Ȳm − Ȳw ist Schätzer von µm − µw
d
d
2
2
o ZGS: Ȳm −→ N (µm, σm
/nm) und Ȳw −→ N (µw , σw
/nw )
Annahme: Ȳm und Ȳw unabhängig
d
2
2
⇒ (Ȳm − Ȳw ) −→ N [(µm − µw ), (σm
/nm + σw
/nw )]
24
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Test auf Mittelwertunterschiede
• Verteilung unter H0 : µm − µw = d0
d
2
2
o (Ȳm − Ȳw ) −→ N [d0, (σm
/nm + σw
/nw )]
2
2
/nm + σw
/nw
• Schätzer für σm
o s2m/nm + s2w /nw
q
s2
s2w
o σ̂mw = nm
+
nw
m
• t-Statistik
(Ȳm − Ȳw ) − d0 d
t=
−→ N (0, 1)
σ̂mw
• Testanwendung wie für übliche t-Tests (p-Werte, ein- oder zweiseitiger
Test etc.)
25
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Test auf Mittelwertunterschiede
• Tests auf Mittelwertunterschiede können zur Feststellung von kausalen
Effekten angewendet werden
• Beispiel: Erntemenge bei Düngemitteleinsatz
o Behandlungsgruppe: Felder mit Düngemitteleinsatz
o Kontrollgruppe: Felder ohne Düngemitteleinsatz
o Randomisiertes Experiment: Gruppen sind zufällig ausgewählt
• Düngemitteleinsatz steigert Ernteertrag: [E(Yb) = µb] > [E(Yk ) = µk ]
• Führe t-Test für H0 : µb − µk = d0 = 0 durch
o Ein- oder zweiseitiger Test sinnvoll?
• Kausaler Effekt = Differenz von Bedingten Erwartungswert
o E(Y |X = 1) − E(Y |X = 0) = Ernte mit Dünger - Ernte ohne Dünger
26
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Intervallschätzung für µY
• Ȳ : Punktschätzer ⇒ keine Angabe der Schätzunsicherheit
• σȲ2 gibt Schätzunsicherheit an
o Schätzunsicherheit kann durch σ̂Ȳ2 geschätzt werden
• Ziel: Gebe Intervall(schätzer) an, der Unsicherheit erfasst
o Kombination von Ȳ und σȲ2
Ȳ − µY
∼ N (0, 1)
• ZGS: z =
σȲ
o P (Ȳ − zα/2σȲ ≤ µY ≤ Ȳ + zα/2σȲ ) = 1 − α
o zα/2 ist (zweiseitiger) kritischer Wert aus N (0, 1)-Verteilung
zum Signfikanzniveau α
27
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Intervallschätzung für µY
• Ersetze σȲ durch σ̂Ȳ
• Intervallschätzer für µY zum Vertrauensniveau 1 − α: {Ȳ ± zα/2σ̂Ȳ }
o {Ȳ ± zα/2σ̂Ȳ }: (1-α)-Konfidenzintervall
• Beispiel: α = 0.05
o zα/2 = 1.96 ⇒ 95%-Konfidenzintervall für µY = {Ȳ ± 1.96σ̂Ȳ }
• {Ȳ ± zα/2σ̂Ȳ } ist Intervallschätzer, d.h. eine Zufallsvariable
• Werden für Ȳ und σ̂Ȳ Schätzergebnisse eingesetzt erhalten wir
die Intervallschätzung für µY basierend auf unseren Daten
28
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Intervallschätzung: Interpretationen
• Konkrete Intervallschätzung zu 95%-Konfidenzniveau
• Falsche Interpretation
o Der wahre Erwartungswert µY liegt mit 95%-Wahrscheinlichkeit im
errechneten Intervall
o Wieso: konkrete Intervallschätzung ist keine Zufallsvariable
• Richtige Interpretation
o Wenn wir unendlich viele Stichproben hätten und unendlich viele
Intervallschätzungen bestimmen könnten, dann liegt in 95% der Fälle
µY im geschätzten Intervall
• 95%-Konfidenzintervall umfasst alle Werte µY,0 für die H0 : µY = µY,0
eines zweiseitigen t-Test nicht zum 5%-Signfikanzniveau abgelehnt wird
29
Empirischen Volkswirtschaftslehre
1.6.3 Inferenz
Schätzung der Kovarianz und Korrelation
• Einfache Zufallsstichprobe: (Xi, Yi), i = 1, . . . , n
• Kovarianz und Korrelation sind Eigenschaften der gemeinsamen
Verteilung von X und Y
• Stichprobenkovarianz sXY ist Schätzer von σXY
1 Pn
o sXY =
(Xi − X̄)(Yi − Ȳ )
n − 1 i=1
p
o sXY −→ σXY
• Stichprobenkorrelation rXY ist Schätzer von ρXY
sXY
o rXY =
sX sY
p
o rXY −→ ρXY
30
Herunterladen