3. Sitzung Eigenschaften der OLS-Schätzer Erinnerung: OLS-Schätzer a und b werden anhand der Zufallsvariable y ermittelt (Ann.: u und y normalverteilt) a und b sind ebenfalls Zufallsvariablen und unterliegen dann ebenfalls Normalverteilung mit Erwartungswert und Varianz Was sagen Erwartungswert und Varianz von a und b aus? Man kann zeigen, dass E(a) = und E(b) = ß, d.h. dass die OLS-Schätzer erwartungstreu (unverzerrt) sind, was bedeutet, dass der Durchschnittswert der Schätzer beim wahren Wert und liegt a 1 Alexander Spermann Universität Freiburg 3. Sitzung Eigenschaften der OLS-Schätzer Verteilung des Schätzers b Systematische Unterschätzung (biased estimator), wobei der wahre Wert und b der Schätzer sind 2 b b Erwartungstreuer OLS-Schätzer (unbiased estimator) Alexander Spermann Universität Freiburg 3. Sitzung Eigenschaften der OLS-Schätzer Weiterhin kann man zeigen, dass gilt: Der OLS-Schätzer ist ein effizienter Schätzer = varianzminimaler Schätzer Inefficient Estimator b b Efficient Estimator Quelle: Pindyck; Rubinfeld 3 Alexander Spermann Universität Freiburg 3. Sitzung Gauss-Markov Theorem (BLUE) Unter OLS-Annahmen sind OLS-Schätzer a und b beste, lineare, unverzerrte Schätzer Best: Minimum-Varianz = effizienter Schätzer Linear: a und b sind Linearkombinationen aus x und y Unbiased: unverzerrt Estimator: Schätzer 4 E(B) = ß, E(a) = Alexander Spermann Universität Freiburg 3. Sitzung 4. Sitzung: Hypothesentest Schätzgleichung: y= + ßx+u „Wahre“ Parameter und ß sind unbekannt, wie kann von Schätzwerten a und b auf wahre Parameter geschlossen werden? H0: Nullhypothese H1: Alternativhypothese H0 : ß = ß0 H1 : ß ≠ ß0 ß0 kann hierbei beliebigen Wert annehmen (wichtiger Fall: ß0 = 0) 5 Alexander Spermann Universität Freiburg 3. Sitzung Type I Error (-Fehler) Definition: Wahre Nullhypothese wird verworfen. Die Wahrscheinlichkeit P für diesen Fehler soll üblicherweise minimiert werden. Beispiel: P = 0,05 Gesucht: Verteilung für Schätzer b unter der Annahme, dass Nullhypothese wahr ist, also ß = ß0 b normalverteilt, bei bekannter Varianz Var(b) kann b derart normiert werden, so dass auf tabellierte Standard-Normalverteilung N(0,1) zurückgegriffen werden kann ( , 2 ) Problem: Var(b) nicht bekannt, sondern muss geschätzt werden! 6 Alexander Spermann Universität Freiburg 3. Sitzung t-Test (zweiseitig oder two-tailed) Man kann zeigen, dass folgender Ausdruck t-(oder „student“)-verteilt ist: b 0 b 0 t Vaˆ r (b ) s.e.( b ) t wobei s.e.(b) = geschätzte Standardabweichung vom Schätzer b Wie kommen Werte t0,025 = - 2 und t0,975 = 2 zustande? Quantile hängen normalerweise von der Anzahl der Beobachtungen und der erklärenden Variablen ab: -2 und 2 gelten approximativ für großes n (Stichprobengröße). Faustregel: H0 wird abgelehnt, wenn 7 | t | >2. Alexander Spermann Universität Freiburg 3. Sitzung t-Test (zweiseitig oder two-tailed) Intuition: b 0 t 2 bedeutet, dass s.e.( b) t Differenz zwischen Schätzwert b und ß0 relativ groß ist, je größer diese Differenz, desto eher wird natürlich H0 abgelehnt s.e.(b), d.h. geschätzte Standardabweichung von b relativ klein ist: Je genauer der Schätzwert b, desto weniger wird Abweichung zwischen b und ß0 „toleriert“ und desto eher wird H0 abgelehnt 8 Alexander Spermann Universität Freiburg 3. Sitzung t-Test Beispiel: H0 : ß = 0 b t s.e.( b) H1 : ß ≠ 0 Dieser Wert wird üblicherweise von Standard-Statistik-Software im Regressionsoutput automatisch ausgegeben. b 0 b 0 0.076 t 9.558 s.e.( b) s.e.( b) 0.008 H0 („Schulbildung hat keinen Einfluss auf Lohn“) wird abgelehnt 9 Alexander Spermann Universität Freiburg 3. Sitzung 4. Sitzung: Hypothesentest 10 Alexander Spermann Universität Freiburg 3. Sitzung t-Test Anderes Beispiel: H0: = 1 H1: ≠ 1 a 0 1,0708 1 0.0708 t 0,669 s.e.(a) s.e.(a) 0.105886 H0 wird nicht verworfen 11 Alexander Spermann Universität Freiburg 3. Sitzung Type I Error (-Fehler) Definition: Wahre Nullhypothese wird verworfen. Intuition: Je geringer das Signifikanzniveau, desto unwahrscheinlicher ist das Risiko eines Typ I Fehlers. Also ist z.B ein 0.1%-iges Signifikanzniveau sicherer in bezug auf den Typ I Fehler. Interpretation für ß0 = 0: Wenn „wahres“ ß = 0 ist, dann wird mit nur 0,1%-iger Wahrscheinlichkeit fälschlicherweise geschlossen, dass ß von Null verschieden ist 12 Alexander Spermann Universität Freiburg 3. Sitzung Signifikanzniveau Intuition: Je geringer das Signifikanzniveau, desto höher ist die Hürde, die Nullhypothese zu verwerfen. Signifikanzniveau - Wahrscheinlichkeit Standard 5% Verschärfung 1% Extrem hohe Hürde 13 0.1% Alexander Spermann Universität Freiburg 3. Sitzung Type II Error (-Fehler) Definition: Falsche Nullhypothese wird nicht verworfen. Intuition: Je geringer das Signifikanzniveau, desto wahrscheinlicher ist das Risiko eines Typ II Fehlers, weil die Anforderungen an das Verwerfen der Nullhypothese steigen. trade-off zwischen Typ I und Typ II Fehler Graphische Intuition: t Quelle: Pindyck, Rubinfeld je geringer das Signifikanzniveau, desto größer ist die Akzeptanzregion für die Nullhypothese, desto wahrscheinlicher ist ein Typ II Fehler 14 Alexander Spermann Universität Freiburg 3. Sitzung Einseitiger Test (one-tailed test) Hypothesen: H0: ß < (>) ß0 H1: ß > (<) ß0 t Quelle: Pindyck, Rubinfeld Faustregel: H0: ß < Grafik) ß0 b 0 wird abgelehnt, wenn t t 0,95 ~ 1,67 s.e.( b ) H0: ß >ß0 wird abgelehnt, wenn 15 (siehe b 0 t t 0,05 ~ 1,67 s.e.( b ) Alexander Spermann Universität Freiburg 3. Sitzung Einseitiger Test (one-tailed test) z.B. Hypothese: H0: ß < 0 H1: ß > 0 t Ökonomische Begründung: negative Werte des Regressionskoeffizienten machen ökonomisch keinen Sinn. Quelle: Pindyck, Rubinfeld Vorteil: Bei gleichem Signifikanzniveau sinkt der kritische Wert tcrit. Das heißt, die Nullhypothese wird eher verworfen als bei einem zweiseitigem Test. Achtung: Das Risiko eines Typ I Fehlers bleibt gleich, nämlich 5%, weil das Signifikanzniveau unverändert bleibt. Aber das Risiko eines Typ II Fehlers sinkt, weil die Nullhypothese eher verworfen wird als beim two-tailed test. 16 Alexander Spermann Universität Freiburg 3. Sitzung Konfidenzintervall Konfidenzintervall : Gegenstück zum Hypothesentest t t 0 P [-2 < t < 2] = P [-2 <b s.e.( b ) P [b - 2· s.e.(b) < ß0 < b + 2 ·s.e.(b)] 17 < 2] = 0.95 = 0.95 Alexander Spermann Universität Freiburg 3. Sitzung Berechnung des Konfidenzintervalls untere Grenze: obere Grenze: b s.e.(b) tcrit b s.e.(b) tcrit Bei Signifikanzniveau von 5%: tcrit ~ 2 Untergrenze : b - s.e.(b) t crit 0,076 0,007973 2 0,060 Obergrenze : b s.e.(b) t crit 0,076 0,007973 2 0,092 Konfidenzintervall: [0,060 ; 0,092] Wert ß0 = 0 nicht enthalten 18 Alexander Spermann Universität Freiburg 3. Sitzung Konfidenzintervall Das Konfidenzintervall ist durch das gewählte Signifikanzniveau festgelegt. Beispiel: Signifikanzniveau P 5% Konfidenzintervall 1- P 95 % 1% 99 % 0,1 % 99,9 % Die Endpunkte des Konfidenzintervalls werden durch den Schätzer b und seine Standardabweichung bestimmt untere und obere Konfidenzintervallgrenzen sind Zufallsvariablen Richtige Interpretation: Die Wahrscheinlichkeit, dass das Konfidenzintervall den wahren Wert 0 enthält, ist 95 %. Falsche Interpretation: Die Wahrscheinlichkeit ist 95 %, dass der wahre Wert in diesem Intervall liegt. Nein, diese Wahrscheinlichkeit ist entweder 0 oder 1. 19 Alexander Spermann Universität Freiburg