linear

Werbung
3. Sitzung
Eigenschaften der OLS-Schätzer
Erinnerung: OLS-Schätzer a und b werden anhand der Zufallsvariable y
ermittelt (Ann.: u und y normalverteilt)
 a und b sind ebenfalls Zufallsvariablen und unterliegen dann ebenfalls
Normalverteilung mit Erwartungswert und Varianz
 Was sagen Erwartungswert und Varianz von a und b aus?
 Man kann zeigen, dass E(a) =  und E(b) = ß,
d.h. dass die OLS-Schätzer
erwartungstreu (unverzerrt) sind,
was bedeutet, dass der
Durchschnittswert der Schätzer
beim wahren Wert  und 
liegt
a

1
Alexander Spermann
Universität Freiburg
3. Sitzung
Eigenschaften der OLS-Schätzer
Verteilung des Schätzers b

Systematische Unterschätzung
(biased estimator),
wobei  der wahre Wert und b der
Schätzer sind
2
b
b

Erwartungstreuer OLS-Schätzer
(unbiased estimator)
Alexander Spermann
Universität Freiburg
3. Sitzung
Eigenschaften der OLS-Schätzer
Weiterhin kann man zeigen, dass gilt: Der OLS-Schätzer ist ein
effizienter Schätzer = varianzminimaler Schätzer

Inefficient Estimator
b

b
Efficient Estimator
Quelle: Pindyck; Rubinfeld
3
Alexander Spermann
Universität Freiburg
3. Sitzung
Gauss-Markov Theorem (BLUE)
Unter OLS-Annahmen sind OLS-Schätzer a und b beste, lineare,
unverzerrte Schätzer
Best:
Minimum-Varianz
= effizienter Schätzer
Linear:
a und b sind Linearkombinationen
aus x und y
Unbiased:
unverzerrt
Estimator:
Schätzer
4
E(B) = ß, E(a) = 
Alexander Spermann
Universität Freiburg
3. Sitzung
4. Sitzung: Hypothesentest
Schätzgleichung:
y= + ßx+u
„Wahre“ Parameter  und ß sind unbekannt, wie kann von
Schätzwerten a und b auf wahre Parameter geschlossen werden?
H0: Nullhypothese
H1: Alternativhypothese
H0 : ß = ß0
H1 : ß ≠ ß0
ß0 kann hierbei beliebigen Wert annehmen (wichtiger Fall: ß0 = 0)
5
Alexander Spermann
Universität Freiburg
3. Sitzung
Type I Error (-Fehler)
Definition:
Wahre Nullhypothese wird verworfen.
Die Wahrscheinlichkeit P für diesen Fehler soll üblicherweise minimiert
werden.
Beispiel:
P = 0,05
Gesucht:
Verteilung für Schätzer b unter der Annahme,
dass Nullhypothese wahr ist, also ß = ß0
b normalverteilt, bei bekannter Varianz Var(b) kann b derart normiert
werden, so dass auf tabellierte Standard-Normalverteilung N(0,1)
zurückgegriffen werden kann
( ,  2 )
Problem: Var(b) nicht bekannt, sondern muss geschätzt werden!
6
Alexander Spermann
Universität Freiburg
3. Sitzung
t-Test (zweiseitig oder two-tailed)
Man kann zeigen, dass folgender Ausdruck
t-(oder „student“)-verteilt ist:
b  0
b  0
t

Vaˆ r (b ) s.e.( b )
t
wobei s.e.(b) = geschätzte Standardabweichung vom Schätzer b
Wie kommen Werte t0,025 = - 2 und t0,975 = 2 zustande? Quantile hängen normalerweise von
der Anzahl der Beobachtungen und der erklärenden Variablen ab: -2 und 2 gelten
approximativ für großes n (Stichprobengröße).
Faustregel: H0 wird abgelehnt, wenn
7
| t |
>2.
Alexander Spermann
Universität Freiburg
3. Sitzung
t-Test (zweiseitig oder two-tailed)
Intuition:
b  0
t 
 2 bedeutet, dass
s.e.( b)
t
 Differenz zwischen Schätzwert b und ß0 relativ groß ist, je größer diese Differenz, desto
eher wird natürlich H0 abgelehnt
 s.e.(b), d.h. geschätzte Standardabweichung von b relativ klein ist: Je genauer der
Schätzwert b, desto weniger wird Abweichung zwischen b und ß0 „toleriert“ und desto
eher wird H0 abgelehnt
8
Alexander Spermann
Universität Freiburg
3. Sitzung
t-Test
Beispiel:
H0 : ß = 0
b
 t
s.e.( b)
H1 : ß ≠ 0
Dieser Wert wird üblicherweise von Standard-Statistik-Software im
Regressionsoutput automatisch ausgegeben.
b  0
b  0 0.076
t


 9.558
s.e.( b) s.e.( b) 0.008
 H0 („Schulbildung hat keinen Einfluss auf Lohn“) wird abgelehnt
9
Alexander Spermann
Universität Freiburg
3. Sitzung
4. Sitzung: Hypothesentest
10
Alexander Spermann
Universität Freiburg
3. Sitzung
t-Test
Anderes Beispiel:
H0:  = 1
H1:  ≠ 1
a   0 1,0708  1 0.0708
t


 0,669
s.e.(a)
s.e.(a)
0.105886
 H0 wird nicht verworfen
11
Alexander Spermann
Universität Freiburg
3. Sitzung
Type I Error (-Fehler)
Definition:
Wahre Nullhypothese wird verworfen.
Intuition:
Je geringer das Signifikanzniveau, desto
unwahrscheinlicher ist das Risiko eines Typ I Fehlers.
Also ist z.B ein 0.1%-iges Signifikanzniveau
sicherer in bezug auf den Typ I Fehler.
Interpretation für ß0 = 0:
Wenn „wahres“ ß = 0 ist, dann wird mit nur 0,1%-iger
Wahrscheinlichkeit fälschlicherweise geschlossen, dass ß von
Null verschieden ist
12
Alexander Spermann
Universität Freiburg
3. Sitzung
Signifikanzniveau
Intuition:
Je geringer das Signifikanzniveau, desto höher ist
die Hürde, die Nullhypothese zu verwerfen.
Signifikanzniveau
 - Wahrscheinlichkeit
Standard
5%
Verschärfung
1%
Extrem hohe Hürde
13
0.1%
Alexander Spermann
Universität Freiburg
3. Sitzung
Type II Error (-Fehler)
Definition:
Falsche Nullhypothese wird nicht verworfen.
Intuition:
Je geringer das Signifikanzniveau, desto wahrscheinlicher ist das
Risiko eines Typ II Fehlers, weil die Anforderungen an das Verwerfen
der Nullhypothese steigen.
 trade-off zwischen Typ I und Typ II Fehler
Graphische Intuition:
t
Quelle: Pindyck, Rubinfeld
je geringer das Signifikanzniveau, desto größer ist die Akzeptanzregion für die
Nullhypothese, desto wahrscheinlicher ist ein Typ II Fehler
14
Alexander Spermann
Universität Freiburg
3. Sitzung
Einseitiger Test (one-tailed test)
Hypothesen:
H0: ß < (>) ß0
H1: ß > (<) ß0
t
Quelle: Pindyck, Rubinfeld
Faustregel:
H0: ß <
Grafik)
ß0
b  0
wird abgelehnt, wenn t 
 t 0,95 ~
 1,67
s.e.( b )
H0: ß >ß0 wird abgelehnt, wenn
15
(siehe
b  0
t
 t 0,05 ~
 1,67
s.e.( b )
Alexander Spermann
Universität Freiburg
3. Sitzung
Einseitiger Test (one-tailed test)
z.B. Hypothese:
H0: ß < 0
H1: ß > 0
t
Ökonomische
Begründung: negative Werte des Regressionskoeffizienten
machen ökonomisch keinen Sinn.
Quelle: Pindyck, Rubinfeld
Vorteil:
Bei gleichem Signifikanzniveau sinkt der kritische Wert tcrit.
Das heißt, die Nullhypothese wird eher verworfen als bei
einem zweiseitigem Test.
Achtung:
Das Risiko eines Typ I Fehlers bleibt gleich, nämlich 5%,
weil das Signifikanzniveau unverändert bleibt.
Aber das Risiko eines Typ II Fehlers sinkt, weil die
Nullhypothese eher verworfen wird als beim two-tailed test.
16
Alexander Spermann
Universität Freiburg
3. Sitzung
Konfidenzintervall
Konfidenzintervall : Gegenstück zum Hypothesentest
t
t
0
P [-2 < t < 2] = P [-2 <b  
s.e.( b )
P [b - 2· s.e.(b) < ß0 < b + 2 ·s.e.(b)]
17
< 2] = 0.95
= 0.95
Alexander Spermann
Universität Freiburg
3. Sitzung
Berechnung des Konfidenzintervalls
untere Grenze:
obere Grenze:
b  s.e.(b)  tcrit
b  s.e.(b)  tcrit
Bei Signifikanzniveau von 5%:
tcrit ~
2
Untergrenze : b - s.e.(b)  t crit  0,076  0,007973  2
 0,060
Obergrenze : b  s.e.(b)  t crit  0,076  0,007973  2
 0,092
Konfidenzintervall: [0,060 ; 0,092]  Wert ß0 = 0 nicht enthalten
18
Alexander Spermann
Universität Freiburg
3. Sitzung
Konfidenzintervall
Das Konfidenzintervall ist durch das gewählte Signifikanzniveau festgelegt.
Beispiel:
Signifikanzniveau
P
5%
Konfidenzintervall
1- P
95 %
1%
99 %
0,1 %
99,9 %
Die Endpunkte des Konfidenzintervalls werden durch den Schätzer b und
seine Standardabweichung bestimmt  untere und obere
Konfidenzintervallgrenzen sind Zufallsvariablen
Richtige Interpretation: Die Wahrscheinlichkeit, dass das Konfidenzintervall den
wahren Wert 0 enthält, ist 95 %.
Falsche Interpretation: Die Wahrscheinlichkeit ist 95 %, dass der wahre Wert in
diesem
Intervall liegt. Nein, diese
Wahrscheinlichkeit ist entweder 0 oder
1.
19
Alexander Spermann
Universität Freiburg
Herunterladen