Signifikanz von Parametern: der t-Test

Werbung
Signifikanz von Parametern: der
t-Test
Dan Li
Gliederung
™
Regressionsanalyse
1.Defiinition
2. Funktion
3. Modelltypen
™
Hypothesentest
Durchführung der Hypothesentest
™
t-Test
1.Definition
2.Signifikanz einzelner Regressoren mittels t-Tes
3.Beziehung für den kritischen Bereich
4.Durchführung
™
™
Beispiel und Lösung
Quellen
Definition
™ Die
Regressionsanalyse :
-ist ein statistisches Analyseverfahren.
-Ziel ist es, Beziehungen zwischen einer
abhängigen und einer oder mehrerer
unabhängigen Variablen festzustellen.
Regressionsfunktion
Einfache lineare Regression:
Ŷ = b0 + b1X
™ Multiple lineare Regression:
Ŷ = b0 + b1X + b2X2 + …+ bjXj + bJXJ
™ Ŷ = Schätzung der abhängigen Variablen Y
™ b0 = Konstantes Glied
™ b1, b2 …bj,bJ= Regressionskoeffizient
™ X = unabhängige Variable
™
Modelltypen
™
Einfache Regression mit linearem Zusammenhang:
Yi = f(Xi) = a0 + a1Xi + ei
Hypothesentest
A0: H0 beibehalten, H0 ist mit der Beobachtung
vereinbar
™ A1: H0 ablehnen, H1 ist signifikant (im Sinne von
„statistisch nachgewiesen“)
™
Wirklichkeit H0 ist richtig
Testergebnis
H1 ist richtig
H0 beibehalten
Kein Fehler
Fehler 2.Art
H0 ablehnen,
H1 signifikant
Fehler 1.Art
Kein Fehler
(Wahrscheinlichkeit:α% )
Die Durchführung eines Hypothesentests :
die 5 Schritte
1 Hypothesenaufstellung H0 und H1
™ 2 Festlegung der Irrtumswahrscheinlichkeit
™ 3 Bestimmung einer geeigneten Prüfgröße
™ 4 Konstruktion des kritischen Bereichs
™ 5 Vergleichung der berechneten Prüfgröße
mit dem kritischen Bereich
™
Definition des t-Tests
™ Der t-Test ist ein Hypothesentest
™
Der t-Test ist auch ein typisches Beispiel dafür,
dass es für bestimmte Hypothesentests durchaus
sinnvoll sein kann, den Test als einseitige oder
als zweiseitige Fragestellung zu formulieren.
Signifikanz einzelner Regressoren
mittels t-Test
™
T-Statistik
ˆ
β
= ‬ βˆj
tj =
s x jj
ŜE
j
βˆ j= Regressionskoeffizient des j-ten Regressors
s x jj = Standardfehler von βˆ j
S xy
β̂ = y − β̂ x
βˆ = S x
2
0
2
ŜE( β̂ j ) = s
xjj
1
Beziehung für den kritischen Bereich
™
™
Man arbeitet bei der formulierten einseitigen Fragestellung
also mit dem α-Quantil und nicht mit dem α/2-Quantil der tVerteilung. Die Nullhypothese H0 wird nur dann abgelehnt,
wenn gilt: tj > tn-(k+1);1- α .
Diese p Values unmittelbar mit den α-Wahrscheinlichkeiten
verglichen werden, da die folgenden Äquivalenzbeziehungen gelten:
p Value/2>α/2 ↔ІtjІ<tn-(k+1);1-α/2 bzw.–ІtjІ >tn-(k+1);α/2
→ Beibehaltung H0
p Value/2<α/2 ↔ІtjІ>tn-(k+1);1-α/2 bzw.–ІtjІ <tn-(k+1);α/2
→ Ablehnung H0
Die Durchführung des t-Tests:
Die 5 Arbeitsschritte
1 Formulierung der geeigneten Hypothesen
™ 2 Festlegung der Irrtumswahrscheinlichkeit α
™ 3 Festlegung einer geeigneten Prüfgröße
™ 4 Konstruktion des kritischen Bereiches
™ 5 Berechnung der entsprechenden Prüfgröße t
und Entscheidung über H0
™
Beispiel
™
Im folgenden Beispiel sollen die jährlichen DAXVeränderungen (∆DAX) mit Hilfe der jährlichen
Veränderungsraten des Bruttoinlandproduktes (∆BIP) und
der Exporte (∆EXP) mittels eines linearen Regressionsmodells erklärt werden.
∆DAX
∆BIP
∆EXP
1 (1993-1994)
5
2
-1
2 (1994-1995)
-2
-1
3
3 (1995-1996)
3
0
1
4 (1996-1997)
7
1
2
t=1,...,4
™
Die Regressionsgleichung lautet in diesem Falle:
yt = β0 + β1xt + εt ,
t = 1,...,n
b̂ =
⎡2 ⎤
⎥
⎢
⎢⎣2,5⎥⎦ SˆE βˆ 0 = 1.42
( )
Lösung
SˆE(βˆ ) = 1,162
1
1.H0:β0=0 gegen H1:β0≠0 bzw.H0:β1=0 gegen H1:β1≠0
2.α=0,05,tj > tn-(k+1);1-α/2 bzw. tj > tn-(k+1);α/2
tn-(k+1);1-α/2= t4-(1+1);0,975 = 4,303
tj>tn-(k+1);α/2= t4-(1+1);0,025 = -4,303
2
3.t0=
=1,405
1 , 423
t 1=
2,5
=2,151
1,162
Die ermittelten Werte für beide Regressionsparameter sind weder größer als
4,303, noch kleiner als -4,303. Damit kann die Nullhypothese, dass die
Regressionskonstante β0 einen Wert von null besitzt, nicht verworfen werden.
Die gleiche Aussage gilt für den Regressionskoeffizienten β1.
Quellen
Poddig Th.u.a: Statistik, Ökonometrie,
Optimierung, 2.Aufl.,Bad Soden 2001
™ Backhaus. Erichson, Plinke.Weiber: Multivariate
Analysemethoden, 10.Aufl.,Springer
™ http://de.wikipedia.org/wiki/Statistischer_Test
™ David Schneider, Markus Kettern „ SeminarData
Mining and Prediction“ WS 04/05, Institut für
Informatik Freie Universität
™
Herunterladen