9 Prinzipien der statistischen Hypothesenprüfung

Werbung
9 Prinzipien der statistischen
Hypothesenprüfung
Prinzipien der statistischen
Hypothesenprüfung
• Bei der Schätzung eines Populationsparamters soll dessen Wert aus
Stichprobendaten erschlossen werden.
Wenn es dagegen darum geht, die
Korrektheit von Vermutungen über die
Werte solcher Parameter zu prüfen,
müssen statistische Tests durchgeführt
werden.
9.1 Die Logik der statistischen
Hypothesenprüfung
Kennwertverteilung bei Gültigkeit der
Null- und der Alternativhypothese
• Beim statistischen Testen wird immer ein
Hypothesenpaar betrachtet: die
Nullhypothese H0 und die Alternativhypothese H1.
Dabei behaupten Null- und Alternativhypothese wechselseitig das Gegenteil.
Kennwertverteilung bei Gültigkeit der
Null- und der Alternativhypothese
• Die Prüfung der H. erfolgt erfolgt anhand
von Stichprobendaten. Das empirische
Kriterium ist dann ein Stichprobenkennwert, der die beiden folgenden
Bedingungen erfüllen muss:
– Die Wahrscheinlichkeitsverteilung des
Kennwerts muß bekannt werden
Kennwertverteilung bei Gültigkeit der
Null- und der Alternativhypothese
– Seine Kennwertverteilung muss sich bei
Gültigkeit der Nullh. Von der Kennwertverteilung bei Gültigkeit der Alternativh.
unterscheiden.
In erster Linie bedeutet das, dass der
Erwartungswert der Kennwertverteilung bei
Gültigkeit der Nullh. einen anderen Wert
aufweist als bei Gültigkeit der Alternativh.
S
T
T
U
V
W
X
Y
Z
[
\
]
^
`
q
_
a
r
s
t
a
u
b
v
`
w
c
x
y
d
`
e
t
`
z
c
{
y
d
w
`
f
x
g
h
t
a
r
i
|
`
}
a
~
e
q
j
{

a
s
k
y
}
d
r
f
l
v

m
n
r
c
s
t
y
j
o
{
t
`
a
p
a
d
`
f
g
`
a
o
`
f
r
A
=
>
?
π
@
!
"
#
$
π
%
&
'
(
)
π
*
+
,
-
.
/
6
2
;
5
7
<
7
;
4
6
2:
5
7
9
7
8
2
6
5
2
3
0
4
1
B
C
D
E
F
G
H
G
I
G
J
K
L
K
M
N
O
P
Q
R
Abbildung aus Kühnel/Krebs, 2001: 255
Kennwertverteilung bei Gültigkeit der
Null- und der Alternativhypothese
• Der Bereich in dem die Nullh. akzeptiert
wird, heißt Annahmebereich, der Bereich,
in dem sie abgelehnt oder verworfen wird,
heißt Ablehnungsbereich oder kritischer
Bereich.
Der Wert, der den Ablehnungsbereich vom
Annahmebereich trennt, wird als kritischer
Wert bezeichnet.
Ÿ
¡
¢
£
¤
¥
¦
§
¨
©
ª
«
¬
´
π
æ
ç
å
è
­
µ
®
®
­
¯
²
°
¬
±
¯
²
°
¬
±
­
³
²
²
¶
¸
¬
­
²
°
­
±
°
²
±
µ
´
½
µ
¾
¶
·
¿
´
π
é
ç
ê
ë
ì
í
î
ï
ð
ñ
î
ò
ó
ð
î
ô
õ
Ë
Ì
Ì
Í
Î
Ï
Ð
Ñ
Ð
Ò
Ð
Ó
Ô
Î
Ö
≤
Õ
À
Á
Ë
Ç
Ñ
×
Ø
Ð
Î
Ì
Ù
Ì
Ú
Û
Ñ
Ð
Ò
Ð
Ó
Ô
Î
Õ
Ö
Ü
À
Á
²
¸
º
®
'
Ç
±
×
¸
­
²
¾
¹
µ
(
¬
¯
(
º
º
±
¬
µ
)
®
¯
²
°
­
¸
±
²
²
*
+
+
+
µ
¸
­
°
±
»
²
­
®
²
µ
¼
²
­
µ
!
­
,
≤
'
-
.
(
!
+
/
(
+
+
,
0
-
!
ú
&
ö÷
ø
ù
"#
−α
ß
$
%
Þ
à
á
â
ã
α
â
Ã
Á
Ä
Þ
ä
π
Á
Â
Á
Ã
Á
)
€
4


‚
ƒ
„
Á
†
Á
Æ
Å
Á
Ç
Á
α
È
Á
É
Á
Ê
ü
ý
ü
þ
ü
ÿ
ü
ü
ü
ü
ü
ü
Â
.
7
…
Ä
å
û
À
−α
Ý
…
‡
…
!
ˆ
‰
ƒ
Š
‹
≤
Œ

Ž


‘
’
“
”
•
–
•
—
˜
‘
“
™
“
š
›
”
œ

ž
Œ

Ž

"#
&
$
%
β
−β
3
0
6
5
3
,
1
2
3
-
4
5
6
Abbildung aus Kühnel/Krebs, 2001: 257
Fehlermöglichkeiten bei der
statistischen Hypothesenprüfung
q
* σ(p ) + µ(p )
=z
1− α 1− α
1
1
π *(1 − π )
1 +π
* 1
=z
1− α
1
n
q
= Wert des (1- α)- Qantails der
1− α
Kennwertev erteilung eines
Stichprobe nkennwerts
Inhaltliche Relevanz der Null- und
der Alternativhypothese
• In Sinne von Popper ist es sinnvoll, die
inhaltlich interessante H (=Hypothese) nur
dann als richtig zu akzeptieren, wenn die
Wahrscheinlichkeit, dass sie falsch ist,
sehr klein ist.
H = π > 0. 5
wird also nur dann
1 1
akzeptiert, wenn die Wahrscheinlichkeit,
dass die Gegenh., d.h. die Nullh., gilt, so
gering ist, dass die Nullh. abgelehnt wird.
Inhaltliche Relevanz der Null- und
der Alternativhypothese
• Die inhaltlich interessantere H, die
Forschungsh. wird in der Alternativh.
formuliert. Ihr theoretisch weniger
interessantes Gegenteil wird in der Nullh.
formuliert.
• Durch Festlegung einer geringen max.
Fehlerwahrscheinlichkeit wird
sichergestellt, dass die Forschungsh.
nur akzeptiert wird, wenn die Nullh. mit
großer Wahrscheinlichkeit falsch ist.
Inhaltliche Relevanz der Null- und
der Alternativhypothese
• Erst bei Populationswerten, die weit von
denen bei zutreffender Nullh. entfernt sind,
ist auch die Wahrscheinlichkeit eines β
Fehlers gering.
Wenn es einen großen Bereich von
Populationswerten gibt, in dem die
Wahrscheinlichkeiten für einen β Fehler
hoch sind, dann hat der statistische Htest
nur eine geringe Trennschärfe.
Inhaltliche Relevanz der Null- und
der Alternativhypothese
• Die Trennschärfe eines Tests hängt nicht
nur von der Festlegung der α -Fehlerwahrscheinlichkeit, sondern auch vom
Stichprobenumfang ab.
Je größer der Stichprobenumfang, desto
kleiner ist der Standardfehler der
Teststatistik, und umso leichter ist es
möglich, zwischen den Populationswerten
zu unterscheiden, die mit der Forschungh.
vereinbar oder unvereinbar sind.
9.2 Die Vorgehensweise bei der
Prüfung statistischer
Hypothesen
Schritt 1:Formulierung von Null- und
Alternativhypothese
• Forschungsh. können gerichtet oder
ungerichtet sein
– Gerichtete H enthalten die Vermutung,
dass ein Populationswert entweder größer
oder kleiner als ein empirischer
Stichprobenwert ist.
– Ungerichtete H enthalten dagegen die
Vermutung, dass ein Populaionswert
ungleich einem empirischen Wert ist.
Schritt 1:Formulierung von Null- und
Alternativhypothese
• Bei der gerichteten H über die
Befürwortung von Schwangerschaftsabbruch bei finanzieller Notlage lautet
das Hypothesenpaar:
H :π ≤ 0.5 versus H :π > 0.5
0 1
1 1
Schritt 1:Formulierung von Null- und
Alternativhypothese
• Bei der ungerichteten H über den
Unterschied der Populationsmittelwerte µD
bei der Einstallung zur Demokratie bei
Erstwählern und Altwählern lautet das
Hypothesenpaar:
H :µ =0 versus H :π >0.5
0 D
1 1
Schritt 2. Auswahl der statistischen
Prüfgröße und der Testverteilung
• In der Null- und der Alternativhypothese
wird eine Behauptung über einen
Populationsparamter formuliert.
•
Z=
p −π
1
π
1/H
1/H
* (1 − π
0
0
1/H
)
0
n
Schritt 3: Festlegung der
Irrtumswahrscheinlichkeit und es
Ablehnungsbereichs
• Der Ablehnungsbereich wird indirekt über
die Festlegung der max. Irrtumswahrscheinlichkeit α bestimmt.
• Bestimmungen der kritischen Region:
– 1. Behauptet die Forschungsh., dass ein
Populationswert größer als ein postulierter
Wert ist, dann liegt der kritische Bereich
der Nullh. Im oberen Abschnitt der
Testverteilung. →
(Fortsetzung) Bestimmungen der
kritischen Region
– Der kritische Wert ist also gleich dem 1- α
Quantilwert der Testverteilung.
Beispiel:
H :π ≤ 0.5 versus H :π > 0.5 Einseitiger Htest
0 1
1 1
– 2. Behauptet die Forschungsh., dass ein
Populationswert kleiner ist als ein
postulierter Wert, dann liegt der kritische
Bereich der Nullh. Im unteren Abschnitt der
→
Testverteilung.
(Fortsetzung) Bestimmungen der
kritischen Region
– Der kritische Wert ist gleich demα
Quantilwert der Testverteilung.
Beispiel:
H :π ≥ 0.5 versus H :π < 0.5 Einseitiger Htest.
0 1
1 1
– 3. Behauptet die Forschungsh., dass ein
Populationswert ungleich einem
postulierten Wert ist, dann liegt der →
(Fortsetzung) Bestimmungen der
kritischen Region
– Kritische Bereich der Nullh. Zu gleichen
Teilen im unteren und im oberen Abschnitt
der Verteilung. Es gibt dann zwei kritische
Werte ,die gleich demα / 2 -Quantilwert und
dem 1 − α / 2 -Quantilwert der Testverteilung
sind.
Beispiel: (zweiseitiger Htest.)
H :π = 0.5 versus H :π ≠ 0.5
0 1
1 1
Schritt 4: Entscheidungen über
Akzeptanz oder Ablehnung der Nullh.
aufgrund des Stichprobenwertes der
Teststatistik
• Ist das empirische Signifikanzniveau
größer oder gleich der Irrtumswahrscheinlichkeit α ,dann wird die Nullh.
beibehalten:
p< α : Ablehnung der Nullh.
p ≥ α : Beibehaltung der Nullh.
Schritt 4 (Fortsetzung)
• Das empirische Signifikanzniveau p
unterscheidet sich bei einseitigen und
zweiseitigen Htests.
Im oben vorgestellten Beispiel hat die
Teststatistik beim zweiseitigen Test den
Wert Z ± 2.
Schritt 4 (Fortsetzung)
• Bei einseitiger Prüfung der Nullh., H0 :π1 ≥ 0,5
dass der Populationswert mindestens π1
50% beträgt, entspricht der Wert der
Teststatistik Z= -2 dem 2.28% - Quantil
der Standardnormalverteilung.
9.3 Beziehung zwischen
statistischen
Hypothesentests und der
Berechnung von
Konfidenzintervallen
Beziehung zwischen statistischen
Htests und der Berechnung von
Konfidenzintervallen
• Beispiel:
Die ungerichtet Forschungsh. wird geprüft:
H :π = 0.5 versus H :π ≠ 0.5
0 1
1 1
In folgender Formel gilt:
z1−α / 2 = Quantilwert des 1 − α / 2 -Quantils der
statistischen Prüfgröße Z
∧
σ(p1) = geschätzter Standerfehler des
Stichprobenanteils p1
Beziehung zwischen....
∧
c . i .( π 1 ) = p 1 ± σ ( p 1 ) * z 1 − α / 2
p 1 * (1 − p 1 )
* z 1− α / 2
n
0 .4 * (1 − 0 .4 )
* 1 . 96
= 0 .4 ±
100
= 0 . 4 ± 0 . 096
= 0 . 304 bis 0 . 496
= p1 ±
Herunterladen