Beurteilende Statistik - Testen von Hypothesen

Werbung
Monika Knobel 26.03.2005 Signifikanztest.mcd
Beurteilende Statistik - Testen von Hypothesen
Signifikanztest
Bsp.:
In einer Spielshow müssen Kandidaten erraten, wieviele weiße Kugeln sich in einer Kiste befinden.
Damit die Kandidaten es etwas leichter haben wissen sie, dass sich in der Kiste insgesamt 50 rote und
weiße Kugeln befinden. Außerdem dürfen die Kandidaten 5 Kugeln mit Zurücklegen aus der Kiste ziehen,
um so besser die Anzahl schätzen zu können.
Herr Schlau, einer der Kandidaten (und leidenschaftlicher Mathematiker), hat sich bereits ein Verfahren
ausgedacht, wie er die Anzahl der weißen Kugeln mit der größt möglichen Wahrscheinlichkeit richtig errät.
Signifikanztest: Man muss zwischen einer Hypothese und mehreren alternativen Hypothesen entscheiden.
(1) Formulieren der Hypothese
Herr Schlau geht davon aus, dass in der Kiste 25 rote und 25 weiße Kugeln sind.
H0 : "In der Kiste sind gleichviele rote und weiße Kugeln." ⇒
p = 0.50
H1 : "In der Kiste sind nicht gleichviele Kugeln"
p ≠ 0.50
⇒
(2) Entscheidungsregel
Zusätzlich gilt für ihn die Regel: wenn er 2 oder 3 weiße Kugeln zieht, entscheidet er sich für seine
Hypothese, ansonsten dagegen.
X := "Anzahl der weißen Kugeln"
⇒
X =2∨X =3
⇒
Entscheidung für H0
⇒
X = 0, 1 ∨ X = 4, 5
⇒
Entscheidung für H1
(3) Vier mögliche Fälle
Realität
H0 ist wahr
(p 0 = 0.5)
H1 ist wahr
Entscheidung aufgrund des Testverfahrens
X =2∨X =3
⇔ Annahme von H0
richtige Entscheidung
X =2∨X =3
⇔ Ablehnung von H1
falsche Entscheidung, Fehler 2. Art
X = 0 , 1 ∨ X = 4 , 5 ⇔ Ablehnung von H0
falsche Entscheidung, Fehler 1. Art
X = 0 , 1 ∨ X = 4 , 5 ⇔ Annahme von H1
richtige Entscheidung
Beim Signifikanztest wird entschieden, ob eine Hyothese sinnvoll ist oder nicht. Ausschlaggebend ist dabei die
Größe des Fehlers 1. Art. Ist die Irrtumswahrscheinlichkeit zu hoch, sollte die Hypothese verändert werden.
(4) Berechnung des Risikos 1. Art
Wie beim Alternativtest berechnet man beim Signifikanztest das Risiko 1. Art mit Hilfe der Bernoulligleichung:
n := 5
p0 := 0.5
X = 0, 1 ∨ X = 4, 5
(
α = Pp0 ( X ≤ 1) + Pp0 ( 4 ≤ X) = 1 − P p0 ( 2 ≤ X ≤ 3) = 1 − Pp0 ( X ≤ 3) − Pp0 ( X ≤ 1)
(
(
)
(
))
α := 1 − SPBin_h n , p0 , 3 − SPBin_h n , p0 , 1
α = 0.375
Die Wahrscheinlichkeit, dass gleich viele rote und schwarze Kugeln in der Kiste sind, d.h. H0 richtig ist, aber Herr
Schlau sie dennoch ablehnt beträgt 37.5%.
Mit einer (Sicherheits-)Wahrscheinlichkeit von 62.5% entscheidet sich Herr Schlau richtig.
(5) Das Risiko 2. Art
Beim Signifikanztest ist es nicht möglich das Risiko 2. Art konkret auszurechnen, da die Wahrscheinlickteit p 1
der Gegenhypothesen nicht bekannt ist.
Man kann lediglich einen Überblick des Fehlers 2. Art erhalten, indem man für verschieden Wahrscheinlichkeiten
die Werte ausrechnet und sie graphisch darstellt.
n := 5
X = 2, 3
p1 = p
0. H1 : "In der Kiste befinden sich keine weißen Kugeln"
β 0 = P p ( 2 ≤ X ≤ 3)
β 0 := 0
p := 0.00
⇒
β0 = 0
1. H1 : "Es sind 5 weiße Kugeln in der Kiste"
0%
p := 0.10
⇒
β 1 := SPBin_h ( n , p , 3) − SPBin_h ( n , p , 1)
β 1 = 0.081
2. H1 : "Es sind 10 weiße Kugeln"
p := 0.20
⇒
β 2 := SPBin_h ( n , p , 3) − SPBin_h ( n , p , 1)
8.1%
β 2 = 0.256
25.6%
.
.
10. H1: "Es sind 50 weiße Kugeln"
anm := 5 ⋅ m apm :=
0
5⋅ m
(
)
m := 0 .. 10
(
)
β m := SPBin_h n , apm , 3 − SPBin_h n , apm , 1
50
1
p := 1.00
⇒
2
3
4
5
6
7
8
(
T
wt := stapeln an , β
9
10
wt = 0
0
5
10
15
20
25
30
35
40
45
50
1
0
0.081
0.256
0.441
0.576
0.625
0.576
0.441
0.256
0.081
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.7
0.6
0.5
β
0.4
0.3
0.2
0.1
0.9
1
ap
Die Wahrscheinlichkeit, dass nicht 25 weiße Kugeln in der Kiste sind, aber man sich trotzdem für diese
Hypothese entscheidet schwankt zwischen 0% und weniger als 62.5%.
Das Risiko 2. Art ist umso kleiner, je mehr p von p 0 abweicht.
T
)
Binomialkoeffizient:


bk ( n , k) := wenn  k < 1 , 1 ,
Wahrscheinlichkeit nach Bernoulli:
n
k


⋅ bk ( n − 1 , k − 1) 
k
PBinver ( n , p , k) := bk ( n , k) ⋅ p ⋅ ( 1 − p)
n− k
n: Anzahl der Versuche
p: Wahrscheinlichkeit für einen Treffer
k: Anzahl der Treffer
z
Summenwahrscheinlichkeit, höchstens z Treffer:
SPBin_h ( n , p , z) :=
∑
PBinver ( n , p , k)
k = 0
n
Summenwahrscheinlichkeit, mindestens z Treffer:
SPBin_m ( n , p , z) :=
∑
k = z
PBinver ( n , p , k)
Herunterladen