Monika Knobel 26.03.2005 Signifikanztest.mcd Beurteilende Statistik - Testen von Hypothesen Signifikanztest Bsp.: In einer Spielshow müssen Kandidaten erraten, wieviele weiße Kugeln sich in einer Kiste befinden. Damit die Kandidaten es etwas leichter haben wissen sie, dass sich in der Kiste insgesamt 50 rote und weiße Kugeln befinden. Außerdem dürfen die Kandidaten 5 Kugeln mit Zurücklegen aus der Kiste ziehen, um so besser die Anzahl schätzen zu können. Herr Schlau, einer der Kandidaten (und leidenschaftlicher Mathematiker), hat sich bereits ein Verfahren ausgedacht, wie er die Anzahl der weißen Kugeln mit der größt möglichen Wahrscheinlichkeit richtig errät. Signifikanztest: Man muss zwischen einer Hypothese und mehreren alternativen Hypothesen entscheiden. (1) Formulieren der Hypothese Herr Schlau geht davon aus, dass in der Kiste 25 rote und 25 weiße Kugeln sind. H0 : "In der Kiste sind gleichviele rote und weiße Kugeln." ⇒ p = 0.50 H1 : "In der Kiste sind nicht gleichviele Kugeln" p ≠ 0.50 ⇒ (2) Entscheidungsregel Zusätzlich gilt für ihn die Regel: wenn er 2 oder 3 weiße Kugeln zieht, entscheidet er sich für seine Hypothese, ansonsten dagegen. X := "Anzahl der weißen Kugeln" ⇒ X =2∨X =3 ⇒ Entscheidung für H0 ⇒ X = 0, 1 ∨ X = 4, 5 ⇒ Entscheidung für H1 (3) Vier mögliche Fälle Realität H0 ist wahr (p 0 = 0.5) H1 ist wahr Entscheidung aufgrund des Testverfahrens X =2∨X =3 ⇔ Annahme von H0 richtige Entscheidung X =2∨X =3 ⇔ Ablehnung von H1 falsche Entscheidung, Fehler 2. Art X = 0 , 1 ∨ X = 4 , 5 ⇔ Ablehnung von H0 falsche Entscheidung, Fehler 1. Art X = 0 , 1 ∨ X = 4 , 5 ⇔ Annahme von H1 richtige Entscheidung Beim Signifikanztest wird entschieden, ob eine Hyothese sinnvoll ist oder nicht. Ausschlaggebend ist dabei die Größe des Fehlers 1. Art. Ist die Irrtumswahrscheinlichkeit zu hoch, sollte die Hypothese verändert werden. (4) Berechnung des Risikos 1. Art Wie beim Alternativtest berechnet man beim Signifikanztest das Risiko 1. Art mit Hilfe der Bernoulligleichung: n := 5 p0 := 0.5 X = 0, 1 ∨ X = 4, 5 ( α = Pp0 ( X ≤ 1) + Pp0 ( 4 ≤ X) = 1 − P p0 ( 2 ≤ X ≤ 3) = 1 − Pp0 ( X ≤ 3) − Pp0 ( X ≤ 1) ( ( ) ( )) α := 1 − SPBin_h n , p0 , 3 − SPBin_h n , p0 , 1 α = 0.375 Die Wahrscheinlichkeit, dass gleich viele rote und schwarze Kugeln in der Kiste sind, d.h. H0 richtig ist, aber Herr Schlau sie dennoch ablehnt beträgt 37.5%. Mit einer (Sicherheits-)Wahrscheinlichkeit von 62.5% entscheidet sich Herr Schlau richtig. (5) Das Risiko 2. Art Beim Signifikanztest ist es nicht möglich das Risiko 2. Art konkret auszurechnen, da die Wahrscheinlickteit p 1 der Gegenhypothesen nicht bekannt ist. Man kann lediglich einen Überblick des Fehlers 2. Art erhalten, indem man für verschieden Wahrscheinlichkeiten die Werte ausrechnet und sie graphisch darstellt. n := 5 X = 2, 3 p1 = p 0. H1 : "In der Kiste befinden sich keine weißen Kugeln" β 0 = P p ( 2 ≤ X ≤ 3) β 0 := 0 p := 0.00 ⇒ β0 = 0 1. H1 : "Es sind 5 weiße Kugeln in der Kiste" 0% p := 0.10 ⇒ β 1 := SPBin_h ( n , p , 3) − SPBin_h ( n , p , 1) β 1 = 0.081 2. H1 : "Es sind 10 weiße Kugeln" p := 0.20 ⇒ β 2 := SPBin_h ( n , p , 3) − SPBin_h ( n , p , 1) 8.1% β 2 = 0.256 25.6% . . 10. H1: "Es sind 50 weiße Kugeln" anm := 5 ⋅ m apm := 0 5⋅ m ( ) m := 0 .. 10 ( ) β m := SPBin_h n , apm , 3 − SPBin_h n , apm , 1 50 1 p := 1.00 ⇒ 2 3 4 5 6 7 8 ( T wt := stapeln an , β 9 10 wt = 0 0 5 10 15 20 25 30 35 40 45 50 1 0 0.081 0.256 0.441 0.576 0.625 0.576 0.441 0.256 0.081 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.7 0.6 0.5 β 0.4 0.3 0.2 0.1 0.9 1 ap Die Wahrscheinlichkeit, dass nicht 25 weiße Kugeln in der Kiste sind, aber man sich trotzdem für diese Hypothese entscheidet schwankt zwischen 0% und weniger als 62.5%. Das Risiko 2. Art ist umso kleiner, je mehr p von p 0 abweicht. T ) Binomialkoeffizient: bk ( n , k) := wenn k < 1 , 1 , Wahrscheinlichkeit nach Bernoulli: n k ⋅ bk ( n − 1 , k − 1) k PBinver ( n , p , k) := bk ( n , k) ⋅ p ⋅ ( 1 − p) n− k n: Anzahl der Versuche p: Wahrscheinlichkeit für einen Treffer k: Anzahl der Treffer z Summenwahrscheinlichkeit, höchstens z Treffer: SPBin_h ( n , p , z) := ∑ PBinver ( n , p , k) k = 0 n Summenwahrscheinlichkeit, mindestens z Treffer: SPBin_m ( n , p , z) := ∑ k = z PBinver ( n , p , k)