5.4. Signifikanztests Grundlagen, demonstriert an einem Beispiel

Werbung
5.4. Signifikanztests
Grundlagen, demonstriert an einem Beispiel zum Gauß-Test
Bei einer Serienfertigung eines bestimmten Typs von Messgeräten werden vor der Auslieferung eines jeden Gerätes
10 Kontrollmessungen durchgeführt um festzustellen, ob das
Gerät korrekt geeicht ist.
Dabei liegt es in der Natur dieses Messvorganges, dass der
tatsächliche Wert nur bis auf einen zufälligen Messfehler
bestimmt werden kann.
Die Varianz dieses Messfehlers betrage σ 2 = 0, 1.
Wie soll der Gütekontrolleur entscheiden?
Wann soll er ein Gerät zur Auslieferung freigeben, wann soll
er es zur Nachbesserung in die Eichabteilung zurückschicken?
Vorgehen:
1. Stochastisches Modell, mit Modellannahmen
(die ggf. ebenfalls getestet werden können bzw. sollten):
• Die Zufallsvariable X beschreibe den Fehler eines Messvorganges, der sich zusammensetzt aus dem
– (nicht zufälligen) Eichfehler µ des kontrollierten Gerätes
und dem
– (zufälligen) Fehler der Messung.
• X sei normalverteilt (Zentraler Grenzwertsatz).
Also X ∼ N (µ; 0, 1), µ unbekannt.
1
2. Formulieren von Hypothesen
Nullhypothese:
H0 : µ = 0 ”Gerät exakt geeicht”
Alternativhypothese:
hier: zweiseitige Alternative HA : µ 6= 0 ”Gerät schlecht geeicht”
3. Festlegung der Irrtumswahrscheinlichkeit,
Signifikanzniveau: α
Üblich: Werte zwischen 0,1 und 0,005
z. B.: α = 0, 05, α = 0, 01 . . . (vgl. Konfidenzintervalle)
Wir wählen α = 0, 05.
4. Aufstellen einer Testgröße T
X̄ − µ0 √
T =
n
σ
hier: µ0 = 0, σ 2 = 0, 1, n = 10.
Wenn H0 richtig ist, dann gilt
T ∼ N (0; 1)
allgemein: H0 und T sind so zu wählen, dass die Verteilung
von T unter der Annahme, dass H0 gilt, bekannt ist.
2
5. Festlegen des
Ablehnungsbereiches, kritischer Bereich K (bzw. Kα )
Gilt H0, so sollte die konkrete Stichprobe einen Wert der
Testgröße in der Nähe von 0 ergeben.
Also Ablehnung von H0, wenn der Wert ”weit weg” von 0 liegt
(”in Richtung auf HA”).
K wird so gewählt, dass eine wahre Nullhypothese nur mit
Wahrscheinlichkeit α abgelehnt wird.
P µ0 ( T ∈ K α ) = α
Im Beispiel interessant, ob für das kontrollierte Gerät µ 6= 0
oder µ = 0, deshalb zweiseitigen kritischen Bereich wählen:
Kα = ( −∞, zα/2 ) ∪ ( z1 − α/2, ∞ )
Bei Werten von T ∈ Kα wird H0 abgelehnt und das Gerät
zur Nachjustierung zurückgeschickt:
”Die Messergebnisse weichen signifikant vom exakten Wert
ab.”
Aber: Auch für ein exakt geeichtes Gerät kann T einen Wert
in K annehmen. Das passiert aber nur mit einer Wahrscheinlichkeit von (höchstens) α = 0, 05.
z0,025 = −1, 96 , z0,975 = 1, 96
K0,05 = ( −∞ , −1, 96 ) ∪ ( 1, 96, ∞ )
3
Entscheidungsregel: Weicht für ein Gerät der Wert
x̄ √
x̄
t = √
10 = q
= 10 · x̄ ,
0, 1
0,1
10
betragsmäßig um mehr als 1,96 von Null ab, so wird das Gerät
zurückgewiesen (also wenn |x̄| > 0, 196).
”Anderenfalls ist auf der Grundlage der Stichprobe (zehn konkrete Messwerte) gegen die Nullhypothese µ = 0 (Gerät i.O.)
nichts einzuwenden.”
Mögliche Fehlentscheidungen beim Testen:
Fehler erster Art: Eine wahre Nullhypothese wird abgelehnt.
Im Beispiel: Ein exakt geeichtes Gerät wird zurückgewiesen.
Die Wahrscheinlichkeit hierfür ist gleich α.
Fehler zweiter Art: Eine falsche Nullhypothese wird nicht
abgelehnt. Im Beispiel: Fehlgeeichtes Gerät wird verkauft.
Die Wahrscheinlichkeit hierfür im Allgemeinen nur sehr
schwierig oder gar nicht bestimmbar (weil die Verteilung dann
nicht bekannt ist). Hängt im Beispiel davon ab, um wieviel die
Eichung falsch ist.
Problem: Reduziert man die Wkt. für Fehler erster Art (durch
kleineres α) vergrößert sich die Wkt. für Fehler zweiter Art
und umgekehrt (in welchem Maße das geschieht, ist im Allgemeinen unbekannt).
sehr kleines α → nur zurückweisen, wenn man sich sehr sicher
ist, dass Gerät fehlgeeicht. Dann hat man mehr Reklamationen
= Fehler 2. Art.
4
Gauß-Test
• Anliegen: Überprüfen von Hypothesen über den
Erwartungswert einer normalverteilten Zufallsvariablen
(ein Mittelwert in der Grundmenge, Population),
parametrischer Test
• Voraussetzung : X ∼ N (µ; σ 2),
• Hypothese:
σ 2 bekannt
H0 : µ = µ0
• Testgröße:
X̄ − µ0 √
T =
n
σ
• Ablehnung von H0, falls bei
zweiseitiger Alternative
HA :
µ 6= µ0
|t| > z1− α2
einseitiger Alternative
HA :
µ < µ0
t < −z1−α
HA :
µ > µ0
t > z1−α
5
Ist die Aufgabenstellung wie zuvor, aber σ 2 unbekannt,
so benutzt man die Testgröße
T =
X̄ − µ0 √
· n
S
T ist dann t - verteilt mit n − 1 Freiheitsgraden.
Einfacher t -Test
• Anliegen: Überprüfen von Hypothesen über den
Erwartungswert einer normalverteilten Zufallsvariablen
(ein Mittelwert in der Grundmenge, Population),
parametrischer Test
• Voraussetzung X ∼ N (µ; σ 2)
oder großer Stichprobenumfang (n ≥ 30)
• Hypothese: H0 : µ = µ0,
• Testgröße
X̄ − µ0 √
n
S
• Ablehnung von H0, falls bei
T =
HA : µ 6= µ0
|t| > tn−1,1− α2 ,
HA : µ > µ 0
t > tn−1,1−α ,
HA : µ < µ 0
t < −tn−1,1−α .
6
Beispiel:
alles wie oben, aber σ 2 unbekannt. Wir nehmen an,
dass x̄ = 0, 2 und s2 = 0, 1 aus 10 Kontrollmessungen für ein
Gerät geschätzt wurden.
Dann:
t =
0, 2 − 0 √
√
10 = 2, 0
0, 1
t10−1 , 1−0,05/2 = t 9,
0,975
= 2, 26
⇒ keine Ablehnung von H0
Bemerkung:
Beim Gauß–Test hätte ein Mittelwert von 0,2 für eine Zurückweisung
des Gerätes genügt.
Interpretation!
7
Im Unterschied zur ”Handrechnung” ist das Vorgehen bei der
Durchführung von Tests am Computer etwas anders.
”Handrechnung”:
∧......
∧......
↓t
ppppp
↓ tppp ppppp ppppp pppppppppppppp
....
....
..
p p p p...p p p p p
p p p p p p p p ....... p p p p p p p p p p p p p
p
p
p
p
p
ppppp
....
pp pp
ppppp
...
ppp p
...
ppppp
p
.
p
p
.
p
.
p
pppppp
.
p
p
.
......
pp
p..p p p p p p.p..............
....
...... p p p.p p p
.
.p.p..p..p p ..
.
.. p
.
.
p
.
p
.
.
.
p
p
p
.
p
... .... p p p p p p p p p p p
.
pppp
.p..p................................................................................................................................................................................................................p..>
.....
...
ppppp
...
ppp p
...
ppppp
p
p
p
...
p
p
.
ppppp
p
.
ppp
....
pppppp
p
p
.
p
p
.
p
.
......
p
p p p.p p p p ............
.
p
p
.
...... p p p.p
..p..p..p p ..
.. p..p..p..p p
....
p
.
p
.
p
.
.
.
p
p
p
.
p
.. ... p p p p p p p p p
.
pppp
.p..p...............................................................................................................................................................................................................p.p.......
K
α/2
α/2
α/2
α/2
K
K
H0 ablehnen
K
H0 nicht ablehnen
Am Computer:
∧.......
..
p p p ...p p p p
p p p p p p p p ....... p p p p p p p p p p p p p p
p
p
p
p
p
ppppp
....
.
...
pp pp
ppppp
...
...
...
...
ppp p
...
...
ppppp
p
...
..
.
p
p
.
..
p
...
p
.
p
..
p
p
.
.
p p p p p p ...
...
....
...
p pppp
p p p p p p ...
..
. p pppp
p...p..p.p..p..p.p...p.p.....p...p.p..p......p........................................................................................................................................................................p..p..p..p.....p..p.p..p..p.p..p..p..p.p..>
....
Sig./2
∧.......
..
p p p ...p p p p
p p p p p p p p ....... p p p p p p p p p p p p p p
p
p
p
p
p
ppppp
....
.
.....
pp pp
.....
.....
p...p p p p
...
.....
.....
p p p ......p
...
.....
.....
p
p
.....
.
p
.....
.... p p p p
p
.
.....
.....
.
p
.
.
..
.
p
.
....
.
.....p p p p p
.
.
p.p...p..p..p
.p..
..
....
....
..... p p p p p p p
..
..
p p p p p p p ....... ...
p...p..p.p..p..p.p...p.p..p..p.p..p..p..............................................................................................................................................................................p..p..p.p..p..p.p..p..p.p..p..p..p.p..>
....
Sig./2
Sig./2
↑t
Sig./2
↑t
Computer liefert Sig. = ”Signifikanz”, p-Wert, die
Wahrscheinlichkeit, dass die Testgröße unter H0 solche und
”noch untypischere”, ”extremere” Werte als das konkrete t annimmt. (Vorsicht: einseitige ↔ zweiseitige Sig.)
Vergleich mit dem vorgegebenen α:
Sig. < α
Sig. > α
H0 ablehnen
H0 nicht ablehnen
8
>
Herunterladen