Das Testen von Hypothesen

Werbung
Wissenswertes 010 …
Das Testen von Hypothesen
Gegeben sei ein Bernoulli – Experiment B(n, p, k) der Länge n und der Trefferwahrscheinlichkeit p (Bernoulli –Kette).
In einem Basistest wird eine – durch die Bernoulli – Kette Annahme bzgl. der Trefferwahrscheinlichkeit p getroffen. Diese Annahme (Aussage) nennt man Nullhypothese H0. Die gegenteilige Annahme nennt man Alternative oder Einshypothese H1!
Beispiel 1:
Aussage:
H0: „Beim 100 – maligen Werfen einer Münze beträgt die Wahrscheinlichkeit für das Ereignis {Zahl} p (z) = ½.“
Problem:
Finde ein Entscheidungskriterium die Richtigkeit von H0.
Lösung (aus dem Bauch raus):
H0 kann als richtig angenommen werden, wenn 50 mal das Ereignis {Zahl} eintritt. Auch
wenn nur 49 mal oder 51 mal {Zahl} fällt, wird man nicht ohne weiteres behaupten dürfen,
dass H0 falsch ist!
Beispiel 2:
Ein Kugelschreiberlieferant liefert 1000 Kugelschreiber. Er behauptet, dass höchstens 10 %
dieser Kulis defekt sind. In der Warenprüfung werden 100 Kulis untersucht!
Aussage:
H0: „Die Wahrscheinlichkeit für einen defekten Kuli beträgt höchstens 10 %.“
Problem:
Finde ein Entscheidungskriterium die Richtigkeit von H0.
Lösung (aus dem Bauch raus):
H0 kann als richtig angenommen werden, wenn von 100 Kugelschreibern 10 oder weniger
defekt sind. Darf bei 11, 12 oder 13 defekten Stücken bereits gesagt werden, dass H0 falsch
ist?
Ein Sicherheitsproblem:
Fällt man eine Entscheidung zugunsten eine Hypothese, so ist nicht gesagt, dass die Hypothese auch richtig ist! Ebenso wenig muss die Aussage einer Hypothese falsch sein, auch
wenn sie abgelehnt wird! Lehnt man eine Hypothese ab, obwohl ihre Aussage zutrifft, begeht
man einen Fehler erster Art (für das Beispiel 2: Man geht irrtümlicherweise davon aus, dass
die Wahrscheinlichkeit eines defekten Kulis größer als 10 % ist). Nimmt man eine Hypothese
an, obwohl ihre Aussage falsch ist, begeht man einen Fehler zweiter Art (für das Beispiel 2:
Man geht irrtümlicherweise davon aus, dass die Wahrscheinlichkeit eines defekten Kulis
schlechtestenfalls 10 % ist).
Um solche Fehler zu vermeiden verwendet man sog. Risikowahrscheinlichkeiten. Typische
Fragestellung: Wie groß darf die maximale Abweichung vom erwünschten Wert maximal sein,
dass die Hypothese … – mit einem Fehler von … % – noch zutrifft? Diese Risikowahrscheinlichkeit heißt auch Signifikanzniveau α.
Übersicht:
wird angenommen
H0 ist richtig
wird abgelehnt
Fehler 1. Art
H1 ist falsch
Fehler 2. Art
wird angenommen
H0 ist falsch
wird abgelehnt
Fehler 2. Art
H1 ist richtig
Fehler 1. Art
Definition:
Die Trefferanzahl, bei der eine Hypothese H0 als richtig angenommen werden darf heißt Annahmebereich A0.
Die Trefferanzahl, bei der eine Hypothese H0 verworfen werden darf, heißt Ablehnungsbereich A0.
Bemerkung: Annahme und Ablehnungsbereich hängen entscheidend vom Signifikanzniveau α ab.
zu Beispiel 2:
Ein Kugelschreiberlieferant liefert 1000 Kugelschreiber. Er behauptet, dass höchstens 10 %
dieser Kulis defekt sind. In der Warenprüfung werden 100 Kulis untersucht! Wie viele der
überprüften Kugelschreiber dürfen höchstens defekt sein, dass die Nullhypothese H0 „die
Wahrscheinlichkeit für einen defekten Kugelschreiber beträgt höchstens 10 %“ auf einem
Signifikanzniveau von 95 % angenommen wird?
Lösung:
Die Überprüfung der Kugelschreiber entspricht einer Bernoulli – Kette der Länge n = 100.
Da die Nullhypothese angenommen werden soll, kann für p ≤ 0,10 (und damit p = 0,10) unterstellt werden.
Dann folgt:
H0 wird angenommen für A0 = {0, 1, 2, 3, …., k}
H0 wird abgelehnt für A1 = {k+1, …, 100}
Rechnung:
k
k
i =0
i =0
(
)
B(n , p,0 ≤ i ≤ k ) = ∑ B(n , p, i ) = ∑ B 100, 1 , i ≤ 0,95
10
⎯⎯ ⎯ ⎯
⎯→ k = 14
Tafelwerk
H0 wird bis zu 14 defekten Kugelschreibern angenommen!
Äquivalente Formulierung der Aufgabenstellung:
Ein Kugelschreiberlieferant liefert 1000 Kugelschreiber. Er behauptet, dass höchstens 10 %
dieser Kulis defekt sind. In der Warenprüfung werden 100 Kulis untersucht! Wie viele der
überprüften Kugelschreiber dürfen höchstens defekt sein, dass die Nullhypothese H0 „die
Wahrscheinlichkeit für einen defekten Kugelschreiber ist kleiner als 10 %“ auf einem Signifikanzniveau von 5 % irrtümlicherweise abgelehnt wird?
Rechnung:
n
100
i = k +1
i = k +1
(
)
B(n , p, i ≥ k + 1) = ∑ B(n , p, i ) = ∑ B 100, 1 , i ≤ 0,05
10
100
(
)
k
(
)
(
k
)
1 , i = 1−
1 , i ≤ 0,05 ⇔
1 , i ≥ 0,95
∑ B 100, 10
∑ B 100, 10
∑ B 100, 10
i = k +1
i =0
i =0
⎯⎯ ⎯ ⎯
⎯→ k = 15
Tafelwerk
H0 wird bis ab 15 defekten Kugelschreibern zu Unrecht abgelehnt!
Aufgabe:
Bei der Herstellung von Schrauben fällt bei normalen Produktionsbedingungen weniger als 5
% Ausschuss an. Bei einer Stichprobe von 100 Schrauben wurden 8 schlechte Schrauben
gezählt. Der Produzent vermutet deshalb, dass sich die Produktionsbedingungen signifikant
geändert haben, dass sich also der Anteil der defekten Schrauben auf wenigstens 5 % erhöht habe.. Geben Sie eine Entscheidungsregel dafür an, dass die Vermutung des Produzenten auf einem Signifikanzniveau von 10 % zu unrecht abgelehnt wird.
Lösung:
H0: „Die Produktionsbedingungen haben sich geändert (p ≥ 0,05)“.
Annahmebereich: A0 = {k, … , 100}
Ablehnungsbereich: A1 = {0, …, k – 1}
H0 ist auf einem Signifikanzniveau von 0,10 zu verwerfen:
k
k
i =0
i =0
(
)
B(n , p,0 ≤ i ≤ k ) = ∑ B(n , p, i ) = ∑ B 100, p ≥ 5 , i ≤ 0,10
100
⎯⎯ ⎯ ⎯
⎯→ k = 2
Tafelwerk
Sollten mehr als 2 Schrauben defekt sein, muss H0 angenommen werden!
Lösungsschemata
Übersichtstabelle / Alternativtest:
Hypothese
Annahmebereich
Fehlerwahrscheinlichkeit
H0: „p0 = ….“
A0 = {…}
B(n , p 0 , k ∈ A1 )
H1: „p1 = ….“
A1 = {…}
B(n , p1 , k ∈ A 0 )
Aufgabe / Beispiel:
In einem Lager befinden sich zwei Arten von Sammelbehältern, die je nach Bedarf zu 30
% (Typ A) oder zu 70 % (Typ B) mit einem bestimmten Artikel befüllt sind. Der Lagerist
hat vergessen, die Behälter richtig zu beschriften. Aus einem Behälter werden nun (mit
Zurücklegen) zehn Gegenstände entnommen. Tritt dabei wenigstens 6 – mal der gewünschte Artikel auf, dann vermutet man, dass es sich um einen Behälter vom Typ B
handelt. Bestimmen Sie die Irrtumswahrscheinlichkeiten.
Übersichtstabelle / Signifikanztest:
Hypothese
Annahmebereich
Fehlerwahrscheinlichkeit
H0: „p0 = ….“
A0 = {…}
B(n , p 0 , k ∈ A1 ) ≤ α 0
H1: „p1 = ….“
A1 = {…}
B(n , p1 , k ∈ A 0 ) ≤ α1
Aufgabe / Beispiel:
Die Behauptung eines Herstellers für Glühbirnen, dass höchstens 15 % seiner Produktion defekt sind soll mit einer Stichprobe vom Umfang 100 und einer Wahrscheinlichkeit
von höchstens 5 % für den Fehler 1. Art getestet werden! Bestimmen Sie die Entscheidungsregel!
Herunterladen