Eine Methode, um anhand von Stichproben Informationen über die Grundgesamtheit zu gewinnen, ist der Hypothesentest (Signifikanztest). Hier wird erst eine Behauptung oder Vermutung (Hypothese) über die Parameter der Grundgesamtheit (z.B. der Mittelwert µ ) aufgestellt, dann wird anhand einer Stichprobe aus der Grundgesamtheit diese Behauptung geprüft (getestet). Eine Hypothese wird dann als statistisch widerlegt angesehen und verworfen, wenn das Stichprobenergebnis in deutlichem (d.h. in signifikantem) Gegensatz zu ihr steht. Eine Abfüllanlage einer Firma füllt Flaschen mit Getränke ab, wobei die Füllmenge pro Flasche gewisse Schwankungen unterliegt. Die Füllmenge X kann als eine normalverteilte Zufallsvariable mit der bekannten Standarbweichung = 0,5 [Deziliter] angesehen werden. Der Hersteller behauptet, dass der Mittelwert µ für die Füllmenge gleich dem Sollwert 3 [Deziliter] ist. Eine Verbraucherorganisation möchte die Behauptung (Hypothese) des Herstellers überprüfen. Eine vollständige Untersuchung der Gesamtproduktion ist aus Zeit- und Kostengründen nicht möglich. Daher soll anhand einer Stichprobe vom Umfang N = 25 aus der Produktion die Aussage geprüft werden. Die Verbraucherorganisation entnahm eine Stichprobe aus 25 Flaschen und erhielt für die mittlere Füllmenge in der Stichprobe den Stichproben-Mittelwert x = 2,8 [Deziliter]. Genügt dieses Ergebnis, um die Behauptung (die Hypothese) des Herstellers zu widerlegen, oder soll die Verbraucherorganisation die Hypothese des Herstellers so annehmen, weil die Füllmenge gewisse Schwankungen unterliegt? Die Abfüllmenge ist gleich dem Sollwert 3 [Deziliter]. Wird die Behauptung anhand der Stichprobe verworfen, so folgert die Verbraucherorganisation mit einer vorher festgelegten Wahrscheinlichkeit, dass der wahre Mittelwert µ für die Abfüllmenge weniger als der Sollwert 3 [Deziliter] ist. Nullhypothese: H0 : Gegenhypothese: Ha : µ = 3 (µ µ < 3 3 ) (Behauptung des Herstellers) (Gegenbehauptung der Verbraucherorganisation) Verwerfen von H0 zugunsten von Ha , falls der Stichproben-Mittelwert x weit kleiner als 3 ist. 1 σx = f(x) σ = 0,1 N x 0 [dl] µ =3 Verwerfen der Nullhypothese H0 , falls diese aber tatsächlich richtig ist. ! Festlegung einer Grenze für den Ablehnungsbereich. σx = f(x) σ N = 0,1 x 0 xG [dl] µ =3 Verwerfen der Nullhypothese H0 , falls der Stichprobenmittelwert x unterhalb eine festgelegte Untergrenze ist. Angabe einer Wahrscheinlichkeit genannt Signifikanzniveau oder Irrtumswahrscheinlichkeit: α z.B. : α = 0,025 = 2,5% σ x = 0,1 f(x) α = 0,025 x 0 " xG µ =3 [dl] # Festlegung der Grenze anhand des gewählten Signifikanzniveaus α = 0,025 und der Standard-Normal-Verteilung: zα = – 1, 96 2 ! (z) Z = X – µ σ N α = 0,025 z zα = – 1,96 $$ % 0 & Entnahme einer Stichprobe der Größe N und Berechnung des Mittelwerts x . N = 25 ; x = 2,8 [dl] Bestimmung der Testgröße ẑ durch: zˆ = x − µ σ N = 2,8 − 3 0 ,5 = −2 25 ' Ablehnung der Nullhypothese H0 , falls die Testgröße ẑ Grenze zα ist. kleiner als die Da ẑ = – 2 kleiner als zα = – 1, 96 , lehnt die Verbraucherorganisation die Nullhypothese H0 : µ = 3 mit einer Irrtumswahrscheinlichkeit α = 2,5% gegenüber der Gegenhypothese Ha : µ < 3 ab. ( ) Eine Abfüllanlage einer Firma füllt Flaschen mit Getränke ab, wobei die Füllmenge pro Flasche gewisse Schwankungen unterliegt. Die Füllmenge X kann als eine normalverteilte Zufallsvariable mit der bekannten Standarbweichung = 0,5 [Deziliter] angesehen werden. Der Hersteller behauptet, dass der Mittelwert µ für die Füllmenge gleich dem Sollwert 3 [Deziliter] ist. (s. voriges Bsp.) Eine Ingenieurin für die Qualitätskontrolle des Abfüllautomaten möchte wissen, ob die Anlage die Flaschen im Mittel mit zu wenig oder mit zu viel Getränke abfüllt. (, ob der wahre Mittelwert µ für die Abfüllmenge weniger oder mehr als der Sollwert ist). Also möchte sie, dass weder µ < 3 [dl] ist (wegen Einsprüche von Verbrauchern) , noch µ > 3 ist. (wegen Verschwendung und Verluste). Dafür entnahm sie aus der Produktion eine Stichprobe von 16 Flaschen. Dabei erhielt sie für die mittlere Füllmenge in der Stichprobe den Stichproben-Mittelwert 3,0125 [dl]. Formulieren Sie einen geeigneten Test und führen Sie ihn auf einem Signifikanzniveau α = 5% durch. 3 Nullhypothese: H0 : Gegenhypothese: Ha : ! Signifikanzniveau oder Irrtumswahrscheinlichkeit: " # Kritische Grenzen: zα/2 = und α= z 1 – α/2 = ! (z) Z = X – µ N σ α/2 α/2 z zα / 2 AblehnungsBereich % 0 z1 – α / 2 AblehnungsBereich & ẑ = % )' ( )( Eine Abfüllanlage einer Firma füllt Flaschen mit Getränke ab, wobei die Füllmenge pro Flasche gewisse Schwankungen unterliegt. Die Füllmenge X kann als eine normalverteilte Zufallsvariable mit der bekannten Standarbweichung = 0,5 [Deziliter] angesehen werden. Der Hersteller behauptet, dass der Mittelwert µ für die Füllmenge gleich dem Sollwert 3 [Deziliter] ist. (s. voriges Bsp.) Der Besitzer der Firma, möchte wissen, ob die Anlage die Flaschen im Mittel mit zu viel Getränke abfüllt. (, ob der wahre Mittelwert µ für die Abfüllmenge mehr als der Sollwert ist). Also er möchte nicht, dass µ > 3 ist. (wegen Verluste). Dafür entnahm er aus der Produktion eine Stichprobe von 16 Flaschen. Dabei erhielt er für die mittlere Füllmenge in der Stichprobe den Stichproben-Mittelwert 3,0125 [dl]. Formulieren Sie einen geeigneten Test und führen Sie ihn auf einem Signifikanzniveau α = 2,5% durch. 4 Nullhypothese: H0 : Gegenhypothese: Ha : ! Signifikanzniveau oder Irrtumswahrscheinlichkeit: α= " # Kritische Grenze: z1 – α = ! (z) Z = X – µ N σ α z 0 z1 – α AblehnungsBereich % & ẑ = % )' 5 *+ ( ! Annahmen und Vermutungen zur Wahrscheinlichkeitsverteilung in einer Grundgesamtheit sind die Grundlage von Hypothesentests. Eine Behauptung oder Vermutung zur Wahrscheinlichkeitsverteilung einer Grundgesamtheit wird als Nullhypothese: H0 und die Gegenbehauptung wird als Gegenhypothese: Ha bezeichnet. Der Grundgedanke der Hypothesentests besteht darin, anhand der Ergebnisse einer Stichprobe zu entscheiden, ob die für die Grundgesamtheit formulierte Nullhypothese H0 angenommen (genauer: nicht abgelehnt) oder abgelehnt werden soll. Die Menge aller möglichen Stichprobenergebnisse , bei deren Eintreten H0 abgelehnt werden soll, wird als ihr Verwerfbereich (Ablehnungsbereich) oder kritischer Bereich, die Menge der restlichen Stichproben-Ergebnisse als ihr Annahmebereich bezeichnet. Die Zufallsvariable, die der Wahrscheinlichkeitsverteilung der Stichprobenergebnisse gehorcht, wird die Testfunktion genannt. Die anhand der Verteilung der Stichprobenergebnisse und eines konkreten Stichprobenergebnisses berechnete Größe wird als die Testgröße bezeichnet. Die Wahrscheinlichkeit dafür, H0 abzulehnen, wird als die Irrtumswahrscheinlichkeit: α oder Signifikanzniveau: α des Tests bezeichnet. Die Grenze, die den kritischen Bereich festlegt, wird anhand der Verteilung der Stichprobenergebnisse sowie aufgrund der Irrtumswahrscheinlichkeit α und der Gegenhypothese Ha festgelegt. Diese Grenze bezeichnet man als die kritische Grenze. Das Verwerfen oder Nicht-Verwerfen einer Nullhypothese H0 wird anhand der Entscheidungsregel getroffen. D.h., liegt die Testgröße im kritischen Bereich, so wird mit der Irrtumswahrscheinlichkeit α die Nullhypothese H0 zugunsten der Gegenhypothese verworfen, liegt dagegen die Testgröße nicht im kritischen Bereich , so wird H0 nicht verworfen. Beim statistischen Test kann nicht entschieden werden, ob die Nullhypothese H0 tatsächlich wahr oder falsch ist und auch nicht, mit welcher Wahrscheinlichkeit sie wahr ist. Da solche statistische Schlüsse nicht ganz sicher sind, treten Fehlentscheidungen auf. Wird in einem Test H0 verworfen, obwohl H0 tatsächlich aber richtig ist, so begeht man einen Fehler 1. Art. Wird dagegen H0 nicht verworfen, obwohl H0 tatsächlich aber falsch ist, so begeht man einen Fehler 2. Art . Es ist wünschenswert bei statistischen Tests beide Fehler möglichst gering zu halten. H0 abgelehnt H0 nicht abgelehnt H0 ist wahr Entscheidung: falsch Fehler 1. Art Entscheidung: richtig H0 ist falsch Entscheidung: richtig Entscheidung: falsch Fehler 2. Art 6 "# # $ % , & ! / ' ( , + * % ' ) ' *( % -. ' 0 & α $ α ) + ) ' !! -. 2 $ , + - ' # * -. , 3 ! ! + ! 1 . & *4 !2 , 3 ! *4 $ Das Nicht-Verwerfen einer Nullhypothese H0 bedeutet aber nicht, dass die Nullhypothese H0 bestätigt ist, sondern nur, dass das Stichprobenergebnis nicht zur Ablehnung von H0 ausreicht. *+* *+*+ ( )% ' ( 1 2 )# &)% ( ( / )% % 0 # $ Hypothesentests, die zur Untersuchung des unbekannten Mittelwerts µ mit aber bekannter Standardabweichung σ einer Grundgesamtheit für normalverteilte Verteilungen der Stichproben-Mittelwerte eingesetzt werden, bezeichnet man als den Gauß-Test oder z-Test. Falls die Verteilung der Gesamtheit normalverteilt ist, dann ist die Verteilung der Stichproben-Mittelwerte immer normalverteilt und falls die Verteilung der Gesamtheit nicht-normalverteilt ist, dann ist Verteilung der Stichproben-Mittelwerte bei Stichprobenumfänge N > 30 auch normalverteilt. Da die Verteilung der Stichprobenergebnisse, nämlich die Verteilung der Stichproben-Mittelwerte in diesen Fällen einer Normalverteilung gehorcht, werden diese Tests Gauß-Test (z-Test) genannt. (s. Kap. 10. Abschnitt 10.3.1) Wird zur Aufstellung einer Nullhypothese für den Mittelwert einer Grundgesamtheit ein bestimmter Wert µ0 vermutet, so können nach Fragestellung folgende unterschiedliche Gegenhypothesen aufgestellt werden. H0 : Ha : µ = µ0 µ < µ0 H0 : µ = µ0 Ha : µ > µ0 H0 : µ = µ0 Ha : µ ≠ µ0 Im Fall spricht man dann von einem einseitigen Test mit unterer (kritischer) dagegen von einem einseitigen Test mit oberer Grenze und im Fall Grenze, im Fall von einem zweiseitigen Test mit zwei Grenzen (eine untere und eine obere Grenze) 7 3)% &5 % ! ! σ H0 : Ha : Kritische Grenzen aufgrund der Irrtumswahrscheinlichkeit α und der Gegenhypothese Ha Testgröße für den Mittelwert x einer konkreten Stichprobe der Größe N Graph der Verteilung der Testfunktion für den Mittelwert X von Stichproben der Größen N mit Angabe der kritischen Bereiche und der Entscheidungsregel ! µ = µ0 (µ µ < µ0 µ0) Einseitiger Test mit unterer Grenze zˆ = (z) x − µo σ N (Linkseitiger Test) Z = zα X – µ σ N α z 0 zα AblehnungsBereich H0 verwerfen, falls zˆ < z α ! µ = µ0 µ > µ0 (µ ≤ µ0) Einseitiger Test mit oberer Grenze zˆ = (z) x − µo σ N (Rechtseitiger Test) Z = X – µ σ N α z z1 – α 0 z1 – α AblehnungsBereich H0 verwerfen, falls ẑ > z 1 −α ! µ = µ0 µ ≠ µ0 Zweiseitiger Test mit oberer und unterer Grenze zα 2 zˆ = (z) x − µo σ N Z = X – µ σ N z zα / 2 und z1 – α 2 α/2 α/2 AblehnungsBereich 0 z1 – α / 2 AblehnungsBereich H0 verwerfen, falls zˆ < z α 2 oder ẑ > z 1 − α 2 8