9 Prinzipien der statistischen Hypothesenprüfung Prinzipien der statistischen Hypothesenprüfung • Bei der Schätzung eines Populationsparamters soll dessen Wert aus Stichprobendaten erschlossen werden. Wenn es dagegen darum geht, die Korrektheit von Vermutungen über die Werte solcher Parameter zu prüfen, müssen statistische Tests durchgeführt werden. 9.1 Die Logik der statistischen Hypothesenprüfung Kennwertverteilung bei Gültigkeit der Null- und der Alternativhypothese • Beim statistischen Testen wird immer ein Hypothesenpaar betrachtet: die Nullhypothese H0 und die Alternativhypothese H1. Dabei behaupten Null- und Alternativhypothese wechselseitig das Gegenteil. Kennwertverteilung bei Gültigkeit der Null- und der Alternativhypothese • Die Prüfung der H. erfolgt erfolgt anhand von Stichprobendaten. Das empirische Kriterium ist dann ein Stichprobenkennwert, der die beiden folgenden Bedingungen erfüllen muss: – Die Wahrscheinlichkeitsverteilung des Kennwerts muß bekannt werden Kennwertverteilung bei Gültigkeit der Null- und der Alternativhypothese – Seine Kennwertverteilung muss sich bei Gültigkeit der Nullh. Von der Kennwertverteilung bei Gültigkeit der Alternativh. unterscheiden. In erster Linie bedeutet das, dass der Erwartungswert der Kennwertverteilung bei Gültigkeit der Nullh. einen anderen Wert aufweist als bei Gültigkeit der Alternativh. S T T U V W X Y Z [ \ ] ^ ` q _ a r s t a u b v ` w c x y d ` e t ` z c { y d w ` f x g h t a r i | ` } a ~ e q j { a s k y } d r f l v m n r c s t y j o { t ` a p a d ` f g ` a o ` f r A = > ? π @ ! " # $ π % & ' ( ) π * + , - . / 6 2 ; 5 7 < 7 ; 4 6 2: 5 7 9 7 8 2 6 5 2 3 0 4 1 B C D E F G H G I G J K L K M N O P Q R Abbildung aus Kühnel/Krebs, 2001: 255 Kennwertverteilung bei Gültigkeit der Null- und der Alternativhypothese • Der Bereich in dem die Nullh. akzeptiert wird, heißt Annahmebereich, der Bereich, in dem sie abgelehnt oder verworfen wird, heißt Ablehnungsbereich oder kritischer Bereich. Der Wert, der den Ablehnungsbereich vom Annahmebereich trennt, wird als kritischer Wert bezeichnet. ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ ´ π æ ç å è ­ µ ® ® ­ ¯ ² ° ¬ ± ¯ ² ° ¬ ± ­ ³ ² ² ¶ ¸ ¬ ­ ² ° ­ ± ° ² ± µ ´ ½ µ ¾ ¶ · ¿ ´ π é ç ê ë ì í î ï ð ñ î ò ó ð î ô õ Ë Ì Ì Í Î Ï Ð Ñ Ð Ò Ð Ó Ô Î Ö ≤ Õ À Á Ë Ç Ñ × Ø Ð Î Ì Ù Ì Ú Û Ñ Ð Ò Ð Ó Ô Î Õ Ö Ü À Á ² ¸ º ® ' Ç ± × ¸ ­ ² ¾ ¹ µ ( ¬ ¯ ( º º ± ¬ µ ) ® ¯ ² ° ­ ¸ ± ² ² * + + + µ ¸ ­ ° ± » ² ­ ® ² µ ¼ ² ­ µ ! ­ , ≤ ' - . ( ! + / ( + + , 0 - ! ú & ö÷ ø ù "# −α ß $ % Þ à á â ã α â Ã Á Ä Þ ä π Á Â Á Ã Á ) 4 Á Á Æ Å Á Ç Á α È Á É Á Ê ü ý ü þ ü ÿ ü ü ü ü ü ü Â . 7 Ä å û À −α Ý ! ≤ "# & $ % β −β 3 0 6 5 3 , 1 2 3 - 4 5 6 Abbildung aus Kühnel/Krebs, 2001: 257 Fehlermöglichkeiten bei der statistischen Hypothesenprüfung q * σ(p ) + µ(p ) =z 1− α 1− α 1 1 π *(1 − π ) 1 +π * 1 =z 1− α 1 n q = Wert des (1- α)- Qantails der 1− α Kennwertev erteilung eines Stichprobe nkennwerts Inhaltliche Relevanz der Null- und der Alternativhypothese • In Sinne von Popper ist es sinnvoll, die inhaltlich interessante H (=Hypothese) nur dann als richtig zu akzeptieren, wenn die Wahrscheinlichkeit, dass sie falsch ist, sehr klein ist. H = π > 0. 5 wird also nur dann 1 1 akzeptiert, wenn die Wahrscheinlichkeit, dass die Gegenh., d.h. die Nullh., gilt, so gering ist, dass die Nullh. abgelehnt wird. Inhaltliche Relevanz der Null- und der Alternativhypothese • Die inhaltlich interessantere H, die Forschungsh. wird in der Alternativh. formuliert. Ihr theoretisch weniger interessantes Gegenteil wird in der Nullh. formuliert. • Durch Festlegung einer geringen max. Fehlerwahrscheinlichkeit wird sichergestellt, dass die Forschungsh. nur akzeptiert wird, wenn die Nullh. mit großer Wahrscheinlichkeit falsch ist. Inhaltliche Relevanz der Null- und der Alternativhypothese • Erst bei Populationswerten, die weit von denen bei zutreffender Nullh. entfernt sind, ist auch die Wahrscheinlichkeit eines β Fehlers gering. Wenn es einen großen Bereich von Populationswerten gibt, in dem die Wahrscheinlichkeiten für einen β Fehler hoch sind, dann hat der statistische Htest nur eine geringe Trennschärfe. Inhaltliche Relevanz der Null- und der Alternativhypothese • Die Trennschärfe eines Tests hängt nicht nur von der Festlegung der α -Fehlerwahrscheinlichkeit, sondern auch vom Stichprobenumfang ab. Je größer der Stichprobenumfang, desto kleiner ist der Standardfehler der Teststatistik, und umso leichter ist es möglich, zwischen den Populationswerten zu unterscheiden, die mit der Forschungh. vereinbar oder unvereinbar sind. 9.2 Die Vorgehensweise bei der Prüfung statistischer Hypothesen Schritt 1:Formulierung von Null- und Alternativhypothese • Forschungsh. können gerichtet oder ungerichtet sein – Gerichtete H enthalten die Vermutung, dass ein Populationswert entweder größer oder kleiner als ein empirischer Stichprobenwert ist. – Ungerichtete H enthalten dagegen die Vermutung, dass ein Populaionswert ungleich einem empirischen Wert ist. Schritt 1:Formulierung von Null- und Alternativhypothese • Bei der gerichteten H über die Befürwortung von Schwangerschaftsabbruch bei finanzieller Notlage lautet das Hypothesenpaar: H :π ≤ 0.5 versus H :π > 0.5 0 1 1 1 Schritt 1:Formulierung von Null- und Alternativhypothese • Bei der ungerichteten H über den Unterschied der Populationsmittelwerte µD bei der Einstallung zur Demokratie bei Erstwählern und Altwählern lautet das Hypothesenpaar: H :µ =0 versus H :π >0.5 0 D 1 1 Schritt 2. Auswahl der statistischen Prüfgröße und der Testverteilung • In der Null- und der Alternativhypothese wird eine Behauptung über einen Populationsparamter formuliert. • Z= p −π 1 π 1/H 1/H * (1 − π 0 0 1/H ) 0 n Schritt 3: Festlegung der Irrtumswahrscheinlichkeit und es Ablehnungsbereichs • Der Ablehnungsbereich wird indirekt über die Festlegung der max. Irrtumswahrscheinlichkeit α bestimmt. • Bestimmungen der kritischen Region: – 1. Behauptet die Forschungsh., dass ein Populationswert größer als ein postulierter Wert ist, dann liegt der kritische Bereich der Nullh. Im oberen Abschnitt der Testverteilung. → (Fortsetzung) Bestimmungen der kritischen Region – Der kritische Wert ist also gleich dem 1- α Quantilwert der Testverteilung. Beispiel: H :π ≤ 0.5 versus H :π > 0.5 Einseitiger Htest 0 1 1 1 – 2. Behauptet die Forschungsh., dass ein Populationswert kleiner ist als ein postulierter Wert, dann liegt der kritische Bereich der Nullh. Im unteren Abschnitt der → Testverteilung. (Fortsetzung) Bestimmungen der kritischen Region – Der kritische Wert ist gleich demα Quantilwert der Testverteilung. Beispiel: H :π ≥ 0.5 versus H :π < 0.5 Einseitiger Htest. 0 1 1 1 – 3. Behauptet die Forschungsh., dass ein Populationswert ungleich einem postulierten Wert ist, dann liegt der → (Fortsetzung) Bestimmungen der kritischen Region – Kritische Bereich der Nullh. Zu gleichen Teilen im unteren und im oberen Abschnitt der Verteilung. Es gibt dann zwei kritische Werte ,die gleich demα / 2 -Quantilwert und dem 1 − α / 2 -Quantilwert der Testverteilung sind. Beispiel: (zweiseitiger Htest.) H :π = 0.5 versus H :π ≠ 0.5 0 1 1 1 Schritt 4: Entscheidungen über Akzeptanz oder Ablehnung der Nullh. aufgrund des Stichprobenwertes der Teststatistik • Ist das empirische Signifikanzniveau größer oder gleich der Irrtumswahrscheinlichkeit α ,dann wird die Nullh. beibehalten: p< α : Ablehnung der Nullh. p ≥ α : Beibehaltung der Nullh. Schritt 4 (Fortsetzung) • Das empirische Signifikanzniveau p unterscheidet sich bei einseitigen und zweiseitigen Htests. Im oben vorgestellten Beispiel hat die Teststatistik beim zweiseitigen Test den Wert Z ± 2. Schritt 4 (Fortsetzung) • Bei einseitiger Prüfung der Nullh., H0 :π1 ≥ 0,5 dass der Populationswert mindestens π1 50% beträgt, entspricht der Wert der Teststatistik Z= -2 dem 2.28% - Quantil der Standardnormalverteilung. 9.3 Beziehung zwischen statistischen Hypothesentests und der Berechnung von Konfidenzintervallen Beziehung zwischen statistischen Htests und der Berechnung von Konfidenzintervallen • Beispiel: Die ungerichtet Forschungsh. wird geprüft: H :π = 0.5 versus H :π ≠ 0.5 0 1 1 1 In folgender Formel gilt: z1−α / 2 = Quantilwert des 1 − α / 2 -Quantils der statistischen Prüfgröße Z ∧ σ(p1) = geschätzter Standerfehler des Stichprobenanteils p1 Beziehung zwischen.... ∧ c . i .( π 1 ) = p 1 ± σ ( p 1 ) * z 1 − α / 2 p 1 * (1 − p 1 ) * z 1− α / 2 n 0 .4 * (1 − 0 .4 ) * 1 . 96 = 0 .4 ± 100 = 0 . 4 ± 0 . 096 = 0 . 304 bis 0 . 496 = p1 ±