Testverfahren zur Prüfung von Hypothesen über Parameter oder Verteilungen Einführung und Begriffe beim Hypothesentest Hypothesentest für den Mittelwert Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 1 Bibliografie ¾ Prof. Dr. Kück Universität Rostock Statistik, Vorlesungsskript, Abschnitt 7.2.1 und 7.2.2 ¾ Bleymüller / Gehlert / Gülicher Verlag Vahlen Statistik für Wirtschaftswissenschaftler ¾ MM*Stat. Eine interaktive Einführung in die Welt der Statistik PC Pool WISO-Fakultät \\zeus\statistik\MMstat\start ¾ Dr. Roland Jeske, Universität Konstanz http://www.wiwi.uni-konstanz.de/heiler/os2/ ¾ Dr. H.-J. Mittag, Fernuniversität Hagen http://www.fernuni-hagen.de/newstatistics Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 2 1 Testverfahren ¾ Zusammen mit dem Schätzen bildet das Testen von Hypothesen den Kernbereich der schließenden oder induktiven Statistik. ¾ Statistische Tests sind Verfahren zur Überprüfung von Annahmen bzw. Hypothesen über unbekannte Parameterwerte oder über die unbekannte Verteilung eines Merkmals in der Grundgesamtheit auf Basis der Ergebnisse einer Zufallsstichprobe. ¾ Hypothesen können auf theoretischen Überlegungen, früheren Beobachtungen, Sollwerten, Güteanforderungen, Erfahrungen, Behauptungen usw. basieren. Sie haben bis zum Beweis des Gegenteils ihre Gültigkeit, sie werden also zum Zweck der empirischen Widerlegung oder Bekräftigung aufgestellt. Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik 3 Testverfahren I Realität Gericht - Beispiel Unschuld Schuld Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Freispruch Freispruch Verurteilung Verurteilung Gerichtsverfahren zum Beweis des Gegenteils, wobei in der Demokratie die Unschuldshypothese Ausgangshypothese ist. Verfahren endet mit Spruch. Testverfahren I Entscheidung 4 2 Düngemittelwerk - Beispiel Zufallsgröße X: Gewicht der Säcke Sollgewicht der Säcke: E(X)=µ0 =50 kg Düngemittelwerk Verpackungsautomat Stichprobemittelwert: X Abweichung zwischen Stichprobemittelwert X und Sollwert µ0: | X − µ 0 | | X − µ 0 | ≤ k ⇒ die Abweichung ist nur zufällig⇔ Der Automat ist richtig eingestellt oder arbeitet fehlerfrei. | X − µ 0 | > k ⇒ die Abweichung ist nicht nur zufällig⇔ Der Automat wurde falsch eingestellt oder arbeitetXfehlerhaft. Mit Hilfe statistischer Testverfahren kann in einem solchen Fall bestimmt werden, wie groß die Abweichung mindestens sein muss, damit mit ausreichender Wahrscheinlichkeit auf einen falsch eingestellten bzw. defekten Verpackungsautomaten geschlossen werden kann. Diese Verfahren finden in der modernen Industrie unter dem Begriff der statistischen Produktionskontrolle massenhaft Anwendung. Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 5 Statistische Hypothesen eines Tests ¾ In einem statistischen Test werden zwei gegensätzliche Hypothesen gegenüber gestellt. Die eine Hypothese negiert die andere. ¾ Eine Hypothese wird Nullhypothese genannt und mit H0 bezeichnet. Sie beinhaltet immer das Gleichheitszeichen. ¾ Die andere Hypothese wird Alternativhypothese genannt und mit H1 bzw. HA bezeichnet. Weil Alternativhypothese und Forschungsvermutung oft übereinstimmen, wird H1 auch Forschungshypothese genannt. ¾ Null- und Alternativhypothese sind stets disjunktiv. Die Ablehnung der einen bedeutet die Annahme der anderen und umgekehrt. Um Missverständnisse zu vermeiden, wird hier meistens nur über die Ablehnung oder die Annahme von H0 geredet. H0 vs. H1 H0: Nullhypothese H1 : Alternativhypothese oder Forschungshypothese Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 6 3 Treffen von Entscheidungen in einem statistischen Hypothesentest Aus der Sicht der Statistik gibt es zwei Möglichkeiten, eine Entscheidung über die Annahme oder Ablehnung einer Hypothese zu treffen. ¾Deterministisch, wenn der Wert des Parameters oder die Verteilung in der Grundgesamtheit auf Grund einer Totalerhebung berechnet werden kann. Es reicht ein simpler Vergleich, um die Entscheidung ohne Irrtum zu treffen. ¾Stochastisch oder statistisch, wenn der wahre Wert des Parameters oder die Verteilung in der Grundgesamtheit aus praktischen Gründen nicht bestimmt, sondern nur mittels einer zufällig ausgewählten Stichprobe vom Umfang n geschätzt werden kann. In diesem Fall ist nicht gesichert, dass die Entscheidung fehlerfrei ist. Hier sind zwei Zustände möglich: Treffen oder Irrtum. Treffen oder berechtigte Entscheidung, wenn eine in der Realität zutreffende Hypothese angenommen oder eine nicht zutreffende Hypothese abgelehnt wird. Irrtum oder Fehler, wenn eine zutreffende Hypothese abgelehnt oder eine nicht zutreffende Hypothese angenommen wird. Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik 7 Testverfahren I Fehlertyp bei einem statistischen Hypothesentest Entscheidung Realität durch H0 ausgedrückt durch H1 ausgedrückt Annahme von H0 Treffen Irrtum (Fehler zweiter Art) Ablehnung von H0 Irrtum (Fehler erster Art) Treffen Lehnt man H0 in einem Test ab, wenn in der Wirklichkeit H0 zutrifft, dann macht man einen Fehler. Wird H0 angenommen (nicht abgelehnt), wenn H0 nicht zutrifft, dann macht man auch einen Fehler. Beide Fehler unterscheiden sich inhaltlich. Sie werden Fehler erster Art bzw. Fehler zweiter Art genannt. Zwei richtige Entscheidungen (Treffen) sind auch möglich. In der Tabelle werden die vier möglichen Zustände bei einem statistischen Test zusammengefasst dargestellt. Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 8 4 Fehlermessung bei einer stochastischen Entscheidung Die Größen der Fehler eines Tests werden mit Hilfe ihrer Wahrscheinlichkeit gemessen und mit W(I) bzw. W(II) bezeichnet. Man kann dann unterscheiden: ¾W(I) =W(Fehler 1. Art) = W(H0 wird abgelehnt|H0 trifft zu) ¾W(II)=W(Fehler 2. Art) = W(H0 wird nicht abgelehnt|H0 trifft nicht zu) In der empirischen Forschung legt man großen Wert darauf, dass der Fehler bei der Annahme einer nicht zutreffenden Forschungshypothese H1 (Ablehnung von H0, wenn H0 zutrifft) so klein wie möglich bleibt. Dazu setzt man eine obere Grenze α für die Wahrscheinlichkeit dieses Fehlers. Der Wert α, der nicht überschritten werden soll, wird Signifikanzniveau des Tests genannt. Es gilt dann W(Fehler 1. Art) ≤ α . Die obere Grenze für die Größe des Fehlers 2. Art wird mit β bezeichnet. Es gilt W(Fehler 2. Art) ≤ β. Die Differenz 1-β wird Macht oder Power des Tests genannt. 1-β ist die Wahrscheinlichkeit dafür, dass man eine zutreffende Forschungshypothese (Alternativhypothese) H1 fehlerfrei annimmt. Es ist natürlich auch erwünscht, einen Test durchzuführen, bei dem diese Wahrscheinlichkeit so groß wie möglich zu erhalten ist. Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik 9 Testverfahren I Fehlermessung - Zusammenfassung Entscheidung Realität durch H0 ausgedrückt durch H1 ausgedrückt Annahme von H0 Treffen Irrtum W(Fehler 2. Art) ≤ β Ablehnung von H0 Irrtum W(Fehler 1. Art) ≤ α α: Signifikanzniveau Treffen W(H0 wird abgelehnt|H1 trifft zu) ≥ 1- β: Macht W(I) = W(Fehler 1. Art) = W(H0 wird abgelehnt|H0 trifft zu) ≤α W(II)= W(Fehler 2. Art) = W(H0 wird nicht abgelehnt|H0 trifft nicht zu) ≤ β W(fehlerfreie Annahme einer zutreffenden Forschungshypothese H1) = W(H0 wird abgelehnt|H0 trifft nicht zu) = 1- W(H0 wird nicht abgelehnt|H0 trifft nicht zu) = 1 - W(II) ≥ 1 - β (Macht) Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 10 5 Prüfgröße, kritischer Bereich Um eine statistische Entscheidung über die Richtigkeit einer Hypothese auf Grund einer zufällig gezogenen Stichprobe (X1, X2, . . . , Xn) zu treffen, definiert man eine geeignete Stichprobenfunktion γ̂ n und teilt den Wertebereich dieser Funktion in zwei ausschließende Teile: einen Teilbereich K und seiner Komplement K , so dass, wenn der Wert der Funktion in den Teilbereich K hinfällt, H0 abgelehnt wird. Fällt der Wert der Stichprobenfunktion in den anderen Teilbereich, dann wird H0 nicht abgelehnt (H0 wird angenommen). Die Stichprobenfunktion und die Teilbereiche werden in diesem Zusammenhang Prüfgröße, Ablehnungsbereich (Ablehnung von H0) und Annahmebereich (Annahme von H0) genannt. Der Ablehnungsbereich von H0 wird auch kritischer Bereich genannt. γ̂ n ∈ K ⇒ H 0 wird abgelehnt (H 1 wird angenommen ) γ̂ n ∉ K ⇔ γ̂ n ∈ K ⇒ H 0 wird angenommen (H 0 wird nicht abgelehnt) Es gilt für die Wahrscheinlichkeit des Irrtums erster Art: W(γ̂ n ∈ K | H 0 trifft in der Realität zu) = W(H 0 wird abgelehnt | H 0 trifft in der Realität zu) = W(Fehler 1. Art) ≤ α Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 11 Klassifizierung von statistischen Tests ¾ Nach dem Inhalt der Hypothese: - Parametrische Tests (Tests über die Parameter einer unbekannten Verteilung) - Verteilungstests (Tests über eine unbekannte Verteilung) ¾ Nach der Abhängigkeit der Verteilung der Stichprobenfunktion von der Verteilung der Grundgesamtheit: - Verteilungsgebundene Tests - Verteilungsfreie Tests ¾ Nach der Anzahl der Stichproben, die für den Hypothesentest notwendig sind: - Einstichprobentest - Zweistichprobentest - Mehrstichprobentest ¾ Nach der Form des kritischen Bereiches - Zweiseitige Tests - Einseitige Tests (rechtsseitige Tests bzw. linksseitige Tests) Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 12 6 Bestandteile eines Hypothesentests Ein Hypothesentest besteht aus sieben Elementen: 1. zwei entgegengesetzt formulierten Hypothesen (H0 und H1) 2. einem von vornherein festgelegten Signifikanzniveau α 3. einer bzw. mehreren Stichproben 4. einer Stichprobenfunktion oder Prüfgröße bzw. Testgröße 5. einem Ablehnungsbereich bzw. einem Annahmebereich für H0 6. einer Entscheidungsregel 7. einer Entscheidung Zusammen mit dem Schätzen bildet das Testen von Hypothesen den Kernbereich der schließenden oder induktiven Statistik. Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik 13 Testverfahren I Parametrische Einstichprobentests In diesem Abschnitt werden folgende Parametertests behandelt, über deren Annahmen eine Stichprobenuntersuchung Aufschluss geben soll: ¾ Parametertest über den Mittelwert (1) H0: µ=µ0 vs. H1: µ≠ µ0 (Zweiseitiger Test) (2) H0: µ≥ µ0 vs. H1: µ< µ0 (Linksseitiger Test) (3) H0: µ≤ µ0 vs. H1: µ> µ0 (Rechtsseitiger Test) ¾ Parametertest über die Varianz einer Normalverteilung (1) H0: σ²= σ²0 vs. H1: σ² ≠ σ²0 (2) H0: σ² ≥ σ²0 vs. H1: σ2 < σ²0 (3) H0: σ² ≤ σ²0 vs. H1: σ² > σ²0 ¾ Parametertest über den Anteilwert (1) H0: θ= θ0 vs. H1: θ ≠ θ0 (2) H0: θ ≥ θ0 vs. H1: θ < θ0 (3) H0: θ ≤ θ0 vs. H1: θ > θ0 Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 14 7 Zweiseitiger Test für den Mittelwert einer Normalverteilung mit bekannter Varianz (A) Sei X eine normalverteilte Zufallsvariable in einer Grundgesamtheit mit dem unbekannten Mittelwert µ und der bekannten Varianz σ², X~ N(µ, σ²). Es wird auf einem Signifikanzniveau α getestet, ob der Parameter µ gleich µ0 ist oder nicht, d. h. es wird zwischen den folgenden Hypothesen entschieden: H0: µ=µ0 vs. H1: µ≠ µ0 (Zweiseitiger Test) Null- und Alternativhypothese W(H 0 wird abgelehnt | µ = µ 0 ) = W(Fehler 1. Art) = α α : Signifikanzniveau Sei (X1, X2, . . . , Xn) eine Stichprobe vom Umfang n. Es gilt für jede Xi ~ N(µ, σ²). Um eine Entscheidung über den Mittelwert µ der Grundgesamtheit zu treffen ist es zweckmäßig, den Stichprobenmittelwert anzuwenden. Für diese Stichprobenfunktion (Prüfgröße bzw. Testgröße) gilt: X ~ N(µ ; σ² X− µ )⇔Z= ~ N(0 ; 1) σ n n Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik 15 Testverfahren I Zweiseitiger Test für den Mittelwert einer Normalverteilung mit bekannter Varianz (B) Der kritische Bereich K ist die Menge aller möglichen Werte des Stichprobenmittelwertes, für welche gilt: 1. der Abstand von µ0 ist so groß, dass man die Nullhypothese ablehnen soll, 2. die Wahrscheinlichkeit, dass der Fehler bei dieser Entscheidung nicht größer als α ist. { K = X : X − µ 0 > c und W( X − µ 0 > c | µ = µ 0 ) ≤ α } W( X − µ 0 > c | µ = µ 0 ) = α ⇔ W( X − µ 0 ≤ c | µ = µ 0 ) = 1 − α ⇔ W(− c ≤ X − µ 0 ≤ c | µ = µ 0 ) = 1 − α ⇔ W( − c X− µ0 c ≤ ≤ | µ = µ0 ) = 1 − α σ σ σ n n n −c c ⇔ W( ≤Z≤ ) = 1− α σ σ n n Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 16 8 Zweiseitiger Test für den Mittelwert einer Normalverteilung mit bekannter Varianz (C) W( −c c ≤Z≤ ) = 1− α σ σ n n c σ =Z α ⇒c= ⋅Z α 1− σ n 1− 2 2 n K = {X :| X − µ 0 | > c und W(| X − µ 0 | > c | µ = µ 0 ) = α} K(α ) = {X :| X − µ 0 | > σ n ⋅Z 1− α 2 } = {X : | X− µ0 | > Z α} 1− σ 2 n Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik 17 Testverfahren I Zweiseitiger Test für den Mittelwert einer Normalverteilung mit bekannter Varianz (D) Entscheidungsregel und Treffen der Entscheidung: X ∈ K(α ) ⇒ H 0 wird abgelehnt (H 1 wird angenommen ) Die Fehlerwahrscheinlichkeit liegt unter α. W[X ∈ K(α ) | µ = µ 0 ] = α Diese Aussage ist richtig vor der Ziehung der konkreten Stichprobe. Zieht man eine konkrete Stichprobe, dann ist der berechnete Stichprobenmittelwert keine Zufallsvariable mehr und deswegen hat es keinen Sinn, nach der Ziehung der SP eine Wahrscheinlichkeitsaussage zu machen. Da der Wert von α nahe Eins gewählt wird, kann man nur hoffen, dass die Entscheidung richtig ist. X ∉ K(α ) ⇒ H 0 wird nicht abgelehnt (H 0 wird angenommen ) Die Fehlerwahrscheinlichkeit bei dieser Entscheidung ist unbekannt. W[ X ∉ K(α ) | µ ≠ µ 0 ] = W[H 0 wird nicht abgelehnt | H 0 trifft nicht zu] = β Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 18 9 Zweiseitiger Test für den Mittelwert einer Normalverteilung mit bekannter Varianz - Zusammenfassung 1. H0: µ=µ0 vs. H1: µ≠ µ0 2. Signifikanzniveau: α (Zweiseitiger Test) 3. Stichprobe vom Umfang n: (X1, X2, . . . , Xn) 4. Prüfgröße bzw. Testgröße: X ~ N(µ ; 5. Kritischer Bereich: X− µ0 X− µ σ² σ ⋅ Z α } = {X : | | > Z α} )⇔Z= ~ N(0 ; 1) K(α ) = {X :| X − µ 0 | > 1− σ σ n n 1− 2 2 n n 7. 6. Entscheidungsregel: Treffen der Entscheidung X ∈ K(α ) ⇒ H 0 wird abgelehnt (H 1 wird angenommen ) X ∉ K(α ) ⇒ H 0 wird nicht abgelehnt (H 0 wird angenommen ) Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik auf Basis einer konkreten Stichprobe (x1, x2, . . . , xn) 19 Testverfahren I Zusammenhang zwischen den Größen beider Fehler H0: µ=µ0 vs. H1: µ ≠ µ0 α: (Signifikanzniveau): Größe des Fehlers erster Art (Vorgegeben) (1) µ0 (µ = µ1 ) β: Größe des Fehlers zweiter Art (Im Allgemeinen unbekannt) µ1 (3) (2) µ0 µ0 µ1 α 1> α2> α3 ⇒ β1< β2< β3 Beide Fehler wachsen umgekehrt. Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik µ1 Testverfahren I 20 10 Test für den Mittelwert einer Normalverteilung mit bekannter Varianz - Beispiel Beispiel: Das Durchschnittsgewicht von Masthähnchen lag in der Vergangenheit bei 492,5 g mit einer Standardabweichung von 18,9 g. Nach Übergang zu einem neuen Futtermittel liefert eine Stichprobe im Umfang von 81 ein Durchschnittsgewicht von 496,3 g. Kann man aufgrund dieses Stichprobenergebnisses unter der Annahme einer gleichgebliebenen Standardabweichung mit einem Signifikanzniveau von 1 % schließen, dass sich das Durchschnittsgewicht in der Grundgesamtheit verändert hat? H0: µ=µ0 vs. H1: µ ≠ µ0 H0: µ=492,5 vs. H1: µ ≠ 492,5 Z= X− µ0 σ K(α ) = {X : | (µ0 = 492,5 ) Z α=0,01 1− α 2 = Z 0,995 = 2,58 x = 496,3 496,3 − 492,5 X− µ0 X − 492,5 = 1,81 | > Z α } = {X : | | > 2,58} z = 1− σ 18,9 18,9 2 n n 81 81 Entscheidung: Da |1,81|<2,58 gilt, wird H0 nicht abgelehnt. Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik 21 Testverfahren I Einseitige Tests für den Mittelwert einer Normalverteilung mit bekannter Varianz Ein einseitiger Test für den Mittelwert einer Normalverteilung mit bekannter Varianz unterscheidet sich von dem zweiseitigen Test nur in seinem entsprechenden kritischen Bereich. 5. Kritische Bereiche: Linksseitiger Test (2) H0: µ≥ µ0 vs. K(α ) = {X : X < µ 0 − σ n Rechtsseitiger Test H1: µ< µ0 ⋅ Z1−α } = {X : (3) H0: µ≤ µ0 X− µ0 < - Z1−α } σ K(α ) = {X : X > µ 0 + vs. σ n H1: µ> µ0 ⋅ Z1−α } = {X : X− µ0 > Z1− α } σ n n α α -Z1-α Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Z1-α Testverfahren I 22 11 Tests für den Mittelwert einer Normalverteilung mit unbekannter Varianz Die Tests für den Mittelwert einer Normalverteilung mit unbekannter Varianz unterscheiden sich von den vorigen Tests nur in der Prüfgröße und den entsprechenden kritischen Bereichen. Prüfgröße X ~ N(µ ; X− µ0 σ² )⇔T= ~ t n −1 S n n Test Kritischer Bereich: (1) H0: µ=µ0 vs. S H1: µ≠ µ0 K(α ) = {X :| X - µ 0 | > (2) H0: µ≥ µ0 vs. H1: µ< µ0 K(α ) = {X : X < µ 0 − S (3) H0: µ≤ µ0 vs. H1: µ> µ0 K(α ) = {X : X > µ 0 + S Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik n n n ⋅t n −1 ; 1− α 2 } = {X : | T | > t n −1 ; 1− α 2 } ⋅ t n −1 ; 1−α } = {X : T < - t n −1 ; 1−α } ⋅ t n −1 ; 1−α } = {X : T > t n −1 ; 1−α } 23 Testverfahren I Test für den Mittelwert einer Normalverteilung mit unbekannter Varianz - Beispiel Beispiel: Eine Maschine stellt Plättchen her, deren Dicke normalverteilt ist, mit dem Sollwert (Mittelwert) 0,25 cm. Eine Stichprobe von 10 Plättchen liefert ein arithmetisches Mittel von 0,253 cm bei einer Standardabweichung von 0,003 cm. Die Hypothese, dass die Maschine noch exakt arbeitet, ist auf einem Signifikanzniveau von 0,05 zu überprüfen. H0: µ=µ0 vs. H1: µ ≠ µ0 H0: µ=0,25 vs. H1: µ ≠ 0,25 T= X− µ0 S K(α ) = {X : | X - µ 0 | > n (µ0 = 0,25 ) t α=0,05 n −1 ; 1− α 2 = t 9 ; 0,975 = 2,262 x = 0,253 S n ⋅t n −1 ; 1− α 2 } = {X : | T | > 2,262} t= s = 0,003 0,253 − 0,25 = 3,162 0,003 10 Entscheidung: Da |3,162|>2,262 ist, wird H0 abgelehnt. Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 24 12 Tests für den Mittelwert einer unbekannten Verteilung für große Stichproben Für die unbekannte Verteilung in der GG und großen Stichprobenumfang (n>30) gilt: Man kann in diesem Fall den Stichprobenmittelwert oder eine Funktion von ihm als Prüfgröße für den Test über den X− µ0 σ² X ~ N(µ ; ) ⇔ T = ~ t n −1 → Z ~ N(0 ; 1) S Mittelwert nutzen. Die entsprechenden n kritischen Bereiche werden durch n Verwendung der Normalverteilung bestimmt. Prüfgröße Kritischer Bereich: Test S vs. H1: µ≠ µ0 K(α ) = {X :| X - µ 0 | > (2) H0: µ≥ µ0 vs. H1: µ< µ0 K(α ) = {X : X < µ 0 − S (3) H0: µ≤ µ0 vs. H1: µ> µ0 K(α ) = {X : X > µ 0 + S (1) H0: µ=µ0 Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik n ⋅Z 1− α 2 } = {X : | T | > Z 1− α 2 } ⋅ Z1−α } = {X : T < - Z1−α } n n ⋅ Z1−α } = {X : T > Z1−α } 25 Testverfahren I Test für den Mittelwert einer unbekannten Verteilung – Beispiel (1) Beispiel: Bei der Überprüfung des Verpackungsautomaten im Düngemittelwerk werden 31 Säcke nachgewogen, für die ein Durchschnittsgewicht 50,1 kg und eine Standardabweichung 250 g berechnet werden. Aufgrund dieses Stichprobenbefundes ist eine Entscheidung über die Arbeit des Automaten (fehlerhaft/ nicht fehlerhaft) zu treffen. Die Entscheidung soll bei 5 prozentiger Irrtumswahrscheinlichkeit getroffen werden. Über die Verteilung des Gewichtes der Säcke liegt keine Information vor. H0: µ=50 T= X− µ0 S vs. α=0,05 n n −1 ; 1− α 2 x = 50,1 H1: µ ≠ 50 K(α ) = {X : | X - µ 0 | > t S n ⋅t n −1 ; 1− α } = { X : | T | > 2,042} 2 = t 30 ; 0,975 = 2,042 s = 0,250 t= 50,1 − 50 = 2,227 0,250 31 Entscheidung: Da |2,227|>2,042 ist, wird H0 abgelehnt, d. h. man kann annehmen, dass der Automat fehlerhaft arbeitet. Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 26 13 Test für den Mittelwert einer unbekannten Verteilung – Beispiel (2) Beispiel: 2003 beträgt das Durchschnittsalter der Zuzüge aus anderen Kreisen MV nach Rostock 30 Jahre. Im Jahr 2004 liegt, bei einer Stichprobe von 100 Personen, das Durchschnittsalter der Zuzüge bei 29,2 Jahre mit einer Standardabweichung von 14,65 Jahren. Hat sich der Wert im Jahr 2004 signifikant verringert, bei einem Signifikanzniveau von 0,05? Quelle: Statistische Berichte 2003. Über die Verteilung des Alters liegt keine Information vor. α=0,05 s = 14,65 x = 29,2 H0: µ≥30 vs. H1: µ < 30 T= t n −1 ; 1−α = t 99 ; 0,95 = 1,66 29,2 − 30 X − µ 0 K(α ) = {X : (X - µ ) < - S ⋅ t t= = −0,55 0 n −1 ; 1− α } = { X : T < -1,66} 14,65 n S 100 n Entscheidung: Da -0,55>-1,66 ist, wird H0 nicht abgelehnt, d. h. die Verringerung des durchschnittlichen Wanderungsalters (Zuzüge) ist nicht signifikant. Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik 27 Testverfahren I Test für den Mittelwert einer unbekannten Verteilung – Beispiel (3) Beispiel: Das durchschnittliche Nettoeinkommen liegt im März 2004 bei 1.603 €. Bei einer Stichprobe von 200 Personen im Juni 2004 lag das durchschnittliche Nettoeinkommen bei 1.715 € mit einer Standardabweichung von 1.227 €. Hat sich das durchschnittliche monatliche Nettoeinkommen bei einem Signifikanzniveau von 0,05 statistisch signifikant erhöht? Quelle: Mikrozensus 2004, Tabelle 36. Über die Verteilung des Nettoeinkommen liegt keine Information vor. H0: µ≤1.603 T= vs. α=0,05 H1: µ > 1.603 t n −1 ; 1−α = t199 ; 0,95 = 1,645 x = 1.715 S X− µ0 K(α ) = {X : (X - µ 0 ) > ⋅ t n −1 ; 1−α } = {X : T > 1,645} t = S n n s = 1.227 1.715 − 1.603 = 1,291 1.227 200 Entscheidung: Da 1,291<1,645 ist, wird H0 nicht abgelehnt, d. h. das durchschnittliche Nettoeinkommen im Juni 2004 ist nicht signifikant höher als im März 2004. Dr. Ricabal Delgado/Prof. Kück Lehrstuhl Statistik Testverfahren I 28 14