Parametrische Einstichprobentests ¾ Einführung und Begriffe beim Hypothesentest ¾ Hypothesentest für den Mittelwert ¾ Hypothesentest für die Varianz ¾ Hypothesentest für den Anteilswert Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 1 Bibliografie Bleymüller / Gehlert / Gülicher Verlag Vahlen Statistik für Wirtschaftswissenschaftler Bleymüller / Gehlert Verlag Vahlen Statistische Formeln, Tabellen und Programme PowerPointPräsentationen (Prof. Kück / Dr. Ricabal) Vorlesungsskript für Statistik I (Dr. Pu Chen) Vorlesungsskript für Statistik II (Prof. Mohr, Private Hanseuniversität Rostock) http://www.wiwi.uni-rostock.de/vwl/statistik/download/ba/ Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 2 1 Testverfahren ¾ Zusammen mit dem Schätzen bildet das Testen von Hypothesen den Kernbereich der schließenden oder induktiven Statistik. ¾ Statistische Tests sind Verfahren zur Überprüfung von Hypothesen (Annahmen) über unbekannte Parameter oder über Verteilungen auf Basis einer bzw. mehreren Zufallsstichproben. ¾ Hypothesen können auf theoretischen Überlegungen, früheren Beobachtungen, Sollwerten, Güteanforderungen, Erfahrungen, Behauptungen usw. basieren. Sie haben bis zum Beweis des Gegenteils ihre Gültigkeit, sie werden also zum Zweck der empirischen Widerlegung oder Bekräftigung aufgestellt. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 3 Realität Beispiel: Gericht Unschuld Schuld Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Freispruch Freispruch Verurteilung Verurteilung Gerichtsverfahren zum Beweis des Gegenteils, wobei in der Demokratie die Unschuldshypothese Ausgangshypothese ist. Verfahren endet mit Spruch. Testverfahren I Entscheidung 4 2 Beispiel: Düngemittelwerk Düngemittelwerk Verpackungsautomat Abweichung zwischen Stichprobemittelwert X und Sollwert µ0: | X − µ 0 | Mit Hilfe statistischer Testverfahren kann in einem solchen Fall bestimmt werden, wie groß die Abweichung mindestens sein muss, damit mit ausreichender Wahrscheinlichkeit auf einen falsch eingestellten bzw. defekten Verpackungsautomaten geschlossen werden kann. Diese Verfahren finden in der modernen Industrie unter dem Begriff der statistischen Produktionskontrolle massenhaft Anwendung. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 5 Statistische Hypothesen eines Tests ¾ In einem statistischen Test werden zwei gegensätzliche Hypothesen gegenüber gestellt. Die eine Hypothese negiert die andere. ¾ Eine Hypothese wird Nullhypothese genannt und mit H0 bezeichnet. Sie beinhaltet immer das Gleichheitszeichen. ¾ Die andere Hypothese wird Alternativhypothese genannt und mit H1 bzw. HA bezeichnet. Weil Alternativhypothese und Forschungsvermutung oft übereinstimmen, wird H1 auch Forschungshypothese genannt. ¾ Null- und Alternativhypothese sind stets disjunktiv. Die Ablehnung der einen bedeutet die Annahme der anderen und umgekehrt. Um Missverständnisse zu vermeiden, wird hier meistens nur über die Ablehnung oder die Annahme der Nullhypothese H0 geredet. H0 vs. H1 Nullhypothese (H0) versus Alternativhypothese (H1) Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 6 3 Treffen von Entscheidungen in einem statistischen Hypothesentest Aus der Sicht der Statistik gibt es zwei Möglichkeiten, eine Entscheidung über die Annahme oder Ablehnung einer Hypothese zu treffen. ¾ Deterministisch, wenn der Wert des Parameters oder die Verteilung in der Grundgesamtheit auf Grund einer Totalerhebung berechnet werden kann. Es reicht ein simpler Vergleich, um die Entscheidung ohne Irrtum zu treffen. ¾ Stochastisch oder statistisch, wenn der wahre Wert des Parameters oder die Verteilung in der Grundgesamtheit aus praktischen Gründen nicht bestimmt, sondern nur mittels einer zufällig ausgewählten Stichprobe vom Umfang n geschätzt werden kann. In diesem Fall ist nicht gesichert, dass die Entscheidung fehlerfrei ist. Hier sind zwei Zustände möglich: Treffen oder Irrtum. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 7 Fehlertyp bei einem statistischen Hypothesentest Test: H0 vs. Entscheidung H1 Realität H0 trifft zu H1 trifft zu Annahme von H0 Treffen Irrtum (Fehler zweiter Art) Ablehnung von H0 Irrtum (Fehler erster Art) Treffen Lehnt man H0 in einem Test ab, wenn in der Wirklichkeit H0 zutrifft, dann macht man einen Fehler. Wird H0 angenommen (nicht abgelehnt), wenn H0 nicht zutrifft, dann macht man auch einen Fehler. Beide Fehler unterscheiden sich inhaltlich. Sie werden Fehler erster Art bzw. Fehler zweiter Art genannt. Zwei richtige Entscheidungen (Treffen) sind auch möglich. In der Tabelle werden die vier möglichen Zustände bei einem statistischen Test zusammengefasst dargestellt. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 8 4 Fehlermessung bei einer stochastischen Entscheidung Die Größen der Fehler eines Tests werden mit Hilfe ihrer Wahrscheinlichkeit gemessen und mit W(I) bzw. W(II) bezeichnet. Man kann dann unterscheiden: ¾ W(I) = W(Fehler 1. Art) = W(H0 wird abgelehnt |H0 trifft zu) ¾ W(II) = W(Fehler 2. Art) = W(H0 wird nicht abgelehnt |H0 trifft nicht zu) Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 9 Größe des Fehlers erster Art ¾ W(I) =W(Fehler 1. Art) = W(H0 wird abgelehnt|H0 trifft zu) In der empirischen Forschung legt man großen Wert darauf, dass der Fehler bei der Annahme einer nicht zutreffenden Forschungshypothese H1 (Ablehnung von H0, wenn H0 zutrifft) so klein wie möglich bleibt. Dazu setzt man eine obere Grenze α für die Wahrscheinlichkeit dieses Fehlers (Fehler erster Art). Der Wert α, der nicht überschritten werden soll, wird Signifikanzniveau des Tests genannt. Es gilt dann W(Fehler 1. Art) ≤ α . Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 10 5 Größe des Fehlers zweiter Art ¾ W(II)=W(Fehler 2. Art) = W(H0 wird nicht abgelehnt|H0 trifft nicht zu) Die obere Grenze für die Größe des Fehlers zweiter Art wird mit β bezeichnet. Es gilt W(Fehler 2. Art) ≤ β. Die Differenz 1-β wird als Macht oder Power des Tests genannt. 1-β ist die Wahrscheinlichkeit dafür, dass man eine zutreffende Forschungshypothese bzw. Alternativhypothese H1 fehlerfrei annimmt. Es ist natürlich auch erwünscht, einen Test durchzuführen, bei dem diese Wahrscheinlichkeit so groß wie möglich zu erhalten ist. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 11 Fehlermessung - Zusammenfassung Entscheidung Realität H0 trifft zu H1 trifft nicht zu Annahme von H0 Treffen Irrtum W(Fehler 2. Art) ≤ β Ablehnung von H0 Irrtum W(Fehler 1. Art) ≤ α α: Signifikanzniveau Treffen W(H0 wird abgelehnt|H1 trifft zu) ≥ 1- β: Macht W(I) = W(Fehler 1. Art) = W(H0 wird abgelehnt|H0 trifft zu) ≤α W(II)= W(Fehler 2. Art) = W(H0 wird nicht abgelehnt|H0 trifft nicht zu) ≤ β W(fehlerfreie Annahme einer zutreffenden Forschungshypothese H1) = W(H0 wird abgelehnt|H0 trifft nicht zu) = 1- W(H0 wird nicht abgelehnt|H0 trifft nicht zu) = 1 - W(II) ≥ 1 - β Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 12 6 Prüfgröße, kritischer Bereich Test: H0 vs. H1 Um eine statistische Entscheidung über die Richtigkeit einer Hypothese auf Grund einer zufällig gezogenen Stichprobe (X1, X2, . . . , Xn) zu treffen, definiert man eine geeignete Stichprobenfunktion γ̂ n und teilt den Wertebereich dieser Funktion in zwei ausschließende Teile: einen Teilbereich K und seiner Komplement K, so dass, wenn der Wert der Funktion in den Teilbereich K hinfällt, H0 abgelehnt wird. Fällt der Wert der Stichprobenfunktion in den anderen Teilbereich, dann wird H0 nicht abgelehnt (H0 wird angenommen). Die Stichprobenfunktion und die Teilbereiche werden in diesem Zusammenhang Prüfgröße, Ablehnungsbereich (Ablehnung von H0) und Annahmebereich (Annahme von H0) genannt. Der Ablehnungsbereich von H0 wird auch kritischer Bereich genannt. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 13 Entscheidungsregeln γ̂ n ∈ K ⇒ H 0 wird abgelehnt γ̂ n ∉ K ⇔ γ̂ n ∈ K ⇒ H 0 wird nicht abgelehnt Es gilt für die Wahrscheinlichkeit des Irrtums erster Art: W(γ̂ n ∈ K | H 0 trifft in der Realität zu) = W(H 0 wird abgelehnt | H 0 trifft in der Realität zu) = W(Fehler 1. Art) ≤ α Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 14 7 Klassifizierung von statistischen Tests (1) ¾Nach dem Inhalt der Hypothese: -Parametrische Tests (Tests über die Parameter einer bekannten Verteilung) -Verteilungstests (Tests über eine unbekannte Verteilung) ¾Nach der Abhängigkeit der Verteilung der Stichprobenfunktion von der Verteilung der Grundgesamtheit: -Verteilungsgebundene Tests -Verteilungsfreie Tests Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 15 Klassifizierung von statistischen Tests (2) ¾Nach der Anzahl der Stichproben, die für den Hypothesentest notwendig sind: -Einstichprobentest -Zweistichprobentest -Mehrstichprobentest ¾Nach der Form des kritischen Bereiches -Zweiseitige Tests -Einseitige Tests (rechtsseitige Tests bzw. linksseitige Tests) Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 16 8 Bestandteile eines Hypothesentests Ein Hypothesentest besteht aus sieben Elementen: 1. zwei entgegengesetzt formulierten Hypothesen (H0 und H1) 2. einem von vornherein festgelegten Signifikanzniveau α 3. einer bzw. mehreren Stichproben 4. einer Stichprobenfunktion oder Prüfgröße bzw. Testgröße 5. einem Ablehnungsbereich bzw. einem Annahmebereich für H0 6. einer Entscheidungsregel 7. einer Entscheidung Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 17 Einstichprobentests über den Mittelwert In diesem Abschnitt werden folgende Einstichprobentests über den Mittelwert einer Grundgesamtheit behandelt: (1) H0: µ = µ0 vs. H1: µ ≠ µ0 (Zweiseitiger Test) (2) H0: µ ≥ µ0 vs. H1: µ < µ0 (Linksseitiger Test) (3) H0: µ ≤ µ0 vs. H1: µ > µ0 (Rechtsseitiger Test) Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 18 9 Einstichprobentests über die Varianz In diesem Abschnitt werden folgende Einstichprobentests über die Varianz einer Grundgesamtheit behandelt: (1) H0: σ²= σ²0 vs. H1: σ² ≠ σ²0 (zweiseitiger Test) (2) H0: σ² ≥ σ²0 vs. H1: σ²< σ²0 (3) H0: σ² ≤ σ²0 vs. H1: σ² > σ²0 (rechtsseitiger Test) Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik (linksseitiger Test) Testverfahren I 19 Einstichprobentests über den Anteilwert In diesem Abschnitt werden folgende Einstichprobentests über die Varianz einer Grundgesamtheit behandelt: (1) H0: θ = θ0 vs. H1: θ ≠ θ0 (zweiseitiger Test) (2) H0: θ ≥ θ0 vs. H1: θ < θ0 (linksseitiger Test) (3) H0: θ ≤ θ0 vs. H1: θ > θ0 (rechtsseitiger Test) Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 20 10 Zweiseitiger Test für den Mittelwert Sei X eine normalverteilte Zufallsvariable in einer Grundgesamtheit mit dem unbekannten Mittelwert µ und der bekannten Varianz σ², X~ N(µ, σ²). Es wird auf einem Signifikanzniveau α getestet, ob der Parameter µ gleich µ0 ist oder nicht, d. h. es wird zwischen den folgenden Hypothesen entschieden: H0: µ = µ0 vs. H1: µ ≠ µ0 (Zweiseitiger Test) W(H 0 wird abgelehnt | µ = µ 0 ) = W(Fehler 1. Art) = α Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 21 Prüfgröße für den Test über den Mittelwert einer Normalverteilung mit bekannter Varianz Sei (X1, X2, . . . , Xn) eine Stichprobe vom Umfang n. Es gilt für jede Xi ~ N(µ, σ²). Um eine Entscheidung über den Mittelwert µ der Grundgesamtheit zu treffen, scheint es zweckmäßig zu sein, den Stichprobenmittelwert oder eine Transformation von ihm anzuwenden. Prüfgröße: Z= X − µ0 σ n Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 22 11 Kritischer Bereich des zweiseitigen Test für den Mittelwertes einer N(µ, σ²) mit bekannter σ² Der kritische Bereich K für diesen Test ist die Menge aller möglichen Werte der Prüfgröße, für welche gilt: 1. der Abstand von µ0 ist so groß, dass man die Nullhypothese ablehnen soll, 2. die Wahrscheinlichkeit, dass der Fehler bei dieser Entscheidung (Fehler erster Art) nicht größer als α ist. { K = X : X − µ 0 > c und W( X − µ 0 > c | µ = µ 0 ) ≤ α X ~ N(µ ; α/2 α/2 Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik } σ² X− µ )⇒Z= ~ N(0, 1) σ n n Testverfahren I 23 Berechnung des kritischen Bereiches { K = X : X − µ 0 > c und W( X − µ 0 > c | µ = µ 0 ) ≤ α } W( X − µ0 > c | µ = µ0 ) = α ⇔ W( X − µ0 ≤ c | µ = µ0 ) = 1 − α ⇔ W(− c ≤ X − µ 0 ≤ c | µ = µ0 ) = 1 − α ⇔ W( ⇔ W( c c −c ) = 1− α ⇒ ≤Z≤ =Z α 1− σ σ σ 2 n n n K(α) = {X :| X − µ 0 | > Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik c − c X − µ0 | µ = µ0 ) = 1 − α ≤ ≤ σ σ σ n n n σ ⇒c= ⋅Z α n 1− 2 X − µ0 σ ⋅ Z α } = {X : | | > Z α } = {X : | Z | > Z α } 1− 1− σ n 1− 2 2 2 n Testverfahren I 24 12 Entscheidungsregel und Treffen der Entscheidung X ∈ K(α ) ⇒ H 0 wird abgelehnt (H 1 wird angenommen ) W[X ∈ K(α ) | µ = µ 0 ] = α Die Fehlerwahrscheinlichkeit ist α. Diese Aussage ist richtig vor der Ziehung der konkreten Stichprobe. Zieht man eine konkrete Stichprobe, dann ist der berechnete Stichprobenmittelwert keine Zufallsvariable mehr und deswegen hat es keinen Sinn, nach der Ziehung der SP eine Wahrscheinlichkeitsaussage zu machen. Da der Wert von α nahe Null gewählt wird, kann man nur hoffen, dass die Entscheidung richtig ist. X ∉ K(α ) ⇒ H 0 wird nicht abgelehnt (H 0 wird angenommen ) Die Fehlerwahrscheinlichkeit bei dieser Entscheidung ist unbekannt. W[ X ∉ K(α ) | µ ≠ µ 0 ] = W[H 0 wird nicht abgelehnt | H 0 trifft nicht zu] = β Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 25 Zweiseitiger Test für den Mittelwert - Zusammenfassung 1. H0: µ=µ0 vs. H1: µ≠ µ0 3. Stichprobe vom Umfang n: (X1, X2, . . . , Xn) 4. Prüfgröße: Signifikanzniveau: α 5. Kritischer Bereich: X − µ0 Z= σ n 6. 2. K(α) = {X : | Z | > Z 1− α 2 } Entscheidungsregel: X ∈ K( α ) ⇒ H 0 wird abgelehnt X ∉ K(α ) ⇒ H 0 wird nicht abgelehnt (H 0 wird angenommen ) 7. Treffen der Entscheidung aus der konkreten Stichproben Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 26 13 Zusammenhang zwischen den Größen beider Fehler H0: µ=µ0 vs. H1: µ ≠ µ0 (1) µ0 (µ = µ1 ) α: (Signifikanzniveau): Größe des Fehlers erster Art (Vorgegeben) β: Größe des Fehlers zweiter Art (Im Allgemeinen unbekannt) µ1 (3) (2) µ0 µ0 µ1 Beide Fehler wachsen gegenläufig. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik µ1 α 1> α2> α3 ⇒ β1< β2< β3 Testverfahren I 27 Beispiel: Test für den Mittelwert einer Normalverteilung mit bekannter Varianz Das Durchschnittsgewicht von Masthähnchen lag in der Vergangenheit bei 492,5 g mit einer Standardabweichung von 18,9 g. Nach Übergang zu einem neuen Futtermittel liefert eine Stichprobe im Umfang von 81 ein Durchschnittsgewicht von 496,3 g. Kann man aufgrund dieses Stichprobenergebnisses unter der Annahme einer gleichgebliebenen Standardabweichung mit einem Signifikanzniveau von 1 % schließen, dass sich das Durchschnittsgewicht in der Grundgesamtheit verändert hat? H0: µ = µ0 vs. H1: µ ≠ µ0 (µ0 = 492,5 ) α = 0,01 Z H0: µ = 492,5 x = 496,3 n = 81 vs. H1: µ ≠ 492,5 K(α) = {X : | Z | > Z 1− α 2 } Z= X − µ0 σ n z= 1− α 2 = Z 0,995 = 2,58 σ = 18,9 496,3 − 492,5 = 1,81 18,9 81 Entscheidung: Da |1,81|< 2,58 gilt, wird H0 nicht abgelehnt. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 28 14 Einseitige Tests für den Mittelwert Ein einseitiger Test für den Mittelwert einer Normalverteilung mit bekannter Varianz unterscheidet sich von dem zweiseitigen Test nur in seinem entsprechenden kritischen Bereich. Linksseitiger Test Rechtsseitiger Test (2) H0: µ≥ µ0 vs. (3) H0: µ≤ µ0 vs. H1: µ< µ0 Z= Prüfgröße: K(α ) = {X : Z < - Z1−α } X − µ0 σ n H1: µ> µ0 K(α ) = {X : Z > Z1−α } Kritischer α α Bereich: -Z1-α Z1-α Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 29 Tests für den Mittelwert bei unbekannter Varianz Die Tests für den Mittelwert einer Normalverteilung mit unbekannter Varianz unterscheiden sich von den vorigen Tests nur in der Prüfgröße und den entsprechenden kritischen Bereichen. Prüfgröße: T = X − µ0 ~ t n −1 S n Kritischer Bereich: Tests: (1) H0: µ=µ0 vs. H1: µ≠ µ0 K(α) = {X : | T | > t n −1 ; 1− α 2 } (2) H0: µ≥ µ0 vs. H1: µ< µ0 K(α) = {X : T < - t n −1 ; 1−α } (3) H0: µ≤ µ0 vs. H1: µ> µ0 K(α) = {X : T > t n −1 ; 1−α } Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 30 15 Beispiel: Test für den Mittelwert bei unbekannter Varianz Eine Maschine stellt Plättchen her, deren Dicke normalverteilt ist, mit dem Sollwert (Mittelwert) 0,25 cm. Eine Stichprobe von 10 Plättchen liefert ein arithmetisches Mittel von 0,253 cm bei einer Standardabweichung von 0,003 cm. Die Hypothese, dass die Maschine noch exakt arbeitet, ist auf einem Signifikanzniveau von 0,05 zu überprüfen. H0: µ = µ0 vs. H1: µ ≠ µ0 (µ0 = 0,25 ) H0: µ = 0,25 vs. H1: µ ≠ 0,25 T= X− µ0 S t K(α) = {X : | T | > t n −1 ; 1− α 2 } n Entscheidung: Da |3,162| > 2,262 ist, wird H0 abgelehnt. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik α = 0,05 n −1 ; 1− α 2 = t 9 ; 0,975 = 2,262 n = 10 x = 0,253 s = 0,003 t= 0,253 − 0,25 = 3,162 0,003 10 Testverfahren I 31 Tests für den Mittelwert einer unbekannten Verteilung für große Stichproben Für die unbekannte Verteilung in der Grundgesamtheit und großen Stichprobenumfang (n>30) lässt sich die t-Verteilung durch die Standardnormalverteilung approximieren. Dadurch gelten: Prüfgröße: T= X − µ0 ~ t n −1 → Z ~ N(0 ; 1) S n Kritischer Bereich: Test: (1) H0: µ = µ0 vs. H1: µ ≠ µ0 K(α) = {X : | T | > Z (2) H0: µ ≥ µ0 vs. H1: µ < µ0 K(α) = {X : T < - Z1−α } (3) H0: µ ≤ µ0 vs. H1: µ > µ0 K(α) = {X : T > Z1−α } Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 1− α 2 } 32 16 Beispiel 1: Test für den Mittelwert einer unbekannten Verteilung Bei der Überprüfung des Verpackungsautomaten im Düngemittelwerk werden 31 Säcke nachgewogen, für die ein Durchschnittsgewicht 50,1 kg und eine Standardabweichung 250 g berechnet werden. Aufgrund dieses Stichprobenbefundes ist eine Entscheidung über die Arbeit des Automaten (fehlerhaft/ nicht fehlerhaft) zu treffen. Die Entscheidung soll bei 5-%ger Irrtumswahrscheinlichkeit getroffen werden. α=0,05 Über die Verteilung des Gewichtes der Säcke liegt keine Information vor. H0: µ=50 vs. T= X− µ0 S n −1 ; 1− α 2 K(α) = {X : | T | > t α n −1 ; 1− 2 t= } = t 30 ; 0,975 = 2,042 x = 50,1 s = 0,250 n = 31 H1: µ ≠ 50 n t 50,1 − 50 = 2,227 0,250 31 Entscheidung: Da |2,227| > 2,042 ist, wird H0 abgelehnt, d. h. man kann annehmen, dass der Automat fehlerhaft arbeitet. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 33 Beispiel 2: Test für den Mittelwert einer unbekannten Verteilung 2003 beträgt das Durchschnittsalter der Zuzüge aus anderen Kreisen MV nach Rostock 30 Jahre. Im Jahr 2004 liegt, bei einer Stichprobe von 100 Personen, das Durchschnittsalter der Zuzüge bei 29,2 Jahre mit einer Standardabweichung von 14,65 Jahren. Hat sich der Wert im Jahr 2004 signifikant verringert, bei einem Signifikanzniveau von 0,05? Quelle: Statistische Berichte 2003. Über die Verteilung des Alters liegt keine Information vor. n = 100 H0: µ≥30 vs. H1: µ < 30 K(α ) = {X : T < − t n −1 ; 1−α } t n −1 ; 1−α = t 99 ; 0,95 = 1,66 α=0,05 T= X− µ0 S n x = 29,2 t= s = 14,65 29,2 − 30 = −0,55 14,65 100 Entscheidung: Da -0,55>-1,66 ist, wird H0 nicht abgelehnt, d. h. die Verringerung des durchschnittlichen Wanderungsalters (Zuzüge) ist nicht signifikant. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 34 17 Beispiel 3: Test für den Mittelwert einer unbekannten Verteilung Das durchschnittliche Nettoeinkommen liegt im März 2004 bei 1.603 €. Bei einer Stichprobe von 200 Personen im Juni 2004 lag das durchschnittliche Nettoeinkommen bei 1.715 € mit einer Standardabweichung von 1.227 €. Hat sich das durchschnittliche monatliche Nettoeinkommen bei einem Signifikanzniveau von 0,05 statistisch signifikant erhöht? Quelle: Mikrozensus 2004, Tabelle 36. α=0,05 Über die Verteilung des NE liegt keine Information vor. n = 100 H0: µ ≤ 1.603 vs. H1: µ > 1.603 K(α) = {X : T > t n −1 ; 1−α } T= X− µ0 S t n −1 ; 1−α = t199 ; 0,95 = 1,645 s = 1.227 x = 1.715 t= 1.715 − 1.603 = 1,291 1.227 n 200 Entscheidung: Da 1,291<1,645 ist, wird H0 nicht abgelehnt, d. h. das durchschnittliche Nettoeinkommen im Juni 2004 ist nicht signifikant höher als im März 2004. Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 35 Einstichprobentest für die Varianz (1) H0: σ²= σ²0 vs. H1: σ² ≠ σ²0 (Zweiseitiger Test) (2) H0: σ² ≥ σ²0 vs. H1: σ2 < σ²0 (Linksseitiger Test) (3) H0: σ² ≤ σ²0 vs. H1: σ² > σ²0 (Rechtsseitiger Test) Modifizierte Stichprobenvarianz als Stichprobenfunktion: S2 = 1 n ∑ (X i − X) 2 n − 1 i =1 Theoretische Verteilung der modifizierten Stichprobenvarianz bei Normalverteilung der Grundgesamtheit und einfacher Zufallsstichprobe: Prüfgröße: χ2 = Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik χ2 = (n- 1) S ² ~ χ 2n −1 2 σ0 (n- 1) S ² σ 02 Testverfahren I 36 18 Kritische Bereiche für die Tests über die Varianz α: Signifikanzniveau α α (1) 2 + 2 =α K(α) = {S ² : H0: σ² = σ²0 H1: σ² ≠ σ²0 χ2 n −1; χ2 α oder n−1; 1− 2 α 2 S ²(n − 1) < χ2 α n −1; σ 02 2 S ²(n − 1) > χ2 α } n −1;1− σ 02 2 (2) α H0: σ² ≥ σ²0 H1: σ² < σ²0 K(α ) = {S ² : S ²(n − 1) < χ 2n −1;α } σ 02 K(α ) = {S ² : S ²(n − 1) > χ 2n −1;1−α } σ 02 χ n2−1; α (3) α H0: σ² ≤ σ²0 H1: σ² > σ²0 Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik χ n2−1; 1−α Testverfahren I 37 Beispiel: Einstichprobentest für die Varianz In der Vergangenheit betrug die Varianz der normalverteilten Lebensdauer einer bestimmten Batteriesorte 1,1 Jahre². Es soll nun auf Stichprobenbasis mit einem Signifikanzniveau von 0,01 geprüft werden, ob sich durch Einführung eines kostengünstigeren Produktionsverfahrens die Varianz der Lebensdauer erhöht. Eine Stichprobe von 25 nach dem neuen Verfahren gefertigten Batterien liefert eine Varianz von 1,6 Jahre². H0: σ² ≤ 1,1 vs. H1: σ² > 1,1 χ Kritischer Bereich: K(α ) = {S ² : α = 0,01 α = 0,01 2 n −1; 1− α =χ 2 24; 0,99 S ²(n − 1) > χ n2 −1;1−α } σ 02 Prüfgröße: = 42,980 χ2 = χ2 = (n- 1) S ² ~ χ 2n −1 σ 02 (n- 1) s ² 24 ⋅ 1,6 = = 34,91 1,1 σ 02 Entscheidung: 34,91<42,980 ⇒H0 kann nicht abgelehnt werden, d. h. aus dem Stichprobenergebnis kann nicht auf eine signifikante Erhöhung der Varianz der Grundgesamtheit geschlossen werden. 42,98 χ2 Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 38 19 Einstichprobentest für den Anteilswert (1) H0: θ= θ0 vs. H1: θ ≠ θ0 (Zweiseitiger Test) (2) H0: θ ≥ θ0 vs. H1: θ < θ0 (Linksseitiger Test) (3) H0: θ ≤ θ0 vs. H1: θ > θ0 (Rechtsseitiger Test) Xi: Bernoulliverteilt mit dem Parameter θ0 P: Stichprobenanteilswert i n ⇒ n⋅ P = ∑ X i n i =1 Prüfgröße: P= i =1 Z= P− θ 0 n·P: Binomialverteilt mit den Parameter n und θ0 Für nθ0(1-θ0) ≥ 9 gilt: P− θ 0 Z= θ 0 (1 − θ 0 ) n f (0) = W(Xi = 0) =1−θ f (1) = W(Xi = 1) = θ n ∑X Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik θ 0 (1 − θ 0 ) n ~ N(0,1) Testverfahren I 39 Kritische Bereiche für die Tests über den Anteilswert Signifikanzniveau α α (1) 2 + α 2 Für nθ0(1-θ0) ≥ 9 =α K(α) = {P : | H0: θ = θ0 H1: θ ≠ θ0 (2) α K(α) = {P : H0: θ ≥ θ0 H1: θ < θ0 -Z1-α α (3) K(α) = {P : H0: θ≤ θ0 H1: θ> θ0 Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Z1-α Testverfahren I P− θ 0 θ 0 (1 − θ 0 ) n P− θ 0 θ 0 (1 − θ 0 ) n P− θ 0 θ 0 (1 − θ 0 ) n | >Z 1− α 2 } < - Z1−α } > Z1−α } 40 20 Beispiel: Einstichprobentest für den Anteilswert Der Fabrikant eines bestimmten Artikels behauptet gegenüber einem Abnehmer, dass der Ausschussanteil in einer von ihm angebotenen Lieferung genau 0,10 bzw. 10 % beträgt. In einer zur Qualitätsüberprüfung gezogenen Stichprobe ohne Zurücklegen im Umfang von 100 werden 13 Ausschussartikel gefunden. Ist damit die Behauptung des Fabrikanten bei einem Signifikanzniveau von 0,05 widerlegt? H0: θ= 0,10 vs. H1: θ≠ 0,10 Prüfgröße: Kritischer Bereich: Z= K(α) = {P : | Z | > Z 1− α 2 + α 2 α} 2 =α α=0,05 Z 1− α 2 = Z 0,975 Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik P− θ 0 Es gilt nθ0(1−θ0) =9. 0,13 − 0,10 0,03 0,03 θ 0 (1 − θ 0 ) z = 0,10 ⋅ 0,90 = 0,0009 = 0,03 = 1 n 100 Entscheidung: 1<1,96 ⇔ 1 ∉ K(a) ⇒H0 kann nicht abgelehnt werden, d. h. aus dem = 1,96 SP-Ergebnis kann die Behauptung des Fabrikanten nicht widerlegt werden. Testverfahren I 41 Hypothesentests und ihre Bestandteile - Zusammenfassung Zusammen mit dem Schätzen bildet das Testen von Hypothesen den Kernbereich der schließenden oder induktiven Statistik. Ein Hypothesentest besteht aus sieben Elementen: 1. zwei entgegengesetzt formulierten Hypothesen (H0 und H1) 2. einem von vornherein festgelegten Signifikanzniveau α 3. einer bzw. mehreren Stichproben 4. einer Stichprobenfunktion (Prüfgröße bzw. Testgröße) 5. einem Ablehnungsbereich bzw. einem Annahmebereich für H0 6. einer Entscheidungsregel 7. einer Entscheidung Dr. Ricabal Delgado / Prof. Kück Lehrstuhl Statistik Testverfahren I 42 21