Modul 141 Statistik 1. Studienjahr 11. Sitzung Signifikanztests Inhalt der 11. Sitzung … 1. Parametrische Signifikanztests 2. Formulierung der Hypothesen 3. Einseitige oder zweiseitige Fragestellung 4. Signifikanzniveau 5. Auswahl der Testfunktion 6. Berechnung des Testwertes 7. Entscheidung 8. Der t-Test 1 Einführung – sind die Österreicher Zwerge? … Österreicher stammen von Zwergen ab! In einer Boulevardzeitung wird behauptet, dass es in Österreich früher viele Zwerge gab, die inzwischen in der Bevölkerung aufgegangen sind. Als Indiz hierfür wird die Tatsache herangezogen, dass die Österreicher im Mittel kleiner seien als die Deutschen. Die Größe der deutschen Bevölkerung ist normalverteilt mit einem Mittelwert von 175 cm und einer Standardabweichung von 8.34 cm ist. Die Zeitung ermittelte die Durchschnittsgröße in Österreich anhand einer Stichprobe von 25 Personen und kam zum Schluss, dass die Größe der österreichischen Bevölkerung ebenfalls normalverteilt ist und einen Mittelwert von 173 cm bei einer Standardabweichung von 8.2 cm aufweist. Einführung – sind die Österreicher Zwerge? … Sind die Österreicher nun tatsächlich kleiner als die Deutschen? Oder ist der Unterschied eher Zufall weil die Stichprobe vielleicht nicht wirklich repräsentativ war? Österreich NV(174;8.2) Deutschland NV(175;8.34) 14 4 14 7 15 0 15 3 15 6 15 9 16 2 16 5 16 8 17 1 17 4 17 7 18 0 18 3 18 6 18 9 19 2 19 5 19 8 Zur Beantwortung bietet die Statistik die SIGNIFIKANZTESTS 2 Signifikanztests… In den vorangegangenen Sitzungen wurde davon ausgegangen, dass einzelne empirische Verteilungen durch entsprechende theoretische Verteilungen wiedergegeben werden können. Auf dieser Grundlage wurden Wahrscheinlichkeiten berechnet. Die Frage ob die empirischen Verteilungen tatsächlich den theoretischen entsprechen oder die aus der Stichprobe berechneten Parameter die der Grundgesamtheit wiedergeben, blieb dabei unbeantwortet. Signifikanztests… Zur Klärung dieser Frage stellt die schließende Statistik die Signifikanztests zur Verfügung mit denen geprüft werden kann ob: • Ein einzelner Parameter (z.B. der Mittelwert oder die Varianz) einer Stichprobe gleich, ungleich, größer oder kleiner dem Mittelwert oder der Varianz der Grundgesamtheit ist (Parametertests Parametertests) • Ein bestimmter Anteil einer Stichprobe gleich, ungleich, größer oder kleiner dem Anteil an der Grundgesamtheit ist (Anteilstest Anteilstest) • Ob der Unterschied zwischen zwei Parametern zweier Stichproben zufällig ist oder nicht (Differenzentest Differenzentest) • Die empirische Verteilung durch eine theoretische Verteilung erklärt werden kann (Anpassungstests Anpassungstests) 3 Signifikanztests… Zur Beantwortung entsprechender Fragestellungen werden in der Statistik Signifikanztests durchgeführt die nach folgendem Schema aufgebaut sind: 1. Spezifikation einer Null- und einer Alternativhypothese 2. Festlegung eines Signifikanzniveaus 3. Auswahl einer geeigneten Testfunktion 4. Berechnung des Testwertes 5. Entscheidung Signifikanztests… 1. Spezifikation einer Null- und einer Alternativhypothese 2. Festlegung eines Signifikanzniveaus 3. Auswahl einer geeigneten Testfunktion 4. Berechnung des Testwertes und Entscheidung Für jeden dieser vier Schritte existieren klare Vorgaben, die von der Fragestellung, die jeweils untersucht wird, abhängen. Unterschieden werden generell: • Parametrische Tests – die sich mit der Untersuchung von einzelnen Parametern (µ, σ, σ² ...) befassen, und • Nichtparametrische Tests – die sich mit Aussagen über die Verteilung (z.B. Normalverteilung) befassen 4 Signifikanztests… Beispiel für einen parametrischen Test: Test Von der Abfüllanlage einer Brauerei werden Flaschen gefüllt, wobei die Füllmenge X pro Flasche gewissen Schwankungen unterliegt. In den Herstellerangaben der Abfüllanlage wurde angegeben, dass die durchschnittliche Füllmenge µ0 = 500 cm³, mit einer Standardabweichung von σ = 1.5, betrage. Anhand einer Stichprobe vom Umfang n = 45 wurde die durchschnittliche Füllmenge von 499.46 cm³ (= µ1) empirisch ermittelt. Anhand diese beiden Werte können nun unterschiedliche Fragestellungen untersucht werden, abhängig von der Interessenlage der Personen, die die Untersuchung durchführen. a.) eine Eichkommission ist an der generellen Abweichung vom Sollwert interessiert. b.) ein Verbraucherschutzverband ist daran interessiert ob der Istwert deutlich kleiner als der Sollwert ist. c.) der Brauereibesitzer ist daran interessiert ob im Mittel zuviel abgefüllt wird. Inhalt der 11. Sitzung … 1. Parametrische Signifikanztests 2. Formulierung der Hypothesen 3. Einseitige oder zweiseitige Fragestellung 4. Signifikanzniveau 5. Auswahl der Testfunktion 6. Berechnung des Testwertes 7. Entscheidung 8. Der t-Test 5 Formulierung der Hypothesen … Beim Aufbau eines Signifikanztests werden immer zwei Hypothesen formuliert: Die Nullhypothese die mit H0 bezeichnet wird und immer die Gleichheit beschreibt. Für das Beispiel wäre H0: „Ist der Mittelwert der Stichprobe gleich dem Mittelwert, den der Hersteller angegeben hat?“ Also: H0: µ0 = µ1 Eine Alternativhypothese, Alternativhypothese die mit HA oder H1 bezeichnet wird und sich als Gegenhypothese aus der Fragestellung und H0 ergibt. Für das Beispiel können folgende HA formuliert werden: a.) HA: µ0 ≠ µ1 b.) HA: µ1 < µ0 c.) HA: µ1 > µ0 Formulierung der Hypothesen … Bei der Bestimmung des Mittelwertes µ1 aus einer Stichprobe ist zu erwarten, dass nicht genau der tatsächliche Wert der Grundgesamtheit getroffen wird. Ist die Stichprobe repräsentativ kann aber davon ausgegangen werden das µ1 nicht allzu sehr vom tatsächlichen Wert µ0 abweicht. Für die formulierten Hypothesen bedeutet dies: H0 (µ1 = µ0) wird abgelehnt und damit die Alternativhypothese angenommen, wenn je nach Fragestellung gilt: a.) HA: µ0 ≠µ1, wenn |µ1 - µ0| sehr groß ist b.) HA: µ1 < µ0, wenn µ1 sehr viel kleiner als µ0 ist c.) HA: µ1 > µ0, wenn µ1 sehr viel größer als µ0 ist. Zur Präzisierung der Entscheidungen ob die Abweichungen sehr groß oder sehr viel größer bzw. kleiner sind wird das Signifikanzniveau festgelegt. 6 Inhalt der 11. Sitzung … 1. Parametrische Signifikanztests 2. Formulierung der Hypothesen 3. Signifikanzniveau 4. Einseitige oder zweiseitige Fragestellung 5. Auswahl der Testfunktion 6. Berechnung des Testwertes 7. Entscheidung 8. Der t-Test Signifikanzniveau … Das Signifikanzniveau bezeichnet die akzeptierte Irrtumswahrscheinlichkeit mit der die Nullhypothese abgelehnt wird obwohl sie richtig ist. Die Festlegung eines geeigneten Signifikanzniveaus ist problemorientiert, entsprechend der Fragestellung vorzunehmen. Alternativ kann das Signifikanzniveau auch als Risiko betrachtet werden, wenn es beispielsweise darum geht die Wahrscheinlichkeit für Schäden zu beziffern. In der Wasserwirtschaft werden Deiche oft so konstruiert, dass das Risiko eines Überflutens zu 95% ausgeschlossen ist. Für die Sicherheit von Kernkraftwerken ist ein niedrigeres Risiko wünschenswert, so dass Unfälle mit nahezu 100%iger Sicherheit ausgeschlossen werden können. 7 Signifikanzniveau … Für das Beispiel sei ein Signifikanzniveau α = 0.01 vorgegeben. Das bedeutet, dass die Wahrscheinlichkeit für die Entscheidung die Nullhypothese abzulehnen obwohl sie richtig ist bei 1% liegt. Auf der anderen Seite liegt aber auch die Wahrscheinlichkeit für die Annahme der Nullhypothese obwohl sie falsch ist bei 99%. Sehr oft muss α nicht frei bestimmt werden sondern ist durch die Vorgaben der Interessensgruppe oder durch die Aufgabenstellung a priori festgelegt. Denkbar wäre beispielsweise, dass die Eichkommission höhere Anforderungen an die Güte des Testes stellt als die Verbraucherschutzorganisationen. Inhalt der 11. Sitzung … 1. Parametrische Signifikanztests 2. Formulierung der Hypothesen 3. Signifikanzniveau 4. Einseitige oder zweiseitige Fragestellung 5. Auswahl der Testfunktion 6. Berechnung des Testwertes 7. Entscheidung 8. Der t-Test 8 Zweiseitige Fragestellung … H0: µ1 = µ0 Zustimmungsbereich (H0) Testwert liegt in einem HA: µ1 ≠ µ0 1- α breiten Intervall der Testverteilung α = 0.1 Breite α/2 Breite α/2 Breite = 1 - α F ( z) = α 2 F ( z) = 1 − α 2 Ablehnungsbereich (HA) – Testwert liegt rechts oder links ausserhalb des 1- α breiten Zustimmungsbereichs der Testverteilung Einseitige Fragestellung … H0: µ1 = µ0 Zustimmungsbereich (H0) Testwert liegt im linken, 1-α breiten Bereich der Testverteilung HA: µ1 > µ0 α = 0.1 Breite α Breite = 1 - α F (z ) = 1 − α Ablehnungsbereich (HA) – Testwert liegt rechts ausserhalb des 1-α breiten Zustimmungsbereichs der Testverteilung 9 Einseitige Fragestellung … Zustimmungsbereich (H0) Testwert liegt im rechten, 1-α breiten Bereich der Testverteilung Breite = α H0: µ1 = µ0 HA: µ1 < µ0 α = 0.1 Breite = 1 - α F (z ) = α Ablehnungsbereich (HA) – Testwert liegt links ausserhalb des 1-α breiten Zustimmungsbereichs der Testverteilung Inhalt der 11. Sitzung … 1. Parametrische Signifikanztests 2. Formulierung der Hypothesen 3. Einseitige oder zweiseitige Fragestellung 4. Signifikanzniveau 5. Auswahl der Testfunktion 6. Berechnung des Testwertes 7. Entscheidung 8. Der t-Test 10 Auswahl der Testfunktion … Die Auswahl einer geeigneten Testfunktion ist von verschiedenen Kriterien abhängig: 1. Von der Art des Tests: parametrisch oder nichtparametrisch 2. Vom Parameter, der durch die Nullhypothese untersucht werden soll; µ, σ, σ² 3. Von der Verteilung der Grundgesamtheit aus der die Stichprobe ermittelt wurde. 4. Von der Größe der Stichprobe Die Testfunktion beschreibt nicht die Verteilung der Grundgesamtheit sondern die Verteilung der Testgröß e Testgröße (im Falle des Beispieles des Mittelwerts). Auswahl der Testfunktion … Beim Beispiel handelte es sich um: 1. Einen parametrischen Test (Mittelwert wird untersucht) 2. Der Stichprobenumfang betrug 45 3. Die Grundgesamtheit war normalverteilt mit µ = 500 und σ = 1.5 Aus diesen Kriterien folgt, dass die Testgröße normalverteilt ist. D.h. würden sehr viele Stichproben aus der Grundgesamtheit gezogen und die Verteilung der Mittelwerte betrachtet, wäre diese normalverteilt. Die Testfunktion ist dann die SNV. 0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 -5 -4 -3 -2 -1 0 1 2 3 4 5 11 Inhalt der 11. Sitzung … 1. Parametrische Signifikanztests 2. Formulierung der Hypothesen 3. Einseitige oder zweiseitige Fragestellung 4. Signifikanzniveau 5. Auswahl der Testfunktion 6. Berechnung des Testwertes 7. Entscheidung 8. Der t-Test Berechnung des Testwertes … Bei einem normalverteilten Testparameter und einem Stichprobenumfang von n ≥ 30 wird ein Gauß Gaußtest durchgeführt der auf der Standardnormalverteilung basiert. Die Testgröße v ist standardnormalverteilt und berechnet sich dabei nach: X − µ0 v= n σ Die Testgröße wird nun gegen die Werte der Standardnormalverteilung an den Signifikanzstellen verglichen um zu einer Entscheidung zu gelangen. 0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 -5 -4 -3 -2 -1 0 1 2 3 4 5 12 Berechnung des Testwertes … Bei einem Signifikanzniveau von α = 0.01 bedeutet dies: Die Nullhypothese: H0: µ0 = µ1 wird verworfen wenn: a.) HA: µ1 ≠ µ0 Æ v außerhalb eines zentralen 99% Intervalls liegt 0.45 b.) HA: µ1 < µ0 0.40 v kleiner als der 1% Wert ist. 0.35 0.30 0.25 c.) HA: µ1 > µ0 v größer als der 99% Wert ist. 0.20 0.15 0.10 0.05 0.00 -5 -4 -3 -2 -1 0 1 2 3 4 5 Berechnung des Testwertes … Es müssen also folgende Sachverhalte für die drei unterschiedlichen Fragestellungen bestimmt werden: H0: µ1 = µ0 ist zu verwerfen a.) gegen HA: µ1 ≠ µ0 falls v < -X1-α/2 oder v > X1-α/2 b.) gegen HA: µ1 < µ0 falls v < -X1-α c.) gegen HA: µ1 > µ0 falls v > X1-α Beispiel: Als Stichprobenmittel der n=45 Flaschen wurde eine Füllmenge von 499.46 cm³ ermittelt. Damit berechnet sich v nach: v= X − µ0 σ n= 499.46 − 500 45 = −2.41 1.5 13 Berechnung des Testwertes … v= X − µ0 σ n= 499.46 − 500 45 = −2.41 1.5 Die Werte der Standardnormalverteilung für: Z(α/2), Z(1-α/2), Z(α) und Z(1-α) werden wie in der letzten Sitzung dargestellt aus Tabellen ermittelt. Es ergibt sich: Für a.) Z(α/2) Z(1-α/2) = Z(0.005) = -2.575 und = Z(0.995) = 2.575 Für b.) Z(α) = Z(0.01) = -2.327 Für c.) Z(1-α) = Z(0.99) = 2.327 Inhalt der 11. Sitzung … 1. Parametrische Signifikanztests 2. Formulierung der Hypothesen 3. Einseitige oder zweiseitige Fragestellung 4. Signifikanzniveau 5. Auswahl der Testfunktion 6. Berechnung des Testwertes 7. Entscheidung 8. Der t-Test 14 Entscheidung … Mit den berechneten Parametern lassen sich nun die Hypothesen prüfen: H0: µ1 = µ0 ist zu verwerfen a.) gegen HA: µ1 ≠ µ0 falls -2.41 < -2.575 oder -2.41 > 2.575 b.) gegen HA: µ1 < µ0 falls -2.41 < -2.372 c.) gegen HA: µ1 > µ0 falls -2.41 > 2.372 Die Ergebnisse lassen sich folgendermaßen interpretieren: a.) Die Eichkommission kommt zum Schluss, dass die mittlere Füllmenge der Stichprobe dem Sollwert entspricht. b.) Die Verbraucherschutzkommission kommt zum Schluss, dass die mittlere Füllmenge nicht dem Sollwert entspricht. c.) Der Brauereibesitzer kommt zum Schluss, die mittlere Füllmenge entspricht dem Sollwert. Entscheidung … gegen HA: µ1 ≠ µ0 falls -2.41 < -2.575 oder 2.41 > 2.575 0.45 0.40 0.35 AblehnungsAblehnungsbereich µ0 ≠ µ1 0.30 0.25 0.20 Zustimmungsbereich µ0 = µ1 Die Eichkommission kommt zum Schluss, dass die mittlere Füllmenge dem Sollwert entspricht. AblehnungsAblehnungsbereich µ0 ≠ µ1 0.15 0.10 0.05 0.00 -5 -4 -3 -2 -1 0 1 2 3 4 5 15 Entscheidung … gegen HA: µ1 < µ0 falls -2.41 < -2.372 0.45 AblehnungsAblehnungsbereich µ0 < µ1 0.40 0.35 Zustimmungsbereich µ0 = µ1 Die Verbraucherschutzkommission kommt zum Schluss, dass die mittlere Füllmenge nicht dem Sollwert entspricht. 0.30 0.25 0.20 0.15 0.10 0.05 0.00 -5 -4 -3 -2 -1 0 1 2 3 4 5 Entscheidung … gegen HA: µ1 > µ0 falls -2.41 > 2.372 0.45 Zustimmungsbereich µ0 = µ1 0.40 AblehnungsAblehnungsbereich µ0 > µ1 Der Brauereibesitzer kommt zum Schluss, dass die mittlere Füllmenge dem Sollwert entspricht. 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 -5 -4 -3 -2 -1 0 1 2 3 4 5 16 Inhalt der 11. Sitzung … 1. Parametrische Signifikanztests 2. Formulierung der Hypothesen 3. Einseitige oder zweiseitige Fragestellung 4. Signifikanzniveau 5. Auswahl der Testfunktion 6. Berechnung des Testwertes 7. Entscheidung 8. Der tt-Test Der t-Test … Der t-Test kommt zur Anwendung, wenn ein Mittelwerttest mit einer Stichprobe (mit n ≤ 30) aus einer Grundgesamtheit, bei der σ oder σ² nicht bekannt ist, durchgeführt werden soll. Der Testfunktionswert v ergibt sich dabei nach: v= x − µ0 n s Anstelle der unbekannten Standardabweichung σ der Grundgesamtheit wird hier die Standardabweichung der Stichprobe s benutzt. Sie berechnet sich nach: 1 n 2 s= ( xi − x ) ∑ n − 1 i =1 17 Der t-Test … Die t-Verteilung ist der Standardnormalverteilung sehr ähnlich. Ihre Funktionswerte sind von der Anzahl der Freiheitsgrade abhängig. Mit zunehmenden FG nähert sie sich immer mehr der SNV an. Die FG berechnen sich aus dem Stichprobenumfang n nach: 0.400 FG = n − 1 0.150 FG = 3 FG = 7 FG = 25 0.350 0.300 0.250 0.200 0.100 0.050 0.000 -4 -3 -2 -1 0 1 2 3 4 Der t-Test … Beispiel für die Anwendung des t-Tests: Zehn Hohlkarabiner einer bestimmten Marke wurden der Produktion entnommen und dem Zerreißversuch unterzogen, d.h. die Belastung des Karabiners wurde solange erhöht, bis er brach. Der Bruch geschah bei folgenden Werten xi: 2100, 2130, 2150, 2170, 2210, 2070, 2230, 2150, 2230, 2200 [kp] Aus versicherungstechnischen Gründen soll nun überprüft werden, ob der vom Hersteller angegebene Sollwert von 2200 kp mit 99%iger Sicherheit gewährleistet ist. Hypothesen: H0: µ1 = µ0 HA: µ1 < µ0 Signifikanzniveau: α = 0.01 18 Der t-Test … Beispiel für die Anwendung des t-Tests: xi: 2100, 2130, 2150, 2170, 2210, 2070, 2230, 2150, 2230, 2200 [kp] Hypothesen: Signifikanzniveau: Freiheitsgrad: H0: µ1 = µ0 α = 0.01 FG = n – 1 = 9 HA: µ1 < µ0 µ1 = 1 n ∑ X i = 2164 n i =1 v= 1 n 2 ( xi − x ) = 2960 = 54.4 ∑ n − 1 i =1 s= 2164 − 2200 X − µ0 n= 10 = −2.325 s 54.4 Der Wert der t-Verteilung für FG=9 und α = 0.01 wird der Tabelle entnommen und beträgt: -2.8214 Der t-Test … Beispiel für die Anwendung des t-Tests: Hypothesen: Signifikanzniveau: Freiheitsgrad: H0: µ1 = µ0 α = 0.01 FG = n – 1 = 9 HA: µ1 < µ0 t(0.01) = -2.821 Entscheidung: HA wird verworfen, da 0.350 0.300 v nicht kleiner als t 0.250 H0 wird deswegen angenommen. Der Hersteller geht also davon aus, dass seine Karabiner dem Sollwert entsprechen. v = -2.325 0.200 0.150 0.100 0.050 0.000 -4 -3 -2 -1 0 1 2 3 4 19 Parametrische Signifikanztests … Eine einfache Stichprobe H0: µ1 = µ0 G beliebig verteilt, n hinreichend groß H0: σ²1 = σ²0 G ist N(µ,σ) verteilt σ bekannt Approximativer Gaußtest Gaußtest G ist N(µ,σ) verteilt σ unbekannt oder n < 30 t-Test χ²-Test für die Varianz Einführung – sind die Österreicher Zwerge? … Österreicher stammen von Zwergen ab! In einer Boulevardzeitung wird behauptet, dass es in Österreich früher viele Zwerge gab, die inzwischen in der Bevölkerung aufgegangen sind. Als Indiz hierfür wird die Tatsache herangezogen, dass die Österreicher im Mittel kleiner seien als die Deutschen. Die Größe der deutschen Bevölkerung ist normalverteilt mit einem Mittelwert von 175 cm und einer Standardabweichung von 8.34 cm ist. Die Zeitung ermittelte die Durchschnittsgröße in Österreich anhand einer Stichprobe von 25 Personen und kam zum Schluss, dass die Größe der österreichischen Bevölkerung ebenfalls normalverteilt ist und einen Mittelwert von 173 cm bei einer Standardabweichung von 8.2 cm aufweist. 20 Einführung – sind die Österreicher Zwerge? … Sind die Österreicher nun tatsächlich kleiner als die Deutschen? Oder ist der Unterschied eher Zufall weil die Stichprobe vielleicht nicht wirklich repräsentativ war? Österreich NV(174;8.2) Deutschland NV(175;8.34) 14 4 14 7 15 0 15 3 15 6 15 9 16 2 16 5 16 8 17 1 17 4 17 7 18 0 18 3 18 6 18 9 19 2 19 5 19 8 Zur Beantwortung bietet die Statistik die SIGNIFIKANZTESTS Einführung – sind die Österreicher Zwerge?… gegeben: normalverteilte Grundgesamtheit mit: µ0 = 175; σ0 = 8.34 normalverteilte Stichprobe mit: n = 25; µ1 = 173; σ1 = 8.2 1. Formulierung der Hypothesen 2. Signifikanzniveau z.B. α = 0.1 3. Einseitige oder zweiseitige Fragestellung 4. Auswahl der Testfunktion 5. Berechnung des Testwertes 6. Entscheidung 21