(c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall Gauß-Test für den Zweistichprobenfall Zweiseitiger Gauß-Test Allgemeine Formulierung der Hypothesen Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit bekannten Varianzen durch Vergleich der Mittelwerte zweier unabhängiger Zufallsstichproben. Beispiel Es wurden im Labor zwei Stichproben an den Merkmalen gezogen. Dabei entstammt und und zufällig einer Normalverteilung mit bekannter Varianz einer Normalverteilung mit der Varianz Beide Stichproben haben den Umfang n=10. Wir wollen nun wissen, ob die Grundgesamtheiten, aus denen die Stichproben stammen, sich in ihrer Lage zueinander unterscheiden. Folgendes können wir dabei voraussetzen: - Die beiden Stichproben wurden unabhängig voneinander gezogen. - Beide Stichproben stammen aus einer Normalverteilung. - Die Varianzen sind bekannt. Zweiseitiger Gauß-Test Der Wilcoxon-Rangsummen-Test ist anwendbar für bestimmte Situationen. So haben wir gesehen, dass der Test schon für ordinal skalierte Daten durchführbar ist, keine bestimmte Verteilungsart, sondern lediglich Symmetrie der Verteilung voraussetzt und dass er zumindest für kleine Stichprobenumfänge praktikabel ist und dann ein exaktes Ergebnis liefert. (Für große Stichproben wird aus praktischen Gründen das Ergebnis Page 1 (c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall über die Normalverteilung approximiert, wie im Exkurs im erklärt wird.) Wenn wir aber Daten vorliegen haben, die intervallskaliert sind und aus Normalverteilungen stammen, gibt es effizientere Tests, um einen Lageunterschied zwischen zwei Grundgesamtheiten festzustellen. Annahmen Annahmen Grundgesamtheit 1 unabhängig und identisch 1) normalverteilt mit Grundgesamtheit 2 unabhängig und identisch 2) normalverteilt mit Die Stichproben 3) und sind voneinander unabhängig und untereinander ebenfalls 4) , bekannt Prüfung der Annahmen Allgemein gilt, dass vor der Durchführung eines Tests zuerst überprüft werden muss, ob die Daten den jeweiligen Annahmen genügen. Ist das nicht der Fall, ist der Test ungeeignet, und es muss ein anderer, passender Test gesucht werden. Ansonsten ist nicht mehr gesichert, dass das Signifikanzniveau tatsächlich eingehalten wird. (Siehe dazu das .) Vor der Durchführung des Gauß-Tests sollte man überprüfen, ob die Daten der Annahmen der Unabhängigkeit und Normalverteilung genügen. Eine Hilfestellung zur Überprüfung finden Sie unter Annahmenüberprüfung für den Gauß-Test ( : aa6.pdf ) oder im . Hypothesen Beim Testen besteht der erste Schritt in der Formulierung der Hypothesen. Wie beim erläutert, wird unter der Nullhypothese angenommen, dass die zugrunde liegenden Page 2 (c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall Verteilungen der Stichproben unterscheiden. Sind und und sich bzgl. ihres Lokalisationsparameters nicht normalverteilt, wird die Lage ihrer Verteilung durch die Erwartungswerte und beschrieben. Will man auf eine unterschiedliche Lage der Verteilungen testen, können die Hypothesen folgendermaßen formuliert werden: Nullhypothese Alternativhypothese Test A gegen Test B gegen Test C gegen Herleitung der Prüfgröße Die Lage der Verteilungen zueinander ist durch die Differenz ihrer Erwartungswerte gekennzeichnet. Das verdeutlicht die Abbildung: Der Lageunterschied der Normalverteilungen N (0,1) und N (2,1) kann durch die Differenz ihrer Erwartungswerte beschrieben werden. Eine Herangehensweise an die Problemlösung ist, die Differenz näher zu betrachten. Bei wahrer Nullhypothese sollte die Differenz 0 sein oder, empirisch Page 3 (c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall gesehen, zumindest nahe um die 0 herumliegen. Sollte die Differenz wesentlich von 0 verschieden sein, ist dies ein Anzeichen dafür, dass die Verteilungen sich eher unterscheiden. Will man das statistische Testproblem über die Differenz der Erwartungswerte lösen, muss man die Verteilung der Differenz der Mittelwerte unter gültiger Nullhypothese kennen. Im weiteren Vorgehen werden wir daher die Differenz auf eine Form zu bringen, deren Verteilung bekannt ist. Die unbekannten Erwartungswerte können mit den erwartungstreuen Stichprobenmitteln und geschätzt werden, d.h. es gilt und Auch für die Differenz liefert die Differenz der Stichprobenmittel und eine erwartungstreue Schätzung, denn Unter der Nullhypothese ergibt sich: Normalverteilungen werden jedoch nicht alleine durch ihren Erwartungswert charakterisiert, sondern zusätzlich durch ihre Varianz . Um die Differenz der Stichprobenmittel auf eine standardisierte Form zu bringen, ist also noch deren Varianz zu bestimmen. Mit und und der geforderten Annahme, dass und unabhängig sind, ergibt sich: Regeln für den Erwartungswert und für die Varianz finden Sie im . Eigenschaften von Schätzern (wie zum Beispiel Erwartungstreue) behandelt das Prüfgröße Mit Hilfe der soeben durchgeführten Herleitungen des Erwartungswertes unter und der Varianz kann die Differenz standardisiert bzw. normalisiert werden. Zu bedenken ist, dass durch die gegebenen Varianzen und vollständig bekannt ist, d.h. die Streuung muss nicht erst aus den Daten geschätzt werden. Damit erhält man die Prüfgröße Bei wahrer Nullhypothese, d.h. ,ist standardnormalverteilt, denn und . Mit der hergeleiteten Verteilung von ist der Test nun leicht durchzuführen. Weitere Informationen zum Thema und . Testentscheidung Bei der Testentscheidung ist die grundsätzliche Idee, die Nullhypothese abzulehnen, wenn die Prüfgröße einen zu extremen Wert annimmt. Unter der wahren Nullhypothese sollte der Erwartungswert der Gauß-Prüfgröße null sein, also Die Nullhypothese wird abgelehnt, wenn Page 4 so stark von 0 abweicht, dass (c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall der zugehörige kritische Wert über- oder unterschritten wird. Da unter der Nullhypothese standardnormalverteilt ist, können die zum jeweiligen Testproblem gehörenden kritischen Werte direkt aus der Standardnormalverteilungstabelle abgelesen werden. Je nach Testproblem ist abzulehnen, falls gilt: Verwirf H0, wenn Test A Test B Test C Mehr Theorie zu Testentscheidungen finden Sie im oder im . Anleitung zur Programmierung des Gauß-Tests im Statistiklabor: Laboranleitung Gauß ( c23.spf ) . Beispiel: Motivation - Berechnung Greifen wir das Beispiel aus der Motivation auf. In diesem Fall liegt kein begründetes Vorwissen über einen eventuellen Lageunterschied in eine bestimmte Richtung vor. Daher entscheiden wir uns für eine zweiseitige Hypothesenformulierung, also gegen Die Hypothese soll zum Signifikanzniveau von getestet werden. Prüfgröße Wir schätzen zunächst die Erwartungswerte über die Stichprobenmittel. Das Ergebnis ist in der Tabelle aufgeführt. Lage- und Streuungsmaße der Stichproben X und Y. Die nun zur Verfügung stehenden Lage- und Streuungsmaße setzen wir in die Formel zur Berechnung der Prüfgröße ein: Testentscheidung Für die Zahlenwerte haben wir oben als Wert für die Prüfgröße 1.404 herausbekommen. Da das zweiseitige Testproblem vorliegt, ergibt sich folgende Testentscheidung: Damit kann die Nullhypothese nicht abgelehnt werden. Es kann von keinem signifikanten Lageunterschied gesprochen werden. Hier können Sie sich das Beispiel im Labor ansehen: Labordatei öffnen ( c59.spf ) Page 5 (c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall Untersuchen Sie, ob die folgenden Ablehnbereiche zu einem der angegebenen Testprobleme gehören und ordnen Sie den jeweiligen Ablehnbereich zu. Nehmen Sie ein Signifikanzniveau von an! Hypothesen Testentscheidung 1) gegen a) 2) gegen b) 3) gegen c) Lösung Zeigen Sie, dass unter gültiger Nullhypothese und gilt. Lösung Allgemeine Formulierung der Hypothesen Der Aufbau der Prüfgröße über die Differenz der Erwartungswerte erlaubt es uns, Hypothesen allgemeiner zu konstruieren. Es soll neben der Möglichkeit, zwei Verteilungen auf ihre Gleichheit hin zu untersuchen, ebenfalls möglich sein, die Verteilungen auf einen bestimmten Abstand zu testen. Die allgemeiner formulierten Hypothesen lauten dann: Nullhypothese Alternative Test A gegen Test B gegen Test C gegen Für würde sich das ursprünglich aufgestellte Testproblem ergeben. Im Bild ist nun die Nullhypothese zu sehen. Die Behauptung ist, dass die Verteilungen einen bestimmten Abstand voneinander haben. Dieser Abstand wird über die Differenz der Parameter beschrieben, welche die Lage der Verteilung charakterisieren, nämlich und Nullhypothese:. Die Verteilungen haben einen bestimmten Abstand delta0 zueinander. Page 6 (c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall In der Alternative wird das Gegenteil der Nullhypothese formuliert, also dass der Abstand ungleich dem vorgegebenen ist. Das untere Bild zeigt eine Alternative bei der der Abstand größer ist. Alternative: In Wahrheit ist der Abstand der beiden Verteilungen größer als das in der Nullhypothese angegebene delta0 (schwarzer + roter Pfeil). Prüfgröße Basierend auf der erweiterten Differenz lautet die Teststatistik hier: Die Testentscheidung bleibt unverändert. (Siehe Abschnitt Testentscheidung ) Beispiel: West - Ost (Blatt 1978) Problemstellung Im Rahmen einer großangelegten Studie über "Schwangerschaft in West- und Ostdeutschland" interessiert u.a. das Alter von Frauen bei der Geburt ihres ersten Kindes. Es wird vermutet, dass die Frauen in Westdeutschland bei ihrer ersten Geburt mindestens 5 Jahre älter sind als die Frauen Ostdeutschlands. Beschreibe das Alter der Erstgebärenden in Westdeutschland und das der Frauen aus Ostdeutschland. Wir gehen davon aus, dass und Zur Überprüfung dieser Hypothese werden 49 Mütter aus Ostdeutschland und 55 Mütter aus Westdeutschland zufällig ausgewählt und nach ihrem Alter bei der Geburt des ersten Kindes befragt. Es ergab sich ein Durchschnittsalter von und . Aus Erfahrung ist bekannt, dass sowohl in West- als auch in Ostdeutschland beträgt. Hypothesen und Signifikanzniveau Um den Unterschied von "mindestens 5 Jahren" zu modellieren, wird folgendes Testproblem zugrunde gelegt: gegen Zur Überprüfung der Hypothese legen wir ein Signifikanzniveau von fest. Prüfgröße und Ablehnbereich Normalverteilung und bekannte Varianzen sind vorausgesetzt. Daher soll die Hypothese mit Hilfe des doppelten Gauß-Tests getestet werden. Bei obigen Testproblem ist die Nullhypothese abzulehnen, wenn . Realisieren der Prüfgröße Für die Berechnung der Prüfgröße, setzen wir die bekannten und geschätzten Parameter in die Formel ein: Testentscheidung Es gilt: Fazit: Die Nullhypothese, nämlich dass die westdeutschen Erstgebärenden höchstens 5 Jahre älter sind als die ostdeutschen, kann nicht abgelehnt werden. Page 7 (c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall Mit einem CVT-Getriebe (continuously variable transmission gearbox) kann ein Verbrennungsmotor geschwindigkeitsunabhängig im optimalen Kennfeldbereich betrieben werden. Obwohl das CVT-Getriebe in der Verbrennungsmotorenforschung keine Neuigkeit mehr ist, setzt sich diese Getriebebauweise im Kraftfahrzeugbau recht zögerlich durch. Das ärgert den bei einer großen Autofirma angestellten umweltbewussten Ingenieur Hans Apelt, denn er ist überzeugt, dass mit dem CVT der Kraftstoffverbrauch verringert werden kann. Um dies den Managern seines Unternehmens zu beweisen, will er auf dem Rollenprüfstand verschiedene Messreihe durchführen, in der er das CVT-Getriebe (C) gegen das momentan in die Oberklasse eingebaute Standardgetriebe (G) hinsichtlich des Kraftstoffverbrauches (der als normalverteilt angesehen wird) untersucht werden soll. Aus Voruntersuchungen weiß Hans Apelt, dass die Varianz des Kraftstoffverbrauchs beim CVT-Getriebe beträgt und beim Standardgetriebes Sein Chef hat ihm versprochen, wenn es bei dem Experiment auf Basis von um einen Spritsenkung von mindestens 0.8l/100km kommt, will er in die nächste Baureihe das CVT-Getriebe einbauen lassen. Labordatei öffnen ( de9.zmpf ) (Über das CVT-Getriebe können Sie in Höhn (1990) nachlesen oder besuchen Sie ) Anstatt vieler Zahnräder "nur noch" zwei variierende Kegelscheiben. Quelle: Neben den kritischen Werten und dem p-Wert kann eine Testentscheidung auch über das Konfidenzintervall durchgeführt werden. (Eine ausführliche Besprechung von Konfidenzintervallen finden Sie in den ) Zwischen dem Konfidenzintervall und dem Annahmebereich eines Tests besteht eine enge Analogie. Um das zu verdeutlichen betrachten wir das Konfidenzintervall im Zweistichprobenfall bei Normalverteilung und bekannten Varianzen. Gegeben sei das zweiseitige Testproblem: gegen Wir haben im Theorieteil gesehen, dass die Nullhypothese beizubehalten ist, wenn (Siehe Prüfgröße und Testentscheidung.) Das Konfidenzintervall für ist: Für die Durchführung der Testentscheidung gilt nun folgende Regel: Verwirf , falls außerhalb des Konfidenzintervalls liegt, d.h. wenn Behalte bei, fallsinnerhalb des Konfidenzintervalls liegt, d.h. wenn Berechnen Sie das dasKonfidenzintervall für Formen Sie hierfür folgende Gleichung äquivalent um: Dabei ist hier Page 8 (c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall Lösung Sie können Sich auf dieser Laborseite ( e64.spf ) anschauen, wie Sie einen Testoutput anhand des Konfidenzintervalls interpretieren können. 2a. stimmt. Der Rest passt nicht. Unter der Nullhypothese gilt: Hier gehen die ein. Hier gehen die ein. Die Ungleichung lässt sich äquivalent umformen zu . Wird der Betrag aufgelöst, erhält man oder , bzw. oder Diese Grenzen sind die Grenzen des -Konfidenzintervalls für , das gegeben ist als Gauß-Test im ZweistichprobenfallTest auf Differenz zweier Mittelwerte unabhängiger Gruppen aus normalverteilten Grundgesamtheiten mit bekannten Varianzen. Erklärung Literaturangabe Höhn, B.-R. (1990) Warum stufenlose Getriebe im Kraftfahrzeug? VDI Berichte 803, S. 121-147, Düsseldorf: VDI-Verlag 1990. (c) Projekt Neue Statistik 2003, Freie Universität Berlin, Center für Digitale Systeme Kontakt: http://www.neuestatistik.de Page 9