Gauß-Test für den Zweistichprobenfall

Werbung
(c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall
Gauß-Test für den Zweistichprobenfall
Zweiseitiger Gauß-Test
Allgemeine Formulierung der Hypothesen
Test auf Lageunterschied zweier normalverteilter Grundgesamtheiten mit
bekannten Varianzen durch Vergleich der Mittelwerte zweier unabhängiger
Zufallsstichproben.
Beispiel
Es wurden im Labor zwei Stichproben an den Merkmalen
gezogen. Dabei entstammt
und
und
zufällig
einer Normalverteilung mit bekannter Varianz
einer Normalverteilung mit der Varianz
Beide
Stichproben haben den Umfang n=10.
Wir wollen nun wissen, ob die Grundgesamtheiten, aus denen die Stichproben
stammen, sich in ihrer Lage zueinander unterscheiden.
Folgendes können wir dabei voraussetzen:
- Die beiden Stichproben wurden unabhängig voneinander gezogen.
- Beide Stichproben stammen aus einer Normalverteilung.
- Die Varianzen sind bekannt.
Zweiseitiger Gauß-Test
Der Wilcoxon-Rangsummen-Test ist anwendbar für bestimmte Situationen. So haben
wir gesehen, dass der Test schon für ordinal skalierte Daten durchführbar ist, keine
bestimmte Verteilungsart, sondern lediglich Symmetrie der Verteilung voraussetzt und
dass er zumindest für kleine Stichprobenumfänge praktikabel ist und dann ein exaktes
Ergebnis liefert. (Für große Stichproben wird aus praktischen Gründen das Ergebnis
Page 1
(c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall
über die Normalverteilung approximiert, wie im Exkurs im erklärt wird.)
Wenn wir aber Daten vorliegen haben, die intervallskaliert sind und aus
Normalverteilungen stammen, gibt es effizientere Tests, um einen Lageunterschied
zwischen zwei Grundgesamtheiten festzustellen.
Annahmen
Annahmen
Grundgesamtheit 1
unabhängig und identisch
1)
normalverteilt mit
Grundgesamtheit 2
unabhängig und identisch
2)
normalverteilt mit
Die Stichproben
3)
und
sind voneinander
unabhängig und
untereinander ebenfalls
4)
,
bekannt
Prüfung der Annahmen
Allgemein gilt, dass vor der Durchführung eines Tests zuerst überprüft werden muss, ob
die Daten den jeweiligen Annahmen genügen. Ist das nicht der Fall, ist der Test
ungeeignet, und es muss ein anderer, passender Test gesucht werden. Ansonsten ist
nicht mehr gesichert, dass das Signifikanzniveau
tatsächlich eingehalten wird.
(Siehe dazu das .)
Vor der Durchführung des Gauß-Tests sollte man überprüfen, ob die Daten der
Annahmen der Unabhängigkeit und Normalverteilung genügen. Eine Hilfestellung zur
Überprüfung finden Sie unter Annahmenüberprüfung für den Gauß-Test (
:
aa6.pdf ) oder im .
Hypothesen
Beim Testen besteht der erste Schritt in der Formulierung der Hypothesen. Wie beim
erläutert, wird unter der Nullhypothese angenommen, dass die zugrunde liegenden
Page 2
(c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall
Verteilungen der Stichproben
unterscheiden. Sind
und
und
sich bzgl. ihres Lokalisationsparameters nicht
normalverteilt, wird die Lage ihrer Verteilung durch
die Erwartungswerte
und
beschrieben. Will man auf eine
unterschiedliche Lage der Verteilungen testen, können die Hypothesen folgendermaßen
formuliert werden:
Nullhypothese
Alternativhypothese
Test A
gegen
Test B
gegen
Test C
gegen
Herleitung der Prüfgröße
Die Lage der Verteilungen zueinander ist durch die Differenz ihrer Erwartungswerte
gekennzeichnet. Das verdeutlicht die Abbildung:
Der Lageunterschied der Normalverteilungen N (0,1) und N (2,1) kann durch die Differenz ihrer Erwartungswerte beschrieben
werden.
Eine Herangehensweise an die Problemlösung ist, die Differenz näher zu betrachten.
Bei wahrer Nullhypothese
sollte die Differenz 0 sein oder, empirisch
Page 3
(c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall
gesehen, zumindest nahe um die 0 herumliegen. Sollte die Differenz wesentlich von 0
verschieden sein, ist dies ein Anzeichen dafür, dass die Verteilungen sich eher
unterscheiden.
Will man das statistische Testproblem über die Differenz der Erwartungswerte lösen,
muss man die Verteilung der Differenz der Mittelwerte unter gültiger Nullhypothese
kennen. Im weiteren Vorgehen werden wir daher die Differenz auf eine Form zu
bringen, deren Verteilung bekannt ist.
Die unbekannten Erwartungswerte können mit den erwartungstreuen
Stichprobenmitteln
und
geschätzt werden, d.h. es gilt und
Auch für die Differenz liefert die Differenz der Stichprobenmittel und
eine erwartungstreue Schätzung, denn
Unter der Nullhypothese ergibt sich:
Normalverteilungen werden jedoch nicht alleine durch ihren Erwartungswert
charakterisiert, sondern zusätzlich durch ihre Varianz . Um die Differenz der
Stichprobenmittel auf eine standardisierte Form zu bringen, ist also noch deren Varianz
zu bestimmen. Mit und und der geforderten Annahme, dass und unabhängig sind, ergibt
sich:
Regeln für den Erwartungswert und für die Varianz finden Sie im .
Eigenschaften von Schätzern (wie zum Beispiel Erwartungstreue) behandelt das
Prüfgröße
Mit Hilfe der soeben durchgeführten Herleitungen des Erwartungswertes unter
und der Varianz kann die Differenz standardisiert bzw.
normalisiert werden. Zu bedenken ist, dass durch die gegebenen Varianzen und
vollständig bekannt ist, d.h. die Streuung muss nicht erst aus den Daten geschätzt
werden.
Damit erhält man die Prüfgröße
Bei wahrer Nullhypothese, d.h. ,ist
standardnormalverteilt, denn
und . Mit der hergeleiteten Verteilung von ist der Test nun leicht durchzuführen.
Weitere Informationen zum Thema und .
Testentscheidung
Bei der Testentscheidung ist die grundsätzliche Idee, die Nullhypothese abzulehnen,
wenn die Prüfgröße einen zu extremen Wert annimmt. Unter der wahren Nullhypothese
sollte der Erwartungswert der Gauß-Prüfgröße null sein, also
Die Nullhypothese wird abgelehnt, wenn
Page 4
so stark von 0 abweicht, dass
(c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall
der zugehörige kritische Wert über- oder unterschritten wird. Da unter der
Nullhypothese standardnormalverteilt ist, können die zum jeweiligen Testproblem
gehörenden kritischen Werte direkt aus der Standardnormalverteilungstabelle abgelesen
werden.
Je nach Testproblem ist abzulehnen, falls gilt:
Verwirf H0, wenn
Test A
Test B
Test C
Mehr Theorie zu Testentscheidungen finden Sie im oder im .
Anleitung zur Programmierung des Gauß-Tests im Statistiklabor:
Laboranleitung Gauß ( c23.spf ) .
Beispiel: Motivation - Berechnung
Greifen wir das Beispiel aus der Motivation auf. In diesem Fall liegt kein begründetes
Vorwissen über einen eventuellen Lageunterschied in eine bestimmte Richtung vor.
Daher entscheiden wir uns für eine zweiseitige Hypothesenformulierung, also
gegen
Die Hypothese soll zum Signifikanzniveau von getestet werden.
Prüfgröße
Wir schätzen zunächst die Erwartungswerte über die Stichprobenmittel. Das Ergebnis
ist in der Tabelle aufgeführt.
Lage- und Streuungsmaße der Stichproben X und Y.
Die nun zur Verfügung stehenden Lage- und Streuungsmaße setzen wir in die Formel
zur Berechnung der Prüfgröße ein:
Testentscheidung
Für die Zahlenwerte haben wir oben als Wert für die Prüfgröße 1.404 herausbekommen.
Da das zweiseitige Testproblem vorliegt, ergibt sich folgende Testentscheidung:
Damit kann die Nullhypothese nicht abgelehnt werden. Es kann von keinem
signifikanten Lageunterschied gesprochen werden.
Hier können Sie sich das Beispiel im Labor ansehen:
Labordatei öffnen ( c59.spf )
Page 5
(c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall
Untersuchen Sie, ob die folgenden Ablehnbereiche zu einem der angegebenen
Testprobleme gehören und ordnen Sie den jeweiligen Ablehnbereich zu. Nehmen Sie
ein Signifikanzniveau von
an!
Hypothesen
Testentscheidung
1)
gegen
a)
2)
gegen
b)
3)
gegen
c)
Lösung
Zeigen Sie, dass unter gültiger Nullhypothese und gilt.
Lösung
Allgemeine Formulierung der Hypothesen
Der Aufbau der Prüfgröße über die Differenz der Erwartungswerte erlaubt es uns,
Hypothesen allgemeiner zu konstruieren. Es soll neben der Möglichkeit, zwei
Verteilungen auf ihre Gleichheit hin zu untersuchen, ebenfalls möglich sein, die
Verteilungen auf einen bestimmten Abstand zu testen. Die allgemeiner formulierten
Hypothesen lauten dann:
Nullhypothese
Alternative
Test A
gegen
Test B
gegen
Test C
gegen
Für würde sich das ursprünglich aufgestellte Testproblem ergeben.
Im Bild ist nun die Nullhypothese zu sehen. Die Behauptung ist, dass die Verteilungen
einen bestimmten Abstand voneinander haben. Dieser Abstand wird über die Differenz
der Parameter beschrieben, welche die Lage der Verteilung charakterisieren, nämlich
und
Nullhypothese:. Die Verteilungen haben einen bestimmten Abstand delta0 zueinander.
Page 6
(c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall
In der Alternative wird das Gegenteil der Nullhypothese formuliert, also dass der
Abstand ungleich dem vorgegebenen ist. Das untere Bild zeigt eine Alternative bei der
der Abstand größer ist.
Alternative: In Wahrheit ist der Abstand der beiden Verteilungen größer als das in der Nullhypothese angegebene delta0 (schwarzer
+ roter Pfeil).
Prüfgröße
Basierend auf der erweiterten Differenz lautet die Teststatistik hier:
Die Testentscheidung bleibt unverändert. (Siehe Abschnitt Testentscheidung )
Beispiel: West - Ost (Blatt 1978)
Problemstellung
Im Rahmen einer großangelegten Studie über "Schwangerschaft in West- und
Ostdeutschland" interessiert u.a. das Alter von Frauen bei der Geburt ihres ersten
Kindes. Es wird vermutet, dass die Frauen in Westdeutschland bei ihrer ersten Geburt
mindestens 5 Jahre älter sind als die Frauen Ostdeutschlands.
Beschreibe das Alter der Erstgebärenden in Westdeutschland und das der Frauen aus
Ostdeutschland. Wir gehen davon aus, dass und
Zur Überprüfung dieser Hypothese werden 49 Mütter aus Ostdeutschland und 55 Mütter
aus Westdeutschland zufällig ausgewählt und nach ihrem Alter bei der Geburt des
ersten Kindes befragt.
Es ergab sich ein Durchschnittsalter von und . Aus Erfahrung ist bekannt, dass sowohl
in West- als auch in Ostdeutschland beträgt.
Hypothesen und Signifikanzniveau
Um den Unterschied von "mindestens 5 Jahren" zu modellieren, wird folgendes
Testproblem zugrunde gelegt:
gegen
Zur Überprüfung der Hypothese legen wir ein Signifikanzniveau von fest.
Prüfgröße und Ablehnbereich
Normalverteilung und bekannte Varianzen sind vorausgesetzt. Daher soll die Hypothese
mit Hilfe des doppelten Gauß-Tests getestet werden. Bei obigen Testproblem ist die
Nullhypothese abzulehnen, wenn
.
Realisieren der Prüfgröße
Für die Berechnung der Prüfgröße, setzen wir die bekannten und geschätzten Parameter
in die Formel ein:
Testentscheidung
Es gilt:
Fazit:
Die Nullhypothese, nämlich dass die westdeutschen Erstgebärenden höchstens 5 Jahre
älter sind als die ostdeutschen, kann nicht abgelehnt werden.
Page 7
(c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall
Mit einem CVT-Getriebe (continuously variable transmission gearbox) kann ein
Verbrennungsmotor geschwindigkeitsunabhängig im optimalen Kennfeldbereich
betrieben werden.
Obwohl das CVT-Getriebe in der Verbrennungsmotorenforschung keine Neuigkeit
mehr ist, setzt sich diese Getriebebauweise im Kraftfahrzeugbau recht zögerlich durch.
Das ärgert den bei einer großen Autofirma angestellten umweltbewussten Ingenieur
Hans Apelt, denn er ist überzeugt, dass mit dem CVT der Kraftstoffverbrauch verringert
werden kann.
Um dies den Managern seines Unternehmens zu beweisen, will er auf dem
Rollenprüfstand verschiedene Messreihe durchführen, in der er das CVT-Getriebe (C)
gegen das momentan in die Oberklasse eingebaute Standardgetriebe (G) hinsichtlich des
Kraftstoffverbrauches (der als normalverteilt angesehen wird) untersucht werden soll.
Aus Voruntersuchungen weiß Hans Apelt, dass die Varianz des Kraftstoffverbrauchs
beim CVT-Getriebe beträgt und beim Standardgetriebes
Sein Chef hat ihm versprochen, wenn es bei dem Experiment auf Basis von um einen
Spritsenkung von mindestens 0.8l/100km kommt, will er in die nächste Baureihe das
CVT-Getriebe einbauen lassen.
Labordatei öffnen ( de9.zmpf )
(Über das CVT-Getriebe können Sie in Höhn (1990) nachlesen oder besuchen Sie )
Anstatt vieler Zahnräder "nur noch" zwei variierende Kegelscheiben.
Quelle:
Neben den kritischen Werten und dem p-Wert kann eine Testentscheidung auch über
das Konfidenzintervall durchgeführt werden. (Eine ausführliche Besprechung von
Konfidenzintervallen finden Sie in den )
Zwischen dem Konfidenzintervall und dem Annahmebereich eines Tests besteht eine
enge Analogie. Um das zu verdeutlichen betrachten wir das Konfidenzintervall im
Zweistichprobenfall bei Normalverteilung und bekannten Varianzen.
Gegeben sei das zweiseitige Testproblem:
gegen
Wir haben im Theorieteil gesehen, dass die Nullhypothese beizubehalten ist, wenn
(Siehe Prüfgröße und Testentscheidung.)
Das Konfidenzintervall für ist:
Für die Durchführung der Testentscheidung gilt nun folgende Regel:
Verwirf , falls außerhalb des Konfidenzintervalls liegt, d.h. wenn
Behalte bei, fallsinnerhalb des Konfidenzintervalls liegt, d.h. wenn
Berechnen Sie das dasKonfidenzintervall für Formen Sie hierfür folgende Gleichung
äquivalent um:
Dabei ist hier
Page 8
(c) Projekt Neue Statistik 2003 - Lernmodul: Gauß-Test für den Zweistichprobenfall
Lösung
Sie können Sich auf dieser Laborseite ( e64.spf ) anschauen, wie Sie einen Testoutput
anhand des Konfidenzintervalls interpretieren können.
2a. stimmt. Der Rest passt nicht.
Unter der Nullhypothese gilt:
Hier gehen die ein.
Hier gehen die ein.
Die Ungleichung lässt sich äquivalent umformen zu
.
Wird der Betrag aufgelöst, erhält man
oder ,
bzw.
oder
Diese Grenzen sind die Grenzen des -Konfidenzintervalls für , das gegeben ist als
Gauß-Test im ZweistichprobenfallTest auf Differenz zweier Mittelwerte
unabhängiger Gruppen aus normalverteilten Grundgesamtheiten mit bekannten
Varianzen.
Erklärung
Literaturangabe
Höhn, B.-R. (1990) Warum stufenlose Getriebe im Kraftfahrzeug? VDI Berichte 803, S. 121-147, Düsseldorf: VDI-Verlag 1990.
(c) Projekt Neue Statistik 2003, Freie Universität Berlin, Center für Digitale Systeme
Kontakt: http://www.neuestatistik.de
Page 9
Herunterladen