Annahmenüberprüfung für den t-Test

Werbung
Annahmenüberprüfung für den t-Test
UNABHÄNGIGKEIT
Unabhängigkeit innerhalb einer Stichprobe
Innerhalb einer Stichprobe sind die Stichprobenvariablen i. Allg. unabhängig
und identisch verteilt, wenn
und
Zufallsstichproben sind.
Wurden die Stichproben allerdings nicht zufällig gezogen, wie z.B. bei
Quotenstichproben, ist die Unabhängigkeit auf jeden Fall zu hinterfragen.
Abhängigkeiten zwischen den Beobachtungen können durch eine dritte, (un-)
beobachtete Größe entstehen, z.B. die in den Daten eine gewisse Ordnung
impliziert. Untersucht man beispielsweise eine Variable über einen längeren
Zeitraum, können die Beobachtungen anhand der Dimension "Zeit" miteinander
korreliert sein.
Mehr Informationen zum Thema bekommen Sie im Lernmodul einfache
Zufallsstichprobe .
Unabhängigkeit zwischen den Stichproben
Abhängigkeiten zwischen zwei Stichproben entstehen, wenn an der gleichen
Beobachtungseinheit dieselbe Variable wiederholt gemessen wird. Solche
Vorher-Nachher-Messungen werden häufig in der Medizin durchgeführt, um die
Wirkung von Medikamenten zu erforschen.
Abhängigkeit zwischen den Stichproben
Abhängigkeiten zwischen Stichproben entstehen, wenn an der selben
Beobachtungseinheit mehrere Variablen gleichzeitig oder eine Variable
mehrmals gemessen werden
NORMALVERTEILUNG
QQ-Plots
Die Normalverteilungsannahme kann sehr gut mit QQ-Plots überprüft werden.
Ein QQ-Plot plottet die theoretischen Quantile der Standardnormalverteilung
gegen die empirischen Quantile der Stichprobe. QQ-Plots werden ausführlicher
im Lernmodul Normalverteilung erklärt.
Zu sehen ist ein QQ-Plot einer Stichprobe normalverteilter Zufallszahlen. Die
meisten Punkte liegen auf der Geraden, das bedeutet, dass die Daten der
Stichprobe gut einer Normalverteilung gle ichen.
Q Q -Plot einer Stichprobe mit exponentialverteilten Daten (linkssteile
Verteilung). Die Punkte liegen an den Rändern weit entfernt von der Geraden.
Erzeugen Sie im Labor doch einmal QQ-Plots von rechtssteilen Verteilungen
oder anderen symmetrischen Verteilungen.
Boxplots, Histogramme
Auch Boxplots und Histogramme veranschaulichen die Verteilung der Daten.
Mehr zu graphischen Darstellungsweise im Lernmodule Datenanalyse aus einer
Urliste und Lernmodul Datenanalyse aus einer Häufigkeitstabelle mit
Klassierung .
Boxplot zweier linkssteiler Verteilungen.
Histogramm
Siehe z.B. auch Fahrmeir et al. (2002) oder Schlittgen (2000).
VARIANZEN
Varianzhomogenität, Gleichheit der Varianzen
Um von der Gleichheit der theoretischen Varianzen beider Populationen
ausgehen zu können, sollte zwischen den empirischen Stichprobenvariablen
und
kein wesentlicher Unterschied bestehen. Die Streuung lässt sich auch
anhand graphischer Darstellungen der Verteilungen (z.B. über Boxplots)
verdeutlichen und vergleichen.
Sind diese Maßnahmen nicht zufrieden stellend, kann die Homogenität der
Varianzen auch mit einem statistischen Test überprüft werden. Bei
gerechtfertigter Annahme der Normalverteilung kann dies beispielsweise bei
einem Zweistichprobenproblem über den F-Test geschehen.
Bei der Varianzanalyse, bei der mehr als zwei Gruppen miteinander verglichen
werden, kann der Test von Bartlett zur Überprüfung verwendet werden.
Weitere Tests zur Prüfung der Varianzhomogenität in Sachs (2002) Büning,
Trenkler (1994).
Anmerkung
Beim t-Test relativiert sich das Problem unterschiedlicher Varianzen, sofern für
die Stic hproben
gilt. In diesem Fall erzeugt der t-Test trotz Verletzung
der Varianzhomogenität äußerst robuste Ergebnisse. Vorsicht ist aber
unbedingt geboten, wenn
(Siehe Lehman (1997))
Dann sollte auf den t-Test für unbekannte und ungleiche Varianzen, den so
genannten Test von Welch zurückgegriffen werden. Ist weder die
Normalverteilungsannahme noch die Annahme gleicher Varianzen
gerechtfertigt, sollte eine Transformation der Daten in Betracht gezogen, oder
auf einen Test zurückgegriffen werden, der auf derartige Annahmen verzichtet.
Weitere Informationen erhalten Sie im Kapitel Spezielle Tests.
Literatur
Büning, Trenkler (1994)
Büning, H. und Trenkler, G. (1994)
Nichtparametrische statistische Methoden. 2.
Auflage, de Gruyter, Berlin.
Fahrmeir et al. (2002)
Fahrmeir, L., Künstler, R., Pigeot, I. und Tutz, G.
(2002) Statistik. Der Weg zur Datenanalyse. 4.
Auflage, Springer, Berlin.
Lehman (1997)
Lehmann, E. L. (1997) Testing Statistical
Hypothesis. 2. Auflage, Springer, Berlin.
Schlittgen (2000)
Schlittgen, R. (2000). Einführung in die Statistik.
Analyse und Modellierung von Daten. 9. Auflage,
Oldenbourg, München.
Sachs (2002)
Sachs, L. (2002) Angewandte Statistik.
Anwendung statistischer Methoden. 10 Auflage,
Springer, Berlin.
Herunterladen