Annahmenüberprüfung für den t-Test UNABHÄNGIGKEIT Unabhängigkeit innerhalb einer Stichprobe Innerhalb einer Stichprobe sind die Stichprobenvariablen i. Allg. unabhängig und identisch verteilt, wenn und Zufallsstichproben sind. Wurden die Stichproben allerdings nicht zufällig gezogen, wie z.B. bei Quotenstichproben, ist die Unabhängigkeit auf jeden Fall zu hinterfragen. Abhängigkeiten zwischen den Beobachtungen können durch eine dritte, (un-) beobachtete Größe entstehen, z.B. die in den Daten eine gewisse Ordnung impliziert. Untersucht man beispielsweise eine Variable über einen längeren Zeitraum, können die Beobachtungen anhand der Dimension "Zeit" miteinander korreliert sein. Mehr Informationen zum Thema bekommen Sie im Lernmodul einfache Zufallsstichprobe . Unabhängigkeit zwischen den Stichproben Abhängigkeiten zwischen zwei Stichproben entstehen, wenn an der gleichen Beobachtungseinheit dieselbe Variable wiederholt gemessen wird. Solche Vorher-Nachher-Messungen werden häufig in der Medizin durchgeführt, um die Wirkung von Medikamenten zu erforschen. Abhängigkeit zwischen den Stichproben Abhängigkeiten zwischen Stichproben entstehen, wenn an der selben Beobachtungseinheit mehrere Variablen gleichzeitig oder eine Variable mehrmals gemessen werden NORMALVERTEILUNG QQ-Plots Die Normalverteilungsannahme kann sehr gut mit QQ-Plots überprüft werden. Ein QQ-Plot plottet die theoretischen Quantile der Standardnormalverteilung gegen die empirischen Quantile der Stichprobe. QQ-Plots werden ausführlicher im Lernmodul Normalverteilung erklärt. Zu sehen ist ein QQ-Plot einer Stichprobe normalverteilter Zufallszahlen. Die meisten Punkte liegen auf der Geraden, das bedeutet, dass die Daten der Stichprobe gut einer Normalverteilung gle ichen. Q Q -Plot einer Stichprobe mit exponentialverteilten Daten (linkssteile Verteilung). Die Punkte liegen an den Rändern weit entfernt von der Geraden. Erzeugen Sie im Labor doch einmal QQ-Plots von rechtssteilen Verteilungen oder anderen symmetrischen Verteilungen. Boxplots, Histogramme Auch Boxplots und Histogramme veranschaulichen die Verteilung der Daten. Mehr zu graphischen Darstellungsweise im Lernmodule Datenanalyse aus einer Urliste und Lernmodul Datenanalyse aus einer Häufigkeitstabelle mit Klassierung . Boxplot zweier linkssteiler Verteilungen. Histogramm Siehe z.B. auch Fahrmeir et al. (2002) oder Schlittgen (2000). VARIANZEN Varianzhomogenität, Gleichheit der Varianzen Um von der Gleichheit der theoretischen Varianzen beider Populationen ausgehen zu können, sollte zwischen den empirischen Stichprobenvariablen und kein wesentlicher Unterschied bestehen. Die Streuung lässt sich auch anhand graphischer Darstellungen der Verteilungen (z.B. über Boxplots) verdeutlichen und vergleichen. Sind diese Maßnahmen nicht zufrieden stellend, kann die Homogenität der Varianzen auch mit einem statistischen Test überprüft werden. Bei gerechtfertigter Annahme der Normalverteilung kann dies beispielsweise bei einem Zweistichprobenproblem über den F-Test geschehen. Bei der Varianzanalyse, bei der mehr als zwei Gruppen miteinander verglichen werden, kann der Test von Bartlett zur Überprüfung verwendet werden. Weitere Tests zur Prüfung der Varianzhomogenität in Sachs (2002) Büning, Trenkler (1994). Anmerkung Beim t-Test relativiert sich das Problem unterschiedlicher Varianzen, sofern für die Stic hproben gilt. In diesem Fall erzeugt der t-Test trotz Verletzung der Varianzhomogenität äußerst robuste Ergebnisse. Vorsicht ist aber unbedingt geboten, wenn (Siehe Lehman (1997)) Dann sollte auf den t-Test für unbekannte und ungleiche Varianzen, den so genannten Test von Welch zurückgegriffen werden. Ist weder die Normalverteilungsannahme noch die Annahme gleicher Varianzen gerechtfertigt, sollte eine Transformation der Daten in Betracht gezogen, oder auf einen Test zurückgegriffen werden, der auf derartige Annahmen verzichtet. Weitere Informationen erhalten Sie im Kapitel Spezielle Tests. Literatur Büning, Trenkler (1994) Büning, H. und Trenkler, G. (1994) Nichtparametrische statistische Methoden. 2. Auflage, de Gruyter, Berlin. Fahrmeir et al. (2002) Fahrmeir, L., Künstler, R., Pigeot, I. und Tutz, G. (2002) Statistik. Der Weg zur Datenanalyse. 4. Auflage, Springer, Berlin. Lehman (1997) Lehmann, E. L. (1997) Testing Statistical Hypothesis. 2. Auflage, Springer, Berlin. Schlittgen (2000) Schlittgen, R. (2000). Einführung in die Statistik. Analyse und Modellierung von Daten. 9. Auflage, Oldenbourg, München. Sachs (2002) Sachs, L. (2002) Angewandte Statistik. Anwendung statistischer Methoden. 10 Auflage, Springer, Berlin.