Beispiel (SPSS): gemischtes Beispiel (Anpassungstest auf Normalverteilung, T-Test bei einer Stichprobe und Anpassungstest auf Gleichverteilung) Die Datei ss14_tut10_bsp05_daten.sav enthält die Daten aus einer repräsentativen Stichprobe von MusikschülerInnen. Erhoben wurden das Geschlecht, die Musikalität mit einem standardisierten Fragebogen und das Instrument, welches die Personen spielen. (a) Überprüfe sowohl graphisch als auch rechnerisch mittels SPSS ( = .05), ob die Variable Musikalität normalverteilt ist. (b) Aus früheren Studien ist bekannt, dass der Populationsmittelwert der Variable Musikalität bei 47 liegt. Überprüfe, ob die kürzlich erhobenen Daten hinsichtlich des Mittelwerts mit denen aus früheren Untersuchungen übereinstimmen. ( = .05) (c) Es soll herausgefunden werden, ob verschiedene Musikinstrumente bei MusikschülerInnen gleich beliebt sind. Kann aufgrund der Daten aus der Stichprobe (Variable Instrument) davon ausgegangen werden? ( = .05) (d) Wäre die Häufigkeitsverteilung der Stichprobe mit der Annahme verträglich, dass sich die Präferenzen der MusikschülerInnen für Musikinstrumente folgendermaßen verteilen: Geige: 20%, Klavier: 30%, Gitarre: 30%, Klarinette: 16%, Schlagzeug: 4% ( = .05) Lösung (a) K-S-Test Analysieren – Deskriptive Statistiken – Explorative Datenanalyse … (K-S-Test mit Korrektur nach Lilliefors) Registerkarte „Diagramme“ Normalverteilungsdiagramm mit Tests anklicken Tests auf Normalverteilung Kolmogorov-Smirnov(a) Statistik Musikalität erhoben mittels FB ,051 df Shapiro-Wilk Signifikanz 100 ,200(*) Statistik ,989 df Signifikanz 100 ,599 * Dies ist eine untere Grenze der echten Signifikanz. a Signifikanzkorrektur nach Lilliefors p-Wert = .200 > = .05 nicht signifikant Normalverteilung kann angenommen werden. Erklärung: Wenn die Wahrscheinlichkeit für die Gültigkeit der Nullhypothese hoch ist (≥ 0.2), dann gibt SPSS immer den Wert .200 aus. Grafische Überprüfungen: Histogramm Boxplot Q-Q-Plot Abweichungen der Datenpunkte von der Geraden als Hinweis auf Normalverteilungsverletzung. In diesem Beispiel: Datenpunkte folgen relativ „schön“ dieser Geraden Es kann von einer Normalverteilung ausgegangen werden. K-S-Test (ohne Korrektur nach Lilliefors) – nicht empfehlenswert, wenn und aus der Stichprobe geschätzt werden müssen: Analysieren Nichtparametrische Tests K-S bei einer Stichprobe… Kolmogorov-Smirnov-Anpassungstest N Mittelwert Parameter der Normalverteilung(a,b) Standardabweichung Extremste Differenzen Absolut Musikalität erhoben mittels FB 100 51,12 14,432 ,051 Positiv ,044 Negativ -,051 Kolmogorov-Smirnov-Z Asymptotische Signifikanz (2-seitig) ,509 ,958 a Die zu testende Verteilung ist eine Normalverteilung. b Aus den Daten berechnet. sehr hoher p-Wert (0.958) nicht signifikant H0 wird beibehalten. K-S-Test ohne Korrektur nach Lilliefors ist konservativer, d.h. wird weniger leicht signifikant. (b) Einstichproben-T-Test: Analysieren – Mittelwerte Vergleichen – T Test bei einer Stichprobe – Testwert 47 Statistik bei einer Stichprobe N Musikalität erhoben mittels FB Mittelwert 100 51,12 Standardabw eichung Standardfehl er des Mittelwertes 14,432 1,443 Test bei einer Sichprobe Testwert = 47 T Musikalität erhoben mittels FB df 2,855 Sig. (2-seitig) ,005 99 Mittlere Differenz 4,120 95% Konfidenzintervall der Differenz Untere 1,26 Obere 6,98 p-Wert = .005 < = .05 Ergebnis ist signifikant: Die Stichprobe erreicht einen signifikant höheren Wert in der Variablen Musikalität. (c) Anpassungstest auf Gleichverteilung: Analysieren – Nichtparametrische Tests – Chi-Quadrat… Instrument Beobachtetes N 27 Erwartete Anzahl 20,0 Klavier 22 20,0 2,0 Gitarre 16 20,0 -4,0 Klarinette 21 20,0 1,0 Schlagzeug 14 20,0 -6,0 Geige Gesamt Residuum 7,0 100 Statistik für Test Chi-Quadrat(a) df Asymptotische Signifikanz Instrument 5,300 4 ,258 a Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 20,0. p-Wert = .258 > = .05 nicht signifikant: H0 wird beibehalten: Es handelt sich um eine Gleichverteilung. (d) Anpassungstest auf eine beliebige Verteilung: Analysieren – Nichtparametrische Tests – Chi-Quadrat… Erwartete Häufigkeiten (nicht Prozentwerte) pro Musikinstrument eingeben (Achtung: Reihenfolge (je nach Kodierung) eimhalten!!! In diesem Beispiel: 1) Geige, 2) Klavier, 3) Gitarre, 4) Klarinette, 5) Schlagzeug Instrument Beobachtetes N 27 Erwartete Anzahl 20,0 Klavier 22 30,0 -8,0 Gitarre 16 30,0 -14,0 Klarinette 21 16,0 5,0 Schlagzeug 14 4,0 10,0 Geige Gesamt Residuum 7,0 100 Statistik für Test Instrument Chi-Quadrat(a) df Asymptotische Signifikanz 37,679 4 ,000 a Bei 1 Zellen (20,0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 4,0. Fußzeile beachten! Da aber bei 80% ≥ 5 Häufigkeiten erwartet, ist der Test (noch) zulässig. p-Wert = .000 < = .05 Ergebnis ist signifikant Verteilung der Stichprobe ≠ Erwartete Verteilung