SoSe 06, Statistik mit SPSS 15-06-06 Überblick Mittelwertvergleiche 1. Fragestellungen 2. Übersicht T-Tests 3. T-Test für unabhängige Stichproben 4. Box-Plots für Gruppenunterschiede 1. Mögliche Fragestellungen In der Sozialforschung sind häufig Mittelwertunterschiede von Interesse: Verdienen Männer mehr als Frauen? Bewerten Männer die SPD anders als Frauen? Schätzen sich Ostdeutsche weiter links ein als Westdeutsche? Voraussetzungen für die Berechnung von Mittelwertunterschieden: Metrische Variablen aus Stichproben mit normalverteilten Werten (bei Ordinaldaten oder fehlender Normalverteilung: Nichtparametrische Tests) Zeigen sich signifikante Abweichungen zwischen den jeweiligen Gruppen, dann kann man davon ausgehen, dass diese Unterschiede auch in der Grundgesamtheit bestehen. 2. Übersicht T-Tests 1. • • • T-Test bei einer Stichprobe: prüft, ob der Mittelwert einer einzelnen Variablen von einer angegebenen Konstanten abweicht. T-Test bei unabhängige Stichproben: Vergleicht die Mittelwerte einer Variablen für zwei Fallgruppen (z.B. Unterschiede zw. Männern und Frauen bei der Bewertung der SPD). T-Test bei gepaarten Variablen: Vergleicht den Mittelwert zweier Variablen für eine einzelne Gruppe (z.B. Blutdruckwerte in Zeitreihe. Einfaktorielle Varianzanalyse: Mittelwertvergleich für mehr als zwei Gruppen 3. Beispiele T-Test für unabh. Stichproben Beispiel: Es soll untersucht werden, ob zwischen Männern und Frauen ein signifikanter Unterschied bei der Bewertung der SPD (Skalometer SPD, f028_1) besteht. H0: Zwischen Männern und Frauen besteht kein Unterschied in den Mittelwerten der Bewertung der SPD H1: Zwischen Männern und Frauen besteht ein Unterschied in den Mittelwerten der Bewertung der SPD 1. Beispiel Anschließend „einfügen“ und weiter im Syntaxfenster... T-Test für unabhängige Stichproben ***Beispiel 1, Mittelwertunterschiede Skalometer SPD Männer/Frauen. T-TEST GROUPS = geschlecht (0 1) /MISSING = ANALYSIS /VARIABLES = skalospd /CRITERIA = CI(.95) . ***Kurzform. Gruppierungsvariable t-test grou geschlecht (0 1) Testvariable /var skalospd /crit ci (.95). 95% Konfidenzintervall Gruppenstatistiken geschlecht Geschlecht skalospd 0 Mann 1 Frau N Mittelwert 1210 ,7985 1295 ,8215 Standardfehl Standarda er des bweichung Mittelwertes 2,87301 ,08260 2,91729 ,08105 Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit skalospd Varianzen sind gleich Varianzen sind nicht gleich F ,326 Signifikanz ,568 T-Test für die Mittelwertgleichheit T -,199 df Sig. (2-seitig) 2503 ,843 -,199 2496,061 ,843 95% Konfidenzinterva Mittlere Standardfehle ll der Differenz Differenz r der Differenz Untere Obere -,02299 ,11579 -,25004 ,20406 -,02299 ,11573 -,24993 ,20394 Levene-Test zur Überprüfung Varianzgleichheit: H0: Varianzen sind gleich H1: Varianzen sind nicht gleich Der Signifikanzwert von .568 besagt, dass bei einer Ablehnung der Nullhypothese die Irrtumswahrscheinlichkeit bei 56,8% liegt. Damit liegt sie deutlich über den geforderten 5% (Sig. <= 0.05). Die H0 wird somit beibehalten, d.h. die Varianzen sind gleich (s.o.). Liegt der Signifikanzwert bei <= 0.05 (also Irrtumswahrscheinlichkeit <= 5%) dann wird davon ausgegangen, dass die Varianzen nicht gleich sind. Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit skalospd Varianzen sind gleich Varianzen sind nicht gleich F ,326 Signifikanz ,568 T-Test für die Mittelwertgleichheit T -,199 df Sig. (2-seitig) 2503 ,843 -,199 2496,061 ,843 95% Konfidenzinterva Mittlere Standardfehle ll der Differenz Differenz r der Differenz Untere Obere -,02299 ,11579 -,25004 ,20406 -,02299 ,11573 -,24993 ,20394 1. Varianzen sind gleich: Ergebnis des T-Tests in der Zeile "Varianzen sind gleich„. (bei Varianzungleichheit: Signifikanz des T-Tests in der Zeile "Varianzen sind nicht gleich„). 2. Hier: p-Wert = 0,843, d.h. der Mittelwertunterschied von 0,023 ist nicht signifikant (Irrtumswahrscheinlichkeit bei Ablehnung der Nullhypothese: 84,3%). 3. Das 95% - Konfidenzintervall: Das Intervall zwischen –0,25 und +0,2 enthält mit einer 95%igen Wahrscheinlichkeit den unbekannten Populationsparameter (also hier den Mittelwertunterschied) D.h. der Mittelwertunterschied zwischen Männern und Frauen liegt in der Grundgesamtheit (alle volljährigen Deutschen) vermutlich zwischen –0,25 und +0,2. 2. Beispiel ***Beispiel 2, Mittelwertunterschiede Skalometer SPD Ost/West. t-test grou region (0 1) /var skalospd /crit ci (.99). Gruppenstatistiken region Ost/West skalospd 0 West 1 Ost N Mittelwert 1995 ,8398 511 ,6956 Standarda bweichung 2,91041 2,83607 Standardfehl er des Mittelwertes ,06517 ,12551 Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit skalospd Varianzen sind gleich Varianzen sind nicht gleich F ,528 Signifikanz ,468 T-Test für die Mittelwertgleichheit T 1,004 df Sig. (2-seitig) 2503 ,315 1,020 806,460 ,308 99% Konfidenzinterva Mittlere Standardfehle ll der Differenz Differenz r der Differenz Untere Obere ,14419 ,14360 -,22599 ,51437 ,14419 ,14142 -,22094 ,50933 1. Varianzen sind gleich: Ergebnis des T-Tests in der Zeile "Varianzen sind gleich„. 2. Hier: p-Wert = 0,315, d.h. der Mittelwertunterschied von 0,014 ist nicht signifikant (Irrtumswahrscheinlichkeit bei Ablehnung der Nullhypothese: 31,5%). 3. Das 99% - Konfidenzintervall liegt zwischen –0,23 und +0,5. D.h. der Mittelwertunterschied zwischen Männern und Frauen liegt in der Grundgesamtheit (alle volljährigen Deutschen) vermutlich zwischen –0,23 und +0,5. 3. Beispiel ***Beispiel 3, Mittelwertunterschiede Skalometer PDS Ost/West. t-test grou region (0 1) /var skalopds /crit ci (.95). Gruppenstatistiken region Ost/West skalopds 0 West 1 Ost N Mittelwert 1959 -2,6639 505 ,1982 Standarda bweichung 2,78850 3,15061 Standardfehl er des Mittelwertes ,06300 ,14020 Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit F skalopds Varianzen sind gleich 7,032 Varianzen sind nicht gleich T-Test für die Mittelwertgleichheit Signifikanz T ,008 -20,008 df Sig. (2-seitig) 2462 ,000 -18,621 720,586 ,000 95% Konfidenzintervall der Differenz Mittlere Standardfehle Differenz r der Differenz Untere Obere -2,86211 ,14305 -3,14261 -2,58160 -2,86211 ,15370 -3,16387 -2,56035 1. Varianzen sind nicht gleich: Ergebnis des T-Tests in der Zeile "Varianzen sind nicht gleich„. 2. Hier: p-Wert = 0,00, d.h. der Mittelwertunterschied von 2,9 ist hoch signifikant (Irrtumswahrscheinlichkeit bei Ablehnung der Nullhypothese: kleiner als 0,1%). 3. Das 95% - Konfidenzintervall liegt zwischen –3,1 und –2,65. D.h. der Mittelwertunterschied zwischen Männern und Frauen liegt in der Grundgesamtheit (alle volljährigen Deutschen) vermutlich zwischen –3,1 und –2,65. 4. Box-Plots ***Boxplot Skalometer PDS nach Region. exa skalopds by region /plot boxplot /stat des. Statistiken Univariate Statistiken region Ost/West skalopds 0 West Mittelwert 95% Konfidenzintervall Untergrenze des Mittelwerts Obergrenze Statistik -2,6639 -2,7875 5% getrimmtes Mittel Median Varianz Standardabweichung Minimum Maximum Spannweite Interquartilbereich Schiefe Kurtosis Mittelwert 95% Konfidenzintervall Untergrenze des Mittelwerts Obergrenze -2,8955 -4,0000 7,776 2,78850 -5,00 5,00 10,00 5,00 ,892 -,412 ,1982 -,0773 5% getrimmtes Mittel Median Varianz Standardabweichung Minimum Maximum Spannweite Interquartilbereich Schiefe Kurtosis ,2202 1,0000 9,926 3,15061 -5,00 5,00 10,00 5,11 -,330 -1,015 1 Ost Standar dfehler ,06300 -2,5404 ,055 ,111 ,14020 ,4736 ,109 ,217 Irrtumswahrscheinlichkeit Irrtumswahrscheinlichk. Bedeutung Symbol P> 0,05 P<= 0,05 P<= 0,01 P<= 0,001 nicht signifikant signifikant sehr signifikant höchst signifikant n.s. * ** *** (>5%) (<= 5%) (<= 1%) (<= 0,1%)