R.Niketta Deskriptivstatistik Univariate Kennwerte mit SPSS In diesem Paper wird beschrieben, wie eindimensionale Tabellen und Kennwerte mit SPSS erzeugt werden. Eine Herleitung der Kennwerte und eine inhaltliche Interpretation der Ergebnisse ist nicht intendiert. Anmerkung: Die Beispiele sind der Datei „POKIV_Terror_V13.SAV“ entnommen. Fragebogen und Codeplan stehen im Aktenordner im CIP-Pool. Alle Datenanalysen werden über „Analysieren“ aufgerufen. Nominalskalenniveau Auf Nominalskalenniveau können Tabellen (Häufigkeiten, Prozente) erzeugt werden. Als Kennwert kann der Modus bestimmt werden. Diese Tabellen werden über „Deskriptive Statistiken“ -à „Häufigkeiten“ aufgerufen. Beispiel: Es sollen die Häufigkeiten von F41 (Familienstand), F42 (höchster allgemeiner Schulabschluss) und der neu erzeugten Variablen F41dicho berechnet werden. R.Niketta Deskriptivstatistik Die betreffenden Variablen werden im linken Feld markiert und über den Pfeil in das rechte Feld transportiert. Auch hier können Sie über „OK“ sofort berechnen lassen oder Sie können den Befehl in das Syntaxfenster übertragen. FREQUENCIES VARIABLES=f41 f42 f42dicho /ORDER= ANALYSIS . Die Originaltabellen sehen wie folgt aus: Häufigkeiten Statistiken N Gültig Fehlend f41 Welchen Familienstand haben Sie? 354 6 f42 Welchen höchsten allgemeinen Schulabschl uss 348 12 f42dicho Schulabs chluss (dichotom isiert) 339 21 Häufigkeitstabelle SPSS_Beispiel_Kennwerte.doc 2 R.Niketta Deskriptivstatistik f41 Welchen Familienstand haben Sie? Häufigkeit Gültig Fehlend Gesamt 1.00 Ich bin verheiratet und lebe 2.00 Ich bin verheiratet und lebe 3.00 Ich bin ledig 4.00 Ich bin geschieden 5.00 Ich bin verwitwet Gesamt 9.00 keine Angabe Gültige Prozente Prozent Kumulierte Prozente 91 25.3 25.7 25.7 7 1.9 2.0 27.7 241 9 6 354 6 360 66.9 2.5 1.7 98.3 1.7 100.0 68.1 2.5 1.7 100.0 95.8 98.3 100.0 f42 Welchen höchsten allgemeinen Schulabschluss Häufigkeit Gültig Fehlend Gesamt 2.00 Hauptschulabschluss ( Volksschulabschluss) 3.00 Realschulabschluss (mittlere 4.00 Abschluss der Polytechnischen 5.00 Fachhochschulreife 6.00 Allg. oder fachgebundene Fachschulreife 7.00 Anderer Abschluss Gesamt 9.00 keine Angabe Gültige Prozente Prozent Kumulierte Prozente 23 6.4 6.6 6.6 60 16.7 17.2 23.9 3 .8 .9 24.7 37 10.3 10.6 35.3 216 60.0 62.1 97.4 9 348 12 360 2.5 96.7 3.3 100.0 2.6 100.0 100.0 f42dicho Schulabschluss (dichotomisiert) Häufigkeit Gültig Fehlend Gesamt 1.00 keine Hochschulreife 2.00 Hochschulreife Gesamt System Prozent Gültige Prozente Kumulierte Prozente 123 34.2 36.3 36.3 216 339 21 360 60.0 94.2 5.8 100.0 63.7 100.0 100.0 Der Modus muss nicht extra berechnet werden, es ist direkt aus den Tabellen ablesbar, da er die Kategorie mit den höchsten Werten ist. Beim Familienstand ist es die Kategorie „ledig“, beim Schulabschluss die Hochschulreife. Bei der dichotomisierten Variablen kann gut die Wirkung der Kategorienzusammenfassung gesehen werden. SPSS_Beispiel_Kennwerte.doc 3 R.Niketta Deskriptivstatistik Über die Optionen „Diagramme“ und „Format“ können Sie zusätzlich Balkendiagramme und Änderungen in der Reihenfolge der Kategorien erzeugen. Ordinalskalenniveau Zusätzlich zu den Häufigkeiten und dem Modus, können der Median und der Interquartilsabstand berechnet werden. Im Grunde haben wir es bei der Variablen „Schulabschluss“ auch schon mit einer ordinal skalierten Variablen zu tun, wenn die Kategorie „anderer Abschluss“ nicht berücksichtigt wird. Beispiel: Neben dem Schulabschluss sollen die Kennwerte der Frage 21 („In welchem Umfang beeinflusst unsere Kultur andere Völker?“) berechnet werden. f21 Unsere Kultur beeinflusst andere Völker Gültig Fehlend Gesamt 1.00 sehr stark 2.00 nicht so stark 3.00 kaum 4.00 überhaupt nicht 5.00 kann ich nicht beantworten Gesamt 9.00 keine Angabe Häufigkeit 45 136 116 17 Prozent 12.5 37.8 32.2 4.7 Gültige Prozente 12.9 39.0 33.2 4.9 Kumulierte Prozente 12.9 51.9 85.1 90.0 35 9.7 10.0 100.0 349 11 360 96.9 3.1 100.0 100.0 Ein erster Blick auf die Tabelle zeigt, dass die Kategorie 5 „kann ich nicht beantworten“ aus der Analyse entfernt werden muss, wenn es sich um Ordinalskalenniveau handelt. Es wird der Wert ‚5‘ auf „missing“ gesetzt. In diesem Fall können Sie in dieselbe Variable umkodieren. Der neue Wert ist ‚9‘, da dieser Wert der Code für einen fehlenden Wert ist. Alternativ können Sie den Wert auch im Variablenansichtsfenster als zusätzlichen Missingwert definieren. Die Berechnung des Median kann mit zwei Prozeduren geschehen: SPSS_Beispiel_Kennwerte.doc 4 R.Niketta Deskriptivstatistik 1.) Wieder über „Deskriptive Statistik“ -à „Häufigkeiten“. Sie tragen die Variable V21 ein und klicken dann auf „Statistik“ Hier rufen die den Median und die Quartile auf (Häkchen). Wenn Sie weiterhin die Häufigkeitstabelle wollen, sehen die Ergebnisse wie folgt aus: Häufigkeiten Statistiken f21 Unsere Kultur beeinflusst andere Völker N Gültig 314 Fehlend 46 Median 2.0000 Perzentile 25 2.0000 50 2.0000 75 3.0000 f21 Unsere Kultur beeinflusst andere Völker Gültig Fehlend Gesamt 1.00 sehr stark 2.00 nicht so stark 3.00 kaum 4.00 überhaupt nicht Gesamt 9.00 keine Angabe Häufigkeit 45 136 116 17 314 46 360 Prozent 12.5 37.8 32.2 4.7 87.2 12.8 100.0 Gültige Prozente 14.3 43.3 36.9 5.4 100.0 Kumulierte Prozente 14.3 57.6 94.6 100.0 Der Median ist 2, der IQR ergibt sich aus 3.Quartil – 1. Quartil, also = 1. SPSS_Beispiel_Kennwerte.doc 5 R.Niketta Deskriptivstatistik 2) Sie analysieren über „explorative Datenanalyse“ Wie immer markieren Sie die Variable V21 im Variablenfenster, die über den Pfeil in das Fenster „Abhängige Variablen“ geschoben wird. Sie können auch schon den Box-Plot aufrufen: Klicken Sie auf „Diagramme“, es öffnet sich ein neues Fenster, entfernen Sie hier das Häkchen von „Stengel-Blatt“. Dann „Weiter“ und „OK“. Die Ergebnistabelle zeigt mehrere Kennwerte, von denen nur die fett markierten Kennwerte für Ordinalskalenniveau gültig sind. SPSS_Beispiel_Kennwerte.doc 6 R.Niketta Deskriptivstatistik Univariate Statistiken f21 Unsere Kultur beeinflusst andere Völker Mittelwert 95% Konfidenzintervall des Mittelwerts Untergrenze Obergrenze 5% getrimmtes Mittel Statistik 2.3344 2.2470 2.4218 2.3160 2.0000 .619 .78705 1.00 4.00 3.00 1.00 .005 -.500 Median Varianz Standardabweichung Minimum Maximum Spannweite Interquartilbereich Schiefe Kurtosis Standardf ehler .04442 .138 .274 Der Box-Plot selbst ist nicht sehr aussagekräftig, man kann aber erkennen, dass 50 % und mehr aller Fälle im Bereich zwischen 2 und 3 liegen, mindestens 50 % der Fälle die Werte 1 und 2 angekreuzt haben. 4,00 3,50 3,00 2,50 2,00 1,50 1,00 Unsere Kultur beeinflusst andere Völker Metrisches Skalenniveau Auf metrischem Skalenniveau kommen noch die Kennwerte arithmetischer Mittelwert und Standardabweichung hinzu. Beispiel: Wir wollen uns die Kennwerte der drei Subskalen „Angst vor terroristischen Bedrohungen“, „Terrorpersistenz“ und „Reiseangst wg. Terror“ anschauen. Auch diese Kennwerte können Sie über „Deskriptive Statistiken“ -à „Häufigkeiten“ erhalten. SPSS_Beispiel_Kennwerte.doc 7 R.Niketta Deskriptivstatistik Über „Statistik“ kommen Sie in das Kennwertefenster, in dem Sie wie in der Abbildung gezeigt die Häkchen setzen. Bevor Sie auf „OK“ klicken, sollten die Anzeige der eigentlich überflüssigen Häufigkeitstabelle ausschalten, indem Sie das Häkchen entfernen. Die Ergebnisse der nicht redigierten Tabelle sehen wie folgt aus: Statistiken N Gültig Fehlend Mittelwert Median Modus Standardabweichung Varianz Schiefe Standardfehler der Schiefe atb_skal Angst vor terroristischen Bedrohungen 355 5 2.4691 2.3846 1.62 1.02362 1.048 .749 terrpers Terrorper sistenz 355 5 4.1571 4.1667 4.17 .91396 .835 -.175 reiseang Reiseangst wg. Terrorismus 345 15 4.2319 4.2500 4.50 .97788 .956 -.576 .129 .129 .131 .132 .097 .260 .258 .258 .262 4.69 1.00 5.69 1.6154 2.3846 3.0769 4.67 1.33 6.00 3.6000 4.1667 4.8333 5.00 1.00 6.00 3.7500 4.2500 5.0000 Kurtosis Standardfehler der Kurtosis Spannweite Minimum Maximum Perzentile 25 50 75 Sie können über diese Prozedur auch Histogramme aufrufen: SPSS_Beispiel_Kennwerte.doc 8 R.Niketta Deskriptivstatistik Beispiel: ATB-Skala Angst vor terroristischen Bedrohungen Das Histogramm der ATB-Skala zeigt eine linkssteile Verteilung, die sich auch im Schiefemaß 0.749 zeigt. 40 Häufigkeit 30 20 10 Mean = 2,4691 Std. Dev. = 1,02362 N = 355 0 1,00 2,00 3,00 4,00 5,00 6,00 Angst vor terroristischen Bedrohungen 2) Sie können diese Kennwerte auch über die schon gezeigte Prozedur „Explorative Datenanalyse“ aufrufen. 3) Beim Vergleich von mehreren Variablen ist die Prozedur „Deskriptive Statistiken“ auch günstig, da hier die Variablen in einer Tabelle zusammengefasst werden und auch z-Werte berechnet werden können. SPSS_Beispiel_Kennwerte.doc 9 R.Niketta Deskriptivstatistik Sie setzen ein Häkchen für die Speicherung der z-Werte (standardisierte Werte) und über „Optionen“ klicken Sie neben der Voreinstellung Mittelwert, Standardabweichung, Minimum und Maximum auch die Anzeigenreihenfolge „Absteigende Mittelwerte“ an. Hierdurch werden die drei Variablen in ihrer Reihenfolge geordnet. Deskriptive Statistik Minimum Maximum Mittelwert Standardab weichung 345 1.00 6.00 4.2319 .97788 355 1.33 6.00 4.1571 .91396 357 2.25 5.00 4.0157 .56187 N reiseang Reiseangst wg. Terrorismus terrpers Terrorpersistenz pazifism Pazifismus (Ablehnung von Kriegen) Gültige Werte (Listenweise) 343 Die unredigierte Tabelle zeigt die Skalen gemäß der Höhe ihrer Mittelwerte an. Auch können Sie sehen, dass nur bei 343 Personen alle Skalenwerte vorgelegen haben. Die z-Werte werden als drei neue Variablen an die Datenmatrix angehängt. SPSS_Beispiel_Kennwerte.doc 10