SoSe 06, Statistik mit SPSS 22-06-06 Überblick Kreuztabellen 1. Ziel der Kreuztabellierung 2. Übersicht CROSSTABS - Syntax 3. 2x2 Kreuztabellen - Kontingenztabelle: Absolute Häufigkeiten - Kontingenztabelle: Spaltenprozente - Kontingenztabelle: Zeilenprozente - Indifferenztabelle 4. Tests und Zusammenhangsmaße 1. Ziel der Kreuztabellierung In einer Kreutabelle wird die gemeinsame Verteilung zweier (oder auch mehrerer) Variablen angegeben. Damit können Zusammenhänge zwischen nominalskalierten Variablen (bzw. ordinalen/ metrischen Variablen mit wenigen Ausprägungen) dargestellt werden. Mit SPSS können zwei- und mehrdimensionale Kreuztabellen erstellt und div. Tests und Zusammenhangsmaße berechnet werden. Ausserdem können Balkendiagramme erstellt werden. Typische Fragestellungen: • Welche Zusammenhänge sind zu erkennen? • In welche Richtung gehen die Zusammenhänge? • Wie stark sind die Zusammenhänge? • Sind die Zusammenhänge signifikant? 2. Übersicht CROSSTABS - Syntax 3. 2x2 Kreuztabellen: absolute Häufigkeiten ****Beispiel 1: Kreuztabelle mit absoluten Häufigkeiten: Kanzlerpräferenz x Region . recode f021 (1=1) (2=2) into kanzpräf. val lab kanzpräf 1 'Gerhard Schröder' 2 'Angela Merkel'. Zeilenvariable (AV) cross kanzpräf by region. Spaltenvariable (UV) kanzpräf * region Ost/West Kreuztabelle Anzahl region Ost/West 0 West 1 Ost Gesamt kanzpräf 1,00 Gerhard Schröder 728 367 1095 2,00 Angela Merkel 519 198 717 Gesamt 1247 565 1812 2x2 Kreuztabellen: Spaltenprozente ****Zusätzlich Spaltenprozente ausgeben. cross kanzpräf by region /cells count column. Zusätzlich werden die Spaltenprozente ausgegeben Die Spaltenprozente sind die bedingten relativen Häufigkeiten der Zeilenvariable bezüglich der Spaltenvariable Interpretation der Kreuztabelle: Spaltenprozente abhängige Variable in der Zeile, Zeilenvariable Unabhängige Variable im Tabellenkopf, Spaltenvariable kanzpräf * region Ost/West Kreuztabelle region Ost/West 0 West 1 Ost Gesamt kanzpräf 1,00 Gerhard Schröder Anzahl 728 367 1095 % von region Ost/West 58,4% 65,0% 60,4% 2,00 Angela Merkel Anzahl 519 198 717 % von region Ost/West 41,6% 35,0% 39,6% Gesamt Anzahl 1247 565 1812 % von region Ost/West 100,0% 100,0% 100,0% Zusammenhänge zwischen den Variablen lassen sich aufdecken, indem man die Prozentwerte der Zeilen vergleicht. Man vergleicht also die bedingten relativen Häufigkeiten der Zeilenvariable bezüglich der Spaltenvariable (spaltenweise Prozentuierung). Anhand der Spaltenprozente betrachtet man den Zusammenhang zwischen beiden Variablen aus der Perspektive der Spaltenvariable - der Region: Von den Befragten, die aus dem Westen kommen, präferieren 41,6% Angela Merkel. Von den Befragten, die aus dem Osten kommen, präferieren jedoch nur 35% Merkel. 2x2 Kreuztabellen: Zeilenprozente ****Zusätzlich Zeilenrrozente ausgeben. cross kanzpräf by region /cells count row Zusätzlich werden die Zeilenprozente ausgegeben Die Zeilenprozente sind die bedingten relativen Häufigkeiten der Spaltenvariable bezüglich der Zeilenvariable Interpretation der Kreuztabelle: Zeilenprozente kanzpräf * region Ost/West Kreuztabelle region Ost/West 0 West 1 Ost Gesamt kanzpräf 1,00 Gerhard Schröder Anzahl 728 367 1095 % von kanzpräf 66,5% 33,5% 100,0% 2,00 Angela Merkel Anzahl 519 198 717 % von kanzpräf 72,4% 27,6% 100,0% Gesamt Anzahl 1247 565 1812 % von kanzpräf 68,8% 31,2% 100,0% Anhand der Zeilenprozente betrachtet man den Zusammenhang zwischen beiden Variablen aus der Perspektive der Zeilenvariable - der Kanzlerpräferenz: Von allen Befragten, die Schröder präferieren, kommen 66,5 aus dem Westen. Von allen Befragten, die Merkel präferieren, kommen 72,4% aus dem Westen - also 5,9% mehr. Indifferenztabelle: erwartete Häufigkeiten bei Unabhängigkeit ****Indifferenztabelle cross kanzpräf by region /cells count expected. Es werden neben den beobachteten auch die erwarteten Häufigkeiten ausgegeben Indifferenztabelle: erwartete Häufigkeiten bei Unabhängigkeit kanzpräf * region Ost/West Kreuztabelle region Ost/West 0 West 1 Ost Gesamt kanzpräf 1,00 Gerhard Schröder Anzahl 898 220 1118 Erwartete Anzahl 915,2 202,8 1118,0 2,00 Angela Merkel Anzahl 614 115 729 Erwartete Anzahl 596,8 132,2 729,0 Gesamt Anzahl 1512 335 1847 Erwartete Anzahl 1512,0 335,0 1847,0 220 Befragte aus Ostdeutschland präferieren Gerhard Schröder. Die bei Unabhängigkeit erwartete Anzahl liegt bei 202,8 Fällen. Unterbefehl „Cells“ CROSSTABS [TABLES=]varlist BY varlist [BY...] [/varlist...] [/CELLS=[COUNT**][ROW ][EXPECTED][SRESID ]] [COLUMN][RESID ][ASRESID] [TOTAL ][ALL ][NONE ] 4. Tests und Zusammenhangsmaße [/STATISTICS=[CHISQ][LAMBDA][BTAU][GAMMA][ETA ]] [PHI ][UC ][CTAU][D ][CORR] [CC ][KAPPA ][RISK][MCNEMAR] [CMH [(value)]] [ALL ][NONE] ***Zusammenhangsmaß phi. cross kanzpräf by region /cells count column /stat phi. Zusammenhangsmaß Phi Symmetrische Maße Nominal- bzgl. Nominalmaß Phi Cramer-V Anzahl der gültigen Fälle Asympto tischer Standard Näherung Näherungswei a b Wert fehler sweises T se Signifikanz -,050 ,033 ,050 ,033 1847 a. Die Null-Hyphothese wird nicht angenommen. b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. Symmetrisches Zusammenhangsmaß Phi = -0,5: geringer Zusammenhang Bei einer Irrtumwahrscheinlichkeit von <= 5% (p<=0,05) wird die Nullhypothese abgelehnt Irrtumswahrscheinlichk. Bedeutung Symbol P> 0,05 P<= 0,05 P<= 0,01 P<= 0,001 nicht signifikant signifikant sehr signifikant höchst signifikant n.s. * ** *** (>5%) (<= 5%) (<= 1%) (<= 0,1%) Weitere Beispiele für 2x2 Kreuztabellen in der Datei „Kreuztabellen.sps“