2x2 Kreuztabellen: Zeilenprozente

Werbung
SoSe 06,
Statistik mit SPSS
22-06-06
Überblick Kreuztabellen
1. Ziel der Kreuztabellierung
2. Übersicht CROSSTABS - Syntax
3. 2x2 Kreuztabellen
-
Kontingenztabelle: Absolute Häufigkeiten
-
Kontingenztabelle: Spaltenprozente
-
Kontingenztabelle: Zeilenprozente
-
Indifferenztabelle
4. Tests und Zusammenhangsmaße
1. Ziel der Kreuztabellierung
 In einer Kreutabelle wird die gemeinsame Verteilung zweier (oder auch
mehrerer) Variablen angegeben. Damit können Zusammenhänge zwischen
nominalskalierten Variablen (bzw. ordinalen/ metrischen Variablen mit wenigen
Ausprägungen) dargestellt werden.
 Mit SPSS können zwei- und mehrdimensionale Kreuztabellen erstellt und div.
Tests und Zusammenhangsmaße berechnet werden. Ausserdem können Balkendiagramme erstellt werden.
 Typische Fragestellungen:
• Welche Zusammenhänge sind zu erkennen?
• In welche Richtung gehen die Zusammenhänge?
• Wie stark sind die Zusammenhänge?
• Sind die Zusammenhänge signifikant?
2. Übersicht CROSSTABS - Syntax
3. 2x2 Kreuztabellen: absolute Häufigkeiten
****Beispiel 1: Kreuztabelle mit absoluten Häufigkeiten:
Kanzlerpräferenz x Region .
recode f021 (1=1) (2=2) into kanzpräf.
val lab kanzpräf 1 'Gerhard Schröder' 2 'Angela Merkel'.
Zeilenvariable (AV)
cross kanzpräf by region.
Spaltenvariable (UV)
kanzpräf * region Ost/West Kreuztabelle
Anzahl
region
Ost/West
0 West 1 Ost Gesamt
kanzpräf 1,00 Gerhard Schröder
728
367
1095
2,00 Angela Merkel
519
198
717
Gesamt
1247
565
1812
2x2 Kreuztabellen: Spaltenprozente
****Zusätzlich Spaltenprozente ausgeben.
cross kanzpräf by region
/cells count column.
Zusätzlich werden die
Spaltenprozente ausgegeben
Die Spaltenprozente sind die bedingten relativen Häufigkeiten der
Zeilenvariable bezüglich der Spaltenvariable
Interpretation der Kreuztabelle: Spaltenprozente
abhängige Variable in der
Zeile, Zeilenvariable
Unabhängige Variable im
Tabellenkopf, Spaltenvariable
kanzpräf * region Ost/West Kreuztabelle
region Ost/West
0 West 1 Ost Gesamt
kanzpräf 1,00 Gerhard Schröder Anzahl
728
367
1095
% von region Ost/West 58,4% 65,0%
60,4%
2,00 Angela Merkel
Anzahl
519
198
717
% von region Ost/West 41,6% 35,0%
39,6%
Gesamt
Anzahl
1247
565
1812
% von region Ost/West 100,0% 100,0% 100,0%
Zusammenhänge zwischen den Variablen lassen sich aufdecken, indem man die Prozentwerte der Zeilen vergleicht. Man vergleicht also die bedingten relativen Häufigkeiten der
Zeilenvariable bezüglich der Spaltenvariable (spaltenweise Prozentuierung).
Anhand der Spaltenprozente betrachtet man den Zusammenhang zwischen beiden
Variablen aus der Perspektive der Spaltenvariable - der Region: Von den Befragten, die
aus dem Westen kommen, präferieren 41,6% Angela Merkel. Von den Befragten, die aus
dem Osten kommen, präferieren jedoch nur 35% Merkel.
2x2 Kreuztabellen: Zeilenprozente
****Zusätzlich Zeilenrrozente ausgeben.
cross kanzpräf by region
/cells count row
Zusätzlich werden die Zeilenprozente
ausgegeben
Die Zeilenprozente sind die bedingten relativen Häufigkeiten der
Spaltenvariable bezüglich der Zeilenvariable
Interpretation der Kreuztabelle: Zeilenprozente
kanzpräf * region Ost/West Kreuztabelle
region
Ost/West
0 West 1 Ost Gesamt
kanzpräf 1,00 Gerhard Schröder Anzahl
728
367
1095
% von kanzpräf
66,5% 33,5% 100,0%
2,00 Angela Merkel
Anzahl
519
198
717
% von kanzpräf
72,4% 27,6% 100,0%
Gesamt
Anzahl
1247
565
1812
% von kanzpräf
68,8% 31,2% 100,0%
Anhand der Zeilenprozente betrachtet man den Zusammenhang zwischen beiden
Variablen aus der Perspektive der Zeilenvariable - der Kanzlerpräferenz: Von allen
Befragten, die Schröder präferieren, kommen 66,5 aus dem Westen. Von allen
Befragten, die Merkel präferieren, kommen 72,4% aus dem Westen - also 5,9%
mehr.
Indifferenztabelle: erwartete Häufigkeiten bei
Unabhängigkeit
****Indifferenztabelle
cross kanzpräf by region
/cells count expected.
Es werden neben den beobachteten auch die
erwarteten Häufigkeiten ausgegeben
Indifferenztabelle: erwartete Häufigkeiten bei
Unabhängigkeit
kanzpräf * region Ost/West Kreuztabelle
region
Ost/West
0 West 1 Ost Gesamt
kanzpräf 1,00 Gerhard Schröder Anzahl
898
220
1118
Erwartete Anzahl
915,2 202,8
1118,0
2,00 Angela Merkel
Anzahl
614
115
729
Erwartete Anzahl
596,8 132,2
729,0
Gesamt
Anzahl
1512
335
1847
Erwartete Anzahl 1512,0 335,0
1847,0
220 Befragte aus Ostdeutschland präferieren Gerhard Schröder. Die bei
Unabhängigkeit erwartete Anzahl liegt bei 202,8 Fällen.
Unterbefehl „Cells“
CROSSTABS [TABLES=]varlist BY varlist [BY...]
[/varlist...]
[/CELLS=[COUNT**][ROW
][EXPECTED][SRESID ]]
[COLUMN][RESID
][ASRESID]
[TOTAL ][ALL
][NONE
]
4. Tests und Zusammenhangsmaße
[/STATISTICS=[CHISQ][LAMBDA][BTAU][GAMMA][ETA ]]
[PHI ][UC
][CTAU][D
][CORR]
[CC
][KAPPA ][RISK][MCNEMAR] [CMH [(value)]]
[ALL ][NONE]
***Zusammenhangsmaß phi.
cross kanzpräf by region
/cells count column
/stat phi.
Zusammenhangsmaß Phi
Symmetrische Maße
Nominal- bzgl.
Nominalmaß
Phi
Cramer-V
Anzahl der gültigen Fälle
Asympto
tischer
Standard Näherung Näherungswei
a
b
Wert
fehler
sweises T se Signifikanz
-,050
,033
,050
,033
1847
a. Die Null-Hyphothese wird nicht angenommen.
b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet.
Symmetrisches Zusammenhangsmaß
Phi = -0,5: geringer Zusammenhang
Bei einer Irrtumwahrscheinlichkeit
von <= 5% (p<=0,05) wird die
Nullhypothese abgelehnt
Irrtumswahrscheinlichk.
Bedeutung
Symbol
P> 0,05
P<= 0,05
P<= 0,01
P<= 0,001
nicht signifikant
signifikant
sehr signifikant
höchst signifikant
n.s.
*
**
***
(>5%)
(<= 5%)
(<= 1%)
(<= 0,1%)
Weitere Beispiele für 2x2 Kreuztabellen in der
Datei „Kreuztabellen.sps“
Herunterladen