Zusammenhangsmaße für ordinale Daten

Werbung
SoSe 06,
Statistik mit SPSS
29-06-06
Überblick Mehrfeldertabellen
1. Mehrfeldertabelle und Zusammenhangsmaße für nominale
Daten
2. Mehrfeldertabelle und Zusammenhangsmaße für ordinale
Daten
3. Metrische Daten in der Kreuztabelle
1. Mehrfeldertabellen, nominale Daten
********Beispiel 1: Kreuztabelle: recall x konfession.
***Rekodierung.
recode s03 (1=1) (2,3=2) (6=0) into konfession.
val lab konfession 1 'katholisch' 2 'evangelisch' 0 'konfessionslos'.
var lab konfession 'Konfessionszugehörigkeit'.
fre konfession recall.
cro recall by konfession
/cells col.
recall x konfession Kreuztabelle
recall * konfession Konfessionszugehörigkeit Kreuztabelle
% von konfession Konfessionszugehörigkeit
recall
Gesamt
1,00
2,00
3,00
4,00
5,00
7,00
konfession
Konfessionszugehörigkeit
,00
konfess
1,00
2,00
ionslos katholisch evangelisch Gesamt
SPD
38,0%
30,1%
46,0%
38,4%
CDU/CSU
20,7%
42,8%
29,1%
31,3%
Bd90/Die Gruenen
9,1%
7,5%
9,5%
8,7%
FDP
8,6%
12,5%
8,4%
9,8%
Die Linke.PDS
19,0%
3,7%
5,4%
8,6%
andere
4,6%
3,5%
1,6%
3,1%
100,0%
100,0%
100,0% 100,0%
Zusammenhangsmaße für nominale Daten
[/STATISTICS=[CHISQ][LAMBDA][BTAU][GAMMA][ETA ]]
[PHI ][UC
][CTAU][D
][CORR]
[CC
][KAPPA ][RISK][MCNEMAR] [CMH [(value)]]
[ALL ][NONE]
Zwei Arten von Zusammenhangsmaßen für nominale sind in SPSS
verfügbar:
1. Symmetrische Maße: Phi, Cramer‘s V und Kontigenzkoeffizient
(basieren auf dem Chisq – Konzept)
2. Richtungsmaße: Lambda, Unsicherheitskoeffizient und Goodman
und Kruskals Tau (basieren auf dem Konzept der proportionalen
Fehlerreduktion)
Zusammenhangsmaße für nominale Daten
********Beispiel 1: Kreuztabelle: recall x konfession.
Berechnet folgende Zusammenhangsmaße:
cro recall by konfession
Phi, Cramer‘s V (phi)
/cells col
Lambda, Tau (lambda)
/stat phi lambda cc uc.
Kontingenzkoeffizient (cc)
Unsicherheitskoeffizient (uc)
Symmetrische Maße
Symmetrische Maße
Nominal- bzgl.
Nominalmaß
Phi
Cramer-V
Kontingenzkoeffizient
Anzahl der gültigen Fälle
Asympto
tischer
Standard Näherung Näherungswei
a
b
Wert
fehler
sweises T se Signifikanz
,309
,000
,218
,000
,295
,000
1943
a. Die Null-Hyphothese wird nicht angenommen.
b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet.
Symmetrisches Zusammenhangsmaß,
Interpretation von Cramer‘s V erfolgt
analog zu Phi, d.h. Cramers‘ V = 2,18
= mittlerer Zusammenhang
Bei einer Irrtumwahrscheinlichkeit
von <= 5% (p<=0,05) wird die
Nullhypothese abgelehnt
Richtungsmaße
Richtungsmaße
Nominal- bzgl.
Nominalmaß
Lambda
Asympto
tischer
Standard Näherung Näherungswei
a
b
Wert
fehler
sweises T se Signifikanz
,102
,017
5,749
,000
,069
,018
3,806
,000
Symmetrisch
recall abhängig
konfession
Konfessionszugeh
,135
,022
5,737
örigkeit abhängig
Symmetrisch
InterpretationGoodman-und-Kruskalvon Lambda: Bei Kenntnis
der Konfessionszugehörigkeit lässt
Tau
recall abhängig
,024
,004
die Wahlabsicht mit einer um 6,9%
geringeren Fehlerquote
vorhersagen als
konfession
Kenntnis der Konfessionszugehörigkeit
Konfessionszugeh
,046
,007
örigkeit abhängig
Unsicherheitskoeffizient Symmetrisch
,035
,005
6,606
recall abhängig
,030
,005
6,606
konfession
Konfessionszugeh
,041
,006
6,606
örigkeit abhängig
a. Die Null-Hyphothese wird nicht angenommen.
b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet.
c. Basierend auf Chi-Quadrat-Näherung
d. Chi-Quadrat-Wahrscheinlichkeit für Likelihood-Quotienten.
,000
sich
,000 c
ohne
,000
c
,000 d
,000 d
,000
d
Besispiel 2: Kreuztabelle recall x geschlecht
****Beispiel 2: Kreuztabelle mit nominalen Daten: recall x geschlecht.
cro recall by geschlecht
/cells col sresid
Standardisierte Residuen
/stat chiq.
Berechnet dem Chiquadrat-Test
recall x geschlecht, Standardisierte Residuen
recall * geschlecht Geschlecht Kreuztabelle
recall
1,00 SPD
2,00
3,00
4,00
5,00
7,00
Gesamt
geschlecht
Geschlecht
0 Mann 1 Frau Gesamt
373,3
403,7
777,0
Erwartete Anzahl
% von geschlecht
41,3% 36,1%
Geschlecht
Standardisierte Residuen
1,3
-1,3
CDU/CSU
Erwartete Anzahl
303,6
328,4
% von geschlecht
27,4% 35,1%
Geschlecht
Standardisierte Residuen
-2,2
2,1
Bd90/Die Gruenen Erwartete Anzahl
85,5
92,5
% von geschlecht
7,5% 10,0%
Geschlecht
Standardisierte Residuen
-1,4
1,3
FDP
Erwartete Anzahl
93,2
100,8
% von geschlecht
9,9%
9,4%
Geschlecht
Standardisierte Residuen
,3
-,3
Die Linke.PDS
Erwartete Anzahl
81,7
88,3
% von geschlecht
9,8%
7,2%
Geschlecht
Standardisierte Residuen
1,5
-1,4
andere
Erwartete Anzahl
29,8
32,2
% von geschlecht
4,0%
2,2%
Geschlecht
Standardisierte Residuen
1,7
-1,6
Erwartete Anzahl
967,0 1046,0
% von geschlecht
100,0% 100,0%
Geschlecht
Standardisierte Residuen
38,6%
632,0
31,4%
178,0
8,8%
194,0
9,6%
170,0
8,4%
62,0
3,1%
2013,0
100,0%
Standardisierte Residuen:
<= -2 bzw. >= +2.
Die standardisierten
Residuen für die CDUWahl deuten auf überzufällige Abweichungen
von bei Unabhängigkeit
erwarteten Werten hin.
Chiquadrat-Test
Chi-Quadrat-Tests
Wert
a
Chi-Quadrat nach
26,225
Pearson
Kontinuitätskorrektur
Likelihood-Quotient
26,340
Zusammenhang
2,472
linear-mit-linear
Anzahl der gültigen Fälle
2013
Asymptotisch
e Signifikanz
(2-seitig)
df
5
,000
5
,000
1
,116
a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner
5. Die minimale erwartete Häufigkeit ist 29,78.
2. Mehrfeldertabellen für ordinale Daten
****Beispiel 3: Kreuztabelle mit ordinalen Daten: Schulbildung x Politisches
Interesse.
****Rekodierung.
fre s05.
recode s05 (2,3=1) (4=2) (5,6=3) into schule.
var lab schule 'Schulbildung, dreistufig'.
val lab schule 1 'wenig Schulbildung' 2 'mittlere Schulbildung' 3 'hohe
Schulbildung'.
fre schule f005.
cro f005 by schule
/cells col.
Zusammenhangsmaße für ordinale Daten
[/STATISTICS=[CHISQ][LAMBDA][BTAU][GAMMA][ETA ]]
[PHI ][UC
][CTAU][D
][CORR]
[CC
][KAPPA ][RISK][MCNEMAR] [CMH [(value)]]
[ALL ][NONE]
Folgende Zusammenhangsmaßen für ordinale sind in SPSS verfügbar:
1. Symmetrische Maße: Gamma, Tau B, Tau C
2. Richtungsmaß: Somers‘ d
Zusammenhangsmaße für ordinale Daten
****Beispiel 3: Kreuztabelle mit ordinalen Daten: Schulbildung x Politisches
Interesse.
Berechnet folgende Zusammenhangsmaße:
cro f005 by schule
Gamma (gamma)
/cells col
Somer‘s D (d)
/stat gamma d btau.
btau (btau)
Politisches Interesse x Schulbildung
f005 Staerke politisches Interesse * schule Schulbildung, dreistufig
Kreuztabelle
% von schule Schulbildung, dreistufig
f005 Staerke
politisches
Interesse
Gesamt
0
1
2
3
4
schule Schulbildung, dreistufig
1,00 wenig 2,00 mittlere
3,00 hohe
Schulbildung Schulbildung Schulbildung Gesamt
ueberhaupt nicht
7,9%
3,5%
1,4%
5,2%
wenig
20,0%
11,0%
3,9%
13,8%
mittel
43,5%
43,6%
36,0%
41,8%
ziemlich stark
19,9%
31,4%
35,1%
26,6%
sehr stark
8,8%
10,6%
23,5%
12,6%
100,0%
100,0%
100,0% 100,0%
Symmetrische Maße
Symmetrische Maße
Ordinal- bzgl.
Ordinalmaß
Kendall-Tau-b
Gamma
Anzahl der gültigen Fälle
Asympto
tischer
Standard Näherung Näherungswei
a
b
Wert
fehler
sweises T se Signifikanz
,269
,016
16,549
,000
,384
,022
16,549
,000
2513
a. Die Null-Hyphothese wird nicht angenommen.
b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet.
Richtungsmaße
Richtungsmaße
Ordinal- bzgl. Ordinalmaß Somers-d Symmetrisch
f005 Staerke politisches
Interesse abhängig
schule Schulbildung,
dreistufig abhängig
Asympto
tischer
Standard Näherung Näherungswei
a
b
Wert
fehler
sweises T se Signifikanz
,250
,016
15,129
,000
,268
,018
15,129
,000
,235
,015
15,129
,000
a. Die Null-Hyphothese wird nicht angenommen.
b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet.
Interpretation: Es besteht eine positive Beziehung, d.h. je höher die Schulbildung
ist, desto stärker ist das politische Interesse. Die Koeffizienten sind bei einer
Irrtumswahrscheinlichkeit von 5% signifikant.
3. Kreuztabelle und Korrelationskoeffizient für
metrische Daten
[/STATISTICS=[CHISQ][LAMBDA][BTAU][GAMMA][ETA ]]
[PHI ][UC
][CTAU][D
][CORR]
[CC
][KAPPA ][RISK][MCNEMAR] [CMH [(value)]]
[ALL ][NONE]
****Beispiel 4: Kreuztabelle mit metrischen Daten: Sympathie Merkel x
Links- Rechts-Selbsteinstufung.
cro f030 by f029_1
/cells col
/stat corr.
Berechnet Spearman‘s Rankorrelation (eig. für
ordinale Daten) und Pearson‘s r.
Sympathie Merkel x Links-RechtsSelbsteinstufung
f030 Links-Rechts-Selbsteinstufung * f029_1 Skalometer Schroeder Kreuztabelle
% von f029_1 Skalometer Schroeder
f029_1 Skalometer Schroeder
f030
Links-RechtsSelbsteinstufung
Gesamt
1 links
2
3
4
5
6
7
8
9
10
11 rechts
0 -5 halte
ueberhaupt
10 +5 halte
nichts von
sehr viel
ihm/ihr
1
2
3
4
5
6
7
8
9
von ihm/ihr Gesamt
5,1%
3,7%
1,9%
4,9%
3,6%
2,1%
2,2%
2,1%
3,0%
10,1%
3,5%
,9%
2,8%
1,6%
1,9%
2,9%
3,6%
4,7%
4,7%
2,6%
7,5%
5,0%
3,8%
4,7%
3,7%
2,3%
8,4%
6,9%
9,2%
5,8% 10,7% 15,0% 23,5%
18,8%
11,9%
3,4%
7,3%
3,1%
5,6%
8,8% 12,3%
8,9% 15,5% 20,4% 21,7%
13,3%
13,3%
7,7%
9,2% 13,3%
4,7% 10,8% 11,3% 17,8% 21,1% 20,9% 16,6%
22,0%
15,9%
37,0% 30,3% 24,2% 40,2% 34,3% 29,2% 38,2% 24,3% 21,8% 19,9%
20,2%
27,1%
12,8% 26,6% 18,8% 19,6% 12,7% 11,3% 12,0%
7,6%
7,0%
2,7%
2,8%
9,8%
11,1% 10,1% 12,5% 12,1% 12,7%
9,7%
4,7%
7,9%
5,6%
2,7%
5,5%
7,5%
11,5%
3,7% 17,2%
3,7%
3,9%
5,1%
3,7%
3,5%
3,8%
1,2%
,9%
4,7%
2,1%
6,3%
1,9%
2,0%
2,1%
1,0%
1,3%
,2%
,5%
1,2%
3,8%
2,8%
,8%
2,6%
1,0%
1,3%
,5%
1,2%
,9%
1,4%
100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
100,0% 100,0%
Bei vielen Ausprägungen der
Variablen wird die Kreuztabelle
schnell unübersichtlich.
Symmetrische Maße
Symmetrische Maße
Wert
Intervall- bzgl.
Intervallmaß
Pearson-R
Ordinal- bzgl.
Korrelation nach
Ordinalmaß
Spearman
Anzahl der gültigen Fälle
Asympto
tischer
Standard Näherung Näherungswei
a
b
fehler
sweises T se Signifikanz
-,327
,020
-16,814
,000
-,363
,019
-18,902
,000
c
c
2360
a. Die Null-Hyphothese wird nicht angenommen.
b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet.
c. Basierend auf
Näherung
Interpretation:
Esnormaler
besteht
eine mittelstarke negative Beziehung, d.h. je rechter die
ideologische Selbsteinstufung, desto negativer die Bewertung von Schröder (bzw.
umgekehrt). Die Koeffizienten sind bei einer Irrtumswahrscheinlichkeit von 5%
signifikant.
Symmetrische Maße
Faustregeln für Korrelationen bei sozialwiss. Datenanalysen
<=
0,05
> 0,05 und < 0,2
> 0,2 und < 0,5
> 0,5 und < 0,7
>=
0,7
zu vernachlässigen
gering
mittel
hoch
sehr hoch
 Werte gelten für den positiven und negativen Bereich
Herunterladen