SoSe 06, Statistik mit SPSS 29-06-06 Überblick Mehrfeldertabellen 1. Mehrfeldertabelle und Zusammenhangsmaße für nominale Daten 2. Mehrfeldertabelle und Zusammenhangsmaße für ordinale Daten 3. Metrische Daten in der Kreuztabelle 1. Mehrfeldertabellen, nominale Daten ********Beispiel 1: Kreuztabelle: recall x konfession. ***Rekodierung. recode s03 (1=1) (2,3=2) (6=0) into konfession. val lab konfession 1 'katholisch' 2 'evangelisch' 0 'konfessionslos'. var lab konfession 'Konfessionszugehörigkeit'. fre konfession recall. cro recall by konfession /cells col. recall x konfession Kreuztabelle recall * konfession Konfessionszugehörigkeit Kreuztabelle % von konfession Konfessionszugehörigkeit recall Gesamt 1,00 2,00 3,00 4,00 5,00 7,00 konfession Konfessionszugehörigkeit ,00 konfess 1,00 2,00 ionslos katholisch evangelisch Gesamt SPD 38,0% 30,1% 46,0% 38,4% CDU/CSU 20,7% 42,8% 29,1% 31,3% Bd90/Die Gruenen 9,1% 7,5% 9,5% 8,7% FDP 8,6% 12,5% 8,4% 9,8% Die Linke.PDS 19,0% 3,7% 5,4% 8,6% andere 4,6% 3,5% 1,6% 3,1% 100,0% 100,0% 100,0% 100,0% Zusammenhangsmaße für nominale Daten [/STATISTICS=[CHISQ][LAMBDA][BTAU][GAMMA][ETA ]] [PHI ][UC ][CTAU][D ][CORR] [CC ][KAPPA ][RISK][MCNEMAR] [CMH [(value)]] [ALL ][NONE] Zwei Arten von Zusammenhangsmaßen für nominale sind in SPSS verfügbar: 1. Symmetrische Maße: Phi, Cramer‘s V und Kontigenzkoeffizient (basieren auf dem Chisq – Konzept) 2. Richtungsmaße: Lambda, Unsicherheitskoeffizient und Goodman und Kruskals Tau (basieren auf dem Konzept der proportionalen Fehlerreduktion) Zusammenhangsmaße für nominale Daten ********Beispiel 1: Kreuztabelle: recall x konfession. Berechnet folgende Zusammenhangsmaße: cro recall by konfession Phi, Cramer‘s V (phi) /cells col Lambda, Tau (lambda) /stat phi lambda cc uc. Kontingenzkoeffizient (cc) Unsicherheitskoeffizient (uc) Symmetrische Maße Symmetrische Maße Nominal- bzgl. Nominalmaß Phi Cramer-V Kontingenzkoeffizient Anzahl der gültigen Fälle Asympto tischer Standard Näherung Näherungswei a b Wert fehler sweises T se Signifikanz ,309 ,000 ,218 ,000 ,295 ,000 1943 a. Die Null-Hyphothese wird nicht angenommen. b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. Symmetrisches Zusammenhangsmaß, Interpretation von Cramer‘s V erfolgt analog zu Phi, d.h. Cramers‘ V = 2,18 = mittlerer Zusammenhang Bei einer Irrtumwahrscheinlichkeit von <= 5% (p<=0,05) wird die Nullhypothese abgelehnt Richtungsmaße Richtungsmaße Nominal- bzgl. Nominalmaß Lambda Asympto tischer Standard Näherung Näherungswei a b Wert fehler sweises T se Signifikanz ,102 ,017 5,749 ,000 ,069 ,018 3,806 ,000 Symmetrisch recall abhängig konfession Konfessionszugeh ,135 ,022 5,737 örigkeit abhängig Symmetrisch InterpretationGoodman-und-Kruskalvon Lambda: Bei Kenntnis der Konfessionszugehörigkeit lässt Tau recall abhängig ,024 ,004 die Wahlabsicht mit einer um 6,9% geringeren Fehlerquote vorhersagen als konfession Kenntnis der Konfessionszugehörigkeit Konfessionszugeh ,046 ,007 örigkeit abhängig Unsicherheitskoeffizient Symmetrisch ,035 ,005 6,606 recall abhängig ,030 ,005 6,606 konfession Konfessionszugeh ,041 ,006 6,606 örigkeit abhängig a. Die Null-Hyphothese wird nicht angenommen. b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. c. Basierend auf Chi-Quadrat-Näherung d. Chi-Quadrat-Wahrscheinlichkeit für Likelihood-Quotienten. ,000 sich ,000 c ohne ,000 c ,000 d ,000 d ,000 d Besispiel 2: Kreuztabelle recall x geschlecht ****Beispiel 2: Kreuztabelle mit nominalen Daten: recall x geschlecht. cro recall by geschlecht /cells col sresid Standardisierte Residuen /stat chiq. Berechnet dem Chiquadrat-Test recall x geschlecht, Standardisierte Residuen recall * geschlecht Geschlecht Kreuztabelle recall 1,00 SPD 2,00 3,00 4,00 5,00 7,00 Gesamt geschlecht Geschlecht 0 Mann 1 Frau Gesamt 373,3 403,7 777,0 Erwartete Anzahl % von geschlecht 41,3% 36,1% Geschlecht Standardisierte Residuen 1,3 -1,3 CDU/CSU Erwartete Anzahl 303,6 328,4 % von geschlecht 27,4% 35,1% Geschlecht Standardisierte Residuen -2,2 2,1 Bd90/Die Gruenen Erwartete Anzahl 85,5 92,5 % von geschlecht 7,5% 10,0% Geschlecht Standardisierte Residuen -1,4 1,3 FDP Erwartete Anzahl 93,2 100,8 % von geschlecht 9,9% 9,4% Geschlecht Standardisierte Residuen ,3 -,3 Die Linke.PDS Erwartete Anzahl 81,7 88,3 % von geschlecht 9,8% 7,2% Geschlecht Standardisierte Residuen 1,5 -1,4 andere Erwartete Anzahl 29,8 32,2 % von geschlecht 4,0% 2,2% Geschlecht Standardisierte Residuen 1,7 -1,6 Erwartete Anzahl 967,0 1046,0 % von geschlecht 100,0% 100,0% Geschlecht Standardisierte Residuen 38,6% 632,0 31,4% 178,0 8,8% 194,0 9,6% 170,0 8,4% 62,0 3,1% 2013,0 100,0% Standardisierte Residuen: <= -2 bzw. >= +2. Die standardisierten Residuen für die CDUWahl deuten auf überzufällige Abweichungen von bei Unabhängigkeit erwarteten Werten hin. Chiquadrat-Test Chi-Quadrat-Tests Wert a Chi-Quadrat nach 26,225 Pearson Kontinuitätskorrektur Likelihood-Quotient 26,340 Zusammenhang 2,472 linear-mit-linear Anzahl der gültigen Fälle 2013 Asymptotisch e Signifikanz (2-seitig) df 5 ,000 5 ,000 1 ,116 a. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 29,78. 2. Mehrfeldertabellen für ordinale Daten ****Beispiel 3: Kreuztabelle mit ordinalen Daten: Schulbildung x Politisches Interesse. ****Rekodierung. fre s05. recode s05 (2,3=1) (4=2) (5,6=3) into schule. var lab schule 'Schulbildung, dreistufig'. val lab schule 1 'wenig Schulbildung' 2 'mittlere Schulbildung' 3 'hohe Schulbildung'. fre schule f005. cro f005 by schule /cells col. Zusammenhangsmaße für ordinale Daten [/STATISTICS=[CHISQ][LAMBDA][BTAU][GAMMA][ETA ]] [PHI ][UC ][CTAU][D ][CORR] [CC ][KAPPA ][RISK][MCNEMAR] [CMH [(value)]] [ALL ][NONE] Folgende Zusammenhangsmaßen für ordinale sind in SPSS verfügbar: 1. Symmetrische Maße: Gamma, Tau B, Tau C 2. Richtungsmaß: Somers‘ d Zusammenhangsmaße für ordinale Daten ****Beispiel 3: Kreuztabelle mit ordinalen Daten: Schulbildung x Politisches Interesse. Berechnet folgende Zusammenhangsmaße: cro f005 by schule Gamma (gamma) /cells col Somer‘s D (d) /stat gamma d btau. btau (btau) Politisches Interesse x Schulbildung f005 Staerke politisches Interesse * schule Schulbildung, dreistufig Kreuztabelle % von schule Schulbildung, dreistufig f005 Staerke politisches Interesse Gesamt 0 1 2 3 4 schule Schulbildung, dreistufig 1,00 wenig 2,00 mittlere 3,00 hohe Schulbildung Schulbildung Schulbildung Gesamt ueberhaupt nicht 7,9% 3,5% 1,4% 5,2% wenig 20,0% 11,0% 3,9% 13,8% mittel 43,5% 43,6% 36,0% 41,8% ziemlich stark 19,9% 31,4% 35,1% 26,6% sehr stark 8,8% 10,6% 23,5% 12,6% 100,0% 100,0% 100,0% 100,0% Symmetrische Maße Symmetrische Maße Ordinal- bzgl. Ordinalmaß Kendall-Tau-b Gamma Anzahl der gültigen Fälle Asympto tischer Standard Näherung Näherungswei a b Wert fehler sweises T se Signifikanz ,269 ,016 16,549 ,000 ,384 ,022 16,549 ,000 2513 a. Die Null-Hyphothese wird nicht angenommen. b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. Richtungsmaße Richtungsmaße Ordinal- bzgl. Ordinalmaß Somers-d Symmetrisch f005 Staerke politisches Interesse abhängig schule Schulbildung, dreistufig abhängig Asympto tischer Standard Näherung Näherungswei a b Wert fehler sweises T se Signifikanz ,250 ,016 15,129 ,000 ,268 ,018 15,129 ,000 ,235 ,015 15,129 ,000 a. Die Null-Hyphothese wird nicht angenommen. b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. Interpretation: Es besteht eine positive Beziehung, d.h. je höher die Schulbildung ist, desto stärker ist das politische Interesse. Die Koeffizienten sind bei einer Irrtumswahrscheinlichkeit von 5% signifikant. 3. Kreuztabelle und Korrelationskoeffizient für metrische Daten [/STATISTICS=[CHISQ][LAMBDA][BTAU][GAMMA][ETA ]] [PHI ][UC ][CTAU][D ][CORR] [CC ][KAPPA ][RISK][MCNEMAR] [CMH [(value)]] [ALL ][NONE] ****Beispiel 4: Kreuztabelle mit metrischen Daten: Sympathie Merkel x Links- Rechts-Selbsteinstufung. cro f030 by f029_1 /cells col /stat corr. Berechnet Spearman‘s Rankorrelation (eig. für ordinale Daten) und Pearson‘s r. Sympathie Merkel x Links-RechtsSelbsteinstufung f030 Links-Rechts-Selbsteinstufung * f029_1 Skalometer Schroeder Kreuztabelle % von f029_1 Skalometer Schroeder f029_1 Skalometer Schroeder f030 Links-RechtsSelbsteinstufung Gesamt 1 links 2 3 4 5 6 7 8 9 10 11 rechts 0 -5 halte ueberhaupt 10 +5 halte nichts von sehr viel ihm/ihr 1 2 3 4 5 6 7 8 9 von ihm/ihr Gesamt 5,1% 3,7% 1,9% 4,9% 3,6% 2,1% 2,2% 2,1% 3,0% 10,1% 3,5% ,9% 2,8% 1,6% 1,9% 2,9% 3,6% 4,7% 4,7% 2,6% 7,5% 5,0% 3,8% 4,7% 3,7% 2,3% 8,4% 6,9% 9,2% 5,8% 10,7% 15,0% 23,5% 18,8% 11,9% 3,4% 7,3% 3,1% 5,6% 8,8% 12,3% 8,9% 15,5% 20,4% 21,7% 13,3% 13,3% 7,7% 9,2% 13,3% 4,7% 10,8% 11,3% 17,8% 21,1% 20,9% 16,6% 22,0% 15,9% 37,0% 30,3% 24,2% 40,2% 34,3% 29,2% 38,2% 24,3% 21,8% 19,9% 20,2% 27,1% 12,8% 26,6% 18,8% 19,6% 12,7% 11,3% 12,0% 7,6% 7,0% 2,7% 2,8% 9,8% 11,1% 10,1% 12,5% 12,1% 12,7% 9,7% 4,7% 7,9% 5,6% 2,7% 5,5% 7,5% 11,5% 3,7% 17,2% 3,7% 3,9% 5,1% 3,7% 3,5% 3,8% 1,2% ,9% 4,7% 2,1% 6,3% 1,9% 2,0% 2,1% 1,0% 1,3% ,2% ,5% 1,2% 3,8% 2,8% ,8% 2,6% 1,0% 1,3% ,5% 1,2% ,9% 1,4% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% Bei vielen Ausprägungen der Variablen wird die Kreuztabelle schnell unübersichtlich. Symmetrische Maße Symmetrische Maße Wert Intervall- bzgl. Intervallmaß Pearson-R Ordinal- bzgl. Korrelation nach Ordinalmaß Spearman Anzahl der gültigen Fälle Asympto tischer Standard Näherung Näherungswei a b fehler sweises T se Signifikanz -,327 ,020 -16,814 ,000 -,363 ,019 -18,902 ,000 c c 2360 a. Die Null-Hyphothese wird nicht angenommen. b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. c. Basierend auf Näherung Interpretation: Esnormaler besteht eine mittelstarke negative Beziehung, d.h. je rechter die ideologische Selbsteinstufung, desto negativer die Bewertung von Schröder (bzw. umgekehrt). Die Koeffizienten sind bei einer Irrtumswahrscheinlichkeit von 5% signifikant. Symmetrische Maße Faustregeln für Korrelationen bei sozialwiss. Datenanalysen <= 0,05 > 0,05 und < 0,2 > 0,2 und < 0,5 > 0,5 und < 0,7 >= 0,7 zu vernachlässigen gering mittel hoch sehr hoch Werte gelten für den positiven und negativen Bereich