T-Tests und Varianzanalysen PC-Praktikum Allgemein Bei all diesen Tests geht es um Zusammenhänge zwischen 2 oder mehr Variablen. Dabei ist die abhängige Variable(AV) mindestens Intervallskalenniveau und die unabhängige/n Variable/n(UV) kategorial. Es werden die arithmetischen Mittel erfasst und auf signifikante Unterschiede geprüft. T-Tests Untersuchen, ob sich die Mittelwerte zweier SP signifikant unterscheiden (außer T-Test für eine SP: Vergleich eines Mittelwertes einer SP mit beliebigen Mittelwert ) Voraussetzungen: Normalverteilung min. intervallskalierte AV dichotome UV Nicht zu große Stichprobenumfänge (neigt dann zu signifikanten Ergebnissen) und Zufallsauswahl für T-Test für unabhängige Stichproben(SP): unabhängige (Teil-)Stichproben für T-Test für gepaarte SP: abhängige (Teil-)SP Quelle: Kähler 2006: 414. T-Test bei einer SP Datensatz: Master_FP_2006.sav Es geht um das Alter der Befragten: Variable: alter Forschungsinteresse: Wir wollen herausfinden, ob sich der Altersdurchschnitt dieser Studie signifikant vom Altersdurchschnitt des Hochschulgesamtdatensatz unterscheidet. Hier wollen wir dazu den Ein-Stichproben-T-Test verwenden. andere Anwendungsmöglichkeiten: z.B. Vergleich des Durchschnittseinkommen der eigenen Studie mit „offiziellem“ Durchschnittseinkommen der Gesamtbevölkerung T-Test bei einer SP AnalysierenMittelwerte vergleichenT-Test bei einer SP Hypothesen (für zweiseitig): H0: μ empir=33,8935 H1: μ empir ≠33,8935 Quelle: Janssen 2003: 306. T-Test bei einer SP -Fenster Testvariable(n)… Variable(n) bei der der Test durchgeführt werden soll hier: alter Testwert… Wert, mit dem der empirische Mittelwert verglichen werden soll hier: 33,8935 (aus Hochschulgesamtdatensatz) Optionen: Konfidenzintervall Fehlende Werte: Fallausschluss Test für Test... nur Ausschluss der Fälle, bei denen in der gerade analysierten abhängigen oder unabhängigen Variable ein fehlender Wert auftritt Listenweiser Fallausschluss… Ausschluss aller Fälle, in denen in irgendeiner dieser Variablen ein fehlender Wert auftritt T-Test bei einer SP -Ausgaben Streuung um den Mittelwert Statistik bei einer Stichprobe N 4114 Alter der Befragten Freiheitsgrade T-Wert Mittelwert 53,21 Standardab weichung 10,079 Standardfe hler des Mittelwertes ,157 Mittelwertsdifferenz: Differenz zum Testwert Test bei einer Sichprobe in diesem Bereich liegt mit 95%iger Sicherheit der wahre Wert Tes twert = 33.8935 Alter der Befragten |t|>tkrit=1,96 T 122,930 UND df 4113 Sig. (2-s eitig) ,000 Mittlere Differenz 19,317 95% Konfidenzintervall der Differenz Untere Obere 19,01 19,63 Sig.(2-seitig)* < 0,05 H0 ist abzulehnen (mit Irrtumswahrscheinlichkeit von 5%) *für 1-seitige Hypothesen: Sig.(2-seitig) durch 2 teilen T-Test bei unabhängigen SP Datensatz: Master_FP_2006.sav Es geht um die Frage 51: Menü Mittelwerte… Analysieren Mittelwerte vergleichen Mittelwerte … zum Vergleich der Mittelwerte u. a. deskriptiver Statistik sowie Kontrolle der Drittvariablen Fenster: abhängige Variablen: f51beruf unabhängige Variablen: f65gesch Optionen: Zellenstatistik…was gewünscht ANOVA-Tabelle… Varianzanalyse (ohne Einbeziehung der Kontrollvariablen) und Eta… zur Bestimmung des Anteils der erklärten Varianz Linearitätstest… prüft, ob Zusammenhang durch lineare Regression erfasst werden kann (metrische, klassifizierte UV nötig) Weiter… zur Einführung von Kontrollvariablen Menü Mittelwerte… Verarbeitete Fälle Eingeschlos sen N Prozent Anges ehenen Beruf aus üben * Geschlecht 4022 96,3% Fälle Aus ges chlos s en N Prozent 153 Insgesamt N Prozent 3,7% 4175 100,0% Bericht Anges ehenen Beruf aus üben Ges chlecht Weiblich Männlich Insgesamt Mittelwert 2,89 2,68 2,75 N 1294 2728 4022 Standardab weichung 1,156 1,148 1,154 Varianz 1,335 1,318 1,332 Forschungsinteresse: Sind die Mittelwertunterschiede signifikant oder zufällig? Prüfung mit 2-Stichproben-T-Test für unabhängige SP T-Test bei unabhängigen SP AnalysierenMittelwerte vergleichenT-Test bei unabhängigen SP Hypothesen (für zweiseitig): H0: μweibl= μmännl H1: μ weibl ≠ μmännl Fenster: Testvariable(n) hier: f51beruf Gruppenvariable…UV hier: f65gesch Gruppen def.: Gruppe 1 hier: 1 Gruppe 2 hier: 2 Trennwert… Teilungspunkt für ordinale oder metrische UV Bildung v. 2 Gruppen Optionen: Konfidenzintervall Fehlende Werte: Fallausschluss Test für Test Listenweiser Fallausschluss T-Test bei unabhängigen SP Ausgaben Gruppenstatistiken Anges ehenen Beruf ausüben Ges chlecht Weiblich Männlich N 1294 2728 Mittelwert 2,89 2,68 Standardab weichung 1,156 1,148 Standardfe hler des Mittelwertes ,032 ,022 T-Test bei unabhängigen SP Ausgaben Test bei unabhängigen Stichproben Levene-Test der Varianzgleich heit Mittlere Differenz Standardfehler der Differenz Untere Obere ,000 ,204 ,039 ,128 ,280 5,239 2524,455 ,000 ,204 ,039 ,128 ,280 3,707 ,054 5,252 df 4020 T 95% Konfidenzint ervall der Differenz Signifikanz Sig. (2-seitig) T-Tes t für die Mittelwertgleichheit F Angesehenen Beruf ausüben FWert Standardab -weichung der Differenz Varianzen sind gleich Varianzen sind nicht gleich T-Test bei unabhängigen SP Ausgaben Levene-Test für Varianzgleichheit: H0: Varianzen der Variablen gleich H1: Varianzen sind nicht gleich Ergebnis: Signifikanz > 0,05 “Varianzen sind nicht gleich” ablesen T-Test: |t|>tkrit=1,96 UND Sig.(2-seitig) < 0,05 H0 ist abzulehnen (mit Irrtumswahrscheinlichkeit von 5%) T-Test bei gepaarten SP Datensatz: abm.sav Einkommen von Teilnehmern einer Arbeitsbeschaffungsmaßnahme Forschungsinteresse: Unterschiede des Einkommen der Teilnehmer vor und nach der Arbeitsbeschaffungsmaßnahme Prüfung mit 2-Stichproben-T-Test für abhängige SP AnalysierenMittelwerte vergleichenTTest bei gepaarten SP T-Test bei gepaarten SP Hypothesen (für zweiseitig): H0: μvar225= μvar310 H1: μvar225 ≠ μvar310 Fenster: Gepaarte Variablen… es sind mehrere Paare möglich hier: var225(Bruttoeinkommen vor ABM) Strg-Taste halten var310(erstes Bruttoeinkommen nach ABM) Optionen: Konfidenzintervall Fehlende Werte: Fallausschluss Test für Test Listenweiser Fallausschluss T-Test bei gepaarten SP Statistik bei gepaarten Stichproben Mittelwert Paaren 1 BRUTTOEINKOMMEN VOR ABM ERSTES BRUTTOEINK. NACH ABM N Standardab weichung Standardfe hler des Mittelwertes 2783,54 80 1284,753 143,640 2631,80 80 920,817 102,950 Korrelationen bei gepaarten Stichproben N Paaren 1 BRUTTOEINKOMMEN VOR ABM & ERSTES BRUTTOEINK.NACH ABM 80 Korrelation Signifikanz ,644 ,000 Korrelation recht hoch T-Test bei gepaarten SP Test bei gepaarten Stichproben Mittelwert der Differenzen zwischen den Zeitpunkten T df Sig. (2-seitig) 110,430 Obere 987,719 1,374 79 ,173 95% Konfidenzintervall der Differenz Untere Standardfehler des Mittelwertes BRUTTOEINKOMMEN VOR ABM - ERSTES 151,738 BRUTTOEINK.NACH ABM Standardabweichung Paaren 1 Mittelwert Standardabweichung der Differenzen zwischen den Zeitpunkten Gepaarte Differenzen -68,069 371,544 |t|<tkrit=1,994 UND Sig.(2-seitig) > 0,05 H0 kann nicht abgelehnt werden kein signifikanter Unterschied im Einkommen Varianzanalysen Untersucht, ob sich die Mittelwerte von mehr als 2 SP signifikant unterscheiden Prüft nur, ob Unterschied zwischen min. einem der verglichenen Paare signifikant ist zur Prüfung zwischen welchen Vergleichspaaren signifikante Differenzen: Post-Hoc-Tests Voraussetzungen: UV: alle Skalenniveaus möglich, kategorisiert AV: min. Intervallskalierung Varianzhomogenität geprüft mit Levene-Test Normalverteilung Zufallsstichproben Für ANOVA: unabhängige SP Für Varianzanalyse mit Meßwiederholung: abhängige SP Quelle: Kähler 2006: 441. Einfaktorielle ANOVA Datensatz: Master_2006_FP Forschungsinteresse: Frage 51Gibt es Unterschiede zwischen den Geburtskohorten? Prüfung mit Einfaktorieller ANOVA AnalysierenMittelwerte vergleichenEinfaktorielle ANOVA Hypothesen (für zweiseitig): H0: μ1=μ2=…=μi H1: μ1≠μ2≠…≠μi Einfaktorielle ANOVA Fenster: Abhängige Variablen hier: f51beruf Faktor… UV hier: f66gebja_koh Kontraste: Polynomial UND Grad … Erklärung der Summe der Abweichungsquadrate zwischen den Gruppen durch Polynomterme bis zur 5.Ordnung Kontrast 1 von 1 : Koeffizienten… t-Test für a priori festgelegte Kontrastgruppen Kodierung mit -1 und +1 für zu vergleichende Gruppen und 0 für ausgeschlossene Gruppen (Koeffizientensumme… Koeffizienten müssen 0 ergeben) Einfaktorielle ANOVA - Post-Hoc Post-Hoc: Varianz-Gleichheit angenommen: LSD Bonferroni Sidak Scheffé… Vergleich der Mittelwerte und Berechnung der kritischen Differenz hier: Scheffe-Test etc. Keine Varianzgleichheit angenommen: Tamhane-T2 etc. Signifikanzniveau …angeben als ,05 etc. Einfaktorielle ANOVA - Optionen Optionen: Statistik: Deskriptive Statistik Feste und zufällige Effekte: Statistiken für Modell mit festen Effekten(Standardabweichung, Standardfehler, Konfidenzintervall) und zufälligen Effekten(Standardfehler, Konfidenzintervall, Varianz zwischen Komonenten) Test auf Homogenität der Varianzen… Levene-test Brown-Forsythe… Test auf Gleichheit der Mittelwerte der Gruppen für ungleiche Varianzen Welch… siehe Brown-Forsythe-Test Diagramm der Mittelwerte: Liniendiagramm aus Punkten der Mittelwerte der Gruppen Fehlende Werte: Fallauschluss Test für Test Listenweiser Testausschluss Einfaktorielle ANOVA ONEWAY deskriptive Statistiken Anges ehenen Beruf ausüben N 1,00 2,00 3,00 4,00 5,00 6,00 Ges amt 27 342 974 1378 1134 168 4023 Mittelwert 2,15 2,19 2,50 2,89 2,93 2,98 2,75 Standardab weichung 1,262 1,066 1,115 1,151 1,125 1,113 1,154 Standardf ehler ,243 ,058 ,036 ,031 ,033 ,086 ,018 95%-Konfidenzintervall für den Mittelwert Untergrenze Obergrenze 1,65 2,65 2,08 2,31 2,43 2,57 2,83 2,95 2,87 3,00 2,81 3,15 2,71 2,78 Minimum 1 1 1 1 1 1 1 Maximum 5 5 5 5 5 5 5 Test der Homogenität der Varianzen F-Wert Anges ehenen Beruf aus üben LeveneStatis tik 1,700 df1 5 df2 4017 Signifikanz ,131 │F│< Fkrit=2,21 UND Signifikanz >0,05 Varianzhomogenität falls nicht: kann Varianzanalyse nicht durchgeführt werden Einfaktorielle ANOVA Zerlegung der summierten Abweichungsquadrate in SAQzw , SAQin und SAQge ONEWAY ANOVA Varianzen Anges ehenen Beruf ausüben Zwischen den Gruppen Innerhalb der Gruppen Ges amt Quadrats umme 250,027 5102,903 5352,931 df 5 4017 4022 Mittel der Quadrate 50,005 1,270 F 39,364 Signifikanz ,000 │F│> Fkrit=2,21 UND Signifikanz <0,05 signifikante Unterschiede zwischen Geburtskohorten Mehrfachvergleiche Abhängige Variable: Angesehenen Beruf ausüben Scheffé-Prozedur (I) geburts kohorten in Jahrzehnte bis 1929 1930-1939 1940-1949 1950-1959 1960-1969 ab 1970 (J) geburts kohorten in Jahrzehnte 1930-1939 1940-1949 1950-1959 1960-1969 ab 1970 bis 1929 1940-1949 1950-1959 1960-1969 ab 1970 bis 1929 1930-1939 1950-1959 1960-1969 ab 1970 bis 1929 1930-1939 1940-1949 1960-1969 ab 1970 bis 1929 1930-1939 1940-1949 1950-1959 ab 1970 bis 1929 1930-1939 1940-1949 1950-1959 1960-1969 Mittlere Differenz (I-J) -,045 -,355 -,744* -,785* -,834* ,045 -,310* -,699* -,740* -,789* ,355 ,310* -,389* -,430* -,479* ,744* ,699* ,389* -,041 -,090 ,785* ,740* ,430* ,041 -,049 ,834* ,789* ,479* ,090 ,049 Standar dfehler ,225 ,220 ,219 ,219 ,234 ,225 ,071 ,068 ,070 ,106 ,220 ,071 ,047 ,049 ,094 ,219 ,068 ,047 ,045 ,092 ,219 ,070 ,049 ,045 ,093 ,234 ,106 ,094 ,092 ,093 *. Die Differenz der Mittelwerte is t auf dem Niveau .05 s ignifikant. Signifikanz 1,000 ,761 ,042 ,026 ,026 1,000 ,002 ,000 ,000 ,000 ,761 ,002 ,000 ,000 ,000 ,042 ,000 ,000 ,975 ,966 ,026 ,000 ,000 ,975 ,998 ,026 ,000 ,000 ,966 ,998 95%-Konfidenzintervall Untergrenze Obergrenze -,79 ,71 -1,09 ,38 -1,47 -,01 -1,52 -,05 -1,61 -,06 -,71 ,79 -,55 -,07 -,93 -,47 -,97 -,51 -1,14 -,44 -,38 1,09 ,07 ,55 -,55 -,23 -,59 -,27 -,79 -,17 ,01 1,47 ,47 ,93 ,23 ,55 -,19 ,11 -,40 ,22 ,05 1,52 ,51 ,97 ,27 ,59 -,11 ,19 -,36 ,26 ,06 1,61 ,44 1,14 ,17 ,79 -,22 ,40 -,26 ,36 Einfaktorielle ANOVA Angesehenen Beruf ausüben a, b Scheffé-Prozedur Signifikanz innerhalb den Gruppen geburtskohorten in Jahrzehnte bis 1929 1930-1939 1940-1949 1950-1959 1960-1969 ab 1970 Signifikanz N 27 342 974 1378 1134 168 Untergruppe für Alpha = .05. 3 2 1 2,15 2,19 2,50 2,50 2,89 2,89 2,93 2,93 2,98 ,995 ,110 ,294 Die Mittelwerte für die in homogenen Untergruppen befindlichen Gruppen werden angezeigt. a. Verwendet ein harmonis ches Mittel für Stichprobengröße = 123,590. b. Die Gruppengrößen s ind nicht identis ch. Es wird das harmonische Mittel der Gruppengrößen verwendet. Fehlerniveaus des Typs I sind nicht garantiert. 3 homogene Gruppen, deren Mittelwerte sich nicht signifikant unterscheiden: Gruppe 1: 1-3 und Gruppe 2: 3-5 und Gruppe 3: 4-6 Weitere Varianzanalysen AnalysierenAllgemeines lineares ModellUnivariat… für eine AV AnalysierenAllgemeines lineares ModellMultivariat… für mehrere AV AnalysierenAllgemeines lineares ModellMeßwiederholung… Varianzanalyse für abhängige SP AnalysierenAllgemeines lineares ModellVarianzkomponenten… schätzt bei Modellen mit gemischten Effekten den Beitrag jedes Zufallseffekts zur Varianz der abhängigen Variablen. 2-faktorielle Varianzanalyse Kann auch Wirkung ihrer Kombination(Interaktion) untersuchen gleiche Zellhäufigkeiten… alle Zellen mit gleicher Anzahl der Fälle besetzt wechselseitig voneinander unabhängig Gegenteil: ungleiche Zellhäufigkeiten: Effekte korrelieren miteinander Datensatz: allbus90.sav Forschungsinteresse: Welchen Einfluss hat der Schulbildung und das Geschlecht auf das Einkommen unter Kontrolle der Variablen Alter? Prüfung mit 2-faktorieller Varianzanalyse AnalysierenAllgemeines lineares ModellUnivariat AnalysierenAllgemeines lineares ModellUnivariat Univariat: Abhängige Variable hier: eink Feste Faktoren… alle relevanten Merkmale des Faktors sind durch Untersuchungsanordnung vorgegeben hier: geschl, schul2 Zufallsfaktoren… kommen durch bzgl. dieses Merkmals zufällige Zuweisung von Fällen zu Untersuchungsgruppen zustande Kovariaten… zusätzliche Einführung einer mit metrischen Variable (wichtig: keine Korrelation zu Faktoren) Kontrollvariable hier: alt WLS-Gewichtung… für Gewichtung der Fälle (vorher Gewichtungsvariable bilden) AnalysierenAllgemeines lineares ModellUnivariat Modell: Gesättigtes Modell… alle Faktoren und Kovariate sowie Wechselwirkungen zwischen Faktoren gehen ins Modell ein hier: gesättigtes Modell Anpassen… Auswahl der Haupteffekte (Faktoren und Kovariate) und Wechselwirkungen (auch mit Kovariaten), die in Modell eingehen sollen Term(e) konstruieren: u.a. Alle ?-Weg… Wechselwirkungen der ?.Ordnung Quadratsumme… zur Berechnung der Summe der Abweichungen Typ I… Hierarchisch: Jeder Term wird nur für die in der Liste vor ihm stehenden korrigiertReihenfolge hat Einfluss auf Ergebnis Typ II: Regressionsmodell: Berechnung der Haupteffekte um alle anderen Terme (außer Interaktionen) korrigiert Typ III: Berechnung der Quadratsumme eines Effekts um alle anderen Effekte bereinigt, die nicht im Effekt enthalten sind robust gegenüber ungleichen Zellhäufigkeiten ungeeignet für leere Zellen Typ IV: für leere Zellen AnalysierenAllgemeines lineares ModellUnivariat Kontraste… Vergleich von Gruppen (nur 1 Faktor) über a priori definierte Kontraste (ähnlich wie bei ANOVA): Einfach… Vergleich der Mittelwerte aller Faktorstufen (außer Referenzkategorie) mit Mittelwert der Referenzkategorie Wiederholt… Vergleich des Mittelwerts jeder Faktorstufe (außer der letzten) mit dem Mittelwert der folgenden Faktorstufe Polynomial… Vergleich des linearen etc. Effekts für Schätzung von polynomialen Trends etc. Referenzkategorie… erste oder letzte Faktorstufe AnalysierenAllgemeines lineares ModellUnivariat Diagramme: Profilplots… stellen den Zusammenhang zwischen max. 2 Faktoren und der AV dar: Horizontale Achse… 1.Faktor hier: schul Separate Linien… 2.Faktor hier: geschl Separate Diagramme… 3.Faktor Post-Hoc… wie bei ANOVA (Speichern… Hier kann man festlegen, dass bestimmte Werte als neue Variablen gespeichert werden können) AnalysierenAllgemeines lineares ModellUnivariat Optionen: Geschätzte Randmittel: Mittelwerte anzeigen für… Auswahl der Faktoren und – kombinationen für Ausgabe der Mittelwerte hier: (Insgesamt) Haupteffekte vergleichen UND Anpassung des Konfidenzintervalls… Auswahl von Post-Hoc-Tests Anzeigen: Deskriptive Statistik… für jede Faktorstufenkomination Schätzer der Effektgröße… partielle Eta-Werte für erklärte Varianz für jeden Faktor, Interaktion und Kovariate hier: beide ankreuzen Beobachtete Schärfe… Wahrscheinlichkeit einen tatsächlich vorhandenen Effekt auch zu entdecken etc. Signifikanzniveau 2-faktorielle Varianzanalyse Gesamtmittelwert Zwischensubjektfaktoren Schulbildung umkodiert 2 3 GESCHLECHT, BEFRAGTE<R> 4 1 2 Wertelabel Hauptsch ule Mittels chul e Fachh/Abi MAENNLI CH WEIBLICH Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN N 74 33 35 80 62 Mittelwert 2142,756a Standardf ehler 94,009 95% Konfidenzintervall Untergrenze Obergrenze 1956,836 2328,676 a. Die Kovariaten im Modell werden anhand der folgenden Werte berechnet: ALTER, BEFRAGTE<R> = 49,63. 2-faktorielle Varianzanalyse Deskriptive Statistiken Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN Schulbildung umkodiert Hauptschule Mittels chule Fachh/Abi Ges amt GESCHLECHT, BEFRAGTE<R> MAENNLICH WEIBLICH Ges amt MAENNLICH WEIBLICH Ges amt MAENNLICH WEIBLICH Ges amt MAENNLICH WEIBLICH Ges amt Mittelwert 2214,63 1328,15 1807,32 2895,24 1897,92 2532,58 2675,00 1806,13 2277,80 2502,63 1561,77 2091,83 Standardab weichung 1130,896 710,437 1053,217 1142,137 633,394 1091,131 1321,606 870,318 1204,875 1204,036 774,572 1136,262 N 40 34 74 21 12 33 19 16 35 80 62 142 2-faktorielle Varianzanalyse Tests der Zwischensubjekteffekte Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN Quadratsum Quelle me vom Typ III Korrigiertes Modell 42424611,068 a Konstanter Term 63559012,059 alt 218591,240 s chul2 9909843,044 ges chl 25432596,662 s chul2 * ges chl 91478,764 Fehler 139619196,9 Ges amt 803401284,0 Korrigierte 182043807,9 Ges amtvariation df 6 1 1 2 1 2 135 142 Mittel der Quadrate 7070768,5 63559012 218591,24 4954921,5 25432597 45739,382 1034216,3 F 6,837 61,456 ,211 4,791 24,591 ,044 Signifikanz ,000 ,000 ,646 ,010 ,000 ,957 Partielles Eta-Quadrat ,233 ,313 ,002 ,066 ,154 ,001 141 a. R-Quadrat = ,233 (korrigiertes R-Quadrat = ,199) Signifikanz>0,05Keine signifikante Interaktion Prüfung der Signifikanz der Haupteffekte: Geschlecht und Schulbildung haben signifikante Wirkung, weil Signifikanz<0,05; Kovariate Alter hat keine signifikante Wirkung, weil Sig. >0,05 (korrigiertes) R2=0,199 Modell erklärt ca. 20% der Gesamtvarianz: davon erklärt die Schulbildung ca. 7% und das Geschlecht ca. 15% der VarianzGeschlecht hat stärkere Wirkung als Schulbildung 2-faktorielle Varianzanalyse Tests der Zwischensubjekteffekte Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN Quadratsum me vom Typ III Quelle Korrigiertes Modell 42424611,068 a Konstanter Term 63559012,059 alt 218591,240 s chul2 9909843,044 ges chl 25432596,662 s chul2 * ges chl 91478,764 Fehler 139619196,9 Ges amt 803401284,0 Korrigierte 182043807,9 Ges amtvariation df 6 1 1 2 1 2 135 142 Mittel der Quadrate 7070768,5 63559012 218591,24 4954921,5 25432597 45739,382 1034216,3 141 a. R-Quadrat = ,233 (korrigiertes R-Quadrat = ,199) F 6,837 61,456 ,211 4,791 24,591 ,044 Signifikanz ,000 ,000 ,646 ,010 ,000 ,957 Partielles Eta-Quadrat ,233 ,313 ,002 ,066 ,154 ,001 2-faktorielle VarianzanalyseDiagrammauswertung Separate Linien: Wenn Zeilenvariable keinen Einfluss besitzt, verläuft sie parallel zur x-Achse Besitzt sie Einfluss, steigt oder fällt sie hier: Einfluss des Geschlechts auf Einkommen Wenn sie Einfluss hat, kann sie in verschiedenen Abschnitten unterschiedlich verlaufen, aber nicht parallel Horizontale Achse: Wenn Spaltenvariable keinen Einfluss besitzt, fallen die einzelnen Linien zusammen Wenn sie Einfluss hat: Abstand zwischen den Linien hier: Einfluss des Geschlechts auf Einkommen vorhanden Wenn Interaktion vorliegt, verlaufen Linien zumindest in Bereichen nicht parallel hier: Linien verlaufen im Bereich Fachhochschule/Abi nicht mehr parallelleichte Interaktion Wenn keine Interaktion vorliegt, verlaufen die Linien parallel Konstanz des Abstands Aufgaben Für diese Aufgaben wird der Datensatz Master_FP_2006 benötigt. Es geht um die Variablen studfach(1.abgeschlossenes Studienfach) und f51aufst(Berufserfolg bedeutet gute Aufstiegschancen zu haben). Es interessiert hier, ob das Studienfach beeinflusst, wie sehr der Aussage (nicht) zugestimmt wird, dass „Beruflicher Erfolg ist … gute Aufstiegschancen zu haben.“ a) Vergleicht zuerst die Mittelwerte der Gruppen der Variable studfach untereinander und mit dem Gesamtmittelwert der Variable studfach! b) Nun soll herausgefunden werden, ob sich die Mittelwerte von f51einko signifikant unterscheiden, je nachdem welches Studienfach studiert wurde. Welchen Test könnt ihr dazu verwenden? c) Führt den Test durch! Was ist das Ergebnis? d) Welchen Test müsste man verwenden, wenn man herausfinden will, ob es signifikante Mittelwertsdifferenzen bezüglich f70gesch(Haben Sie Geschwister?) bzgl. f51aufst gibt? e) Führt den Test durch! Was ist das Ergebnis? Literaturempfehlungen CD-Rom: Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005): Einführung in die sozialwissenschaftliche Datenanalyse, Ein multimediales Selbstlernprogramm. Wiesbaden: VS Verlag für Sozialwissenschaften/GWV Fachverlage GmbH. Lehrbuch: Janssen, Jürgen/Laatz, Wilfried(2005): Statistische Datenanalyse mit SPSS für Windows. Berlin, Heidelberg: Springer-Verlag. SPSS: Ergebnis-Assistent bei Tabellen (in Englisch) Hilfe-Taste auf den Fenstern (erklärt Vorgang und seine Bedeutung) Quellen Backhaus, Klaus/Erichson, Bernd/Plinke, Wulff/Weiber, Rolf(2006): Multivariate Analysemethoden. Berlin/Heidelberg: Springer-Verlag. Bellgardt, Egon(2004): Statistik mit SPSS. München: Verlag Franz Vahlen GmbH. Fahrmeir, Ludwig ed.al.(2005): Arbeitsbuch Statistik. Berlin/Heidelberg: Springer-Verlag. Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005): Einführung in die sozialwissenschaftliche Datenanalyse, Ein multimediales Selbstlernprogramm. Wiesbaden: VS Verlag für Sozialwissenschaften/GWV Fachverlage GmbH. Kähler, Wolf-Michael(2006): Statistische Datenanalyse. Wiesbaden: Friedr. Vieweg & Sohn Verlag/GWV Fachverlage GmbH. Janssen, Jürgen/Laatz, Wilfried(2003): Statistische Datenanalyse mit SPSS für Windows. Berlin, Heidelberg: Springer-Verlag.