T-Tests und Varianzanalysen

Werbung
T-Tests und
Varianzanalysen
PC-Praktikum
Allgemein
 Bei all diesen Tests geht es um
Zusammenhänge zwischen 2 oder mehr
Variablen.
 Dabei ist die abhängige Variable(AV)
mindestens Intervallskalenniveau und die
unabhängige/n Variable/n(UV) kategorial.
 Es werden die arithmetischen Mittel
erfasst und auf signifikante Unterschiede
geprüft.
T-Tests
 Untersuchen, ob sich die Mittelwerte zweier SP
signifikant unterscheiden (außer T-Test für eine SP:
Vergleich eines Mittelwertes einer SP mit beliebigen
Mittelwert )
Voraussetzungen:
 Normalverteilung
 min. intervallskalierte AV
 dichotome UV
 Nicht zu große Stichprobenumfänge (neigt dann zu
signifikanten Ergebnissen) und Zufallsauswahl
 für T-Test für unabhängige Stichproben(SP):
unabhängige (Teil-)Stichproben
 für T-Test für gepaarte SP: abhängige (Teil-)SP
Quelle: Kähler 2006: 414.
T-Test bei einer SP
 Datensatz: Master_FP_2006.sav
 Es geht um das Alter der Befragten: Variable:
alter
 Forschungsinteresse: Wir wollen herausfinden,
ob sich der Altersdurchschnitt dieser Studie
signifikant vom Altersdurchschnitt des
Hochschulgesamtdatensatz unterscheidet.
Hier wollen wir dazu den Ein-Stichproben-T-Test
verwenden.

andere Anwendungsmöglichkeiten: z.B. Vergleich des Durchschnittseinkommen der
eigenen Studie mit „offiziellem“ Durchschnittseinkommen der Gesamtbevölkerung
T-Test bei einer SP
 AnalysierenMittelwerte vergleichenT-Test bei einer SP
 Hypothesen (für zweiseitig):
H0: μ empir=33,8935
H1: μ empir ≠33,8935
Quelle: Janssen 2003: 306.
T-Test bei einer SP -Fenster
 Testvariable(n)… Variable(n) bei der der Test durchgeführt werden
soll
hier: alter
 Testwert… Wert, mit dem der empirische Mittelwert verglichen
werden soll
hier: 33,8935 (aus Hochschulgesamtdatensatz)
 Optionen:
Konfidenzintervall
Fehlende Werte: Fallausschluss Test für Test... nur Ausschluss der
Fälle, bei denen in der gerade analysierten abhängigen oder
unabhängigen Variable ein fehlender Wert auftritt
Listenweiser Fallausschluss… Ausschluss aller Fälle,
in denen in irgendeiner dieser Variablen ein fehlender Wert auftritt
T-Test bei einer SP -Ausgaben
Streuung um
den Mittelwert
Statistik bei einer Stichprobe
N
4114
Alter der Befragten
Freiheitsgrade
T-Wert
Mittelwert
53,21
Standardab
weichung
10,079
Standardfe
hler des
Mittelwertes
,157
Mittelwertsdifferenz:
Differenz zum
Testwert
Test bei einer Sichprobe
in diesem Bereich
liegt mit 95%iger
Sicherheit der wahre
Wert
Tes twert = 33.8935
Alter der Befragten
|t|>tkrit=1,96
T
122,930
UND
df
4113
Sig. (2-s eitig)
,000
Mittlere
Differenz
19,317
95% Konfidenzintervall
der Differenz
Untere
Obere
19,01
19,63
Sig.(2-seitig)* < 0,05
H0 ist abzulehnen (mit Irrtumswahrscheinlichkeit von 5%)
*für 1-seitige Hypothesen: Sig.(2-seitig) durch 2 teilen
T-Test bei unabhängigen SP
 Datensatz: Master_FP_2006.sav
 Es geht um die Frage 51:
Menü Mittelwerte…
 Analysieren  Mittelwerte vergleichen  Mittelwerte
 … zum Vergleich der Mittelwerte u. a. deskriptiver Statistik sowie
Kontrolle der Drittvariablen
Fenster:
 abhängige Variablen: f51beruf
 unabhängige Variablen: f65gesch
 Optionen: Zellenstatistik…was gewünscht
ANOVA-Tabelle… Varianzanalyse (ohne Einbeziehung
der Kontrollvariablen)
und Eta… zur Bestimmung des Anteils der erklärten
Varianz
Linearitätstest… prüft, ob Zusammenhang durch lineare
Regression erfasst werden kann (metrische, klassifizierte UV nötig)
 Weiter… zur Einführung von Kontrollvariablen
Menü Mittelwerte…
Verarbeitete Fälle
Eingeschlos sen
N
Prozent
Anges ehenen Beruf
aus üben * Geschlecht
4022
96,3%
Fälle
Aus ges chlos s en
N
Prozent
153
Insgesamt
N
Prozent
3,7%
4175
100,0%
Bericht
Anges ehenen Beruf aus üben
Ges chlecht
Weiblich
Männlich
Insgesamt
Mittelwert
2,89
2,68
2,75
N
1294
2728
4022
Standardab
weichung
1,156
1,148
1,154
Varianz
1,335
1,318
1,332
Forschungsinteresse: Sind die Mittelwertunterschiede signifikant oder
zufällig?
Prüfung mit 2-Stichproben-T-Test für unabhängige SP
T-Test bei unabhängigen SP
 AnalysierenMittelwerte vergleichenT-Test bei unabhängigen SP
 Hypothesen (für zweiseitig):
H0: μweibl= μmännl
H1: μ weibl ≠ μmännl
Fenster:
 Testvariable(n) hier: f51beruf
 Gruppenvariable…UV hier: f65gesch
 Gruppen def.: Gruppe 1 hier: 1
Gruppe 2 hier: 2
Trennwert… Teilungspunkt für
ordinale oder metrische UV
Bildung v. 2 Gruppen
 Optionen:
Konfidenzintervall
Fehlende Werte: Fallausschluss Test für Test
Listenweiser Fallausschluss
T-Test bei unabhängigen SP Ausgaben
Gruppenstatistiken
Anges ehenen
Beruf ausüben
Ges chlecht
Weiblich
Männlich
N
1294
2728
Mittelwert
2,89
2,68
Standardab
weichung
1,156
1,148
Standardfe
hler des
Mittelwertes
,032
,022
T-Test bei unabhängigen SP Ausgaben
Test bei unabhängigen Stichproben
Levene-Test
der
Varianzgleich
heit
Mittlere Differenz
Standardfehler der
Differenz
Untere
Obere
,000
,204
,039
,128
,280
5,239
2524,455
,000
,204
,039
,128
,280
3,707
,054
5,252
df
4020
T
95%
Konfidenzint
ervall der
Differenz
Signifikanz
Sig. (2-seitig)
T-Tes t für die Mittelwertgleichheit
F
Angesehenen Beruf
ausüben
FWert
Standardab
-weichung
der
Differenz
Varianzen sind gleich
Varianzen sind nicht
gleich
T-Test bei unabhängigen SP Ausgaben
Levene-Test für Varianzgleichheit:
 H0: Varianzen der Variablen gleich
 H1: Varianzen sind nicht gleich
 Ergebnis: Signifikanz > 0,05
“Varianzen sind nicht gleich” ablesen
T-Test:
 |t|>tkrit=1,96 UND Sig.(2-seitig) < 0,05
H0 ist abzulehnen (mit
Irrtumswahrscheinlichkeit von 5%)
T-Test bei gepaarten SP
 Datensatz: abm.sav
 Einkommen von Teilnehmern einer
Arbeitsbeschaffungsmaßnahme
 Forschungsinteresse: Unterschiede des
Einkommen der Teilnehmer vor und nach der
Arbeitsbeschaffungsmaßnahme
Prüfung mit 2-Stichproben-T-Test für
abhängige SP
 AnalysierenMittelwerte vergleichenTTest bei gepaarten SP
T-Test bei gepaarten SP
 Hypothesen (für zweiseitig):
H0: μvar225= μvar310
H1: μvar225 ≠ μvar310
Fenster:
 Gepaarte Variablen… es sind mehrere Paare möglich
hier: var225(Bruttoeinkommen vor ABM) Strg-Taste
halten var310(erstes Bruttoeinkommen nach ABM)
 Optionen:
Konfidenzintervall
Fehlende Werte: Fallausschluss Test für Test
Listenweiser Fallausschluss
T-Test bei gepaarten SP
Statistik bei gepaarten Stichproben
Mittelwert
Paaren
1
BRUTTOEINKOMMEN
VOR ABM
ERSTES BRUTTOEINK.
NACH ABM
N
Standardab
weichung
Standardfe
hler des
Mittelwertes
2783,54
80
1284,753
143,640
2631,80
80
920,817
102,950
Korrelationen bei gepaarten Stichproben
N
Paaren
1
BRUTTOEINKOMMEN
VOR ABM & ERSTES
BRUTTOEINK.NACH ABM
80
Korrelation
Signifikanz
,644
,000
Korrelation
recht hoch
T-Test bei gepaarten SP
Test bei gepaarten Stichproben
Mittelwert der
Differenzen
zwischen den
Zeitpunkten
T
df
Sig. (2-seitig)
110,430
Obere
987,719
1,374
79
,173
95%
Konfidenzintervall
der Differenz
Untere
Standardfehler des Mittelwertes
BRUTTOEINKOMMEN
VOR ABM - ERSTES
151,738
BRUTTOEINK.NACH ABM
Standardabweichung
Paaren
1
Mittelwert
Standardabweichung der
Differenzen
zwischen den
Zeitpunkten
Gepaarte Differenzen
-68,069
371,544
|t|<tkrit=1,994 UND Sig.(2-seitig) > 0,05
 H0 kann nicht abgelehnt werden kein signifikanter Unterschied im Einkommen
Varianzanalysen
 Untersucht, ob sich die Mittelwerte von mehr als 2 SP signifikant
unterscheiden
 Prüft nur, ob Unterschied zwischen min. einem der verglichenen
Paare signifikant ist  zur Prüfung zwischen welchen
Vergleichspaaren signifikante Differenzen: Post-Hoc-Tests
Voraussetzungen:
 UV: alle Skalenniveaus möglich, kategorisiert
 AV: min. Intervallskalierung
 Varianzhomogenität geprüft mit Levene-Test
 Normalverteilung
 Zufallsstichproben
 Für ANOVA: unabhängige SP
 Für Varianzanalyse mit Meßwiederholung: abhängige SP
Quelle: Kähler 2006: 441.
Einfaktorielle ANOVA
 Datensatz: Master_2006_FP
 Forschungsinteresse: Frage 51Gibt es Unterschiede
zwischen den Geburtskohorten?
Prüfung mit Einfaktorieller ANOVA
 AnalysierenMittelwerte vergleichenEinfaktorielle
ANOVA
 Hypothesen (für zweiseitig):
H0: μ1=μ2=…=μi
H1: μ1≠μ2≠…≠μi
Einfaktorielle ANOVA
Fenster:
 Abhängige Variablen hier: f51beruf
 Faktor… UV hier: f66gebja_koh
 Kontraste: Polynomial UND Grad … Erklärung der
Summe der Abweichungsquadrate zwischen
den Gruppen durch Polynomterme bis zur
5.Ordnung
Kontrast 1 von 1 : Koeffizienten… t-Test für a priori
festgelegte Kontrastgruppen Kodierung mit -1
und +1 für zu vergleichende Gruppen und 0 für
ausgeschlossene Gruppen
(Koeffizientensumme… Koeffizienten müssen 0
ergeben)
Einfaktorielle ANOVA - Post-Hoc
Post-Hoc:
 Varianz-Gleichheit angenommen:
LSD
Bonferroni
Sidak
Scheffé… Vergleich der Mittelwerte und
Berechnung der kritischen Differenz hier:
Scheffe-Test
etc.
 Keine Varianzgleichheit angenommen:
Tamhane-T2
etc.
 Signifikanzniveau …angeben als ,05 etc.
Einfaktorielle ANOVA - Optionen
Optionen:
 Statistik: Deskriptive Statistik
Feste und zufällige Effekte: Statistiken für Modell mit
festen Effekten(Standardabweichung,
Standardfehler, Konfidenzintervall) und zufälligen
Effekten(Standardfehler, Konfidenzintervall, Varianz
zwischen Komonenten)
Test auf Homogenität der Varianzen… Levene-test
Brown-Forsythe… Test auf Gleichheit der Mittelwerte der
Gruppen für ungleiche Varianzen
Welch… siehe Brown-Forsythe-Test
 Diagramm der Mittelwerte: Liniendiagramm aus Punkten der
Mittelwerte der Gruppen
 Fehlende Werte: Fallauschluss Test für Test
Listenweiser Testausschluss
Einfaktorielle ANOVA
ONEWAY deskriptive Statistiken
Anges ehenen Beruf ausüben
N
1,00
2,00
3,00
4,00
5,00
6,00
Ges amt
27
342
974
1378
1134
168
4023
Mittelwert
2,15
2,19
2,50
2,89
2,93
2,98
2,75
Standardab
weichung
1,262
1,066
1,115
1,151
1,125
1,113
1,154
Standardf
ehler
,243
,058
,036
,031
,033
,086
,018
95%-Konfidenzintervall für
den Mittelwert
Untergrenze Obergrenze
1,65
2,65
2,08
2,31
2,43
2,57
2,83
2,95
2,87
3,00
2,81
3,15
2,71
2,78
Minimum
1
1
1
1
1
1
1
Maximum
5
5
5
5
5
5
5
Test der Homogenität der Varianzen
F-Wert
Anges ehenen Beruf aus üben
LeveneStatis tik
1,700
df1
5
df2
4017
Signifikanz
,131
│F│< Fkrit=2,21 UND Signifikanz >0,05
Varianzhomogenität falls nicht: kann Varianzanalyse nicht durchgeführt werden
Einfaktorielle ANOVA
Zerlegung der summierten Abweichungsquadrate
in SAQzw , SAQin
und SAQge
ONEWAY ANOVA
Varianzen
Anges ehenen Beruf ausüben
Zwischen den Gruppen
Innerhalb der Gruppen
Ges amt
Quadrats
umme
250,027
5102,903
5352,931
df
5
4017
4022
Mittel der
Quadrate
50,005
1,270
F
39,364
Signifikanz
,000
│F│> Fkrit=2,21 UND Signifikanz <0,05
signifikante Unterschiede zwischen Geburtskohorten
Mehrfachvergleiche
Abhängige Variable: Angesehenen Beruf ausüben
Scheffé-Prozedur
(I) geburts kohorten
in Jahrzehnte
bis 1929
1930-1939
1940-1949
1950-1959
1960-1969
ab 1970
(J) geburts kohorten
in Jahrzehnte
1930-1939
1940-1949
1950-1959
1960-1969
ab 1970
bis 1929
1940-1949
1950-1959
1960-1969
ab 1970
bis 1929
1930-1939
1950-1959
1960-1969
ab 1970
bis 1929
1930-1939
1940-1949
1960-1969
ab 1970
bis 1929
1930-1939
1940-1949
1950-1959
ab 1970
bis 1929
1930-1939
1940-1949
1950-1959
1960-1969
Mittlere
Differenz (I-J)
-,045
-,355
-,744*
-,785*
-,834*
,045
-,310*
-,699*
-,740*
-,789*
,355
,310*
-,389*
-,430*
-,479*
,744*
,699*
,389*
-,041
-,090
,785*
,740*
,430*
,041
-,049
,834*
,789*
,479*
,090
,049
Standar
dfehler
,225
,220
,219
,219
,234
,225
,071
,068
,070
,106
,220
,071
,047
,049
,094
,219
,068
,047
,045
,092
,219
,070
,049
,045
,093
,234
,106
,094
,092
,093
*. Die Differenz der Mittelwerte is t auf dem Niveau .05 s ignifikant.
Signifikanz
1,000
,761
,042
,026
,026
1,000
,002
,000
,000
,000
,761
,002
,000
,000
,000
,042
,000
,000
,975
,966
,026
,000
,000
,975
,998
,026
,000
,000
,966
,998
95%-Konfidenzintervall
Untergrenze Obergrenze
-,79
,71
-1,09
,38
-1,47
-,01
-1,52
-,05
-1,61
-,06
-,71
,79
-,55
-,07
-,93
-,47
-,97
-,51
-1,14
-,44
-,38
1,09
,07
,55
-,55
-,23
-,59
-,27
-,79
-,17
,01
1,47
,47
,93
,23
,55
-,19
,11
-,40
,22
,05
1,52
,51
,97
,27
,59
-,11
,19
-,36
,26
,06
1,61
,44
1,14
,17
,79
-,22
,40
-,26
,36
Einfaktorielle ANOVA
Angesehenen Beruf ausüben
a, b
Scheffé-Prozedur
Signifikanz
innerhalb
den
Gruppen
geburtskohorten
in Jahrzehnte
bis 1929
1930-1939
1940-1949
1950-1959
1960-1969
ab 1970
Signifikanz
N
27
342
974
1378
1134
168
Untergruppe für Alpha = .05.
3
2
1
2,15
2,19
2,50
2,50
2,89
2,89
2,93
2,93
2,98
,995
,110
,294
Die Mittelwerte für die in homogenen Untergruppen befindlichen
Gruppen werden angezeigt.
a. Verwendet ein harmonis ches Mittel für Stichprobengröße =
123,590.
b. Die Gruppengrößen s ind nicht identis ch. Es wird das
harmonische Mittel der Gruppengrößen verwendet.
Fehlerniveaus des Typs I sind nicht garantiert.
3 homogene Gruppen, deren Mittelwerte sich nicht
signifikant unterscheiden:
Gruppe 1: 1-3 und Gruppe 2: 3-5 und Gruppe 3: 4-6
Weitere Varianzanalysen
 AnalysierenAllgemeines lineares
ModellUnivariat… für eine AV
 AnalysierenAllgemeines lineares
ModellMultivariat… für mehrere AV
 AnalysierenAllgemeines lineares
ModellMeßwiederholung… Varianzanalyse für
abhängige SP
 AnalysierenAllgemeines lineares
ModellVarianzkomponenten… schätzt bei
Modellen mit gemischten Effekten den Beitrag jedes
Zufallseffekts zur Varianz der abhängigen Variablen.
2-faktorielle Varianzanalyse
 Kann auch Wirkung ihrer Kombination(Interaktion) untersuchen
 gleiche Zellhäufigkeiten… alle Zellen mit gleicher Anzahl der Fälle
besetzt wechselseitig voneinander unabhängig
 Gegenteil: ungleiche Zellhäufigkeiten: Effekte korrelieren
miteinander
 Datensatz: allbus90.sav
 Forschungsinteresse: Welchen Einfluss hat der Schulbildung und
das Geschlecht auf das Einkommen unter Kontrolle der Variablen
Alter?
Prüfung mit 2-faktorieller Varianzanalyse
 AnalysierenAllgemeines lineares ModellUnivariat
AnalysierenAllgemeines lineares
ModellUnivariat
Univariat:
 Abhängige Variable hier: eink
 Feste Faktoren… alle relevanten Merkmale des Faktors sind
durch Untersuchungsanordnung vorgegeben
hier: geschl, schul2
 Zufallsfaktoren… kommen durch bzgl. dieses Merkmals
zufällige Zuweisung von Fällen zu
Untersuchungsgruppen zustande
 Kovariaten… zusätzliche Einführung einer mit
metrischen Variable (wichtig: keine
Korrelation zu Faktoren) Kontrollvariable
hier: alt
 WLS-Gewichtung… für Gewichtung der Fälle
(vorher Gewichtungsvariable bilden)
AnalysierenAllgemeines lineares
ModellUnivariat
 Modell: Gesättigtes Modell… alle Faktoren und Kovariate sowie
Wechselwirkungen zwischen Faktoren gehen ins Modell ein
hier: gesättigtes Modell
Anpassen… Auswahl der Haupteffekte (Faktoren und Kovariate)
und Wechselwirkungen (auch mit Kovariaten), die in Modell
eingehen sollen
Term(e) konstruieren: u.a. Alle ?-Weg… Wechselwirkungen der
?.Ordnung
Quadratsumme… zur Berechnung der Summe der Abweichungen
 Typ I… Hierarchisch: Jeder Term wird nur für die in der
Liste vor ihm stehenden korrigiertReihenfolge hat Einfluss
auf Ergebnis
Typ II: Regressionsmodell: Berechnung der Haupteffekte um
alle anderen Terme (außer Interaktionen) korrigiert
Typ III: Berechnung der Quadratsumme eines Effekts um alle
anderen Effekte bereinigt, die nicht im Effekt enthalten sind
robust gegenüber ungleichen Zellhäufigkeiten
ungeeignet für leere Zellen
Typ IV: für leere Zellen
AnalysierenAllgemeines lineares
ModellUnivariat
 Kontraste… Vergleich von Gruppen (nur 1 Faktor) über a priori
definierte Kontraste (ähnlich wie bei ANOVA):
Einfach… Vergleich der Mittelwerte aller Faktorstufen (außer
Referenzkategorie) mit Mittelwert der
Referenzkategorie
Wiederholt… Vergleich des Mittelwerts jeder Faktorstufe
(außer der letzten) mit dem Mittelwert der
folgenden Faktorstufe
Polynomial… Vergleich des linearen etc. Effekts  für
Schätzung von polynomialen Trends
etc.
Referenzkategorie… erste oder letzte Faktorstufe
AnalysierenAllgemeines lineares
ModellUnivariat
 Diagramme: Profilplots… stellen den
Zusammenhang zwischen max.
2 Faktoren und der AV dar:
Horizontale Achse… 1.Faktor
hier: schul
Separate Linien… 2.Faktor
hier: geschl
Separate Diagramme… 3.Faktor
 Post-Hoc… wie bei ANOVA
 (Speichern… Hier kann man festlegen, dass bestimmte
Werte als neue Variablen gespeichert werden können)
AnalysierenAllgemeines lineares
ModellUnivariat
Optionen:
 Geschätzte Randmittel:
Mittelwerte anzeigen für… Auswahl der Faktoren und –
kombinationen für Ausgabe der Mittelwerte
hier: (Insgesamt)
Haupteffekte vergleichen UND Anpassung des
Konfidenzintervalls… Auswahl von Post-Hoc-Tests
 Anzeigen:
Deskriptive Statistik… für jede Faktorstufenkomination
Schätzer der Effektgröße… partielle Eta-Werte für erklärte
Varianz für jeden Faktor, Interaktion und Kovariate
hier: beide ankreuzen
Beobachtete Schärfe… Wahrscheinlichkeit einen tatsächlich
vorhandenen Effekt auch zu entdecken
etc.
 Signifikanzniveau
2-faktorielle Varianzanalyse
Gesamtmittelwert
Zwischensubjektfaktoren
Schulbildung
umkodiert
2
3
GESCHLECHT,
BEFRAGTE<R>
4
1
2
Wertelabel
Hauptsch
ule
Mittels chul
e
Fachh/Abi
MAENNLI
CH
WEIBLICH
Abhängige Variable: BEFR.: MONATLICHES
NETTOEINKOMMEN
N
74
33
35
80
62
Mittelwert
2142,756a
Standardf
ehler
94,009
95% Konfidenzintervall
Untergrenze Obergrenze
1956,836
2328,676
a. Die Kovariaten im Modell werden anhand der
folgenden Werte berechnet: ALTER,
BEFRAGTE<R> = 49,63.
2-faktorielle Varianzanalyse
Deskriptive Statistiken
Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN
Schulbildung umkodiert
Hauptschule
Mittels chule
Fachh/Abi
Ges amt
GESCHLECHT,
BEFRAGTE<R>
MAENNLICH
WEIBLICH
Ges amt
MAENNLICH
WEIBLICH
Ges amt
MAENNLICH
WEIBLICH
Ges amt
MAENNLICH
WEIBLICH
Ges amt
Mittelwert
2214,63
1328,15
1807,32
2895,24
1897,92
2532,58
2675,00
1806,13
2277,80
2502,63
1561,77
2091,83
Standardab
weichung
1130,896
710,437
1053,217
1142,137
633,394
1091,131
1321,606
870,318
1204,875
1204,036
774,572
1136,262
N
40
34
74
21
12
33
19
16
35
80
62
142
2-faktorielle Varianzanalyse
Tests der Zwischensubjekteffekte
Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN
Quadratsum
Quelle
me vom Typ III
Korrigiertes Modell 42424611,068 a
Konstanter Term
63559012,059
alt
218591,240
s chul2
9909843,044
ges chl
25432596,662
s chul2 * ges chl
91478,764
Fehler
139619196,9
Ges amt
803401284,0
Korrigierte
182043807,9
Ges amtvariation
df
6
1
1
2
1
2
135
142
Mittel der
Quadrate
7070768,5
63559012
218591,24
4954921,5
25432597
45739,382
1034216,3
F
6,837
61,456
,211
4,791
24,591
,044
Signifikanz
,000
,000
,646
,010
,000
,957
Partielles
Eta-Quadrat
,233
,313
,002
,066
,154
,001
141
a. R-Quadrat = ,233 (korrigiertes R-Quadrat = ,199)
Signifikanz>0,05Keine signifikante Interaktion Prüfung der Signifikanz der
Haupteffekte: Geschlecht und Schulbildung haben signifikante Wirkung, weil
Signifikanz<0,05; Kovariate Alter hat keine signifikante Wirkung, weil Sig. >0,05
(korrigiertes) R2=0,199 Modell erklärt ca. 20% der Gesamtvarianz: davon erklärt die
Schulbildung ca. 7% und das Geschlecht ca. 15% der VarianzGeschlecht hat stärkere
Wirkung als Schulbildung
2-faktorielle Varianzanalyse
Tests der Zwischensubjekteffekte
Abhängige Variable: BEFR.: MONATLICHES NETTOEINKOMMEN
Quadratsum
me vom Typ III
Quelle
Korrigiertes Modell 42424611,068 a
Konstanter Term
63559012,059
alt
218591,240
s chul2
9909843,044
ges chl
25432596,662
s chul2 * ges chl
91478,764
Fehler
139619196,9
Ges amt
803401284,0
Korrigierte
182043807,9
Ges amtvariation
df
6
1
1
2
1
2
135
142
Mittel der
Quadrate
7070768,5
63559012
218591,24
4954921,5
25432597
45739,382
1034216,3
141
a. R-Quadrat = ,233 (korrigiertes R-Quadrat = ,199)
F
6,837
61,456
,211
4,791
24,591
,044
Signifikanz
,000
,000
,646
,010
,000
,957
Partielles
Eta-Quadrat
,233
,313
,002
,066
,154
,001
2-faktorielle VarianzanalyseDiagrammauswertung
Separate Linien:
 Wenn Zeilenvariable keinen Einfluss besitzt, verläuft sie parallel zur
x-Achse
 Besitzt sie Einfluss, steigt oder fällt sie
hier: Einfluss des Geschlechts auf Einkommen
 Wenn sie Einfluss hat, kann sie in verschiedenen Abschnitten
unterschiedlich verlaufen, aber nicht parallel
Horizontale Achse:
 Wenn Spaltenvariable keinen Einfluss besitzt, fallen die einzelnen
Linien zusammen
 Wenn sie Einfluss hat: Abstand zwischen den Linien
hier: Einfluss des Geschlechts auf Einkommen vorhanden
 Wenn Interaktion vorliegt, verlaufen Linien zumindest in Bereichen
nicht parallel
hier: Linien verlaufen im Bereich Fachhochschule/Abi nicht mehr
parallelleichte Interaktion
 Wenn keine Interaktion vorliegt, verlaufen die Linien parallel
Konstanz des Abstands
Aufgaben
Für diese Aufgaben wird der Datensatz Master_FP_2006 benötigt.
Es geht um die Variablen studfach(1.abgeschlossenes Studienfach) und
f51aufst(Berufserfolg bedeutet gute Aufstiegschancen zu haben). Es
interessiert hier, ob das Studienfach beeinflusst, wie sehr der Aussage
(nicht) zugestimmt wird, dass „Beruflicher Erfolg ist … gute
Aufstiegschancen zu haben.“
a) Vergleicht zuerst die Mittelwerte der Gruppen der Variable studfach
untereinander und mit dem Gesamtmittelwert der Variable studfach!
b) Nun soll herausgefunden werden, ob sich die Mittelwerte von f51einko
signifikant unterscheiden, je nachdem welches Studienfach studiert
wurde. Welchen Test könnt ihr dazu verwenden?
c) Führt den Test durch! Was ist das Ergebnis?
d) Welchen Test müsste man verwenden, wenn man herausfinden will, ob
es signifikante Mittelwertsdifferenzen bezüglich f70gesch(Haben Sie
Geschwister?) bzgl. f51aufst gibt?
e) Führt den Test durch! Was ist das Ergebnis?
Literaturempfehlungen
CD-Rom:
 Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005):
Einführung in die sozialwissenschaftliche Datenanalyse, Ein
multimediales Selbstlernprogramm. Wiesbaden: VS Verlag
für Sozialwissenschaften/GWV Fachverlage GmbH.
Lehrbuch:
 Janssen, Jürgen/Laatz, Wilfried(2005): Statistische
Datenanalyse mit SPSS für Windows. Berlin, Heidelberg:
Springer-Verlag.
SPSS:
 Ergebnis-Assistent bei Tabellen (in Englisch)
 Hilfe-Taste auf den Fenstern (erklärt Vorgang und seine
Bedeutung)
Quellen
 Backhaus, Klaus/Erichson, Bernd/Plinke, Wulff/Weiber, Rolf(2006):





Multivariate Analysemethoden. Berlin/Heidelberg: Springer-Verlag.
Bellgardt, Egon(2004): Statistik mit SPSS. München: Verlag Franz
Vahlen GmbH.
Fahrmeir, Ludwig ed.al.(2005): Arbeitsbuch Statistik.
Berlin/Heidelberg: Springer-Verlag.
Fröhlich, Romy/Wutz, Gertraud, Rossmann, Raphael(2005):
Einführung in die sozialwissenschaftliche Datenanalyse, Ein
multimediales Selbstlernprogramm. Wiesbaden: VS Verlag für
Sozialwissenschaften/GWV Fachverlage GmbH.
Kähler, Wolf-Michael(2006): Statistische Datenanalyse. Wiesbaden:
Friedr. Vieweg & Sohn Verlag/GWV Fachverlage GmbH.
Janssen, Jürgen/Laatz, Wilfried(2003): Statistische Datenanalyse
mit SPSS für Windows. Berlin, Heidelberg: Springer-Verlag.
Herunterladen