Explorative Faktorenanalyse

Werbung
Faktorenanalyse
Die Faktorenanalyse ist ein Verfahren, das eine größerer Anzahl von
Variablen auf eine kleinere Anzahl von Faktoren zurückführt. All jene
Variablen, die untereinander stark korrelieren werden zu einem Faktor
zusammengefasst. Variablen aus verschiedenen Faktoren korrelieren
gering untereinander. Ziel der Faktorenanalyse ist es, jene Faktoren zu
finden, welche die beobachteten Zusammenhänge zwischen den
Variablen vollständig erklären. In einem ersten Schritt werden die
Variablen standardisiert (z-Transformation) und dann die PearsonKorrelationskoeffizienten zwischen den Variablen berechnet.
Eigenwert: Der Eigenwert λj eines Faktors j gibt an, wie viel von der
Gesamtvarianz aller Variablen durch diesen Faktor erfasst wird. Je
größer der Eigenwert, desto mehr Erklärungswert hat der Faktor.
Kommunalitäten: Die Kommunalität h² einer Variable i gibt an, in
welchem Ausmaß diese Variable durch die Faktoren aufgeklärt bzw.
erfasst wird. Die Kommunalitäten ändern sich durch die Rotation nicht!
Faktorenladungen: Die Faktorenladung aij entspricht der Korrelation
zwischen einer Variable i und einem Faktor j.
Für die Faktorenanalyse gibt es zahlreiche Verfahren. Die
„Hauptkomponentenanalyse“ ist das gebräuchlichste Verfahren. Die
Faktorenladungen der „rotierten Faktormatrix“ können als eigentliches
Ergebnis der Faktorenanalyse angesehen werden.
Wenn Faktoren ermittelt wurden, dann kann man für jeden Fall Werte
von vielen Variablen in die Werte von wenigen Faktoren überführen.
2 Verfahrenstypen:
a) Explorative Faktorenanalyse: Ein Zusammenhang zwischen den
Variablen wird vermutet (Entdeckungszusammenhang).
b) Konfirmatorische Faktorenanalyse: Aufgrund von theoretischen
Überlegungen existieren bereits Annahmen über Beziehungen
zwischen den Variablen (Begründungszusammenhang). Sie testet
eine theoretisch angenommene Struktur! Hält ein vorab
aufgestelltes Modell der empirischen Realität stand?
Prof. Mag. Dr. Michael Kuttner, PHT
Seite 1
Explorative Faktorenanalyse:
Das Ziel ist die Zusammenfassung einer Vielzahl von Items (auf Basis
der korrelativen Beziehungen) zu einer Anzahl überschaubarer und
interpretierbarer Faktoren.
 Datenreduktion
 Aufdeckung latenter Strukturen
 Entwicklung und Überprüfung eines Messinstruments
1) Beispiel aus der Soziologie:
Datei: Ausland.sav
„Einstellung gegenüber Ausländern“; 15 Items (a1 – a15) auf einer 7teiligen Skala; Ablehnung (1) bis völlige Zustimmung (7)
Analysieren – Dimensionsreduzierung – Faktorenanalyse:
 Deskriptive Statistik: Anfangslösung 
 Extraktion: Art der Extraktionsmethode; Hauptkomponenten; die
Anzahl der Faktoren richtet sich nach der Zahl der Eigenwerte, die
größer als 1 sind oder es wird eine feste Anzahl von Faktoren
vorgegeben. Nicht rotierte Faktorenlösung . Screeplot 
 Rotation: Rotationsmethode; Varimax; Die anfängliche Lösung ist
immer eine Lösung, die den formalen, mathematischen Kriterien
entspricht. Durch die Rotation soll auch eine inhaltlich
befriedigende Lösung gefunden werden.
 Werte: Faktorenwerte berechnen und in zusätzlichen Variablen
speichern?
 Optionen: Fehlende Werte? Anzeigeformat: Sortiert nach Größe 
Kleine Koeffizienten unterdrücken ,30 bzw. ,40
Ergebnis:
3 Eigenwerte über 1  3 Faktoren!
1.Faktor erklärt 23,105 % der Gesamtvarianz
2.Faktor erklärt 16,908 % der Gesamtvarianz
3.Faktor erklärt 16,698 % der Gesamtvarianz
Insgesamt:
56,711% der Gesamtvarianz
Prof. Mag. Dr. Michael Kuttner, PHT
Seite 2
Gegenüber der Anfangslösung ändert sich im Übrigen der Anteil der
durch die Faktoren gemeinsam erklärten Varianz nicht, wohl aber die
durch die einzelnen Faktoren erklärte Varianz!
a7 kann dem Faktor 1 und dem Faktor 3 zugeordnet werden!
1.Faktor: Fremdenfeindliche Einstellung
2.Faktor: Ausländerfreundliche Einstellung
3.Faktor: Soziale Ängste
Faktorenwerte:
Faktorenwerte (Mittelwerte der entsprechenden Items) berechnen!
z-standardisierte Werte (zwischen -3 und +3); Faktorenwerte berechnen
lassen; Fall 4 bzw. Fall 17 beachten; Transformieren – Rangfolge bilden
(fac 1_1); Rangtypen deaktivieren; N-Perzentile aktivieren (4 Gruppen):
Wertelabels: 1 (keine), 2 (schwach), 3 (stark), 4 (sehr stark) Kreuztabelle
mit ewv (Zufriedenheit mit eigenen wirtschaftlichen Verhältnissen)
erstellen!
2) Beispiel aus der Psychologie:
Datei: fkv.sav
„Freiburger Fragebogen zur Krankheitsverarbeitung“; 35 Items (f1 – f35)
auf einer 5-teiligen Skala; gar nicht (1) bis sehr stark (5)
Analysieren – Dimensionsreduzierung – Faktorenanalyse:
 Deskriptive Statistik: Anfangslösung 
 Extraktion: Art der Extraktionsmethode; Hauptkomponenten; die
Anzahl der Faktoren richtet sich nach der Zahl der Eigenwerte, die
größer als 1 sind oder es wird eine feste Anzahl von Faktoren
vorgegeben (5). Nicht rotierte Faktorenlösung . Screeplot 
 Rotation: Rotationsmethode; Varimax
 Werte: Faktorenwerte berechnen und in zusätzlichen Variablen
speichern?
 Optionen: Fehlende Werte? Anzeigeformat: Sortiert nach Größe 
Kleine Koeffizienten unterdrücken ,30 bzw. ,40
Prof. Mag. Dr. Michael Kuttner, PHT
Seite 3
Ergebnis:
1.Faktor – 5.Faktor
f 23 lädt auf den 1.Faktor mit ,426 und auf den 4.Faktor mit ,469!
1.Faktor: Depressive Verarbeitung
2.Faktor: Aktives, problemorientiertes Coping
3.Faktor: Vertrauen in den Arzt
4.Faktor: Religiosität und Sinnsuche
5.Faktor: Bagatellisierung und psychische Distanz
Screeplot: scree  Geröllhang; plot  grafische Darstellung
(bedeutende Faktoren sollen von unbeduetenden Faktoren (Geröll)
getrennt werden.
Umcodierung:
f 31 Galgenhumor entwickeln -,493  f 31_u
f 10 Gefühle nach außen zeigen -,564  f 10_u
15
24
33
42
51
andere Werte  systemdefiniert fehlend
Wichtig: Der Text des Items muss auch umgepolt werden!
f 29; f 32, f 20 rausschmeißen und Faktorenanalyse neu berechnen!
Publikation:






Eigenwerte
Kommunalitäten
Faktorenladungen
Varianzaufklärung
Gesamtvarianzaufklärung
Cronbach´s Alpha (gibt Auskunft über die Reliabilität des
Messinstruments: Analysieren – Skalierung - Reliabilitätsanalyse)
Beispiel aus der Studie „Studienabbruch von Männern in der
Volksschullehrerausbildung“:
Prof. Mag. Dr. Michael Kuttner, PHT
Seite 4
Faktorenstruktur zur Verbindlichkeit gegenüber der Hochschule:
Eigenwert
18/6.Wunsch nach anderer Umgebung
18/1u.Abstand zum Heimatort
18/2u.nicht zu Hause wohnen
18/7.Freizeitwert des Ortes
18/9.Ausbildungsmöglichkeiten
18/5.Freunde/-innen leben dort
18/10.gute öffentliche Verbindungen
18/8.Jobangebot
Cronbachs Alpha
Varianzaufklärung in %
Gesamtvarianzaufklärung in %
2,789
0,762
0,756
0,705
0,629
0,618
0,561
Kommunalitäten h2
u = umcodiertes Item
Mobilität
Itemkurzformulierungen zur
Verbindlichkeit gegenüber der
Hochschule
(Frage 18 + 19)
Aufbruchsstimmung
Die durchgeführte Faktorenanalyse zur Verbindlichkeit gegenüber der
Hochschule ergab bei Streichung der Items 18/3, 18/4 und 19 zwei
Faktoren mit einer Gesamtvarianzaufklärung von 55,752 Prozent.
1,672
0,819
0,778
0,751
0,564
34,858 20,894
55,752
0,596
0,591
0,643
0,404
0,498
0,404
0,695
0,629
Tabelle 1: Faktorenstruktur zur Verbindlichkeit
gegenüber der Hochschule
Die Verbindlichkeit gegenüber der Hochschule wird deshalb durch die
zwei Faktoren „Aufbruchsstimmung“ und „Mobilität“ dargestellt.
Merke:
Konstrukt/Dimension: z.B. Verbindlichkeit gegenüber der Hochschule
Skalen/Faktoren/Subdimensionen/Komponenten: z.B. Mobilität
Items: 18/6, 18/1…
Literatur:
Bühl, A.: (2010): PASW 18. Einführung in die moderne Datenanalyse.
München: Pearson Studium.
Janssen, J./Laatz, W. (2005):Statistische Datenanalyse mit SPSS für
Windows. Eine anwendungsorientierte Einführung in das Basissystem
und das Modul Exakte Tests. Hamburg: Springer.
Prof. Mag. Dr. Michael Kuttner, PHT
Seite 5
Herunterladen