Faktorenanalyse Die Faktorenanalyse ist ein Verfahren, das eine größerer Anzahl von Variablen auf eine kleinere Anzahl von Faktoren zurückführt. All jene Variablen, die untereinander stark korrelieren werden zu einem Faktor zusammengefasst. Variablen aus verschiedenen Faktoren korrelieren gering untereinander. Ziel der Faktorenanalyse ist es, jene Faktoren zu finden, welche die beobachteten Zusammenhänge zwischen den Variablen vollständig erklären. In einem ersten Schritt werden die Variablen standardisiert (z-Transformation) und dann die PearsonKorrelationskoeffizienten zwischen den Variablen berechnet. Eigenwert: Der Eigenwert λj eines Faktors j gibt an, wie viel von der Gesamtvarianz aller Variablen durch diesen Faktor erfasst wird. Je größer der Eigenwert, desto mehr Erklärungswert hat der Faktor. Kommunalitäten: Die Kommunalität h² einer Variable i gibt an, in welchem Ausmaß diese Variable durch die Faktoren aufgeklärt bzw. erfasst wird. Die Kommunalitäten ändern sich durch die Rotation nicht! Faktorenladungen: Die Faktorenladung aij entspricht der Korrelation zwischen einer Variable i und einem Faktor j. Für die Faktorenanalyse gibt es zahlreiche Verfahren. Die „Hauptkomponentenanalyse“ ist das gebräuchlichste Verfahren. Die Faktorenladungen der „rotierten Faktormatrix“ können als eigentliches Ergebnis der Faktorenanalyse angesehen werden. Wenn Faktoren ermittelt wurden, dann kann man für jeden Fall Werte von vielen Variablen in die Werte von wenigen Faktoren überführen. 2 Verfahrenstypen: a) Explorative Faktorenanalyse: Ein Zusammenhang zwischen den Variablen wird vermutet (Entdeckungszusammenhang). b) Konfirmatorische Faktorenanalyse: Aufgrund von theoretischen Überlegungen existieren bereits Annahmen über Beziehungen zwischen den Variablen (Begründungszusammenhang). Sie testet eine theoretisch angenommene Struktur! Hält ein vorab aufgestelltes Modell der empirischen Realität stand? Prof. Mag. Dr. Michael Kuttner, PHT Seite 1 Explorative Faktorenanalyse: Das Ziel ist die Zusammenfassung einer Vielzahl von Items (auf Basis der korrelativen Beziehungen) zu einer Anzahl überschaubarer und interpretierbarer Faktoren. Datenreduktion Aufdeckung latenter Strukturen Entwicklung und Überprüfung eines Messinstruments 1) Beispiel aus der Soziologie: Datei: Ausland.sav „Einstellung gegenüber Ausländern“; 15 Items (a1 – a15) auf einer 7teiligen Skala; Ablehnung (1) bis völlige Zustimmung (7) Analysieren – Dimensionsreduzierung – Faktorenanalyse: Deskriptive Statistik: Anfangslösung Extraktion: Art der Extraktionsmethode; Hauptkomponenten; die Anzahl der Faktoren richtet sich nach der Zahl der Eigenwerte, die größer als 1 sind oder es wird eine feste Anzahl von Faktoren vorgegeben. Nicht rotierte Faktorenlösung . Screeplot Rotation: Rotationsmethode; Varimax; Die anfängliche Lösung ist immer eine Lösung, die den formalen, mathematischen Kriterien entspricht. Durch die Rotation soll auch eine inhaltlich befriedigende Lösung gefunden werden. Werte: Faktorenwerte berechnen und in zusätzlichen Variablen speichern? Optionen: Fehlende Werte? Anzeigeformat: Sortiert nach Größe Kleine Koeffizienten unterdrücken ,30 bzw. ,40 Ergebnis: 3 Eigenwerte über 1 3 Faktoren! 1.Faktor erklärt 23,105 % der Gesamtvarianz 2.Faktor erklärt 16,908 % der Gesamtvarianz 3.Faktor erklärt 16,698 % der Gesamtvarianz Insgesamt: 56,711% der Gesamtvarianz Prof. Mag. Dr. Michael Kuttner, PHT Seite 2 Gegenüber der Anfangslösung ändert sich im Übrigen der Anteil der durch die Faktoren gemeinsam erklärten Varianz nicht, wohl aber die durch die einzelnen Faktoren erklärte Varianz! a7 kann dem Faktor 1 und dem Faktor 3 zugeordnet werden! 1.Faktor: Fremdenfeindliche Einstellung 2.Faktor: Ausländerfreundliche Einstellung 3.Faktor: Soziale Ängste Faktorenwerte: Faktorenwerte (Mittelwerte der entsprechenden Items) berechnen! z-standardisierte Werte (zwischen -3 und +3); Faktorenwerte berechnen lassen; Fall 4 bzw. Fall 17 beachten; Transformieren – Rangfolge bilden (fac 1_1); Rangtypen deaktivieren; N-Perzentile aktivieren (4 Gruppen): Wertelabels: 1 (keine), 2 (schwach), 3 (stark), 4 (sehr stark) Kreuztabelle mit ewv (Zufriedenheit mit eigenen wirtschaftlichen Verhältnissen) erstellen! 2) Beispiel aus der Psychologie: Datei: fkv.sav „Freiburger Fragebogen zur Krankheitsverarbeitung“; 35 Items (f1 – f35) auf einer 5-teiligen Skala; gar nicht (1) bis sehr stark (5) Analysieren – Dimensionsreduzierung – Faktorenanalyse: Deskriptive Statistik: Anfangslösung Extraktion: Art der Extraktionsmethode; Hauptkomponenten; die Anzahl der Faktoren richtet sich nach der Zahl der Eigenwerte, die größer als 1 sind oder es wird eine feste Anzahl von Faktoren vorgegeben (5). Nicht rotierte Faktorenlösung . Screeplot Rotation: Rotationsmethode; Varimax Werte: Faktorenwerte berechnen und in zusätzlichen Variablen speichern? Optionen: Fehlende Werte? Anzeigeformat: Sortiert nach Größe Kleine Koeffizienten unterdrücken ,30 bzw. ,40 Prof. Mag. Dr. Michael Kuttner, PHT Seite 3 Ergebnis: 1.Faktor – 5.Faktor f 23 lädt auf den 1.Faktor mit ,426 und auf den 4.Faktor mit ,469! 1.Faktor: Depressive Verarbeitung 2.Faktor: Aktives, problemorientiertes Coping 3.Faktor: Vertrauen in den Arzt 4.Faktor: Religiosität und Sinnsuche 5.Faktor: Bagatellisierung und psychische Distanz Screeplot: scree Geröllhang; plot grafische Darstellung (bedeutende Faktoren sollen von unbeduetenden Faktoren (Geröll) getrennt werden. Umcodierung: f 31 Galgenhumor entwickeln -,493 f 31_u f 10 Gefühle nach außen zeigen -,564 f 10_u 15 24 33 42 51 andere Werte systemdefiniert fehlend Wichtig: Der Text des Items muss auch umgepolt werden! f 29; f 32, f 20 rausschmeißen und Faktorenanalyse neu berechnen! Publikation: Eigenwerte Kommunalitäten Faktorenladungen Varianzaufklärung Gesamtvarianzaufklärung Cronbach´s Alpha (gibt Auskunft über die Reliabilität des Messinstruments: Analysieren – Skalierung - Reliabilitätsanalyse) Beispiel aus der Studie „Studienabbruch von Männern in der Volksschullehrerausbildung“: Prof. Mag. Dr. Michael Kuttner, PHT Seite 4 Faktorenstruktur zur Verbindlichkeit gegenüber der Hochschule: Eigenwert 18/6.Wunsch nach anderer Umgebung 18/1u.Abstand zum Heimatort 18/2u.nicht zu Hause wohnen 18/7.Freizeitwert des Ortes 18/9.Ausbildungsmöglichkeiten 18/5.Freunde/-innen leben dort 18/10.gute öffentliche Verbindungen 18/8.Jobangebot Cronbachs Alpha Varianzaufklärung in % Gesamtvarianzaufklärung in % 2,789 0,762 0,756 0,705 0,629 0,618 0,561 Kommunalitäten h2 u = umcodiertes Item Mobilität Itemkurzformulierungen zur Verbindlichkeit gegenüber der Hochschule (Frage 18 + 19) Aufbruchsstimmung Die durchgeführte Faktorenanalyse zur Verbindlichkeit gegenüber der Hochschule ergab bei Streichung der Items 18/3, 18/4 und 19 zwei Faktoren mit einer Gesamtvarianzaufklärung von 55,752 Prozent. 1,672 0,819 0,778 0,751 0,564 34,858 20,894 55,752 0,596 0,591 0,643 0,404 0,498 0,404 0,695 0,629 Tabelle 1: Faktorenstruktur zur Verbindlichkeit gegenüber der Hochschule Die Verbindlichkeit gegenüber der Hochschule wird deshalb durch die zwei Faktoren „Aufbruchsstimmung“ und „Mobilität“ dargestellt. Merke: Konstrukt/Dimension: z.B. Verbindlichkeit gegenüber der Hochschule Skalen/Faktoren/Subdimensionen/Komponenten: z.B. Mobilität Items: 18/6, 18/1… Literatur: Bühl, A.: (2010): PASW 18. Einführung in die moderne Datenanalyse. München: Pearson Studium. Janssen, J./Laatz, W. (2005):Statistische Datenanalyse mit SPSS für Windows. Eine anwendungsorientierte Einführung in das Basissystem und das Modul Exakte Tests. Hamburg: Springer. Prof. Mag. Dr. Michael Kuttner, PHT Seite 5