Methoden der Psychologie Multivariate Analysemethoden Thema: Multidimensionale Skalierung (MDS) Günter Meinhardt Johannes Gutenberg Universität Mainz Methoden der Psychologie Verfahren Multidimensionale Skalierung Thema Multidimensionale Skalierung Problem: Positionierung von Messobjekten in einem latenten Raum (hier: Wahrnehmungsraum) Möglichkeiten: Faktorenanalyse Multidimensionale Skalierung Methoden der Psychologie Verfahren MDS - Faktorenanalyse Faktorenanalyse Vorgehen Man lässt Personen Eigenschaftsausprägungen von Objekten einschätzen (Item-Schätzskalen). Man faktorisiert die Skalen und betrachtet die Koordinaten der Objekte auf den neuen (unabhängigen) Dimensionen (= latenter Wahrnehmungsraum). MDS Vorgehen Man lässt nur die Ähnlichkeit der Objekte beurteilen (ohne den direkten Bezug auf konkrete Eigenschaften) und probiert die Anordnung („Konfiguration“) der Objekte in einem latenten Raum derart, dass die Ähnlichkeitsurteile möglichst gut reproduziert werden. Methoden der Psychologie Latente Variable MDS - Faktorenanalyse Verfahren Faktorenanalyse Man möchte Objekte (Personen) in einem Raum latenter Dimensionen (Fähigkeiten, Traits) anordnen. Gegeben ist ein Set von Beobachtungen (Messvariablen) (x1 , x2 ,K , x p ) Problem: Finde latente Variablen (w1 , w2 ,K , wr ) r p, so dass jede Variable xk eine Linearkombination der wl ist: xk = bk1w1 + bk 2 w 2 + K + bkr w r Beispiel: Das Abschneiden im Abitur mit Deutsch, Mathe, Physik, Latein und Geographie wird erklärt aus latenten Variablen Memory, Induction, Perceptual Speed, Space, Verbal Comprehension. Methoden der Psychologie Latente Variable MDS - Faktorenanalyse Verfahren Multidimensionale Skalierung Man möchte Objekte (Personen) in einem Raum latenter Dimensionen anordnen. Gegeben ist ein Set von Beobachtungen über die (sensorischen) Distanzen der Objekte: (Distanzmatrix) Problem: Finde latente Variablen o1 o2 o1 0 o2 d 21 0 D= M M M o j d j1 d j 2 M M M on d n1 d n 2 L oj L on O L 0 M M O L d nj L 0 (w1 , w2 ,K , wr ) r n, so dass die Distanzen zwischen den Objekten auf den Koordinaten reproduziert werden. Beispiel: Man lässt Filmschauspieler paarweise nach Ähnlichkeit/Unähnlichkeit bewerten. Die MDS soll den latenten Wahrnehmungsraum liefern, auf dem die Schauspieler angeordnet werden können, so dass die Ähnlichkeitsurteile reproduziert werden. Methoden der Psychologie Verfahren Faktorenanalyse MDS - Faktorenanalyse Multidimensionale Skalierung Demo - Beispiel mit Excel und Statistica Methoden der Psychologie MDS Verfahren MDS Vorteile • relevante Eigenschaften dürfen unbekannt sein (keine Verzerrung durch Vorauswahl) • kann bereits bei Rangdaten eingesetzt werden (Ergebnisse sind mit metrischer MDS quasi identisch) Nachteile • Aggregation über Personen ist problematisch (Bezug auf verschiedene latente Dimensionen beim Urteil) • Großer Interpretationsfreiraum beim Untersucher bei der inhaltlichen Benennung der Dimensionen (vage) • MDS- Lösung ist nicht algorithmisch (Keine Garantie die beste Lösung gefunden zu haben) • MDS Lösung ist von weiteren Parametern abhängig (Distanzmodell, Anzahl der Dimensionen) Methoden der Psychologie MDS Verfahren MDS StädteBeispiel Distanzen von Städten in km Basel Berlin Frank- Ham- Hanno- Kassel Köln furt burg ver Basel Berlin Frankfurt Hamburg Hannover Kassel Köln München Nürnberg Stuttgart 847 337 820 677 517 496 438 437 268 555 294 282 378 569 584 437 634 495 352 193 189 400 228 217 154 307 422 782 609 668 164 287 639 466 526 243 482 309 366 578 405 376 Mün- Nürn- Stutt. chen berg 167 220 207 Methoden der Psychologie MDS Verfahren MDS StädteBeispiel Rangreihe der Distanzen von Städten Basel Berlin Frank- Ham- Hanno- Kassel Köln furt burg ver Basel Berlin Frankfurt Hamburg Hannover Kassel Köln München Nürnberg Stuttgart 45 17 44 42 32 31 27 25 11 34 14 12 21 35 37 25 39 30 18 5 4 22 9 7 1 15 24 43 38 41 2 13 40 28 33 10 29 16 19 36 23 20 Mün- Nürn- Stutt. chen berg 3 8 6 Methoden der Psychologie StädteBeispiel MDS Verfahren MDS - Konfiguration Methoden der Psychologie StädteBeispiel Verfahren MDS MDS – Konfiguration nach Rotation und Spiegelung Methoden der Psychologie MDS Verfahren MDS Anwendung Die MDS ist ein exploratives Verfahren und nicht zur strengen Hypothesenprüfung geeignet Probleme • Auffinden der Konfiguration (relative Lage der Objekte zueinander im Wahrnehmungsraum, wenn nur die Distanzen bekannt sind • Bestimmung der Dimensionalität • Bestimmung der Metrik Kommentar • Die Konfiguration ist unabhängig von Rotation und Spiegelung • Es finden fast nur nichtmetrische MDS Prozeduren Verwendung (Kruskal) Methoden der Psychologie MDS Verfahren MDS Ablauf 1. Messung von Ähnlichkeiten 2. Wahl des Distanzmodells 3. Ermittlung der Konfiguration 4. Zahl und Interpretation der Dimensionen 5. Aggregation von Personen Methoden der Psychologie Verfahren MDS - 1. Messung von Ähnlichkeiten Methoden • Rangreihungsmethode • Ankerpunktmethode • Ratingverfahren Rangreihe Es werden „n über 2“ Paare geordnet von „unähnlichstes Paar“ zu „ähnlichstes Paar“ (bei grossem n kaum möglich) Ankerpunkt Jedes Objekt ist einmal Vergleichsobjekt (Anker) für alle anderen Objekte. Es werden soviele Rangreihen wie Objekte erstellt. Man erhält eine asymmetrische quadratrische Distanzmatrix, die in eine symmetrische überführt werden kann. Rating Probleme: Man bildet ale möglichen Paare und lässt diese, randomisiert dargeboten, auf einer Ratingskala nach Ähnlichkeit bewerten. Ties (Rangbindungen), Reliabilität der Ränge Methoden der Psychologie Euklidische Metrik p=2 MDS - 2. Distanzmodell Verfahren æ d kl = ççå xkv - xlv çè v= 1 x2 m 4.00 k d kl 3.00 b 2.00 l a 1.00 0.00 0.00 1.00 2.00 3.00 4.00 x1 a = xk1 - xl1 = 1- 4 = - 3 b = xk 2 - xl 2 = 3 - 2 = 1 Objektdistanz d kl = 32 + 12 = 10 = 3.16 1 p p ö ÷ ÷ ÷ ø Methoden der Psychologie MinkowskiMetriken MDS - 2. Distanzmodell Verfahren æ d kl = ççå xkv - xlv çè v= 1 m 1 p p ö ÷ ÷ ÷ ø p=2 Euklidische Metrik: Abstand der Objekte ist die Länge der Verbindungslinie. p=1 City-Block Metrik: Abstand der Objekte ist die Summe der einzelnen Koordinatendistanzen p= Supremum Metrik: Abstand der Objekte ist die größte der auftretenden Koordinatendistanzen Wahlkriterium Metrik muss nach inhaltlichen Gesichtspunkten gewählt Sein, Abstände werden in diesem Sinne interpretiert. Methoden der Psychologie Konfiguration ermitteln MDS - 3. Konfiguration ermitteln Verfahren Ausgehend von den Unähnlichkeiten u ist ein möglichst niedrig dimensionierter Raum zu finden, in dem die Distanzen d möglichst der Monotoniebeziehung p=2 Wenn ukl > uij dann d kl > dij genügen. Shepard Diagram Distances d and D-Hats vs. Dissimilarity u 2.6 Shephard Diagramm 2.4 2.2 2.0 1.8 1.6 1.4 1.2 Distances/D-Hats 1.0 0.8 0.6 0.4 0.2 0 1 2 3 4 Dissimilarity u 5 6 7 8 Methoden der Psychologie MDS - 3. Konfiguration ermitteln Verfahren Konfiguration ermitteln Unähnlichkeiten u Rama 1 2 3 4 StartKonfiguration 8 Rama Homa Becel Butter 5 4 Becel 3 2 1 1 4 2; 7 6 3 Becel 1 2 3 4 6 Rama Homa Becel Butter x1 3 2 1 10 x2 2 7 3 4 Homa 2 7 X2 3 2 5 Homa Koordinaten x1, x2 10; 4 Butter 4 1; 3 Rama 1 3; 2 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X1 Objekte(k,l) 1;2 1;3 1;4 2;3 2;4 3;4 å xkv - xlv 1+25=26 4+1=5 49+4=53 1+16=17 64+9=73 81+1=82 2 d(kl) 5.1 2.2 7.3 4.1 8.5 9.1 Rg[d(k,l)] 3 1 4 2 5 6 u(k,l) 3 2 5 1 4 6 Methoden der Psychologie Konfiguration ermitteln StartKonfiguration MDS - 3. Konfiguration ermitteln Verfahren Shephard - Diagramm 10 9 8 7 6 d(k,l) 5 4 3 2 1 0 Distance d(k,l) Disparity ^ d(k,l) 0 1 2 3 4 5 6 7 Dissimilarity u(k,l) Abweichung von Distanz d und Disparität Gütemaß ”Stress” d kl - dˆkl å ( Stress = k ,l Faktor 2 ) d̂ Methoden der Psychologie MDS - 3. Konfiguration ermitteln Verfahren Wahrnehmungsraum Konfiguration ermitteln 8 Homa 2 Alte Koordinaten 7 ^ Neue Koordinaten 6 Iterative Optimierung 5 X2 4 Butter 4 3 Becel 3 2 Rama 1 1 0 0 1 2 3 4 5 6 X1 7 8 9 10 11 12 Methoden der Psychologie MDS - 3. Konfiguration ermitteln Verfahren Wahrnehmungsraum Konfiguration ermitteln 8 7 Homa 2 Neue Koordinaten 6 Iterative Optimierung 5 X2 4 Butter 4 Becel 3 Shephard Diagramm 3 2 Rama 1 Stress berechnen 1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X1 Gütemaß ”Stress” Für jeden Iterationsschritt wird Stress bewertet. Iterationen so lange, bis Stress sich nicht mehr vermindert. (Stress ist Führungsfunktion für nichtlineare Optimierung.) Methoden der Psychologie Anzahl Verfahren MDS - 4. Dimensionen - Interpretation • Je mehr Dimensionen, desto geringer wird Stress • Lösungen mit einer geringeren Anzahl von Dimensionen sind einfacher zu interpretieren • Stress darf nicht 0 werden (uneindeutige Lösung) Trade-Off von Stress und Interpretierbarkeit Regeln Trade-Off • An Interpretierbarkeit orientieren, ggf. Achsen rotieren • Stress soll niedrig sein – Anhaltswerte nach Kruskal • Die Daten sollen einen gewissen Verdichtungsgrad Q haben, Q soll möglichst groß sein (Tabelle) Durch Erhöhung der Anzahl der Dimensionen wird trivialerweise eine Repräsentierbarkeit erreicht. Gleichzeitig strebt aber die Datenverdichtung gegen 1. Erhöhung der Anzahl der Objekte n führt zu besserer Verdichtung, aber auch zu schlechterer Urteilspräzision. Methoden der Psychologie Verdichtung Q MDS - 4. Dimensionen - Interpretation Verfahren Q= æn÷ ö çç ÷ çè2÷ ÷ ø n ×m = Anzahl der Ähnlichkeiten Anzahl der Koordinaten m = Anzahl Dimensionen Q - Tabelle Trade-Off n 7 8 9 10 11 12 13 m=2 1.5 1.75 2 2.25 2.5 2.75 3 m=3 1 1.17 1.33 1.5 1.67 1.83 2 Trade-Off von hohem Q- Wert & niedrigem Stress-Wert Methoden der Psychologie Stressmaße MDS - 4. Dimensionen - Interpretation Verfahren d kl - dˆkl SM1 = å ( å d kl - dˆkl 2 å ( ) k ,l d SM 2 = 2 kl k,l Stress-Güte Richtwert Güte gering ausreichend gut ausgezeichnet perfekt 2 ) k ,l 2 å (d kl - d ) k,l SM1 0.2 0.1 0.05 0.025 0 SM2 0.4 0.2 0.1 0.05 0 Werte zwischen gut und ausgezeichnet ergeben einen relativ glatten Anstieg im Shephard Diagramm Methoden der Psychologie Anzahl Verfahren MDS - 5. Aggregation Die MDS als klassisches Verfahren dient der Ermittlung der Konfiguration einer Person. Aggregationen werden durchgeführt: • Über die Ähnlichkeitsdaten wird aggregiert • Über die Konfigurationen wird aggregiert • Über spezielle Rechenverfahren werden MDS Analysen über die Ähnlichkeitsdaten mehrerer Personen (replicated MDS) durchgeführt Diskussion Vor-und Nachteile der Techniken abwägen