Methoden der Psychologie - Johannes Gutenberg

Werbung
Methoden der
Psychologie
Multivariate Analysemethoden
Thema: Multidimensionale Skalierung (MDS)
Günter Meinhardt
Johannes Gutenberg Universität Mainz
Methoden der
Psychologie
Verfahren
Multidimensionale Skalierung
Thema
Multidimensionale Skalierung
Problem:
Positionierung von Messobjekten in einem latenten Raum
(hier: Wahrnehmungsraum)
Möglichkeiten:
Faktorenanalyse
Multidimensionale
Skalierung
Methoden der
Psychologie
Verfahren
MDS - Faktorenanalyse
Faktorenanalyse
Vorgehen
Man lässt Personen Eigenschaftsausprägungen von Objekten
einschätzen (Item-Schätzskalen). Man faktorisiert die Skalen
und betrachtet die Koordinaten der Objekte auf den neuen
(unabhängigen) Dimensionen (= latenter Wahrnehmungsraum).
MDS
Vorgehen
Man lässt nur die Ähnlichkeit der Objekte beurteilen (ohne den
direkten Bezug auf konkrete Eigenschaften) und probiert die
Anordnung („Konfiguration“) der Objekte in einem latenten
Raum derart, dass die Ähnlichkeitsurteile möglichst gut reproduziert werden.
Methoden der
Psychologie
Latente
Variable
MDS - Faktorenanalyse
Verfahren
Faktorenanalyse
Man möchte Objekte (Personen) in einem Raum latenter Dimensionen
(Fähigkeiten, Traits) anordnen. Gegeben ist ein Set von Beobachtungen
(Messvariablen)
(x1 , x2 ,K , x p )
Problem: Finde latente Variablen
(w1 , w2 ,K , wr )
r p, so dass jede Variable xk eine Linearkombination der wl ist:
xk = bk1w1 + bk 2 w 2 + K + bkr w r
Beispiel:
Das Abschneiden im Abitur mit Deutsch, Mathe, Physik, Latein und Geographie
wird erklärt aus latenten Variablen Memory, Induction, Perceptual Speed, Space,
Verbal Comprehension.
Methoden der
Psychologie
Latente
Variable
MDS - Faktorenanalyse
Verfahren
Multidimensionale Skalierung
Man möchte Objekte (Personen) in einem Raum latenter Dimensionen
anordnen. Gegeben ist ein Set von Beobachtungen über die (sensorischen)
Distanzen der Objekte: (Distanzmatrix)
Problem: Finde latente Variablen
o1 o2
o1 0
o2 d 21 0
D= M M M
o j d j1 d j 2
M M M
on d n1 d n 2
L
oj
L
on
O
L
0
M M O
L d nj L
0
(w1 , w2 ,K , wr )
r n, so dass die Distanzen zwischen den Objekten auf den Koordinaten
reproduziert werden.
Beispiel:
Man lässt Filmschauspieler paarweise nach Ähnlichkeit/Unähnlichkeit bewerten.
Die MDS soll den latenten Wahrnehmungsraum liefern, auf dem die Schauspieler
angeordnet werden können, so dass die Ähnlichkeitsurteile reproduziert werden.
Methoden der
Psychologie
Verfahren
Faktorenanalyse
MDS - Faktorenanalyse
Multidimensionale
Skalierung
Demo - Beispiel mit Excel und Statistica
Methoden der
Psychologie
MDS
Verfahren
MDS
Vorteile
• relevante Eigenschaften dürfen unbekannt sein
(keine Verzerrung durch Vorauswahl)
• kann bereits bei Rangdaten eingesetzt werden (Ergebnisse sind mit metrischer MDS quasi identisch)
Nachteile
• Aggregation über Personen ist problematisch (Bezug
auf verschiedene latente Dimensionen beim Urteil)
• Großer Interpretationsfreiraum beim Untersucher bei
der inhaltlichen Benennung der Dimensionen (vage)
• MDS- Lösung ist nicht algorithmisch (Keine Garantie
die beste Lösung gefunden zu haben)
• MDS Lösung ist von weiteren Parametern abhängig
(Distanzmodell, Anzahl der Dimensionen)
Methoden der
Psychologie
MDS
Verfahren
MDS
StädteBeispiel
Distanzen von Städten in km
Basel Berlin Frank- Ham- Hanno- Kassel Köln
furt
burg ver
Basel
Berlin
Frankfurt
Hamburg
Hannover
Kassel
Köln
München
Nürnberg
Stuttgart
847
337
820
677
517
496
438
437
268
555
294
282
378
569
584
437
634
495
352
193
189
400
228
217
154
307
422
782
609
668
164
287
639
466
526
243
482
309
366
578
405
376
Mün- Nürn- Stutt.
chen berg
167
220
207
Methoden der
Psychologie
MDS
Verfahren
MDS
StädteBeispiel
Rangreihe der Distanzen von Städten
Basel Berlin Frank- Ham- Hanno- Kassel Köln
furt
burg ver
Basel
Berlin
Frankfurt
Hamburg
Hannover
Kassel
Köln
München
Nürnberg
Stuttgart
45
17
44
42
32
31
27
25
11
34
14
12
21
35
37
25
39
30
18
5
4
22
9
7
1
15
24
43
38
41
2
13
40
28
33
10
29
16
19
36
23
20
Mün- Nürn- Stutt.
chen berg
3
8
6
Methoden der
Psychologie
StädteBeispiel
MDS
Verfahren
MDS - Konfiguration
Methoden der
Psychologie
StädteBeispiel
Verfahren
MDS
MDS – Konfiguration nach Rotation und Spiegelung
Methoden der
Psychologie
MDS
Verfahren
MDS
Anwendung
Die MDS ist ein exploratives Verfahren und nicht zur
strengen Hypothesenprüfung geeignet
Probleme
• Auffinden der Konfiguration (relative Lage der Objekte
zueinander im Wahrnehmungsraum, wenn nur die
Distanzen bekannt sind
• Bestimmung der Dimensionalität
• Bestimmung der Metrik
Kommentar
• Die Konfiguration ist unabhängig von Rotation und
Spiegelung
• Es finden fast nur nichtmetrische MDS Prozeduren
Verwendung (Kruskal)
Methoden der
Psychologie
MDS
Verfahren
MDS
Ablauf
1. Messung von Ähnlichkeiten
2. Wahl des Distanzmodells
3. Ermittlung der Konfiguration
4. Zahl und Interpretation der Dimensionen
5. Aggregation von Personen
Methoden der
Psychologie
Verfahren
MDS - 1. Messung von Ähnlichkeiten
Methoden
• Rangreihungsmethode
• Ankerpunktmethode
• Ratingverfahren
Rangreihe
Es werden „n über 2“ Paare geordnet von „unähnlichstes
Paar“ zu „ähnlichstes Paar“ (bei grossem n kaum möglich)
Ankerpunkt
Jedes Objekt ist einmal Vergleichsobjekt (Anker) für alle
anderen Objekte. Es werden soviele Rangreihen wie
Objekte erstellt. Man erhält eine asymmetrische quadratrische Distanzmatrix, die in eine symmetrische überführt
werden kann.
Rating
Probleme:
Man bildet ale möglichen Paare und lässt diese,
randomisiert dargeboten, auf einer Ratingskala nach
Ähnlichkeit bewerten.
Ties (Rangbindungen), Reliabilität der Ränge
Methoden der
Psychologie
Euklidische
Metrik
p=2
MDS - 2. Distanzmodell
Verfahren
æ
d kl = ççå xkv - xlv
çè v= 1
x2
m
4.00
k
d kl
3.00
b
2.00
l
a
1.00
0.00
0.00
1.00
2.00
3.00
4.00
x1
a = xk1 - xl1 = 1- 4 = - 3
b = xk 2 - xl 2 = 3 - 2 = 1
Objektdistanz
d kl =
32 + 12 =
10 = 3.16
1
p p
ö
÷
÷
÷
ø
Methoden der
Psychologie
MinkowskiMetriken
MDS - 2. Distanzmodell
Verfahren
æ
d kl = ççå xkv - xlv
çè v= 1
m
1
p p
ö
÷
÷
÷
ø
p=2
Euklidische Metrik: Abstand der Objekte ist die Länge der
Verbindungslinie.
p=1
City-Block Metrik: Abstand der Objekte ist die Summe der
einzelnen Koordinatendistanzen
p=
Supremum Metrik: Abstand der Objekte ist die größte der
auftretenden Koordinatendistanzen
Wahlkriterium
Metrik muss nach inhaltlichen Gesichtspunkten gewählt
Sein, Abstände werden in diesem Sinne interpretiert.
Methoden der
Psychologie
Konfiguration
ermitteln
MDS - 3. Konfiguration ermitteln
Verfahren
Ausgehend von den Unähnlichkeiten u ist ein möglichst
niedrig dimensionierter Raum zu finden, in dem die
Distanzen d möglichst der Monotoniebeziehung
p=2
Wenn ukl > uij dann d kl > dij
genügen.
Shepard Diagram
Distances d and
D-Hats vs. Dissimilarity u
2.6
Shephard
Diagramm
2.4
2.2
2.0
1.8
1.6
1.4
1.2
Distances/D-Hats
1.0
0.8
0.6
0.4
0.2
0
1
2
3
4
Dissimilarity u
5
6
7
8
Methoden der
Psychologie
MDS - 3. Konfiguration ermitteln
Verfahren
Konfiguration
ermitteln
Unähnlichkeiten u
Rama
1
2
3
4
StartKonfiguration
8
Rama
Homa
Becel
Butter
5
4 Becel 3
2
1
1
4
2; 7
6
3
Becel
1
2
3
4
6
Rama
Homa
Becel
Butter
x1
3
2
1
10
x2
2
7
3
4
Homa 2
7
X2
3
2
5
Homa
Koordinaten x1, x2
10; 4
Butter 4
1; 3
Rama 1
3; 2
0
0 1 2 3 4 5 6 7 8 9 10 11 12
X1
Objekte(k,l)
1;2
1;3
1;4
2;3
2;4
3;4
å
xkv - xlv
1+25=26
4+1=5
49+4=53
1+16=17
64+9=73
81+1=82
2
d(kl)
5.1
2.2
7.3
4.1
8.5
9.1
Rg[d(k,l)]
3
1
4
2
5
6
u(k,l)
3
2
5
1
4
6
Methoden der
Psychologie
Konfiguration
ermitteln
StartKonfiguration
MDS - 3. Konfiguration ermitteln
Verfahren
Shephard - Diagramm
10
9
8
7
6
d(k,l) 5
4
3
2
1
0
Distance d(k,l)
Disparity ^
d(k,l)
0
1
2
3
4
5
6
7
Dissimilarity u(k,l)
Abweichung von Distanz d und Disparität
Gütemaß
”Stress”
d kl - dˆkl
å (
Stress =
k ,l
Faktor
2
)
d̂
Methoden der
Psychologie
MDS - 3. Konfiguration ermitteln
Verfahren
Wahrnehmungsraum
Konfiguration
ermitteln
8
Homa 2
Alte Koordinaten
7
^
Neue Koordinaten
6
Iterative
Optimierung
5
X2
4
Butter 4
3
Becel 3
2
Rama 1
1
0
0
1
2
3
4
5
6
X1
7
8
9 10 11 12
Methoden der
Psychologie
MDS - 3. Konfiguration ermitteln
Verfahren
Wahrnehmungsraum
Konfiguration
ermitteln
8
7
Homa 2
Neue Koordinaten
6
Iterative
Optimierung
5
X2
4
Butter 4
Becel 3
Shephard Diagramm
3
2
Rama 1
Stress berechnen
1
0
0
1
2
3
4
5
6
7
8
9 10 11 12
X1
Gütemaß
”Stress”
Für jeden Iterationsschritt wird Stress bewertet. Iterationen
so lange, bis Stress sich nicht mehr vermindert.
(Stress ist Führungsfunktion für nichtlineare Optimierung.)
Methoden der
Psychologie
Anzahl
Verfahren
MDS - 4. Dimensionen - Interpretation
• Je mehr Dimensionen, desto geringer wird Stress
• Lösungen mit einer geringeren Anzahl von Dimensionen sind einfacher zu interpretieren
• Stress darf nicht 0 werden (uneindeutige Lösung)
Trade-Off von Stress und Interpretierbarkeit
Regeln
Trade-Off
• An Interpretierbarkeit orientieren, ggf. Achsen rotieren
• Stress soll niedrig sein – Anhaltswerte nach Kruskal
• Die Daten sollen einen gewissen Verdichtungsgrad Q
haben, Q soll möglichst groß sein (Tabelle)
Durch Erhöhung der Anzahl der Dimensionen wird trivialerweise eine
Repräsentierbarkeit erreicht. Gleichzeitig strebt aber die Datenverdichtung gegen 1. Erhöhung der Anzahl der Objekte n führt zu besserer
Verdichtung, aber auch zu schlechterer Urteilspräzision.
Methoden der
Psychologie
Verdichtung Q
MDS - 4. Dimensionen - Interpretation
Verfahren
Q=
æn÷
ö
çç ÷
çè2÷
÷
ø
n ×m
=
Anzahl der Ähnlichkeiten
Anzahl der Koordinaten
m = Anzahl Dimensionen
Q - Tabelle
Trade-Off
n
7
8
9
10
11
12
13
m=2
1.5
1.75
2
2.25
2.5
2.75
3
m=3
1
1.17
1.33
1.5
1.67
1.83
2
Trade-Off von hohem Q- Wert & niedrigem Stress-Wert
Methoden der
Psychologie
Stressmaße
MDS - 4. Dimensionen - Interpretation
Verfahren
d kl - dˆkl
SM1 =
å (
å
d kl - dˆkl
2
å (
)
k ,l
d
SM 2 =
2
kl
k,l
Stress-Güte
Richtwert
Güte
gering
ausreichend
gut
ausgezeichnet
perfekt
2
)
k ,l
2
å (d kl - d )
k,l
SM1
0.2
0.1
0.05
0.025
0
SM2
0.4
0.2
0.1
0.05
0
Werte zwischen gut und ausgezeichnet ergeben einen
relativ glatten Anstieg im Shephard Diagramm
Methoden der
Psychologie
Anzahl
Verfahren
MDS - 5. Aggregation
Die MDS als klassisches Verfahren dient der Ermittlung
der Konfiguration einer Person. Aggregationen werden
durchgeführt:
• Über die Ähnlichkeitsdaten wird aggregiert
• Über die Konfigurationen wird aggregiert
• Über spezielle Rechenverfahren werden MDS Analysen
über die Ähnlichkeitsdaten mehrerer Personen
(replicated MDS) durchgeführt
Diskussion
Vor-und Nachteile der Techniken abwägen
Herunterladen