Vortrag - evidence-based

Werbung
Mixture modeling
Holger Steinmetz and Peter Schmidt
University of Giessen / Germany
Überblick

Beobachtete vs. unbeobachtete Populationsheterogenität

Konzept der „kategorialen latenten Variable“

Latent class analyse (LCA) und finite mixtures

Anwendungsmöglichkeiten

Ein empirisches Beispiel: latent profile Analyse der 10
Werthaltungen (Schwartz, 1992) und Zusammenhänge mit
demografischen Variablen
Beobachtete vs. unbeobachtete Populationsheterogenität



Gibt es Subpopulationen mit unterschiedlichen Parametern?
Parameter:
- Antwortwahrscheinlichkeiten
- Verteilungsmittelwerte und –varianzen
- Modellparameter (Faktorladungen, Regressionskoeffizienten etc.)
Beobachtete Heterogenität
- Gruppenzugehörigkeit ist bekannt
- Analysen: t-Test, ANOVA, multigroup-Analysen
Beobachtete vs. unbeobachtete Populationsheterogenität



Unbeobachtete Heterogenität: Gruppenzugehörigkeit ist unbekannt
Ziele des mixture modeling:
- Wieviele Subpopulationen („latent classes“) gibt es?
- Welche Parameter gelten in ihnen?
- Zuordnungswahrscheinlichkeiten für die Individuen der Stichprobe
Anwendungsgebiete:
- Klinische Psychologie: Psychische Störungen als latente Klassen
- Marktforschung: Marktsegmentierung
- Pädagogische Psychologie: Mastery-Typen in der Schule
Latent Class Analyse (LCA)


Begründet durch Lazarsfeld und Henry (1968), Goodman (1974),
Clogg (1995) u.a.
Dichotome / binäre items (uj)
C


U
C = latente kategoriale Variable mit 1, 2, …k Kategorien
Ziele / Ergebnis:
- Klassenspezifische Wahrscheinlichkeiten: P(u=1 | c=k)
Beispiel zwei Klassen (k = 2):
Pc=1(u = 1) = .85
Pc=2(u = 1) = .40
Wahrscheinlichkeit der Klassenzugehörigkeit: P(c = k)
- Posterior-Wahrscheinlichkeit: P(c=k | u=1)
-
Latent Class Analyse (LCA)

Erweiterung: Die latente Klassenvariable erklärt die Kovarianz mehrerer
Items (lokale stochastische Unabhängigkeit)
U1
C
U2
Latent Class Analyse (LCA)
U1: „Kontollverlust beim Trinken von
Alkohol?“
U2: „Blackout nach dem
Trinken?“
ja
nein
ja
5%
8%
nein
9%
78%
Latent Class Analyse (LCA)
Blackout
Kontrollverlust
ja
ja
nein
5%
8%
Kontrollverlust
C
nein
9%
78%
Blackout
Klasse 1: Normale Trinker
Klasse 2: Problemtrinker
Latent Class Analyse (LCA)
Kontrollverlust
Blackout
ja
ja
nein
nein
5%
8%
9%
78%
ja
nein
Blackout
Kontrollverlust
Kontrollverlust
ja
ja
nein
1%
10%
5%
86%
P(c=k) :
C
Problemtrinker
.85
Blackout
Blackout
Normale Trinker
Kontrollverlust
ja
nein
nein
79%
11%
9%
1%
.15
Latent Class Analyse (LCA)
Kontrollverlust
Blackout
ja
ja
nein
nein
5%
8%
9%
78%
Kontrollverlust
C
Blackout
Posterior-Wahrscheinlichkeiten P(c=k | u=1)
Normale
Trinker
Problemtrinker
S
Kontrollverlust
.24
.76
1.0
Blackout
.39
.61
1.0
Latent Profile Analyse (LPA)


LCA mit kontinuierlich verteilten Items
Die Klassen unterscheiden sich in ihren Mittelwerten
Common factor model
Quelle: Bauer, D. J., & Curran, P. J. (2004). The integration of continuous and discrete latent variable models: Potential
problems and promising opportunities. Psychological Methods, 9 (1), 3-29.
Latent Profile Analyse (LPA)


LCA mit kontinuierlich verteilten Items
Die Klassen unterscheiden sich in ihren Mittelwerten
Common factor model
LPA
Quelle: Bauer, D. J., & Curran, P. J. (2004). The integration of continuous and discrete latent variable models: Potential
problems and promising opportunities. Psychological Methods, 9 (1), 3-29.
Mixture modeling
s2
m
Mixture modeling
s2
s2 2
1
m1
m2
Mixture modeling
f ( x) 
( .5 )( x  m ) 2
1
2s
2
e
s2
Mixture modeling
f 1( x) 
1
2s 1
2
e
( .5 )( x  m 1) 2
s 21
s2
f 2( x) 
s2 2
1
m1
m2
1
2s 2
2
e
( .5 )( x  m 2 ) 2
s22
Mixture modeling
f 1( x) 
1
2s 1
2
e
( .5 )( x  m 1) 2
s 21
f 2( x) 
1
2s 2
2
Likelihood für Person i = 1*f1(x) + 2*f2(x)
s2
s2 2
1
m1
m2
e
( .5 )( x  m 2 ) 2
s22
Mixture modeling
f 1( x) 
1
2s 1
2
e
( .5 )( x  m 1) 2
s 21
f 2( x) 
1
2s 2
2
Likelihood für Person i = 1*f1(x) + 2*f2(x)
s2
s2 2
1
m1
m2
e
( .5 )( x  m 2 ) 2
s22
Mixture modeling
f 1( x) 
1
2s 1
2
e
( .5 )( x  m 1) 2
s 21
f 2( x) 
1
2s 2
2
Likelihood für Person i = 1*f1(x) + 2*f2(x)
s2
s2 2
1
m1
m2
e
( .5 )( x  m 2 ) 2
s22
Mixture modeling
f 1( x) 
1
2s 1
2
e
( .5 )( x  m 1) 2
s 21
f 2( x) 
1
2s 2
2
Likelihood für Person i = 1*f1(x) + 2*f2(x)
s2
s2 2
1
m1
m2
e
( .5 )( x  m 2 ) 2
s22
Mixture modeling
f 1( x) 
1
2s 1
2
e
( .5 )( x  m 1) 2
s 21
f 2( x) 
1
2s 2
2
Likelihood für Person i = 1*f1(x) + 2*f2(x)
s2
s2 2
1
m1
m2
e
( .5 )( x  m 2 ) 2
s22
Mixture modeling
f 1( x) 
1
2s 1
2
e
( .5 )( x  m 1) 2
s 21
f 2( x) 
1
2s 2
2
Likelihood für Person i = 1*f1(x) + 2*f2(x)
s2
s2 2
1
m1
m2
e
( .5 )( x  m 2 ) 2
s22
Mixture modeling
f 1( x) 
1
2s 1
2
e
( .5 )( x  m 1) 2
s 21
f 2( x) 
1
2s 2
2
Likelihood für Person i = 1*f1(x) + 2*f2(x)
s2
s2 2
1
m1
m2
e
( .5 )( x  m 2 ) 2
s22
Mixture modeling
f 1( x) 
1
2s e1
2
e
( .5)( y   x ) 2
s 2 e1
s2
f 2( x) 
s2 2
1
m1
m2
1
2s e2
2
e
( .5 )( y   x ) 2
s 2e 2
Erweiterungen der finite mixtures
u1
x
C
u2
u3
u4
Erweiterungen der finite mixtures
y
u1
Y
C=2
u2
u3
u4
C
x2
C=1
x1
Mixture Regressionsanalyse
X1
Erweiterungen der finite mixtures
C
x1
x
x2
x3
x4
Mixture CFA
Erweiterungen der finite mixtures
C
x1
y1
x2
y2
x3
x
h
y3
x4
y4
Mixture SEM
Erweiterungen der finite mixtures
X T1
X T2
X T3
Intcpt.
X T4
Slp
C
Mixture Growth curve model
Slp2
Evaluation der Klassenanzahl


Fitmaße
- Likelihood-ratio test: Nicht anwendbar
- Vuong-Lo-Mendell-Rubin LR-Test
- BIC = -2 logL + Anzahl der Parameter * ln(n)
Güte der Klassifikation: Entropie
Evaluation der Klassenanzahl
Evaluation der Klassenanzahl

Fitmaße
- Likelihood-ratio test: Nicht anwendbar
- Vuong-Lo-Mendell-Rubin LR-Test
- BIC = -2 logL + Anzahl der Parameter * ln(n)

Güte der Klassifikation: Entropie

Plausbilität
Ein empirisches Beispiel:
Latent profile analyse von Werthaltungen


Stichprobe: N = 1677 Personen aus der allgemeinen
erwerbstätigen Bevölkerkung
Messinstrument
- Portraits Values Questionnaire (Schwartz, 2001)
- Demografische Merkmale (Geschlecht, Alter, Bildung)
Ein empirisches Beispiel:
Latent profile analyse von Werthaltungen
Openness to Change
Self-transcendence
Selfdirection
Universalism
Stimulation
Benevolence
Hedonism
Conformity
Achievement
Power
Self-enhancement
Tradition
Security
Conservation
Ein empirisches Beispiel: Latent profile analyse von
Werthaltungen
Ach
SD
Hed
Stim
Ben
Uni
Geschlecht
Trad
Alter
Bildung
dummy1
Bildung
dummy2
C
Sec
Con
Pow
Ein empirisches Beispiel: Latent profile analyse von
Werthaltungen
1.5
1
0.5
Latent Class 1
0
ACH
SD
HED
BEN
UNI
STIM
SEC
TRAD
POW
CON
Latent Class 2
Latent Class 3
Latent Class 4
-0.5
-1
-1.5
LC1
12%
Wichtig: Spaß, Stimulation, Selbstbestimmung
Unwichtig: Sicherheit, Tradition und Konformität, Benevolenz, Universalismus
“Hedonisten”
LC2
34%
Alles unwichtig
“Nihilisten”
LC3
29%
Wichtig: Benevolenz, Universalismus, Sicherheit
Unwichtig: Leistung, Stimulation, Selbstbestimmung und Macht
“Altruisten”
LC4
25%
Alles wichtig
“Ja-Sager”
Ein empirisches Beispiel: Latent profile analyse von
Werthaltungen
55
50
45
40
35
30
25
20
Hedonisten
Nihilisten
Altruisten
Ja-Sager
Ein empirisches Beispiel: Latent profile analyse von
Werthaltungen
Hedonisten
Nihilisten
Altruisten
Ja-Sager
40%
40%
30%
29%
21%
16%
14%
10%
Männer
Frauen
Ein empirisches Beispiel: Latent profile analyse von
Werthaltungen
Hedonisten
Nihilisten
Altruisten
41%
Ja-Sager
39%
32% 33%
30%
27%
26%
23%
21%
17%
9%
3%
Hauptschule
Realschule
Abitur
Herunterladen