Mixture modeling Holger Steinmetz and Peter Schmidt University of Giessen / Germany Überblick Beobachtete vs. unbeobachtete Populationsheterogenität Konzept der „kategorialen latenten Variable“ Latent class analyse (LCA) und finite mixtures Anwendungsmöglichkeiten Ein empirisches Beispiel: latent profile Analyse der 10 Werthaltungen (Schwartz, 1992) und Zusammenhänge mit demografischen Variablen Beobachtete vs. unbeobachtete Populationsheterogenität Gibt es Subpopulationen mit unterschiedlichen Parametern? Parameter: - Antwortwahrscheinlichkeiten - Verteilungsmittelwerte und –varianzen - Modellparameter (Faktorladungen, Regressionskoeffizienten etc.) Beobachtete Heterogenität - Gruppenzugehörigkeit ist bekannt - Analysen: t-Test, ANOVA, multigroup-Analysen Beobachtete vs. unbeobachtete Populationsheterogenität Unbeobachtete Heterogenität: Gruppenzugehörigkeit ist unbekannt Ziele des mixture modeling: - Wieviele Subpopulationen („latent classes“) gibt es? - Welche Parameter gelten in ihnen? - Zuordnungswahrscheinlichkeiten für die Individuen der Stichprobe Anwendungsgebiete: - Klinische Psychologie: Psychische Störungen als latente Klassen - Marktforschung: Marktsegmentierung - Pädagogische Psychologie: Mastery-Typen in der Schule Latent Class Analyse (LCA) Begründet durch Lazarsfeld und Henry (1968), Goodman (1974), Clogg (1995) u.a. Dichotome / binäre items (uj) C U C = latente kategoriale Variable mit 1, 2, …k Kategorien Ziele / Ergebnis: - Klassenspezifische Wahrscheinlichkeiten: P(u=1 | c=k) Beispiel zwei Klassen (k = 2): Pc=1(u = 1) = .85 Pc=2(u = 1) = .40 Wahrscheinlichkeit der Klassenzugehörigkeit: P(c = k) - Posterior-Wahrscheinlichkeit: P(c=k | u=1) - Latent Class Analyse (LCA) Erweiterung: Die latente Klassenvariable erklärt die Kovarianz mehrerer Items (lokale stochastische Unabhängigkeit) U1 C U2 Latent Class Analyse (LCA) U1: „Kontollverlust beim Trinken von Alkohol?“ U2: „Blackout nach dem Trinken?“ ja nein ja 5% 8% nein 9% 78% Latent Class Analyse (LCA) Blackout Kontrollverlust ja ja nein 5% 8% Kontrollverlust C nein 9% 78% Blackout Klasse 1: Normale Trinker Klasse 2: Problemtrinker Latent Class Analyse (LCA) Kontrollverlust Blackout ja ja nein nein 5% 8% 9% 78% ja nein Blackout Kontrollverlust Kontrollverlust ja ja nein 1% 10% 5% 86% P(c=k) : C Problemtrinker .85 Blackout Blackout Normale Trinker Kontrollverlust ja nein nein 79% 11% 9% 1% .15 Latent Class Analyse (LCA) Kontrollverlust Blackout ja ja nein nein 5% 8% 9% 78% Kontrollverlust C Blackout Posterior-Wahrscheinlichkeiten P(c=k | u=1) Normale Trinker Problemtrinker S Kontrollverlust .24 .76 1.0 Blackout .39 .61 1.0 Latent Profile Analyse (LPA) LCA mit kontinuierlich verteilten Items Die Klassen unterscheiden sich in ihren Mittelwerten Common factor model Quelle: Bauer, D. J., & Curran, P. J. (2004). The integration of continuous and discrete latent variable models: Potential problems and promising opportunities. Psychological Methods, 9 (1), 3-29. Latent Profile Analyse (LPA) LCA mit kontinuierlich verteilten Items Die Klassen unterscheiden sich in ihren Mittelwerten Common factor model LPA Quelle: Bauer, D. J., & Curran, P. J. (2004). The integration of continuous and discrete latent variable models: Potential problems and promising opportunities. Psychological Methods, 9 (1), 3-29. Mixture modeling s2 m Mixture modeling s2 s2 2 1 m1 m2 Mixture modeling f ( x) ( .5 )( x m ) 2 1 2s 2 e s2 Mixture modeling f 1( x) 1 2s 1 2 e ( .5 )( x m 1) 2 s 21 s2 f 2( x) s2 2 1 m1 m2 1 2s 2 2 e ( .5 )( x m 2 ) 2 s22 Mixture modeling f 1( x) 1 2s 1 2 e ( .5 )( x m 1) 2 s 21 f 2( x) 1 2s 2 2 Likelihood für Person i = 1*f1(x) + 2*f2(x) s2 s2 2 1 m1 m2 e ( .5 )( x m 2 ) 2 s22 Mixture modeling f 1( x) 1 2s 1 2 e ( .5 )( x m 1) 2 s 21 f 2( x) 1 2s 2 2 Likelihood für Person i = 1*f1(x) + 2*f2(x) s2 s2 2 1 m1 m2 e ( .5 )( x m 2 ) 2 s22 Mixture modeling f 1( x) 1 2s 1 2 e ( .5 )( x m 1) 2 s 21 f 2( x) 1 2s 2 2 Likelihood für Person i = 1*f1(x) + 2*f2(x) s2 s2 2 1 m1 m2 e ( .5 )( x m 2 ) 2 s22 Mixture modeling f 1( x) 1 2s 1 2 e ( .5 )( x m 1) 2 s 21 f 2( x) 1 2s 2 2 Likelihood für Person i = 1*f1(x) + 2*f2(x) s2 s2 2 1 m1 m2 e ( .5 )( x m 2 ) 2 s22 Mixture modeling f 1( x) 1 2s 1 2 e ( .5 )( x m 1) 2 s 21 f 2( x) 1 2s 2 2 Likelihood für Person i = 1*f1(x) + 2*f2(x) s2 s2 2 1 m1 m2 e ( .5 )( x m 2 ) 2 s22 Mixture modeling f 1( x) 1 2s 1 2 e ( .5 )( x m 1) 2 s 21 f 2( x) 1 2s 2 2 Likelihood für Person i = 1*f1(x) + 2*f2(x) s2 s2 2 1 m1 m2 e ( .5 )( x m 2 ) 2 s22 Mixture modeling f 1( x) 1 2s 1 2 e ( .5 )( x m 1) 2 s 21 f 2( x) 1 2s 2 2 Likelihood für Person i = 1*f1(x) + 2*f2(x) s2 s2 2 1 m1 m2 e ( .5 )( x m 2 ) 2 s22 Mixture modeling f 1( x) 1 2s e1 2 e ( .5)( y x ) 2 s 2 e1 s2 f 2( x) s2 2 1 m1 m2 1 2s e2 2 e ( .5 )( y x ) 2 s 2e 2 Erweiterungen der finite mixtures u1 x C u2 u3 u4 Erweiterungen der finite mixtures y u1 Y C=2 u2 u3 u4 C x2 C=1 x1 Mixture Regressionsanalyse X1 Erweiterungen der finite mixtures C x1 x x2 x3 x4 Mixture CFA Erweiterungen der finite mixtures C x1 y1 x2 y2 x3 x h y3 x4 y4 Mixture SEM Erweiterungen der finite mixtures X T1 X T2 X T3 Intcpt. X T4 Slp C Mixture Growth curve model Slp2 Evaluation der Klassenanzahl Fitmaße - Likelihood-ratio test: Nicht anwendbar - Vuong-Lo-Mendell-Rubin LR-Test - BIC = -2 logL + Anzahl der Parameter * ln(n) Güte der Klassifikation: Entropie Evaluation der Klassenanzahl Evaluation der Klassenanzahl Fitmaße - Likelihood-ratio test: Nicht anwendbar - Vuong-Lo-Mendell-Rubin LR-Test - BIC = -2 logL + Anzahl der Parameter * ln(n) Güte der Klassifikation: Entropie Plausbilität Ein empirisches Beispiel: Latent profile analyse von Werthaltungen Stichprobe: N = 1677 Personen aus der allgemeinen erwerbstätigen Bevölkerkung Messinstrument - Portraits Values Questionnaire (Schwartz, 2001) - Demografische Merkmale (Geschlecht, Alter, Bildung) Ein empirisches Beispiel: Latent profile analyse von Werthaltungen Openness to Change Self-transcendence Selfdirection Universalism Stimulation Benevolence Hedonism Conformity Achievement Power Self-enhancement Tradition Security Conservation Ein empirisches Beispiel: Latent profile analyse von Werthaltungen Ach SD Hed Stim Ben Uni Geschlecht Trad Alter Bildung dummy1 Bildung dummy2 C Sec Con Pow Ein empirisches Beispiel: Latent profile analyse von Werthaltungen 1.5 1 0.5 Latent Class 1 0 ACH SD HED BEN UNI STIM SEC TRAD POW CON Latent Class 2 Latent Class 3 Latent Class 4 -0.5 -1 -1.5 LC1 12% Wichtig: Spaß, Stimulation, Selbstbestimmung Unwichtig: Sicherheit, Tradition und Konformität, Benevolenz, Universalismus “Hedonisten” LC2 34% Alles unwichtig “Nihilisten” LC3 29% Wichtig: Benevolenz, Universalismus, Sicherheit Unwichtig: Leistung, Stimulation, Selbstbestimmung und Macht “Altruisten” LC4 25% Alles wichtig “Ja-Sager” Ein empirisches Beispiel: Latent profile analyse von Werthaltungen 55 50 45 40 35 30 25 20 Hedonisten Nihilisten Altruisten Ja-Sager Ein empirisches Beispiel: Latent profile analyse von Werthaltungen Hedonisten Nihilisten Altruisten Ja-Sager 40% 40% 30% 29% 21% 16% 14% 10% Männer Frauen Ein empirisches Beispiel: Latent profile analyse von Werthaltungen Hedonisten Nihilisten Altruisten 41% Ja-Sager 39% 32% 33% 30% 27% 26% 23% 21% 17% 9% 3% Hauptschule Realschule Abitur