Nagl, Modelle mit latenten Variablen, Schätzen und Testen Seite 1 Schätzung der Modellparameter. N Gegeben sei die Kovarianzmatrix der Stichprobe S mit den Elementen: s ij 1 N* (y i y i )( y j y j ) . Diese 1 Kovarianzmatrix (OHNE Restriktion durch das Modell) enthält die üblichen Stichproben-Kovarianzen und Varianzen der p+q manifesten Variablen. In Spezialfällen kann auch die Korrelationsmatrix oder die Momentenmatrix verwendet werden. Beispiel: Kovarianzmatrix aus der Entfremdungs-Stichprobe geschätzt S V1 V2 V3 V4 V5 V6 V1 11.83 6.95 6.82 4.78 -3.84 -21.90 V2 6.95 9.36 5.09 5.03 -3.89 -18.83 V3 6.82 5.09 12.53 7.49 -3.84 -21.75 V4 4.78 5.03 7.49 9.99 -3.63 -18.77 V5 -3.84 -3.89 -3.84 -3.63 9.61 35.52 V6 -21.90 -18.83 -21.75 -18.78 35.52 450.29 Andererseits können die Kovarianzen auch unter Geltung der Modellannahmen geschätzt werden. Auf Grund der Modellannahmen werden bestimmte Parameter (= ) geschätzt; mit Hilfe dieser geschätzten Parameter (= θ̂ ) werden die Varianzen und Kovarianzen berechnet. Diese Kovarianzmatrix sei mit C abgekürzt (bzw. = (θˆ ) ). Die Matrix C berücksichtigt die Forderungen des Modells im Sinne einer Restriktion bzw. einer Hypothese (Hm). Beispiel: Kovarianzmatrix auf Grund des Modell 1 restringiert. Mit Hilfe der geschätzten Parameter berechnet C V1 V2 V3 V4 V5 V6 V1 11.90 6.91 6.83 4.93 -4.17 -22.38 V2 6.91 9.35 4.93 5.02 -3.47 -18.64 V3 6.83 4.93 12.62 7.50 -4.07 -21.83 V4 4.93 5.02 7.50 9.85 -3.39 -18.18 V5 -4.17 -3.47 -4.07 -3.39 9.61 35.52 V6 -22.38 -18.64 -21.83 -18.18 35.52 450.29 Beispiel: Unter Geltung eines Unabhängigkeits-Modells, bei dem gefordert würde, dass die Variablen unabhängig sind, würden die Kovarianzen 0 sein müssen. D.h. die Matrix C würde in der Diagonale die Varianzen der Variablen enthalten, außerhalb der Diagonalen müssten alle Kovarianzen 0 sein. Das Ziel der Schätzung ist dann, solche Schätzwerte für die Parameter zu finden, die den Unterschied zwischen S und C möglichst klein macht. Beispiel: Differenz = Residualmatrix S- C V1 V2 V3 V4 V5 V6 V1 -0.07 0.04 -0.01 -0.15 0.33 0.48 V2 0.04 0.01 0.16 0.01 -0.42 -0.19 V3 -0.01 0.16 -0.08 -0.01 0.22 0.08 V4 -0.15 0.01 -0.01 0.14 -0.24 -0.59 V5 0.33 -0.42 0.22 -0.24 0.00 0.00 V6 0.48 -0.19 0.08 -0.59 0.00 0.00 Einige der üblichen Kriterien sind: Ungewichtete Kleinste Quadrat-Schätzung(ULS): F 0.5 * Spur[(C S) 2 ] . Generalisierte Kleinste Quadrat-Schätzung(GLS): F 0.5 * Spur[(S 1 (C S)) 2 ] . Normal-Verteilungs ML-Schätzung(ML): F Spur[(SC1 ) (p q) ln(Det(C)) ln(Det(S))] . Diese Kriterien können auch allgemein durch eine Formel dargestellt werden: F 0.5 * Spur[(W 1 (C S)) 2 ] , wobei die Gewichtungsmatrix W unterschiedlich zu wählen ist: für ULS wird W als Identische Matrix I, für GLS als Matrix S und für ML als Matrix C (hat Browne(1982) gezeigt). Weitere Kriterien sind das gewichtete Kleinste Quadrate-Kriterium (WLS,ADF) und das diagonal gewichtete kleinste Quadrate-Kriterium (DWLS). Nagl, Modelle mit latenten Variablen, Schätzen und Testen Seite 2 Bemerkungen zum ML-Kriterium für normalverteilte Daten: Es wird unterstellt, dass die (p+q) Variablen in der Population normalverteilt sind. Im zentrierten Fall (alle Mity y 1 telwerte gleich 0) gilt die Dichte: f ( ) exp( 12 (y x C 1 ) . Dabei ist C die Vari( p q ) x x (2) Det (C) anz-Kovarianzmatrix ( der y- und x-Werte) in der Population, die auf Grund des Modells in einem gedachten Generierungprozess entstanden ist. Für eine Stichprobe der Größe N kann die Likelihood folgendermaßen dargestellt werden 1: N 1 L exp( 12 ( N Spur(S C 1 ) )) bzw. ( p q ) (2) Det (C) ln(L) 0.5((p q) N ln(2) N ln(Det(C)) N Spur(SC1)) . N (( p q) ln( 2) ln( Det (C)) Spur(SC 1 )) . Diese Likelihood wird 2 maximiert durch die Variation der Parameterwerte, die dann ML-Schätzer heißen. Nach Ausklammern von N: ln( L) Mit Hilfe dieser Likelihood wird ein Likelihood-Ratio-Test konstruiert, indem das Modell mit dem saturierten Modell verglichen wird. Das saturierte Modell hat exakt so viele Parameter wie die Elemente der Kovarianzmatrix. Ohne Restriktion ist daher die restringierte Kovarianzmatrix C gleich S. Das Maximum von Ln( Likelihood ) kann daher in diesem Fall folgendermaßen vereinfacht werden: N N sup ln(L) (( p q) ln(2) ln(Det (S)) Spur(SS 1 )) (( p q) ln( 2) ln( Det (S)) (p q)) 2 2 saturiert Der nat. Log. des Likelihood-Verhältnis ist: sup (L) ln() ln( Modell Re str ) sup (ln( L)) sup (ln( L)) sup (L) Modell Re str Saturiert Saturiert N N (( p q) ln( 2) ln( Det (C)) Spur(SC 1 )) (( p q) ln( 2) ln( Det (S)) (p q)) 2 2 N (ln( Det (C)) ln( Det (S)) Spur(SC 1 ) (p q)) . 2 Der negative verdoppelte natürliche Logarithmus des Likelihood-Verhältnisses ist unter Geltung der Hypothese (=Modellrestriktion) approximativ Chi**2 – verteilt: 2 ln() N(ln(Det(C)) ln(Det(S)) Spur(SC1 ) (p q)) N FM ~ 2 (df ) . Die Freiheitsgrade df werden i.a. folgendermaßen berechnet: df = Anzahl der Parameter des saturierten Modells – Anzahl Parameter des restringierten Modells Bemerkungen zum ‚Basis’-Modell bzw. Null-Modell. Das ‚Unabhängigkeitsmodell wird oft auch als Basismodell bezeichnet (manchmal auch als Null-Modell). Die ML-Schätzung des Unabhängigkeitsmodells sieht für die Kovarianzmatrix in der Diagonalen Varianzen, außerhalb der Diagonalen 0-en vor. 1 Hier wird momentan die Unterschiedlichkeit von N (wegen Erwartunbgstreue-Überlegungen vernachlässigt). N 1, falls Kovarianz bwz. Korrelatio n analyssiert wird Sonst gelten folgende Ankürzungen: N * falls keine Mittelwert e geschätzt werden. N, Nagl, Modelle mit latenten Variablen, Schätzen und Testen Seite 3 Die so restringierte Matrix kann durch die Diagonalmatrix ML-geschätzt werden: C = Diag(S). Das ergibt für das LR-Kriterium 2 ln() N(ln(Det(Diag(S))) ln(Det(S)) Spur(SDiag(S) 1 ) (p q)) = N( ln(s ii ) ln( Det (S))) =: N*F0 = mit: 02 (df ). df0 = (p+q) ((p+q)+1)/2 – (p+q) = (p+q)( (p+q+1)/2 – 1). Einige Indizes zur Beurteilung der Anpassung (Fit). GFI 1 Spur ( W 1 (S C)) 2 1 Spur ( W (S)) AGFI (p q )( p q 1) 1 (1 GFI ) 2df RMR pq 2 ( p q )( p q 1) PGFI Informationskriterien: 2 i (s ij c ij ) 2 i 1 j1 df GFI df 0 AIC 2 2df CAIC 2 (ln(N* ) 1)df LR-Test-Kriterium RMSEA Index Prob. of Close Fit Z-Test (Wilson & Hilferty) SBC 2 ln( N* )df ECVI 2 (df ) a max( F 1 ,0) df N * ‚p-Wert’ für erweiterte H0 3 df 2 Z (1 92df ) 2 9df Bentler-Bonett- Normed-Delta F0 FM F0 Goodness of Fit –Index (zwischen 0 und 1) Adjustierter GFI Wurzel aus dem Mittel der quadrierten Residuen Parsimonious GFI (berücksichtigt Abweichung vom Unabhängigkeitsmodell) An Information Criterion Consistent AIC Schwarz-Bayes’sches C. Expected Cross Validation Index Anpassungs-Chi**2 Root-Mean-Square-Abweichung (sollte in etwa ca. <= 0.05 sein) H0: a0.05 (statt klassisch: a=0) Approximation des –verteilten F durch Normalverteilten z-Wert Fehlerreduktion, Fehlermaß = F: F0 Fehler bei Unabh.-Modell, FM = Fehler bei vorliegendem Modell df F0 FM df 0 F0 Mit Abweichung vom Unabhängigkeitsmodell gewichtetes Delta Bentler-Bonett- Non-Normed F0 / df 0 FM / df F0 / df 0 1 / N * Fehlerreduktion, Fehlermaß = F pro Freiheitsgrad Normed Rho 1 (Bollen) F0 / df 0 FM / df F0 / df 0 Fehlerreduktion, Fehlermaß = F pro Freiheitsgrad Normed Delta 2 (Bollen) F0 FM F0 df / N * Fehlerreduktion, Fehlermaß = F Parsimonious Normed Fit (James, Mulaik, Brett) Delta Critical N Index CN ‚Kritisches’ N: ab welchem N ist das Ergebnis signifikant (auf 5%Niveau) wäre