Kapitel 3: Strukturgleichungsmodelle Strukturgleichung: Gleichung zur Repräsentation des kausalen Einflusses einer Menge von unabhängigen Variablen auf eine abhängige Variable y: f() symbolisiert eine nicht näher spezifizierte Funktion, welche die kausale Beziehung zwischen dem Effekt y und den Ursachen repräsentiert. Kapitel 3: Strukturgleichungsmodelle Lineare Strukturgleichungen: haben die Form einer Regressionsgleichung: mit den Regressionsgewichten: Diese werden auch strukturelle Koeffizienten oder Strukturkoeffizienten genannt (Auch Ladungskoeffizienten oder Ladungen, siehe später). Kapitel 3: Strukturgleichungsmodelle Strukturgleichungsmodelle: Systeme von Strukturgleichungen: Abhängige Variablen können als unabhängige Variablen in anderen Gleichungen fungieren (»Verkettung«). Kapitel 3: Strukturgleichungsmodelle Lineare Strukturgleichungsmodelle: Systeme linearer Strukturgleichungen: Notation: Reihenfolge der Indizes: Index der AV vor Index der UV. Kapitel 3: Strukturgleichungsmodelle Lineare Strukturgleichungsmodelle: Bezeichungen: SEM = Structural equation models (modeling) LISREL = Linear Structural Relations (System linearer Strukturgleichungen oder ein Programm zur Schätzung dieser Modelle) Kapitel 3: Strukturgleichungsmodelle Kausaldiagramme: Graph bestehen aus Knoten und Kanten: Knoten repräsentierten Variablen. Kanten repräsentieren Relationen (kausale und nicht-kausale). Kapitel 3: Strukturgleichungsmodelle Kausaldiagramme: 1. Kreise und Rechtecke repräsentieren Variablen: 1 ,2 , 1 ,2 , 𝑌1 , 𝑌2 . 2. Kreise repräsentieren unbeobachtete, latente Variablen:1 ,2 , 1 ,2 , Rechtecke beobachtete: 𝑌1 , 𝑌2 . 3. Die Pfeile stellen kausalen Einflüsse dar, wobei die genaue Art und Weise (z.B. linear), sowie die Stärke (vorerst) nicht genau bestimmt ist. Kapitel 3: Strukturgleichungsmodelle Kausaldiagramme: 4. Doppelpfeile repräsentieren kausal nicht näher spezifizierte Korrelationen (bzw. Kovarianzen) zwischen den Variablen. Die Abwesenheit eine Doppelpfeils signalisiert die Abwesenheit einer Korrelation bzw. Kovarianz (Die Korrelation oder Kovarianz zwischen den Variablen ist gleich Null). Kapitel 3: Strukturgleichungsmodelle Kausaldiagramme: 5. Unterscheidung zwischen exogenen und endogenen Variablen: Exogene Variablen sind jene, die im Modell nicht erklärt werden: Das Modell dient nicht dazu, deren Verteilung bzw. Kovarianzstruktur (im linearen Modell) zu erklären. Auf exogene Variablen ist daher kein Pfeil gerichtet und Kovarianzbögen können nur zwischen exogenen Variablen vorliegen. Kapitel 3: Strukturgleichungsmodelle Kausaldiagramme: 5. Unterscheidung zwischen exogenen und endogenen Variablen (Fortsetzung): Exogene Variablen im Modell sind: X,1 ,2 , 1 ,2 . Endogene Variablen: Deren Verteilung bzw. Kovarianzstruktur wird durch das Modell erklärt. Zwischen endogenen Variablen gibt es keine Kovarianzbögen. Im Modell: 𝑌1 , 𝑌2 . Kapitel 3: Strukturgleichungsmodelle Kausaldiagramme: 6. Endogene Variablen und Fehlerterme: Gewöhnlich werden für die endogenen Variablen zusätzlich zu den eigentlichen Ursachenvariablen Fehler- bzw. Residuenterme als weitere latente Ursachenvariablen hinzugefügt. Diese repräsentieren alle im Modell vernachlässigten Ursachen. Fehlerterme im Modell: 1 ,2 . Kapitel 3: Strukturgleichungsmodelle Lineare Kausalmodelle: Kausale Beziehungen sind linear und die Kovarianzbögen repräsentieren Kovarianzen (Korrelationen). Modellparameter: 1. Varianzen und Kovarianzen der exogenen Variablen: Welche keine Fehler repräsentieren: 21 , 22 , 12 , 2𝑋 . Welche Fehler repräsentieren: 21 , 22 . Kapitel 3: Strukturgleichungsmodelle Lineare Kausalmodelle: Modellparameter: 2. Strukturelle Parameter (Regressionskoeffizienten): Zwischen beobachteten exogenen und endogenen Variablen: 𝛾𝑌1𝑋 , 𝛾𝑌2𝑋 . Zwischen latenten und beobachteten Variablen (Ladungskoeffizienten: 𝑌11 , 𝑌22 . Zwischen endogenen Variablen: 𝛽𝑌2𝑌1 . Kapitel 3: Strukturgleichungsmodelle Ermittlung der linearen Strukturgleichungen aus dem kausalen Diagramm: 1. Für jede endogene Variable wird eine Gleichung erzeugt. Es gibt daher so viele Gleichungen, wie es endogene Variablen. 2. Die endogene Variable erscheint auf der linken Seite und alle Variablen, von denen ein Pfeil auf die endogene Variable hinführt, erscheinen auf der rechten Seite der Gleichung. Die strukturellen Koeffizenten bilden die Regressionsgewichte. 3. Die Regressionsgewichte für die Fehlerterme sind 1.0. Kapitel 3: Strukturgleichungsmodelle Bsp. 3-1: Ermittlung der linearen Strukturgleichungen: Kapitel 3: Strukturgleichungsmodelle Vorhersage der Kovarianzstruktur: Das kausale Modell dient zur Vorhersage der Kovarianzstruktur, d.h. der Varianzen und Kovarianzen der beobachteten endogenen Variablen (auch die Mittelwertstruktur kann vorhergesagt werden, was wir jedoch vorläufig ignorieren). Zur Vorhersage werden die linearen kausalen Beziehungen zwischen den Variablen verwendet, sowie die Kovarianzen und Varianzen der exogenen Variablen (deren Kovarianzstruktur im Modell nicht erklärt wird). Kapitel 3: Strukturgleichungsmodelle Vorhersage der Kovarianzstruktur: Gegeben: beobachtete Kovarianzmatrix: Es gilt: Die Matrix hat 𝑚 × 𝑚 = 𝑚2 Einträge. Es gibt aber nur 𝑚∙ 𝑚+1 2 eindeutige Einträge, da die Matrix symmetrisch ist: m Varianzen und eindeutige Kovarianzen. 𝑚∙ 𝑚−1 2 Kapitel 3: Strukturgleichungsmodelle Vorhersage der Kovarianzstruktur: Kovarianzgleichungen: Die Kovarianzgleichungen beschreiben die Varianzen und Kovarianzen mit Hilfe der Parameter des Modells. Auf der linken Seite befinden sich die vorherzusagenden Varianzen und Kovarianzen. Auf der rechten Seite Ausdrücke, welche Parameter enthalten: Varianzen und Kovarianzen der exogenen Variablen und strukturelle Koeffizienten. Kapitel 3: Strukturgleichungsmodelle Vorhersage der Kovarianzstruktur: Erzeugung der Kovarianzgleichungen: beinhaltet 2 Schritte: 1. Reduktion der linearen Strukturgleichungen: Sukzessives Ersetzen endogener Variable auf der rechten Seite durch deren Gleichungen, solange bis keine endogenen Variablen auf der rechten Seite mehr vorhanden ist. 2. Anwendung der Kovarianzrechnung zur Ermittlung der beobachteten Varianzen und Kovarianzen der endogenen Variablen. Kapitel 3: Strukturgleichungsmodelle Vorhersage der Kovarianzstruktur: Erzeugung der Kovarianzgleichungen: 1. Reduktion der linearen Strukturgleichungen: Gegeben: Reduktion von Gleichung 2: Kapitel 3: Strukturgleichungsmodelle Vorhersage der Kovarianzstruktur: Erzeugung der Kovarianzgleichungen: 2. Anwendung der Kovarianzrechnung. Kapitel 3: Strukturgleichungsmodelle Vorhersage der Kovarianzstruktur: Erzeugung der Kovarianzgleichungen: 3. Kovarianzgleichungen in Parameter-Notation: Kapitel 3: Strukturgleichungsmodelle KTT und lineare Strukturgleichungen: Gegeben: Grundgleichung der KTT: Es handelt sich um eine lineare Strukturgleichung, wobei 𝜏𝑝𝑖 und 𝜀𝑝𝑖 als kausale Einflussgrössen interpretiert werden: Kapitel 3: Strukturgleichungsmodelle 14 KTT und lineare Strukturgleichungen: Allgemeines Klassisches Testmodell für 4 Tests: Erfüllt die Axiome der KTT: Fehlende Kovarianzbögen indizieren fehlenden Varianzen. Anstelle von zur Bezeichnung der Truescores wird zur Bezeichung der latenten Konstrukte verwendet. 13 12 1 21 23 2 2 4 3 2 2 34 4 2 3 1 1 1 1 Y1 Y2 Y3 Y4 1 1 2 1 1 2 2 2 1 3 23 1 4 2 4 24 Kapitel 3: Strukturgleichungsmodelle KTT und lineare Strukturgleichungen: Das kongenerische Testmodell für 4 Tests: Zentrales Merkmal: Alle 4 Test messen das gleiche latente Konstrukt. Y1 Jedoch nicht in gleicher Weise: Unterschiedliche Ladungen und Fehlervarianzen). 2 1 3 4 Y2 Y3 Y4 1 1 1 1 1 2 3 4 Kapitel 3: Strukturgleichungsmodelle KTT und lineare Strukturgleichungen: Das -äquivalente Testmodell für 4 Tests: Zentrales Merkmal: Alle 4 Test messen das gleiche latente Konstrukt. Latentes Konstrukt beeinflusst Messung in gleicher Weise. Fehlervarianzen verschieden. 1 1 1 1 Y1 Y2 Y3 Y4 1 1 1 1 1 2 3 4 Kapitel 3: Strukturgleichungsmodelle KTT und lineare Strukturgleichungen: Das parallele Testmodell für 4 Tests: Zentrales Merkmal: Alle 4 Test messen das gleiche latente Konstrukt. Die Maße sind vollständig austauschbar: Gleiche Ladungen und gleiche Fehlervarianzen. 1 1 1 1 Y1 Y2 Y3 Y4 1 1 1 1 1 2 3 4 Kapitel 3: Strukturgleichungsmodelle KTT und lineare Strukturgleichungen: Bsp.3-3: Prüfung von Testmodellen (Jöreskog, 1971) Gegeben: 4 Arten von Vokabeltests: X1, X2: zwei Tests, bestehend aus je 15 Items, die ohne Zeitdruck präsentiert wurden (Power-Tests). Y1, Y2: Tests, bestehend aus je 75 Items, die unter Zeitdruck präsentiert wurden (Speed-Tests). Kapitel 3: Strukturgleichungsmodelle KTT und lineare Strukturgleichungen: Bsp.3-3: Prüfung von Testmodellen (Jöreskog, 1971) Gegeben: Kovarianzmatrix (N= 649): X1 X2 Y1 X1 86.3979 X2 57.7751 86.2632 Y1 56.8651 59.3177 97.2850 Y2 58.8986 59.6683 73.8201 Y2 97.8192 Kapitel 3: Strukturgleichungsmodelle KTT und lineare Strukturgleichungen: Bsp.3-3: Prüfung von Testmodellen (Jöreskog, 1971) Hypothesen: H1: X1 und X2, sowie Y1 und Y2 sind jeweils parallel. Die beiden Paare sind jedoch nicht kongenerisch. H2: X1 und X2, sowie Y1 und Y2 sind jeweils parallel und alle 4 Tests sind kongenerisch. H3: X1 und X2, sowie Y1 und Y2 sind jeweils kongenerisch, aber die beide Paare (zusammengenommen) sind nicht kongenerisch. H4: Die 4 Tests sind kongenerisch, jedoch nicht notwendigerweise parallel. Kapitel 3: Strukturgleichungsmodelle KTT und lineare Strukturgleichungen: Bsp.3-3: Prüfung von Testmodellen (Jöreskog, 1971) Erklärung: Die 4 Hypothesen beziehen sich auf 2 Aspekte der Tests: 1. Der erste Aspekt betrifft die Frage, ob die 4 Tests (mit und ohne Zeitbeschränkung) das gleiche Konstrukt messen. Falls dies der Fall ist, so sind die 4 Tests kongenerisch. Hypothese H2 und H4 behaupten dies. Die Hypothesen H1 und H3 hingegen bestreiten dies und nehmen an, dass Tests mit und ohne Zeitbeschränkung unterschiedliche Konstrukte erfassen. Kapitel 3: Strukturgleichungsmodelle KTT und lineare Strukturgleichungen: Bsp.3-3: Prüfung von Testmodellen (Jöreskog, 1971) Erklärung: 2. Der 2. Aspekt betrifft die Frage, ob es sich bei den beiden Subtests X1, X2 bzw. Y1, Y2 jeweils um Parallelformen handelt. Die Hypothesen H1 und H2 nehmen an, dass es sich um Parallelformen handelt, H3 und H4 nehmen dies nicht an. Kapitel 3: Strukturgleichungsmodelle KTT und lineare Strukturgleichungen: Bsp.3-3: Prüfung von Testmodellen (Jöreskog, 1971) Subtests parallel Gleiches Konstrukt (kongenerisch) Ja Nein Ja H2 H4 Nein H1 H3 Vorgehensweise: Zuerst einzelne Modelle betrachtet, anschliessend Modellvergleiche. Kapitel 3: Strukturgleichungsmodelle Bsp.3-3: Jöreskog, 1971 Modell H2: partiell parallel Subtests parallel 1 Gleiches Konstrukt (kongenerisch) Ja Nein Ja H2 H4 Nein H1 H3 1 X1 X2 Y1 Y2 1 1 1 1 1 2 3 4 Kapitel 3: Strukturgleichungsmodelle Bsp.3-3: Jöreskog, 1971 Modell H2*: parallel Subtests parallel 1 Gleiches Konstrukt (kongenerisch) Ja Nein Ja H2 H4 H1 H3 Nein 1 1 1 X1 X2 Y1 Y2 1 1 1 1 1 2 3 4 Kapitel 3: Strukturgleichungsmodelle Bsp.3-3: Jöreskog, 1971 Modell H4: kongenerisch Subtests parallel 1 Gleiches Konstrukt (kongenerisch) Ja Nein Ja H2 H4 Nein H1 H3 X1 X2 Y1 Y2 1 1 1 1 1 2 3 4 Kapitel 3: Strukturgleichungsmodelle Bsp.3-3: Jöreskog, 1971 Modell H1: partiell parallel 1 Subtests parallel Gleiches Konstrukt (kongenerisch) Ja Nein Ja H2 H4 Nein H1 H3 X Y 1 1 1 X1 X2 Y1 Y2 1 1 1 1 1 2 3 4 Kapitel 3: Strukturgleichungsmodelle Bsp.3-3: Jöreskog, 1971 Modell H3: X Y Subtests parallel Gleiches Konstrukt (kongenerisch) Ja Nein Ja H2 H4 Nein H1 H3 1 X 1 Y X1 X2 Y1 Y2 1 1 1 1 1 2 3 4 Kapitel 3: Strukturgleichungsmodelle Bsp.3-3: Jöreskog, 1971 1 Modellierungsstrategie: X Y 1 Varianzen der latenten Konstrukte auf 1 gesetzt dafür Ladungen frei: Setzt man daher , so sind Konstrukte perfekt korreliert (= gleiches Konstrukt). X1 X2 Y1 Y2 1 1 1 1 1 2 3 4 Kapitel 3: Strukturgleichungsmodelle Bsp.3-3: Jöreskog, 1971 Modellierungsstrategie: 1 X Y 1 Gleiches Konstrukt: X1 X2 Y1 Y2 Parallel: Ladungen und Fehlervarianzen gleich: 1 1 1 1 1 2 3 4 Kapitel 3: Strukturgleichungsmodelle Unterschied zwischen KTT- und LISREL-Ansatz: Unterschied betrifft zwei Aspekte: 1. Kausalannahmen 2. Verteilungsannahmen Die KTT macht weder Kausalannahmen noch Verteilungsannahmen. Der lineare Strukturgleichungsansatz macht beides. Kapitel 3: Strukturgleichungsmodelle Unterschied zwischen KTT- und LISREL-Ansatz: Ein Messmodell / Testmodell ist ein kausales Modell, welches die Mess- bzw. Testsituation repräsentiert. Es umfasst folgende Komponenten: i. Die Menge der verwendeten Maße (Indikatoren, Tests). ii. Die Menge aller relevanten Einflussgrössen, welche einen direkten Einfluss auf die Messung (den Test) aufweisen, sowie deren Beziehung untereinander. iii. Eine detaillierte Spezifikation der (kausalen) Beziehungen zwischen den Maßen und den Einflussgrössen. Kapitel 3: Strukturgleichungsmodelle Unterschied zwischen KTT- und LISREL-Ansatz: In der KTT (wenn kausal interpretiert) gibt es zwei relevante Einflussgrössen, welche das Testergebnis beeinflussen: 1. Der Truescore (die wahre Fähigkeit). 2. Andere Einflussgrössen, welche durch den Fehler repräsentiert werden. Bei kausaler Betrachtung ist der Truescore wenig sinnvoll und durch das zu messendes latentes Konstrukt zu ersetzen. Kapitel 3: Strukturgleichungsmodelle Unterschied zwischen KTT- und LISREL-Ansatz: LISREL-Ansatz der KTT nimmt 2 Einflussgrössen an: 1. Das (zu messende) latente Konstrukt. 2. Andere Einflussgrössen, welche durch den Fehler repräsentiert werden. Der Ansatz erlaubt die Messung weiterer Einflussfaktoren, zum Beispiel: Methodeneinflüsse (Multitrait-Multimethod) Situationseinflüsse (State-Trait-Modelle) Kapitel 3: Strukturgleichungsmodelle Unterschied zwischen KTT- und LISREL-Ansatz: Verteilungsannahmen: KTT macht keine Annahmen zu Verteilungen von Truescores und Fehler, sondern nur Annahmen zu Erwartungswerte, Varianzen und Kovarianzen. Problem: Keine statistischen Tests der Modelle möglich. Mit LISREL-Ansatz sind gewöhnlich – aber nicht notwendig – Verteilungsannahmen verbunden: Häufigste Annahme: Konstruktwerte und Fehler sind multivariat normal verteilt. Kapitel 3: Strukturgleichungsmodelle Non-lineare Strukturgleichungsmodelle und probabilistische Testtheorie (PTT): Problemstellung: Kategorisierung von Items, ob korrekt (=1) / falsch (=0) (oder vorhanden / nicht vorhanden), etc. Modelliert wird dann die Wahrscheinlichkeit einer korrekten Antwort (bzw. die Wahrscheinlichkeit eines bestimmten Antwortmusters und nicht Kovarianzen. Kapitel 3: Strukturgleichungsmodelle Non-lineare Strukturgleichungsmodelle und PTT: Modellierungsansatz: Die Itemschwierigkeit β und die kognitive Leistungsfähigkeit beeinflussen die Tendenz zu einer korrekten Antwort Y* wie folgt: Die Tendenz für eine korrekte Antwort nimmt mit der Leistungsfähigkeit zu und mit der Itemschwierigkeit ab. β ist eine Konstante, eine Zufallsvariable, gewöhnlich: 𝜃~𝑁 μθ , σ2θ . Kapitel 3: Strukturgleichungsmodelle Non-lineare Strukturgleichungsmodelle und PTT: Modellierungsansatz: Aufgrund der Tendenz zu einer korrekten Antwort Y* ergibt sich mit Hilfe einer sogenannten Itemresponse-Funktion die Wahrscheinlich einer korrekten Antwort: Kapitel 3: Strukturgleichungsmodelle Non-lineare Strukturgleichungsmodelle und PTT: Modellierungsansatz: Einsetzen für Antwort Y* ergibt: Hierbei gilt: 𝑃 𝑌 = 1 θ ist die Wahrscheinlichkeit einer korrekten Antwort für eine Personen mit Fähigkeit . 𝑃 𝑌 = 1 θ = 0.5 für θ = β. Kapitel 3: Strukturgleichungsmodelle Non-lineare Strukturgleichungsmodelle und PTT: Itemresponse-Funktionen: Kapitel 3: Strukturgleichungsmodelle Non-lineare Strukturgleichungsmodelle und PTT: Kausal-Diagramm: Kapitel 3: Strukturgleichungsmodelle Non-lineare Strukturgleichungsmodelle und PTT: Modellierung eines Anwortmusters: Gegeben sei das Antwortmuster: 𝐘 = 1,0,1,0 Gesucht: 𝑃 𝐘 = 1,0,1,0 𝜃 = 𝑃 𝑌1 = 1, 𝑌2 = 0, 𝑌3 = 1, 𝑌4 = 0 𝜃 Annahme der lokalen stochastischen Unabhängigkeit: Anwortwahrscheinlichkeiten der einzelnen Items sind bei gegebenen unabhängig voneinander. Daher ist Wahrscheinlichkeit des Musters gleich dem Produkt der Einzelwahrscheinlichkeiten. Kapitel 3: Strukturgleichungsmodelle Non-lineare Strukturgleichungsmodelle und PTT: Modellierung eines Antwortmusters: 𝑃 𝐘 = 1,0,1,0 θ = 𝑃 𝑌1 = 1 θ ∙ 𝑃 𝑌2 = 0 θ ∙ 𝑃 𝑌3 = 1 θ ∙ 𝑃 𝑌4 = 0 θ Einsetzen der Ausdrücke für die einzelnen Wahrscheinlichkeiten: exp α1 ∙ θ − β1 𝑃 𝐘 = 1,0,1,0 θ = 1 + exp α1 ∙ θ − β1 1 × 1 + exp α2 ∙ θ − β2 exp α3 ∙ θ − β3 1 + exp α3 ∙ θ − β3 1 × 1 + exp α4 ∙ θ − β4 × Kapitel 3: Strukturgleichungsmodelle Non-lineare Strukturgleichungsmodelle und PTT: Modellierung eines Antwortmusters: Problem: 𝑃 𝐘 = 1,0,1,0 θ hängt von ab. Man möchte aber die unbedingte Wahrscheinlichkeit 𝑃 𝐘 = 1,0,1,0 des Antwortmusters. Lösung: Bilde den Erwartungswert bezüglich der Verteilung von : 𝑃 𝐘 = 1,0,1,0 = Eθ 𝑃 𝐘 = 1,0,1,0 θ = 𝑃 𝐘 = 1,0,1,0 θ ∙ 𝑓 θ dθ