Dr. Wolfgang Langer - 2.2.4.2 Verallgemeinerte lineare Modelle - SoSe 2001 - 1 Die Interpretation von Interaktionseffekten im logistischen Regressionsmodell für Individualdaten In diesem Abschnitt vertiefen wir die in Abschnitt 2.2.3.2 begonnene Diskussion über die Spezifikation und Interpretation von Interaktionseffekten bei der logistischen Regression. Eine Vielzahl von Autoren sparen dieses Thema in ihren einschlägigen Einführungsbüchern entweder aus oder sie streifen es nur am Rande.1 Letztere ersparen sich aber eine detaillierte Interpretation der geschätzten logistischen Steigungskoeffizienten.2 Angesichts in Deutschland geführten Diskussion über „implizite“ und „explizite Interaktionseffekte“ erscheint eine Klärung der sich widersprechenden Positionen von Jagodzinski&Klein (1997)3 und Schumann&Hardt (1998) dringend geboten zu sein. Erstere vertreten die These, daß im logistischen Regressionsmodell bei der Betrachtung der geschätzten Wahlwahrscheinlichkeiten der Interaktionseffekt zweier unabhängiger Variablen aufgrund der „multiplikativen Modellstruktur“ bereits implizit enthalten sei. Ihres Erachtens ist dies ersichtlich, wenn wir die logistische Schätzgleichung gleichzeitig nach zwei exogenen Merkmalen ableiten, wie dies Hanushek&Jackson (1977) getan haben:4 (1) Berechnung der gemeinsamen 1. Ableitung für zwei exogene Merkmale Xj und Xk 2 P( Y 1) j k P̂ ( 1 P̂) (1 2 P̂) Xj Xk Legende j: Logistischer Steigungskoeffizient von Xj k: Logistischer Steigungskoeffizient von Xk P̂: Geschätzte Wahlwahrscheinlichkeit für Y 1 Hingegen vertreten Schumann&Hardt (1998) die Position, daß sich ein Interaktionseffekt nur 1 S. Wrigley (1985; S. 91-96); Demaris (1992, S. 52f); Menard (1995, S. 52ff); Long (1997) 2 Zur Interpretation der geschätzten Odds im logistischen Regressionsmodell mit Interaktionseffekten: S. Kleinbaum (1994, S. 209) 3 S. Jagodzinski&Klein (1997, S. 55) 4 S. Hanushek&Jackson (1977, S.189) Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 2 bestimmen läßt, wenn er bei der logistischen Regression als eigenständiger Prädiktor in Form einer Hilfsvariablen eingeführt wird, die sich aus der Multiplikation der sie tragenden exogenen Merkmale ergibt. Im Sinne des für die Logits unterstellten linear-additiven Modells mißt dann der zugehörige logistische Steigungskoeffizient die Richtung und die Stärke des Interkationseffekts. „Nach dem oben Gesagten erscheint es ratsam, Interaktionsterme explizit in ein Logit-Modell einzufügen, sofern theoretische Überlegungen dies nahelegen. Solche expliziten Interaktionsterme haben den Vorteil, daß Interaktionen zwar, falls zwei oder mehr Variablen einen Einfluß auf die abhängige Variable ausüben, auftreten können, dies jedoch keineswegs. Man hat die Möglichkeit, Interaktionseffekte zu separieren und deren Stärke und Signifikanz zu bestimmen.“ (Schumann&Hardt 1998, S. 93) Sie weisen ausdrücklich daraufhin, daß der von Jagodzinski&Klein (1997) bei der Betrachtung der geschätzten Wahlwahrscheinlichkeiten der Republikaner entdeckte „Interaktionseffekt“ von rechtsexteremer Orientierung und Politikverdrossenheit allein durch die logistische Verteilungsfunktion „modellgeneriert und nicht Ausdruck einer besonderen Struktur in den Daten“ sei. Daher empfehlen Schumann&Hardt einen aufgrund von theoretischen Überlegungen erwarteten Interaktionseffekt direkt im Rahmen der logistischen Regression mit über eine explizit aufgenommene Hilfsvariable zu ermitteln und im Hinblick auf die geschätzten Logits zu interpretieren. Beide Autoren vermeiden es aber, auf die Bedeutung der logistischen Schätzer der beteiligten exogenen Merkmale und ihrer Interaktion detailliert einzugehen. In dieser Hinsicht erweist sich die Literaturlage im Bereich der logistischen Regression als eher dürftig. Da es sich bei ihr im Hinblick auf die zu schätzenden Logits um ein linear-additives Modell handelt, können wir den im Bereich der linearen Regressionsanalyse vorhandenen Kenntnisstand auf das Logitmodell übertragen. Die folgende Darstellung orientiert sich an den Arbeiten von Aiken&West(1991) sowie Jaccard,Turrisi,Wan (1996). Bei unserem Item „Ich könnte mir vorstellen, mit einem Türken, einer Türkin ein sexuelles Verhältnis zu haben“ erwarten wir bei Ablehnungsbereitschaft der Befragten einen altersabhängigen Geschlechtseffekt. Da die Interaktion zweier exogener Merkmale immer in beide Richtungen wirkt, könnten wir gleichermaßen unterstellen, daß der Alterseffekt auf die Ablehnungsbereitschaft geschlechtspezifisch wirkt. Um dies zu überprüfen, erweitern wir das „Haupteffektmodell“ der logistischen Regression, welches als Prädiktoren nur das Alter (AGE) und den Geschlechtsdummy (FRAU) enthält, um eine aus der Multiplikation beider Merkmale gewonnene Hilfsvariable. Deren logistischer Steigungskoeffizient erfaßt nun die Richtung und Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 3 Stärke der Interaktion im Sinne einer wechselseitigen Verstärkung bzw. Abschwächung in ihrer gemeinsamen Wirkung auf die Ablehnungsbereitschaft. Formal entspricht dies der folgenden Schätzgleichung. (2) Schätzgleichungen des Haupteffekt- und Interaktionsmodells der logistischen Regression 1. Schätzgleichung der logistischen Regression nur mit Haupteffekten: ln P ( Yi 1) 1 P ( Yi 1 ) 0 1 AGE 2 FRAU 0i 2. Schätzgleichung der logistischen Regression mit Interaktionseffekt: ln P ( Yi 1 ) 1 P ( Yi 1 ) 0 1 AGE 2 FRAU 3 ( AGEFRAU ) 0i Analog zum klassischen linearen Regressionsmodell gilt, daß die Logitschätzer für AGE und FRAU im Modell mit Interaktionseffekt nicht mehr wie im Haupteffektmodell „einfache logistische Steigungskoeffizienten“ („simple slopes“) darstellen. Bei ihnen handelt es sich vielmehr um bedingte Steigungskoeffizienten („conditional slopes“), die den Effekt des betreffenden Merkmals unter der Bedingungen erfassen, daß alle anderen an der Interaktion beteiligten exogenen Merkmale jeweils Null sind. Bezogen auf unsere geschätzten Logits entsprechen die bedingten Steigungskoeffizienten den folgenden Erwartungswerten: (3) Interpretation der bedingten logistischen Steigungskoeffizienten und des Interaktionseffekts 1. Logistische Regressionskonstante 0 E (Logit |AGE 0 FRAU 0 ) E (Logit |AGE 0 Mann ) 2. Bedingte Haupteffekte: AGE E (û Logit |û AGE 1 FRAU 0 ) E (û Logit |û AGE 1 Mann ) FRAU E (û Logit |û FRAU 1 AGE 0 ) E (û Logit |Frau AGE 0 ) 3. Interaktionseffekt von AGE und FRAU: AGEFRAU E (û Logit |û AGE 1 û FRAU 1 ) E (û Logit |û AGE 1 Frau ) Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 4 Hierbei erfaßt der bedingte Logitschätzer des Merkmals AGE die Zunahme des geschätzten Logits pro Erhöhung des Lebensalters um 1 Jahr unter der Bedingung, daß der Geschlechterdummy FRAU Null ist Folglich handelt es sich beim ihm um den geschlechtsspezifischen Alterseffekt der Männer. Hingegen erfaßt der bedingte Logitschätzer für FRAU den Geschlechtsunterschied der Ablehnungsneigung von Frauen im Vergleich zu Männern im Alter von Null Jahren, sprich bei frisch geborenen Säuglingen. Dieser Gruppenvergleich erscheint aber nicht als sinnvoll, da Säuglinge in diesem Alter noch nicht in der Lage sind, Fragen zu beantworten. Aiken&West (1991) weisen ausdrücklich daraufhin, daß der zu testende Gruppenunterschied bei konditionalen Effekten dergestalt sinnhaft sein sollte, daß die zu untersuchenden Gruppen tatsächlich in der Grundgesamtheitsdefinition vorkommen. „Conditional effects describe the effect of on predictor on the criterion variable under the condition in which the other predictors equals a specified value. For a conditional effect to be useful, the point on the other preditors at which it is evaluated must be meaningful.“ (S.37) Da wir die Kondition der bedingten Schätzer selbst nicht ändern können, bietet es sich an, die exogenen Merkmale dergestalt zu transformieren, daß die konditionalen Schätzer des Alters und Geschlecht einen sinnvollen Vergleich durchführen. Ein hierfür geeignetes Mittel stellt die Zentrierung der kontinuierlichen Prädiktoren an ihrem jeweiligen Stichprobenmittelwert dar. Bei der Zentrierung handelt es sich um eine lineare Transformation, die erstens den Mittelwert der zentrierten Variablen in den Nullpunkt verschiebt und die zweitens die Varianz des Merkmals selbst nicht beeinflußt. Dies führt dazu, daß nach der Zentrierung des exogenen Merkmals die Regressionskonstante b0 im linear-additiven Modell den Erwartungswert der Kriteriumsvariablen bzw. ihres Logits für den Mittelwert des metrischen exogenen Merkmalls im Sinne des „Durchschnittsfalls“ mißt. In unserem Fall erfaßt bei einer Zentrierung des Lebensalters am Stichprobenmittel der bedingte Haupteffekt des Geschlechterdummy FRAU unmittelbar die Differenz der geschätzten Logits von Frauen und Männer im Durchschnittsalter. Der zugehörige T-Test überprüft, ob dieser im Durchschnittsalter erwartete Unterschied der Ablehnungsbereitschaft statistisch signifikant ist. „The b1 and b2 coefficients never represent constant effects of the predictors in the presence of an interaction. The b1 and b2 coefficients from centered equations always represent the effects of the predictors at the mean of other predictors. In the centered equation, they may also be considered as the weighted average effect of each predictor coefficient across all observed values of the other predictor. The interpretation of b1 or b2 as conditional effects of predictors at the mean of other predictors may well be useful in clarifying relationships under investiga- Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 5 tion.“. (Aiken&West 1991, S. 39), Wir können das Lebensalter an jeden beliebigen Wert zentrieren, sofern der beabsichtigte Geschlechtervergleich der Ablehnungsbereitschaft dort sinnvoll ist.5 Formal gesehen läßt sich die Zentrierung dieses intervallskalierten Prädiktors am Altersdurchschnitt und am Mindestalter der Befragten demonstrieren. Letzteres lag im Eurobarometer 30 bei 15 Jahren. (4) Formen der Zentrierung intervallskalierter Prädiktoren: 1. Zentrierung am Stichprobenmittelwert: AGECx̄ AGEi x̄AGE E ( AGEC x̄ ) E ( AGE ) x̄AGE 0 Var ( AGEC x̄ ) Var ( AGE ) 2. Zentrierung am Mindestalter der Stichprobe AGECMinimum AGEi MinimumAGE E ( AGECMinimum ) E ( AGE ) MinimumAGE AGECMinimum 0 entspricht dem Minimum von AGE ! Var ( AGECMinimum ) Var ( AGE ) Hierdurch modifiziert sich die Schätzgleichung der logistischen Regression mit dem Interaktionseffekt von Lebenalter und Geschlecht sowie die Interpretation der bedingten Steigungskoeffizienten folgendermaßen: (5) Einfluß der Zentrierung am Altersmittelwert auf die logistische Konstante und die Steigungskoeffizienten 1. Schätzgleichung der logistischen Regression mit Interaktionseffekt von FRAU und des am Mittelwert zentrierten Alter ln 5 P ( Yi 1 ) 1 P ( Yi 1 ) 0 1 AGEC x̄ 2 FRAU 3 ( AGEC x̄ FRAU ) 0i Zur Diskussion der Zentrierung im Bereich der Mehrebenenanalyse: S. Raudenbush (1989a, 1989b), Plewis (1989), Longford (1989), Kreft, DeLeeuw&Aiken (1995), Snijders&Bosker (1999, S. 80f) Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 6 (6) Interpretation der logistischen Schätzer 2. Logistische Regressionskonstante 0 E (Logit |AGEC x̄ 0 FRAU 0 ) E ( Logit |AGE x̄ AGE Mann ) 3. Bedingte Haupteffekte: AGEC E (û Logit |û AGEC x̄ 1 FRAU 0 ) E (û Logit |û AGEC x̄ 1 Mann ) x̄ FRAU E (û Logit |û FRAU 1 AGEC x̄ 0 ) E (û Logit |Frau AGE x̄AGE ) 4. Interaktionseffekt von AGE und FRAU: AGEC FRAU E (û Logit |û AGECx̄ 1 û FRAU 1 ) x̄ E (û Logit |û AGECx̄ 1 Frau ) Bei der Zentrierung am Mindestalter der Befragten erhalten wir die folgende Schätzgleichung: (7) Einfluß der Zentrierung am Mindestalter auf die logistische Konstante und die Steigungskoeffizienten 1. Schätzgleichung der logistischen Regression mit Interaktionseffekt von FRAU und des am Mindestalter zentrierten Lebensalters ln P ( Yi 1 ) 1 P ( Yi 1 ) 0 1 AGEC Minimum 2 FRAU 3 ( AGEC Minimum FRAU ) 0i (8) Interpretation der logistischen Schätzer 2. Logistische Regressionskonstante 0 E (Logit |AGECMinimum 0 FRAU 0 ) E ( Logit |AGE MinimumAGE Mann ) 3. Bedingte Haupteffekte: AGEC Minimum E (û Logit |û AGECMinimum 1 FRAU 0 ) E (û Logit |û AGECMinimum 1 Mann ) FRAU E (û Logit |û FRAU 1 AGECMinimum 0 ) E (û Logit |Frau AGE MinimumAGE ) Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 7 4. Interaktionseffekt von AGE und FRAU: AGEC Minimum FRAU E (û Logit | û AGECMinimum 1 û FRAU 1 ) E (û Logit |û AGECMinimum 1 Frau ) Um die Interpretation der konditionalen Logitschätzer und des Interaktionseffekts zu veranschaulichen, schätzen wir zunächst ein Haupteffektmodell mit dem am Mindesalter von 15 Jahren zentrierten Lebensalter und dem Geschlecherdummy FRAU. Anschließend führen wir zusätzlich den Interaktionseffekt des zentrierten Alters und des Dummy FRAU ein, um den altersabhängigen Geschlechterunterschied bzw. den geschlechtsspezifischen Alterseffekt auf die Ablehnung unseres Items zu bestimmen. Hierfür benötigen wir die folgenden LIMDEP-Befehle: LIMDEP-Befehle für die Schätzung des Haupt- und Interaktionseffektmodell der logistischen Regression open; output=logitreg.out$ title; Logistische Regression mit Individualdaten: EB30, BRD(ABL) 1988$ ? Einlesen der binaeren Datendatei: EURBOBARO Nr 30 load; file=eb30kurs.lpj$ ? Zuruecknahme der bisherigen Fallauswahl sample; all$ ? Auswahl der Substichprobe BRD(ABL) 1988 reject; DBRD=0$ ? Manueller Ausschluss fehlender Werte reject; ogsexabl=-999 | AGE=-999|FRAU=-999$ ? Anzahl der Auspraegungen der abhaengigen Variablen: 2 calc; ycat=2$ ? Berechnung des Durchschnittsalters dstat;rhs=age$ ? Zentrierung am juengsten Jahrgang (Mindestalter der Befragten) create; agec15=age-15$ ? Zentrierung am Durchschnittsalter mit Hilfe der Create-Funktion xbr() create; agecm=age-xbr(age)$ dstat;rhs=age,agec15,agecm$ ? Schaetzung des Nullmodells logit; lhs=ogsexabl;rhs=one$ exec;proc=hierinit$ ? Schaetzung des Haupteffektmodells: + AGEC15 + FRAU namelist; X=one,agec15,frau$ logit; lhs=ogsexabl;rhs=X;marginal$ exec;proc=hiertest$ exec;proc=mzr2l$ Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 8 ? Berechnung der geschaetzten Logits, Probs create; flgt=dot(X,b)$ create; plgt=lgp(flgt)$ plot; lhs=agec15; rhs=flgt;grid;spikes=26.28;endpoints=0,80$ plot; lhs=agec15; rhs=plgt;grid;spikes=26.28;endpoints=0,80$ ? Schaetzung des logist.Regressionsmodells mit Interaktionseffekt ? Bildung der Hilfsvariablen FRAU*AGEC15 create;frauag15=agec15*frau$ namelist;X=one,agec15,frau,frauag15$ logit; lhs=ogsexabl;rhs=X;marginal$ exec;proc=hiertest$ exec;proc=mzr2l$ ? Berechnung der geschaetzten logits, odds, probs create; flgt=dot(X,b)$ create; plgt=lgp(flgt)$ plot; lhs=agec15; rhs=flgt;grid;spikes=26.28;endpoints=0,80$ plot; lhs=agec15; rhs=plgt;grid;spikes=26.28;endpoints=0,80$ delete;flgt,plgt$ Für unsere zentrierten Altersvariablen erhalten wir die folgenden deskriptiven Statistiken: Tab.1: Univariaten statistischen Kennziffern der zentrierten und unzentrierten Altersvariablen Descriptive Statistics All results based on nonmissing observations. Variable Mean Std.Dev. Minimum Maximum Cases ------------------------------------------------------------------------------AGE 41.2803204 17.3685316 15.0000000 94.0000000 874 AGEC15 26.2803204 17.3685316 .000000000 79.0000000 874 AGECM -.951184211E-14 17.3685316 -26.2803204 52.7196796 874 Wir schätzen zunächst unsere Haupt- und Interaktionsmodell mit dem am Mindestalter zentrierten Lebensalter. Anschließend vergleichen wir seine Ergebnisse mit denjenigen der logistischen Regressionsmodelle für das am Altersmittelwert zentrierte Lebensalter. Für unsere erste Modellgruppe erhalten wir die folgenden Angaben zur Modellanpassung und Logitschätzer: Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 9 +---------------------------------------------+ | Multinomial Logit Model | | Maximum Likelihood Estimates | | Dependent variable OGSEXABL | | Weighting variable ONE | | Number of observations 874 | | Iterations completed 5 | | Log likelihood function -476.0552 | | Restricted log likelihood -514.6884 | | Chi-squared 77.26640 | | Degrees of freedom 2 | | Significance level .0000000 | +---------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Characteristics in numerator of Prob[Y = 1] Constant -.1355193360 .14999999 -.903 .3663 AGEC15 .2745477950E-01 .49781271E-02 5.515 .0000 26.280320 FRAU .9743300091 .16233228 6.002 .0000 .50457666 +-------------------------------------------+ | Partial derivatives of probabilities with | | respect to the vector of characteristics. | | They are computed at the means of the Xs. | | Observations used for means are All Obs. | +-------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Marginal effects on Prob[Y = 1] Constant -.2567579054E-01 .28693934E-01 -.895 .3709 AGEC15 .5201642720E-02 .91947437E-03 5.657 .0000 26.280320 FRAU .1845986998 .30036692E-01 6.146 .0000 .50457666 Frequencies of actual & predicted outcomes Predicted outcome has maximum probability. -----Actual -----0 1 -----Total Predicted ---------- + 0 1 | ---------- + 24 217 | 26 607 | ---------- + 50 824 | ----Total ----241 633 ----874 McFadden Pseudo-R2 = 7,51 % McKelvey&Zavoina Pseudo-R2 = 13,53 % Der Informationsgewinn des Haupteffekteffektmodells beträgt im Sinne McFaddens rd. 7,51%. Die geschätzte Varianzaufklärung erreicht einen Wert von rd. 13,53%. Wie der LikelihoodRatio-2 von 77,27 bei 2 Freiheitsgraden belegt, ist dieser Erklärungsbeitrag mit einer Irrtumswahrscheinlichkeit von weniger als einem Promille statistisch signifikant. Wenn die Befragten um ein Jahr älter werden, erhöht sich das Logit ihrer Ablehungsbereitschaft jeweils im signifikanten Maße um +0,027 Einheiten. Da wir das Lebensalter am Mindestalter der Befragten zentriert haben, entspricht der Mittelwert der Variablen AGEC15 dem Mittelwert der unzen- Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 10 trierten Altersvariablen. Bezogen auf dieses Durchschnittsalter von 26,28 + 15 Jahren, steigt die Ablehnungsbereitschaft um rd. 0,52 %, wenn der Befragte um genau ein Jahr älter wird. Das geschätzte Logit der Frauen fällt um rd. +0,97 Einheiten signifikant höher aus als dasjenige der gleichaltrigen Männer. Wie der partiellen Ableitung für den Geschlechterdummy Frau zu entnehmen ist, erreicht die Ablehnungsbereitschaft der 16-jährigen Mädchen einen um etwa 18,46% höheren Wert als diejenige der gleichaltrigen Jungen. Für das um den Interaktionseffekt erweiterte logistischen Regressionsmodell erhalten wir die folgenden Logitschätzer und Anpassungmaße: +---------------------------------------------+ | Multinomial Logit Model | | Maximum Likelihood Estimates | | Dependent variable OGSEXABL | | Weighting variable ONE | | Number of observations 874 | | Iterations completed 6 | | Log likelihood function -475.3271 | | Restricted log likelihood -514.6884 | | Chi-squared 78.72254 | | Degrees of freedom 3 | | Significance level .0000000 | +---------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Characteristics in numerator of Prob[Y = 1] Constant -.2779650644E-01 .17451972 -.159 .8735 AGEC15 .2264542844E-01 .63056767E-02 3.591 .0003 26.280320 FRAU .6981341638 .27942643 2.498 .0125 .50457666 FRAUAG15 .1238259596E-01 .10331770E-01 1.198 .2307 14.203661 +-------------------------------------------+ | Partial derivatives of probabilities with | | respect to the vector of characteristics. | | They are computed at the means of the Xs. | | Observations used for means are All Obs. | +-------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Marginal effects on Prob[Y = 1] Constant -.5220022445E-02 .32837716E-01 -.159 .8737 AGEC15 .4252679917E-02 .11864600E-02 3.584 .0003 26.280320 FRAU .1311055406 .52955547E-01 2.476 .0133 .50457666 FRAUAG15 .2325379594E-02 .19218668E-02 1.210 .2263 14.203661 Frequencies of actual & predicted outcomes Predicted outcome has maximum probability. -----Actual -----0 1 -----Total Predicted ---------- + 0 1 | ---------- + 2 239 | 9 624 | ---------- + 11 863 | ----Total ----241 633 ----874 Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 11 Anpassungsmaße: McFadden Pseudo R2 = 7,65 % ûMcFadden Pseudo R2 = 0,14 % McKelvey&Zavoina Pseudo R2 = 15,12 % ûMcKelvey&Zavoina Pseudo R2 = 1,58 % Partieller-Likelihood-Ratio-2 = 1,46 D.F.= 1 . = 0,23 Der erzielte Informationsgewinn im Sinne McFaddens von rd. 7,65 % sowie die geschätzte Varianzaufklärung von rd. 15,12 % erweisen sich als statistisch signifikant, wie der globale Wert von 78,72 bei 3 Freiheitsgraden und einer Irrtumswahrscheinlichkeit von weniger als einem Promille belegt. Im Vergleich zum Haupteffektmodell erhöht sich die geschätzte Varianzaufklärung im Sinne McKelvey und Zavoinas um rd. 1,58%, wobei die mit Hilfe des partiellen Likelihood-Ratio-2-Tests ermittelte Irrtumswahrscheinlichkeit die 5-%-Grenze weit überschreitet. Dies bedeutet, daß der zu identifizierende Interaktionseffekt nicht auf die Grundgesamtheit übertragbar ist. Um uns die Interpretation der geschätzten bedingten Haupteffekte und des Interaktionsterms zu erleichtern, bieten sich zwei Möglichkeiten an. Zum einen berechnen wir die partiellen Ableitungen der Variablen AGEC15 und FRAU für die geschätzten Logits der Ablehnungsbereitschaft. Zum anderen lassen wir uns jeweils zwei Streudiagramm der geschätzten Logits und Ablehnungswahrscheinlichkeiten mit dem zentrierten Lebensalter erstellen, die wir jeweils für das Haupteffekt- und Interaktionsmodell miteinander vergleichen. Als weitere Orientierungslinie enthalten die Streudiagramme eine Parallele zur Y-Achse, die den arithmetrischen Mittelwert des zentrierten Lebensalters markiert. Wenden wir uns zunächst der Interpretation der ermittelten Logitschätzer und ihrer partiellen Ableitungen zu. (9) Berechnung der geschätzten Logits der Ablehnungsbereitschaft ˆ 0,028 0,023AGEC15 0,698FRAU 0,012( AGEC15FRAU ) (1) Logit Die Regressionskonstante 0 erfaßt das geschätzte Logit der 15-jährigen Jungen und ist mit einem Wert von -0,028 nicht signifikant von Null verschieden, wie der zugehörige T-Test zeigt. Dies bedeutet, daß die Wahrscheinlichkeit, daß die Jungen dieser Altersgruppe das Item ablehnen in der Grundgesamtheit rd. 50 % beträgt. Das geschätzte Logit der gleichaltrigen Mädchen fällt um rd, + 0,70 Einheiten signifikant höher aus als dasjenige der Jungen, wie dem zugehörigen bedingten Steigungskoeffizienten und seinem T-Wert zu entnehmen ist. Für die Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 12 Hilfsvariable FRAUAG15 hat LIMDEP einen logistischen Steigunsgkoeffizienten von +0,012 geschätzt, der aber nicht statistisch signifikant ist. Sein positives Vorzeichen weist auf eine wechselseitige Verstärkung beider Merkmale in ihrer gemeinsamen Wirkung auf die Ablehungsbereitschaft des Befragten hin. Da die Interaktion zweier exogener Merkmale in beide Richtungen verläuft, berechnen wir getrennt für AGEC15 und FRAU die zugehörigen partiellen Ableitungen der Logits. (10) Berechnung der partiellen Ableitungen für AGEC15 und FRAU (2) Berechnung der partiellen Ableitungen: (2a) Logit 0,023 0,012FRAU AGEC15 Logit 0,023 AGEC15 Mann Logit 0,023 0,0121 0,035 AGEC15 Frau (2b) Logit 0,698 0,012AGEC15 FRAU Im Hinblick auf die im Rahmen des linear-additiven Modells geschätzten Logits zeigt sich folgdenes. Zum einen liegt ein geschlechtsspezifischer Alterseffekt liegt. Werden Männer um ein Jahr älter, so erhöht das geschätzte Logit ihrer Ablehnungsbereitschaft um +0,023 Einheiten. Bei den Frauen nimmt dieser Alterseffekt zusätzlich um jeweils +0,012 auf insgesamt +0,035 Einheiten pro Lebensjahr zu. Zum anderen nimmt der geschätzte Gruppenunterschied zwischen Frauen und Männer um rd. 0,012 Einheiten pro Lebensjahr zu. Dieser Interaktionseffekt zeichnet sich deutlich ab, wenn wir die Geraden der geschätzten Logits im Haupt- und Interaktionseffektmodell vergleichen. In Abbildung 1 entsprechen die unteren Geraden dem Alterseffekt der Männer und die oberen demjenigen der Frauen. Während die beiden roten Geraden des Haupteffektmodells erwartungsgemäß parallel verlaufen, fällt der Alterseffekt der Frauen im Interaktionsmodell deutlich stärker aus als derjenige der Männer. Ihre blaue obere Gerade verfügt über eine deutlich höhere Steigung als diejenige der Männer. Vice versa nimmt mit zunehmenden Alter der Geschlechtsunterschied bei den geschätzten Logits der Ablehnungsbereitschaft deutlich zu, wie in Abbildung 1 leicht erkennbar ist. Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 13 Abb. 1: Geschätzte Logits der Haupt- (LGTH) und Interaktionseffektmodelle (LGTI) auf zentriertes Lebensalter und FRAU Abb. 2: Geschätzte Ablehnungswahrscheinlichkeiten der Haupt- (PH) und Interaktionseffektmodelle (PI) auf zentriertes Alter und FRAU Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 14 Wie sehr der Augenschein bei der Betrachtung der geschätzten Wahrwahrscheinlichkeiten trügen kann, zeigt die bereits ausführlich dargestellte Debatte um „implizite“ und „explizite Interaktionseffekte“. Abbildung 2 stellt daher die Verteilungen der altersabhängigen Ablehnungswahrscheinlichkeiten von Männer und Frauen im Haupt- und Interaktionseffektmodell dar. Ein erster Blick auf die beiden geschlechtsspezifischen Alterseffekt in Abbildung 2 zeigt, daß der bereits für die geschätzten Logits dargestellte Interaktionseffekt von Alter und Geschlecht bei den geschätzten Ablehnungswahrscheinlichkeiten überhaupt nicht so einfach zu identifizieren ist. Die roten Punkte entsprechen in Abbildung 2 den geschätzten Ablehnungswahrscheinlichkeiten des Haupteffektmodells und die blauen Punkte denen des Interaktionseffektmodells. Der von uns ausdrücklich in das Modell eingeführte Interaktionseffekt beider Variabeln manifestiert sich nicht in der Krümmung der geschlechtspezifischen Altersfunktonen sondern in den Differenz der geschätzten Wahrscheinlichkeiten von Haupt- und Interaktionseffektmodell aus. Die Krümmung der geschätzten Wahrscheinlichkeitsfunktionen beruht allein auf der von uns gewählten logistischen Verteilungsfunktion. Limdep-Befehle für die Schätzung des logistischen Haupt- und Interaktionseffektmodells mit dem am Altersmittelwert zenterierten Lebensalter und FRAU ? Schaetzung des Nullmodells logit; lhs=ogsexabl;rhs=one$ exec;proc=hierinit$ ? Schaetzung des Haupteffektmodells: + AGECM + FRAU namelist; X=one,agecm,frau$ logit; lhs=ogsexabl;rhs=X;marginal$ exec;proc=hiertest$ exec;proc=mzr2l$ ? Berechnung der geschaetzten logits, probs create; flgth2=dot(X,b)$ create; plgth2=lgp(flgth2)$ ? Bildung der Hilfsvariablen FRAU*AGECM create;frauagcm=agecm*frau$ namelist;X=one,agecm,frau,frauagcm$ logit; lhs=ogsexabl;rhs=X;marginal$ exec;proc=hiertest$ exec;proc=mzr2l$ ? Berechnung der geschaetzten logits, odds, probs create; flgti2=dot(X,b)$ create; plgti2=lgp(flgti2)$ plot; lhs=agecm; rhs=flgth2,flgti2;grid$ plot; lhs=agecm; rhs=plgth2,plgti2;grid$ delete;flgth2,flgti2,plgth2,plgti2$ Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 15 Für das Haupteffektmodell erhalten wir die folgenden Logitschätzer und Anpassungsmaße: +---------------------------------------------+ | Multinomial Logit Model | | Maximum Likelihood Estimates | | Dependent variable OGSEXABL | | Weighting variable ONE | | Number of observations 874 | | Iterations completed 5 | | Log likelihood function -476.0552 | | Restricted log likelihood -514.6884 | | Chi-squared 77.26640 | | Degrees of freedom 2 | | Significance level .0000000 | +---------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Characteristics in numerator of Prob[Y = 1] Constant .5860010648 .10344761 5.665 .0000 AGECM .2745477950E-01 .49781271E-02 5.515 .0000 -.95118421E-14 FRAU .9743300091 .16233228 6.002 .0000 .50457666 +-------------------------------------------+ | Partial derivatives of probabilities with | | respect to the vector of characteristics. | | They are computed at the means of the Xs. | | Observations used for means are All Obs. | +-------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Marginal effects on Prob[Y = 1] Constant .1110250466 .17075257E-01 6.502 .0000 AGECM .5201642720E-02 .91947437E-03 5.657 .0000 -.95118421E-14 FRAU .1845986998 .30036692E-01 6.146 .0000 .50457666 Frequencies of actual & predicted outcomes Predicted outcome has maximum probability. -----Actual -----0 1 -----Total Predicted ---------- + 0 1 | ---------- + 24 217 | 26 607 | ---------- + 50 824 | ----Total ----241 633 ----874 Modellanpassung: McFadden Pseudo-R2 = 7,51 % McKelvey&Zavoina Pseudo-R2 = 13,53 % Die Modellanpassung der beiden geschätzten Haupteffektmodelle unterscheidet sich weder im Sinne der praktischen noch der statistischen Signifikanz. Die Unterschiedliche Zentrierung der Altersvariable beeinflußt nicht die logistischen Steigungskoeffizienten. Lediglich bei der Regressionskonstante weicht das zweite vom ersten Haupteffektmodell ab. Wie der Formel 6 zu Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 16 entnehmen ist, erfaßt die Regressionskonstante nun das geschätzte Logit der Männer im Durchschnittsalter von 41,28 Dezimaljahren. Mit einem Wert von rd. +0,59 ist es signifikant von Null verschieden, wie der zugehörige T-Wert von 5,67 und die geschätzte Irrtumswahrscheinlichkeit von weniger als einem Promille belegen. Wir erwarten für die Männer dieser Altersgruppe eine Ablehnungswahrscheinlichkeit von 64,34 %. Der logistische Steigungskoeffizient für die Abweichung der Frauen weist mit +0,97 denselben Wert wie im ersten Haupteffektmodell auf. Für das logistische Regressionsmodell mit spezifizierten Interaktionseffekt erhalten wir die folgenden Schätzer und Angaben zur Modellanpassung. +---------------------------------------------+ | Multinomial Logit Model | | Maximum Likelihood Estimates | | Dependent variable OGSEXABL | | Weighting variable ONE | | Number of observations 874 | | Iterations completed 6 | | Log likelihood function -475.3271 | | Restricted log likelihood -514.6884 | | Chi-squared 78.72254 | | Degrees of freedom 3 | | Significance level .0000000 | +---------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Characteristics in numerator of Prob[Y = 1] Constant .5673326077 .10338829 5.487 .0000 AGECM .2264542844E-01 .63056767E-02 3.591 .0003 -.95118421E-14 FRAU 1.023552753 .16872798 6.066 .0000 .50457666 FRAUAGCM .1238259596E-01 .10331770E-01 1.198 .2307 .94322508 +-------------------------------------------+ | Partial derivatives of probabilities with | | respect to the vector of characteristics. | | They are computed at the means of the Xs. | | Observations used for means are All Obs. | +-------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Marginal effects on Prob[Y = 1] Constant .1065417682 .17173763E-01 6.204 .0000 AGECM .4252679917E-02 .11864600E-02 3.584 .0003 -.95118421E-14 FRAU .1922172613 .30399693E-01 6.323 .0000 .50457666 FRAUAGCM .2325379594E-02 .19218668E-02 1.210 .2263 .94322508 Frequencies of actual & predicted outcomes Predicted outcome has maximum probability. -----Actual -----0 1 -----Total Predicted ---------- + 0 1 | ---------- + 2 239 | 9 624 | ---------- + 11 863 | ----Total ----241 633 ----874 Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 17 Anpassungsmaße: McFadden Pseudo R2 = 7,65 % ûMcFadden Pseudo R2 = 0,14 % McKelvey&Zavoina Pseudo R2 = 15,12 % ûMcKelvey&Zavoina Pseudo R2 = 1,58 % Partieller-Likelihood-Ratio-2 = 1,46 D.F.= 1 . = 0,23 Das zweite logistische Regressionsmodell mit dem Interaktionseffekt von AGECM und FRAU unterscheidet sich bei der Modellanpassung weder bei der statistischen noch bei der praktischen Signifikanz. Nur die Logitschätzer für die Regressionskonstante und den bedingten Haupteffekt des Geschlechterdummy FRAU unterscheiden sich von denjenigen des ersten Interaktionsmodells. Der bedingte Haupteffekt des zentrierten Lebensalters und sein geschlechtsspezifischer Interaktionseffekt weisen exakt dieselben Werte auf wie im ersten Interaktionsmodell. Um die Interpretation der alterspezifischen Ablehnungsunterschiede von Frauen und Männer zu erleichtern, berechnen wir für die exogene Variable FRAU und AGECM jeweils die zugehörige partielle Ableitung des Logits. (10) Berechnung der geschätzten Logits der Ablehnungsbereitschaft ˆ 0,567 0,023AGECM 1,024FRAU 0,012( AGECMFRAU ) (1) Logit (11) Berechnung der partiellen Ableitungen für AGECM und FRAU (2) Berechnung der partiellen Ableitungen: (2a) Logit 0,023 0,012FRAU AGECM Logit 0,023 AGECM Mann Logit 0,023 0,0121 0,035 AGECM Frau (2b) Logit 1,024 0,012AGECM FRAU Bezogen auf die geschätzten Logits unterscheiden sich die geschlechtsspezifischen Alterseffekte der beiden logistischen Regressionsmodelle mit Interaktionseffekt überhaupt nicht. Lediglich bei der partiellen Ableitung für den Geschlechterdummy FRAU finden wir beim bedingten Haupteffekt einen Unterschied gegenüber dem Vergleichsmodell. Dies ist darauf zurückzuführen, daß wir Männer und Frauen im ersten Interaktionsmodell im Mindestalter von 15 Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 18 Jahren vergleichen, während sich dieser Geschlechtervergleich beim zweiten Modell auf das Durchschnittsalter von 41,28 Dezimaljahren bezieht. Wenn wir die geschätzten Logits und Ablehungswahrscheinlichkeiten beider Interaktionsmodelle miteinander vergleichen, so finden wir in Abbildung 1 und 3 sowie 2 und 4 identische Funktionsverläufe. Die beiden Abbildungspaare unterscheiden sich lediglich in der Skalierung ihrer X-Achsen, wobei in Abbildung 3 und 4 der Nullpunkt der X-Achse um 26,28 Einheiten, der Differenz der beiden Zentrierungsformen , weiter nach rechts verschoben worden ist. In Abbildung 3 und 4 kennzeichnen wir zusätzlich das Vergleichsalter für den bedingten Haupteffekts von FRAU mit einer Parallelen zur Y-Achse durch den Nullpunkt der zentrierten Altersvariablen. Die an diesem Punkt geschätzten Differenzen der geschätzten Logits bzw. Ablehnungswahrscheinlichkeiten entsprechen denjenigen in Abbildung 1 und 2, die wir für den Mittelwert der am Mindestalter zentrierten Altersvariablen berechnet haben. Abb. 3: Geschätzte Logits der Haupt- (LGTH) und Interaktionseffektmodelle (LGTI) auf zentriertes Alter (AGECM) und FRAU Dr. Wolfgang Langer - Abb. 4: Verallgemeinerte lineare Modelle - SoSe 2001 - 19 Geschätzte Ablehnungswahrscheinlichkeiten der Haupt- (PH) und Interaktionseffektmodelle (PI) auf zentriertes Alter (AGECM) und FRAU Bei der Eurobarometer 30 Untersuchung haben die Forscher die Einstellung gegenüber Türken in den Alten Bundesländern mit einem weiteren Item gemessen, das die Wahrnehmung der Konkurrenz zwischen der In- und Outgroup um Arbeitsplätze erfassen sollte. Die Befragten Inländer sollte ihm zu stimmen oder es ablehnen. „339. Türken haben Arbeitsplätze, die den Deutschen zuständen“ (EMNID 1988, S.21) Als exogene Merkmale erhoben sie die subjektive Links-Rechts-Einstufung auf einer 10-er Likertskala, wobei der Wert 1 dem Pol Links und der Wert 10 dem Pol Rechts entsprach. Zusätzlich maßen sie die relative Deprivation der Inländer im Vergleich zu den Türken anhand der folgenden Frage: „353. Wenn Sie einmal vergleichen: Ist es Deutschen wie Ihnen in den vergangenen 5 Jahren in wirtschaftlicher Hinsicht besser oder schlechter gegangen als den hier lebenden Türken? Würden Sie sagen viel besser, besser, etwa gleich, schlechter oder viel schlechter ?“ (EMNID 1988 Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 20 Für die weiteren Analysen dichotomisieren wir die Antwortvorgaben dergestalt, daß wir die Befragten, die ihre wirtschaftliche Situation als viel schlechter oder schlechter als diejenige der Türken einschätzen, mit denjenigen vergleichen, die ihre Situation mindestens als gleich gut bzw. besser einstufen. LIMDEP-Befehle für die Schätzung des Haupt- und Interaktionseffektmodell der logischen Regression: ? Auswahl der Substichprobe BRD(ABL) 1988 reject; DBRD=0$ ? Manueller Ausschluss fehlender Werte reject; ogjobs=-999 | poliselb=-999|deprivat=-999$ ? Anzahl der Auspraegungen der abhaengigen Variablen: 2 calc; ycat=2$ ? Berechnung des Mittelwerts der Links-Rechts-Selbsteinstufung dstat;rhs=poliselb$ ? Zentrierung am Minimum von POLISELB create; polisec1=poliselb-1$ ? Schaetzung des Nullmodells logit; lhs=ogjobs;rhs=one$ exec;proc=hierinit$ ? Schaetzung des Haupteffektmodells: + POLISEC1 + DEPRIVAT namelist; X=one,polisec1,deprivat$ logit; lhs=ogjobs;rhs=X;marginal$ exec;proc=hiertest$ exec;proc=mzr2l$ ? Berechnung der geschaetzten Logits, Probs create; flgth=dot(X,b)$ create; plgth=lgp(flgth)$ ? Bildung der Hilfsvariablen DERPIVAT*POLISEC1 create;deprpoli=polisec1*deprivat$ ? Schaetzung des logist.Regressionsmodells mit Interaktionseffekt namelist;X=one,polisec1,deprivat,deprpoli$ logit; lhs=ogjobs;rhs=X;marginal$ exec;proc=hiertest$ exec;proc=mzr2l$ ? Berechnung der geschaetzten Logits, Probs und Erstellung der Plots create; flgti=dot(X,b)$ create; plgti=lgp(flgti)$ plot;lhs=polisec1;rhs=flgth,flgti;grid;spikes=0,4.44;endpoints=-0.5,9.5$ plot;lhs=polisec1;rhs=plgth,plgti;grid;spikes=0,4.44;endpoints=-0.5,9.5$ delete;flgth,flgti,plgth,plgti$ Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 21 Wir zentrierten die Links-Rechts-Selbsteinstufung an ihrem eigenen Minimum von 1. Hierdurch erfaßt die logistische Regressionskonstante das geschätzte Logit der Zustimmung zum Item, derjenigen Befragten, die sich als Links einstufen und sich im Vergleich zu hier lebenden den Türken in wirtschaftlicher Hinsicht keinesfalls als benachteiligt einstufen. Für das Haupteffektmodell erhalten wir die folgenden Logitschätzer und Anpassungsmaße: +---------------------------------------------+ | Multinomial Logit Model | | Maximum Likelihood Estimates | | Dependent variable OGJOBS | | Weighting variable ONE | | Number of observations 860 | | Iterations completed 4 | | Log likelihood function -571.5852 | | Restricted log likelihood -586.8430 | | Chi-squared 30.51559 | | Degrees of freedom 2 | | Significance level .0000000 | +---------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Characteristics in numerator of Prob[Y = 1] Constant -1.022446646 .17424108 -5.868 .0000 POLISEC1 .1467086935 .34721678E-01 4.225 .0000 4.4441860 DEPRIVAT 1.033616374 .28913410 3.575 .0004 .66279070E-01 +-------------------------------------------+ | Partial derivatives of probabilities with | | respect to the vector of characteristics. | | They are computed at the means of the Xs. | | Observations used for means are All Obs. | +-------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Marginal effects on Prob[Y = 1] Constant -.2498732134 .41493580E-01 -6.022 .0000 POLISEC1 .3585377566E-01 .84779964E-02 4.229 .0000 4.4441860 DEPRIVAT .2526029556 .70738255E-01 3.571 .0004 .66279070E-01 Frequencies of actual & predicted outcomes Predicted outcome has maximum probability. -----Actual -----0 1 -----Total Predicted ---------- + 0 1 | ---------- + 403 90 | 244 123 | ---------- + 647 213 | ----Total ----493 367 ----860 Modellanpassung: McFadden Pseudo R2 = 2,60 % McKelvey&Zavoina Pseudo R2 = 4,38 % Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 22 Der im Vergleich zum Nullmodell erzielte Informationsgewinn von 2,60 % nach McFadden fällt zwar gemäß dem Likelihood-Ratio-2 von 30,52 bei 2 Freiheitsgraden signifikant aus, aber die geschätzte Varianzaufklärung von rd. 4,38 % erweist sich als sehr bescheiden. Die Linken der Referenzgruppe lehnen das Item mehrheitlich ab, wie die logistische Regressionskonstante von -1,02 belegt. Ihr entspricht eine Zustimmungswahrscheinlichkeit von rd. 26,46 %. Je weiter rechts sich die Befragten einordnen, desto eher stimmen sie dem Item, wie der statistisch signifikante logistische Steigungskoeffizient von +0,15 belegt. Ebenfalls neigen Deprivierte eher dazu, dieses Item zu bejahen, wie der signifikante Logitschätzer von +1,03 zeigt. Für das logistische Regressionsmodell mit dem spezifizierten Interaktionseffekt zwischen Links-Rechtsselbsteinstufung und der Deprivation erhalten wir die folgenden Schätzer und Fitindizes. +---------------------------------------------+ | Multinomial Logit Model | | Maximum Likelihood Estimates | | Dependent variable OGJOBS | | Weighting variable ONE | | Number of observations 860 | | Iterations completed 5 | | Log likelihood function -566.8665 | | Restricted log likelihood -586.8430 | | Chi-squared 39.95315 | | Degrees of freedom 3 | | Significance level .0000000 | +---------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Characteristics in numerator of Prob[Y = 1] Constant -1.124132801 .17897563 -6.281 .0000 POLISEC1 .1689630716 .35736967E-01 4.728 .0000 4.4441860 DEPRIVAT 3.408986305 .91119627 3.741 .0002 .66279070E-01 DEPRPOLI -.5558076698 .19413992 -2.863 .0042 .27674419 +-------------------------------------------+ | Partial derivatives of probabilities with | | respect to the vector of characteristics. | | They are computed at the means of the Xs. | | Observations used for means are All Obs. | +-------------------------------------------+ +---------+--------------+----------------+--------+---------+----------+ |Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X| +---------+--------------+----------------+--------+---------+----------+ Marginal effects on Prob[Y = 1] Constant -.2747584588 .42550374E-01 -6.457 .0000 POLISEC1 .4129764126E-01 .87225715E-02 4.735 .0000 4.4441860 DEPRIVAT .8332181237 .22325684 3.732 .0002 .66279070E-01 DEPRPOLI -.1358494820 .47523223E-01 -2.859 .0043 .27674419 Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 23 Frequencies of actual & predicted outcomes Predicted outcome has maximum probability. -----Actual -----0 1 -----Total Predicted ---------- + 0 1 | ---------- + 409 84 | 248 119 | ---------- + 657 203 | ----Total ----493 367 ----860 Anpassungsmaße: McFadden Pseudo R2 = ûMcFadden Pseudo R2 = Partieller LR-2 = 9,44 3,40 % McKelvey&Zavoina Pseudo-R2 = 0,80 % û McKelvey&Zavoina Pseudo-R = 1,56 % D.F.= 1 5,94 % 2 . = 0,00 Im Vergleich zum Haupteffektmodell erhöht sich der Informationsgewinn nach McFadden um rd. 0,80. Dies entspricht einer Erhöhung der nach McKelvey&Zavoina geschätzten Varianzaufklärung um rd. 1,56%. Wie dem partiellen Likelihood-Ratio-2-Test zu ennehmen ist, erweist sich diese Verbesserung der Modellanpassung als statistisch signifikant. Durch die von uns gewählte Zentrierung der Links-Rechts-Selbsteinstufung erfaßt die Regressionskonstante erneut das geschätzte Logit der Befürwortung des Items der Linken, die sich selbst als nicht nachbeteiligt im Vergleich zu den hier lebenden Türken einschätzen. Ihr geschätztes Logit von -1,12 entspricht einer Zustimmungswahrscheinlichkeit von 24,53 %. Nehmen sich diese Linken aber als wirtschaftlich benachteiligt war, so steigt ihr geschätztes Logit um rd. 3,41 Einheiten an. Ihre Wahrscheinlichkeit, dem Item zu zustimmen, beträgt dann rd. 90,76 %. Ordnen sich nichtdeprivierte Befragte auf der Links-Rechts-Skale um eine Einheit weiter rechts ein, so erhöht sich in signifikanten Maße ihr geschätztes Logit der Zustimmung um rd. +0,17 Einheiten. Der Logitschätzer des Interaktionsterms von -0,56 erweist sich als statistisch signifikant, wie der zugehörige T-Test belegt. Sein negatives Vorzeichen charakteristiert das Zusammenwirken beider Merkamale dergestalt, daß je weiter rechts sich die Befragten einstufen, desto geringer fällt der Effekt der relativen Deprivation auf die Zustimmungsneigung aus. Mit Hilfe der partiellen Ableitung der Logits identifizieren wir erneut die genaue Wirkung des Interaktionseffektes. Alternativ hierzu stellen wir die wechselseitige Beeinflussung beider Merkmale in ihrer Wirkung auf die Zustimmungsneigung mit Hilfe der geschätzten Logits und Zustimmungswahrscheinlichkeiten dar. Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 24 (8) Berechnung der partiellen Ableitungen für die Links-Rechts-Selbsteinstufung und die relative Deprivation (1) Berechnung der geschätzten Logits ˆ 1,124 0,169 POLISEC1 3,409 DEPRIVAT Logit 0,556 ( POLISEC1 DEPRIVAT) (2) Berechnung der partiellen Ableitung von POLISEC1 (2a) Logit 0,169 0,556 ( DEPRIVAT ) POLISEC1 (2b) Logit 0,169 POLISEC1 |DEPRIVAT 0 (2c) Logit 0,169 0,556 0,387 POLISEC1 |DEPRIVAT 1 (3) Berechnung der partiellen Ableitung für DEPRIVAT Logit 3,409 0,556 ( POLISEC1 ) DEPRIVAT Bei der Betrachtung der partiellen Ableitung der Logits nach POLISEC1 zeigt sich, daß der Effekt der Links-Rechts-Selbsteinstufung auf die Zustimmungsneigung in den Gruppen der Nichtdeprivierten und Deprivierten genau umgekehrt ausfällt. Während bei den Nichbenachteiligten das geschätzte Logit um +0,169 Einheiten zunimmt, wenn sie sich eine Einheit weit rechts einstufen, reduziert sich das geschätzte Logit der Deprivierten jeweils um -0,387 pro Einheitswechsel nach rechts. Bei ihnen fällt der Effekt seinem Betrag nach doppelt so hoch aus als bei den Nichtbenachteiligten. Vice versa nimmt der geschätzte Unterschied zwischen den Deprivationsgruppen um 0,556 Einheiten ab, wenn sich die Befragten um jeweils eine Einheit weiter nach Rechts einordnen. LIMDEP bietet uns die Möglichkeit, die geschätzten Logits und Zustimmungswahrscheinlichkeiten des Haupteffekt- und Interaktionsmodells zu simulieren, um eine bessere graphische Darstellung zu erhalten. Hierfür nehmen wir einfach an, daß sich unsere Links-Rechts-Selbsteinstufung nicht nur um ganze Punkte sondern sich auch um Zehntelpunkte ändern kann. Hierdurch erhalten wir anstatt von jeweils zehn geschätzten Funktionswerten pro Deprivationsgruppe jeweils eine logistische Gerade bzw. eine stetige Wahrscheinlichkeitsfunktion. Hierfür benötigen wir die folgenden LIMDEP-Befehle: Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - 25 LIMDEP-Befehle für die Simulation der geschätzten Logits und Zustimmungswahrscheinlichkeiten: type; Simulation der geschaetzten Logits im Haupt- und Interationsmodell$ type; POLISEC1 von 0 bis 9 Punkte$ type; LGTHND: Logit HM Nichtdeprivierte $ type; LGTHD: Logit HM Deprivierte$ type; PHND= Wahlwahrscheinlichkeit HM Nichtdepriviert$ type; PHD= Wahlwahrscheinlichkeit HM Deprivierte$ type; LGTIND: Logit IM Nichtdeprivierte $ type; LGTID: Logit IM Deprivierte$ type; PIND= Wahlwahrscheinlichkeit IM Nichtdepriviert$ type; PID= Wahlwahrscheinlichkeit IM Deprivierte$ sample; 1-100$ create; polisec1=trn(0,0.1)$ create; lgthnd = -1.022 + 0.147*polisec1$ create; lgthd= -1.022 + 0.147*polisec1 + 1.034$ create; lgtind= -1.124 + 0.169*polisec1$ create; lgtid= -1.124 + 0.169*polisec1 + 3.409 - 0.556*polisec1$ create; create; create; create; phnd=lgp(lgthnd)$ phd=lgp(lgthd)$ pind=lgp(lgtind)$ pid=lgp(lgtid)$ plot;lhs=polisec1; rhs=lgthnd,lgthd,lgtind,lgtid;grid;spikes=0,4.44; endpoints=0,10$ plot; lhs=polisec1; rhs=phnd,phd,pind,pid;grid;spikes=0,4.44; endpoints=0,10$ Mit Hilfe der „trn“-Option des Create-Befehls realisieren wir diese Änderung der Selbsteinstufung um jeweils einen Dezimalpunkt, indem wir den Startwert 0 und das Inkrement 0.1 festlegen. Über die Sample-Funktion führen wir 100 Simulationsschritte durch und füllen damit die Lücken zwischen unseren Punktwerten auf. Bei der Betrachtung sowohl der geschätzten Logits als auch der Zustimmungswahrscheinlichkeiten in Abbildung 5 und 6 zeichnet sich der negative Interaktionseffekt beider exogener Merkmale deutlich ab. Die relative Deprivation wirkt vor allem bei denjenigen Personen zustimmungsfördernd, die sich eher links einstufen. Hingegen wirkt sie sich bei den eher rechts stehenden Personen eindeutig zustimmungshemmend aus. Dr. Wolfgang Langer - Verallgemeinerte lineare Modelle - SoSe 2001 - Abb. 5: Geschätzte Logits der Zustimmungsneigung im Haupt- (LGTH) und Interaktionseffektmodell (LGTI) auf POLISEC1 und DEPRIVAT (ND: nein; D: ja) Abb. 6: Geschätzte Logits der Zustimmungsneigung im Haupt- (PH) und Interaktionseffektmodell (PI) auf POLISEC1 und DEPRIVAT 26