Methoden V: Verallgemeinerte Lineare Modelle

Werbung
Dr. Wolfgang Langer -
2.2.4.2
Verallgemeinerte lineare Modelle -
SoSe 2001
-
1
Die Interpretation von Interaktionseffekten im logistischen Regressionsmodell für Individualdaten
In diesem Abschnitt vertiefen wir die in Abschnitt 2.2.3.2 begonnene Diskussion über die
Spezifikation und Interpretation von Interaktionseffekten bei der logistischen Regression. Eine
Vielzahl von Autoren sparen dieses Thema in ihren einschlägigen Einführungsbüchern entweder
aus oder sie streifen es nur am Rande.1 Letztere ersparen sich aber eine detaillierte Interpretation
der geschätzten logistischen Steigungskoeffizienten.2 Angesichts in Deutschland geführten
Diskussion über „implizite“ und „explizite Interaktionseffekte“ erscheint eine Klärung der sich
widersprechenden Positionen von Jagodzinski&Klein (1997)3 und Schumann&Hardt (1998)
dringend geboten zu sein. Erstere vertreten die These, daß im logistischen Regressionsmodell
bei der Betrachtung der geschätzten Wahlwahrscheinlichkeiten der Interaktionseffekt zweier
unabhängiger Variablen aufgrund der „multiplikativen Modellstruktur“ bereits implizit enthalten sei. Ihres Erachtens ist dies ersichtlich, wenn wir die logistische Schätzgleichung gleichzeitig nach zwei exogenen Merkmalen ableiten, wie dies Hanushek&Jackson (1977) getan
haben:4
(1) Berechnung der gemeinsamen 1. Ableitung für zwei exogene Merkmale Xj und Xk
2 P( Y 1)
j k P̂ ( 1 P̂) (1 2 P̂)
Xj Xk
Legende
j: Logistischer Steigungskoeffizient von Xj
k: Logistischer Steigungskoeffizient von Xk
P̂: Geschätzte Wahlwahrscheinlichkeit für Y 1
Hingegen vertreten Schumann&Hardt (1998) die Position, daß sich ein Interaktionseffekt nur
1
S. Wrigley (1985; S. 91-96); Demaris (1992, S. 52f); Menard (1995, S. 52ff); Long (1997)
2
Zur Interpretation der geschätzten Odds im logistischen Regressionsmodell mit
Interaktionseffekten: S. Kleinbaum (1994, S. 209)
3
S. Jagodzinski&Klein (1997, S. 55)
4
S. Hanushek&Jackson (1977, S.189)
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
2
bestimmen läßt, wenn er bei der logistischen Regression als eigenständiger Prädiktor in Form
einer Hilfsvariablen eingeführt wird, die sich aus der Multiplikation der sie tragenden exogenen
Merkmale ergibt. Im Sinne des für die Logits unterstellten linear-additiven Modells mißt dann
der zugehörige logistische Steigungskoeffizient die Richtung und die Stärke des Interkationseffekts.
„Nach dem oben Gesagten erscheint es ratsam, Interaktionsterme explizit in ein Logit-Modell
einzufügen, sofern theoretische Überlegungen dies nahelegen. Solche expliziten Interaktionsterme haben den Vorteil, daß Interaktionen zwar, falls zwei oder mehr Variablen einen Einfluß
auf die abhängige Variable ausüben, auftreten können, dies jedoch keineswegs. Man hat die
Möglichkeit, Interaktionseffekte zu separieren und deren Stärke und Signifikanz zu bestimmen.“
(Schumann&Hardt 1998, S. 93)
Sie weisen ausdrücklich daraufhin, daß der von Jagodzinski&Klein (1997) bei der Betrachtung
der geschätzten Wahlwahrscheinlichkeiten der Republikaner entdeckte „Interaktionseffekt“ von
rechtsexteremer Orientierung und Politikverdrossenheit allein durch die logistische Verteilungsfunktion „modellgeneriert und nicht Ausdruck einer besonderen Struktur in den Daten“ sei.
Daher empfehlen Schumann&Hardt einen aufgrund von theoretischen Überlegungen erwarteten
Interaktionseffekt direkt im Rahmen der logistischen Regression mit über eine explizit aufgenommene Hilfsvariable zu ermitteln und im Hinblick auf die geschätzten Logits zu interpretieren. Beide Autoren vermeiden es aber, auf die Bedeutung der logistischen Schätzer der
beteiligten exogenen Merkmale und ihrer Interaktion detailliert einzugehen. In dieser Hinsicht
erweist sich die Literaturlage im Bereich der logistischen Regression als eher dürftig. Da es sich
bei ihr im Hinblick auf die zu schätzenden Logits um ein linear-additives Modell handelt,
können wir den im Bereich der linearen Regressionsanalyse vorhandenen Kenntnisstand auf das
Logitmodell übertragen. Die folgende Darstellung orientiert sich an den Arbeiten von Aiken&West(1991) sowie Jaccard,Turrisi,Wan (1996).
Bei unserem Item „Ich könnte mir vorstellen, mit einem Türken, einer Türkin ein sexuelles
Verhältnis zu haben“ erwarten wir bei Ablehnungsbereitschaft der Befragten einen altersabhängigen Geschlechtseffekt. Da die Interaktion zweier exogener Merkmale immer in beide
Richtungen wirkt, könnten wir gleichermaßen unterstellen, daß der Alterseffekt auf die Ablehnungsbereitschaft geschlechtspezifisch wirkt. Um dies zu überprüfen, erweitern wir das
„Haupteffektmodell“ der logistischen Regression, welches als Prädiktoren nur das Alter (AGE)
und den Geschlechtsdummy (FRAU) enthält, um eine aus der Multiplikation beider Merkmale
gewonnene Hilfsvariable. Deren logistischer Steigungskoeffizient erfaßt nun die Richtung und
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
3
Stärke der Interaktion im Sinne einer wechselseitigen Verstärkung bzw. Abschwächung in ihrer
gemeinsamen Wirkung auf die Ablehnungsbereitschaft. Formal entspricht dies der folgenden
Schätzgleichung.
(2) Schätzgleichungen des Haupteffekt- und Interaktionsmodells der logistischen Regression
1. Schätzgleichung der logistischen Regression nur mit Haupteffekten:
ln
P ( Yi 1)
1 P ( Yi 1 )
0 1 AGE 2 FRAU 0i
2. Schätzgleichung der logistischen Regression mit Interaktionseffekt:
ln
P ( Yi 1 )
1 P ( Yi 1 )
0 1 AGE 2 FRAU 3 ( AGEFRAU ) 0i
Analog zum klassischen linearen Regressionsmodell gilt, daß die Logitschätzer für AGE und
FRAU im Modell mit Interaktionseffekt nicht mehr wie im Haupteffektmodell „einfache
logistische Steigungskoeffizienten“ („simple slopes“) darstellen. Bei ihnen handelt es sich
vielmehr um bedingte Steigungskoeffizienten („conditional slopes“), die den Effekt des betreffenden Merkmals unter der Bedingungen erfassen, daß alle anderen an der Interaktion beteiligten exogenen Merkmale jeweils Null sind. Bezogen auf unsere geschätzten Logits entsprechen die bedingten Steigungskoeffizienten den folgenden Erwartungswerten:
(3) Interpretation der bedingten logistischen Steigungskoeffizienten und des Interaktionseffekts
1. Logistische Regressionskonstante
0 E (Logit |AGE 0 š FRAU 0 ) E (Logit |AGE 0 š Mann )
2. Bedingte Haupteffekte:
AGE E (û Logit |û AGE 1 š FRAU 0 ) E (û Logit |û AGE 1 š Mann )
FRAU E (û Logit |û FRAU 1 š AGE 0 ) E (û Logit |Frau š AGE 0 )
3. Interaktionseffekt von AGE und FRAU:
AGEFRAU E (û Logit |û AGE 1 š û FRAU 1 ) E (û Logit |û AGE 1 š Frau )
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
4
Hierbei erfaßt der bedingte Logitschätzer des Merkmals AGE die Zunahme des geschätzten
Logits pro Erhöhung des Lebensalters um 1 Jahr unter der Bedingung, daß der Geschlechterdummy FRAU Null ist Folglich handelt es sich beim ihm um den geschlechtsspezifischen
Alterseffekt der Männer. Hingegen erfaßt der bedingte Logitschätzer für FRAU den Geschlechtsunterschied der Ablehnungsneigung von Frauen im Vergleich zu Männern im Alter
von Null Jahren, sprich bei frisch geborenen Säuglingen. Dieser Gruppenvergleich erscheint
aber nicht als sinnvoll, da Säuglinge in diesem Alter noch nicht in der Lage sind, Fragen zu
beantworten. Aiken&West (1991) weisen ausdrücklich daraufhin, daß der zu testende Gruppenunterschied bei konditionalen Effekten dergestalt sinnhaft sein sollte, daß die zu untersuchenden
Gruppen tatsächlich in der Grundgesamtheitsdefinition vorkommen.
„Conditional effects describe the effect of on predictor on the criterion variable under the
condition in which the other predictors equals a specified value. For a conditional effect to be
useful, the point on the other preditors at which it is evaluated must be meaningful.“ (S.37)
Da wir die Kondition der bedingten Schätzer selbst nicht ändern können, bietet es sich an, die
exogenen Merkmale dergestalt zu transformieren, daß die konditionalen Schätzer des Alters und
Geschlecht einen sinnvollen Vergleich durchführen. Ein hierfür geeignetes Mittel stellt die
Zentrierung der kontinuierlichen Prädiktoren an ihrem jeweiligen Stichprobenmittelwert dar.
Bei der Zentrierung handelt es sich um eine lineare Transformation, die erstens den Mittelwert
der zentrierten Variablen in den Nullpunkt verschiebt und die zweitens die Varianz des Merkmals selbst nicht beeinflußt.
Dies führt dazu, daß nach der Zentrierung des exogenen Merkmals die Regressionskonstante b0
im linear-additiven Modell den Erwartungswert der Kriteriumsvariablen bzw. ihres Logits für
den Mittelwert des metrischen exogenen Merkmalls im Sinne des „Durchschnittsfalls“ mißt. In
unserem Fall erfaßt bei einer Zentrierung des Lebensalters am Stichprobenmittel der bedingte
Haupteffekt des Geschlechterdummy FRAU unmittelbar die Differenz der geschätzten Logits
von Frauen und Männer im Durchschnittsalter. Der zugehörige T-Test überprüft, ob dieser im
Durchschnittsalter erwartete Unterschied der Ablehnungsbereitschaft statistisch signifikant ist.
„The b1 and b2 coefficients never represent constant effects of the predictors in the presence of
an interaction. The b1 and b2 coefficients from centered equations always represent the effects
of the predictors at the mean of other predictors. In the centered equation, they may also be
considered as the weighted average effect of each predictor coefficient across all observed
values of the other predictor. The interpretation of b1 or b2 as conditional effects of predictors
at the mean of other predictors may well be useful in clarifying relationships under investiga-
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
5
tion.“. (Aiken&West 1991, S. 39),
Wir können das Lebensalter an jeden beliebigen Wert zentrieren, sofern der beabsichtigte
Geschlechtervergleich der Ablehnungsbereitschaft dort sinnvoll ist.5 Formal gesehen läßt sich
die Zentrierung dieses intervallskalierten Prädiktors am Altersdurchschnitt und am Mindestalter
der Befragten demonstrieren. Letzteres lag im Eurobarometer 30 bei 15 Jahren.
(4) Formen der Zentrierung intervallskalierter Prädiktoren:
1. Zentrierung am Stichprobenmittelwert:
AGECx̄ AGEi x̄AGE
E ( AGEC x̄ ) E ( AGE ) x̄AGE 0
Var ( AGEC x̄ ) Var ( AGE )
2. Zentrierung am Mindestalter der Stichprobe
AGECMinimum AGEi MinimumAGE
E ( AGECMinimum ) E ( AGE ) MinimumAGE
AGECMinimum 0 entspricht dem Minimum von AGE !
Var ( AGECMinimum ) Var ( AGE )
Hierdurch modifiziert sich die Schätzgleichung der logistischen Regression mit dem Interaktionseffekt von Lebenalter und Geschlecht sowie die Interpretation der bedingten Steigungskoeffizienten folgendermaßen:
(5) Einfluß der Zentrierung am Altersmittelwert auf die logistische Konstante und die
Steigungskoeffizienten
1. Schätzgleichung der logistischen Regression mit Interaktionseffekt von FRAU
und des am Mittelwert zentrierten Alter
ln
5
P ( Yi 1 )
1 P ( Yi 1 )
0 1 AGEC x̄ 2 FRAU 3 ( AGEC x̄ FRAU ) 0i
Zur Diskussion der Zentrierung im Bereich der Mehrebenenanalyse: S. Raudenbush
(1989a, 1989b), Plewis (1989), Longford (1989), Kreft, DeLeeuw&Aiken (1995),
Snijders&Bosker (1999, S. 80f)
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
6
(6) Interpretation der logistischen Schätzer
2. Logistische Regressionskonstante
0 E (Logit |AGEC x̄ 0 š FRAU 0 ) E ( Logit |AGE x̄ AGE š Mann )
3. Bedingte Haupteffekte:
AGEC E (û Logit |û AGEC x̄ 1 š FRAU 0 ) E (û Logit |û AGEC x̄ 1 š Mann )
x̄
FRAU E (û Logit |û FRAU 1 š AGEC x̄ 0 ) E (û Logit |Frau š AGE x̄AGE )
4. Interaktionseffekt von AGE und FRAU:
AGEC FRAU E (û Logit |û AGECx̄ 1 š û FRAU 1 )
x̄
E (û Logit |û AGECx̄ 1 š Frau )
Bei der Zentrierung am Mindestalter der Befragten erhalten wir die folgende Schätzgleichung:
(7) Einfluß der Zentrierung am Mindestalter auf die logistische Konstante und die
Steigungskoeffizienten
1. Schätzgleichung der logistischen Regression mit Interaktionseffekt von FRAU
und des am Mindestalter zentrierten Lebensalters
ln
P ( Yi 1 )
1 P ( Yi 1 )
0 1 AGEC Minimum 2 FRAU
3 ( AGEC Minimum FRAU ) 0i
(8) Interpretation der logistischen Schätzer
2. Logistische Regressionskonstante
0 E (Logit |AGECMinimum 0 š FRAU 0 )
E ( Logit |AGE MinimumAGE š Mann )
3. Bedingte Haupteffekte:
AGEC
Minimum
E (û Logit |û AGECMinimum 1 š FRAU 0 )
E (û Logit |û AGECMinimum 1 š Mann )
FRAU E (û Logit |û FRAU 1 š AGECMinimum 0 )
E (û Logit |Frau š AGE MinimumAGE )
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
7
4. Interaktionseffekt von AGE und FRAU:
AGEC
Minimum FRAU
E (û Logit | û AGECMinimum 1 š û FRAU 1 )
E (û Logit |û AGECMinimum 1 š Frau )
Um die Interpretation der konditionalen Logitschätzer und des Interaktionseffekts zu veranschaulichen, schätzen wir zunächst ein Haupteffektmodell mit dem am Mindesalter von 15
Jahren zentrierten Lebensalter und dem Geschlecherdummy FRAU. Anschließend führen wir
zusätzlich den Interaktionseffekt des zentrierten Alters und des Dummy FRAU ein, um den
altersabhängigen Geschlechterunterschied bzw. den geschlechtsspezifischen Alterseffekt auf die
Ablehnung unseres Items zu bestimmen. Hierfür benötigen wir die folgenden LIMDEP-Befehle:
LIMDEP-Befehle für die Schätzung des Haupt- und Interaktionseffektmodell der logistischen Regression
open; output=logitreg.out$
title; Logistische Regression mit Individualdaten: EB30, BRD(ABL) 1988$
? Einlesen der binaeren Datendatei: EURBOBARO Nr 30
load; file=eb30kurs.lpj$
? Zuruecknahme der bisherigen Fallauswahl
sample; all$
? Auswahl der Substichprobe BRD(ABL) 1988
reject; DBRD=0$
? Manueller Ausschluss fehlender Werte
reject; ogsexabl=-999 | AGE=-999|FRAU=-999$
? Anzahl der Auspraegungen der abhaengigen Variablen: 2
calc; ycat=2$
? Berechnung des Durchschnittsalters
dstat;rhs=age$
? Zentrierung am juengsten Jahrgang (Mindestalter der Befragten)
create; agec15=age-15$
? Zentrierung am Durchschnittsalter mit Hilfe der Create-Funktion xbr()
create; agecm=age-xbr(age)$
dstat;rhs=age,agec15,agecm$
? Schaetzung des Nullmodells
logit; lhs=ogsexabl;rhs=one$
exec;proc=hierinit$
? Schaetzung des Haupteffektmodells: + AGEC15 + FRAU
namelist; X=one,agec15,frau$
logit; lhs=ogsexabl;rhs=X;marginal$
exec;proc=hiertest$
exec;proc=mzr2l$
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
8
? Berechnung der geschaetzten Logits, Probs
create; flgt=dot(X,b)$
create; plgt=lgp(flgt)$
plot; lhs=agec15; rhs=flgt;grid;spikes=26.28;endpoints=0,80$
plot; lhs=agec15; rhs=plgt;grid;spikes=26.28;endpoints=0,80$
? Schaetzung des logist.Regressionsmodells mit Interaktionseffekt
? Bildung der Hilfsvariablen FRAU*AGEC15
create;frauag15=agec15*frau$
namelist;X=one,agec15,frau,frauag15$
logit; lhs=ogsexabl;rhs=X;marginal$
exec;proc=hiertest$
exec;proc=mzr2l$
? Berechnung der geschaetzten logits, odds, probs
create; flgt=dot(X,b)$
create; plgt=lgp(flgt)$
plot; lhs=agec15; rhs=flgt;grid;spikes=26.28;endpoints=0,80$
plot; lhs=agec15; rhs=plgt;grid;spikes=26.28;endpoints=0,80$
delete;flgt,plgt$
Für unsere zentrierten Altersvariablen erhalten wir die folgenden deskriptiven Statistiken:
Tab.1: Univariaten statistischen Kennziffern der zentrierten und unzentrierten Altersvariablen
Descriptive Statistics
All results based on nonmissing observations.
Variable
Mean
Std.Dev.
Minimum
Maximum
Cases
------------------------------------------------------------------------------AGE
41.2803204
17.3685316
15.0000000
94.0000000
874
AGEC15
26.2803204
17.3685316
.000000000
79.0000000
874
AGECM
-.951184211E-14 17.3685316
-26.2803204
52.7196796
874
Wir schätzen zunächst unsere Haupt- und Interaktionsmodell mit dem am Mindestalter zentrierten Lebensalter. Anschließend vergleichen wir seine Ergebnisse mit denjenigen der logistischen Regressionsmodelle für das am Altersmittelwert zentrierte Lebensalter. Für unsere erste
Modellgruppe erhalten wir die folgenden Angaben zur Modellanpassung und Logitschätzer:
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
9
+---------------------------------------------+
| Multinomial Logit Model
|
| Maximum Likelihood Estimates
|
| Dependent variable
OGSEXABL
|
| Weighting variable
ONE
|
| Number of observations
874
|
| Iterations completed
5
|
| Log likelihood function
-476.0552
|
| Restricted log likelihood
-514.6884
|
| Chi-squared
77.26640
|
| Degrees of freedom
2
|
| Significance level
.0000000
|
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Characteristics in numerator of Prob[Y = 1]
Constant -.1355193360
.14999999
-.903
.3663
AGEC15
.2745477950E-01 .49781271E-02
5.515
.0000 26.280320
FRAU
.9743300091
.16233228
6.002
.0000 .50457666
+-------------------------------------------+
| Partial derivatives of probabilities with |
| respect to the vector of characteristics. |
| They are computed at the means of the Xs. |
| Observations used for means are All Obs. |
+-------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Marginal effects on Prob[Y = 1]
Constant -.2567579054E-01 .28693934E-01
-.895
.3709
AGEC15
.5201642720E-02 .91947437E-03
5.657
.0000 26.280320
FRAU
.1845986998
.30036692E-01
6.146
.0000 .50457666
Frequencies of actual & predicted outcomes
Predicted outcome has maximum probability.
-----Actual
-----0
1
-----Total
Predicted
---------- +
0
1 |
---------- +
24 217 |
26 607 |
---------- +
50 824 |
----Total
----241
633
----874
McFadden Pseudo-R2 = 7,51 %
McKelvey&Zavoina Pseudo-R2 = 13,53 %
Der Informationsgewinn des Haupteffekteffektmodells beträgt im Sinne McFaddens rd. 7,51%.
Die geschätzte Varianzaufklärung erreicht einen Wert von rd. 13,53%. Wie der LikelihoodRatio-2 von 77,27 bei 2 Freiheitsgraden belegt, ist dieser Erklärungsbeitrag mit einer Irrtumswahrscheinlichkeit von weniger als einem Promille statistisch signifikant. Wenn die Befragten
um ein Jahr älter werden, erhöht sich das Logit ihrer Ablehungsbereitschaft jeweils im signifikanten Maße um +0,027 Einheiten. Da wir das Lebensalter am Mindestalter der Befragten
zentriert haben, entspricht der Mittelwert der Variablen AGEC15 dem Mittelwert der unzen-
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
10
trierten Altersvariablen. Bezogen auf dieses Durchschnittsalter von 26,28 + 15 Jahren, steigt die
Ablehnungsbereitschaft um rd. 0,52 %, wenn der Befragte um genau ein Jahr älter wird. Das
geschätzte Logit der Frauen fällt um rd. +0,97 Einheiten signifikant höher aus als dasjenige der
gleichaltrigen Männer. Wie der partiellen Ableitung für den Geschlechterdummy Frau zu
entnehmen ist, erreicht die Ablehnungsbereitschaft der 16-jährigen Mädchen einen um etwa
18,46% höheren Wert als diejenige der gleichaltrigen Jungen.
Für das um den Interaktionseffekt erweiterte logistischen Regressionsmodell erhalten wir die
folgenden Logitschätzer und Anpassungmaße:
+---------------------------------------------+
| Multinomial Logit Model
|
| Maximum Likelihood Estimates
|
| Dependent variable
OGSEXABL
|
| Weighting variable
ONE
|
| Number of observations
874
|
| Iterations completed
6
|
| Log likelihood function
-475.3271
|
| Restricted log likelihood
-514.6884
|
| Chi-squared
78.72254
|
| Degrees of freedom
3
|
| Significance level
.0000000
|
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Characteristics in numerator of Prob[Y = 1]
Constant -.2779650644E-01 .17451972
-.159
.8735
AGEC15
.2264542844E-01 .63056767E-02
3.591
.0003 26.280320
FRAU
.6981341638
.27942643
2.498
.0125 .50457666
FRAUAG15 .1238259596E-01 .10331770E-01
1.198
.2307 14.203661
+-------------------------------------------+
| Partial derivatives of probabilities with |
| respect to the vector of characteristics. |
| They are computed at the means of the Xs. |
| Observations used for means are All Obs. |
+-------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Marginal effects on Prob[Y = 1]
Constant -.5220022445E-02 .32837716E-01
-.159
.8737
AGEC15
.4252679917E-02 .11864600E-02
3.584
.0003 26.280320
FRAU
.1311055406
.52955547E-01
2.476
.0133 .50457666
FRAUAG15 .2325379594E-02 .19218668E-02
1.210
.2263 14.203661
Frequencies of actual & predicted outcomes
Predicted outcome has maximum probability.
-----Actual
-----0
1
-----Total
Predicted
---------- +
0
1 |
---------- +
2 239 |
9 624 |
---------- +
11 863 |
----Total
----241
633
----874
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
11
Anpassungsmaße:
McFadden Pseudo R2 = 7,65 %
ûMcFadden Pseudo R2 = 0,14 %
McKelvey&Zavoina Pseudo R2 = 15,12 %
ûMcKelvey&Zavoina Pseudo R2 = 1,58 %
Partieller-Likelihood-Ratio-2 = 1,46 D.F.= 1
. = 0,23
Der erzielte Informationsgewinn im Sinne McFaddens von rd. 7,65 % sowie die geschätzte
Varianzaufklärung von rd. 15,12 % erweisen sich als statistisch signifikant, wie der globale
Wert von 78,72 bei 3 Freiheitsgraden und einer Irrtumswahrscheinlichkeit von weniger als
einem Promille belegt. Im Vergleich zum Haupteffektmodell erhöht sich die geschätzte Varianzaufklärung im Sinne McKelvey und Zavoinas um rd. 1,58%, wobei die mit Hilfe des
partiellen Likelihood-Ratio-2-Tests ermittelte Irrtumswahrscheinlichkeit die 5-%-Grenze weit
überschreitet. Dies bedeutet, daß der zu identifizierende Interaktionseffekt nicht auf die Grundgesamtheit übertragbar ist.
Um uns die Interpretation der geschätzten bedingten Haupteffekte und des Interaktionsterms zu
erleichtern, bieten sich zwei Möglichkeiten an. Zum einen berechnen wir die partiellen Ableitungen der Variablen AGEC15 und FRAU für die geschätzten Logits der Ablehnungsbereitschaft. Zum anderen lassen wir uns jeweils zwei Streudiagramm der geschätzten Logits und
Ablehnungswahrscheinlichkeiten mit dem zentrierten Lebensalter erstellen, die wir jeweils für
das Haupteffekt- und Interaktionsmodell miteinander vergleichen. Als weitere Orientierungslinie enthalten die Streudiagramme eine Parallele zur Y-Achse, die den arithmetrischen Mittelwert des zentrierten Lebensalters markiert.
Wenden wir uns zunächst der Interpretation der ermittelten Logitschätzer und ihrer partiellen
Ableitungen zu.
(9) Berechnung der geschätzten Logits der Ablehnungsbereitschaft
ˆ 0,028 0,023AGEC15 0,698FRAU 0,012( AGEC15FRAU )
(1) Logit
Die Regressionskonstante 0 erfaßt das geschätzte Logit der 15-jährigen Jungen und ist mit
einem Wert von -0,028 nicht signifikant von Null verschieden, wie der zugehörige T-Test zeigt.
Dies bedeutet, daß die Wahrscheinlichkeit, daß die Jungen dieser Altersgruppe das Item ablehnen in der Grundgesamtheit rd. 50 % beträgt. Das geschätzte Logit der gleichaltrigen Mädchen
fällt um rd, + 0,70 Einheiten signifikant höher aus als dasjenige der Jungen, wie dem zugehörigen bedingten Steigungskoeffizienten und seinem T-Wert zu entnehmen ist. Für die
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
12
Hilfsvariable FRAUAG15 hat LIMDEP einen logistischen Steigunsgkoeffizienten von +0,012
geschätzt, der aber nicht statistisch signifikant ist. Sein positives Vorzeichen weist auf eine
wechselseitige Verstärkung beider Merkmale in ihrer gemeinsamen Wirkung auf die Ablehungsbereitschaft des Befragten hin. Da die Interaktion zweier exogener Merkmale in beide
Richtungen verläuft, berechnen wir getrennt für AGEC15 und FRAU die zugehörigen partiellen
Ableitungen der Logits.
(10) Berechnung der partiellen Ableitungen für AGEC15 und FRAU
(2) Berechnung der partiellen Ableitungen:
(2a)
Logit
0,023 0,012FRAU
AGEC15
Logit
0,023
AGEC15 š Mann
Logit
0,023 0,0121 0,035
AGEC15 š Frau
(2b)
Logit
0,698 0,012AGEC15
FRAU
Im Hinblick auf die im Rahmen des linear-additiven Modells geschätzten Logits zeigt sich
folgdenes. Zum einen liegt ein geschlechtsspezifischer Alterseffekt liegt. Werden Männer um
ein Jahr älter, so erhöht das geschätzte Logit ihrer Ablehnungsbereitschaft um +0,023 Einheiten.
Bei den Frauen nimmt dieser Alterseffekt zusätzlich um jeweils +0,012 auf insgesamt +0,035
Einheiten pro Lebensjahr zu. Zum anderen nimmt der geschätzte Gruppenunterschied zwischen
Frauen und Männer um rd. 0,012 Einheiten pro Lebensjahr zu. Dieser Interaktionseffekt
zeichnet sich deutlich ab, wenn wir die Geraden der geschätzten Logits im Haupt- und Interaktionseffektmodell vergleichen. In Abbildung 1 entsprechen die unteren Geraden dem Alterseffekt der Männer und die oberen demjenigen der Frauen. Während die beiden roten Geraden
des Haupteffektmodells erwartungsgemäß parallel verlaufen, fällt der Alterseffekt der Frauen im
Interaktionsmodell deutlich stärker aus als derjenige der Männer. Ihre blaue obere Gerade
verfügt über eine deutlich höhere Steigung als diejenige der Männer. Vice versa nimmt mit
zunehmenden Alter der Geschlechtsunterschied bei den geschätzten Logits der Ablehnungsbereitschaft deutlich zu, wie in Abbildung 1 leicht erkennbar ist.
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
13
Abb. 1:
Geschätzte Logits der Haupt- (LGTH) und Interaktionseffektmodelle (LGTI) auf
zentriertes Lebensalter und FRAU
Abb. 2:
Geschätzte Ablehnungswahrscheinlichkeiten der Haupt- (PH) und
Interaktionseffektmodelle (PI) auf zentriertes Alter und FRAU
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
14
Wie sehr der Augenschein bei der Betrachtung der geschätzten Wahrwahrscheinlichkeiten
trügen kann, zeigt die bereits ausführlich dargestellte Debatte um „implizite“ und „explizite
Interaktionseffekte“. Abbildung 2 stellt daher die Verteilungen der altersabhängigen Ablehnungswahrscheinlichkeiten von Männer und Frauen im Haupt- und Interaktionseffektmodell
dar. Ein erster Blick auf die beiden geschlechtsspezifischen Alterseffekt in Abbildung 2 zeigt,
daß der bereits für die geschätzten Logits dargestellte Interaktionseffekt von Alter und Geschlecht bei den geschätzten Ablehnungswahrscheinlichkeiten überhaupt nicht so einfach zu
identifizieren ist. Die roten Punkte entsprechen in Abbildung 2 den geschätzten Ablehnungswahrscheinlichkeiten des Haupteffektmodells und die blauen Punkte denen des Interaktionseffektmodells. Der von uns ausdrücklich in das Modell eingeführte Interaktionseffekt beider
Variabeln manifestiert sich nicht in der Krümmung der geschlechtspezifischen Altersfunktonen
sondern in den Differenz der geschätzten Wahrscheinlichkeiten von Haupt- und Interaktionseffektmodell aus. Die Krümmung der geschätzten Wahrscheinlichkeitsfunktionen beruht allein
auf der von uns gewählten logistischen Verteilungsfunktion.
Limdep-Befehle für die Schätzung des logistischen Haupt- und Interaktionseffektmodells
mit dem am Altersmittelwert zenterierten Lebensalter und FRAU
? Schaetzung des Nullmodells
logit; lhs=ogsexabl;rhs=one$
exec;proc=hierinit$
? Schaetzung des Haupteffektmodells: + AGECM + FRAU
namelist; X=one,agecm,frau$
logit; lhs=ogsexabl;rhs=X;marginal$
exec;proc=hiertest$
exec;proc=mzr2l$
? Berechnung der geschaetzten logits, probs
create; flgth2=dot(X,b)$
create; plgth2=lgp(flgth2)$
? Bildung der Hilfsvariablen FRAU*AGECM
create;frauagcm=agecm*frau$
namelist;X=one,agecm,frau,frauagcm$
logit; lhs=ogsexabl;rhs=X;marginal$
exec;proc=hiertest$
exec;proc=mzr2l$
? Berechnung der geschaetzten logits, odds, probs
create; flgti2=dot(X,b)$
create; plgti2=lgp(flgti2)$
plot; lhs=agecm; rhs=flgth2,flgti2;grid$
plot; lhs=agecm; rhs=plgth2,plgti2;grid$
delete;flgth2,flgti2,plgth2,plgti2$
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
15
Für das Haupteffektmodell erhalten wir die folgenden Logitschätzer und Anpassungsmaße:
+---------------------------------------------+
| Multinomial Logit Model
|
| Maximum Likelihood Estimates
|
| Dependent variable
OGSEXABL
|
| Weighting variable
ONE
|
| Number of observations
874
|
| Iterations completed
5
|
| Log likelihood function
-476.0552
|
| Restricted log likelihood
-514.6884
|
| Chi-squared
77.26640
|
| Degrees of freedom
2
|
| Significance level
.0000000
|
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Characteristics in numerator of Prob[Y = 1]
Constant .5860010648
.10344761
5.665
.0000
AGECM
.2745477950E-01 .49781271E-02
5.515
.0000 -.95118421E-14
FRAU
.9743300091
.16233228
6.002
.0000 .50457666
+-------------------------------------------+
| Partial derivatives of probabilities with |
| respect to the vector of characteristics. |
| They are computed at the means of the Xs. |
| Observations used for means are All Obs. |
+-------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Marginal effects on Prob[Y = 1]
Constant .1110250466
.17075257E-01
6.502
.0000
AGECM
.5201642720E-02 .91947437E-03
5.657
.0000 -.95118421E-14
FRAU
.1845986998
.30036692E-01
6.146
.0000 .50457666
Frequencies of actual & predicted outcomes
Predicted outcome has maximum probability.
-----Actual
-----0
1
-----Total
Predicted
---------- +
0
1 |
---------- +
24 217 |
26 607 |
---------- +
50 824 |
----Total
----241
633
----874
Modellanpassung:
McFadden Pseudo-R2 = 7,51 %
McKelvey&Zavoina Pseudo-R2 = 13,53 %
Die Modellanpassung der beiden geschätzten Haupteffektmodelle unterscheidet sich weder im
Sinne der praktischen noch der statistischen Signifikanz. Die Unterschiedliche Zentrierung der
Altersvariable beeinflußt nicht die logistischen Steigungskoeffizienten. Lediglich bei der
Regressionskonstante weicht das zweite vom ersten Haupteffektmodell ab. Wie der Formel 6 zu
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
16
entnehmen ist, erfaßt die Regressionskonstante nun das geschätzte Logit der Männer im Durchschnittsalter von 41,28 Dezimaljahren. Mit einem Wert von rd. +0,59 ist es signifikant von Null
verschieden, wie der zugehörige T-Wert von 5,67 und die geschätzte Irrtumswahrscheinlichkeit
von weniger als einem Promille belegen. Wir erwarten für die Männer dieser Altersgruppe eine
Ablehnungswahrscheinlichkeit von 64,34 %. Der logistische Steigungskoeffizient für die
Abweichung der Frauen weist mit +0,97 denselben Wert wie im ersten Haupteffektmodell auf.
Für das logistische Regressionsmodell mit spezifizierten Interaktionseffekt erhalten wir die
folgenden Schätzer und Angaben zur Modellanpassung.
+---------------------------------------------+
| Multinomial Logit Model
|
| Maximum Likelihood Estimates
|
| Dependent variable
OGSEXABL
|
| Weighting variable
ONE
|
| Number of observations
874
|
| Iterations completed
6
|
| Log likelihood function
-475.3271
|
| Restricted log likelihood
-514.6884
|
| Chi-squared
78.72254
|
| Degrees of freedom
3
|
| Significance level
.0000000
|
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Characteristics in numerator of Prob[Y = 1]
Constant .5673326077
.10338829
5.487
.0000
AGECM
.2264542844E-01 .63056767E-02
3.591
.0003 -.95118421E-14
FRAU
1.023552753
.16872798
6.066
.0000 .50457666
FRAUAGCM .1238259596E-01 .10331770E-01
1.198
.2307 .94322508
+-------------------------------------------+
| Partial derivatives of probabilities with |
| respect to the vector of characteristics. |
| They are computed at the means of the Xs. |
| Observations used for means are All Obs. |
+-------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Marginal effects on Prob[Y = 1]
Constant .1065417682
.17173763E-01
6.204
.0000
AGECM
.4252679917E-02 .11864600E-02
3.584
.0003 -.95118421E-14
FRAU
.1922172613
.30399693E-01
6.323
.0000 .50457666
FRAUAGCM .2325379594E-02 .19218668E-02
1.210
.2263 .94322508
Frequencies of actual & predicted outcomes
Predicted outcome has maximum probability.
-----Actual
-----0
1
-----Total
Predicted
---------- +
0
1 |
---------- +
2 239 |
9 624 |
---------- +
11 863 |
----Total
----241
633
----874
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
17
Anpassungsmaße:
McFadden Pseudo R2 = 7,65 %
ûMcFadden Pseudo R2 = 0,14 %
McKelvey&Zavoina Pseudo R2 = 15,12 %
ûMcKelvey&Zavoina Pseudo R2 = 1,58 %
Partieller-Likelihood-Ratio-2 = 1,46 D.F.= 1
. = 0,23
Das zweite logistische Regressionsmodell mit dem Interaktionseffekt von AGECM und FRAU
unterscheidet sich bei der Modellanpassung weder bei der statistischen noch bei der praktischen
Signifikanz. Nur die Logitschätzer für die Regressionskonstante und den bedingten Haupteffekt
des Geschlechterdummy FRAU unterscheiden sich von denjenigen des ersten Interaktionsmodells. Der bedingte Haupteffekt des zentrierten Lebensalters und sein geschlechtsspezifischer
Interaktionseffekt weisen exakt dieselben Werte auf wie im ersten Interaktionsmodell. Um die
Interpretation der alterspezifischen Ablehnungsunterschiede von Frauen und Männer zu erleichtern, berechnen wir für die exogene Variable FRAU und AGECM jeweils die zugehörige
partielle Ableitung des Logits.
(10) Berechnung der geschätzten Logits der Ablehnungsbereitschaft
ˆ 0,567 0,023AGECM 1,024FRAU 0,012( AGECMFRAU )
(1) Logit
(11) Berechnung der partiellen Ableitungen für AGECM und FRAU
(2) Berechnung der partiellen Ableitungen:
(2a)
Logit
0,023 0,012FRAU
AGECM
Logit
0,023
AGECM š Mann
Logit
0,023 0,0121 0,035
AGECM š Frau
(2b)
Logit
1,024 0,012AGECM
FRAU
Bezogen auf die geschätzten Logits unterscheiden sich die geschlechtsspezifischen Alterseffekte
der beiden logistischen Regressionsmodelle mit Interaktionseffekt überhaupt nicht. Lediglich
bei der partiellen Ableitung für den Geschlechterdummy FRAU finden wir beim bedingten
Haupteffekt einen Unterschied gegenüber dem Vergleichsmodell. Dies ist darauf zurückzuführen, daß wir Männer und Frauen im ersten Interaktionsmodell im Mindestalter von 15
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
18
Jahren vergleichen, während sich dieser Geschlechtervergleich beim zweiten Modell auf das
Durchschnittsalter von 41,28 Dezimaljahren bezieht. Wenn wir die geschätzten Logits und
Ablehungswahrscheinlichkeiten beider Interaktionsmodelle miteinander vergleichen, so finden
wir in Abbildung 1 und 3 sowie 2 und 4 identische Funktionsverläufe. Die beiden Abbildungspaare unterscheiden sich lediglich in der Skalierung ihrer X-Achsen, wobei in Abbildung 3 und
4 der Nullpunkt der X-Achse um 26,28 Einheiten, der Differenz der beiden Zentrierungsformen
, weiter nach rechts verschoben worden ist.
In Abbildung 3 und 4 kennzeichnen wir zusätzlich das Vergleichsalter für den bedingten
Haupteffekts von FRAU mit einer Parallelen zur Y-Achse durch den Nullpunkt der zentrierten
Altersvariablen. Die an diesem Punkt geschätzten Differenzen der geschätzten Logits bzw.
Ablehnungswahrscheinlichkeiten entsprechen denjenigen in Abbildung 1 und 2, die wir für den
Mittelwert der am Mindestalter zentrierten Altersvariablen berechnet haben.
Abb. 3:
Geschätzte Logits der Haupt- (LGTH) und Interaktionseffektmodelle (LGTI)
auf zentriertes Alter (AGECM) und FRAU
Dr. Wolfgang Langer -
Abb. 4:
Verallgemeinerte lineare Modelle -
SoSe 2001
-
19
Geschätzte Ablehnungswahrscheinlichkeiten der Haupt- (PH) und Interaktionseffektmodelle (PI) auf zentriertes Alter (AGECM) und FRAU
Bei der Eurobarometer 30 Untersuchung haben die Forscher die Einstellung gegenüber Türken
in den Alten Bundesländern mit einem weiteren Item gemessen, das die Wahrnehmung der
Konkurrenz zwischen der In- und Outgroup um Arbeitsplätze erfassen sollte. Die Befragten
Inländer sollte ihm zu stimmen oder es ablehnen.
„339. Türken haben Arbeitsplätze, die den Deutschen zuständen“ (EMNID 1988, S.21)
Als exogene Merkmale erhoben sie die subjektive Links-Rechts-Einstufung auf einer 10-er
Likertskala, wobei der Wert 1 dem Pol Links und der Wert 10 dem Pol Rechts entsprach.
Zusätzlich maßen sie die relative Deprivation der Inländer im Vergleich zu den Türken anhand
der folgenden Frage:
„353. Wenn Sie einmal vergleichen: Ist es Deutschen wie Ihnen in den vergangenen 5 Jahren
in wirtschaftlicher Hinsicht besser oder schlechter gegangen als den hier lebenden
Türken? Würden Sie sagen viel besser, besser, etwa gleich, schlechter oder viel schlechter ?“ (EMNID 1988
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
20
Für die weiteren Analysen dichotomisieren wir die Antwortvorgaben dergestalt, daß wir die
Befragten, die ihre wirtschaftliche Situation als viel schlechter oder schlechter als diejenige der
Türken einschätzen, mit denjenigen vergleichen, die ihre Situation mindestens als gleich gut
bzw. besser einstufen.
LIMDEP-Befehle für die Schätzung des Haupt- und Interaktionseffektmodell der logischen Regression:
? Auswahl der Substichprobe BRD(ABL) 1988
reject; DBRD=0$
? Manueller Ausschluss fehlender Werte
reject; ogjobs=-999 | poliselb=-999|deprivat=-999$
? Anzahl der Auspraegungen der abhaengigen Variablen: 2
calc; ycat=2$
? Berechnung des Mittelwerts der Links-Rechts-Selbsteinstufung
dstat;rhs=poliselb$
? Zentrierung am Minimum von POLISELB
create; polisec1=poliselb-1$
? Schaetzung des Nullmodells
logit; lhs=ogjobs;rhs=one$
exec;proc=hierinit$
? Schaetzung des Haupteffektmodells: + POLISEC1 + DEPRIVAT
namelist; X=one,polisec1,deprivat$
logit; lhs=ogjobs;rhs=X;marginal$
exec;proc=hiertest$
exec;proc=mzr2l$
? Berechnung der geschaetzten Logits, Probs
create; flgth=dot(X,b)$
create; plgth=lgp(flgth)$
? Bildung der Hilfsvariablen DERPIVAT*POLISEC1
create;deprpoli=polisec1*deprivat$
? Schaetzung des logist.Regressionsmodells mit Interaktionseffekt
namelist;X=one,polisec1,deprivat,deprpoli$
logit; lhs=ogjobs;rhs=X;marginal$
exec;proc=hiertest$
exec;proc=mzr2l$
? Berechnung der geschaetzten Logits, Probs und Erstellung der Plots
create; flgti=dot(X,b)$
create; plgti=lgp(flgti)$
plot;lhs=polisec1;rhs=flgth,flgti;grid;spikes=0,4.44;endpoints=-0.5,9.5$
plot;lhs=polisec1;rhs=plgth,plgti;grid;spikes=0,4.44;endpoints=-0.5,9.5$
delete;flgth,flgti,plgth,plgti$
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
21
Wir zentrierten die Links-Rechts-Selbsteinstufung an ihrem eigenen Minimum von 1. Hierdurch
erfaßt die logistische Regressionskonstante das geschätzte Logit der Zustimmung zum Item,
derjenigen Befragten, die sich als Links einstufen und sich im Vergleich zu hier lebenden den
Türken in wirtschaftlicher Hinsicht keinesfalls als benachteiligt einstufen. Für das Haupteffektmodell erhalten wir die folgenden Logitschätzer und Anpassungsmaße:
+---------------------------------------------+
| Multinomial Logit Model
|
| Maximum Likelihood Estimates
|
| Dependent variable
OGJOBS
|
| Weighting variable
ONE
|
| Number of observations
860
|
| Iterations completed
4
|
| Log likelihood function
-571.5852
|
| Restricted log likelihood
-586.8430
|
| Chi-squared
30.51559
|
| Degrees of freedom
2
|
| Significance level
.0000000
|
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Characteristics in numerator of Prob[Y = 1]
Constant -1.022446646
.17424108
-5.868
.0000
POLISEC1 .1467086935
.34721678E-01
4.225
.0000 4.4441860
DEPRIVAT 1.033616374
.28913410
3.575
.0004 .66279070E-01
+-------------------------------------------+
| Partial derivatives of probabilities with |
| respect to the vector of characteristics. |
| They are computed at the means of the Xs. |
| Observations used for means are All Obs. |
+-------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Marginal effects on Prob[Y = 1]
Constant -.2498732134
.41493580E-01
-6.022
.0000
POLISEC1 .3585377566E-01 .84779964E-02
4.229
.0000 4.4441860
DEPRIVAT .2526029556
.70738255E-01
3.571
.0004 .66279070E-01
Frequencies of actual & predicted outcomes
Predicted outcome has maximum probability.
-----Actual
-----0
1
-----Total
Predicted
---------- +
0
1 |
---------- +
403
90 |
244 123 |
---------- +
647 213 |
----Total
----493
367
----860
Modellanpassung:
McFadden Pseudo R2 = 2,60 %
McKelvey&Zavoina Pseudo R2 = 4,38 %
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
22
Der im Vergleich zum Nullmodell erzielte Informationsgewinn von 2,60 % nach McFadden fällt
zwar gemäß dem Likelihood-Ratio-2 von 30,52 bei 2 Freiheitsgraden signifikant aus, aber die
geschätzte Varianzaufklärung von rd. 4,38 % erweist sich als sehr bescheiden. Die Linken der
Referenzgruppe lehnen das Item mehrheitlich ab, wie die logistische Regressionskonstante von
-1,02 belegt. Ihr entspricht eine Zustimmungswahrscheinlichkeit von rd. 26,46 %. Je weiter
rechts sich die Befragten einordnen, desto eher stimmen sie dem Item, wie der statistisch
signifikante logistische Steigungskoeffizient von +0,15 belegt. Ebenfalls neigen Deprivierte
eher dazu, dieses Item zu bejahen, wie der signifikante Logitschätzer von +1,03 zeigt.
Für das logistische Regressionsmodell mit dem spezifizierten Interaktionseffekt zwischen
Links-Rechtsselbsteinstufung und der Deprivation erhalten wir die folgenden Schätzer und
Fitindizes.
+---------------------------------------------+
| Multinomial Logit Model
|
| Maximum Likelihood Estimates
|
| Dependent variable
OGJOBS
|
| Weighting variable
ONE
|
| Number of observations
860
|
| Iterations completed
5
|
| Log likelihood function
-566.8665
|
| Restricted log likelihood
-586.8430
|
| Chi-squared
39.95315
|
| Degrees of freedom
3
|
| Significance level
.0000000
|
+---------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Characteristics in numerator of Prob[Y = 1]
Constant -1.124132801
.17897563
-6.281
.0000
POLISEC1 .1689630716
.35736967E-01
4.728
.0000 4.4441860
DEPRIVAT 3.408986305
.91119627
3.741
.0002 .66279070E-01
DEPRPOLI -.5558076698
.19413992
-2.863
.0042 .27674419
+-------------------------------------------+
| Partial derivatives of probabilities with |
| respect to the vector of characteristics. |
| They are computed at the means of the Xs. |
| Observations used for means are All Obs. |
+-------------------------------------------+
+---------+--------------+----------------+--------+---------+----------+
|Variable | Coefficient | Standard Error |b/St.Er.|P[|Z|>z] | Mean of X|
+---------+--------------+----------------+--------+---------+----------+
Marginal effects on Prob[Y = 1]
Constant -.2747584588
.42550374E-01
-6.457
.0000
POLISEC1 .4129764126E-01 .87225715E-02
4.735
.0000 4.4441860
DEPRIVAT .8332181237
.22325684
3.732
.0002 .66279070E-01
DEPRPOLI -.1358494820
.47523223E-01
-2.859
.0043 .27674419
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
23
Frequencies of actual & predicted outcomes
Predicted outcome has maximum probability.
-----Actual
-----0
1
-----Total
Predicted
---------- +
0
1 |
---------- +
409
84 |
248 119 |
---------- +
657 203 |
----Total
----493
367
----860
Anpassungsmaße:
McFadden Pseudo R2 =
ûMcFadden Pseudo R2 =
Partieller LR-2 = 9,44
3,40 %
McKelvey&Zavoina Pseudo-R2 =
0,80 %
û McKelvey&Zavoina Pseudo-R = 1,56 %
D.F.= 1
5,94 %
2
. = 0,00
Im Vergleich zum Haupteffektmodell erhöht sich der Informationsgewinn nach McFadden um
rd. 0,80. Dies entspricht einer Erhöhung der nach McKelvey&Zavoina geschätzten Varianzaufklärung um rd. 1,56%. Wie dem partiellen Likelihood-Ratio-2-Test zu ennehmen ist, erweist
sich diese Verbesserung der Modellanpassung als statistisch signifikant. Durch die von uns
gewählte Zentrierung der Links-Rechts-Selbsteinstufung erfaßt die Regressionskonstante erneut
das geschätzte Logit der Befürwortung des Items der Linken, die sich selbst als nicht nachbeteiligt im Vergleich zu den hier lebenden Türken einschätzen. Ihr geschätztes Logit von -1,12
entspricht einer Zustimmungswahrscheinlichkeit von 24,53 %. Nehmen sich diese Linken aber
als wirtschaftlich benachteiligt war, so steigt ihr geschätztes Logit um rd. 3,41 Einheiten an. Ihre
Wahrscheinlichkeit, dem Item zu zustimmen, beträgt dann rd. 90,76 %. Ordnen sich nichtdeprivierte Befragte auf der Links-Rechts-Skale um eine Einheit weiter rechts ein, so erhöht sich in
signifikanten Maße ihr geschätztes Logit der Zustimmung um rd. +0,17 Einheiten. Der Logitschätzer des Interaktionsterms von -0,56 erweist sich als statistisch signifikant, wie der zugehörige T-Test belegt. Sein negatives Vorzeichen charakteristiert das Zusammenwirken beider
Merkamale dergestalt, daß je weiter rechts sich die Befragten einstufen, desto geringer fällt der
Effekt der relativen Deprivation auf die Zustimmungsneigung aus. Mit Hilfe der partiellen
Ableitung der Logits identifizieren wir erneut die genaue Wirkung des Interaktionseffektes.
Alternativ hierzu stellen wir die wechselseitige Beeinflussung beider Merkmale in ihrer Wirkung auf die Zustimmungsneigung mit Hilfe der geschätzten Logits und Zustimmungswahrscheinlichkeiten dar.
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
24
(8) Berechnung der partiellen Ableitungen für die Links-Rechts-Selbsteinstufung und die
relative Deprivation
(1) Berechnung der geschätzten Logits
ˆ 1,124 0,169 POLISEC1 3,409 DEPRIVAT
Logit
0,556 ( POLISEC1 DEPRIVAT)
(2) Berechnung der partiellen Ableitung von POLISEC1
(2a)
Logit
0,169 0,556 ( DEPRIVAT )
POLISEC1
(2b)
Logit
0,169
POLISEC1 |DEPRIVAT
0
(2c)
Logit
0,169 0,556 0,387
POLISEC1 |DEPRIVAT
1
(3) Berechnung der partiellen Ableitung für DEPRIVAT
Logit
3,409 0,556 ( POLISEC1 )
DEPRIVAT
Bei der Betrachtung der partiellen Ableitung der Logits nach POLISEC1 zeigt sich, daß der
Effekt der Links-Rechts-Selbsteinstufung auf die Zustimmungsneigung in den Gruppen der
Nichtdeprivierten und Deprivierten genau umgekehrt ausfällt. Während bei den Nichbenachteiligten das geschätzte Logit um +0,169 Einheiten zunimmt, wenn sie sich eine Einheit weit
rechts einstufen, reduziert sich das geschätzte Logit der Deprivierten jeweils um -0,387 pro
Einheitswechsel nach rechts. Bei ihnen fällt der Effekt seinem Betrag nach doppelt so hoch aus
als bei den Nichtbenachteiligten. Vice versa nimmt der geschätzte Unterschied zwischen den
Deprivationsgruppen um 0,556 Einheiten ab, wenn sich die Befragten um jeweils eine Einheit
weiter nach Rechts einordnen.
LIMDEP bietet uns die Möglichkeit, die geschätzten Logits und Zustimmungswahrscheinlichkeiten des Haupteffekt- und Interaktionsmodells zu simulieren, um eine bessere graphische
Darstellung zu erhalten. Hierfür nehmen wir einfach an, daß sich unsere Links-Rechts-Selbsteinstufung nicht nur um ganze Punkte sondern sich auch um Zehntelpunkte ändern kann.
Hierdurch erhalten wir anstatt von jeweils zehn geschätzten Funktionswerten pro Deprivationsgruppe jeweils eine logistische Gerade bzw. eine stetige Wahrscheinlichkeitsfunktion. Hierfür
benötigen wir die folgenden LIMDEP-Befehle:
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
25
LIMDEP-Befehle für die Simulation der geschätzten Logits und Zustimmungswahrscheinlichkeiten:
type; Simulation der geschaetzten Logits im Haupt- und
Interationsmodell$
type; POLISEC1 von 0 bis 9 Punkte$
type; LGTHND: Logit HM Nichtdeprivierte $
type; LGTHD: Logit HM Deprivierte$
type; PHND= Wahlwahrscheinlichkeit HM Nichtdepriviert$
type; PHD= Wahlwahrscheinlichkeit HM Deprivierte$
type; LGTIND: Logit IM Nichtdeprivierte $
type; LGTID: Logit IM Deprivierte$
type; PIND= Wahlwahrscheinlichkeit IM Nichtdepriviert$
type; PID= Wahlwahrscheinlichkeit IM Deprivierte$
sample; 1-100$
create; polisec1=trn(0,0.1)$
create; lgthnd = -1.022 + 0.147*polisec1$
create; lgthd= -1.022 + 0.147*polisec1 + 1.034$
create; lgtind= -1.124 + 0.169*polisec1$
create; lgtid= -1.124 + 0.169*polisec1 + 3.409 - 0.556*polisec1$
create;
create;
create;
create;
phnd=lgp(lgthnd)$
phd=lgp(lgthd)$
pind=lgp(lgtind)$
pid=lgp(lgtid)$
plot;lhs=polisec1; rhs=lgthnd,lgthd,lgtind,lgtid;grid;spikes=0,4.44;
endpoints=0,10$
plot; lhs=polisec1; rhs=phnd,phd,pind,pid;grid;spikes=0,4.44;
endpoints=0,10$
Mit Hilfe der „trn“-Option des Create-Befehls realisieren wir diese Änderung der Selbsteinstufung um jeweils einen Dezimalpunkt, indem wir den Startwert 0 und das Inkrement 0.1
festlegen. Über die Sample-Funktion führen wir 100 Simulationsschritte durch und füllen damit
die Lücken zwischen unseren Punktwerten auf. Bei der Betrachtung sowohl der geschätzten
Logits als auch der Zustimmungswahrscheinlichkeiten in Abbildung 5 und 6 zeichnet sich der
negative Interaktionseffekt beider exogener Merkmale deutlich ab. Die relative Deprivation
wirkt vor allem bei denjenigen Personen zustimmungsfördernd, die sich eher links einstufen.
Hingegen wirkt sie sich bei den eher rechts stehenden Personen eindeutig zustimmungshemmend aus.
Dr. Wolfgang Langer -
Verallgemeinerte lineare Modelle -
SoSe 2001
-
Abb. 5:
Geschätzte Logits der Zustimmungsneigung im Haupt- (LGTH) und
Interaktionseffektmodell (LGTI) auf POLISEC1 und DEPRIVAT
(ND: nein; D: ja)
Abb. 6:
Geschätzte Logits der Zustimmungsneigung im Haupt- (PH) und
Interaktionseffektmodell (PI) auf POLISEC1 und DEPRIVAT
26
Herunterladen