Diekmann, Andreas und Peter Mitter 1984 Methoden zur Analyse

Werbung
Studienskripte n zur Soziologie
Herausgeber: Prof. Dr.
Prof,
Erwin K.
Methoden zur Analyse
von Zeitverläufen
Scheuch
Dr. Heinz Sahner
Anwendungen stochastischer Prozesse
bei der Untersuchung von Ereignisdaten
Von Dr.
rer.
und Dr.
phil.
pol.
Andreas Diekmann
Peter Mitter
Institut für Höhere Studien
und wissenschaftliche Forschung,
Mit 25 Bildern und
17 Tabellen
Teubner Studienskripten zur Soziologie sind als in sich abge­
schlossene Bausteine für das Grund- und Hauptstudium konzipiert.
Sie umfassen
sowohl
Bände zu den Methoden der
empirischen
forschung, Darstellung der Grundlagen der Soziologie,
in denen ver-
Arbeiten zu sogenannten
eines Themas und
schiedene theoretische Ansätze,
wichtige
kutiert
Sozial­
als auch
Studien und Ergebnisse dargestellt und dissind
Diese
1111:tar1gsseme:St<D: gedacht,
sollen
in
erster Linie f ilr
auch dem Examenskandidaten
Praktiker eine rasch zugängliche Informationsquelle sein.
B.
G.
Teubner Stuttgart
1984
Wien
-
Dipl.-Soz. Dr.
1951
rer. pol.
in Lübeck geboren.
Andreas Diekmann
1970
bis
1975
Vorwort
in Hamburg. Anschließend Studium der Psychologie und stati­
Forschungsprojekten und in der Lehre am Institut für Sozio­
1975
bis
Studienaufenthalt in Ann Arbor, Michigan.
1980. Sommer 1977
Seit 1980 Assistent
Bei Sozialwissenschaftlern verschiedenster Disziplinen ist in
jüngster Zeit ein wachsendes Interesse a n der Untersuchung von
Lebensverläufen,
am Institut für Höhere Studien in Wien.
nen.
Publikationen zum Thema mathematische Modelle sozialer Pro­
werden,
zesse,
Sozialindikatoren und auf dem Gebiet der Soziologie
abweichenden Verhaltens.
Dr. phil.
1948
Biographien und sozialen Karrieren zu erken­
Gleichgültig,
ob qualitative Erhebungsverfahren benutzt
ob die Datenquellen Tagebücher oder Tiefeninterviews
sind,
oder ob hochstandardisierte Fragebögen Verwendung fin­
den -
bei aller Unterschiedlichkeit der Erhebungsmethoden be­
steht das Ziel häufig darin,
Peter Mitter
in Innsbruck geboren.
Studium der Mathematik und Infor­
matik an der Universität Innsbruck.
-
Studium der Soziologie
stischen Methodenlehre in Hamburg und Wien. Mitarbeit in
logie der Universität Hamburg von
5
1974
Assistent am Insti­
tut für Mathematik an der Universität Innsbruck und ab
1975
am Institut für Höhere Studien, Wien. Seit 1982 Leiter der
Informationen über die zeitliche
Abfolge von Ereignissen zu gewinnen.
Derartige Ereignisge­
schichten - im Englischen "event histories"
gangsmaterial der Datenanalyse dar.
- stellen das Aus­
Auch bei experimentellen
Abteilung für Mathematische Methoden und Computerverfahren
Designs oder im Rahmen der Evaluierungsforschung,
am Institut für Höhere Studien.
Untersuchung der Wirksamkeit von Maßnahmen der Sozialplanung,
Publikationen zum Thema Mathematische Methoden in den Sozial­
wissenschaften, Prognoseverfahren, Soziale Mobilität, Ar­
beitsmarktforschung.
werden häufig die
eignisses erhoben.
also der
Zeitintervalle bis zum Eintreten eines Er­
Z.B.
richtet sich die Aufmerksamkeit von
Kriminologen bei der Strafvollzugsevaluierung auf die Zeit­
spanne bis
CIP-Kurztitelaufr.ahme der Deutschen Bibliothek
zum ersten
Rückfall nach der Entlassung aus einer
Strafanstalt.
von Zeitverläufen
stochast. Prozesse bei d.
von Adreas Diekmann u.
Teubner,
Unters.
:
Anwendungen
von Ereignisdaten
Peter Mitter.
- Stuttgart
/
:
(Teubner-Studienskripten
122
:
Studienskripten
zur Soziologie)
besonders die der Übersetzung, des Nachdrucks, der Bild­
entnahme, der Funksendung, der Wiedergabe auf photomechanischem
oder ähnlichem Wege, der Speicherung und Auswertung in Datenver­
arbeitungsanlagen, bleiben, auch bei Verwertung von Teilen des
Werkes, dem Verlag vorbehalten.
Bei gewerblichen Zwecken dienender Vervielfältigung ist an den
§ 54
zwischen Ereignissen sind in
UrhG eine Vergütung zu zahlen, deren Höhe mit
Diese
die häufig auch unter dem Oberbegriff "Survival­
mographie und der Medizin-
Das Werk ist urheberrechtlich geschützt. Die dadurch begründeten
Verlag gemäß
Methoden,
Analyse" zusammengefaßt werden,
ISBN 3-519-00122-5
NE: Mitter, Peter:; GT
Rechte,
Zur Analyse von Zeitintervallen
den Sozialwissenschaften neue Methoden erforderlich.
1984.
nicht verwunderlich:
staJl1ltlen vor allem aus der De­
und Biostatistik.
Der Grund ist
Demographen und Mediziner waren schon im­
mer mit dem Zeitintervall bis zum Eintreten eines wichtigen
Ereignisses,
nämlich des Todes oder der Genesung befaßt.
Be­
deutsame Weiterentwicklungen der Verfahren sind aber auch von
Soziologen wie JAMES COLEMAN,
MICHAEL HANNAN und NANCY TOMA
und Ökonomen wie JAMES HECKMAN
geleistet worden.
dem Verlag zu vereinbaren ist.
©
B.
G.
Teubner Stuttgart
1984
Printed in Germany
Gesamtherstellung: Beltz Oft<�t,ar,„rJc
Umschlaggestaltung: W. Koch,
Anwendungsgebiete der Survival-Analyse sind in der Ökonomie
und Soziologie die Untersuchung von Berufskarrieren und so­
zialer Mobilität ebenso wie das Studium abweichenden Verhal-
- 6
tens.
- 7 -
-
Ereignisse sind im ersten Fall Berufswechsel und im
Inhaltsverzeichnis
Seite
letzteren Fall abweichende Handlungen im Verlauf einer kri­
minellen Karriere.
Für beide Disziplinen sind die Verfah­
1.
Einleitung:
Datenanalyse mit stochastischen Modellen
11
11
ren zur Analyse von segmentierten Arbeitsmärkten von Bedeu-
1.1. Daten und Modell
tung.
können damit Einstellungsänderungen ge-
1.2. Beispiele und Fragestellungen
18
genüber Parteien,
Kernkraft etc.,
1.3. Datenarten und Datenstruktur
21
aber auch die Dynamik
politischer Strukturen im Zeitablauf untersuchen,
�
graphen Prozesse der Migration und Psychologen z.B.
Daten
aus Lernexperimenten.
1.3.1. Ereignisdaten
21
1.3.2. Ereignisdaten als Individualdaten
und gruppierte Daten
25
1.3.3.
Bisher existierte u.w.
kein Lehrbuch,
Sprache unter Hinweis auf
Computerprogramme Methoden der Ana­
1.4.
lyse von Ereignisdaten für Sozialwissenschaftler behandelt.
Mit dem vorliegenden Buch beabsichtigen wir,
eine erste Ein­
führung in das Gebiet anhand soziologischer Beispiele zu prä­
sentieren.
Frau Mag.
danken.
33
2.2. oas zwei-Zustands-Modell mit absorbierendem
Zielzustand
37
Wir
ren Dank für vielfältige kritische Diskussionen. Ohne das an­
regende Forschungsklima und die liberale Atmosphäre am Insti­
tut für Höhere Studien unter der Leitung von Prof.
Rapoport wäre es schwerer gewesen,
Anatol
Überlebensfunktion und
2.2.2. Das Modell mit
zeitunabhängiger Rate
Maximum-Likelihood-Schätzung der Übergangsrate
neben den Alltagsgeschäf­
Nicht-parametrische Schätzverfahren bei gruppierten Zeitbereichs-Daten:
3.2.1.
die vorliegende Schrift
3.2.2. Programmbeispiele
zu verfassen.
3.3.
Wien,
im September
1983
mit SPSS und BMDP
Schätzverfahren bei Indi-
vidualdaten mit exakter Ankunftszeit:
Limit-Schätzer
Andreas Diekmann und Peter Mitter
3.3.1.
60
68
76
Product­
Product-Limit-Schätzformeln
3.3.2. Programmbeispiel mit BMDP
3.4.
60
Life-Table-Schätzer
Berechnung der Werte einer Sterbetafel
Nicht-parametrische
52
58
3.1. Explorative Datenanalyse
ten und Projektverpflichtungen ein einführendes Lehrbuch wie
49
58
3. Nicht-parametrische Verfahren
3. 2.
43
51
2.3. Mehr-Zustands-Modelle
2.4.
38
46
Zeitabhängige Raten
2.2.4. Berücksichtigung von Heterogenität
Ranna Gutierrez-Rieger für zahlreiche Hinweise be­
tut für Höhere Studien und den Teilnehmern an unseren Semina­
2.2.1. Übergangsrate,
I
Verteilungen
2.2.3.
Peter Preisendörfer und
Nicht zuletzt schulden wir unseren Kollegen am Insti­
33
2.1. Arten stochastischer Prozesse
Frau Helga Maier gilt unser Dank für die maschinenschriftli­
Frau Gerda Suppanz für die Anfertigung der Graphiken.
30
Einige Vorteile der Datenanalyse mit
stochastischen Modellen
2. Grundlegende Konzepte stochastischer Modelle
che Übersetzung unserer handschriftlichen Hieroglyphen und
möchten uns besonders bei Herrn Dr.
27
Alternative Datenstrukturen
das in verständlicher
Verfahren für den Vergleich
77
81
86
8
4.
-
-
Semi-parametrische Verfahren
95
4.1. Das Proportional-Hazards-Modell von COX
96
4.2.
Die ?artial-Likelihood-Methode von COX
4.3. Das geschichtete Cox-Modell und die Über-
100
4.4.
Signifikanztests und Stepwise-Regression
Arbeitslosigkeit mit
5.
2.
195
119
5.1.2. Qualitative Variablen als Kovariate
124
5.1.3.
132
5.2.1.
Exponentialverteilung
143
145
5.2.2. Weibullverteilung
146
5.2. 3. Weibullverteilung und Gompertz-Makeham-
148
Verteilung als Extremwertverteilungen
5.2.4. Das Sichel-Modell
5.2.5.
152
und log-logi-
5.2.6. Graphische Verfahren
154
5.2.7.
156
Anwendungsbeispiel Ehescheidungsdaten
5.3. Kovariateneffekte und Zeitabhängigkeit
5.4.
153
164
5.3.1. Die verallgemeinerte Gompertz-MakehamFunktion in RATE
164
5.3.2. Weitere RATE-Modelle
172
Mehr-Zustands-Modelle
173
5 . 4.1. Parameterschätzung bei Mehr-ZustandsModellen
174
5.4. 2. Die dynamische Analyse von Mehr-Zustands-Modellen
177
5.4. 2.1. Überlebensfunktionen und
mittlere Ankunftszeiten
177
5.4.2.2.
179
Die Wahrscheinlichkeitsverteilung der Zustandsvariablen Y(t)
Ableitung der Überlebensfunktion und einiger
weiterer Beziehungen beim Zwei-Zustands-Modell
mit absorbierendem Zielzustand
110
119
5.2. Parametrische Modelle der Zeitabhängigkeit
193
105
5. 1. Das log-lineare Basismodell
Qualitative und quantitative Kovariate:
Berechnungen mit dem Programm RATE
Anhang
193
119
Das Modell und die Interpretation
der Koeffizienten
190
1. Notation und Definition der wichtigsten
Terme
Parametrische Verfahren
5. 1.1.
6. Ausblick
102
prüfung der Proportionalitätsannahme
4. 5.
9 -
3.
der Maximum-Likelihood-Schätzer bei
Kovariaten
198
4.
Die Ableitung der Differentialgleichungen für
die Zustandswahrscheinlichkeiten bei Multi­
State-Modellen
200
Literaturverzeichnis
203
Sachregister
207
- 11 -
1.
Einleitung:
1.1.
Datenanalyse mit stochastischen Modellen
Daten und Modell
Bei Ereignisdaten handelt es sich u m spezielle, besonders in­
formationshaltige Längsschnittdaten.
Zeitverläufe,
d.h.
Sie geben Auskunft über
die Länge des Zeitintervalls bis
treten eines Ereignisses,
die Scheidung einer Ehe,
zum Auf­
sei es der Abbruch eines Studiums,
der Wechsel des Arbeitsplatzes,
die
Änderung der Einstellung gegenüber Gastarbeitern oder ein Mi­
litärputsch.
Wie man sich vorstellen kann,
sind Ereignisdaten
wesentlich aussagekräftiger als beispielsweise Panel-Daten,
da sie ja auch über die Geschehnisse zwischen den Erhebungs­
zeitpunkten einer Panel-Studie informieren.
Eine genaue Er­
läuterung und Klassifizierung von Ereignisdaten erfolgt in
Abschnitt 1.3.
dieses Kapitels.
Für den Sozialforscher stellt sich nun die Frage,
niken geeignet sind,
welche Tech­
um die Informationen aus den beobachteten
Zeitverläufen optimal auszuschöpfen. Insbesondere möchte man
kausales Wissen darüber erzielen,
Merkmalen
von welchen Bedingungen oder
der Untersuchungseinheiten der Verlauf sozialer Pro­
zesse abhängt.
Methoden
diese und weitere Fragen
geben können,
zur Analyse von Ereignisdaten,
(dazu
Abschnitt
1.2.)
die auf
eine Antwort
fassen wir in Anlehnung an den englischen Sprach­
gebrauch unter dem Oberbegriff Survival-Analyse
zusammen.
Bei Anwendungen der Survival-Analyse wird davon ausgegangen,
daß der Zeitpunkt des Auftretens von Ereignisdaten normaler­
weise nicht rnit Sicherheit vorhersagbar ist.
Vielmehr gibt es
eine mehr oder minder große Wahrscheinlichkeit dafür,
einer bestimmten Gruppe von Untersuchungseinheiten
duen,
Ehen,
Staaten)
ein bestimmtes Ereignis innerhalb eines
festgelegten Zeitintervalls stattfindet.
zwar
zufällig auf,
daß bei
(Indivi­
Ereignisse treten
jedoch können die Wahrscheinlichkeiten da-
-
- 13 -
12 -
für in Abhängigkeit von den Charakteristika der Untersuchungs­
Geeignete Modelle stellt hierfür die Theorie stochastischer
einheiten variieren. Die Theorie segmentierter Arbeitsmärkte
Prozesse
behauptet z.B.,
stochastischer Prozeß zwei Aspekte:
daß Personen im
"sekundären Arbeitsmarkt" ein
größeres Risiko des unfreiwilligen Arbeitsplatzwechsels auf­
weisen
(DOERINGER und PIORE,
1971). Das Zeitintervall bis zum
Wechsel wird hier im allgemeinen kürzer sein als im stabile­
ren primären Arbeitsmarkt.
aspekt
zur Verfügung.
Intuitiv gesprochen beinhaltet ein
den Wahrscheinlichkeits­
(crToxa�€CT8al=durch Zufall etwas finden)
(Prozeß)
und den dyna­
der Zeitabhängigkeit der Wahrschein­
lichkeiten. Mit Hilfe des stochastischen Modells ist es mög­
lich,
auf mathematisch-deduktivem Wege die Wahrscheinlich­
keitsverteilung der Ankunftszeiten,
die Überlebensverteilung
Die Grundlagen
Zufälligkeit heißt also nicht Regellosigkeit. Im Gegenteil -
und weitere Merkmale des Prozesses abzuleiten.
man möchte
der Modellkonstruktion werden ebenfalls in Kap.2 gelegt.
ja gerade die Regel-
oder Gesetzmäßigkeiten von
Massenerscheinungen herausfinden oder vermutete Regelmäßig­
keiten an Daten überprüfen.
In wenigen Worten läßt sich die Logik der Anwendung stocha­
stischer Modelle auf die Datenanalyse von Zeitintervallen fol­
Die verstrichene Zeit bis zur Ankunft eines Ereignisses
weildauer,
Ankunftszeit,
Wartezeit)
(Ver­
kann als Zufallsvariable
gendermaßen skizzieren
(Abbildung
11: Ausgangspunkt ist eine
Hypothese über die genaue Art des stochastischen Prozesses,
betrachtet werden. Die Wahrscheinlichkeitsverteilung der kon­
gewissermaßen eine Hypothese über den
tinuierlichen,
nismus".
nicht-negativen Variablen Ankunftszeit gibt
l einer Ehescheidung
dann darüber Auskunft, mit welcher Wahrscheinlichkeit ein
"stochastischen Mecha­
Eine solche Hypothese könnte z.B. lauten,
(=Ereignis)
daß das
mit zunehmender Ehe­
aber bei gleicher Ehedauer in der Oberschicht ge­
Ereignis,
etwa der Arbeitsplatzwechsel, bis zum Zeitpunkt t
dauer sinkt,
auftritt.
Umgekehrt kann man auch fragen,
ringer ist als in der Unterschicht. Die Hypothese besagt also,
mit welcher Wahr­
scheinlichkeit eine Person bis zum Zeitpunkt t
d.h. daß bis t kein Ereignis stattfindet.
die Überlebensfunktion.
vival-Analyse,
"überlebt",
Hierüber informiert
Diese und weitere Konzepte der Sur­
sozusagen die grundlegenden Arbeitsinstrumente,
werden in Kap.2.
genauer erläutert.
daß das momentane Risiko einer Ehescheidung
von der Ehedauer t
selbst abhängt
der sogenannten Kovariaten
Schicht.
zum Zeitpunkt t
und von
(Zeitabhängigkeit)
(=unabhängige Variable)
soziale
Wird die funktionale Abhängigkeit des Risikos von der
Zeit und den Kovariaten in Form einer mathematischen Funktion
spezifiziert
(ähnlich wie eine Regressionsgleichung) ,
dann ge­
Wir wollen aber nicht bei den Verteilungen und der Überle­
stattet das stochastische Modell die Ableitung der Wahrschein­
bensfunktion stehenbleiben,
lichkeitsverteilung der "Ankunftszeiten"
hen.
sondern einen Schritt weiterge­
Erstens stellt sich dann die Frage,
durch welche grund­
und Ehescheidung) ,
(Zeit zwischen Heirat
der Überlebensfunktion und der Wahrschein­
legende Hypothese oder vermutete Regelmäßigkeit die beobach­
lichkeitsdichteverteilung der Ankunftszeiten. Auf dieser Basis
tete Verteilung der
Zeitintervalle erklärt werden kann. zwei­
wiederum ist es möglich,
tens fragt es sich,
auf welche Weise die Parameter der Ver­
empirischer Daten
teilungen und Überlebensfunktion an empirischen Daten
werden können.
mit einer
geschätzt
Zur Lösung beider Probleme benötigt man ein
mathematisches Modell.
die Parameter des Modells anhand
(der beobachteten Ankunftszeiten)
1)
zu einer genauen Definition des hier verwendeten Begriffs
"Risiko" im technischen Sinne wird auf Kap.2 verwiesen.
-
14
-
-
geeigneten Methode
schätzen
(z.B.
15 -
der Maximum-Likelihood-Methode)
zu
(dazu Kap.2). Die Parameter sind wichtige Kenngrößen:
Sie sind anschaulich interpretierbar und geben z.B.
darüber
Auskunft,
die so­
wie stark eine unabhängige Variable
ziale Schicht)
(z.B.
den Verlauf des Prozesses beeinflußt.
Tests
zur Modellüberprüfung und inferenzstatistische Tests zur Prü­
Mechanismus
Risiko : f(Zeit,
Kovariate)
fung der Parameter auf Signifikanz k önnen Kriterien
liefern,
dafür
wie gu t die Hypothesen mit den Daten übereinstimmen.
Sind die Te sts negativ,
so wird man das Modell revidieren
müssen.
Ableitung der Wahr­
scheinlichkeitsverteilung,
liberlebensfunktion und
Wahrscheinlichkeitsdichte
Bei der Schilderung wurde unterstellt,
daß das Risiko des Auf­
tretens eines Ereignisses in Abhängigkeit von den Kovariaten
und der Zeit in Form einer mathematischen Gleichung - also in
parametrischer Form - formuliert wurde.
man von parametrischen Modellen,
Parameterschätzung
In diesem Fall spricht
wie sie in Kap.5 behandelt
werden. Wird dagegen in einem voraussetzungsärmeren Modell
die Art der funktionalen Beziehung offen gelassen,
so gelan­
gen die nicht-parametrischen Verfahren zur Anwendung,
Inferenzstatistische
denen in Kap.3 die Rede sein wird. Eine
ein.
Tests
Modellüberprüfung
scher Weise dargestellt,
für die Zeitabhängigkeit werden da­
Cox-Regression wird in Kap.4
1:
Die Logik der Datenanalyse mit
stochastischen Modellen
behandelt.
Die semi-parametrische
Parametrische Modelle
haben einen höheren Informationsgehalt als semi-parametrische
oder gar nicht-parametrische Modelle. Der Preis dafür ist in
Form stärkerer Annahmen zu zahlen.
Die mathematischen Modelle,
Abbildung
Hierbei
wird nur der Einfluß der Kovariate in bestimmter parametri­
gegen beliebige Funktionen zugelassen.
Aussagen über die Effekte
der kausal unabhängigen
Variablen auf den Prozeß
und Möglichkeit von
Prognosen
von
Zwischenstellung nimmt
die den in dieser Arbeit vorge­
stellten Verfahren zugrunde liegen,
der letzten Jahre,
sind keine Erfindungen
sondern das Ergebnis einer langen For­
schungstradition. Neu und inhaltlich bedeutsam für die Fort­
entwicklung der soziologischen Disziplin ist hingegen ihre
enge Verknüpfung mit der Datenanalyse.
-
16
-
-
17 -
Anwendungen stochastischer Modelle auf soziale Prozesse im
Mit den klassischen Modellen und ihren Nachkriegsanwendungen
w�itesten Sinne findet man schon bei DANIEL BERNOULLI
in den Sozialwissenschaften wurde der Schwerpunkt auf die
DAVID
und MOESCHBERGER
1978),
(vgl.
der in einem berühmt gewor­
denen Vortrag im Jahre 1760 vor der Französischen Akademie
Modellbildung,
legt.
weniger dagegen auf die Analyse von Daten ge­
Außerdem konzentrierte man sich beispielsweise in der
der Wissenschaften die Auswirkungen der Eliminierung eines
Soziologie primär auf die Erklärung von Mobilitätstabellen
Krankheitsrisikos
und gelegentlich auf die Verteilung von Ereignishäufigkeiten,
(der Pocken) auf die Sterblichkeit unter­
sucht. Bei der Erforschung von Berufskarrieren mit den beiden
Risiken "freiwillige Kündigung"
beitgeber" kommt sein - nach heutiger Bezeichnung Risks-Modell" in soziologischen Arbeiten wieder
CARROLL
selten hingegen auf die Verteilung von Verweildauern.
und "Kündigung durch den Ar­
"Competing­
zu Ehren
(z.B.
1982).
Die Arbeiten von COLEMAN
(1964a,1981) und TUMA
in jüngster Zeit eine Wende eingeleitet.
(1979) haben
Das eigentlich Neue
ihrer Arbeiten ist die enge Verknüpfung von
(parametrischen)
stochastischen Modellen mit statistischen Schätzverfahren
Einen festen Platz in der Theorie stochastischer Prozesse hat
die Poisson-Verteilunq.
Unfälle wurden u.W.
ternommen.
Anwendunqen auf seltene Ereiqnisse wie
erstmaliq von L.v.BORTKIEWICZ
(1898) un­
In den 20er Jahren formulierten GREENWOOD und YULE
ein erweitertes Modell zur Erklärung von Unfallhäufigkeiten
(zu verschiedenen Varianten siehe FELLER
1943). Aber erst i n
unter Berücksichtigung von Kovariaten und die Erweiterung
der Verfahren auf "Multi-State-Modelle"
Abschnitt).
(dazu der folgende
Im Unterschied zum "statistischen Ansatz" geht
die explizite Konzeptualisierung eines sozialen Prozesses
durch ein stochastisches Modell der Datenanalyse voraus
(COLEMAN 1981,
Kap.1).
Der große Vorteil dieser Strategie
d e r Nachkriegszeit wurden diese Ideen in der Soziologie rezi­
besteht darin,
piert.
leitbaren Konsequenzen zahlreiche Charakteristika des sozia­
daß mit Hilfe des Modells und der daraus ab­
len Prozesses aufgedeckt werden
Die klassischen Modelle aus der Unfallstatistik können auch
können. Auf der anderen Seite
wird im Gegensatz zu modellplatonischen Konstruktionen die
heute gute Dienste - beispielsweise in der Kriminalsoziolo­
Zielsetzung in der Analyse empirischer Daten gesehen.
gie - leisten
und Techniken der Datenanalyse
(zu einer übersieht siehe CARR-HILL und PAYNE
1971 sowie GREENBERG 1979,
Teil II).
Markov-Prozesse und Semi­
Medaille.
Damit wird -
wie wir sehen werden
Markov-Prozesse stießen in den 50er und 60er Jahren auf wach­
lieh fruchtbarer Beitrag
sendes Interesse in den Sozialwissenschaften. Die Anwendungs­
leistet.
domänen waren in der Soziologie Prozesse sozialer Mobilität,
in der Sozialpsychologie die Diffusion von Informationen und
Neuerungen und in der Psychologie Vorgänge des Lernens und
Gedächtnisleistungen
und RAPOPORT 1980,
(Uberblick in S�RENSEN und S�RENSEN
Kap.III).
1977
Modell
sind hierbei zwei Seiten einer
ein außerordent-
zur Analyse von Längsschnittdaten ge­
- 19
- 18 -
Abbildung 2b
1.2. Beispiele und Fragestellungen
Das Auftreten von Ereignissen kann in der Sprache stochasti­
scher Modelle als
Zustandswechsel gedeutet werden.
In der
Survival-Analyse mit einem Ausgangszustand und einem absor­
(Abbildung 2a)
bierenden Zielzustand
eignis" auch synonym von "Tod",
zeigt einen Zählprozeß. Die Zustandsvariable ist
hierbei die Anzahl der Delikte.
(BECKER 1963)
Gemäß der Labeling-Theorie
sollte das Risiko eines neuen Delikts mit der
zahl vorher verübter Delikte anwachsen,
kungstheorie"
gemäß der "Abschrek­
ist möglicherweise eine Abnahme zu erwarten.
wird anstelle von "Er­
"Ausfall" oder "failure" ge­
sprochen. 1 )
Die stochastischen Prozesse,
werden,
Zeit.
Arbeitslos;.gkeit
b)
kriminelle
Karrieren
die in diesem Buch erläutert
sind Modelle mit diskreten Zuständen und stetiger
Die Zeit ist eine kontinuierliche Variable;
können zu jedem Zeitpunkt auftreten.
(z.B.
a)
Ereignisse
Die Zustandsvariable
arbeits·los/erwerbstätig in Abbildung 2a)
weist dagegen
diskrete Ausprägungen auf.
Wir können jetzt zwei Fragen stellen.
Antwort auf die Frage suchen,
siko eines Zustandswechsels
gigen Variablen
usf.)
(die Übergangsrate)
(dem Ausbildungsniveau,
beeinflußt wird.
als Kausalhypothese.
0
Erstens kann man eine
ob und in welcher Weise das Ri­
gegen
Todes-
cJ
1=����91
Attitüden­
änderung
strafe
von unabhän­
der Berufserfahrung
Eine Hypothese hierüber bezeichnen wir
"Drogenkarrieren"
d)
zweitens kann unser Interesse der Frage
gelten,
in welcher Weise das Risiko von der Verweildauer im
Zustand
"arbeitslos" abhängig ist.
'.'.:.B.
ist anzunehmen,
(Mehr-Zustands­
Modell
mit
konkurrierenden
Risiken)
daß
die Chance einer Beschäftigung mit zunehmender Arbeitslosig­
keit sinkt.
Eine Hypothese dieser Art nennen wir Entwicklungs­
hypothese. Natürlich l!;.ann eine Hypothese auch davon ausgehen,
daß sowohl Effekte unabhängiger Variablen als auch Verweil­
dauereffekte gemeinsam auftreten.
r
ij
Risiko (tlbergangsrate für den
j.
oder von Kovariaten und der
1)
ist aufgrund der Anwendungen der vorgeDie
in verschiedensten Disziplinen (Medizinstellten
statistik, Demographie, Technik, Biostatistik, sozialwis­
sensch�ften) noctt sehr uneinheitlich. Wir erwähnen häufig
auch die synonyme, um dem Anwender den Weg in die Litera­
tur der Survival-Analyse zu erleichtern.
Wechsel
von
Zustand
i
r
kann eine Funktion von Kovariaten
ij
{Kausalhypothese) , von der Zeit {Entwicklungshypothesel
nach Zustand
Abbildung 2..:_
Zeit sein,
Beispiele fur Modelle mit zwei
und mehr Zuständen
-
- 21 -
20 -
In beiden Fällen dürfte es sinnvoll sein,
rücksichtigen,
Kovariate
zu
be­
da kaum alle Personen das gleiche Risiko eines
"Zustandswechsels"
aufweisen dürften.
die Zeitintervalle bis
Anhand von Daten über
zum ersten Delikt,
und dem zweiten Delikt usf.
zwischen dem ersten
wären verschiedene interessante
1
Hypothesen über den Verlauf krimineller Karrieren prüfbar. )
Bei unseren Ausführungen in den folgenden Kapiteln wird haupt­
sächlich von dem einfachsten Modell in Abbildung 2a ausgegan­
gen.
ständen,
Modell mit zwei nicht-absorbierenden zu­
wie es von COLEMAN
bildung 2c),
(1981 )
zugrunde
gestattet die Erforschung der
gelegt wird
(Ab­
Dynamik von Ein­
stellungsänderungen. Auch hier stellt sich wieder die Frage
nach der Einflußstärke von Kovariaten auf den Prozeß der
Attitüdenänderung.
daß leichte Drogen als
"Ein­
stiegsdrogen" das Risiko der Einnahme harter Drogen erhöhen.
Das Risiko eines Wechsels von Zustand 1 in den Zustand 2 in
Abbildung 2d müßte dann höher sein als der direkte Wechsel
von O nach 2.
Eine aussagekräftige Analyse erfordert auch bei dieser For­
relevanter unabhängiger Va­
Sonst könnte es der Fall sein,
2d nur deswegen größer ist als r
,
02
daß r
in Abbildung
12
weil Personen mit bestimm­
ten Merkmalen in den Zustand 1 gelangen,
die auch ein erhöh­
in den Zustand 2 zu wechseln.
Man muß -
übrigens wie bei der Prüfung der Labeling-Hypothese in Abbil­
dung 2b - vorsichtig sein,
sichtigter Heterogenität
riate)
1)
zur Schätzung der
Modellen des in der Abbildung 2a gezeigten Typs zerlegen las­
Bei den Anwendungen der Survival-Analyse ist dieser Mo­
delltyp von grundlegender Bedeutung.
1.3.
Datenarten und Datenstruktur
1.3.1.
Ereignisdaten
informieren Ereignisgeschichten
("Event­
Histories") oder kurz Ereignisdaten bezüglich jeder Untersu­
chungseinheit über die exakten Zeitpunkte,
oder Zustandswechsel auftreten.
zu denen Ereignisse
Damit ist die Länge aller
Zeitintervalle zwischen je zwei Ereignissen und die Abfolge
der Ereignisse gegeben. Das Zeitintervall zwischen zwei be­
nachbarten Ereignissen wird
schungsfrage die Berücksichtigung
tes Risiko aufweisen,
Mehr-Zustands-Modelle
Wie schon angedeutet,
Gelegentlich wird behauptet,
riablen.
da sich
Parameter immer in eine bestimmte Anzahl von Zwei-Zustands­
sen.
Ein stochastisches
Es handelt sich dabei nicht um eine wesentliche Ein­
schränkung,
da Fehlschlüsse wegen nicht-berück­
(=Vernachlässigung relevanter Kova­
leicht auftreten können.
Daten dieser Art wurden z.B. in der Studie von WOLFGANG,
Eine Sekundäranalyse in
dieser Richtung wäre sicherlich von großem Interesse.
FIGLIO und SELLIN 1979 erhoben.
einfachsten Fall haben wir es pro
nur einer Episode
zu tun,
z.B.
der Dauer der Arbeitslosigkeit
der Person i.
Ereignisgeschichten lassen sich graphisch im Zustandsvariab­
len-Zeit-Diagramm
(Abbildung 3)
darstellen
(zur Darstellung
von Lebensverläufen siehe auch CARR-HILL und MACDONALD 1973,
sowie MÜLLER 1977).
Aus dem Diagramm gehen die Drogenkarrie­
ren für zwei Personen hervor. Es handelt sich dabei um ver­
laufsdaten,
die mit dem Modell in Abbildung
2d korrespondieren.
1lDies können Individuen, Organisationen, Ehen etc.sein. Der
Einfachheit halber sprechen wir im folgenden nur von Indi­
viduen, Personen oder Fällen.
- 23 -
- 22 -
In Abbildung
�ustand
daten auf:
harte
1
weiche 1
die letzte Episode
t11
zu
wird.
Für den Fall,
unbekannt ist,
daß
spricht man von
linkszensiert.en Daten. Bleibt das Ende der letzten Episode
1
im Beobachtungszeitraum offen,
1
1
'10 T20
"abgeschnitten"
der Beginn der ersten Episode
P.erson 1
i beginnt
T
und endet zu einem Zeitpunkt i:
("window
i1
iO
of Observation"). Es kann somit passieren, daß die erste und
einem Zeitpunkt
Person
2
3 fällt eine häufige Besonderheit von Ereignis­
Die Beobachtungsperiode für Person
so haben wir es mit rechts­
zensierten Daten zu tun.
t21
Bei linkszensierten Daten ist normalerweise die problemati­
Beobachtungs-zei trawn
links zensiert
sche Annahme erforderlich,
rechtszensiext
daß die
Vorgeschichte vor Beginn
des Beobachtungszeitraums keinen Einfluß
auf den Prozeß hat.
Bei geeigneter Anlage des Erhebungsdesigns reduzieren sich
hier aber die Probleme.
Startereignis
Endzeitpunkt von Episode m für Person i
zusammen,
In der Regel fällt T
mit einem
iO
wie z.B. die Entlassung aus dem Ge­
Beginn der Beobachtungsperiode für Person i
fängnis bei Rückfallstudien, der Heiratstermin bei Scheidungs­
Ende der Beobachtungsperiode für
studien usf. Dieser Fall ist typisch bei Kohortenuntersuchun­
Person i
�·
Eine Kohorte ist
sonen, die zu
Abbildung
3:
Zustandsvariablen-Zeit-Diagramm
flüssen
ja definiert als eine Gruppe von Perso­
Beginn ihrer Ereignisgeschichte gemeinsamen Ein­
ausgesetzt ist
(z.B.
eine Geburtskohorte von Perso­
nen mit gleichem Geburtsjahrgang,
eine
Heiratskohorte
von
Ehen mit gleichem Heiratsdatum etc.).
Betrachten wir Person 1.
Zeitpunkt
,
Die Beobachtungsperiode startet
Bis zum Zeitpunkt t
11
(z.B.
10•
ter) werden keinerlei Drogen genommen. Dann aber punkt t
11
im
zum Zeit­
- tritt ein Ereignis oder Zustandswechsel ein. t
markiert das Ende der ersten Episode bei Person 1.
t
zum
drei Monate spä­
11
(Allgemein:
ist der Zeitpunkt der Beendigung der m'ten Episode bei
Person il. Während des Zeitintervalls der Episode 2 befindet
sich Person 1 im Zustand
Zeitpunkt t
12
genkarriere bemerkbar.
Zum
Jetzt befindet sich Person 1 in Zu­
stand 2. Zum Zeitpunkt t
freie Episode,
1, nimmt also weiche Drogen.
macht sich eine neuerliche Änderung in der Dro­
schließlich beginnt eine drogen­
13
die bis zum Ende der Beobachtungszeit andauert.
Aber auch wenn man es nicht mit echten Kohorten
zu tun hat,
existiert häufig ein "natürlicher" Zeitpunkt des Prozeßbe­
ginns innerhalb der Beobachtungsperiode.
Bei Studien der
Arbeitslosigkeit etwa sollte der Anfang der Beobachtungs­
periode mindestens mit dem Beginn der Arbeitslosigkeit über­
einstimmen. Im Falle "echter"
Kohorten ist normalerweise
für alle Personen identisch wie in Abbildung 4. Hier
'
iO � 'o
endet auch der Beobachtungszeitraum für alle Personen zum
(T
�
, ), was wiederum besonders typisch
i1
1
für Kohortenstudien ist. Ein Beispiel ist eine Stichprobe von
gleichen Zeitpunkt
Personen,
die zum gleichen Zeitpunkt arbeitslos wurden und
für einen Zeitraum von 12 Monaten untersucht werden.
24 -
-
Bei rechtszensierten Daten ist die Situation anders. 1)
Grei­
fen wir dazu das einfache Beispiel in Abbildung 4
das
auf,
mit dem Zwei-Zustands-Modell in Abbildung 2a korrespondiert.
Bei Person
1 stellen wir fest, daß im Beobachtungszeitraum
kein Ereignis aufgetreten ist. Die Episode ist also "abge­
schnitten";
es handelt sich um ein zensiertes Datum.
bei Person 2.
Zum Zeitpunkt t
weggelassen werden,
2
Anders
(der Episodenindex rn kann hier
da beim Zwei-Zustands-Modell mit absor­
bierendem Zielzustand nur eine Episode pro Fall betrachtet
wird)
hat Person
2
eine Beschäftigung aufgenommen.
sode Arbeitslosigkeit ist nicht zensiert,
Die Epi­
und wir sprechen
daher von einem nicht-zensierten Datum oder einer exakten
Beobachtung.
25 -
Vernachlässigt man einfach die zensierten Fälle bei der Aus­
wertung der Daten,
dann führt dies zu einer u.u.
krassen Verzerrung der Ergebnisse.
äußerst
Ein großer Vorteil der
Schätzverfahren auf der Basis stochastischer Modelle ist
darin zu sehen,
daß sie die Informationen zensierter Daten
explizit nutzen und optimal verarbeiten können.
Wenn von dem Beginn der Beobachtungsperiode bei Person i
die Rede war, so wurde auf die Kalenderzeit oder chro­
(
•iol
nologische Zeit verwiesen. Wurde dagegen von der Verweildauer
oder Ankunftszeit gesprochen,
meint.
son
Nehmen wir an,
2 am
1.
April
Person
so ist damit die Prozeßzeit ge­
1 wurde am 1.
arbeitslos.
Januar und Per-
Die Kalenderzeit ist dann bei
beiden Personen unterschiedlich,
während die Prozeßzeit t
je­
weils bei Beginn der Arbeitslosigkeit auf 0 gesetzt wird. Wir
haben es also mit
'1
err,,.,l'erbs­
tä,t±g
gische,
Die in diesem Buch präsentierten stationären Modelle können
Beobachtungsze�traum
Zustandsvariablen-Zeitdiagramm für die
Dauer der Arbeitslosigkeit
In der Praxis stellt sich fast immer das Problem rechtszen­
geschieden,
1l
wenn im
so sind
so ist zunächst
struktion relevante Prozeßzeit erforderlich.
t
'o
sierter Daten.
Eine mißt die chronolo­
Wird bei der Datengewin­
eine Übersetzung in die für die Datenanalyse und Modellkon­
0
4:
zu tun.
nung die Kalenderzeit von Ereignissen erhoben,
PeJ:."SOn 2
Person 1
Abbildung
zwei Uhren
die andere die Prozeßzeit.
Nicht alle Ehen werden im Beobachtungszeitraum
nicht alle Personen finden einen Arbeitsplatz usf.
u•·Y'"'"��u· kurz
von zensierten Daten die Rede ist,
immer rechtszensierte ·Daten gemeint.
wohl Verweildauereffekte
(Zeit-Inhomogenität),
Kalenderzeiteffekte explizit modellieren.
möglich,
nicht aber
Allerdings ist es
mittels des Untersuchungsdesigns,
z.B. durch die
Auswahl geeignet geformter Kohorten, oder auch durch Kova­
riate vermutete "Einflüsse"
der Kalenderzeit zu kontrollie-
ren.
1.3.2. Ereignisdaten als Individualdaten und gruppierte Daten
Bei Ereignisdaten mit mehreren Episoden wie im Beispiel der
Drogenkarriere sind die kleinsten Einheiten der Analyse die
Episoden. Datentechnisch bedeutet dies,
"logische"
Lochkarte zu präparieren ist.
wir in Kap.5 behandeln.
daß pro Episode eine
Ein Beispiel werden
-
26
-
27 -
Einfacher ist die Situation hingegen beim Beispiel der Ar­
beitslosigkeitsuntersuchung.
nur eine Episode,
Hier existiert pro Individuum
so daß in üblicher Weise die Individuen
die Analyseeinheit bilden.
Um die Angelegenheit nicht übermäßig zu komplizieren,
werden
da sowohl bei der Drogenkarriere
als auch bei der Arbeitslosigkeitsdauer die erhobenen Merk­
male
(Episodendauer und unabhängige Variablen)
Individuen zu­
geordnet werden können.
Bei Individualdaten kann der exakte Zeitpunkt eines Ereig­
nisses bekannt sein,
z.B.
wenn die Daten darüber informieren,
daß Person i nach x Tagen arbeitslos wurde.
der Fall sein,
Es kann aber auch
daß die Daten nur über einen Zeitbereich Auf­
schluß geben, in dem ein Ereignis stattgefunden hat.
Diese
Situation liegt häufig vor, wenn man nach dem Alter in Jah­
ren
fragt,
zu dem ein Ereignis stattgefunden hat.
sagt die Angabe des Alters,
begangen wurde,
Z.B.
be­
in dem der erste Ladendiebstahl
daß das Ereignis
"erster Ladendiebstahl"
Natürlich kann man auch Grade der Exaktheit von
unterscheiden.
daß bei Individualdaten die exakten Zeit­
punkte von Ereignissen bekannt sein können,
oder aber nur
in die die Ereignisse fallen.
ersten Fall sprechen wir von
ohne in
nach
Man weiß also nur,
z.B.
zwei Jahren usf.
ge­
daß eine bestimmte Anzahl
im dritten Ehejahr, stattgefunden hat,
jedem einzelnen Fall das genaue Datum zu kennen.
Solche tabellarischen Daten,
bei denen eine große Anzahl
Untersuchungseinheiten aggregiert wurden,
folgenden als gruppierte Daten.
von
bezeichnen wir im
Im Unterschied
zu Individual­
daten können wir bei gruppierten Daten in der Regel davon
ausgehen,
1.3.3.
daß es sich um Zeitbereichs-Daten handelt.
Alternative Datenstrukturen
Die Ereignisgeschichten in Abbildung 3 und
des Individuum durch Paare von
zu denen ein
4 kann man für je­
Zustandswerten und Zeitpunkten,
Zustandswechsel erfolgt, charakterisieren
auch TUMA 1979).
Für Person
(siehe
1 in Abbildung 3 wird die voll­
ständige Ereignisgeschichte mit den folgenden Meßwertepaaren
wiedergegeben:
{ (T 10,o), (t , 1), (t12, 2), (t13 ,O), (T11 ,O)}
11
Ereignisgeschichte
Zeitangaben
Es genügt jedoch im folgenden, von der Dicho­
abgegrenzte Zeitbereiche,
schieden sind.
ir­
gendwann innerhalb eines bestimmten Jahres aufgetreten ist.
tomie auszugehen,
kann man entnehmen, wieviele Ehen eines Eheschlies­
sungsjahrgangs nach einem Jahr,
von Scheidungen,
wir in Abgrenzung zu gruppierten Daten in beiden Fällen von
Individualdaten sprechen,
werden,
Im
Zeitpunkt-Daten, im letzteren
Kennt man nur die Abfolge der Episoden
(keine Drogen, weiche
Drogen usf.) im Beobachtungszeitraum, nicht aber die
punkte der
Zustandswechsel,
quenz-Designs.
Zeit­
so spricht man von Ereignis-Se­
Für Person 1 liegt dann nur folgende Informa­
tion vor:
Fall von Zeitbereichs-Daten.
Veröffentlichte Daten von statistischen Ämtern sind im Gegen­
satz
zu Individualdaten normalerweise aggregiert.
Auch ist
hier zumeist nicht der exakte Zeitpunkt eines Ereignisses er­
schließbar,
sondern nur ein mehr oder minder großes
tervall angegeben.
z.B.,
Zeitin­
Aus kohortenspezifischen Scheidungsdaten
wie sie gelegentlich von statistischen Ämtern publiziert
Ereignissequenz
( (T
10
,0),1,2,0,(T
,oJ}.
11
Wurden nur die Ereignishäufigkeiten
achtungszeitraum erhoben,
Daten noch geringer.
(Event Counts)
im Beob­
so ist der Informationsgehalt der
Jetzt kann man nur darüber Auskunft ge­
ben, wie häufig sich eine Person im
des Beobachtungszeitraums befand.
Zustand 0,1,2 während
- 29 -
- 28 -
bei einer Panel-Erhebung nach der Ereignisgeschichte
{(T1Q'T11),(0,2),(1,1)(2,1)}
den Befragungszeitpunkten fragen.
keine Querschnitts- oder Paneldaten,
Das erste Paar gibt den Beobachtungszeitraum an.
rigen Paaren gibt die erste
Zahl den
zweimal im Zustand
Bei
Person
o
wie man sieht,
gehalt.
haben Ereignisdaten den höchsten
Dies ist wohl auch der Grund,
daten zu verzeichnen ist.
in welchem Zustand sich eine
befindet.
also den
"Wellen"
der
Und vermutlich ist dies auch einer
der Gründe hinter der Forderung nach qualitativen Methoden
zur
Erfassung von Lebensverläufen.
Bei einer Panel-Studie mit zwei Wel­
zum Ende des Beobachtungszeitraums erhält
Von Ereignisdaten bis hin zu Querschnittsdaten existiert eine
Datenhierarchie:
man als Daten:
Kennt man die Ereignisgeschichte,
man auch alle anderen Daten,
Panel-Daten
{ ( ,10,o), (T11,o)}
Die zwischen den "Wellen"
jedoch unbekannt.
sponse-Daten,
Panel-Daten sehr ähnlich sind Quantal-Re­
Inspektion resultieren,
durch die nur festgestellt wird,
das untersuchte Ereignis eingetreten ist oder nicht.
ob
Solche
bei einer Retrospektiverhebung anfallen,
in der zwar nach dem Eintreten bestimmter Ereignisse
erste Ladendiebstahl,
die erste Liebe),
Alter bei diesem Ereignis gefragt wird,
so kennt
aber nicht umgekehrt.
Zur Schätzung der Parameter stochastischer Modelle sind Er­
liegende Ereignisgeschichte bleibt
welche bei bekanntem Episodenbeginn aus einer
Daten können z.B.
Informations­
daß in den letzten Jah­
ren ein z unehmendes Interesse an der Erhebung von Ereignis­
zu den Befragungszeitpunkten,
len zu Beginn und
war Person
.
ist nur bekannt,
Panel-Studie,
Z.B.
sondern Ereignisdaten.
Bei den üb­
Zustand und die zweite
Zahl die Häufigkeit des Ereignisses wieder.
zwischen
Dann sind das Resultat
(der
eignisdaten besonders gut geeignet.
Theorie stochastischer
Analyse von Ereignisdaten.
ven Daten - bis hin
zahlen wäre,
zur
Aber auch bei weniger informati-
zu Querschnittsdaten
stische Modelle gute Dienst leisten.
zu
Umgekehrt liefert die
Prozesse die geeigneten Modelle
können stocha-
Der Preis,
der hierfür
ist je nach Art der Daten die Akzeptierung
mehr oder minder realistischer Annahmen. l)
nicht aber nach dem
etwa weil die Alters­
angabe im Gegensatz zur Ereignisangabe sehr unzuverlässig ist.
Eine Querschnittsstudie
zum
Zeitpunkt ,11 schließlich liefert
die Daten:
11
Die Bezeichnungen Panel- und Querschnittsdaten beziehen sich
hier auf die Art der Daten,
nicht auf die Erhebungsmethode.
Bei einer einmaligen Befragung kann man
Berufskarriere retrospektiv zu erfassen.
z.B.
versuchen,
die
Ebenso kann man
In dieser Einführung beschäftigen wir uns nur mit der Ana­
lyse von Ereignisdaten. Verfahren und Programme zur Aus­
von Querschnittsdaten, Paneldaten und Ereignis­
mit stochastischen Modellen findet man in
1
von COLEMAN (198 ). Die
sind am Lehrvon Prof.Kreutz an der
Nürnberg implementiert.
- 30 -
- 31 -
1. 4.
der stochastischen Modellbildung besteht darin,
Modellen
"Hardersche Dilenuna" aufgelöst wird.
daß das
Stochastische Modelle
tragen dem Zeitverlauf und damit der I?ynamik explizit Rech­
Stellen wir zusanunenfassend noch einmal die Vorteile der Da­
tenanalyse auf der Basis stochastischer Modelle dar.
nung.
Welchen
Beitrag zur Problemlösung leisten die hier vorgestellten Ver­
Im Unterschied zu den naturwissenschaftlichen Makrogesetzen
fahren?
haben es die Sozialwissenschaften vorwiegend mit Wahrschein­
lichkeitsgesetzen
oder probabilistischen Regelmäßigkeiten
Einige Probleme einer empirisch orientierten Sozialwissen­
zu tun.
schaft lassen sich stichwortartig auflisten:
keitsverteilungen erklärbar und prognostizierbar.
-
Problem 1:
- Problem 2:
wird der nicht-deterministische
Dynamische Theorien versus statische Analyse
Messung und Skalenprobleme
- Problem 4:
Explorative Datenanalyse
- Problem 6:
Modellen von geringerer Bedeutung.
eignisdaten wird ja die
ein "natürlicher"
Prüfung von Hypothesen und Ermittlung der Ein­
der
flußstärke unabhängiger Variablen
gewählt,
Geeignete Schätzverfahren zur Auswertung ver­
schiedener Arten von Längsschnittdaten, insbe­
sondere von Lebensverläufen,
sozialen Karrieren
und Biographien
- Problem 7:
-
Problem 8:
schaftlicher Gesetzmäßigkeiten explizit berücksichtigt.
Skalenprobleme sind bei der Datenanalyse mit stochastischen
- Problem 3:
5:
Hierdurch
Charakter sozialwissen­
Probabilistische versus deterministische Regel­
mäßigkeiten
- Problem
Mit stochastischen Prozessen sind Wahrscheinlich­
Berücksichtigung
Bei der Auswertung von Er­
zugrunde gelegt.
Beginn des Prozesses,
d.h.
Existiert
ist der Nullpunkt
Zeitskala substantiell interpretierbar und nicht beliebig
so verfügt man sogar über eine Ratioskala. 1)
Die sogenannten nicht-parametrischen Verfahren der
Analyse
Survival­
sind besonders geeignet zum Zweck explorativer Da­
tenanalysen,
ohne genau spezifiziertes theoretisches Vorwis­
sen vorauszusetzen.
zensierter Daten
Zeitskala
Zur Prüfung von Hypothesen über
Zeitver­
läufe und Kausaleffekte kann hingegen auf parametrische Mo­
Gewinnung informativer Aussagen über den Verlauf
delle zurückgegriffen werden.
sozialer Prozesse.
für ��;:..;;;.::.:!==..:::::=.:::�� Datenanalysen stehen somit Methoden zur
Sowohl für explorative als auch
Verfügung.
Auf das Dilenm1a von dynamischen
zierenden Bezeichnungen"
"Mobilität",
"Evolution",
Theorien und
in der Soziologie
"Dynamik indi­
("sozialer Wandel",
"sozialer Prozeß" usf.)
einerseits
und meist statischen Analyseverfahren und Auswertungen von
Querschnittsdaten andererseits hat schon vor einem Jahrzehnt
HARDER
(1973)
in dieser Buchreihe
hingewiesen.
Ein Vorteil
1l
Bei den unabhängigen Variablen können allerdings Probleme
mit den Skaleneigenschaften auftreten. Diese müssen ent­
weder mindestens Intervallskalenniveau haben oder als di­
chotome Dummy-Variablen in die Analyse eingehen. Genaue­
res dazu weiter unten.
- 32 -
-
Zur Auswertung von Ereignisdaten werden neue Methoden benö­
2.
33
-
Grundlegende Konzepte stochastischer Modelle
tigt. Bekannte Verfahren wie die Regressionsanalyse sind nur
in seltenen Sonderfällen anwendbar - in der Regel scheitern
In diesem Kapitel wollen wir die Arbeitsinstrumente der Ana­
sie am Problem zensierter,
lyse genauer behandeln.
also unvollständiger
darstellen,
Der
fahren ist ein eingehendes Verständnis der folgenden Konzepte
Techniken zur Analyse der
und der zwischen ihnen existierenden Beziehungen von Bedeutung:
-
sondern auch
-
ten ermöglichen.
Ferner gestatten stochastische Modelle - wurden die Parameter
erst einmal an Daten geschätzt - eine Vielzahl von Ableitun­
gen über den Verlauf des Prozesses.
haben somit einen hohen
Für die praktische Anwendung der Ver­
darin zu sehen,
Vorzug der stochastischen Verfahren ist u.a.
daß sie nicht nur die angemessenen
Daten.
Stochastische Modelle
-
Zustandsraum-Variable Y(t)
Zustände j
1,2,3,
•
•
.
,n
Ankunftszeit Tj bezüglich Zustand j (Zufallsvariable)
Ubergangsrate r
(t)
jk
Hazardrate r
im Zustand j
j
- Übergangswahrscheinlichkeit qj (t,t+At)
k
- Überlebensfunktion im Zustand j G (t)
j
- (Kumulierte) Wahrscheinlichkeitsverteilung der Ankunftszeiten bezüglich
Zustand j Fj (t)
- Wahrscheinlichkeitsdichteverteilung der Ankunftszeiten
f (t), wenn T
eine stetige Zufalls<rariable ist
j
j
- Erwartungswert (Mittelwert) der Ankunftszeiten E(T )
j
- Häufigkeitsverteilung
(t) der diskreten ZustandsraumVariablen Y(t).
Kompliziertere Ableitungen,
ren
die für die Anwendung der Verfah­
zur Datenanalyse nicht unbedingt erforderlich,
tieferes Verständnis aber sehr nützlich sind,
für ein
findet der
interessierte Leser im Anhang.
2.1.
Arten stochastischer Prozesse
Eine erste Entscheidung bei der Modellkonstruktion betrifft
die Wahl des Zustandsraums.
Die Zustände können diskret oder
stetig sein und entsprechendes gilt für die Zustandsraum­
Variable Y(t).
In Abbildung 2d in Kap.1
z.B.
wird der
Zustands­
raum in drei diskrete,sich gegenseitig ausschließende und
erschöpfende zustände
zerlegt:
keine Drogen,
weiche Drogen
- 32 -
-
Zur Auswertung von Ereignisdaten werden neue Methoden benö­
2.
33
-
Grundlegende Konzepte stochastischer Modelle
tigt. Bekannte Verfahren wie die Regressionsanalyse sind nur
in seltenen Sonderfällen anwendbar - in der Regel scheitern
In diesem Kapitel wollen wir die Arbeitsinstrumente der Ana­
sie am Problem zensierter,
lyse genauer behandeln.
also unvollständiger
darstellen,
Der
fahren ist ein eingehendes Verständnis der folgenden Konzepte
Techniken zur Analyse der
und der zwischen ihnen existierenden Beziehungen von Bedeutung:
-
sondern auch
-
ten ermöglichen.
Ferner gestatten stochastische Modelle - wurden die Parameter
erst einmal an Daten geschätzt - eine Vielzahl von Ableitun­
gen über den Verlauf des Prozesses.
haben somit einen hohen
Für die praktische Anwendung der Ver­
darin zu sehen,
Vorzug der stochastischen Verfahren ist u.a.
daß sie nicht nur die angemessenen
Daten.
Stochastische Modelle
-
Zustandsraum-Variable Y(t)
Zustände j
1,2,3,
•
•
.
,n
Ankunftszeit Tj bezüglich Zustand j (Zufallsvariable)
Ubergangsrate r
(t)
jk
Hazardrate r
im Zustand j
j
- Übergangswahrscheinlichkeit qj (t,t+At)
k
- Überlebensfunktion im Zustand j G (t)
j
- (Kumulierte) Wahrscheinlichkeitsverteilung der Ankunftszeiten bezüglich
Zustand j Fj (t)
- Wahrscheinlichkeitsdichteverteilung der Ankunftszeiten
f (t), wenn T
eine stetige Zufalls<rariable ist
j
j
- Erwartungswert (Mittelwert) der Ankunftszeiten E(T )
j
- Häufigkeitsverteilung
(t) der diskreten ZustandsraumVariablen Y(t).
Kompliziertere Ableitungen,
ren
die für die Anwendung der Verfah­
zur Datenanalyse nicht unbedingt erforderlich,
tieferes Verständnis aber sehr nützlich sind,
für ein
findet der
interessierte Leser im Anhang.
2.1.
Arten stochastischer Prozesse
Eine erste Entscheidung bei der Modellkonstruktion betrifft
die Wahl des Zustandsraums.
Die Zustände können diskret oder
stetig sein und entsprechendes gilt für die Zustandsraum­
Variable Y(t).
In Abbildung 2d in Kap.1
z.B.
wird der
Zustands­
raum in drei diskrete,sich gegenseitig ausschließende und
erschöpfende zustände
zerlegt:
keine Drogen,
weiche Drogen
- 35 -
- 34 -
und harte Drogen.
Variablen
Für jeden
Die korrespondierenden Werte der (Zufalls-)
Y(t) sind j=0,1 und 2.
meisten sozialwissenschaftlichen Problemen angemessen.
Zustand existiert eine Wahrscheinlichkeit.
In der
Regel ändern sich diese Wahrscheinlichkeiten im Zeitablauf.
Die Zeit t kann hierbei diskret oder stetig sein.
Fall
Im ersten
ist die Wahrscheinlichkeitsverteilung Y(t) nur
Zeitpunkten t=0,1,2
Zeitpunkt t�o.
•
.
•
definiert, im
Wie Tabelle 1
zu festen
zweiten Fall zu jedem
zeigt, kann man nun vier Arten
stochastischer P rozesse unterscheiden:
Zustandsraum-Variable Y(t)
diskret
stetig
nisse können
festgelegten Zeitpunkten.
Den Ausprägungen von
Y (t) entsprechen
keiten, die von der Zeit abhängen.
keit,
daß eine Person
(Zustand
j=1)
zum
Zeitpunkt t z.B.
p. (t)=P
J
[Y(t) =j ] .
Y(t),
zeß
Wir befassen uns also mit Prozessen mit ste­
tiger Zeit.und diskreten Zuständen.
1)
kann man
von Verteilungen.
man spricht auch
zeitindizier­
deren
zeitab­
zu erklären und zu
bestimmen gilt.
Wenn ein stochastischer P rozeß nicht-trivial ist,
schen den
zuständen Übergänge möglich. l)
den "weichen Drogen"
zum Zeitpunkt t
"keine Drogen"
tionen) Wechsels vom Zustand
k im Zeitpunkt(t+ßt),
sind zwi­
Eine Person kann von
in einem Zeitintervall
wechseln.Y(t)
hätte dann den
Die bedingte Wahrscheinlich­
keit eines direkten oder indirekten (d.h.
Wenn die Ausprägungen von Y (t) als Zahl von Ereignissen (z.B.
Deliktzahl wie in Abbildung 2b) interpretiert werden, hat
Y(t) z.B. absolutes Skalenniveau.
von
Einen stochastischen Pro­
hängige Wahrscheinlichkeitsverteilung es
Wert 1 und Y(t+�t) den Wert o.
Die Wahl eines diskreten Zustandsraums ist keine Vorent­
scheidung bezüglich des Skalenniveaus der Variablen Y(t).
Diese kann ebenso nominales wie Absolutskalenniveau haben.
[Y(t)=1] .
Zeitpunkt t existiert eine
jetzt definieren als eine Familie
llt in den zustand
)
l
(t)=P
definiert für den jeweils gewählten
Zu jedem positiven
ter Zufallsvariablen (RAPOPORT 1980, S.101),
Der für uns in Frage kommende Modelltyp ist mit einem Kreuz
1
p.(t) ist die (diskrete) Wahrscheinlichkeitsverteilung der
einer "Familie"
1: Vier Typen stochastischer Prozesse
gekennzeichnet.
weiche Drogen
nimmt, schreiben wir symbolisch p
Allgemein gilt:
;
X
zustandswahrsoheinlioh­
Für die Wahrscheinlich­
solche Wahrscheinlichkeitsverteilung stetig
zu
zweitens ist das Modell mathema­
tisch relativ gut handhabbar.
Zustandsraum.
Zeit t
Ereig­
zu jedem Zeitpunkt auftreten und nicht nur
Z fallsvariablen
diskret
Tabelle
Erstens ist der Prozeßtyp bei den
Diese Wahl hat zwei Vorteile:
über Zwischensta­
j im Zeitpunkt t in den Zustand
also im Zeitintervall ßt, bezeichnet
wan als Übergangswahrscheinlichkeit q
(t,t+l)t).
jk
l)
Andernfalls stünden in der Diagonale der Matrix der über­
weiter unten) nur Einsen
gangswahrscheinlichkeiten
konstant.
und p.(t) wäre zu jedem
J
- 36 -
Formal:
Nehmen
1)
qjk(t,t+öt)
z.B.
- 37 -
= P Y(t+ßtl=klY(t)=j]
[
scheinlichkeiten aufweisen,
nach 6 Monaten 80 Personen leichte Drogen und
haben von diesen nach
7 Monaten (ßt=1)
20 mit dem Drogen­
konsum vollständig aufgehört, so ergibt sich als Schätzwert
der Übergangswahrscheinlichkeit für dieses Zeitintervall ein
q 0C6,7)
1
von 0,25 vom zustand 1 in den Zustand
die Übergangswahrscheinlichkeit nur davon abhängig,
befand,
ist
in wel­
j sich die Untersuchungseinheit
nicht jedoch vom vorvorhergehenden und allen frühe­
ren Zuständen der Ereignisgeschichte.
zum Zeitpunkt t weiche Drogen nimmt,
Für eine Person,
die
werden also unabhängig
von ihrer vorherigen Drogenkarriere für die Zukunft die glei­
chen Übergangswahrscheinlichkeiten unterstellt.
zesse "ohne Gedächtnis" werden als
Solche Probezeich-
)
net. 2
Die Modellklasse,
1
je nachdem wie lange sie sich
befunden haben.
mit der wir uns hier beschäftigen, können
wir somit weiter einschränken:
wenn die
Übergangswahrscheinlichkeit zusätzlich von der Verweildauer
im vorhergehenden Zustand
j
abhängig ist.
Konsumenten von
weichen Drogen können dann unterschiedliche
Es
In dem Drogenbeispiel wurden drei Zustände unterschieden, wo­
bei die Möglichkeit besteht,
laufen.
(Multi-State-Modelle)
net.
jeden Zustand erneut
übergangswahr-
zu durch­
Solche Modelle werden als Mehr-Zustands-Modelle
mit reversiblen Ereignissen bezeich­
Die jeweilige Festlegung des Zustandsraums wird durch
substanzwissenschaftliche Überlegungen,
durch das Forschungs­
problem und die Fragestellung der Untersuchung gesteuert.
Das einfachste Modell
ist dagegen das Zwei-Zustands-Modell
mit absorbierendem Zielzustand.
Von Semi-Markov-Prozessen wird dann gesprochen,
1l
o.
Bei einer wichtigen Klasse von stochastischen Prozessen
chem vorhergehenden Zustand
schon im Zustand
eignisse irreversibel.
In diesem Fall sind die Er­
Die Konzepte der Analyse lassen sich
am besten anhand dieses Zwei-Zustands-r.Jodells erläutern.
über hinaus ist das Modell
auch bei
Dar­
empirischen Anwendungen
von großer Bedeutung.
2.2.
1)
2)
wie vorher die Wahrscheinlichkeit. Das Sym­
zu lesen als "unter der Bedingung von • • . " .
P[Y(t+llt) = k!Y(t!=j und Y(T)=y(T) für
P[Y(t+öt)
=
k
IY(t)
]"
T<t
"j]
Die Übergangswahrscheinlichkeit von j nach k ändert sich
nicht, auch wenn man die gesamte Vorgeschichte Y(<) des
Prozesses kennt.
Verschiedene Anwendungen des Modells sowie die Notation sind
in Abbildung 5
1)
aufgelistet.
Interpretieren wir im folgenden
Bei Semi-Markov-Prozessen ist das Zeitintervall zwischen
zwei Ereignissen nicht exponential verteilt wie im Fall
von Markov-Prozessen. Dazu weiter unten.
2l
Die Unabhängigkeit von der Vorgeschichte erscheint eine
sehr restriktive Annahme zu sein. In
Weise kann
die
den K<>v;•r1"
zum Ausdruck
so daß die Restriktion weniger
(dazu
Anschein hat.
einschneidend ist,
- 39 -
- 38 Zustand O als "arbeitslos".
Die Wartezeit bezieht sich dann
�
�
auf das Intervall bis zum Eintreten des Ereignisses "Aufnahme
einer Erwerbstätigkeit"
einzigen Übergangsrate
(Zustand
zu
1).
tun haben,
Da wir es nur mit einer
Zustand O
= kein
Ereignis
verzichten wir auf die
explizite Hinzufügung der Zustandsindizes bei der Rate r(t)
und der Ubergangswahrscheinlichkeit q(t,t+ßtJ.
stand
Y(t)
Da ferner Zu­
1 absorbierend ist, sind Tj,G (t),Fj(t) und f (t) sinn­
j
j
vollerweise immer nur auf den Zustand j�o bezogen. Auch hier
können wir die Notation vereinfachen,
weglassen.
2.2.1.
indem wir den Index j
Übergangsrate, Uberlebensfunktion und Verteilungen
Po (t)
r(t)
L\t+O
Zeitintervalle der Länge ßt sind also
Rate und Übergangswahrscheinlichkeit proportional:
q(t,t+Llt)
r(t) .b.t
um sich in erster Näherung unter der nicht direkt beobacht­
baren übergangsrate etwas vorstellen zu können, kann man grob
sagen,
daß sie für kurze Zeiteinheiten der (bedingten) Wahr­
scheinlichkeit
zum
Zustandswechsel entspricht.
Die Rate in­
formiert damit über die Intensität der momentanen Neigung
)
Da sie zwar nicht-ne­
oder das Risiko zum Zustandswechsel7
gativ ist, aber größere Werte als eins
annehmen kann,
ist
sie jedoch keine Wahrscheinlichkeit.
1l
P [Y (t)
Y(t)
1
z ustandsraum­
Variable
=
=
O]
p1
(t)=P(Y(t)=1}
Abbildung
5:
Zwei-Zustands-Modell mit absorbierendem Ziel­
zustand
Beispiele
lim q(t,t+ßt)/ßt
ein. Für "sehr kleine"
0
r{t)=tibergangsrate
q(t,t+6t)=Übergangswahrscheinlichkeit
Eine herausragende Stellung nimmt die Übergangsrate
(1)
=
=
Zustand
Für die tibergangsrate sind zahlreiche Synonyme gebräuchlich wie das schon erwähnte
ferner Intensität
mit einem Zieloder "Force of Mortality".
zustand ist die Ubergangsrate auch mit der Hazardrate
identisch (dazu weiter unten) .
-
arbeitslos
konform
Beruf i
lebend
unfallfrei
alter Wohnsitz
Y(t)=O
- erwerbstätig
abweichend
Beruf j
tot
Unfall
- neuer Wohnsitz
- arbeitslos
- Organisation
Y(t)=1
- Ehe existiert
nicht
Die Übergangsrate ist deswegen von zentraler Bedeutung,
sie erstens
Gegenstand der Hypothesenbildung ist und
weil
zweitens
den Verlauf des Prozesses in eindeutiger Weise festlegt.
nächst jedoch noch einige Begriffe, bevor hierauf und auf
zu­
weitere Interpretationen der Übergangsrate eingegangen wer­
den kann.
Bei einem stochastischen Prozeß kann man,
wie wir schon ge­
sehen haben, zwei Zufallsvariablen und ihre zugehörigen Ver­
teilungen betrachten:
Erstens die
- 41 -
- 40 -
und zweitens die Ankunftszeit T eines Zustandswechsels oder
Wir führen jetzt folgende Funktionen ein,
Ereignisses.
wir uns auf
Prozesse mit stetiger
wobei
Ankunftszeit-Variablen T
beschränken:
a)
G(tl=tlberlebenswahrschein­
lichkeit im z u s and o
bl
t
-
G(t)=P T�t gibt die wahrscheinlich-
Die
keit an,
[
]
daß eine Person den Zeitpunkt t
kein Ereignis eintritt (Abbildung 6a).
"erlebt", d.h.
denn p (t) infor­
0
wie groß die Wahrscheinlichkeit ist,
sich eine Person zum
daß
G(t) ist identisch
mit der Zustandswahrscheinlichkeit p (t),
0
miert ja darüber,
daß
0
Zeitpunkt t noch im zustand o befindet.
t
z.B. Wahrscheinlichkeit,
daß die Arbe tslosigkeit
mindestens t
Monate
anhält.
*
- Die kumulierte Verteilungsfunktion der Ankunftszeiten
F(t)=P
gibt die Wahrscheinlichkeit an,
Zeitpunkt t ein Ereignis eingetreten ist
daß bis zum
�
z.B. Wahrscheinlichke t,
daß nach spätestens t
Monaten eine Beschäftigung
aufgenonunen wird.
(Abbildung 6b) .
c)
-
F{t)•kumulierte Verteilung
der Ankunftszeiten
f(t)=Dichte
dl
von F(t)
Physikalisches Beispiel
Die Wahrscheinlichkeitsdichteverteilung der Ankunfts­
zeiten wir<l mit f{t)
solute)
bezeichnet,
Sie
Wahrscheinlichkeit Aufschluß,
gibt über die (ab­
daß in einem bestimm­
ten Zeitintervall ein Ereignis eintritt (Abbildung 6c).
Anhand eines einfachen physikalischen Systems kann man sich
die Begriffe gut veranschaulichen.
serbehälter (dessen Volumen gleich eins gesetzt wird)
einem Abfluß und einem Ventil (Abbildung 6d).
entspricht dann
dem
Abfluß dem zustand
spricht G(t),
Zustand
1,
O,
mit
Der Behälter
das Wasserbecken unter dem
die Wassermenge in dem Behälter ent­
die abgeflossene Menge F(t) und die momentan
1l
durch das Ventil fließende Menge entspricht f(t) .
1)
ausgeht, daß der momentane Durchfluß f(t)
Behälter proportional ist, dann erhält man
sich leicht zeigen läßt - die Exponential­
der Hazardrate r als Proportionalitätskon­
diese Weise kann man eine Art "Galton-Brett"
konstruieren. Das Bild mit
wurde, ist einem Teil­
Nürnberg abgehaltenen
Seminars
zu verdanken.
0
Betrachten wir einen Was­
t
f(t)
rlt)
z.B� Wahrscheinlichke�t,
daß eine Beschäftigung im
Ze�traum
t ,t�
gefunden
1
•
wird.
Dichte 1 ist eine monoton
abnehmende Verteilung wie
z�B. die Exponentialvertei­
l ung in Abschnitt 2.2.2.
Dichte 2 ist eine nicht­
monotone eingipfelige Ver­
teilung.
Abbildung 6:
f(tJ entspricht hier dem
momentanen und
r{t) dem relativen momen­
tanen Durchfluß.
Uberlebensfunktion und
Verteilungen
- 42 -
- 43 -
Zwischen den drei Funktionen bestehen einfache und eindeutige
Wenn beispielsweise von 1000 Personen, die am 1.Januar ar­
Beziehungen. Die Wahrscheinlichkeit, daß eine Person bis t
beitslos wurden, nach 30 Tagen immer noch 800 ohne Arbeit
überlebt oder daß sich bis zum Zeitpunkt t etwas ereignet,
sind (=Risikomenge), so könnte man als Schätzwert von G(30)
muß ja eins sein. F(t) ist somit zu G(t) komplementär:
den Wert 0,8 angeben.
im Zeitintervall
(2) F(t)
1-G(t)
wenn weiterhin am nächsten Tag, also
t+.ßt=31]
4 Personen eine Beschäftigung
aufnehmen, so beträgt die absolute Wahrscheinlichkeit eines
Ereignisses für dieses Intervall etwa 4/1000=0,004. Dies wäre
Ferner sei hier wiederholt, was einführenden Statistik-Texten
eine grobe Schätzung von f(30), dessen Wert ja auf einen Zeit­
zu entnehmen ist, daß die Dichteverteilung der ersten Ablei­
1
tung der Verteilungsfunktion entspricht. Es gilt also: l
der Übergangswahrscheinlichkeit q(30,31) und damit wegen lit=1
(3) f(t)
4/800,
punkt und nicht auf ein Intervall bezogen ist. Als Schätzung
ungefähre Schätzung der Rate r(30) erhielte man als Resultat
unter Benützung von (4) wegen f(30) /G(30)
=
0,004/0,8
dasselbe Ergebnis.
Welche Beziehungen bestehen nun zwischen der Übergangsrate
und den drei
Funktionen
G(t), F(t) und f (t)?
Ohne Beweis seien hier einige Ergebnisse aufgeführt, deren
Ableitung in l\l'.hang 2 nachvollzogen werden kann. Aus den Annah­
men des Modells folgt die zentrale Beziehung:
(4) r(t)
f(t)
1-F(t)
2.2.2.
Das Modell mit zeitunabhängiger Rate
Wir betrachten jetzt den Spezialfall einer im Zeitablauf kon­
stanten Rate r(t)=r. In diesem Fall, der sozusagen das Basis­
Modell darstellt, spricht man auch von einem einfachen Pois­
1)
son-Prozeß.
Mit der Annahme der Zeitkonstanz der Rate kann man - wie in An­
Man kann sich den Ausdruck (4) wie folgt veranschaulichen.
Die Übergangsrate entspricht der Häufigkeit von Zustands­
wechseln in einem sehr kleinen Zeitintervall dividiert durch
alle "überlebenden", d.h. Kandidaten für einen Zustandswech­
sel (=Risikomenge). Bezogen auf das physikalische Beispiel
hang .2 gezeigt - eine Gleichung formulieren, deren Lösung
eine Beziehung zwischen der Überlebensfunktion und der Rate
liefert:
(5) G(t}
handelt es sich um den relativen momentanen Durchfluß.
11
1) f(t) = l'im P (t<'T<t+Lit]
llt
Llt_,.O
=
F(t+tit)-F(t}
l'
m
. i
Llt
Llt.+O
Für kleine Zeiteinheiten entspricht
(absoluten) Wahrscheinlichkeit, daß
(t,t+fit) ein Ereignis eintritt.
dF(t)
�
Die Bezeichnung rührt daher, daß bei einem Zählprozeß wie
in Abbildung 2b mit konstanter Rate die Zustandsvariable
"Y(t)=Anzahl von Ereignissen" einer Poisson-Verteilung mit
Parameter A=r.t folgt, wobei die Zeitintervalle bis zum
Eintreffen eines neuen Ereignisses gemäß Formel (7) ex­
ponentialverteilt sind. Siebe z.B. CHIANG 1968, Kap.III.
- 44 -
- 45 -
Die Zahl e=2,718 ist hierbei die Basis des natürlichen Loga­
rithmus.
nehmender Länge des Zeitintervalls.Für t=O ist G(t) =1, wie man
r
Berechnen wir jetzt noch den Mittelwert oder Erwartungswert
erwarten darf: Alle Personen sind zum Startzeitpunkt des Pro­
der Ankunftszeit.
zesses ja im zustand o. Auf der anderen Seite strebt G(t) mit
wachsender Zeit gegen O (siehe Abbildung 6a).
Kennt man G(t),
Bei einer beobachteten Häufigkeitsverteilung der Variablen X
mit den relativen Häufigkeiten f(x), berechnet
so ergibt sich als Komplement sofort F(t):
telwert bekanntlich nach folgender Formel:
f (t)
wir analog vor;
t:
(9)
-rt
re
Rate eine monoton fallende Funktion (siehe auch Abbildung 6c)
Für t=O ist f(t) maximal, nämlich r.
Die Wahrscheinlich-
keit eines Ereignisses ist zu Beginn des Prozesses am größ­
ten und sinkt dann exponentiell. 1)
Die Gleichungen
(4)
(5),
(6) und (7) folgen auch aus dem zentra­
(4)
durch das Integral von f(t)
man die Integralgleichung nach f(t) auf,
und löst
so erhält man die
Dichte (7). Dies läßt sich einfach nachprüfen, indem man (7)
(4)
einsetzt:
ft.f(t)dt
E(T)
Die Lösung des Integrals ist glücklicherweise eine einfache
und bedeutsame Beziehung:
.
(10) E(T)
( 11)
unter der Bedingung einer konstanten Rate.
Ersetzt man F(t) in
und (6) in
statt der Summierung müssen wir jetzt jedoch
über alle Werte von t integrieren:
Auch die Dichtefunktion ist bei dem Modell mit konstanter
len Theorem
r
1
r
oder:
1
E(T)
Der Mittelwert von
o,
T,
die mittlere Lebenserwartung im Zustand
ist also einfach der reziproke Wert der Rate. Das klingt
auch intuitiv einleuchtend:
Je größer die Übergangsrate (ge­
wissermaßen der "Abfluß" aus dem zustand 0), desto geringer
die mittlere Verweildauer im Zustand o. Beträgt z.B. die Uber­
gangsrate konstant 0,005,
so können wir erwarten, daß eine
Person im Mittel 1/0,005 = 200
l)
wobei
theoretischen Verteilung mit stetiger Zufallsvariable T gehen
schließlich erhält man die Dichtefunktion f (t) durch Ableitung
von F(t) nach
sich der Mit­
M=rx.f(x),
über sämtliche Beobachtungsklassen summier·t wird. Bei einer
-rt
(6) F(t) = 1-e
(7)
r
(8)
Die Uberlebenskurve fällt also exponentiell mit zu­
Dies erlaubt eine interessante Interpretation: Wenn man
das Modell auf seltene Ereignisse wie Unfälle anwendet hier ist der einfache Poisson-Prozeß mitunter angemessen so ist die Wahrscheinlichkeit eines neuen Ereignisses am
größten
nach dem Eintreten des letzten Ereignisses. Es
also
zu erwarten
daß zwei oder auch
mehrere Unfälle
aufeinander
Tage arbeitslos sein wird,
wenn die Zeit in Tagen gemessen wurde.
Das Modell mit konstanter Rate hat eine große Bedeutung als
Basis-Zufallsmodell.
Im Vergleich mit komplizierteren Modeldienen.
- 47 -
- 46 -
Die Gleichungen (5) bis (11) liefern ferner neue Interpreta­
(13) G(t)
tionen der Ubergangsrate, insbesondere aber weisen sie auf
Bindeglieder zwischen der Rate und den Beobachtungen hin.
(14) F (t)
R(t)
1-e-
(15)
r(t) .e
Auch wenn die Rate selbst als nicht direkt beobachtbarer ma­
thematischer Grenzwert intuitiv weniger verständlich sein mag
(obwohl wir uns auch an andere derartige Größen, wie z.B.
f (t)
die
momentane Geschwindigkeit in der Mechanik, gewöhnt haben) so
Man sieht,
sind doch die beobachtbaren Konsequenzen anschaulich.
(5) bis
Und von
daß aus (13),
(7)
daher erschließt sich auch die Rate indirekt einem genaueren
daß die Chance der A ufnahme einer Beschäf­
tigung mit zunehmender Dauer der Arbeitslosigkeit geringer
wird.
(14) und (15) auch die Gleichungen
denn es gilt ja bei konstanter Rate r:
=
Ir.de
r.t
Eine einfache Beziehung für die mittlere Verweildauer E(T)
zeitabhängige Raten
Es ist zu vermuten,
folgen,
t
(16) R(t)
Verständnis.
2.2.3.
-R(t)
Die tlbergangsrate dürfte nach 30 Tagen Arbeitslosigkeit
höher sein als nach 300 Tagen. Eine Ratenfunktion r(t),
bei
läßt sich leider nicht allgemein, sondern nur bei wenigen
1)
Spezialfällen ableiten.
Man erkennt anhand der Gleichungen
(13) bis (16),
daß mit der Wahl der Übergangsrate auch F(t),
G(t) und f(t) eindeutig bestimmt sind.
Rate,
Kennt man also die
dann kennt man auch den vollständigen Prozeßverlauf.
der die Übergangsrate als Funktion der Verweildauer spezifiziert
wird,
wie gesagt -
bezeichnen wir
als Entwicklungshypothese.
Verschiedene Modelle,
dargestellt wird,
Die Gleichungen
(5) bis
um auch im Fall
zeitabhängiger Raten gültige Aussagen zu er­
lauben.
(7)
müssen
Dazu ist es erforderlich,
jetzt mod�fiziert werden,
die kumulierte Hazardfunk­
Wenn r(t) nicht konstant ist,
keine Exponentialverteilung.
erhält man gemäß (14) für F(t)
In diesem Fall haben wir es mit
Semi-Markov-Prozessen zu tun.
tion zu definieren:
t
(12) R(t)
bei denen r(t) als Funktion der Zeit
werden wir in Kap.5 behandeln.
Aus Gleichung (13) resultiert eine weitere Deutung der Rate.
fr(T)dT
Dazu logarithmieren wir zunächst beide Seiten von (13):
R(t) ist also das Integral
der Rate (Tist hierbei nur eine
Hilfsvariable bei der Integration). Anschaulich gesprochen
bewirkt R(t) die Aufsummierung oder Kumulierung der Rate über
alle Zeitpunkte bis zum Zeitpunkt t.
(17)
1)
ln G(t)
Es gilt
ja:
-R(t)
E(T)
=
'11
Jt.f(t)dt
0
=
ft.r(t)e-R(t)dt.
Dieser
0
Ausdruck ist in den meisten Fällen leider nicht explizit
Im Falle zeitabhängiger Raten erhält man G(tl
folgende Weise:
rt
in
Gleichung
einfach auf
(5) wird durch die kumu­
lierte Hazardfunktion R(t) ersetzt (siehe Anhang 2).
gibt sich für G(t),
F(t) und f(t):
Somit er­
auflösbar.
- 49 -
- 48 -
Unter Berücksichtigung von (12)
liefert die Ableitung von
(17):
( 18)
2. 2. 4.
Bei den bisherigen Modellen wurde unterstellt,
daß alle Un­
tersuchungseinheiten die gleiche Rate aufweisen.
r(t)
zeitabhängiger Raten muß man genauer sagen,
Im Falle
daß für alle Per­
sonen mit identischer Verweildauer gleiche Raten angenommen
Die Rate entspricht also dem negativen Wert der ersten Ablei­
werden.
tung des natürlichen Logarithmus der Uberlebensfunktion.
die Berücksichtigung der Heterogenität der Untersuchungsein­
Die Definition der tibergangsrate und verschiedene Folgerun­
nicht alle Personen haben die gleiche Chance,
gen hieraus
bekommen etc.
heiten.
(zur Ableitung siehe Anhang2),die die Interpre­
tation der tibergangsrate erleichtern,
sind nochmals übersicht­
Häufig erf.ordern wirklichkeitsnahe Modelle hingegen
Nicht alle Personen haben die gleiche Unfallneigung,
einen Job zu
Zur Berücksichtigung von Heterogenität kann man
im Prinzip zwei Wege beschreiten:
lich in Tabelle 2 aufgeführt.
- Der Heterogenität wird Rechnung getragen
Tabelle 2:
Definition der Übergangsrate und einige Beziehungen
lierung einer Verteilungsannahme.
Z.B.
durch die Formu­
kann angenommen wer­
den, daß die Rate r in der Population gammaverteilt ist
Die Übergangsrate r(t) charakterisiert die
momentane Neigung einer Untersuchungseinheit
zum Zustandswechsel.
erbal:
r(t)
=
lim
At+O
1
(eine relativ allgemeine Verteilung) • l
(Überblick bei CARR-HILL und PAYNE 1971).
g(t,t+At)
At
- Die Heterogenität wird durch die Einführung von
ten
InterAt
q(t,t+At)
berücksichtigt.
f(t}
1-F (t)
z.B.
die Schätzung der Übergangsrate bei Arbeitsunfällen
f (t)
G(t)
Der Unterschied zwischen den Übergangs­
raten kann dann als kausaler Einfluß der unabhängigen Va­
riablen "Fabrik" gedeutet werden.
elegantere Methode,
heorem 2
dlnG(t)
dt
r(t)
3
r
1
=
E(T)
�ovaria­
Im einfachsten Fall entspräche dem
die separate Schätzung der Rate bei verschiedenen Gruppen,
r(t) .At
in zwei Fabriken.
r(t)
Auf diesem Weg
kommt man zu den klassischen Modellen der Unfallstatistik
'dR(t}
�
zu ermitteln.
Es existiert jedoch eine
um die Effekte unabhängiger Variablen
Ähnlich wie eine Regressionsgleichung wird
dabei eine parametrische Funktion formuliert, die die Rate
1) Die Gamma-Verteilung ist hier
im Unterschied etwa zur
Normalverteilung - deswegen sehr geeignet, weil sie für
positive Zufallsvariablen definiert ist. Die Rate r ist
ja stets positiv. zweitens enthält sie eine Reihe wich­
tiger Verteilungen wie die
x 2-verteilung, die Exponen­
tial verteilung und die geometrische Verteilung als Spe­
zialfälle. Siehe zu diesen Modellen z.B. das. Lehrbuch
von CHIANG 1968, Kap.III.
-
-
0
5
- 51 -
in Abhängigkeit von dichotomen oder auch metrischen unab­
hängigen Variablen darstellt.
11981)
und TUMA (1979) beschritten.
Eine derartige Raten­
Funktion mit unabhängigen Variablen bezeichnen wir - wie
gesagt - als :..:o::.:::.::c:;:.;::=uc.::..;;;;;.;;.;;;="'Um den Einfluß
2.3. Mehr-Zustands-Modelle
Dieser Weg wurde von COLEMAN
Zur Analyse von Mehr-Zustands-Modellen können die bisher ent­
wickelten Konzepte generalisiert werden.
von unabhängigen Variablen auf die Rate gra­
Personen, die sich im zustand O befinden
phisch zu veranschaulichen, vereinbaren wir eine Symbolik,
zwei Risiken ausgesetzt:
die aus Abbildung 7 hervorgeht.
oder in den Zustand 2.
zweiten Fall r02, bzw.
Abbildung 7:
Greifen wir dazu er­
neut das Drogenbeispiel aus Abbildung 2d auf.
Zwei-Zustands-Modell mit Kovariaten
(keine Drogen), sind
Sie können in den Zustand 1 wechseln
und im
Die Rate ist im ersten Fall r0
1
bei zeitabhängigen Raten r01(t) und
r0 (t). Das Risiko, daß überhaupt ein Ereignis - gleich wel­
2
cher Art - auftritt, wird als Hazardrate oder Hazardfunktion
bezeichnet.
j charakterisiert das
Die Hazardrate im Zustand
momentane Risiko, daß eine Untersuchungseinheit den Zustand
verlassen wird.
Die formale Definition lautet:
n
(19) Hazardrate
für Zustand j
=*'
Übergang
0
D
Erwartetes Vorzeichen des Effekts auf die Rate
Ausprägung der Zustandsvariablen
Unabhängige Variable (z.B. X =Geschlecht mit Codie­
1
X2 =Qualifikationsni­
rung O=männlich, 1=weiblich,
veau, x =Berufserfahrung) .
3
Gemäß der Graphik werden die Hypothesen aufgestellt, daß
Frauen eine geringere Chance haben, eine Beschäftigung zu
finden,
kh
zwischen den Zuständen ("Abfluß")
Effekte von unabhängigen Variablen (Kovariate) auf
die Rate
+/-
k=1
und daß sowohl das Ausmaß
der Qualifikation als auch
der Grad der Berufserfahrung die Rate positiv beeinflussen.
Die Hazardrate für
Zu­
j entspricht also der Summe der Raten aller von j aus
erreichbaren Zustände.
Für das Drogenbeispiel ist
r0(t)=
r0
t)+r0 (t)
2
1(
.
1)
Wahrscheinlichkeit �j(t,t+&t), daß im zu­
Zeitin�ervall [t,t+Lltj irgendein Ereignis auftritt,
ist die Sunune der Übergangswahrscheinlichkeiten bezüglich
aller vom Zustand j erreichbaren Zielzustände k. Die
Hazardrate ist der Limes dieser bedingten Wahrscheinlich­
keiten dividiert durch Llt für lit+O und somit die Sunune der
Übergangsraten gemäß Ausdruck (19):
ob die Hypothesen zutreffen und wie stark die Effekte sind,
muß die empirische Analyse zeigen.
r k
. (tj
J
Hierbei ist n die Anzahl der Zustände.
stand
1)
r · (t) =lim
J
Llt+O
q' (t,t+lit)
Llt
n
= lim
Llt+O
r
k=1
k #j
q ' (t,t+&t)
k
i';t
-
- 53 -
52 -
Als Generalisierung von (12) definieren wir ferner die kumu­
Man könnte nun leicht auf die Idee kommen,
lierte Hazardfunktion im
der beobachteten mittleren Ankunftszeit
Zustand j:
die Rate anhand
zu schätzen.
Ange­
nommen es liegen Daten über 6 Personen für einen Beobachtungs­
t
(20) R (t) =
j
f
zeitraum von zehn Monaten vor,
r (T)dT
j
Die Überlebensfunktion G(t) und die Verteilung F(t) und �(t)
sind bei Mehr-Zustands-Modellen auf den jeweiligen zustand j
zu beziehen. G.(t), F.(t) und f .(t) erhält man als Generali-
J
J
J
sierungen von (13), (14) und (15), wobei R(t) durch R (t) gej
mäß (20),und r(t) durch r.(t) gemäß (19) zu ersetzen ist.
J
Die Raten und die Effekte der Kovariate auf
die Raten können
bei Mehr-Zustands-Modellen anhand von Ereignisdaten geschätzt
werden.
wobei die Zeit bis zur Aufnahme
einer Beschäftigung ermittelt wurde (z.B.
Im zweiten Schritt können mit mathematischen Hilfs­
mitteln die Zustandswahrscheinlichkeiten - im Beispiel p (t),
0
p (t) und p (t) - abgeleitet werden. Von großem Interesse bei
2
1
der dynamischen Analyse von Modellen sind auch eventuell exi­
stierende Gleichgewichtszustände (dazu Kap.5) sowie die Effekte
spektive Befragung).
ten noch arbeitslos, für die übrigen Personen endete die Ar­
beitslosigkeit nach 2,, 4, 6 und 8
1/5=0,2 (wobei
T=5
Monaten.
Wäre dann r=1
dem beobachteten Mittelwert der Ankunfts­
zeiten entspricht) eine gute Schätzung der Rate?
Hier ist Vorsicht geboten, da
berücksichtigt wurden.
Monaten arbeitslos
Für
waren,
ja die zensierten Fälle nicht
zwei Personen, die auch nach zehn
ist die Ankunftszeit ja unbekannt.
Möglicherweise tritt ein Ereignis erst nach
ten oder gar nicht auf.
13
oder 17 Mona­
Die skizzierte Vorgehensweise liefert
nur dann einen guten, d.h.
möglichst unverzerrten und effi­
zienten Schätzwert der Rate, wenn keine
liegen.
der Kovariate auf das Niveau des Gleichgewichts.
durch eine retro­
Zwei Personen waren auch nach zehn Mona­
zensierten Daten vor­
Typ ischerweise ist man jedoch bei soziologischen An­
wendungen nahezu immer mit dem Problem zensierter Daten kon­
Allerdings kann die mathematische
Analyse der Dynamik von
frontiert, wenn man die Ankunftszeiten erhebt.
Prozessen bei Mehr-Zustands-Modellen mit zeitabhängigen Ra­
ten und reversiblen Ereignissen recht kompliziert werden.
1)
Wir werden emige Beispiele nach in Kap. 5 behandeln und lassen
es hier mit der knappen Skizzierung bewenden.
Auch die Behandlung der zensierten Fälle als nicht-zensierte
Beobachtungen stellt keine Lösung dar.
teten
Ankunftszeiten aus den Werten 2,4,6,8 und 10,10 zu be­
rechnen. Der hieraus resultierende Schätzwert der Rate von
2.4.
Gemäß Ausdruck
Man könnte leicht auf
die Idee kommen, einen korrigierten Mittelwert der beobach­
0,15 ist jedoch ebenfalls noch eine Überschätzung der Rate
(11)
ist die Übergangsrate (beim Modell mit
(HANNAN und
TUMA
1979).
konstanter Rate) der reziproke Wert der mittleren Ankunfts­
Mit der Maximum-Likelihood-Schätzmethode (ML-Methode)
zeit.
ist es
nun möglich, auch dann gute Schätzungen der Raten zu erzie­
11
len (und damit von f(t), F(t), G(t) und E(T)), wenn der
Untersuchungen von wichtigen
z.B. bei COLEM.�N 1981, CARROLL
und GROENEVELD 1979.
finden sich
TUMA, HANNAN
Datensatz Zensierungen enthält.
- 54 -
- 55 -
Die ML-Methode arbeitet dabei nach folgendem Prinzip. Zu­
nächst entscheiden wir uns für ein Modell, d.h. wir wählen
Allgemein ist die Likelihood
achteten Ankunftszeiten
bei N1
nicht-zensierten beob�
das Produkt
einen bestimmten Zustandsraum und die entsprechenden Raten­
funktionen. Wir gehen dabei wieder vom zwei-Zustands-Modell
mit absorbierendem Zielzustand aus.
Sodann stellen wir eine
Funktion auf, nämlich die Likelihood-Funktion,
Auskunft gibt,
welche Plausibilität
die darüber
(Likelihood) unsere Be­
obachtungen (die Stichprobe von Ereignisdaten) bei bestimm­
ten
"wahren" Werten der Rate
Grundgesamtheit haben. l)
Werte
für
(der Modell-Parameter) in der
Wie plausibel ist es, z.B.
die sechs
die Dauer der Arbeitslosigkeit des obigen Beispiels
z u erzielen,
wenn der wahre Wert der Rate 0,1 oder 0,2 oder
0,3 beträgt? Natürlich kennen wir den wahren Wert der Rate
nicht,
aber wir wählen denjenigen als besten Schätzwert, bei
dem die Plausibilität unserer Beobachtung maximal ist. Diese
Entscheidungsregel ist das Maximum-Likelihood-Prinzip.
Die Likelihood,
eine Verweildauer von 6 Monaten zu beobachten,
ergibt sich aus der Dichtefunktion f(t).
Bei der einen Beob­
Nun verfügen wir aber auch noch über die zensierten Beobach­
tungen, die wir nicht vernachlässigen dürfen.
los. Aus der Überlebensfunktion wissen wir,
daß
f(6) kein bestimmter Wert,
sondern
die Likelihood-Funktion (21) bei unabhängigen Beobachtungen
wie folgt erweitert werden:
(23) L=f(2).f(4) f (6) .f(8) .G(10).G (10)
.
Oder allgemein bei N
obachtungen:
N
(24) L=
eine Funktion von Parametern ist. Im Falle zeitunabhängiger
Raten z.B.
müßten wir demnach genauer f(6,r) schreiben. Um
die Notation nicht zu kompliziert zu gestalten,
verzichten
wir jedoch auf die explizite Erwähnung der Parameter. Bei den
vier unabhängig voneinander erhobenen,
nicht-zensierten Be­
obachtungen erhalten wir als Likelihood das Produkt:
TI
1
i=1
Gleichung
f(t.).
1
(24)
nicht-zensierten und N
1
N
2
TI
i=1
Kap.8).
zensierten Be­
kann man etwas eleganter schreiben, wenn die
Indikator-Variable d eingeführt wird,
wobei d�1 angibt,
eine nicht-zensierte Beobachtung vorliegt,
sierte Beobachtung indiziert.
daß
und d=O eine zen­
Die Anzahl aller Beobachtungen
bezeichnen wir mit N.
(25) L
Bei Wahrscheinlichkeitsverteilungen mit diskreten Zufalls­
variablen ist die Likelihood identisch mit der .!'.!'.<JLQ.1::§.'�El_!:�
der Beobachtungen bei gegebenen
nicht mehr
Zufallsvariablen handelt es sich
von "Plausi­
um eine Wahrscheinlichkeit. Wir sprechen
bilität". Eine ausführliche Beschreibung der Maximum-Likeli­
hood-Methode findet sich in dem Lehrbuch von NELSON (1982,
2
G{t )
i
(21) L = f(2).f(4).f(6).f{8)
1l
daß die Wahr­
scheinlichkeit hierfür G(10) ist. Mit zensierten Daten kann
achtung ist die Likelihood-Funktion genau f ( 6l. Dabei müssen
wir im Auge behalten,
Bei dem Bei­
spiel waren zwei Personen nach 10 Monaten immer noch arbeits­
[DatenJ
f(t) und G(t)
-
]-
Parameter
sind
N
II
i=l
d.
[f(ti l ] �[G(ti)]
wir wir wissen
(1-d.)
;i.
Funktionen der Raten,
also der Modell-Parameter, deren Werte wir schätzen wollen.
Das haben wir in (25) symbolisch durch den Zusatz in eckiger
Klammer
zum Ausdruck gebracht,
der als "Likelihood der Daten
in Abhängigkeit der Werte der Parameter" z u lesen ist.
- 56 -
- 57 -
Bei dem Modell mit konstanter Rate r folgt unter Verwendung
von
(5)
und
(7) aus
(25):
- Die Schätzwerte sind maximal effizient,
der Schätzwerte
d.h.
(sozusagen die Fehlerbreite)
die Varianz
ist geringer
als bei anderen Verfahren.
<25> L
N
IT
i=1
[Daten !
- Aus der Maximum-Likelihood-Theorie folgen verfahren
Prüfung der Parameter auf statistische Signifikanz.
Das Maximum von L in Bezug auf r bei den gegebenen Daten t ,d
i
i
liefert gemäß dem ML-Prinzip den Schätzwert r.
den Wert von r,
der L
Wir suchen
ja
"maximal macht".
Bei dem Modell mit konstanter Rate erhalten wir als Endresul­
tat obiger Überlegungen eine einfache Formel für die Schät­
zung der Raten
3).
(siehe dazu Kapitel 5 und zur Ableitung Anhang
Bei komplizierten Ratenfunktionen mit Kovariaten und
Zeitabhängigkeit benötigt man zur Schätzung der Parameter
allerdings Computerprogramme.
Der Anwender ist dabei mit den komplizierten numerischen Be­
rechnungen in keiner Weise belastet.
Allerdings erscheint es
uns hilfreich zu sein, wenn ein Verständnis des Prinzips der
Methode erlangt wird.
Die Likelihood-Funktion
(25) gilt für Zwei-Zustands-Modelle
mit irreversiblen Ereignissen.
Die allgemeine Funktion für
Mehr-Zustands-Modelle und reversible
in TUMA
VELD
Ereignisse
findet sich
1979 sowie in dem Aufsatz von TUMA, HANNAN und GROENE­
(1 979).
Insbesondere bei größeren Stichproben bietet die ML-Methode
eine Reihe von Vorteilen:
Zensierte Daten werden berücksichtigt.
Damit wird ein star­
ker Bias der geschätzten Parameter vermieden und der Infor­
mationsgehalt der Daten wird in vollem Umfang ausgeschöpft.
sind inferenzstatistische
zur
Somit
Tests der Parameter möglich.
- 58 -
- 59
3. Nicht-parametrische Verfahren
rigkeiten,
da in der Regel einige der beobachteten Zeiten
nicht exakt,
3.1.
sondern zensiert sind,
lediglich bekannt ist,
größer ist als die beobachtete
Jede statistische Datenauswertung beginnt zweckmäßigerweise
zwar die Möglichkeit,
mit einer explorativen Phase,
oberste
und
zwar unabhängig davon,
die Daten aus einem geplanten Experiment stammen,
sich bei der Auswertung um eine Sekundäranalyse,
waltungsstatistiken,
handelt.
mente wie Linearauszählungen,
oder ob es
etwa von Ver­
Die einfachsten dieser Instru­
Kreuztabellen,
Korrelations- und
Assoziationsmaße, graphische Darstellungen usw.
sind allgemein
bekannt und in gebräuchlichen Statistik-Softwarepaketen
SPSS oder BMDP enthalten.
ob
wie
(rechtsoffene)
sierten Zeit beginnt,
von diesen Fällen also
daß die tatsächliche Ankunftszeit
(zensierte)
Zeit.
daß das
Zeitintervall bei der kleinsten zen­
so daß alle größeren exakten wie zen­
sierten Beobachtungen in diese Kategorie fallen.
gleichsweise kurzen
Hier besteht
die Zeitskala so zu gruppieren,
Bei ver­
zensierten Zeiten werden sich dann aller­
dings die meisten Beobachtungen in dieser Kategorie konzen­
trieren,
und die Ankunftszeitverteilung wird wenig aussage­
kräftig sein.
Zu Weiterentwicklungen auf diesem
Gebiet sei insbesondere auf TUKEY
(1977) verwiesen.
Die folgenden beiden Abschnitte befassen sich mit nicht-para­
metrischen Schätzverfahren für gruppierte Zeitbereichs-Daten
Die Zielsetzung dieser explorativen Techniken besteht darin,
die in den Daten enthaltene Information unter möglichst all­
gemeinen Modellannahmen
annahme)
(im Idealfall sogar ohne jede Modell­
zu komprimieren und diese komprimierte Information
in numerischer und/oder graphischer Form darzustellen.
Die
bzw.
Individualdaten mit exakter Ankunftszeit
ten,
vgl.
Abschnitt
(ab Level 8.0)
1.3.2)
und BMDP.
(Zeitpunkt-Da­
und deren Realisierung in SPSS
Diese Verfahren liefern insbesondere
bei graphischer Unterstützung ein recht gutes Bild des unter­
suchten Prozesses.
Teil schon hier,
Graphische Auswertungstechniken werden zum
zum Teil auch in Kapitel
5 beschrieben.
Im
Forderung nach einer weitgehenden Unabhängigkeit von Modell­
letzten Abschnitt des vorliegenden Kapitels befassen wir uns
annahmen schließt Verteilungsannahmen und damit parametrische
mit Testverfahren zum Vergleich der Überlebensfunktionen in
Verfahren praktisch aus und legt die Anwendung nicht-parame­
verschiedenen Gruppen.
trischer Verfahren nahe.
Der Anwendungsbereich nicht-parame­
trischer Verfahren ist allerdings nicht auf die explorative
Die Unterscheidung zwischen gruppierten
Analyse beschränkt.
und Individualdaten mit exakter Zeitangabe bezieht sich dabei
Wir werden solche Verfahren etwa beim
Zeitbereichs-Daten
Test auf die Gleichheit von Überlebensfunktionen durchaus
auf die bei der Auswertung verwendete Datenstruktur,
auch im Rahmen der konfirmatorischen Statistik anwenden.
nicht notwendigerweise auf die Struktur der Originaldaten.
Bei gruppierten
Zeitbereichs-Daten ist die Untersuchungsein­
Die zentrale abhängige Variable - die Ankunftszeit oder Ver­
heit eine Gruppe von Individuen
weildauer - ist eine eindimensionale Zufallsvariable.
Ankunftszeit in ein bestimmtes Zeitintervall fällt.
Die
also
{Personen,
Ehen usw.),
deren
Bei in­
Verwendung von vertrauten deskriptiven Konzepten wie Linear­
dividuenbezogenen Zeitpunkt-Daten dagegen
auszählung
chungseinheiten die Individuen selbst und die Ankunftszeiten
{nach fest gewählten Zeitintervallen)
gramm liegt also nahe.
und Histo­
Dabei stößt man aber bald auf Schwie-
müssen exakt bekannt sein.
sind die Untersu­
Obwohl bei letzteren Daten der In­
formationsgehalt offensichtlich größer ist,
kann es durchaus
- 60 -
zweckmäßig sein,
vorzugehen,
sie vor der Auswertung
die Ankunftszeit nicht exakt
scheidungen z.B.
piert werden.
n ur
Ehe,
Zeitangabe,
wird man für
in Jahren)
also als
den wert
bei denen
(2)
angegeben ist,
die Anzahl der Kohortenmitglieder,
welche im betreffenden
Intervall sterben.
können grup­
Individual-Daten mit
Zeitpunkt-Daten,
welche den Beginn des
und
ausgewertet
Diese werte werden in der Regel auf einen standardisierten
ursprünglichen
Kohortenumfang
(z.B.
1000 Personen)
bezogen.
jedes Jahresintervall einen charakte­
(für eine Ehescheidung im dritten Ehe­
also nach mehr als zwei,
z.B.
Individual-Daten,
die Anzahl der Kohortenmitglieder,
betreffenden Intervalls erleben,
(bei der Untersuchung von Ehe­
Sollen sie hingegen als
ristischen Zeitpunkt
jahr,
(1)
Zeitbereichs-Da­
Grenzfälle wird man ebenfalls nach dem Gesichts­
punkt der Zweckmäßigkeit zuordnen.
werden,
zu gruppieren und so
als würde es sich um gruppierte
ten handeln.
"exakter"
- 61 -
2,5)
aber weniger als drei Jahren
Zensierungsprobleme gibt es bei dieser idealen Kohorte nur
insofern,
als bei der Erstellung der Sterbetafel einige Ko­
hortenmitglieder noch am Leben sein können.
wählen.
chenden zensierten
3.2.
gruppierten
Da die entspre­
Zeiten aber gleichzeitig die längsten be­
obachteten Zeiten sind,
fällt dieser Umstand kaum ins Gewicht.
Bei einer realen Kohorte ist die Situation
anders:
Hier hat man es in der Regel mit unvollständigen Beobachtun­
3.2.1. Berechnung der Werte einer Sterbetafel
gen
zu tun,
beispielsweise dadurch,
daß ein ige Fälle durch
Die in der englischsprachigen Literatur gebräuchlichen Namen
Emigration verlorengehen. Werden - was normalerweise der Fall
für diese Methode "Life-Table-Estimator"
ist - Sterbetafeln nicht aus Verlaufsdaten,
Method"
weisen darauf hin,
and
"Actuarical
daß die hier dargestellten sta­
sondern aus re­
gelmäßig wiederholten Querschnittserhebungen oder der Zusam­
tistischen Techniken aus der Bevölkerungsstatistik stammen
menführung von Geburts- und Sterbestatistiken erstellt,
und der Auswertung von "Life Tables"
kann es weitere Verzerrungen durch zusätzlich hinzukommende
(Sterbetafeln)
dienen.
Eine Sterbetafel ist eine Datenstruktur für Beobachtungen,
welche nach ihrer Lebenszeit gruppiert sind.
ches Beispiel mag das Altern einer
dienen,
Als anschauli­
"idealen Geburtenkohorte"
in der es weder Emigration noch Inunigration gibt.
Bei einer einfachen nicht-parametrischen Da,rstellung dieses
Alterungsprozesses wird man die Z eit in feste Intervalle ein­
teilen,
welche nicht notwendigerweise gleich lang sein müs­
Fälle,
etwa durch Immigration,
geben.
dann
Beim Altern von Ge­
burtskohorten mögen die dadurch entstehenden Ungenauigkei­
ten noch in einem vertretbaren Bereich liegen,
bei der Un­
tersuchung von Ehescheidungen in einer Heiratskohorte können
diese Fehler mit zunehmender Ehedauer aber beträchtlichen
Umfang annehmen
(konkurrierendes Risiko:
Eheauflösuno durch
Tod eines Partners).
sen. Um etwa ein genaueres Bild von der Säuglingssterblich­
keit
zu erhalten,
wird man zweckmäßigerweise die ersten ein,
zwei Jahre in Tages-, Wochen- oder Monatsabschnitte einteilen,
später werden Jahresabschnitte oder noch längere Intervalle
genügen.
In der Sterbetafel werden dann für jedes Intervall
ausgewiesen :
In vollständiger Form wird eine Sterbetafel also für
jedes
Zeitintervall neben den oben genannten Daten auch die Anzahl
der Kohortenmitglieder,
siert werden,
welche i m betreffenden Intervall zen­
enthalten müssen.
Dabei ist es durchaus mög-
- 62 -
lieh,
daß die ursprünglichen
- 63 -
Individualdaten exakte
Zeitan­
gaben beinhalten. Für die Life-Table-Methode wird auf die
Information über den exakten
Zeitpunkt
zugunsten einer unten beschriebenen
nützt wird lediglich die
vall das betreffende
findet.
Information,
Ereignis
verzichtet
{und zwar
Verteilungsannahme). Be­
in welchem Zeitinter­
(Tod oder
Zensierung)
Zeitachse
i
2
Intervall Nr.
statt­
Das Ergebnis wird demnach auch noch von der gewähl­
ten Einteilung in
immer feinerer
Zeitintervalle abhängen.
Der Grenzfall bei
Zeiteinteilung - die Product-Limit- oder
Kaplan-Meier-Methode - benützt dann wieder die vollständige
Information über die Ankunftszeiten.
schnitt 3.3.
Dieser Methode ist Ab­
Die Verwendung eckiger bzw.
das "untere Ende"
das "obere Ende"
des
a
i
b ;a
i+1
i
runder Klammern drückt aus,
jedoch
zum nächsten Intervall Nr.i+1
(um Zuordnungsprobleme für den Fall, daß beobachtete Zeiten
gewidmet.
gerade auf Intervallgrenzen liegen,
Neben den Rohdaten
(dem Input-Teil) enthält eine Sterbetafel
auch nicht-beobachtbare,geschätzte
Informationen
mittlere restliche Lebenszeit usw.
etwa ELANDT-JOHNSON und JOHNSON
1980)
Hazard­
Von mehreren Schätz­
verfahren für diese Funktionen und Verteilungen
(siehe dazu
werden wir uns hier
nur mit dem in BMDP und SPSS 8 realisierten Schätzer befas­
sen.
Er stützt sich auf die im Falle gruppierter Daten plau­
sible
(allerdings nicht überprüfbare) Annahme, daß in jedem
Zeitintervall die
zensierten
Beobachtungen qleichverteilt sind.Diese
Annahme ist um so unproblematischer,
valle
sind.
Ein
zensierter Fall,
je kürzer die
z.B.
zu vermeiden).
Die wei­
teren Bezeichnungen lauten:
zur Über­
lebensfunktion, Dichte der Sterbezeitenverteilung,
rate,
daß
Intervalls Nr.i zu diesem gehört,
Inter­
n.
1.
C,
1.
Anzahl von Individuen,
welche den Zeitpunkt a.
Anzahl von Individuen,
welche im
1.
Zeitintervall
[a i,bi)
Anzahl von Individuen, welche im Zeitintervall
[ai,bi)
zensiert werden,
d.
J_
erleben,
sterben.
Da wir davon ausgehen können, daß
jedes
Individuum aus
einer
konkreten Stichprobe entweder während des Beobachtungszeit­
raums
"stirbt"
oder zensiert wird,
gilt für n '
i
und d
c
i
i
folgende Beziehung:
ein unbekannt verzo­
gener Arbeitsloser einer Arbeitslosenkohorte im Zeitinter­
vall 60 bi s
65 Tage
nach Beginn der Arbeitslosigkeit,
ja irgendwann in diesem
gehen.
kann
J:
jU
(c .+d.)
J
J
Zeitintervall der Studie verloren
Man nimmt bei Gleichverteilung also an,
daß
die zen­
sierten Fälle im Durchschnitt bis zur Mitte des Intervalls
in. der Risikomenge
(27)
(dazu weiter unten)
enthalten sind.
Für die Rohdaten verwenden wir die folgende Notation:
n , die zahl der Lebenden zum Zeitpunkt
, entspricht also
i
der Summe aller Fälle, die nach dem Zeitpunkt
(jG:i) "sterben"
oder
zensiert werden.
-
64
- 65 -
-
Zu den durch die gewählten Zeitintervalle festgelegten Zeit­
punkten a
men:
1
läßt sich die Uberlebensfunktion rekursiv bestim-
Die Wahrscheinlichkeit
("conditional proportion
of surviving")
1, den Beginn des (i+1)-ten
Intervalls zu erleben ist gleich der Wahrscheinlichkeit
den Beginn des vorhergehenden (i-ten) Zeitintervalls zu §:E::
Überlebensfunktion,
kumulierte Überlebenswahrscheinlichkeit
leben mal der bedingten Wahrscheinlichkeit p , dieses Inter­
i
vall zu überleben. Das Schätzproblem wird damit reduziert auf
("cumulative proportion of surviving")
das Problem, Schätzwerte p
für die bedingten Uberlebenswahr­
i
scheinlichkeiten ("conditional proportion of surviving") zu
(31)
finden
bzw.
- komplementär dazu - für die bedingten Sterbe­
wahrscheinlichkeiten q
("conditional proportion of dying").
i
Ein naheliegender Schätzwert für q
ist die Anzahl der Sterbe­
i
fälle im Zeitintervall Nr.i, dividiert durch die Anzahl von
Individuen ,
welche in diesem Intervall dem Sterberisiko aus­
gesetzt sind.
Beim Vorliegen von zensierten Beobachtungen
ist der Umfang dieser Risikomenge allerdings nicht gleich n .
i
Gemäß der Annahme, daß zensierte Fälle im Durchschnitt nur
die halbe Zeit über dem Risiko ausgesetzt sind,
die Hälfte der zensierten Fälle abzuziehen.
ist von n
i
Wir erhalten so­
mit die folgenden Formeln für unsere Schätzwerte (das Zeichen
hin,
über den entsprechenden Ausdrücken weist darauf
ist die geschätzte Wahrscheinlichkeit, den Beginn des In­
i
tervalls Nr.i zu erleben. Aus der Identität
G
(32)
wobei t
(a +b )/2 der Mittelpunkt des Intervalls Nr.i ist,
mi
i
i
läßt sich für die Dichtefunktion der folgende Schätzer her­
leiten:
(33)
daß es sich um Schätzwerte handelt):
(Risikomenge, "number
exposed to risk")
(28) n!
l
Bedingte Sterbewahrscheinlichkeit ("conditional proportion of
Hazardfunktion.
Diese für die Interpretation des untersuch­
ten Prozesses zentrale Funktion läßt sich - wieder für den
Intervallmittelpunkt
aus der Identität r(t)=f(t)/G(t)
)/2 (unter Berücksichtigung
und der Näherung G(t i)
(G +G
i
1+1
m
von (31) und (33) herleiten�)
(34)
dying")
1l
Um Mißverständnisse zu vermeiden, sei darauf
für das
daß r1 die Hazardrate oder
auf das Intervall,
i bezeichnet. Der Index i
nicht auf den Zustand. Gemäß unserer Vereinbarung in Kap.2
sind die zustände nicht indiziert, da die einfache Sterbeeinem Zwei-Zustands-Modell mit absorbierendem Zieltafel
entspricht.
- 66 -
- 67 Auch Formel
zur Schätzung der Hazardrate
Standardfehler von G , f , t . Zu diesen Schätzwerten werden
i
i
i
in SPSS und BMDP Standardfehler berechnet. Der Vollständig­
bestimmten Bedingungen ein ML-Schätzer.
keit halber geben wir hier die entsprechenden Formeln ohne
nahme einer stufenförmigen Hazardfunktion mit konstantem Wert
A bleitung an:
im Intervall
r
i
Schätzer ableiten
A
-
(36)
(37)
Var
var
(fi)
O\l
Gi
2
A
�
�
2
r.
J.
2
i-1
l:
j =1
{
_s_
n
z
j= 1 n
+
� ·P.
)
J
1-
n
sierten Zeiten im Intervall
Zeitpunkte etwa im Falle
:i_ .qi
und JOHNSON
und
j_qi
1975
("Green­
oder ELANDT-JOHNSON
Als Warnung sei vermerkt,
daß dadurch die
tatsächliche Varianz beträchtlich unterschätzt werden kann,
wenn der Anteil zensierter Beobachtungen groß ist.
sich daher,
Sind diese genauen
Daten nicht bekannt,
ersetzt (oder, äquivalent,
gleichverteilten Zeiten t
vall I
ij
i
daß alle Zeiten auf den Intervallmittelpunkt fallen),dann gilt:
2)
siehe GROSS und CLARK
1980).
erstreckt.
wird dieses Informationsdefizit durch die Annahme von im Inter­
Diese Formeln gelten allerdings nur näherungsweise
wood-Formel",
der folgende ML[a ,b ) lä!t sich f�r r
i
i
i
1980).
(KALBFLEISCH und PRENTICE
wobei sich die Summation im Nenner über alle exakten und zen-
i-1
n
ist unter
Unter der Modellan­
{38)
·Pj
j
{34)
bei der Auswertung das
''Zeitpattern"
Es empfiehlt
(39)
und damit:
(40)
von zensier­
ten und exakten Beobachtungen im Auge zu behalten.
In BMDP
wird diese Vorgangsweise graphisch unterstützt.
Die hier angegebenen, in BMDP und SPSS realisierten Schätzer,
mögen recht heuristisch erscheinen.
Tatsächlich lassen sie
sich unter allgemeinen Voraussetzungen als Maximum-Likeli­
hood-Schätzer
(ML-Schätzer}
herleiten und damit wahrschein­
lichkeitstheoretisch rechtfertigen.
die
exakten Beobachtungen
Unter der Annahme,
(also die Sterbefälle)
daß
in jedem
Zeitintervall exponentialverteilt und die zensierten Beob­
achtungen
(wie oben angenommen)
ben sich
und
und JOHNSON
1980).
gleichverteilt sind, erge-
als ML-Schätzer
(siehe ELANDT-JOHNSON
was gerade wieder der oben a ngegebene Life-Table-Schätzer ist.
Für die Uberlebensfunktion und die Dichte der Ankunftszeiten­
verteilung ergeben sich hier aber andere Ausdrücke
KALBFLEISCH und PRENTICE
1980).
(siehe
- 69
- 68 -
Ein einfaches Berechnungsbeispiel mag die Vorgangsweise ver­
anschaulichen.
Wir gehen von folgenden beobachteten Zeiten
{in Tagen) aus, wobei ein
"+" hinter einer Zahl andeutet, daß
die entsprechende Beobachtung zensiert ist:
19, 21,21+,24.
3,4,7+,10,13+,14,
Bei einer Gruppierung in Wochen enthält die
folgende Tabelle Zwischen- und Endergebnisse der Berechnung
nach der Life Table-Methode:
d.
n.
1
1
[o, 7)
[7' 14)
2
10
8
[14,21)
5
2
3
2
Tabelle 3:
n'.
c.
].
l
0
10
2
7
0
5
2,5
Gi
i
0,80
1,00
0,029
0,86
0,80
i\
0,20
0, 14
0,40
0,60
0,80
0,20
(28) bis
(34)
geschätzten Varianzen mit den Formeln
0,69
0,41
0,016
0,035
0,047
0,032
0,022
0,071
o, 190
ten und zensierten Beobachtungen dient.
Zeit sowie eine
In BMDP ist die Un­
( "withdrawn",
etwa durch
etwa durch in der Versuchsplanung nicht vorgesehe­
nes Ausscheiden einzelner Individuen vor dem Ende der Unter­
suchungsperiode)
möglich, aber ohne Einfluß auf die Schätz­
werte.
:::::'.'.:E:::'!:!:S�:'.2��.::._��s_���:2.'.:l.:..:��L...��I.11���
Angabe von Beginndatum und Enddatum,
nachzurechnen und die
(35),
(36)
und
(37)
zu
Wie
im
Falle der
Monat, Jahr)
und Scheidungsdatum
z.B.
Beiratsdatum
(Tag, Monat,
(Tag,
Jahr).
Mit diesen Daten werden die oben angeführten Schätzwerte und
deren approximative Standardfehler berechnet,
außerdem der
(interpolierte) Median der Lebenszeit, bei BMDP zusätzlich
das erste und dritte Quartil sowie die dazugehörenden Stan­
Programmbeispiele mit SPSS und BMDP
dardfehler.
Der oben beschriebene Life-Table-Schätzer ist sowohl in BMDP
(DIXON et al.1981) als auch in SPSS 8
in NIE und HULL
(Programmbeschreibung
1978 sowie BEUTEL, KUEFFNER und SCHUBOE
1983)
wobei in beiden Fällen drei verschiedene Rohdaten­
strukturen verarbeitet werden können:
Life Table:
zu jedem Individual­
bzw. zensierte
Ankunftszeiten, aber statt der Angabe der Dauer erfolgt die
ermitteln.
verfügbar,
(survival time as input):
statusvariable angegeben, welche der Unterscheidung von exak­
("lost",
Dem Leser sei empfohlen, zur Übung einmal die Werte in der
3.2.2.
Ankunftszeiten
fall werden die Ankunftszeit
das Ende der Untersuchungsperiode) und ungeplanter zensierung
Beispiel einer Sterbetafel
Tabelle mit den Formeln
SPSS ist die.se Datenstruktur praktisch identisch mit einer ge­
wichteten Version der Ankunftszeiten -Datenstruktur.
terscheidung zwischen geplanter
gi
-
Zu einer gewählten
BMDP beliebig,
Zeitintervalleinteilung
{in
in SPSS mit Einschränkung beliebig - vorzugs-
weise konstante Intervallängen) werden die c
und
angegeben
i
(bei BMDP optional auch n , was an sich überflüssig ist). In
i
Für die explorative Phase von großer Wichtigkeit
sind die verfügbaren Plot-Optionen für die graphische Dar­
stellung.
Überlebensfunktion und deren
Logarithmus, Hazard­
rate und Dichte der Lebenszeiten sind in beiden Programm­
paketen verfügbar.
Die in BMDP zusätzlich enthaltene kumula­
tive Hazardfunktion ist bis auf das Vorzeichen mit der loga­
rithrnierten Überlebensfunktion identisch
in Kap.2).
Wie bereits erwähnt, werden in
(siehe Formel
(17)
BMDP auch die zeit­
lichen Muster von exakten und zensierten Beobachtungen aus­
gedruckt und können so als Indikator für die Zuverlässigkeit
der geschätzten Werte dienen.
-
-
70 -
71 -
Als konkretes Beispiel soll die Auswertung von Ladendieb­
Diskutieren wir zunächst das Rechenbeispiel mit dem BMDP-Programm.
stahlsdaten dienen. Die Zeitintervalle entsprechen hier
Die gewählte Methode geht aus dem Programmaufruf P1L
(vollendeten)
Altersjahren beim ersten
Ladendiebstahl bzw.
Zum Zeitpunkt der Befragung, wenn kein Diebstahl begangen
wurde
(zensiertes Datum).
Jede
(logische) Lochkarte des Da­
teninputs enthält bei BMDP die
Information über ein solches
Alters- Zeitintervall:
Beginnzeitpunkt
(der Endzeitpunkt
IS LIFE
hervor.
Für
jedes Zeitintervall werden die Werte der
drei Variablen AGE,DEAD und WD
wobei AGE dem In­
tervallbeginn, DEAD der Anzahl der Gestorbenen
welche in diesem Alter
begehen), WD der Anzahl der
und d . Die zusätzliche
Angabe der
ist mög­
i
i
lich, hier aber redundant. Bei SPSS sind für jedes Intervall
noch keinen Ladendiebstahl begangen haben und
bis zu
zwei Lochkarten anzugeben.
exakte Beobachtungen gibt,
Sofern es im Intervall
eine Lochkarte mit Intervallmit-
telpunkt, Status "exakt" und
Falls es zensierte Beob-
Zensierten
der Befragung dieses Alter hatten)
(=Individuen, welche
entspricht.
zum
funktion und deren Logarithmus, die Hazardfunktion und die
vom Programm graphisch dargestellt werden. Dateninput:
erste Datenkarte z.B.
vallmittelpunkt, Status "zensiert"
ginnenden
ersten
besagt, daß
(=Ladendiebstahl) und O
Für das gleiche Beispiel lau­
tet das SPSS- Programm:
TITLE IS
/INPUT
VARIABLES ARE 3.
FORMAT IS
'ANWENDUNGSBEISPIEL LADENDIEBSTAHL'.
'(3F5.0)
'
Runbeispiel SPSS
16
.
/VARIABLE
NAMES ARE AGE,DEAD,WD.
RUN NAME
/FORM
INTERVAL IS AGE.
INPUT MEDIUM
CARD
NDEAD IS DEAD.
N OF CASES
UNKNOWN
/ESTIMATE
ANWENDUNGSBEISPIEL LADENDIEBSTAHL
NWITH IS WD.
VARIABLE LIST
AGE,
METHOD IS LIFE.
WEIGHT
WEIGHT
INPUT FORMAT
FIXED
SURVIVAL
TABLES=AGE/
PLOTS ARE SURV,LOG,HAZ ,DEN.
/END
STATE,
WEIGHT
(F5.1,2F5.�J
4.
1.
o.
INTERVALS=THRU 36
5.
2.
o.
STATUS=STATE(1)
6.
6.
o.
Daten
Die
in dem im Zeitpunkt 4.0 be­
(und laut 2.Datenkarte im Zeitpunkt 5.0 endenden)
Zeitintervall ein Todesfall
Zensierungen beobachtet wurden.
/PROBLEM
Zeitpunkt
Die tlberlebens­
Dichtefunktion des Alters beim ersten Ladendiebstahl sollen
achtungen gibt, eine zweite Lochkarte ebenfalls mit Inter­
und c . Die Intervall­
i
länge wird bei SPSS im Progranun festgelegt.
(=Individuen,
zum ersten Mal einen Ladendiebstahl
wird durch den Beginn des darauffolgenden Intervalls defi­
niert), c
("Life
Tables and Survival Functions") und aus der Anweisung METHOD
PLOTS/
BY 1/
FOR AGE/
- 73 -
- 72 -
READ INPUT DATA
4.5
1.
§
o�w-NMN��o�o��-o
ooo�--�--MNMNNNM
0000000000000000
1.
5.5
1.
2.
6.5
1.
6.
�
Daten
•
daß
zu berechnen sind,
Zeitpunkt 36
in gleich lange
�w
���
�
Life-Table-Funktionen für die
„
•
�
„
„
•
•
„
g
•
•
•
„
•
•
•
g
„
·
·
·
·
·
·
·
·
·
·
�
·
·
wobei die Zeitskala bis
b'i
zum
Zeitintervalle der Länge 1
·
·
·
·
·
·
�
„
·
·
·
.
.
.
.
.
.
.
.
.
.
.
.
.
.
�
.
.
.
.
.
.
.
.
"
•
•
•
•
•
•
•
•
.
•
•
.
•
•
•
•
•
•
•
•
•
•
•
•
.
liegt also im Intervall
(Plots)
�
•
„
•
•
•
•
·
·
�
·
·
�
·
�
.
.
.
.
.
.
�
.
•
•
•
.
.
•
•
•
000000000�00000000000000000000000
•
•
•
�
•
•
"
•
•
•
•
•
•
•
•
•
•
•
„
„
•
„
•
•
•
•
„
•
•
•
•
•
O �N���Mro�-N�-��--�--���m�m�w��w�w
0��--�NNroOO�M�����N00�0�roro��NNNNNN
0�ro�M��-��OONOO�M00��mN-�����������
O����rororo���������MMMMMNNNNN.----�-
Fälle
[35,36)).
mit Statusvariable STATE=1 sind exakte Beobachtungen,
anderen Fälle sind zensiert.
g
•
8������������0��8��gg��oggg�ggggg
80000000000
OOQNNMN�M-OO�MM-MOMNON-�
zu
(die größte beobachtete Zeit entspricht einem
Alter von 35 Jahren,
g
��ON��
oo�
o
oo
M�o��o
eo�
o
oo
00000-ooooNOOOOO
•
g���������������g��o;��oooogggggg
8��ro 8888 oooooo
NMMN���N-����oro�
888000000---ocoooooooo-oooo�ooooo
•
Darstellungen
•
(wobei die Variable WEIGHT das
variable AGE
unterteilen ist
•
��MW0N��-NMMMMM�MMM����-��������
oo��NNNNMMM�MM����MMM�����������
00000000000000000000000000000000
Die dem "Control Word" SURVIVAL folgen­
den Informationen besagen,
•
§
als würde es sich um gewich­
.
Gewicht darstellt).
•
��0
FINISH
tete Individualdaten handeln
'
0
-NO�N0WWM -�NO�M
0N
� §§80�88888
- --g��
0----�-N-----N
88000000000000g0g000000
00000000
·
Die Verarbeitung erfolgt hier so,
�
alle
•
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
�
�
.
.
.
.
.
. .
.
.
Alle verfügbaren graphischen
sind anzufertigen.
Im Datenteil wurde
jede Altersangabe einheitlich auf den entsprechenden Inter­
vallmittelpunkt
(4.5,
5.5 usw.)
verlegt.
Da beide Programmpakete im wesentlichen dieselben Informatio­
nen liefern,
beschränkt sich die im folgenden angeführte Er­
gebnisbesprechung auf
SPSS-Resultate
schied ist lediglich zu beachten,
daß
(Tabelle 4).
000000000000000000000000000000000
.
Als Unter­
nicht auf den Beginn,
.
.
.
.
�
.
.
.
.
.
.
.
.
N-M
�M
also auf den Beginn des nach­
folgenden Intervalls beziehen.
Numerisch sind die berechneten
Bei der Auswertung der Ergebnisse sind vor allem die Plots
von Hazardfunktion und kumulativer Hazardfunktion bzw.
und
.
loga­
.
.
.
. .
.
�
.
..
.
.
.
.
�
.
�
.
.
.
.
.
,,,
.
.
.
.
.
.
.
.
.
���N��-�-��roM-���Mm�roNoo-m�W�M--­
MMMMN--O�W�MN-m��W�MNN.­
NNNNNNNN,,.--..-..-.-..-
•ri
0
Werte bis auf Rundungsfehler völlig identisch.
rithmierter Überlebensfunktion von Nutzen,
oooooooooooooo�oooooo�o�mmooo�oom
sondern
auf das Ende des betreffenden,
blick auf Entwicklungstheorien,
�
sich bei SPSS - im Ge­
gensatz zu BMDP und den oben angeführten Formeln - die ("cumula­
tive proportion of surviving")
.
-Nw�ro��row��m���
N��
.
°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.
��o�OroN���M-M
Nr
�����������������������������qq��
���N�����M�OOM�-o�roMNO�OMO����N--­
MMMMN�-o�oo�MN-O������NN-­
NNNNNNNN-t-...-....:--.-,,.-
zwar im Hin­
welche ein vom Alter unab-
������°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.��qqqqq
M������O�N�����ro�O-NM����oo�O-NM��
----------NNNNNNNNNNMMMMMM
-
74 -
-
75 -
r(t}
0,4
I
I
I
1
l
1
l
1
I
1
0,20
<V
.<:
0
"1
·.-l
s
:5
0,10
I
l
l
1
0,05
I
0,02
1
I
1
11 11 1 111 1
1
II 111 1
1
I•-- -----+----_:__4 ----- --+- ---- - -+ ---- ---+--- ---- +- --- ---+---- ---+-------+-------t I
0,01
I
0
I
1
1
1 1
I
4
8
Abbildung 8;
12
16
20
24
28
Beispiel Ladendiebstahl,
32
36
Hazardrate
40 t(Jahre)
oder fallendes
ersten Fall
("negative aging")
(r konstant)
Risiko postulieren.
Im
zu
Die aus den Laden­
diebstahlsdaten geschätzten Ergebnisse legen ein zuerst bis
des Risiko nahe.
30
12
Jahren zunehmendes, dann abnehmen­
Die hohen Werte der Hazardrate bei 25 bzw.
Jahren sollten unter Berücksichtigung der oben ausgespro­
chenen Warnung nicht äberinterpretiert werden.
1 1l
l l
l
I
l
I
I
l
1
I
l 1 1 1
I
I
1
I
l
1
I
1
I
I
I
I
I
1
1
I
I
I
I
1
I
I
l
I
I
I
I
l
I
I
!
!
l
l
1
I
l
I
!
I
l
I
I t-- - --- - t--- ----+-- - ----+-- -----1"-- ---- -+-- ---- -+- -----• ---- ---+-- - ---- t-- -- ----tl
4
8
12
16
24
20
28
32
36
40
Der Verlauf
9:
Beispiel Ladendiebstahl,
Logarithmus der Über­
der logarithmierten Überlebensfunktion erlaubt eine Untertei­
wäre ein linearer verlauf der loga­
bei positivem Altern ein nach unten, bei negativem
zu einem Höhepunkt bei
l
l
I
I
I
I
I
lebensfunktion (SPSS)
("positive aging"J
Altern ein nach oben gekrümmter Verlauf.
1
1 l
(SPSS)
rithmierten Überlebensfunktion (mit negativem Anstieg -r)
erwarten,
l
I
l
I
l
0
Abbildung
hängiges, ein mit dem Alter steigendes
1l 1
I
·ri
k
nl
Ö'
0
r-1
1
I
0,0
nj
r-1
nj
..'><
<Jl
I
1
l
1
I
l 1
l
1
l
1
l
1
l
I
I
1
!
I
I+-------+-------t--- ____.,.___ - -- -+- - -- --�+-------+--- -- --+-------+-------+----- --tI
ll 1 1 1 l l l 1
l
I
1
l l l
I
11
!
l
l
!
1
I
l
1
l l
l
l
11
1
1
1
I
1
I
l
l
o, 1
0,50
I
1
1
1
1
I
I
1
1
1
I
l
1
I
I
I
I
I
I
I
1
I
l
l
I
0,2
1,00
1
I
I
I
0,3
G(t)
I+-------+-------+-------+-------i-------+---��--+------�+�-----�+-------+-�-----+1
l
I
I
1
I
I
I
lung des Lebenszyklus in vier Phasen:
zendes,
ein allmählich einset­
dann relativ konstantes Risiko in der Kindheit
zum Alter von etwa 10
Jahren),
wieder abnehmendes Risiko in der Pubertät
und
15
Jahren),
(bis
ein stark zunehmendes, dann
(etwa zwischen 10
ein wiederum relativ konstantes Risiko in der
nachpubertären Entwicklung
(bis etwa 20 Jahre)
rasch auf O zurückgehendes Risiko danach.
und ein recht
t
- 76
-
-
Nicht vergessen werden sollte hier allerdings,
daß diese In­
geht diese Probleme.
77 -
Im Falle großer Stichproben kann es
terpretation auf der Annahme einer homogenen Population be­
a1-lerdings bei der Benutzung von Computer-Programmen Schwie­
ruht,
rigkeiten mit der Rechenzeit und dem Speicherbedarf geben.
und daß nicht beobachtete Heterogenitäten die Form der
geschätzten Hazardfunktion maßgeblich beeinflussen.
schnell einsieht,
stante,
Wie man
wird selbst eine für jedes Individuum kon­
aber individualspezifische Hazardrate zu einer abneh­
menden geschätzten
(Gruppen-)
Hazardfunktion führen,
da zu­
Die nach ihren Erfindern auch Kaplan-Meier-Schätzer
und MEIER
Idee,
1958)
durch immer feinere
erst die Individuen mit hohem Risiko ausscheiden und mit zu­
Intervalle)
nehmendem Alter nurmehr die Individuen mit geringem Risiko
jedes
übrigbleiben.
Ohne zusätzliche Informationen ist die Unter­
auch gar nicht möglich.
anzunehmen,
3.4.
auch ANDRESS
zwi­
3.3.1. Product-Limit-Schätzformein
Wir werden in Abschnitt
und in den folgenden Kapitein darauf
einer soziologischen Anwendung der
Wenn die Intervalleinteilung derart ge­
sind Life-Tab1-e- und Product-Limit-Schätzwerte
also
etwa bei Männern und Frauen unterschied1-ich ist und auch
schen sozialen Schichten variiert.
(aber möglicherweise mehrere Beobachtungen/Zensierungen zu
tatsächlich auch identisch.
daß das Verlaufsmuster der Hazardfunktion von
Sozia1-isations- und Entwicklungsbedingungen abhängt,
in der
Zeitintervall_ nur mehr höchstens eine beobachtete zeit
wählt wird,
Im vorliegenden Fall ist durchaus
Zeiteinteilungen, (in immer kleinere
sch1-ießlich zu einer Situation zu kommen,
dieser Zeit) enthält.
scheidung zwischen Lebenszykluseffekten und Heterogenität
(KAPLAN
genannte Product-Limit-Methode beruht auf der
zurückkommen
Die Beobachtungen werden nach aufsteigenden Zeiten geordnet,
(zu
Life-Table-Methode siehe
wobei davon ausgegangen wird,
daß nicht zu ein und demselben
Zeitpunkt sowoh1- Todesfäl1-e als auch Zensierungen auftreten
1982b).
{sollte das trotzdem der Fall sein,
wird die
Zensierung ais
"etwas später eintretend" betrachtet). Bei genügend feiner
3.3.
Zeiteinteilung befindet sich dann in jedem Intervall höch­
stens ein Beobachtungszeitpunkt,
zu dem entweder nur Todes­
Die Life-Tab1-e-Methode kann auch bei der Auswertung von Indi­
fälle oder nur
zensierungen
vidua1-daten mit exakten Zeitangaben von Nutzen sein,
Notwendigkeit,
wie im letzten Abschnitt die Risikomenge um
besonders dann,
und
zwar
wenn der Stichprobenumfang sehr groß ist.
Bei
der Einteilung der Zeitachse in Intervaiie wird man sich in
Intervalle,
in denen Todesfälle auftreten,
etwa Tagesdaten in Wochen- oder Monatsintervalle gruppieren.
erst kürzere,
kann aber auch eine Einteilung in
dann längere Intervalle zweckmäßig sein.
terschiedliche Intervalleinteilungen führen
unterschiedlichen Schätzergebnissen,
jedoch i.a.
Un­
zu
und die dadurch auftre­
tenden Ungenauigkeiten können sehr stören.
Der bei nicht zu
großen Stichproben vorzuziehende Product-Limit-Schätzer um-
Damit entfäl1-t die
einen Anteil der zensierten Fälle zu reduzieren.
diesem Fall wohl an allgemein übliche Aggregate ha1-ten und
Wie schon oben erwähnt,
auftreten.
für alle anderen Intervalle:
Für alle
gilt dann:
- 78 -
- 79 -
Wegen der Diskontinuitäten der Überlebensfunktion ist es
und für die Überlebensfunktion:
(44)
G(tl"'
lI
p.
ilt.<t l.
l.
wobei hier wegen
{43)
gebildet werden muß,
il
nicht sinnvoll, eine Hazardfunktion zu schätzen,
"Hazardkomponenten"
TI
Zeitpunkte,
das Produkt nur über jene Zeitpunkte
zu denen Todesfälle auftreten. Die For­
)
mel für die Varianz von G(t) wird asymptotisch 1
(KALBFLEISCH
und PRENTICE
1980):
FLEISCH und PRENTICE
(46)
Var(ln
schrieben,
G{t) sind aber asymptotisch
�
Varianz
{siehe KALB-
G(t))
Graphische Checks,
(45) Var(G(t))
-In
und
Hazardrate R(t)=
i
äquivalent mit
�
wohl aber
r1=d /n
für die Sprungstellen, d.h. die
i
i
zu denen Todesfälle auftreten. Die kumulative
wie am Ende des letzten Abschnitts be­
sind natürlich ebenfalls möglich.
T;otz der - mo­
�ellimmanenten - Diskontinuitäten lassen sich R(t) und - ln
Im Grenzübergang bei immer feinerer Zeiteinteilung - und dar­
um geht es beim Product-Limit-Schätzer - fallen für die In­
tervalle, in denen Todesfälle auftreten, Intervallbeginn und
Beobachtungszeitpunkt zusammen, und b�zum nächsten Zeitpunkt,
in dem ein Todesfall auftritt,
bleibt G(t)
konstant.
Die mit
der Product-Limit-Methode geschätzte Überlebensfunktion ist
also eine Stufenfunktion mit Sprüngen
zu denen ein
Todesfall
obachtete Zeit zensiert ist,
blem auf,
zu jenen Zeitpunkten,
beobachtet wurde.
tritt dabei
Falls die größte bedas Pro-
daß die geschätzte Überlebensfunktion G(t) nicht
gegen 0 strebt.
In diesem Fall ist es üblich,
G(t) für alle
Zeitpunkte nach der größten beobachteten exakten Todeszeit
als nicht definiert zu betrachten.
G{t) so wie früher interpretieren.
Ein steiler Verlauf dieser
Funktionen entspricht einer großen Neigung zum Wechsel,
flacher Verlauf einer geringen Neigung.
ein
Der Product-Limit-Schätzer hat einige recht angenehme stati­
stische Eigenschaften.
Er kann als Maximum-Likelihood-Schätzer
hergeleitet werden und liefert unter relativ allgemeinen Be­
dingungen über den Zensierungsmechanismus asymptotisch nor­
malverteilte Schätzer (siehe etwa KALBFLEISCH und PRENTICE
1980).
Damit lassen sich Konfidenzintervalle für G(t) be­
stimmen (für ein festes t),
G(t)±1,96
'0f
ar (�(t))•
1
etwa ein 95 %-Konfidenzintervall
Mit Hilfe der in BMDP ebenfalls be­
rechneten Standardfehleri{Var (G(t ))' können für die exakt
i
beobachteten Zeitpunkte t1 solche Konfidenzintervalle leicht
berechnet werden.
1)
"Asymptotisch" heißt hier und im
chen - für "große" Stichproben. In
Praxis
man die entsprechenden Formeln bzw. Teststatistiken so
als ob sie exakt gelten bzw. exakt mit der asymptotisch�n
Verteilung (meist x2- oder Normalverteilung) übereinstim­
men würden. Bei kleinen Stichproben muß man dabei aller­
dings Ungenauigkeiten in Kauf nehmen.
Es
kann natürlich vorkommen,
daß ein derart berechnetes Kon­
fidenzintervall negative Werte oder Werte
>1
enthält. Da G(t)
eine Wahrscheinlichkeit darstellt, ist ein solches Ergebnis
nicht sinnvoll.
Es läßt sich aber durch eine geschickte Trans­
formation von G(t) vermeiden.
Für den interessierten Leser
- 80 -
führen
- 81
wir die entsprechende� Formeln hier an. Die log­
minus-log Transformation von G(t)
besitzt die asymptotische Varianz:
d
2
; (t)
�
G(t)
r
i
i l t.<t n. (n.-d )
2
l.
l.
l.
i
ni-di
2
log(
)
n
i [ t <t
i
i
[
1
r
%-Konfidenzintervall:
�
exp(±1,96s(t))
(t)
(49)
zur Product-Limit-Methode
3
10
0, 10
0 ,90
1,00
4
9
0,11
0,89
0,90
7
0, 14
0 ,86
0 ,80
5
0,20
0,80
o,69
4
0,25
0, 7 5
0,55
3
0,33
0,67
0,41
1,00
o,oo
0,27
7
0
10
1
13
0
14
Nach Rücktransformation ergibt sich für G(t) das folgende
95
Rechenbeispiel
log(-log G(t))
(47) V(t)
(48)
Tabelle 5:
-
19
21
1
0
21
24
*) 1=exakte, o�zensierte Beobachtung
1)
Dieses nimmt nur zulässige Werte zwischen O und 1 an.
Für
die Bestimmung simultaner Konfidenzbänder für die gesamte
Zeitachse (also nicht nur für einen festen Zeitpunkt t ) sind
z.B.
G ( 14)
10-1
2..:..1 11=..l> =
0,69
(
)(
)
7
9
10
3.3.2.
.
allerdings recht kompl·izierte Berechnungen notwendig (siehe
etwa HALL und WELLNER 1980).
In BMDP
sind entsprechende
Routinen leider nicht implementiert,
Auch hier soll ein einfaches Beispiel mit den zehn Beobach­
tungen in Abschnitt 3.2.1. die Berechnungen veranschaulichen
(vgl. dazu Tab.5).
Der Product-Limit-Schätzer ist in BMDP implementiert (in SPSS
bis Level 8.0 nicht).
Die Beobachtungen werden nach
den Zeiten geordnet und einzeln :
zunehmen­
Zeile für Zeile - mit dem
dazu berechneten Schätzwert für G(t) und dessen Standardfeh­
ler ausgedruckt. Für große Stichproben empfiehlt es sich da­
her, diesen Teil des Ausdrucks
zu unterdrücken (NO PRINT).
Für die gesamte Stichprobe werden die mittlere Überlebens­
zeit sowie Median, erstes und drittes Quartil berechnet. Die
graphische Darstellung von Uberlebensfunktion und deren Loga­
l)
x
Statt der Schreibweise e
für die Exponentialfunktion
verwenden wir
auch exp{x), um die Lesbarkeit der
Formeln zu
rithrnus bzw.
nicht
kumulierter Hazardrate kann angefordert werden,
jedoch - aus den oben angeführten Gründen - die Hazard­
funktion und die Dichte der Ankunftszeit.
- 82 -
- 83 -
Als Anwendungsbeispiel betrachten wir die Auswertung von In­
Das Programm für unser Beispiel lautet:
dividualdaten zur Dauer von Arbeitslosigkeit. Die Stichprobe
entspricht im vorliegenden Fall einer Kohorte, also einem
Sample von Erwerbstätigen, welche in einem bestimmten
Zeit­
raum arbeitslos wurden. Das Ereignis "Tod" ist hier durchaus
erfreulich:
wird.
es besagt,
daß der Betreffende wieder beschäftigt
Ein hoher Wert der Hazardrate
(hohes "Todesrisiko")
entspricht also einer hohen Chance, wieder beschäftigt zu
werden. Zensierungen entstehen bei unseren Daten dadurch,
/PROBLEM
TITLE IS
/INPUT
VARIABLES ARE 7.
/VARIABLE
NAMES ARE ENTDAY,ENTMONTH,ENTYEAR,
/FORM
ENTRY IS ENTMONTH,ENTDAY,ENTYEAR.
F ORMAT IS
Es sind aber auch andere
RESPONSE IS 1 •
/ESTIMATE
Buch
zwar nicht behandelt werden, aber trotzdem nicht über­
sehen werden
sollten:
die Beziehungen zwischen dem untersuch­
ten Prozeß und dem Zensierungsmechanisrnus. Es ist sicher
leicht einzusehen, daß
ein Zensierungsschema, nach dem Indi­
viduen genau dann aus der Studie entfernt
(also zensiert wer­
den), wenn ihr Todesrisiko besonders groß
(oder klein)
zu verzerrten Schätzwerten führen muß. Streng
METHOD IS PRODUCT.
NO PRINT.
nach längerer erfolgloser Suche diese Meldung unterläßt. Das
letzte Beispiel weist auf Probleme hin, welche in diesem
·
STATUS IS STATE.
Zensierungsursachen denkbar, z.B.
beitsamt gebunden ist, und der betreffende Arbeitssuchende
'
TERMINATION IS TERMONTH,TERDAY,TERYEAR.
endet.
wenn die Beobachtung an eine regelmäßige Meldung beim Ar­
'(3F2.0,1x,3F2.0, 1x,F1.0)
TERDAY,TERMONTH,TERYEAR,STATE.
daß die Beobachtungsperiode zu einem festgesetzten Zeitpunkt
(zu dem einzelne Befragte noch arbeitslos sein können)
'ANWENDUNGSBEISPIEL ARBEITSLOSIGKEIT'.
PLOTS ARE SURV,LOG.
/END
180279 220379
20 0279
0 10379
Daten
270279 310879 0
ist,
genommen wäre
hier eine sorgfältige Modellierung der Wechse lwirkungen zwi­
Neben den selbsterklärenden Anweisungen METHOD IS PRODUCT
und NO PRINT sind im Vergleich zum BMDP-Beispiel in 3.2.2.
schen untersuchtem Prozeß und Zensierungsmechanismus erfor­
die Anweisungen ENTRY IS
derlich, dafür sind in der Literatur allerdings kaum Vor­
Paragraphen neu. Sie besagen, daß die Daten chronologische
schläge zu finden.
Für uns sollte als Anhaltspunkt ausrei­
chend sein, daß etwa bei "random censoring"
derartige
Prcblerre
Zeiten
(Kalenderzeiten)
•
.
.
und TERMINATION IS
darstellen,
und
(Jahr)
•
im FORM­
ausgedrückt wird,
daß
(Monat),
nicht auftreten. Ein solches Zensierungsschema liegt beispiels­
ENTDAY.
weise dann vor, wenn für
Beendigung der Arbeitslosigkeit bzw. Zensierung analog durch
jedes Individuum a priori eine feste
ENTYEAR
•
zwar in der Form,
das Eintrittsdatum durch die Variablen ENTMONTH
(Tag) ,
•
das Datum der
Zensierungszeit gewählt wird, oder wenn Individuen über einen
TERMONTH, TERDAY und TERYEAR. Die Daten der
bestimmten Zeitraum hinweg zufällig in die Studie aufgenommen
B. gehören zu einem Arbeitslosen, der am 18.2.1979 arbeits­
werden und die Beobachtung zu einem festgewählten Zeitpunkt
los wurde und am 22.3.1979
abbricht.
den hat.
Beide Arten sind für sozialwissenschaftliche Unter­
suchungen durchaus typisch.
1. Lochkarte
z.
wieder eine Beschäftigung gefun­
- 85 -
- 84 -
G(t)
(109-Skala)
•*·· • ,;-. • • ,+ .
Sprung nach unten, was einem kurzfristig wirksamen, aber
• • t., • • + • • • . T • •
,.t. • • .+ • • ,
.+. , , •'*'·
•·i'·, .,+ . . , ,:t-, . ,.+ . . , .+ • • . . T,, • •
t.
deutlichen Anstieg der !lbergangsrate
(aus der Arbeitslosig­
keit in ein Beschäftigungsverhältnis)
1 ,ooo
entspricht.
Die bei­
den anderen Termine sind nicht so deutlich ersichtlich.
der Nähe des
o,so o
Knick,
12-Wochen-Termins hat die Log-Kurve
wobei sich die tlbei::gangsrate
(=Anstieg der Kurve)
geschätzt auf die Hälfte reduziert.
rung einer
Notstandshilfe kommen
jedoch, daß nach 46=20+26
lativ
0,050
O
grob
Für das Ende der Gewäh­
je nach der Arbeitslosen­
geld-Bezugsdauer sogar drei Termine in Frage.
o, 100
In
einen
Auffallend ist
Wochen die llbergangsrate
wieder re­
hoch ist, nachdem sie unmittelbar vorher praktisch auf
zurückgegangen ist.
Natürlich können auch hier Verweildauereffekte durch Kova­
riateneinflüsse überlagert werden.
0,010
Om diese
0,005
1)
Untergliederung der gesamten Population nach geeigneten
Kriterien in homogene Subgruppeni
0
120
360
240
480
Abbildung 10: Beispiel Arbeitslosigkeit,
lebensfunktion
600 t (Tage)
der Ergebnisse
logarithmierte Über-
(Hypothesentests,
zu behalten.
•
Nullhypothese:
Subgrup­
in Bezug auf die Über­
Diese Vorgangsweise wird im folgenden
Abschnitt erläutert.
zweckmäßig, die We­
senszüge des österreichischen Arbeitslosenversicherungsge­
setzes im Auge
lebensfunktion)
(BMDP)
Bei der Auswertung der Ergebnisse ist es
Schätzen der entspre­
chenden Funktionen in den einzelnen Gruppen und Vergleich
pen unterscheiden sich nicht z.B.
besteht
Effekte zu tren­
nen bieten sich im wesentlichen zwei Vorgangsweisen an:
Ein Anspruch auf Arbeitslosengeld
(bei Erfüllung weiterer Bedingungen)
für einen Zeit­
2)
Variation der Hazardrate in Abhängigkeit der Kovariate.
Dieser Vorgangsweise entsprechen die in den nächsten
beiden Kapiteln beschriebenen Regressionsmodelle.
raum, der je nach der Dauer der vorhergehenden versicherungs­
pflichtigen Beschäftigung
12, 20 oder 30 Wochen beträgt.
Bei
Erschöpfung dieses An spruchs kann für maximal weitere 26 Wo­
chen eine Notstandshilfe gewährt werden,
Bedingungen erfüllt sein müssen.
wobei aber weitere
Der 20- und der 30-Wochen­
Termin sind im PLOT der logarithmierten Uberlebensfunktion
deutlich ausgeprägt:
zu beiden
Zeitpunkten gibt es einen
Im ersten Fall genügen dafür zwar grundsätzlich doppelt
nach der
zeit und nach der Untergruppe gruppierte Daten.
(d.h.
In
der Regel wird man sich aber auch hier auf Individualdaten
stützen, welche neben der Ankunftszeit noch Informationen
über die den untersuchten Prozeß beeinflussenden Kovariaten
enthalten.
- 86 -
- 87 -
3.4.
züglich der Anzahl aller mit Gewißheit kleineren Überlebens­
Subgruppen
zeiten ist.
"Mit Gewißheit"
soll dabei bedeuten,
daß· nur
zweifelsfrei entscheidbare Größenunterschiede zu berück­
Beim Vergleich von Subgruppen liegt es nahe,
die oben be­
sichtigen sind.
schriebenen Verfahren für jede Untergruppe durchzuführen. So­
Bei zwei zensierten Beobachtungen z.B.
die Feststellung,
ist
welche der beiden dazugehörenden Lebens­
wohl SPSS als auch BMDP sehen diese Möglichkeit, vor und er­
zeiten größer ist,
lauben insbesondere die simultane graphische Darstellung der
ten und einer exakten Beobachtung, welche größer ist als die
Ergebnisse. Damit können gruppenspezifische Unterschiede im
zensierte.
Verlauf von Überlebensfunktionen,
Hazardrate usw.
nicht möglich,
ebenso bei einer zensier­
auf einen
Blick erfaßt werden.
Der Score-Wert einer Beobachtung kann also als ihre Ordnungs­
nummer
(Rang)
interpretiert werden,
wobei kleine Zeiten einem
Wünschenswert ist darüber hinaus natürlich auch die Verfüg­
hohen Rang,
barkeit von Teststatistiken mit
wenn sich die Gruppen nicht unterscheiden,
(zumindest asymptotisch)
be­
kannter Verteilung,
um bei einem gewählten Signifikanzniveau
2
etwa analog zur Varianzanalyse oder�urn x -Test die Nullhypo­
große Zeiten einem niedrigen Rang entsprechen.
sollte die Ver­
teilung der Ränge auf die verschiedenen Gruppen ungefähr
gleich sein.
these identischer Uberlebenswahrscheinlichkeiten testen zu
können.
Unter der Annahme identischer Überlebensverteilungen (Null­
hypothese)
sowie gleicher Zensierungsmuster in allen Gruppen
Die gebräuchlichen nicht-parametrischen Testverfahren benüt­
lassen sich Erwartungswert und Varianz der gruppenspezifi­
zen Rangordnungsstatistiken und sind im wesentlichen Modifi­
schen Scoresummen berechnen, und die davon abgeleitete Test­
kationen von Rangordnungstests für vollständige
statistik:
zensierte)
(d.h.
nicht­
Daten. Dabei werden alle beobachteten Zeiten der
Größe nach geordnet,
Ränge auf die einzelnen Untergruppen ist die in die Test­
statistiken eingehende Information.
•
(50)
j=1
k
j
2
(
uij) /n
j
i=1
�
n.
i:J u
i=1
ij
2
/ (n-1)
Sub­
n -Fälle umfaßt, bei einem
j
Gesamtstichprobenumfang n=n1+n +
+n . In jeder Unter­
k
2
gruppe werden die Beobachtungen der Größe nach geordnet.
wobei die Gruppe Nr.j
•
E
E
j�1
Im a llgemeinen Fall zerfällt die Stichprobe in k(k<:2)
gruppen,
k
die Verteilung der dadurch gewonnenen
•
ist asymptotisch
mit k-1
Im verallgemeinerten Savage-Test
Für den verallgemeinerten Wilcoxon-Test (Gehan-Breslow-Test)
wird für jede beobachtete Zeit ein
obachtung Nr.i in der Gruppe Nr.j)
"score" U
(für die Be­
ij
ermittelt, welcher gleich
der Anzahl aller mit Gewißheit größeren tlberlebenszeiten ab-
Freiheitsgraden. Dieser
Test ist sowohl in SPSS als auch in BMDP realisiert.
Test)
(Mantel-Cox-Test, Log-Rank­
wird zu jedem Todeszeitpunkt die unter der Nullhypo­
these zu erwartende Verteilung der Todesf�lle auf die k Sub­
gruppen berechnet und der beobachten Verteilung gegenüber­
gestellt.
Eine gewichtete Quadratsumme der Differenzen beob­
achtete-erwartete Verteilung dient als Teststatistik.
- 88 -
und d
die Anzahl der einen Todeszeit­
Wir bezeichnen mit n
i
i
erlebenden bzw. zu diesem Zeitpunkt sterbenden In­
t
punkt
i
die
und d
dividuen in der ganzen Stichprobe sowie mit n
ij
ij
entsprechenden Anzahlen in der Subgruppe Nr.j. Wenn die Uber­
lebensfunktionen in allen Subgruppen identisch sind
hypothese),
89 -
-
(Null­
dann werden sich die Todesfälle im Mittel propor­
der dem Risiko ausgesetzten Individuen n
ij
ist
auf die Subgruppen aufteilen. Der Erwartungswert von d
ij
daher
tional zur Anzahl
Anzahl der Subgruppen ist).
TARONE und WARE
(1977)
zeigen,
daß
sich beide Tests nur in der Gewichtung der Beobachtungen un­
terscheiden,
konkret:
daß sich auch die Gehan-Breslow-Test­
statistik als Summe von Differenzen beobachtete minus erwar­
tete Häufigkeiten darstellen läßt,
n
1
tet.
allerdings mit der Anzahl
erlebenden Individuen gewich­
der einen Todeszeitpunkt
Statt der oben angegebenen Differenzen v
i
werden also
die gewichteten Differenzen
(51) w
ij
und deren Varianz-Kovarianz-Matrix in der Teststatistik verUnter der Nullhypothese hat also die Differenz beobachtete­
wendet.
n.
l.
erwartete Todesfallhäufigkeiten
t ,
1
Da für kleine beobachtete Zeiten
das zugehörige
relativ groß ist verglichen mit großen beobachteten Zeiten
bedeutet das,
��_..':!:�_:!.��;..!:.';��!.!!.§!����.:::!��
sensitiv auf Unterschiede zu Beginn des Prozesses reagiert,
der Log-Rank-Test eher auf Unterschiede gegen das Ende de�;
Prozesses.
den Erwartungswert o.
Unter Benützung der hier nicht ange-
führten Varianz-Kovarianz-Matrix
Teststatistik
läßt sich die
von v
i
Falls die Hazardfunktionen in verschiedenen Unter­
gruppen proportional sind,
besitzt der Log-Rank-Test asymp­
totisch sogar volle Effizienz.
Die Eigenschaften der beiden
Tests sind in Tabelle 6 zusammengefaßt.
wenn sich gruppenspezifische
Überlebensfunktionen schneiden,
können beide Tests zu irreführenden Ergebnissen führen.
bilden,
welche asymptotisch
ist.
Da bei Summation
über die Gruppen die Anzahl der beobachteten gleich der An­
zahl der erwarteten Todesfallhäufigkeiten ist,
der Freiheitsgrade
Gruppen.
lauf der geschätzten gruppenspezifischen Uberlebensfunktio­
nen mitberücksichtigt werden.
um eins kleiner als die Zahl der
Für nähere Details verweisen wir auf die weiterfüh­
rende Literatur,
LAWLESS
(k-1}
ist die Zahl
Bei
der Interpretation der Testergebnisse sollte daher der Ver­
etwa KALBFLEISCH und PRENTICE
(1980)
oder
(1982).
Die Annahme identischer
kritischen Würdigung.
treffend sein,
Zensierungsmuster bedarf noch einer
Sie wird insbesondere dann nicht zu­
wenn das Auftreten ungeplanter Zensierungen
(lost cases) mit dem Subgruppenkriterium korreliert.
Die beiden hier vorgestellten Teststatistiken sind also
2
asymptotisch x -verteilt mit k-1 Freiheitsgraden {wobei k die
Wenn
etwa in einem klinischen Versuch mit Kontrollgruppe und Ver-
-
90
-
-
suchsgruppen,
Verallgemeinerter
Verallgemeinerter
Wilcoxon-Test
Savage-Test
scheiden,
-
welche sich durch Behandlungsintensität unter­
infolge unangenehmer oder schmerzhafter Behandlung
in unterschiedlichem Umfang Ausfälle aus dem Untersuchungs­
programm auftreten,
ist eine Korrelation
und Zensierungen gegeben.
Synonyme Bezeichnungen
91
zwischen Subgruppe
Wenn es ferner bei
pen von Arbeitslosen häufiger vorkommt,
bestimmten Grup­
daß infolge Entmuti­
gung eine weitere Meldung am Arbeitsamt unterbleibt,
Gehan-Breslow-Test
Mantel-Cox-Test
Log-Rank-Test
die obige Annahme ebenfalls nicht gerechtfertigt
Nachprüfung ist dabei nicht immer leicht möglich,
Test hat sich der folgende
eher sensitiv bei fol­
genden Alternativhypothesen
"Trick"
bewährt:
Eine
aber als
Durch ein gegen­
seitiges Vertauschen der Statusausprägungen "exakt"
siert"
wird
sein.
und "zen­
können mit denselben verfahren die Ankunftszeitenver­
teilungen der zensierten Zeiten in jeder Gruppe geschätzt
G(t)
G(t)
werden.
Wenn sich diese nicht sehr unterscheiden,
wird man
die Annahme konstanter Zensierungsrnuster getrost akzeptie­
ren.
Bei nur wenigen
zensierten Fällen gibt es ohnedies kaum
Probleme.
Als Anwendungsbeispiel greifen wir noch einmal auf unsere
Ladendiebstahldaten
zurück,
wobei die an sich gruppierten
Ankunftszeiten als individuelle Beobachtungen jeweils
Altersjahresmitte interpretiert werden.
t
zur
In diesem Fall be­
handeln wir also die Ladendiebstahlsdaten als individuenbe­
zogene Zeitpunkt-Daten.
Wie
schon erwähnt,
lassen unter­
schiedliche Entwicklungs- und Sozialisationsbedingungen
Software-Realisierung
einen unterschiedlichen Verlauf
warten.
BMDP
BMDP
SPSS
Tabelle 6:
Nicht-parametrische Tests für Subgruppenvergleich
bei Männern und Frauen er­
-
Runbeispiel BMDP
- 93
G(t)
(Programm P1L)
/PROBLEM
TITLE rs
/INPUT
VARIABLES ARE 3.
FORMAT IS
/VARIABLE
92 -
.
... . , • . + • • , . + . ' . . • . .
+.
.
'ANWENDUNGSBEISPIEL LADENDIEBSTAHL'.
lt
0, 75
TIME IS AGE.
RESPONSE IS 1 •
0,50
METHOD IS PRODUCT.
F
- Fff
-f
Kf
Hf
H FFf
f
H
H ffF
IM<
Fff
lt
Fff
fff
f
H
M
f
fffff
II
fff
fffffffff
F
f
F
'(F4.1,2F3.0) '.
NAMES ARE AGE,STATE,SEX.
. >t-. . . . ... . . . t. ' .. +.' . . .... . ..... . .t . . ................ + . • • • + • • • . +.
tfffffffffffMiH
fFFFfFF
l<ll f ffff
-f
M fff
HHHHf
fffff
1,00
STATUS IS STATE,
/ESTIMATE
' .
-
GROUP IS SEX.
PLOTS ARE SURV,LOG.
-
STATISTICS ARE BRESLOW,MANTEL.
/GROUP
F
MMMF
CODES (3)ARE 0,1.
NAMES
f
-
-ffffffffffffffffff
0,25
II
II
H
-
(3) ARE FRAUEN,MAENNER.
/END
4.5
0
5.5
1
Daten
o,oo
.+ . • . . + . • • ·*"·
0
Überlebensfunktionen
kommen:
1) Im ESTIMATE-Paragraph
(SEX)
mit der die s ubgruppende­
vereinbart wird
die Anweisung STATISTICS ARE BRESLOW,MANTEL,
Merkmale
nungen
mit der
in dem die Subgruppen-definierenden
(Codes O bzw.
(FRAUEN,MAENNER)
1)
sowie dafür verwendete Bezeich­
festgelegt werden.
Die Anfangs­
buchstaben dieser Namen werden in den angeforderten Plots
verwendet.
die üblichen Berechnungen,
gegeben.
beide in BMDP verfügbaren Tests angefordert werden
2) Ein GROUP-Paragraph,
25
•• . . •+.
30
• • + . • • . + • • • ·'*·
35
40
t
geschlechtsspezifische
(BMDP)
Die Programmexekution liefert für jede der beiden Subgruppen
die Anweisung GROUP IS SEX,
finierende Variable
b)
10
' ·*' · · · .+ • • . .
20
15
Beispiel Ladendiebstahl,
Im vergleich zu den bisherigen Runstreams ist neu hinzuge­
a)
5
... + • • • • + • • • • +.
die Graphiken werden simultan aus­
Der Vergleich der Überlebensfunktionen zeigt, daß
-
von einer Ausnahme am Anfang abgesehen - die Uberlebenswahr­
scheinlichkeiten bei den Frauen durchwegs größer sind als bei
den Männern,
Männer,
daß also
Frauen im allgemeinen älter sind als
wenn sie zum ersten Mal einen Ladendiebstahl begehen.
Da sich die überlebensfunktionen in zunehmendem Alter wieder
annähern,
ist
zu erwarten,
daß
der Gehan-Breslow-Test stärker
anspricht als der Log-Rank-Test.
werden die Werte der
Für die
angeforderten Tests
entsprechenden Teststatistiken und die
- 94 -
- 95 -
zugehörigen Irrtumswahrscheinlichkeiten sowie die Zahl der
Freiheitsgrade ausgedruckt.
95
4.
Semi-parametrische Verfahren
Bei einem Signifikanzniveau von
% z.B. würde der Gehan-Breslow-Test zu einer Ablehnung der
Nullhypothese identischer Überlebensfunktionen führen.
Im Unterschied
zum vorhergehenden Kapitel ist Heterogenität
auch als kontinuierliche Variation entlang einer oder mehre­
rer Kovariatendimensionen
Test
Statistik
Einkommen
d.f.
4,67
0,031
verallg.Savage
3, 72
054
2)
Anzahl der Freiheitsgrade
=
•
)
(Alter, sozioökonomischer Status,
vorstellbar und - in Abhängigkeit davon - eine
so daß
idealtypisch jeder Kovariatenkonfiguration eine spezifische
Hazardfunktion entspricht.
kommen,
Um zu geeigneten Verfahren zu
ist es allerdings unumgänglich,
die Beziehungen zwi­
schen Kovariaten und dem untersuchten Prozeß
Anzahl der Gruppen -1
2
Restwahrscheinlichkeit der x -Verteilung
der Teststatistik
•
kontinuierliche Variation etwa der Hazardfunktion,
verallg.Wilcoxon
1)
•
zu
operationa­
lisieren.
(d.f.=1)
zum Wert
Dazu gibt es im wesentlichen zwei verschiedene Entwicklungs­
Tabelle 7:
Ladendiebstahlsstudie,
gleich Männer/Frauen
Testergebnisse beim ver­
linien:
Der erste,
in diesem Buch nicht weiter verfolgte An­
satz, spezifiziert Beziehungen
der Ankunftszeit
zwischen den Kovariaten und
(oder transformierten Werten davon)
und lei­
tet daraus Regressionsmodelle für unvollständige Beobachtun­
gen ab
{siehe etwa MILLER
ziert Beziehungen
tion.
1976).
Der zweite Ansatz spezifi­
zwischen den Kovariaten und der Hazardfunk­
Diese Beziehung kann vollständig
(siehe Kapitel 5)
oder
teilweise parametrisiert sein.
Der semi-pararnetrische Ansatz beruht auf der Modellannahme
eines allgemeinen, nicht weiter spezifizierten
(also nicht­
pararnetrischen) Verlaufsmusters der Hazardfunktion,
durch Kovariateneinfluß
welche
individuell modifiziert wird.
Die
Effekte der Kovariate werden demnach in parametrischer Weise
modelliert.
Der Vorteil der semi-parametrischen Verfahren ist in der
großen Flexibilität des Ansatzes
zu sehen.
tet sich ja das Hauptinteresse auf das
sal bedeutsamer Effekte zu ermitteln.
Sehr häufig rich­
Ziel,
die Stärke kau­
Mit den semi-parametri­
schen Verfahren ist es möglich, das Gewicht von qualitativen
- 96 -
oder quantitativen Kovariaten
- 97 -
Die beiden verbleibenden Annahmen (multiplikativer und log­
zu schätzen, ohne wie bei den
parametrischen Verfahren a priori Annahmen über die genaue
linearer Kovariateneinfluß)
mathematische Funktion der Verweildauerabhängigkeit zu tref­
dellrestriktionen dar.
fen.
Risiko eines Zustandswechsels unabhängig vom Zeitpunkt bei
4.1.
stellen noch zwei bedeutsame Mo­
Gemeinsam besagen sie,
Veränderung eines Kovariatenwerts
Das Proportional-Hazards-Modell von COX
satz erhöht bzw.
erniedrigt.
daß sich das
ei11en festen Prozent­
um
In einem konkreten Regressions­
beispiel kann das etwa bedeuten,
Im Proportional-Hazards-Modell von COX wird angenommen, daß
der Einfluß der Kovariate multiplikativ und log-linear ist,
d.h.,
daß bei gegebenen Kovariaten x=(x , ... ,x ) die indivi­
1
n
folgende Gestalt hat:
dual-spezifische Hazardfunktion r(t,x)
daß sich die Chance eines Arbeitslosen,
zu
werden,
mit
jedem
wiederbeschäftigt
zusätzlichem Altersjahr um einen fe­
sten Prozentsatz ändert
(in diesem Fall vermutlich verrin­
gert)
- daß sich diese Chance mit jedem zusätzlichen Ausbildungs­
wobei die "Baseline-Hazard-Function"
steht hier fUr Baseline
r0{t)
- der Index
jahr um einen festen Prozentsatz ändert
"O"
das nicht-parametrisierte Ver­
laufsmuster der Hazardrate darstellt und ß'=(ß ,
1
Parametervektor der Kovariateneinflüsse ist.
daß
,ß ) der
n
Die Bezeich­
.
•
•
- daß sich das Scheidungsrisiko mit
der Quotient zweier individual-spezifischer Hazardraten eine
Zeit abhänqige Konstante ist,
sich das Scheidungsrisiko mit jedem zusätzlichen Kind
um einen festen Prozentsatz ändert
nung "proportional hazard" erinnert an die Eigenschaft, daß
nur von den beiden Kovari.atenkonfigurationen,
und zwar unabhängig von der Dauer der Arbeitslosigkeit bzw.
Ehe.
Baseline-Funktion läßt sich damit als Hazardfunktion zu den
rate,
Kovariatenausprägungen x =o,x2=o,
1
nächsten Augenblick ein
wie man anhand von Gleichung
(55)
rung liegt der Wunsch zugrunde,
schätzen
(und testen)
jeder zusätzlichen DM
Haushaltseinkonunen um einen festen Prozentsatz ändert,
zifischen Hazardfunktionen zueinander proportional sind. Die
,x =O interpretieren,
n
erkennt. Dieser Modellie­
•
(vermutlich verringert)
nicht aber der
daß also alle individual-spe­
•
(in diesem Fall
vermutlich erhöht)
•
Kovariateneinflüsse B1,
.
•
.
,ß
zu können,
"Chance"
also
dingung,
n
oder "Risiko"
(näherungsweise)
steht hier synonym für die Hazard­
die Wahrseheinlichkeit,
daß im
Zustandswechsel eintritt unter der Be­
daß bis zu diesem Zeitpunkt kein Wechsel stattgefun­
den hat.
Einschränkend ist das Cox-Modell also nur in der Lage,
suchte Population rauß also in bezug auf
das Verlaufsmuster
der Baseline-Hazardfunktion homogen sein.
ser Homogenitätsannahme
Eine Lockerung die­
subgruppenspezifische Baseline-Ha­
eine
für
bestimmte Art des Kovariateneinflusses Richtung und
Größe dieses
Einflusses
zu bestimmen.
das Modell insbesondere dann,
Nicht zielführend ist
wenn dieser Einfluß
nicht eini­
zardfunktionen bei subgruppenunabhängigem Kovariateneinfluß -
germaßen monoton ist.
werden wir später beim geschichteten Cox-Modell untersuchen.
etwa bei Ehen mit sehr wenigen und sehr vielen Kindern rela-
Ist das tatsächliche Scheidungsrisiko
- 98
tiv gering,
- 99
bei einer mittleren Kinderzahl aber relativ groß,
-
die Rate bei einer Erhöhung von x
um eine Einheit unter Kon­
i
stanz der übrigen Variablen um 14 % sinken wird. a -Werte
i
größer als eins signalisieren dagegen positive Effekte auf
die Rate (zu einer a usführlichen Interpretation der Effekte
später im Rahmen des geschichteten Modells, welches ja eine
Modifikation für den Fall der Verletzung der Proportionali­
tätsannahme darstellt, einen graphischen Test kennenlernen.
siehe auch die Zusammenstellung in Abschnitt
wenn eine qualitative Variable mehr als
5.1.1 ).
2 Ausprägungen hat,
bleibt nichts anderes übrig, als wieder eine Basiskategorie
zu wählen,
für jede der anderen (Vergleichs-) Kategorien aber
Die J?..o:rlinearität des Einflusses hat die angenehme Eigen­
eine künstliche "Dummy-Variable"
schaft,
dann den Wert 1 erhält,
daß die individual-spezifische Hazardfunktion nicht
negativ werden kann
(was bei einer linearen Modellierung
nicht ausgeschlossen ist).
diese Kategorie fällt.
Sie erfordert allerdings zumin­
einzuführen, welche genau
wenn das betreffende
Individuum in
Andernfalls wird der Wert Null zugeschrie­
ben. Hat die Variable "Sozialrechtliche
Stellung"
etwa die
dest ein Intervallskalenniveau der Kovariaten mit mehr als
Ausprägungen Arbeiter, Angestellter und Selbständiger, und
zwei Ausprägungen. Die Aufnahme von qualitativen Kovariaten
wählen wir "Arbeiter" als Basiskategorie,
ist dann möglich und
"Dummy-Variable"
sinnvoll, wenn es sich um dichotome
Variablen handelt. In diesem Fall ist es zweckmäßig, eine
x
und
dann sind zwei
einzuführen,
wobei ein Arbeiter
Ang.
die Dummy-Werte (0,0), ein Angestellter (1,0) und ein Selb­
der beiden Ausprägungen als Basiskategorie zu wählen und mit
ständiger (0,1) erhält.
O zu codieren und die andere als Vergleichskategorie mit
wie oben relativ zur Basiskategorie interpretiert werden:
zu codieren.
Wird z.B.
die Variable Geschlecht mit O=männlich,
1=weiblich codiert,
ß
Ang
Die geschätzten ß-Werte können aber
bestimmt das Risiko eines Angestellten relativ zum Ar­
dann entspricht die Baseline-Hazardfunkß 0
tion wegen r(t,O)
( t).e 1 =r (t).
(t) genau der Hazard0
rate für Männer, während das "Risiko" (die Hazardrate) für
8 1
1
Frauen wegen r(t,1)/r(t,O)
(t).e 1 ;r (t)
=a
um 100 mal
1
0
8
(1-e 1) Prozent größer (bei negativem Vorzeichen kleiner) ist
beiter und ßs das Risiko eines Selbständigen wiederum rela­
als für Männer.
Konstruktion der Dummy-Variablen erfordert nicht nur
Bei kleinen Werten für a tbis etwa ß =0,1)
1
1
ist diese Prozentzahl nicht sehr verschieden von 100.ß , man
1
kann sich dann die obige Umrechnung ersparen.
Wenn im fol­
genden von den ß-Parametern im Exponenten die Rede ist,
sprechen wir auch von B-Effekten.
Die "Multiplikatoren"
bezeichnen wir dagegen als a-Effekte.
formieren die a-Effekte darüber,
so
Allgemein in­
daß bei einer Veränderung
der unabhängigen Variable x
um eine Einheit
1 sich die
i
Rate um 100(1-a ) Prozent verändert. Ein a -Wert kleiner als
i
i
eins, z.B. 0,86 besagt also, daß der Effekt negativ ist und
tiv zum Arbeiterrisiko.
Die Aufnahme von qualitativen Variablen mit vielen Ausprägun­
gen bringt eine Reihe von technischen Problemen mit sich.
Die
einen
mit der Anzahl der Kategorien steigenden Recodierungsaufwand,
sondern senkt auch die Zahl der Freiheitsgrade.
rufssystematik mit 2000 Berufen 1999
ieren
Aus einer Be­
Dummy-Variablen konstru­
zu· 'Wollen, ist wohl kaum zielführend.
Durch eine gleich­
zeitige Aufblähung der Parameterzahl wird die Auswertung der
geschätzten Ergebnisse schwieriger und ihre Aussagekraft ge­
ringer .Auch die Proportionalitätsannahme, die dem Modell zu-
100 -
-
grundeliegt, wird, wenn schon nicht weniger plausibel,
so,
101
-
ein Teil der (vollen) Likelihoodfunktion aller Beobachtungen
doch schwieriger nachzuprüfen sein. Sofern mit dem Untersu­
ist - daher die jetzt gebräuchliche Bezeichnung "Partial
chungsziel vereinbar,
kelihood" - und daß sich die aus der Maximierung von
ist eine weitgehende Aggregation der
qualitativen Merkmale zu empfehlen.
Li­
L(ß) er­
gebenden Schätzer vergleichbare asymptotische Eigenschaften
wie Maximuro-Likelihood-Schätzer haben,
4. 2.
also asymptotisch nor­
roalverteilt sind mit einer Varianz-Kovarianz-Matrix,
welche
durch die negative Inverse der Matrix der zweiten Ableitun­
Dieser Methode zur Schätzung der ß-Parameter liegt ursprüng-
gen von
1 ich folgende Idee zugrunde:
nen nicht nur die Parameter,
punkt t ein Todesfall
Individuen,
in der Risikomenge M(t)
welche zum
sind) eintritt,
Wenn zu einem bestimmten Zeit­
(das sind alle
Zeitpunkt t noch dem Risiko ausgesetzt
dann ist die bedingte Wahrscheinlichkeit,
daß
lnL(ß) konsistent geschätzt werden kann. Damit kön­
sondern auch deren
(asympto­
tische) Standardfehler berechnet und Signifikanztests durch­
geführt werden.
Für nähere Details verweisen wir auf die wei-
terführende Literatur (KALBFLEISCH und PRENTICE
1980)·
dieser Todesfall gerade ein bestimmtes Individuum iEM(t)
trifft,
Die Maximierung nur eines Teils der vollen
gerade
Likelihoodfunktion
bedingt natürlich einen gewissen Effizienzverlust
(56)
E
r(t,x(i))
r(t,x(j))
ß x(i)
/
e '
jEM(t)
E
jEM(t)
Standardfehler der Schätzwerte wächst) ,
ß x(j)
e '
tisch relevanten Fällen nicht sehr groß ist.
Da die partielle
Likelihood trotzdem noch eine verhältnismäßig komplizierte
Gestalt hat (insbesondere nicht-linear ist),
wobei x(i) die Kovariatenausprägungen des Individuums i ent­
hält.
(d.h. der
welcher aber in prak­
Durch die Proportionalitätseigenschaft kann bei der
benötigt man zur
Berechnung der Schätzwerte iterative Lösungsverfahren, welche
eine von Hand- oder Taschenrechnerberechnung selbst bei ein­
obigen Quotientenbildung die nicht-spezifizierte Baseline­
fachsten Modellen praktisch ausschließen.
Funktion r tl
stimmung der ß
anschließende Schätzung der Baseline-Hazard­
i
funktion gibt es mehrere Möglichkeiten, welche in der Regel
J
gekürzt werden.
cox•
Idee
(COX
1972,
1975)
bestand darin, analog zur Maximum-Likelihood-Methode das Pro­
Für die an die Be­
dukt dieser bedingten Wahrscheinlichkeiten über alle Todes­
Modifikationen von nicht-parametrischen Schätzern sind (d.h.
zeitpunkte t ,
1
die Kovariateneinflüsse werden berücksichtigt). Für den Fall,
• • •
,
zu bilden und dieses Produkt
daß alle geschätzten ß-Koeffizienten Null sind, ist z.B. der
(57) L(ß)
k
IT
i= 1
ß ' x(il
e
;
in BMDP verwendete Schätzer mit der Product-Limit-M ethode
o:
identisch.
ji::M
welches er ursprünglich "Conditional Likelihood" nannte,
eine
Likelihoodfunktion zu behandeln
wie
(im Falle von Bindungen,
also mehreren Todesfällen zu einem Zeitpunkt,
ist
L(ß) zu mo­
Die Berücksichtigung von
lich,
zeitabhängigen
Kovariaten ist mög­
erfordert aber eine erhöhte Aufmerksamkeit.
Wenn eine
solche Zeitabhängigkeit vorbestimmt ist oder zumindest vorn
difizieren). Obwohl sich diese Begründung als nicht richtig
untersuchten Prozeß nicht beeinflußt wird,
herausgestellt hat,
sonderen Probleme - außer möglicherweise einem erhöhten Re-
konnte später gezeigt werden, daß L(ß)
gibt es keine be­
- 102 -
- 103 -
codierungsaufwand und längerer Rechenzeit.
Beispiele für die­
sen Typ von zeitabhängigen Kovariaten (nach der Klassifika­
tion von KALBFLEISCH und PRENTICE (1980)
ten")
"externe Kovaria­
sind z.B. bei der Untersuchung von Arbeitslosigkeit
das Alter (vorbestimmt),
die wöchentliche oder monatliche
Unterstützungsleistung (durch Gesetz in Abhängigkeit von der
Arbeitslosigkeitsdauer vorbestimmt)
beitsmarktindikator,
oder ein geeigneter Ar­
welcher von der Wiederbeschäftigung
eines bestimmten Arbeitslosen praktisch nicht beeinflußt
wird,
flußt.
wohl aber dessen Wiedereingliederungschancen beein­
hingegen aber die Annahme
identischer Kovariateneinflüsse
für alle Schichten, bietet sich folgende Modifikation an:
(58)
(
r j) (t,x)
(j) (t)
.e11 'x
)
wobei j ein Schichtindex, r (j (t)
die nicht-spezifizierte
0
(
Baseline-Hazardfunktion in Schicht j und r j) (t,x)
die indi­
vidual-spezifische Hazardfunktion in Schicht
sogar reduziert wird.
portionalität geschichtet wird,
Zeitabhängige Kovariate können aber auch das Ergebnis eines
der von den untersuchten Individuen generiert
und nur solange beobachtet wird, als das
viduum am
ten") .
"Leben"
betreffende Indi­
und nicht zensiert ist ("interne Kovaria­
Bei�pielsweise wäre vorstellbar, daß eine Ehe vor ei­
ner eventuellen Scheidung mehrere Zustände durchläuft, und
daß ein geeigneter Ehezustandsindikator als Kovariate zur Er­
klärung des Scheidungsrisikos beitragen kann.
Da in diesem
Fall zweifellos eine wechselseitige Beziehung zwischen der
Bei der
che innerhalb der jeweiligen Schichten durchzuführen,
der Rechenaufwand i.a
.
Prozesses sein,
ist.
j
Bestimmung der partiellen Likelihood sind dabei nur Verglei­
wodurch
Falls trotz Pro­
ist allerdings mit einem Ef­
fizienzverlust zu rechnen, dieser ist aber in der Regel nicht
übermäßig groß (siehe etwa KALBFLEISCH und PRENTICE
1980).
Die Berücksichtigung von Schichten erlaubt einen einfachen
graphischen Check der Proportionalitätsannahme.
vermutet,
Wird etwa
daß die Baseline-Hazardfunktionen für Männer und
sind,
Frauen disproportional unterschiedlich
wir das Geschlecht
benutzen
als Schichtungskriterium und schätzen
im geschichteten Modell die Parameter ß.
der übrigen Kovaria-
Entwicklung des Ehezustands und dem untersuchten Eheauflä­
ten und die beiden schichtspezifischen Baseline-Uberlebens-
unumgänglich. KALBFLEISCH und PRENTICE (1980)
nahme zutrifft,also r
sungsprozeß besteht, ist eine Modellierung dieser Beziehung
schläge für eine vergleichbare Situation;
machen Vor­
die statistische
Inferenz bei internen Kovariaten ist aber noch recht unzu­
reichend erforscht.
funktionen (vgl.
Wenn die Annahme einer allgemeinen Baseline-Hazardfunktion
(wohl aber innerhalb abgegrenzter
"Schichten"
P,
und G 2\t) . Wenn die Proportionalitätsan­
�
2(t)=c.r
J
1\t)
mit der Proportionali­
dann gilt für die Baseline-Uberlebens­
Formel
(13)
in Abschnitt
. .3 ):
2 2
( )
G 2 (t)
0
und nach einer log-minus-log-Transformation:
Proportionalitätsannahme
Subgruppen, welche hier
GJ1tt)
tätskonstanten c>O,
(59)
4.3.
nicht gerechtfertigt ist
funktionen
1.
oder
"Strata" heißen) ,
(60)
ln -ln
[
12
h1 ]
=
ln c
+
ln
(
-ln
(1)
(t)
J
- 1 05 -
- 104 -
Das
Minus
zwischen den beiden logs ist notwendig, da G(t) nur
Werte zwischen O und
1 annimmt,
ln
G(t)
daher negativ
ist
Der Verletzung der Proportionalitätsannahme
und vor einer weiteren log-Transformation erst ins Positive
transformiert werden muß.
Wenn man
die
Frauen gegen die
Zeit aufträgt,
ler Verlauf der beiden Kurven
ist ein einigermaßen paralle­
(Distanz:
H1
so transformier-
ten geschätzten Baseline-überlebensfunktionen für Männer bzw.
ln c)
ein Indikator
dafür, daß die Proportionalitätsannahme zutrifft.
entspricht die
Alternativhypothese
:
ß
2
f 0
Diese können unter Benützung der asymptotischen Normalver­
teilung von ß 2 leicht getestet werden,
wie im folgenden Ab­
schnitt gezeigt wird.
Diese Mög­
lichkeit ist in BMDP vorgesehen und sollte in explorativen
4.4.
Studien bereits bei der Überlegung, welche Kovariaten ins
Modell
aufgenommen werden sollen,
genützt werden.
Aus den asymptotischen Eigenschaften der mit der Partial-Li­
kelihood-Methode berechneten Schätzwerte lassen sich
über den Umweg mit konstruierten zeitabhängigen Kovariaten
sind sogar Signifikanztests möglich;
nativen spezifiziert werden.
etwa sein,
dabei müssen aber Alter­
Eine solche Alternative könnte
tests für einzelne Parameter ableiten. Wird z.B.
die Null­
hypothese:
daß der Quotient der Baseline-Hazardfunktionen von
Männern und Frauen nicht konstant,
zumin­
dest für nicht zu kleine Stichproben einfache Signifikanz­
o (Kovariate Nr.i hat keinen
sondern proportional zu
Einfluß)
einer Potenz der Verweildauer ist, Bezeichnen wir das Geschlecht
mit x , eine neue zeitabhängige Kovariate x •ln t (t=Zeit)
1
1
mit
und die anderen Kovariaten mit x , ... ,x ,
3
n
und schätgetestet, d �nn ist ß /a
(wobei a
der geschätzte Standard­
i
i
i
fehler von ß ist) t-verteilt. Be
einem Signifikanzniveau von
i
95 % ist der kritische Wert für ß /a
für den beidseitigen
i
i
Test bei größeren Stichproben 1.96, bei einem Signifikanzni­
zen wir das Modell:
�
(61 ) r(t,x)
so erhalten wir bei der x -codierung männlich=O,
1
weiblich=1
die folgenden schichtenspezifischen Hazard-Funktionen:
Männer:
r(t,x)
Frauen:
r(t,x)
veau von 99
%
sind dies
2,58.
Als Faustregel geht man häufig
davon aus, daß jeder geschätzte Parameter
betragsmäßig zumin­
dest doppelt so groß sein sollte wie sein Standardfehler.
8
ß l
t
(t)e 1e 2 n
=r
0
ß x3+
e 3
•
•
•
+ßnxn
Dieser Test bietet allerdings nur einen sehr groben überblick,
da er immer nur die Signifikanz eines einzigen Parameters be­
ß
(t)e 1
Wir erhalten darnit die gewünschte Alternative.
u rteilt.
Der Propor­
tionalitätsannahme entspricht die Nullhypothese
einzeln
Wenn der '.liest für mehrere
für sich
genommen
Parameter
die Annahme
der
jeweils
Nullhypo­
these zuläßt, ist der Schluß, daß diese Parameter auch ge­
meinsam keinen Einfluß haben,
nicht gerechtfertigt.
- 106
-
-
Für den Fall, daß der simultane Einfluß einer Gruppe von Ko­
variaten getestet werden soll,
schlägt LAWLESS
Möglichkeiten vor:
(1)
(1982)
drei
I(ß) die negativ genommene Matrix der zwei­
ten Ableitungen der logarithmierten Partial-Likelihood­
Funktion ist (WALD). Der Test auf der Basis der varianz­
Kovarianzmatrix ist eine Verallgemeinerung des Tests auf
Signifikanz eines einzelnen Einflusses.
(2)
Tests
auf der Grundlage von Likelihood-Ratio-Statistiken
(vgl. Abschnitt
Als Spezialfall kann natürlich getestet werden,
5.1 .3 )
mit x2
2[1n
L(B)
In L(B*J],
wobei L(ß) die maximale Partial-Likelihood im vollen Mo­
dell ist, L(B*) die maximale
geschränkten Modell,
Partial-Likelihood im ein­
welches man durch Weglassen der
testenden Kovariaten erhält (LRATIO).
zu
daß alle
B-Koeffizienten Null sind.
dem Score-Test entsprechende globale
und mit der
(3) Tests,
welche auf den
"Score-Vektoren"
U(ß)=(<l ln L(BJ/aß l
i
basieren. In großen Stichproben können diese Scores eben­
falls als normalverteilt mit Erwartungswert 0 und Varianz­
Kovarianzmatrix I(ß) !
betrachtet werden (SCORE).
Klammer angeführten Stichwörter sind die in BMDP verwendeten
Bezeichnungen.
Die Eigenschaften dieser Tests bei der Anwen­
dung in der Survival-Analyse sind zwar noch recht wenig er­
forscht, der Vergleich der
Teststatistiken mit der x2-vertei­
lung (Freiheitsgrade=Anzahl der zu testenden Parameter) dürf­
te im allgemeinen aber gerechtfertigt sein.
wenn dieser Test - was in der Regel
kann daraus aller­
(Goodness
dings noch keineswegs auf die Güte der Anpassung
achtete
of fit) geschlossen werden, da ja noch nichtbeob
He­
verletzt sein
terogenität vorliegen oder eine Modellannahme
KALBFLEISCH
kann. Für die Beurteilung der Anpassung schlagen
und PRENTICE
(1980)
einen einfachen graphischen Check vor.
Für das Individuum Nr.i mit Ankunftszeit t1 definieren wir
das
"Residumn"
e
i
folgendermaßen:
'x(i)
r (c)dt
wobei R (t) die kumulierte Baseline-Hazardfunktion
0
0
wenn
wir
wir,
für die Residuen erhalten
ist. Schätzwerte �
i
Werte
en
geschätzt
l
in die obige Gleichung die im Cox-Model
t
·
gungen x(i) ein­
für R (t ) und ß sowie die Kovariatenausprä
i
0
sfunktionen
Uberleben
setzen. Für die individual-spezifischen
(13) in AbG(t.,x(i))gilt folgende Beziehung (siehe Formel
i
Alle drei Möglichkeiten sind in BMDP vorgesehen, die oben in
berechnet
wohl zu erwarten ist - positiv ausfällt,
die Idee, daß sich bei Hinzunahme nicht signifikanter
Einflüsse der maximale Wert der Partial-Likelihood­
also die Nullhypothese,
In BMDP wird dazu eine
Ko­
x2-verteilung (Freiheitsgrade�Anzahl aller
variaten) verglichen.
Dahinter steckt
Funktion nur unwesentlich erhöhen sollte.
ob die durch
die Kovariaten beschriebene Heterogenität überhaupt einen Ein­
fluß auf die Uberlebensverteilung hat,
ß wird als normalverteilt betrachtet mit Erwartungswert ß
und varianz-Kov�rianzmatrix I(B) 1 , wobei die "Informa­
tionsmatrix"
107 -
schnitt
.2.3.):
2
(63) G(t 1x(i)) = e
i
exp(ß 'x (i))
= e
Betrachtet man die e
als transformierte Zeiten
i
folgt:
,
so
-
Die t
*
-
108 -
sind also exponentialverteilt mit konstanter Hazard-
i
rate 1.
Dies müßte
die Gültigkeit der Modellannahmen voraus­
gesetzt - auch für die geschätzten
Die Gültigkeit
gelten.
der Modellannahme und damit auch die Güte der Anpassung kann
also dadurch überprüft werden,
daß man untersucht,
ob die
tatsächlich aus einer Exponentialverteilung mit der Hazard­
rate
1 stammen.
werden nach erfolgter Schätzung des Cox-Mowobei exakten
berechnet,
dells die Residuen
Zeiten exakte
Residuen,
zensierten Zeiten zensierte Residuen entsprechen.
Zu diesen
Residuen
aufgefaßt
nunmehr als neu definierte "Zeiten"
t
�
l.
kann jetzt mit einer der im vorigen Kapitel be-
schriebenen nicht-parametrischen Methoden die dazugehörige
kumulative Hazardrate geschätzt werden.
*
1.
Ein Plot,
t;n
Methoden geschätz
gen die "Zeit" t
in dem diese - mit nicht-parametrischen
- kumulierten Hazardraten der Residuen ge­
d.h.
,
gegen die aus dem Cox-Modell ge­
schätzten Residuen selbst aufgetragen werden,
muß bei zu­
treffenden Modellannahmen eine Gerade mit dem Anstieg 1 er­
geben.
Weicht die Darstellung deutlich davon ab,
das ein sicheres Zeichen dafür,
sind.
dann ist
daß Modellannahmen verletzt
In BMDP ist dieser graphische Check verfügbar.
ner Variablen behilflich sein,
Modell aufzunehmen sind.
welche letztendlich in das
Zu diesem
Zweck sind zwei unter­
schiedliche Arten schrittweisen Vorgehens gebräuchlich
thode
welche der Kovariaten als nächste in das Modell auf­
zunehmen ist bzw.
ELANDT-JOHNSON
("Step-Up")
und JOHNSON
1980).
(siehe
Bei der ersten Me­
geht man von einem Modell ohne Kovariaten
- in späteren
Schritten - aus dem Modell
Ausscheiden
auszuscheiden ist.
Dazu sind für Aufnahme bzw.
Grenzwerte für die
Irrtumswahrscheinlichkeit festzulegen.
Unter allen Aufnahmekandidaten wird die Kovariate mit der
günstigsten Statistik
(=kleinster p-Wert)
für die Aufnahme
unter allen Ausscheidungskandidaten analog dazu
die Kovariate mit der ungünstigsten Statistik
Wert)
setzt,
(=größter p­
ausgeschieden. Diese Prozedur wird so lange
fortge­
bis es keine Aufnahme- und Ausscheidungskandidaten
mehr gibt,
bis also bei allen Kovariaten im Modell der p-Wert
kleiner als die vorgegebene p-Grenze für das Ausscheiden und
bei allen nicht aufgenommenen Kovariaten der p-Wert größer
als die vorgegebene Grenze für die Aufnahme ist.
("Step-Down")
Bei der
geht man spiegelbildlich dazu
von einem Modell mit allen Kovariaten aus und reduziert bzw.
erweitert analog. Step-Up- und Step-Down-Ergebnis müssen
nicht identisch sein,
außerdem kann die Verwendung einer
anderen Teststatistik auch ein anderes Ergebnis bringen,
ebenso die Wahl unterschiedlicher p-Grenzen.
Stepwise Re­
gression ist lediglich eine Hilfe bei der Modellkonstruktion,
eine fundierte Theorie über die Variation von Überlebensver­
teilungen kann sie gewiß nicht ersetzen.
modifizierbare Step-Up-Verfahren
statistiken)
verfügbar.
In BMDP sind zwei
(mit unterschiedlichen Test­
Mit zunehmender Anzahl von Kovaria­
ten-Kandidaten kann der Rechenaufwand allerdings recht groß
werden.
Die oben beschriebenen Tests können auch bei der Auswahl je­
etwa
Tests,
zweiten Methode
Gemäß der Überlebensfunktion G(t ) erwarten wir für die Hai
zardrate einen Wert von eins uhd für die kumulierte Hazard­
*
rate
eine Gerade mit dem
in Abhängigkeit von der "Zeit" t
Anstieg
aus und entscheidet schrittweise aufgrund eines geeigneten
ausgewählt,
Zu diesem Zweck
109 -
Stepwise-Regression sollte deshalb nur mit entspre­
chender Sorgfalt durchgeführt werden.
110 -
4.5.
- 111
Anwendungsbeispiel Arbeitslosigkeit mit dem Programm BMDP
muß,
ist aber die Proportionalitätsannahme
mit zu entscheiden,
Die Dauer der Arbeitslosigkeit oder Chance,
spiegelbildlich
wieder eine Beschäftigung zu finden,
los von vielen Bestimmungsgründen beeinflußt.
die
wird zweifelIndividuelle
zu testen und da­
ob die einzelnen Variablen als Kovaria­
ten oder als Schichtungsmerkmale in das Modell aufzunehmen
sind.
Zu diesem
Zweck wird abwechselnd eine der Variablen
als Schichtungsmerkmal aufgefaßt
(wobei Alter und die Höhe
Charakteristika
wie Alter, Geschlecht,
der letzte
der Arbeitslosenunterstützung geeignet gruppiert werden) ,
ausgeübte Beruf,
die Höhe der bezogenen Arbeitslosenunterstüt­
die restlichen Variablen als Kovariaten.Das resultierende
zung werden eine Rolle spielen,
ren wie die Arbeitslosenquote,
Ausbildung,
-
ebenso Arbeitsmarktindikato­
das Verhältnis Arbeitssuchende
zu offenen Stellen oder Regionalindikatoren.
solcher
Stehen sehr viele
zusätzlicher Informationen zur Verfügung,
fiehlt es sich,
stimmen,
dann emp­
geschichtete Cox-Modell wird geschätzt,
durch Vergleich der
schichtspezifischen log-minus-log-Über­
lebensfunktionen.
in einer ersten Phase jene Variablen zu be­
welche letztlich in das Regressionsmodell aufgenom­
Wir demonstrieren diese Vorgangsweise am Beispiel des Alters,
men werden. Dabei sind die nicht-parametrischen Verfahren von
welches in Gruppen bis
Kapitel 3 sicher von Nutzen.
Jahre
rauf zu achten,
Bei der
Auswahl ist auch da­
daß hoch korrelierende unabhängige Variablen
nicht gemeinsam in das Modell aufgenonunen werden. Wenn
die variablen Beruf
z.B.
(mit den Ausprägungen Produktionsberuf/
Dienstleistungsberuf)
stellter)
und soziale Stellung
(Arbeiter/Ange­
im Extremfall in der Stichprobe so verteilt sind,
daß es nur Arbeiter in Produktionsberufen und Angestellte in
Dienstleistungsberufen gibt,
Aussicht,
dann besteht natürlich keine
ist es aber durchaus
zweckmäßig,
mehrere Modellvarianten zu
terschiedlich sein kann.
ten Arbeitslosendaten entfällt allerdings diese Phase,
Stellung,
10 Jahren haben,
ist bei Gültigkeit
warten,
daß die log-minus-log-Darstellung der Gruppen-Über­
lebensfunktionen:
a)
parallel verlaufen
b)
monoton angeordnet sind,
d.h.
Altersgruppe ist die unterste,
die Kurve für die jüngste
die Kurve für die zweit­
jüngste Altersgruppe ist die nächste usw.,
von oben nach unten,
c)
der Abstand
aber in derselben
oder umgekehrt
Reihenfolge,
zwischen der untersten und der nächsten Kurve
gleich groß ist wie zwischen dieser und der übernächsten
Kurve usw.
Im vorliegenden Fall der .bereits im letzten Kapitel benütz­
jeder der vier verfügbaren Kovariaten Alter,
26-35,36-45,46-55 und über 55
Da die Gruppenmittelpunkte etwa
der Proportionalitätsannahme in bezug auf das Alter zu er­
Bei hoch korrelierenden Variablen
schätzen, d a die Erklärungskraft solcher Variablen sehr un­
25,
zusammengefaßt wird.
konstante Abstände von
sowohl einen Berufs- als auch einen Sozialstellungs­
effekt schätzen zu können.
von
und der Test auf
Proportionalität erfolgt - wie oben beschrieben - graphisch
da
soziale
Geschlecht und Höhe der Arbeitslosenunterstützung
ein Einfluß auf die Dauer der Arbeitslosigkeit erwartet wer­
den kann. Da die Wirkung nicht zwangsläufig proportional sein
Der entsprechende BMDP-Runstream sieht folgendermaßen aus:
- 113 -
- 112 -
Runbeispiel BMDP
Im Vergleich zu den früher angeführten BMDP-Runstrearns
(Programm P2L)
gibt
es folgende Neuerungen:
/PROBLEM
TITLE IS
/INPUT
VARIABLES ARE 11.
CUTPOINTS, welche die Gruppengrenzen definieren,
FORMAT IS '(3F2.0,1x,3F2.0,1x,F2.0,1x,F1.0,1x,
ben. Bei qualitativen Variablen - Geschlecht, Kategorie -
F1.0,1x,F8.0) '.
würden wir wieder wie in 3.4.
/VARIABLES
'PROPORTIONALITAETSTEST'.
NAMES ARE ENTDAY,ENTMONTH,ENTYEAR,TERDAY,
TERMONTH,TERYEAR,STATE,AGE,CAT,SEX,PAY.
/FORM
a) Im
c) Die Steuerung für den graphischen Output erfolgt nicht
STATUS IS STATE.
wie im Programm P1L (nicht-parametrische Verfahren)
RESPONSE IS 1
ESTIMATE-Paragraph,
•
CUTPOINTS
(8)
NAMES (8)
ARE
im
sondern in einem eigenen PLOT-Para­
graph.
ARE 25.0,35.0,45.0,55.0.
'-25','26-35','36.-45','46-55','5 6-'.
Bei der Exekution des Runstreams werden die Parameter der
Kovariaten Geschlecht, Soziale Stellung, Arbeitslosenunter­
/REGRESSION COVARIATES ARE CAT,SEX,PAY.
/PLOT
CODES-Statements verwenden.
men der Kovariaten und des Schichtmerkmals an.
UNIT IS DAY.
/GROUP
angege­
b) Der REGRESSION-Paragraph ist völlig neu und gibt die Na­
ENTRY IS ENTMONTH,ENTDAY,ENTYEAR.
TERMINATION IS TERMONTH,TERDAY,TERYEAR.
GROUP-Paragraph wird die Gruppenzusammenfassung durch
STRATA IS AGE.
stützung und die um diese Effekte bereinigten altersgruppen­
TYPE IS LOG.
spezifischen Uberlebensfunktionen berechnet. In der gegen­
wärtigen Phase interessieren uns nur die letzteren.
/END
Ihr Ver­
180279 220379
28
5276.
lauf nach der log-minus-log-Transformation ist in Abbildung
200279 010379
24
4657.
dargestellt. Dabei wurden für jede der drei Kovariaten deren
270279 310879 0
55 0
0
5012.
Mittelwert in der gesamten Stichprobe eingesetzt. Die jüng­
Daten
ste Altersgruppe ist mit A dargestellt, die
35-jährigen mit B usw., die
Bei einer Geschlechts-Codierung O=weiblich,
1=männlich und
einer Sozialstellungs-Codierung O=Arbeiter,
1=Angestellter
entspricht der
erste Fall
12
einem männlichen, 28-jährigen
Gruppe der 26-
Gruppe der über 55-jährigen mit E.
Etwa während des ersten Monats gibt es einige Irregilari­
täten und Uberschneidungen, welche nicht unbedingt den Pro­
portionalitätsbedingungen entsprechen. Von der E-Gruppe ab­
Angestellten, welcher am 18.2.1979 arbeitslos wurde (die so­
gesehen, sind die
ziale Stellung bezieht sich auf die letzte Tätigkeit vor der
füllt:
Arbeitslosigkeit), eine Arbeitslosenunterstützung von
gleichsweise höheren Chance für junge Arbeitslose entspricht,
öS 5.276,- bezog und am 22.3.1979 wieder eine Beschäftigung
wieder beschäftigt zu werden) , darunter liegt die Kurve der
fand.
B-Gruppe usw. Die einigermaßen konstante Differenz
je
Bedingungen nachher aber recht gut er­
die oberste Kurve gehört zur A-Gruppe (was einer ver­
zwischen
zwei benachbarten Kurven entspricht der für zehn zusätz­
liche Altersjahre geminderten Chance, wieder eine Anstellung
zu finden.
-
2
114
- 115
-
.+ • . . . T . • • • t . . , .t . . , .+.
.+
+
, ..
t... ·*·
aber nicht mehr lo:r--linear mit dem Alter verbunden ist,
... T •
MAMA
AAAA.AJ.A
eaaA"'CC
BBBeBBBCBB"'CCC
MAAA
BBBBa
CCCCCC
EEEE
AAAMAM
ß6Sat\ßS8ßBBaS
CC:CCCCDD""'•""""lll""u
CC"'"'""U[,ED""'EE
B8BßB8ii
AAAA
einer Alters-Dummy-Variablen
-
-5
-6
dem Wert 1
(mit dem Wert O für die
für die über
55-jährigen)
abschätzen.
bis
Durch
diese Vorgangsweise werden auch Verzerrungen bei der Parame­
terschätzung vermieden.
Auf analoge Weise wird die Proportionalitätsannahme bei den
anderen drei Variablen überprüft.
EEC"""'
EC"'B
E11"8
-2
-4
HE(•"""'**..,."HPODDPOOO
P'"O
E"'"''D
• .„
E"BI>
1
-3
55-,
MA Bß8
EEE""'.,."'CCCC OOOOOODOOD
AA "'""E"'u ....ccc
IIDilOOOfl
AB„"'CCCC ODOOOOODIJD
AAß><tC 0000
AB-""0000
AA"'""D
0
läßt
sich der Kompensationseffekt durch zusätzliches Einführen
AAAAAAA.A
AAA ßaeaBaeBS
-
Bei den vorliegenden Daten
zeigen die entsprechenden Kurven immer den erwarteten paral­
"ß
.„
lelen Verlauf.
Lediglich beim Geschlecht gibt es Überschnei­
. C"B
. "E"'
dungen,
...
. '""B
'
.C"
·"'"'6
+i"'B
nalitätsannahme
t "f"
allerdings liegen hier die Kurven für Männer bzw •
Frauen so dicht beisammen,
daß man auch hier die Proportio­
(hier eher:
Identitätsannahme)
gelten las­
sen kann •
. '"8
.•s
+'B
.•a
. '8
...
Das endgültige Modell ist also ungeschichtet und hat folgende
Form:
. + „ . . + . • . . + . • • • .+.,
0
35
.t ..
70
. +.. ...... ... +
105
. . • + . • • • +. . . . +
140
k
. . . + . . . .+ . . • . i
175
210
245
280
t
...,
J:l
u
Abbildung 1 2 :
Beispiel Arbeitslosigkeit.
test
k
Proportionalitäts­
"
...,
nach dem Alter
';;!
"
,...,
.c:
u
"'
<V
<.!J
<ll <:
"
<tln
.„ .....
N <ll
0 .µ
....
''""
' tl'>
i:: Q
<lJ"
:tl N
0...,
;,...;:::i
" "'...,
'Ö .µ III
.„ k
" ""
.C:..O+l
lil ;.i §
"
.0
:>..
:::;
h<lJ
'Ö .0 k
III
.c:
kk <tl
" "'"'
..., ...,
.-; <: U1
..: ::lll1
Lediglich die Altersgruppe der über 55-jährigen tanzt aus
der Reihe.
Ihre log-minus-log-überlebensfunktion liegt
nicht unterhalb der D-Kurve
(wo sie bei Angemessenheit des
Proportionalitätsmodells eigentlich liegen müßte),sondern
zwischen den anderen Kurven.
Einflüsse,
Offensichtlich gibt es hier
welche den ungünstigen Alterseffekt zumindest
teilweise kompensieren.
über die Ursachen dieser Kompensa­
tion können wir ohne weitere Informationen keine Aussagen
machen,
wohl aber über deren Ausmaß.
Da auch in dieser Al­
tersgruppe die Hazardrate noch einigermaßen proportional,
Abbildung
13:
Kovariateneffekte auf die Wiederbeschäftigungs­
chance
- 1 17 -
- 116 -
Die Schätzergebnisse sind in Tabelle 8 enthalten.
für etwa 15 Altersjahre (0,4551/0,0275�16,55)
entspricht.
�
Dieser Effekt ist ;ignifi ant bei einer Irrtumswahrschein­
Nr.
2
3
4
5
1)
Kovariate
SE(ß)
ß
exp(ß)
1l
Alter
-0,0275
0,0033
-8,22
0,973
soziale
2)
Stellung
-0,6222
0,0753
-8 '26
o,537
0,1049
0,0693
1 '51
1 ,111
)
Geschlecht3
Arbeitslosen4)
untersj:ützung
5)
Altersdumroy
in Jahren
2)
o,1460
0,0235
6,22
1'157
o,4551
0,1921
2,37
1 ,576
O=Arbeiter,
4)
3 ) O=
wei blich, 1=männlich
5)
SE(ß)
Tabelle 8:
186,43
1=Angestellter
signifikant:
bei Angestellten (Code 1)
beschäftigt zu werden, nür
wie bei den
Arbeitern
halb
(Code 0).
Chance, wieder
so groß (exp(ß )=0,537
2
Bei einer konstanten Base-
line-Hazardfunktion - was hier allerdings nicht der Fall
ist - wären Angestellte damit im Durchschnitt fast doppelt so
lange arbeitslos wie Arbeiter.
Die österreichische Arbeits­
Möglicherweise
gibt es bei unserer Stichprobe Repräsentativitätsprobleme,
was auch den Umstand, daß der Einfluß des Geschlechts zwar
die erwartete Richtung hat (die Wiederbeschäftigungschance
(df=5)
Beispiel Arbeitslosigkeit, Schätzergebnisse des
Cox-Modells
für Männer/Code 1 ist um 11 %
gr0fte r
Code Ol, aber nicht signifikant ist
als die für Frauen /
(p=0,132), erklären
könnte.
Wie nicht anders zu erwarten war, kann die durch die Kovaria­
ten ausgedrückte Heterogenität maßgeblich zur Erklärung der
2
Hazardraten-Variation beitragen: der globalen x -statistik
entspricht ein p-Wert von praktisch 0.
Unter der Annahme
normalverteilter Schätzwerte und eines Signifikanzniveaus von
95 % sind alle Einflüsse bis auf das Geschlecht signifikant.
Der Einfluß des Alters wirkt in die erwartete Richtung:
mit
zunehmendem Alter wird es für Arbeitslose schwieriger, wieder
Auch die Höhe der Arbeitslosenunterstützung hat einen signi­
fikanten Einfluß.
Je höher diese ist, desto größer ist die
Wiederbeschäftigungschance (bei zusätzlichen 1.000 ÖS
sie um 15 %)
Der graphische Anpassungstest (kumulative Hazardfunktion der
Residuen) ist einigermaßen zufriedenstellend, ledigl�ch für
große Residuenwerte sind die Abweichungen von der 45 -Geraden
nicht mehr zu rechtfertigen, und auch im mittleren Bereich
(Residuen zwischen 2, 5 und 5)
diese
noch besser sein.
% (=100 - 97131
Arbeitslosengruppe (über 55)
ab. In der ältesten
gibt es aber einen Kompensa­
tionseffekt, welcher größenordnungsmäßig einer Kompensation
steigt
•
eine Beschäftigung zu finden, mit jedem Lebensjahr nimmt
Chance um knapp 3
ist die
der Unterschied beträgt aber nur etwa 20 %.
in 1.000 öS
p-Wert=0,0000
Der Einfluß der "Sozialen Stellung" ist beträchtlich und hoch­
marktstatistik zeigt zwar ein Gefälle in dieser Richtung auf,
o für ein Alter von 5 5 Jahren oder weniger, 1=über 55 Jahre
Globaler Wert von
o,4551/0,1921=2,37), seine
lichkeit von 5 % (ß /SE !ß l
5
5
Ursachen sind aber aus den Daten nicht ersichtlich.
Wegen der
Residuum des Individuums Nr.i
könnte die Anpassung durchaus
(definito ischen) Beziehung:
:
(t )exp(ß 'x(i)) entsprechen die
1
großen Residuen Individuen mit großer kumulierter Hazardrate
-
-
118
R (t ), also längerer Arbeitslosigkeit, und einem großen Wert
1
0
ß'x(i). Wegen der Vorzeichen der geschätzten ß-Koeffizienten,
5.
119
-
Parametrische Verfahren
sind das jüngere Arbeiter mit einer hohen Arbeitslosenunter­
stützung.
Treffen diese Merkmale mit einer länger dauernden
Zur Ermittlung der Effekte kausal unabhängiger Variablen auf
Arbeitslosigkeit zusammen, dann erscheint unser Modell nicht
die Übergangsrate und die Verweildauer mit parametrischen
angemessen.
Verfahren ist es
Die Residuen im mittleren Bereich lassen sich we­
gen der Kompensationsmöglichkeiten zwischen R (t) und den Ko­
0
variaten (bei der Berechnung der Residuen) nicht einfach lo­
kalisieren.
Für kleine Residuen, also insbesondere für eine
kurze Dauer der Arbeitslosigkeit, ist die Anpassung des Mo­
dells sehr gut.
,+.
10,0
+
tion
Im allgemeinen empfiehlt
sich, mit einfachen Modellen zu beginnen, die die wünschens­
werte Eigenschaft aufweisen, daß
die
Rate nicht-negativ werden
kann und deren Parameter gut interpretierbar
. . + • • '.+ ... »t,. ' • ..-•
• • t . . . . +• • . • t • . . . + . • • . + • . . . + . . '·1"· ' • • +
• . + . • . . +.
sind.
Das log­
lineare Basismodell erfüllt die genannten drei Kriterien.
t
Das log-lineare Basismodell
5.1.1.
•
eine genaue Ratenfunk­
Welche Ratenfunktion aufgestellt wird,
ist eine Frage der Hypothesenbildung.
es
5.1.
7,5
zunächst erforderlich,
zu spezifizieren.
Das Modell und die Interpretation der Koeffizienten
+
Für praktische Anwendungen des Modells ist eine genaue Vor­
stellung von der Bedeutung der Koeffizienten besonders wich­
tig.
In Zusammenhang mit dem Cox-Modell wurden schon einige
Interpretationsmöglichkeiten erwähnt. Bei zeitunabhängigen
5,0
parametrischen Modellen kommt hinzu, daß die Koeffizienten
AA
...
AA
A
AA
...
A
AA
A
AA
AA
2,5
direkt über die Stärke der Effekte auf die mittlere Verweil­
dauer Auskunft geben.
Wir wollen an dieser Stelle noch ein­
mal ausführlich und übersichtlich die verschiedenen Inter­
p retationsmöglichkeiten der Koeffizienten zusammenstellen
und erläutern.
Wir gehen im folgenden wieder von einem
o,o
.• •
+ ••
0
1,5
Abbildung 14:
3
4,5
. .+ . • . . + . • ' .+.'. ,+ • . • • +.
6
7,5
9
10,5
12
Beispiel Arbeitslosigkeit. Graphischer An­
(kumulierte Iiazardfunktion der
- senkrecht - gegen die Residuen waagrecht)
Zwei-Zustands-Modell
aus. Sind x
,• . •x
die Kova­
mit der tlbergangsrate r=r0
m
1
1
empirisch
riate (=unabhängige variablen) und B ,B ,ß2, • • • ,ß
m
0
1
zu schätzende Parameter, so hat das log-lineare Modell die
Form:
-
-
120 -
Werden beide Seiten der Gleichung logarithmiert,
man einen log-linearen Ausdruck.
so erhält
-
Die u -Parameter sind Multiplikatoren,
i
1,
st
positive Werte aufweisen
ß
:
i
für
positiv,
Rate
die
auf
Effekt der variable x
so
i
ist der Effekt negativ und für u =1 existiert kein Ef­
i
fekt, wie man anhand von Gleichung (68) erkennen kann. Ein
�
Auf der linken Seite steht
der natürliche Logarithmus der Rate,
121
auf der rechten Seite
eine Linearkombination der Kovariate.
wert von
1,08 signalisiert also einen positiven Einfluß der
Variablen Bildung.
Zur Interpretation der Koeffizienten
Schreibweise von
(65)
ist noch eine andere
zweckmäßig (CARROLL
1982).
Gleichung
(65)
wird wie folgt umgeformt:
Aus Gleichung
stärke des Effekts.
einer
(68)
folgt,
daß sich bei
Erhöhung der unabhängigen Variablen um eine Einheit
6x
die Rate um 100. (� -1)
i
i
1,08 weist also daraufhin,
jahr die Rate um 8
dierung 0/1
Prozent verändert.
Ein Wert von
daß bei einem zusätzlichen Schul­
% steigt. Bei Dummy-Variablen mit der Co­
gibt der Koeffizient an,
um wieviel Prozent höher
oder niedriger die Übergangsrate für die Gruppe mit der
1-Co­
dierung ist.
Hierbei gilt:
Verweildauer-Interpretation. Die Rate selbst ist nicht beob­
achtbar. Die Effektstärke-Interpretation ist daher eventuell
Wir sprechen von a- und von ß-Koeffizienten,
weniger anschaulich,
die mit einer
einfachen Rechenoperation ineinander überführbar sind. Die
a-Koeffizienten lassen
pretieren,
sich inhaltlich besonders gut inter­
wie sich im folgenden zeigen wird.
Schreibweise
(68)
Daher ist
der
meist der Vorzug zu geben.
(0/1-Variablen)
in die Gleichung eingehen. Ferner
können wie in einer Regressionsgleichung auch Interaktions­
ef fekte
(Zusammenwirken von
zwei oder mehreren Variablen)
in
der Ratengleichung berücksichtigt werden.
Was bedeutet es nun,
wenn man z.B.
für a1,
etwa den a-Koeffi­
zienten der unabhängigen Variablen x =Bildung in Schuljahren,
1
einen wert von
1,08 ermittelt?
Zuwachs der nicht beob­
Eine recht anschaulich erfaß­
bare Größe ist dagegen die mittlere Verweildauer im Ausgangs­
zustand. Unter der mittleren Lebenserwartung können
sich die
meisten Menschen etwas vorstellen.
zwischen
Wenn es gelingt,
den a-Koeffizienten und der mittleren Verweildauer E(T)
Die Kovariate x
müssen quantitatives Skalenniveau aufweisen
i
(mindestens Intervallskala) oder aber als qualitative Dummy­
variablen
da sie über den
achtbaren Rate Auskunft gibt.
eine
Brücke zu bauen,
dann kann a
als Maß für die Stärke des
i
Effekts der variablen x
auf E(T) angesehen werden. Beim Mo­
i
dell mit zeitunabhängiger Rate liefert Formel (10) in Kap.2
eine solche Brücke.
Die Rate entspricht ja dem reziproken
Wert der Verweildauer.
Gleichung
(69)
E(T)=
(68)
Gemäß der Spezifikation der Rate in
folgt:
(1 �
0 1
X
1
•
•
•
-
122
-
- 123 -
Hieraus ergibt sich folgende Interpretation der a-Koeffizienten:
Wird die unabhängige Variable um eine Einheit
erhöht,
[ !1/ai)-1 ]
so verändert sich die mittlere Verweildauer um
.100
Prozent. Ein Wert von 1,08 gibt also an, daß ein zusätzliches
Jahr Bildung die erwartete Verweildauer zustand der Arbeitslosigkeit - um 7,4
%
z.B.
tion von ß
bezüglich des Einflusses auf die Verweildauer
i
folgt aus der Beziehung:
(70)
ln
E(T)
im Ausgangs­
vermindert.
Wie bereits in Kap.4
erwähnt, erleichtert eine einfache grobe
Faustregel mitunter die Abschätzung der Effekte.Für ß-Koeffi­
zienten nahe null
-Koeffizient
Typ des Effekts
Richtung des
Effekts
pos:if.:iv
a.=1 kein Effekt
1
negativ
Rate verändert
sich um
Zuwachs der
Rate für
lix. =1
(a> -1) .100 %
i
1.
Effekt auf er-
erwartete Ver­
weildauer E(T)
ändert sich u m
-1).100%
ß-Koeffizient
( 71)
ß.>O
oder
a-Koeffizienten nahe
gilt ungefähr:
1+ß.
i
Und für den Effekt auf die Verweildauer ist die Abschätzung
1
nach folgender Näherungsformel möglich:
ß.=O
l.
ß.<O
(72) %-Effekt auf E(T)
i
natürlicher
Logarithmus
der Rate ver­
ändert sich
um ß
i
natürlicher
Lqgarithmus der
8 % zu­
wachs
100
Bei einem ß -Wert von 0,08 kann man also sofort sagen:
i
fekt auf die mittlere Verweildauer ungefähr -8 %.
7,4 %
Vermin­
erwarteten Ver­
derung
weildauer ändert
sich um -ß
i
Interpretation der Koeffizienten
ist
ungefähr 1,08, der Effekt auf die Rate somit 8 % und der Ef­
Bei Werten
von ß
absolut größer als 0,10 wird die Faustregel allerdings
i
sehr ungenau.
Wie werden nun die Parameter an empirischen Daten geschätzt?
Da dieRate keine beobachtbare Größe darstellt, können die Ko­
effizienten in Gleichung (65)
sionsanalyse geschätzt werden.
Tabelle 9:
1
auf der Basis von Gleichung
nicht wie z.B.
bei der Regres­
Man könnte auf die Idee kommen,
(69)
eine Regressionsschätzung mit
der beobachteten Verweildauer als abhängiger Variable durchzu­
führen.
Diese Schätzung wäre jedoch weniger gut,
da wegen der
Die Interpretation der ß-Koeffizienten bezüglich der Richtung
zensierten Beobachtungen
des Effekts folgt aus der Beziehung ß =ln
Ist a
z.B.
i
i
1,08, so hat B
den Wert 0,077. Für Werte von a <1 ist ß
da­
1
i
i
gegen kleiner als null, d.h. der Effekt wäre negativ. Der
Schätzprobleme können jedoch mit der Maximum-Likelihood-Methode
Effekt auf den Zuwachs des natürlichen Logarithmus der Rate
ist anhand von Gleichung
(66)
erkennbar, und die Interpreta-
gelast werden
ein starker Bias auftreten kann.
Die
(TUM11. 1979, TUM1I. U."ld H1\NNi'\N 1979). Dazu betrachten wir
im folgenden Abschnitt
zunächst den Fall qualitativer Kovariate.
- 125 -
- 124 -
Oder ab.er man untersucht im Rahmen einer Evaluierungsstudie
5.1.2. Qualitative variablen als Kovariate
den Einfluß von zwei Strafanstaltstypen
stodiale Anstalt,
Bei dem Spezialfall der Untersuchung des Einflusses von m di­
chotomen Variablen mit der Codierung 0/1
Variablen)
formeln,
(sogenannten Dummy­
auf die Übergangsrate existieren einfache Schätz­
so daß die Koeffizienten per Hand oder mittels Ta­
schenrechner ermittelt werden können.
fälligkeit.
x
1
(x =o ist eine ku­
1
ist eine Reformanstalt)
auf die Rück­
1
Gemessen wird hierbei die Zeit in Monaten bis zum
Rückfalldelikt. Als drittes Beispiel könnte man sich vorstel­
len, daß für zwei Gruppen von Arbeitslosen
(Gruppe O hat eine
Ausbildung absolviert, Gruppe 1 ist ohne Ausbildung)
weildauer im
die Ver­
Zustand der Arbeitslosigkeit in Monaten erhoben
wird.
Qualitative Variablen mit mehr als zwei Ausprägungen müssen
zuvor in R-1 Dummy-Variablen umgeformt werden, wenn R die An­
Ein für alle drei Beispiele passender
zahl der Ausprägungen bezeichnet
könnte die folgenden Ankunftszeiten enthalten:
(vgl.
auch Kap.4).
Der Einfachheit halber gehen wir im folgenden von einer Glei­
chung mit einer Dummy-Variablen aus.
Dies entspricht dem Ver­
gleich von zwei Gruppen:
Gruppe O:
1,1,1,2,2,3,4,6+,8,13
Gruppe 1:
1,2,2,3+,5+,8,12+,19,28
Ein "+"
bezeichnet zensierte Zeiten. Die Zustandsvariable hat
hier den Wert O,
x
Hat x
1
(fiktiver) Datensatz
andernfalls den Wert 1.
1
Bei Gruppe o weist
Unter Berücksich­
1
tigung dieser Konventionen kann der Datensatz in einen im
die Ausprägung O, so gilt für die 0-Gruppe:
den Wert O, bei Gruppe
den Wert 1 auf.
Prinzip maschinenlesbaren Datenfile übersetzt werden, wie ihn
Tabelle 10 zeigt.
Betrachten wir z.B. Fall 8. Hier wurde eine
Ankunftszeit von 19 bis zum Eintreten des Ereignisses gemes­
a
ist allgemein immer die Rate fü r d\ie Referenzgruppe, bei
0
der alle Dummy-Variablen den Wert O a fweisen. Für x =1 wird
1
der Wert der Referenzgruppe mit a
1
h
sen
(Zustand=1). Ferner gehört Person 8 zur Gruppe 1
Tabelle 10 zeigt den Datenfile und das Modell.
sich nun das Problem der
(x =1).
1
Für uns stellt
Schätzung der beiden Parameter a
a (bzw. ß
und ß ).
0
1
1
Nehmen wir an,
in einem Experiment zur Untersuchung kultur­
spezifischer Einflüsse auf die Aggression im Straßenverkehr
wurde gemessen, nach wieviel Sekunden eine Reaktion
erfolgt, wenn ein Fahrzeug den Verkehr blockiert.
(Hupen)
Die Dummy­
variable könnte dann zwei Städte unterschiedlicher Kultur­
kreise bezeichnen
(z.B. x =o ist Wien, x =1 ist Stockholm).
1
1
0
und
Die Maximum-Likelihood-Methode liefert in unserem speziellen
Fall einfache Schätzformeln.
Funktion
(26)
in Kap.2.4.
unsere Ratenfunktion
(73).
Gehen wir von der Likelihood­
aus und berücksichtigen wir dabei
Das Resultat der Maximierung der
Likelihood-Funktion in Bezug auf die Parameter a0 und
die beiden folgenden Schätzformeln
Anhang 3):
a1
(siehe zur Ableitung
sind
- 126 -
Fallnummer
2
0
4
3
8
0
3
5
2
6
12
8
19
9
1
0
0
0
10
2
11
6
0
5
0
13
0
2
1
1
14
13
15
1
16
8
17
1
12
18
3
19
28
(77)
N
a1
0
1
7
**
Zustand**
2
4
*
Verweildauer*
- 127 -
0
0
1
0
0
0
Zeit bis zum Eintreten des Ereignisses oder bis zum Ab­
bruch der Beobachtung
Zustand, in dem sich die Person am Ende der Beobachtungs­
periode befindet. "O" indiziert eine zensierte Beobach­
tung, "1" einen Zustandswechsel. Aller Personen befanden
sich vorher im zustand o.
Da es sich bei a
und a
um Schätzwerte und nicht um die
1
0
"wahren" werte der Grundgesamtheit handelt, kennzeichnen wir
wie in den vorhergehenden Kapiteln die Schätzungen mit dem
Symbol „�„ . N
ist die Zahl der Ereignisse in der 0-Gruppe,
0
v
die Summe der Zeiten bei den nicht-zensierten, w
die
0
0
Summe der Zeiten bei den zensierten Fällen und T0 die Summe
aller Zeiten in der 0-Gruppe.
1-Gruppe.
Entsprechendes gilt für die
Für unser Datenbeispiel erhalten wir die Schätzwerte:
ao=
9
35+6
6
= o,22
&1= 60+20
/0,22=0,3�
Wegen ß =ln �
folgt: B =-1,52 und B =-1,07. Der Effekt auf
i
i
1
0
die Rate beträgt ( � -1).100, also -66 %. M.a.w. ist die über­
1
gangsrate in der 1-Gruppe um 66 % geringer als in der O-Gruppe.
Besonders anschaulich
weildauer=[(1
)-1
]
ist der :::::.��=:...::::.!:=-�:;::._-""��:::.:=,::=__-'"":.::..._
.100.
Es
zeigt sich,
Verweildauer in der 1-Gruppe 193
%
daß die mittlere
höher ist als in der 0-
Gruppe. Natürlich können wir die Schätzungen der gruppenspe­
zifischen Raten und mittleren Verweildauern auch direkt an­
geben.
Tabelle
10:
Hypothetischer Datenfile mit einer unabhängigen
Dummy-Variablen x
für das Zwei-Zustands-Modell
1
(78)
Wie oben erwähnt,
r(O)
haben die Raten die Form:
0,22
0,22.0,34=0,075
- 129 -
- 128 -
Ferner wissen wir,
daß die Raten im reziproken Verhältnis zur
mittleren Verweildauer stehen:
1
-iü) ,
r
1
),
O
r
Af; (O)J
also E LT
G(tl
4,56
"r (11
also E LT
]
,..
13 ,33
/
Die mittlere Verweildauer ist in der Gruppe
länger als in der Gruppe 0.
1
1
(z.B. Reformanstalt)
also erheblich
Für das Beispiel der Strafvoll­
zugsevaluierung würde dies bedeuten,
Gruppe
daß die Reformanstalt
(z.B. "Normal­
vollzug")
0,5
einen
positiven Effekt auf die mittlere Verweildauer bis zum Rück­
fall (und einen negativen Effekt auf die Rate)
ausübte.
Man
erkennt auch, daß die Survival-Analyse wichtige Kennziffern
zur Beurteilung des Effekts von Maßnahmen beisteuert. Ohne
die Akzeptierung eines bestimmten Survival-Modells wäre die
Schätzung der mittleren Verweildauer wegen der zensierten Be­
0
obachtungen ja nicht möglich gewesen.
30
20
10
t
Schließlich läßt sich auch die gesamte erwartete tlberlebens­
funktion G(t) für jede Gruppe berechnen
Dichte f(t) ).
(82)
G {O)(t)
(sowie F(t)
und deren
In unserem Fall:
e
e
(
-t O)
-t<•)
.t
e
.t
e
Abbildung
15:
Erwartete gruppenspezifische Uberlebensfunk­
tionen
-0,22.t
-0,075.t
Als weiteres Problem stellt sich die inferenzstatistische
der Effekte und der Berechnung von
Für jeden Zeitpunkt t kann für jede Gruppe aufgrund der bei­
den Formeln der Anteil der "Uberlebenden"
berechnet und gra­
phisch veranschaulicht werden (siehe Abbildung 15).
sieht man eine der Stärken der Modellkonstruktion:
Hier
Mit Hilfe
des Modells ist eine Vielzahl informativer Folgerungen ableit­
bar. Allerdings ist auch der kriti sche Punkt,
die empirische
Angemessenheit der Modellannahmen, im Auge zu behalten.
Maximum-Likelihood-Theorie weiß auch
auf diese Fragen eine Antwort
Kap.3).
(KALBFLEISCH und PRENTICE 1980,
Es läßt sich nachweisen,
daß die Parameterschätzungen
asymptotisch normalverteilt sind mit dem folgenden Standard­
schätzfehler
oder "Standarderror" für
ß
1
(Standardabweichung
- 131
130 -
SE der Stichprobenverteilung
(84)
SE(ß1)
�
(86)
�
=vl�IC
0,53
= t;i
y
Bei einer Normalverteilung weiß man, daß 95
Bereich von ungefähr 2 (genau:
liegen.
Für ß
berechnet
1
intervall:
%
der Fläche im
1,96) Standardabweichungen
sich daher das folgende Konfidenz­
Konfidenzintervall für B
1
B ±1,96.SE (ß1) =-1,07±
1
1 ,04
( )
( )
wenn kein Gruppeneinfluß e istiert, also r O =r l , lautet
x
die Nullhypothese:
ß =0.
1
zum Test der Nullhypothese kann man
entweder vom Konfidenzintervall ausgehen und danach fragen,
ob der Nullpunkt im Konfidenzintervall liegt.
Man sieh!, daß
das bei unserem Beispiel nicht der Fall ist, daß also ß
einer Irrtumswahrscheinlichkeit von 5
kant ist.
bei
1
% gerade noch signifi­
Äquivalent hiermit ist die zweite Vorgehensweise.
Man berechnet zunächst den standardisierten z-Wert:
(85) z
ß
1 ,07
0,53
(i#O)
(87)
(i)
(88) �
Anhand der Schätzformel
2,02.
für die Rate erkennt man, daß die
(W =O) zu einer Über­
i
schätzung der Rate und somit zu einer Unterschätzung der er­
Ignorierung der zensierten Beobachtungen
warteten Verweildauer führt (siehe dazu auch TUMA und HANNAN
1979).
Im Strafvollzugsbeispiel erhielte man eine verzerrte
Schätzung der mittleren Verweildauer in der 0-Gruppe von 3,89
Monaten
bzw.
und in der
13,33
Monaten).
1-Gruppe von 10 Monaten (anstelle von 4,56
Auch bei der Behandlung der zensierten
Beobachtungen als exakte Zeiten - eine zensierte Zeit von z.B.
zehn Monaten wird wie ein Rückfall nach
und die mittlere Verweildauer
als bei korrekter Behandlung
zensierter Zeiten.
In diesem Fall ist der Zähler von (88) größer
verglichen, wobei ein gerade noch signifikanter Grup­
Verweildauer von, 4,10 bzw.
8,89 Monaten.
daß sich hier mehrere zensierte Beobachtungen im
In der 1-Gruppe sind
der Fälle zensierte Beobachtungen.
für die Gleichung
1)
Gruppen bzw.
m Dununy-Variablen
Die Schätzformeln lauten im allgemeinen Fall
x1 a x2
2
a xm :
m
Ein weiterer Test ist der Likelihood-Ratio-Test. Die For­
mel für den Gruppenvergleich findet sich in KALBFLEISCH
und PRENTICE 1980, s.53. Siehe dazu auch den folgenden
Abschnitt.
Das größere Ausmaß
der Unterschätzung in der 1-Gruppe ist darauf zurückzuführen,
(88) bemerkbar machen.
Die Untersuchung von zwei Gruppen läßt sich ohne Schwierig­
verallgemeinern.
Wie man leicht
nachrechnen kann, ergäbe sich eine Schätzung der mittleren
1)
peneinfluß erkennbar wird.
keiten auf die Analyse von m+1
zehn Monaten einge­
stuft - wird die Rate überunterschätzt.
Sodann wird dieser Wert mit dem kritischen za-Wert (z0
1,96)
-
Zähler von
ja ein Drittel
Wie schon erwähnt, ist bei parametrischen Verfahren der kri­
tische Punkt inuner die Akzeptierung der Modellannahmen.
wohl die deduzierten Folgerungen,
So­
als auch die Schätzformeln
und die inferenzstatistischen Tests sind nur gültig, wenn das
gewählte Modell angemessen ist.
Zur Prüfung der Annahmen aber
kann auf nicht-parametrische Verfahren
zurückgegriffen werden.
So kann die nicht-parametrische Analyse beispielsweise dar-
- 132 -
über Auf sc!hluß geben,
- 133
ob das Modell mit zeitunabhängiger Rate
eine zutreffende Beschreibung der Daten liefert.
Der natür­
liche Logarithmus der nicht-parametrisch geschätzten
bensfunktion müßte dann für jede Gruppe im
Gerade mit negativer Steigung darstellbar sein
5. 2
)
tlberle­
a)
ßreiqnisdaten
Zeitdiagramm als
(vgl.
Zustand
Abschnitt
•
0
2_,_1.3.
Qualitative und quantitative Kovariate:
"1 .,___140
mit dem Programm RATE
b)
Die bisherige Auswertung der
Ereignis)
Berechnungen
Datenfile
in den Kapiteln 3 und 4 erwähn­
ten Stichprobe österreichischer Arbeitsloser hat ergeben,
zial- Sex
t!!'goe
daß
Da nach
20 Wochen aus institutionellen
Gründen Strukturbrüche in den Daten erkennbar sind,
24
beschrän­
45
ken wir uns bei der Schätzung auf die ersten 140 Tage. Wir
wollen für diesen Zeitraum die Kovariateneinflüsse im Rahmen
eines vollparametrischen Modells neu
dabei alle Zeiten,
zensiert.
schätzen und betrachten
welche größer als 140 sind,
als am
140.Tag
Abbildung 16a veranschaulicht noch einmal die Er­
eignisdaten
anhand von zwei typischen Fällen,
gestellter,
zustand
6320
3940
0
0
* O c Arbeiter
1
=
•• O
i>.ngestellte
=
weiblich
=
männlich
•�•
(Ab­
Sozialkategorie An­
also nicht-zensierte Beobachtung,
Wiederbe­
schäftigung erfolgt nach 89 Tagen.
Bezogen auf den Prozeß sind alle Kovariate
zeitunabhängig: so­
wohl das Lebensalter als auch die Höhe der Arbeitslosenunter­
stützung wurden
zu einem bestimmten Stichtag ermittelt.
bildung 16c veranschaulicht die Hypothesen.
daß das Alter und die Sozialkategorie
stellte 1)
(Codierung für Ange­
einen negativen und das Geschlecht
r =
r
0a0 +s1x1+a2x2+a3x3+s4 x4
ao„°'1
X1
.(12
''<
.a3
X3
.a.4
X4
Ab­
Wir nehmen an,
(Codierung für
89
140
Höhe der Arbeits­
losenunterstützwig
plus sonstige Trans­
ferzahlungen in
österreichischen
Schillinq pro Monat
Geschlecht männlich, Arbeitslosengeld 6.320 öS,
Zielzustand=1,
Verweildauer
im zustand o
{Tage)
1055
c)�
Betrachten wir als Beispiel den nicht-zensierten Fall 1
Das Alter beträgt 24 Jahre,
0
Abbildung 16b
informiert über den Aufbau des Datenfiles.
bildung 16b):
�;�)
"2l
die kumulative Hazardrate während der ersten Monate einiger­
maßen linear verläuft.
'Ziel-
11.rgeld
(;,i
Abbildung 16:
Modell und Datenmuster
-
Männer
1)
- 135 -
134 -
einen positiven Einfluß auf die Rate haben. Bei der
Höhe der Arbeitslosenunterstützung gehen wir von einem posi­
tiven Effekt aus.
Dabei benutzt RATE eine Variante des klassischen Newton-Ver­
fahrens,
1979}.
die von GILL und MURRAY vorgeschlagen wurde
den speziellen Iterationsverfahren zu befassen.
Natürlich handelt es sich hierbei
streng genommen nicht mehr
um einen deduktiven Test, wenn die Hypothesen im Einklang mit
den nicht-parametrischen Ergebnissen formuliert
werden.
Zur Prüfung der Hypothesen formulieren wir eine Gleichung mit
zeitunabhängiger Rate:
{TUMA
Normalerweise braucht sich der Anwender aber nicht mit
Wer an einem
überblick zu verschiedenen Optimierungsalgorithmen interessiert
ist, sei auf das Buch von MURRAY
(1972) verwiesen.
Nur einen
Punkt sollte auch der Benutzer der Programme im Auge behalten.
Wenn die Likelihood-Funktion mehrere Maxima aufweist,
kann kein
Programm garantieren, daß die erzielte Lösung wirklich das
globale Maximum ist. Vielmehr können die berechneten Werte
(89) r
nur ein suboptimales lokales
sprochen
(90)
r
Maximum darstellen.
hätte man in diesem
mensionalen Raum
Bildlich ge­
Fall bezogen auf einen dreidi­
(Likelihood-Funktion mit
zwei Parametern)
nur einen Nebenhügel erklommen und nicht den höchsten Berg
Hierbei bedeuten:
der "Likelihoodlandschaft". Wenn man jedoch die iterativen
Lebensalter in Jahren
x2= Sozialkategorie
x3= Geschlecht
Berechnungen mit unterschiedlichen Startwerten durchführt,
(Arbeiter=O, Angestellte=1)
erkennt man leicht,
(weiblich=O, männlich=1)
ob eventuell mehrere Maxima existieren.
Praktisch heißt dies nur,
x4= Höhe der monatlichen Arbeitslosenunterstüzung in öS,
daß man das Programm RATE mehrfach
startet, wobei man jeweils andere Startwerte für die zu
schätzenden Parameter eingibt.
Im Unterschied zum Spezialfall von Gruppenvergleichen sind nur
die
Variablen x
und x
4
und x
qualitativ, während die Variablen x
3
2
1
quantitativen Charakter aufweisen. Dieser Unterschied
Startwerten
Unterläßt man die Eingabe von
(wie in dem Beispiel in Tabelle
11),
so werden
diese von RATE automatisch bestimmt. In diesem Fall kann man
aber auch nicht testen,
wie stabil die Lösung ist.
macht sich rechentechnisch stark bemerkbar.
erlernbar. l)
Die Anwendung von RATE ist sehr leicht
Zur Schätzung der Parameter wird beim Zwei-Zustands-Modell
(mit zeitunabhängiger Rate) wiederum von der Likelihood-Funk­
tion
chung
(26) in Kap.2.2. ausgegangen,
gramm
zur Schätzung der Koeffizienten unseres
kurzen Kommentaren versehen in
Tabelle
Das Pro­
Modells ist mit
11 wiedergegeben.
wobei für r die Ratenglei­
(89) eingesetzt wird. Die Maximierung der Likelihood­
Funktion in Bezug auf die Parameter B ,ß ,B ,ß3 und B
lie­
4
0
2
1
fert jedoch nicht so einfache Schätzformeln wie bei rein qua­
litativen
Kovariaten.
Vielmehr benötigt man iterativ
arbei­
tende Computerroutinen, die bei gegebenen Daten das Maximum
der Likelihood-Funktion suchen.
Ein Computerprogramm, das bei
verschiedensten Arten von Modellen diese Leistung erbringt,
ist TUMAS Progranun RATE
(TUMA 1979).
�
TUMA 1979) sowie da�
Die Programmbeschreibung von RATE2
Programm selbst ist beim "Zentrum fur Umfrageforschung in
Mannheim e.V. (ZUMAr' erhältlich. Die Anschrift lautet: D.
ist inzwischen eine
6800 Mannheim, B2,1. In
. Siehe dazu auch
wesentlich verbesserte Version
weiter unten.
-
136 -
- 137 -
Kommentar
Programm
9RUN ANDY01,IHS-S4711,DIEKMANN
aSYM PRINT$,1,I9
ilASG,AZ ARSURV
:IUSE 4,ARSURV
aASG,AZ RATE*RATE2
�XQT RATE*RATE2.RATE
Rechnerspezifische Steuer­
karten zum Aufruf des Pro­
gramms. Hier: UNIVAC 1100/81
RUN NAME
ARBEIT
Beliebiger Titel
N OF CASES
1055
Fallzahl
VARIABLES
7
ALT
2
soz
3
SEX
4
ARGELD
5
ZUSTAND
ZEIT
6
Zahl der Variablen auf der
A=1
VECTOR
(1)
A=1 bedeutet, daß
Position der Variablen Alter,
Sozialkategorie, Geschlecht,
Arbeitslosengeld, Zielzu­
stand und der beobachteten
Ankunftszeit auf der Loch­
karte
Angabe der Position der Kova­
riate auf der Lochkarte für
2 3 4 5
das Modell A=1. (1) bezieht
sich auf die Vektor-Nr., in
unserem Beispiel auf den er­
sten und einzigen Vektor.
SOLVE
Mit diesem Befehl beginnt
RATE die Berechnungen.
FINISH
Tabelle 11:
Fortsetzung
Neben anderen
Informationen
(zu Einzelheiten siehe die Pro­
grammbeschreibung TUMA 1979)
allem
druckt RATE die uns hier vor
interessierenden Werte der
"1" besagt, daß Event-Histor:y­
Daten eingelesen werden. Die
Daten werden über die logi­
sche Gerätenr.4 eingelesen.
(Hierfür ist eine rechner­
spez if i sche Steuerkarte er­
the parameter"
Bei UNIVAC eine
Datenfile ARSURV angeordnet.)
Forrnatangabe für alle sieben
Variablen auf der-cTögischen)
Lochkarte im FORTRAN-Format.
Tabelle 11:
Position der Verweildauer­
Variablen ZEIT (7) und der
Zielzustands-Variablen (6).
J.
(in
und die "Antilogs of
F-Werte
-3,74
0,138
731,48
0,0238
alter x1
-0,0329
0,00322
104,97
0,968
0,00311
Sozialkategorie x2
-0,739
0,0823
80,59
0,478
0,0393
O, 153
0,0731
4,38
1 ( 17
0,0851
0,000154
0,0000247
1,00015
0,0000247
Konstante
Lebens-
(F4.0,F2.0,2F1.0,F5.0,F1.0,F3.0)
ß.
a ) sowie die Standardfehler aus. Für unsere
i
Stichprobe wurden die Werte in Tabelle 12 berechnet:
USE 4-Karte. Die Daten sind
wie in Abbildung 16b auf dem
7 6
und �-Koeffizienten
ß-
der Sprache von RATE die "Parameter"
forderlich.
T AND S
ein
lineares Modell für die
variate spezifiziert wird.
Lochkarte
7
READ DATA
MODEL
Geschlecht
x3
Arbeitslo-
sengeld x4
38,69
RATE - Programm für das Beispiel in Abbildung 16
Tabelle
12:
Schätzwerte der ß- und �-Koeffizienten sowie der
Standardfehler
- 138
-
- 139
Wie anhand des Vorzeichens der �-Koeffizienten in Tabelle 12
erkennbar,ist der Geschlechtseffekt positiv und der Effekt
des Lebensalters negativ.
für die Sozial­
Der
kategorie ist dagegen positiv.
Angestellte sind also in der
Regel länger arbeitslos als Arbeiter. Möglicherweise ist bei
Arbeitern die Fluktuation sowohl bei der Beschäftigung als
-
fung der Nullhypothese der Quotient
den Standardfehler größer als 2 sein
tumswahrscheinlichkei t von 0,05).
(ct1
1)
dividiert durch
(bezogen auf eine Irr­
Betrachten wir jetzt noch das quantitative Ausmaß der Effekte
auf die Rate und die mittlere Verweildauer
(Tabelle 13).
auch im Zustand der Arbeitslosigkeit relativ hoch. Diese
Idee könnte verständlich machen, daß Arbeiter kürzere Ver­
weildauern aufweisen als Angestellte.
Zur Prüfung der Hypo­
these benötigten wir allerdings Ereignisdaten,
die für einen
längeren Zeitraum über Episoden der Beschäftigung und Arbeits­
losigkeit Aufschluß geben.
Der Grund hierfür ist möglicherweise,
daß Ar­
beitslose mit höherem Arbeitslosengeld eher diejenigen Berufe
ausüben,
die eine höhere Chance der Wiederbeschäftigung ga�
rantieren.
Lebens-
Um letztere Behauptung zu überprüfen,
erneute Analyse unter Kontrolle der Variablen
wäre eine
Qualifikation
df2=Fallzahl) ist ablesbar,
Effekte aufweisen.
1)
+
sozialkategorie x
0,478
2
-52,2
+109,2
+
+17,0
-14,5
+
Geschlecht
x3
Arbe i tslosengeld
ter für den Geschlechtseffekt liegt
scheinlichkeit von 0,05)
Nur der Parame­
(bei einer Irrtumswahr­
gerade an der Signif ikanzgrenze
(im
semi-parametrischen Modell war dieser Effekt nicht signifikant).
Das Programm druckt auch die Standardfehler der
ten. H·ier ist zu berücksichtigen,
die Nullhypothese � =1
i
1l
entspricht.
&-Koeff izien­
daß der Nullhypothese B =O
i
Daher sollte zur Verwer-
Die F-Werte berechnen sich nach der Formel:
A
2
F=(ß /Standardfehlerl „
i
1' 17
1 ,00015
X4
Tabelle
13:
-0,015
+0,015
(+15') *
Tausend Schilling
Die ß-Koeffizienten dividiert durch den
Standardfehler sind wesentlich größer als 2.
Signifi-
kanz**
+ 3,3
* pro
(df =1,
1
daß alle Kovariate signifikante
%-Effekte auf
die mittlere
Verweil<lauer
-3,2
ratsam.
Sowohl anhand der Standardfehler als auch der F-Werte
%-Effekte auf
die Rate
0,968
alter x
1
Die Höhe des Arbeitslosengeldes hat einen positiven Effekt
auf die Rate.
,..
(;!..
1
(-15) *
**
+
Irrtumswahrscheinlichkeit=0,05
Stärke der Effekte auf die Rate und die Verweildauer
Ein zusätzliches Lebensjahr erhöht die Dauer der Arbeitslo­
sigkeit im Durchschnitt um 3,3
%. Bei Angestellten erhöht
sich die mittlere Verweildauer auf mehr als das Doppelte
(109
%).
Männer haben im Schnitt eine 14,5 % geringere Ver­
weildauer, und pro 1.000 öS mehr Arbeitslosenunterstützung
sinkt die mittlere Dauer der Arbeitslosigkeit um 15 %.
Mit Hilfe der folgenden beiden Gleichungen gestattet das
Modell Prognosen der Ubergangsrate und der mittleren Dauer
der Arbeitslosigkeit für beliebige Kombinationen von unab-
140
hängigen Variablen,
beitslosen:
- 141 -
also für hypothetische Gruppen von Ar­
Die Maximum-Likelihood-Methode gestattet ein weiteres infe­
renzstatistisches Testverfahren,
mit dem einzelne Parameter
oder simultan Gruppen von Parametern auf
werden können.
Da die erwartete Verweildauer der reziproke Wert der Rate
ist, ergibt sich für �(T):
Merkmale: Alter 45 Jahre, Angestellte,
weiblich, 3.000 öS Ar­
und Gruppe 2 umfaßt männliche Arbeiter,
Jahre alt mit 6.000 ös monatlicher Unterstützung.
nosegleichungen für
�(T)
lauten dann:
25
Die Prog­
Gruppe 1:
45
3000
(93) �(T)=(42,02). (1,033)
• (2,092). (0,99985)
=
Gruppe 2:
(94) E'(T)
2
(96)
[B]
(
)
*
2 ln L
L(ß)
,
mit df�u Freiheitsgraden.
Der Likelihood-Ratio-Test basiert auf dieser Formel.
L(ß*)
ist dabei der maximale wert der Likelihood-Funktion eines Mo­
dells mit
u restringierten Parametern (Nullhypothese).
stringierte Parameter"
besagt normalerweise, daß
"u re­
u Parameter
242
als null angenommen werden (z.B. u=4 und B =B =B =B =o in der
4
3
1
2
Ratengleichung (89)) ,aber auch andere Arten von Restriktionen,
25
000
{42,02). {1,033)
• (0,855).(0,99985) 6
=
ternativhypothese geht dagegen von einem nicht-restringierten
33
Die erwartete Dauer der Arbeitslosigkeit in Gruppe 1 beträgt
somit 242 Tage,
in Kap.4 angedeutet - daß die sogenannte Likelihood-Ratio
zweier gegeneinander zu testender Modelle näherungsweise x
verteilt ist:
Nehmen wir als Beispiel zwei Extremgruppen. Gruppe 1 hat die
beitslosengeld,
Signifikanz geprüft
Aus der Likelihood-Theorie folgt, - wie schon
in Gruppe 2 sind es dagegen nur 33 Tage.
Ent­
sprechend können die Uberlebensverteilungen G(t) sowie F(t}
und f(t) für beliebige Gruppen prognostiziert werden.
"
dierter stochastischer Modelle.
A
Für G(t) lautet die Prognosegleichung:
-� t
x
x
(95) G'Ctl=e
' =exp(-(0,0238)(0,968)X1(0,478) 2(1,17) 3 .
x4
(1, 0001 5)
t
J
sind denkbar.
Die Al­
Modell aus ldie Werte von ß0,B ,ß ,ß ,B
werden nicht fest­
4
2
3
1
gelegt). L(ß) ist der maximale Likelihood-Wert des alterna­
tiven Modells.
Die obige Gleichung kann man auch folgender­
maßen schreiben:
L (ß)- ln L (ß
Auch
hier zeigt sich der hohe Informationsgehalt empirisch vali­
•
etwa die Gleichsetzung von Parametern,
*)]
Intuitiv läßt sich die Formel wie folgt deuten:
L(ß*)
ist
normalerweise das Produkt aus vielen Werten kleiner eins und
daher eine Zahl, die nahe bei null im positiven Bereich liegt.
Für den Likelibood-Wert der Alternativhypothese gilt ähnli­
ches,
jedoch wird der Wert etwas größer sein, je nachdem wie
signifikant die freien Parameter sind. Die Logarithmen der
Likelihoods sind dann relativ hohe negative Werte, deren
2
Differenz mit zwei multipliziert den positiven x -wert ergibt.
- 142
Dieser ist um so größer,
dell ist,
d.h.
-
je überlegener das alternative Mo­
je größer der Wert der Differenz in der ecki­
riable Alter
Das Programm RATE druckt standardmäßig den natürlichen Loga­
Nullhypothese:
these aus:
Alle
als null angenommen, d.h.
aus.
Nullhypo­
bis auf die Konstante ß
0
werden
die Kovariate üben keinen Einfluß
Der von RATE ausgedruckte Wert für die Alternativhypo­
these bezieht sich dagegen auf ein Modell,
bei dem alle
Parameter als "frei" betrachtet werden. Ferner gibt RATE den
2
x -wert für den simultanen Einfluß aller Kovariate an.
In unserem Beispiel ist u=4.RATE berechnet die folgenden
Werte:
ln L(ß*)
-4975,99 (Nullhypothese)
ln L(ß)
-4827,44 ( A lternativhypothese)
-
liehen signifikanten Effekt hat, kann mit dem Likelihood­
Ratio-Test beantwortet werden.
gen Klammer ist.
rithmus der maximalen Likelihood für die folgende
143
(x J
1
Dies sei am Beispiel der Va­
demonstriert.
Die Nullhypothese lautet:
ß =o,B ,ß ,ß
beliebig (u=1)
4
1
3
2
Alternativhypothese:
B fo,ß ,ß3,B4
1
2
beliebig
Zur Berechnung der maximalen Likelihoods für beide Hypothe­
sen sind jetzt z wei RATE-Läufe erforderlich, da die "einge­
baute Nullhypothese" des Programms sich ja immer darauf be­
zieht, daß alle Koeffizienten null sind. Wir berechnen daher
zunächst den Likelihood-Wert für das Modell mit den Kovaria­
,x4 und dann den Likelihood-Wert für das Modell mit
ten
allen vier Kovariaten.
Das Programm liefert die Werte:
ln L(ß*)
-4886,19
Nullhypothese
ln L(ß)
-4827,44
Alternativhypothese
2
Den x -wert berechnen wir nach Formel
= 297 mit df=4
Der gemeinsame Effekt aller vier Kovariate ist somit
hoch
Setzt man die Likelihoods in Formel (97) ein, so
2
kann man nachprüfen, daß der x -wert 297 beträgt.
2
x
= 2 I-4827,44-(-4886,19>
]
=
(97):
118
signifikant.
Bei df=1
ist der wert hoch signifikant, die Variable Alter
hat also einen signifikanten zusätzlichen Einfluß,
Der Likelihood-Ratio-Test eröffnet darüber hinaus noch we­
sentlich mehr Möglichkeiten.
So kann man beliebige Modelle
gegeneinander testen, sofern nur gewährleistet ist,
Modell mit den angenommenen Effekten von x
und x , die Al­
2
1
ternativhypothese ein Modell mit allen vier Kovariaten (df=
Auch die Frage,
5.2.
Parametrische Modelle der Zeitabhängigkeit
könnte man da­
nach fragen, ob die Variablen
und x
gemeinsam einen zu­
4
sätzlichen Effekt ausüben. Die Nullhypothese ist dann ein
u=2).
raschen wird.
daß das
Null-Modell durch Restriktionen aus dem Alternativ-Modell
hervorgeht ( sogenannte "nested models").Z.B.
was bei
dem hohen F-Wert in Tabelle 12 allerdings auch nicht über­
ob eine einzelne Variable einen zusätz-
In diesem Abschnitt
Rate
ist
betrachten wir Modelle, bei denen die
in parametrischer Weise von der Verweildauer abhängig
nicht hingegen von Kovariaten.
Das Modell einer konstanten Hazardrate (und die daraus re­
sultierende Exponentialverteilung)
dient in der Regel als
- 144 -
- 145 -
Nullhypothese ("kein spezifisches Entwicklungsmuster"),
5. 2. 1.
ob­
wohl das Eintreten seltener, nicht koordinierter Ereignisse
durchaus diesem Modell entsprechen kann. Jenseits dieser Null­
Wie schon mehrfach erwähnt (Kap.2),
hypothese befindet sich der weite Bereich
konstanten Hazardrate r(t)=r
ster Hazard-Verlaufsmuster,
verschiedenartig­
dessen Einschränkung auf die ein­
führt die Annahme einer
zur Exponentialverteilung der
Ankunftszeiten:
fachsten funktionalen Formen immer noch die Operationalisie­
rung einer Vielzahl von Entwicklungshypothesen erlaubt.
Die
einfachsten Entwicklungsalternativen umfassen monoton fallende
oder steigende Risiken.
Auf der nächsten Stufe wären Zwei-Pha­
sen-Modelle mit zuerst zunehmendem,
oder umgekehrt zuerst fallendes,
bar.
dann abnehmendem Risiko
spricht dieser letzte Typus recht gut dem altersspezifischen
Sterberisiko
des Menschen:
für einen längeren
Hohe,
aber rasch abnehmende
Zeitraum,
schließlich erfolgt im Alter
laufsmuster ("bathtub shaped hazard·function",
1982)
recht beliebt.
siehe etwa
Wir werden uns in den folgen-
den Abschnitten aber nur mit den für sozialwissenschaftliche
Anwendungen relevanteren Alternativen eines nur steigenden
oder nur fallenden oder erst steigenden,
dann fallenden Ri­
sikos beschäftigen.
weder in SPSS noch
in BMDP sind
RATE 2 erlaubt Parame­
terschätzungen für das Exponential-,
Gompertz- und Gompertz­
für RATE 3 ist die Möglichkeit der Parame­
terschätzung für praktisch beliebige Verteilungen geplant.
Auch im Rahmen des verallgerreinerten linearen Modells
etwa ARMINGER
1984)
(GLH1,
sind Parameterschätzungen möglich,
es eine Reihe sehr einfacher,
zensierten Daten
ist der Maximum-Likelih ood-Schätzwert
der Rate der Quotient aus der Anzahl aller Ereignisse im
Zähler und der Summe aller unzensierten und
kunftszeiten im Nenner
zensierten An­
(siehe dazu auch Formel (88) in 5.1.2).
quenz des Modells sei an dieser Stelle hingewiesen.
vorausgesetzt,
daß bis zu einem bestimmten Zeitpunkt t noch
kein Ereignis eingetreten ist,
Lebensd
er­
Da
robuster graphischer Techniken
werden wir uns vor allem mit diesen beschäftigen.
Bei
ist die
s(t) kurioserweise immer noch mit der mittleren
1l
ch.
auer seit Beginn des Prozesses identis
siehe
fordern aber Vertrautheit mit der GLIM-Modellphilosophie.
gibt,
Damit läßt sich - bei vollständigen Daten - der Parameter r
leicht aus dem Mittelwert der beobachteten Zeiten schätzen.
sem Buch schon mehrfach diskutiert. Auf eine weitere Konse­
einschlägige Routinen implementiert.
Makeham-Modell,
var(T) 1/r
Implikationen des Modells mit konstanter Rate wurden in die­
Die Softwareunterstützung für die parametrischen Verlaufs­
modelle ist eher dürftig,
(99) E(T)=1/r
(100)
Auch bei technischen Sta­
tistikern sind Modelle mit diesem "badewannenförmigen" Ver­
NELSON
ist - wie wir
und für die Varianz ergibt sich der gleiche Wert:
dann ein relativ konstantes Risiko
wieder eine Zunahme des Risikos.
Der Erwartungswert ("mittlere Lebensdauer")
wissen:
dann steigendes Risiko - denk­
Mit einer dazwischen eingeschobenen dritten Phase ent­
Säuglingssterblichkeit,
-
l)
Das Ergebnis folgt mit partieller Integration
s(t)
f(T J T
t'.)d'r= f Tf(T ! T ?;t)dT-t=1/r,
t
t)=r exp(-n)/exp(-rt).
(T-t)f(T
JT
aus:
wobei
- 1 46
(101)
s(t)=E(T-t l T
-
147
t)=l
r
Wenn beispielsweise bei Ereignissen
wie Arbeitsunfällen die
r(t)
konstante Rate einen Wert von 0,1 bezogen auf die Zeitmessung
in Jahren hat,
so hat ein Arbeiter bei Beginn der Beschäfti­
gung eine erwartete unfallfreie Periode von
sich.
10 Jahren vor
Das gleiche gilt aber auch für jemanden,
der schon 10,
20 oder 30 Jahre lang in dem Betrieb tätig ist,
setzt
das
diese Eigenschaft,
sitzt,
vorausge­
Auf
Unfallrisiko bleibt im Zeitablauf unverändert.
welche das Exponentialmodell exklusiv be­
sind die gebräuchlichen Bezeichnungen
"memory loss"
"no aging"
oder
zurückzuführen.
t
f(t)
5.2.2.
Weibullverteilung
Die Weibullverteilung kann als Verallgemeinerung der Exponen­
tialverteilung angesehen werden.
zwei Parameter A>p,
(102)
r(t) =l.p(:\t)
Ihre Hazardfunktion enthält
p>O:
P-1
0
.
t
Der wichtigste Grund für die Beliebtheit dieser Verteilung
ist wohl
ihre Flexibilität.
p<1 monoton abnehmend,
Die Hazardfunktion (102)
für p>1 monoton zunehmend,
p=1
G(t)
ist für
ent­
spricht dem Exponentialmodell mit konstanter Rate r(t)=A
(siehe Abbildung 17).
Mit
diesem
Modell läßt sich daher ins­
besondere die Nullhypothese einer konstanten Hazardrate
(p=O)
gegen monotone Alternativen (p<O oder p>O)
testen.
Für die Ankunftszeitverteilung gilt:
0
t
Abbildung
17:
Hazardfunktion, Dichte und Uberlebens­
funktion der Weibullverteilung
-
(103)
f(t)=Ap(At)
-
148 -
p-l
Die "Standard-" oder "Typ 1-"
149
-
Extremwertverteilung mit der
Überlebensfunktion:
p
1-exp -(Atl
[
(104)
F(t)
(105 )
P
G(t) = exp -(a)
]
(106)
[
]
G(t)
[ lt+O
.
ist auch für negative t-Werte definiert.
Aus (104)
läßt sich ableiten,
meters A das
teilung ist.
daß der reziproke Wert des Para­
100. (1-1/e)=63,2te Perzentil der
Dies erkennt man leicht,
Überlebensver­
wenn man in (104) t
durch
Weibullverteilung insofern zusammen,
rithmus einer weibullverteilten
Sie hängt mit der
als der natürliche Löga­
Zufall s variablen extremwert­
v e rteilt ist.
1/ >. ersetzt.
Wird die Extremwertverteilung als Modell für die Ankunftszeiten
Wie im nächsten Abschnitt gezeigt wird,
gibt es auch eine
andere Begründung der Weibullverteilung,
nämlich als Extrem­
selbst (und nicht deren Logarithmen)
benützt,
dann gibt e s
insofern Probleme, a l s d a s Modell negative Zeiten
zuläßt (die
Wahrscheinlichkeit dafür wird aber in der Regel sehr klein
wertverteilung.
sein).
Der einfachste Weg,
dies zu umgehen,
besteht darin,
die Extremwertverteilung bei 0 abzuschneiden.
5. 2. 3.
Man erhält dann
die abgeschnittene Extremwertverteilung oder Gompertzvertei­
lung mit der Hazardrate (Abbildung 18):
Extremverteilungen sind bei der Modellierung von Lebensdauer­
prozessen recht beliebt,
weil sie nicht nur sehr flexibel
sind und auf beobachtete Werte oft sehr gut passen,
auch eine Herleitung aus Beziehungen
Makroebene erlauben.
ihr schwächstes
Glied in die Brüche geht,
kann bei komplexen,
zusammengesetzten Systemen der Aus­
Sind i m einfachsten Fall alle Komponenten gleichartig
und voneinander unabhängig, und ist die Zufallsvariable T
i
dann ist T= Min(T ) die
i
Lebensdauer des ganzen Systems. Sowohl die Weibullverteilung
die Lebenszeit der Komponente Nr.i,
als auch die der Gompertz-Verteilung zugrundeliegende Ex­
tremwertverteilung lassen sich aus einem solchen Kontext als
Grenzfälle bei n�oo (also sehr vielen Komponenten)
ten (siehe dazu LAWLESS
und der überlebensfunktion:
wenn
fall einer einzigen Komponente zum Ausfall des ganzen Systems
führen.
et
rltl =Be
sondern
zwischen der Mikro- und
So wie eine Kette eben dann reißt,
aus vielen Komponenten
(107)
1982
oder NELSON
1982).
herlei-
bei einer Heparametrisierung von (106)
mit C=1/0>0,B=exp(l;;/El)>O. Der Gam­
pertzverteilung entspricht also eine wachsende Hazardfunktion.
In der Demographie ist die Gompertzverteilung ein altbewähr­
tes Modell für das Ableben infolge natürlicher Todesursachen.
Bei sehr vielen voneinander unabhängigen Todesursachen ist
die tatsächliche Lebenszeit durch die erste eintretende Todes­
ursache gegeben,
stellen.
läßt sich also als Extremwertverteilung dar­
Durch Addition einer Konstanten A>O (für Todesfälle
durch Unfälle) erhält man die Eazardrate der Gompertz-Makeham­
Verteilung:
- 150 -
- 151 -
r!tl
(109)
i
!
!;-- ----------
r
i
Exponential
r(t )
Gompertz- und Gompertz-Makeham-Verteilung sind ursprünglich
nur für C>O definiert,
1
Risiko zuzuordnen.
sind also den Modellen mit steigendem
Wenn wir für C auch negative Werte zulas­
p>2
sen,
1 <p<2
sikos miteinbeziehen
kö nnen wir auf einfache Art die Situation fallenden Ri­
(Abbildung
18).
Im Fall der Gompertz­
Verteilung kommt dann ein völlig neuer Gesichtspunkt dazu: bei
C<O ist limG(t)=exp(B/C)>O.Die Wahrscheinlichkeit bei t+00
Weibu:u
p<1
zu sterben,
ist größer als o.
�
Diese Eigenschaft mag bei bio­
logischen, physikalischen oder technischen Systemen keine
Rolle spielen,
daß
LAND
Log-logistisch
bei sozialen Phänomenen kann die Möglichkeit,
ein bestirruntes Ereignis nie eintritt,
(1971)
sehr nützlich sein.
benützt die Gornpertz-Hazardrate mit C<O zur Mo­
dellierung von Scheidungsrisiken,
also in einem Kontext,
dem die Annahme,
daß
wenn auch möglicherweise
nach sehr langer
Zeit - das untersuchte Ereignis sicher ein­
tritt,
d.h.
irgendwann
jede Ehe geschieden wird,
in
nicht unbedingt ange­
messen ist.
Eine positive Wahrscheinlichkeit,
Gompertz
nis nie eintritt,
delliert werden,
ein Teil
Mover-Stayer
nicht vor.
nach dem
dem betreffenden Risiko ausgesetzt ist,
(die Stayer)
dagegen nicht
Im Gompertz-Modell mit negativem c
gesetzt,
Heterogenität mo­
etwa in einem Mover-Stayer-Modell,
(die Mover)
ein anderer Teil
daß das untersuchte Ereig­
kann natürlich auch durch
Hier ist jedes
(Abbildung
18).
liegt aber Heterogenität
Individuum dem gleichen Risiko aus­
aber nicht notwendigerweise betroffen,
so wie im Fall
einer Epidemie in der Regel nur ein Teil der Bevölkerung er­
krankt,
Sichel
Abbildung
18:
Einige Hazardraten-Modelle
ohne daß die anderen deshalb irrunun sein müssen.
- 153 -
- 1 52 -
5. 2.
4.
Die Wahrscheinlichkeit, daß das Ereignis nie eintritt, ist
(111) :
gemäß
DIEKMANN und MITTER
(1983,
1984) haben das folgende Hazard­
modell vorgeschlagen, welches besonders bei Scheidungsdaten
eine sehr gute Anpassung erbrachte:
(110) r(t)=c.t.e
-t/A
(113) lim G(t)
t+ro
Nach Konstruktion der Likelihood-Funktion auf der Basis von
(111) und (112) findet man eine explizite Lösung des Maximie­
c,J.>O
rungsproblems in bezug auf den Parameter c.
Mit einem Itera­
Diese Hazardfunktion hat die Form einer Sichel mit einem
tionsverfahren ist dann nur noch das Maximum bezüglich des
einzigen Maximum bei t=A und einem einzigen Wendepunkt bei
einen Parameters A zu bestimmen. l)
t=2A.
den,
Das Verlaufsmuster entspricht
einem zuerst steigen­
5. 2. 5.
dann fallenden Risiko (Abbildung 18).
Das Sichel-Modell ist besonders bei bestimmten Prozessen mit
nicht-monotoner Risikofunktion angemessen.
ten ist z.B.
Bei Heiratskohor­
das Scheidungsrisiko direkt nach der Hochzeit
ebenso wie nach der "silbernen Hochzeit"
gering mit einem da­
zwischen liegenden Maximum nach etwa zwei bis drei Jahren.
Ein ähnlicher Verlauf ist bei Migrationsprozessen oder im
Falle von Berufswechseln zu erwarten.
negativem Parameter C auch das Sichel-Modell eine positive
Wahrscheinlichkeit dafür impliziert, daß ein Ereignis nie
z.B.
Bei der Untersuchung von Scheidungsdaten kann man
davon ausgehen,
Ehen (70 bis 90
dann fallenden Risikoverlauf sind die Log-Normal­
und die log-logistische Verteilung. Die erste entspricht einem
Modell,
ist,
in dem der Logarithmus der Ankunftszeit normalverteilt
bei der zweiten ist dieser Logarithmus logistisch verteilt.
Die Hazardfunktion der log-logistischen Verteilung (Abbildung 18):
Hinzu kommt die häufig
günstige Eigenschaft, daß wie bei dem Gompertz-Modell mit
eintritt.
Zwei in der Literatur häufig empfohlene Verteilungen mit erst
steigendem,
daß ein relativ hoher Prozentsatz von
% je nach Zeitraum und Land) erst mit dem
( 114) r(t)
ist bis auf den Faktor 1+(J.t)P im Nenner mit der Weibull-Ha­
zardrate identisch. Sie ist ebenfalls sehr flexibel:
ist sie monoton fallend, für p>1
1
(p-1) 1P;;1.,
dann fallend.
für p�1
zuerst steigend (bis t=
Im Gegensatz zum Sichel-Modell ist
die Wahrscheinlichkeit, daß das untersuchte Ereignis nie ein­
Tod eines Ehepartners aufgelöst wird.
tritt,
null.
Für die log-logistische Überlebensfunktion gilt:
Aus (110) folgt für die überlebensfunktion und die Dichte
(115) G(t) =
der Ankunftszeitverteilung:
(111) G(t)=exp{-k
[;\.-(t+f.)
---
1+ p,t)
exp(-t/f.J
[
]}
(112) f (t)=c.t.exp(-t/;I.) exp{-Ac A-(t+A) exp(-t/A
1>
fl }
zur Maximum-Likelihood-Schätzung der Parameter des Sichel­
Modells existiert am Institut für Höhere Studien, Wien,
ein FORTRAN-Programm, das bei den Verfassern erhältlich
ist.
-
5.2.6.
- 155 -
154
Dieser Test wurde bereits in Kap.3
Graphische Verfahren
geführt.
Eine sinnvolle Strategie bei der Modellauswahl besteht darin,
möglichst allgemeine Verteilungstypen zu konstruieren,
konkurrierende Hypothesen als Spezialfälle umfassen.
laubt z.B. die Weibull-Verteilung die Modellierung
welche
So er­
wegen G(t)�exp(-rt),
also
ln G (t)�-rt,
logarithmierten werte der geschätzten
gen die Zeit auf getragen,
an­
müssen die
Uberlebensfunktion,
ge-
eine Gerade durch den Ursprung mit
Anstieg -r bilden.
steigen­
den und fallenden Risikos und enthält die Exponentialvertei­
lung als Spezialfall. Noch allgemeinere,
umfassendere Ver­
teilungstypen sind die verallgemeinerte Gamma- oder die ver­
allgemeinerte F-Verteilung (siehe etwa KALBFLEISCH und PREN­
TICE
1980).
Letztere enthält alle in diesem Kapitel bP­
schriebenen echten Verteilungen als Spezialfälle. Durch Tests
auf bestimmte Parameterwerte - die Nullhypothese H :p�1 im
0
Weibull-Modell z.B. entspricht der Exponentialverteilung kann dann das passendste Modell herausgefiltert werden. Lei­
der sind diese Tests bei den allgemeineren Modelltypen (z.B.
der verallgemeinerten F-Verteilung) nicht sehr trennscharf.
Man wird in der Regel also um mehrere Versuche und die Be­
urteilung der Güte der Anpassung nicht herumkommen.
Dabei
(116)
G{t)=exp(-(AtlP]folgt
(117)
ln G(t)=-(At)P und
(118) ln{-ln G(t)j=p ln t + p ln
Die doppelt logarithmierte geschätzte Uberlebensfunktion,
gen den Logarithmus der Zeit aufgetragen,
rade mit dem Anstieg p und der Konstanten p.ln
setzt man ln
t durch t,
Grenzen können sie sogar die Parameterschätzung mit geeig­
neten (i.a. aufwendigen) Computerprogrammen ersetzen.
A
bilden.
Er­
der Extremwertver­
bull- und Extremwertverteilung in Abschnitt 5.2.3.).
Für die
Gompertz-Verteilung ist ein derart einfacher Test leider nur
Die graphischen Verfahren stützen sich in der Regel auf Trans­
welche die betreffende Verteilung beschreiben (in der
Regel die kumulierte Hazardrate oder - äquivalent - der Loga­
rithmus der Uberlebensfunktion). Bei geschickter Wahl dieser
Transformationen kann eine lineare Beziehung hergestellt und
in der graphischen Darstellung durch eine Ausgleichsgerade
dargestellt werden. Die Parameter der Ausgleichsgeraden kön­
die
Konzentration der Meßpunkte um die Ausgleichsgerade erlaubt
die Beurteilung der Güte der Anpassung.
können die Parameter
in Sonderfällen möglich (siehe nächster Abschnitt)·
formationen sowohl der beobachteten Zeiten als auch der Funk­
nen bei der Schätzung der Modellparameter benutzt werden,
ge­
muß also eine Ge­
teilung geschätzt werden (vgl. die Beziehung zwischen Wei­
haben sich graphische Verfahren sehr bewährt. In gewissen
tionen,
A
Bei dieser Verteilung führt die
bei logistischen Konzepten gebräuchliche"log-odds-Transfor­
mation"
(119)
zum Ziel:
G(t)
p
(120) (At)
( 121)
ln
1+ (At)
)
1 ���f
1-G(t)
-mt)
. Hieraus folgt:
,
und nach Logarithmierung:
p.ln t + p.ln A.
- 156 -
Die log-odds ln
( (1-G(t))/G (t) ]
- 157 -
gegen den Logarithmus der Zeit
G(t
aufgetragen, müssen also eine Gerade bilden mit dem Anstieg
p und der Konstanten p.ln A.
Graphische Auswertungstechniken und dabei nützliche Hilfs­
mittel, z.B.
pier
verschiedene Arten von Wahrscheinlichkeitspa­
(Millimeterpapier mit nicht-dezimaler, sondern loga­
rithmierter, normalverteilter usw.
Skala), werden sehr de­
tailliert in dem Buch von NELSON (1982)
5.2. 7.
beschrieben.
Die Rohdaten
sind gruppiert und auf 10.000 Eheschließungen bezogen
der Scheidungen im Jahr der Eheschließung, im
sie
(Anzahl
1. Jahr danach
Die Beobachtung endet im Jahr 1974, alle in diesem
Jahr noch nicht geschiedenen Ehen sind also zensierte Beob­
achtungen. Tabelle
134
3-4
121
4-5
115
5-6
89
8-9
stammen vom österreichischen Statistischen Zentralamt;
usw.).
134
2-3
7-8
Als Anwendungsbeispiel wollen wir die Scheidungen einer öster­
reichischen Heiratskohorte von 1960 auswerten.
105
1-2
6-7
Anwendungsbei��.!_..._E:.11.e_,;.cheidungsdaten
0
18
0-1
10-11
11-12
12-13
15-
2
0,693
,988
3
1,099
4
1,386
5
1,609
6
1 ,792
7
1,946
8
2 ,079
9
2, 197
63
10
2,303
58
11
2 ,398
50
12
2 ,485
13
2,565
45
14-15
,998
83
51
13-14
14
878o**11s
]_
2,639
2 ,708
(1 )
-,002
-6, 21
-,01 2
-4,42
,974
-,026
,961
-,040
-3,22
-,065
-2,73
,052
,949
1937
,928
-,075
-,083
,920
,912
-,092
,898
'108
,1 00
,905
,8 93
,883
-4,29
-4 ,28
-2,95
-4,41
-2,59
-2,48
-2,38
-2,30
-2,23
-2,18
-,124
-2,08
- ,130
,878
-4,55
-3,64
-, 113
- ,119
,888
(2)
-6,32
0
1,000
0
81
73
9-10
log G(t.)
i)
-2,13
-4,37
-4 ,65
-4 '74
-4 '70
-4 ,82
-4,96
-5,04
-5, 18
-5,16
-5,27
-2, 04
14 enthält die in den einzelnen Jahren ge­
zählten Ehescheidungen und nach der Life-Table-Methode be­
rechnete Überlebenswahrscheinlichkeiten sowie die für die
graphische Auswertung erforderlichen Transformationen von t
und G(t).
ln[
( 21 ln
Die Abbildungen 19 und 20 sind die entsprechenden Darstel­
lungen für das Exponential- bzw.
Abbildung
(1)
weibull-Modell.
19 liefert keine Unterstützung der Nullhypothese
einer konstanten Hazardrate.
von einer Geraden ab!
punkte ist bis etwa
einem steigenden
Der Verlauf weicht systematisch
Eine verbindende Kurve durch die Meß­
zum 2.
Jahr nach unten
Risiko entspricht)
nach oben gekrümmt
gekrümmt
(was
und ab etwa dem 6.
{abnehmendes Risiko) ,
Jahr
lediglich im mitt­
leren Bereich erscheint die Annahme eines konstanten Risikos
-ln
[ 1n
G (t1H
G (t
i)
G(t +1)
i
}
*) Life-Table-Schätzwerte
Tabelle 14:
**)
zensiert
Beispiel Ehescheidungen:
Geschätzte Überlebens-
-
-
158
ln [in
ln
159
G(t))
G(tl
0
0
+
-1
0,02
+
0,04
-2
+
++++
+
,0,06
+
-
+
3
+
+
+
-4
+
0,10
+
+
+
o, 12
+
+
-5
+
+
-6
0,14
2
t
3
5
7
++
+
+
0,08
+
++
9
11
13
15
0
0,5
3
4
5
1, 5
8 10
6
2
15
2,5
t
log
t
t
Test bei ExponentialGraphischer Test bei Weibullverteilung
-
gerechtfertigt.
- 161
160 -
Außerdem geht eine durchgelegte Ausgleichs­
gerade kaum durch den Nullpunkt, sondern schneidet die t-Achse
bei etwa o,5.
Dieser Umstand ist durchaus gerechtfertigt:
rechtliche und prozedurale Gegebenheiten lassen eine Schei­
dung unmittelbar nach der Eheschließung kaum zu,
Schnittpunkt bei t =0,5=6
"Vorbereitungszeit"
den.
und der
Monate kann als durchschnittliche
für eine
Scheidung sicher akzeptiert wer­
Konsequenterweise wäre dann der Nullpunkt auf der
achse zu verschieben bzw.
Zeit­
wären alle Zeiten um den Wert
0,5
zu verringern. Die verbleibenden systematischen Abweichungen
von einem linearen Verlauf lassen das Exponentialmodell trotz­
dem inadäquat erscheinen.
Modell geschätzte Hazardfunktion
-
ihren maximalen Wert erst
sehr spät einnimmt, das den Schätzwerten entsprechende Schei­
dungsrisiko also während des gesamten Beobachtungszeitraums
zunimmt.
Aus dem Weibull-Plot können wir nämlich für den An­
stieg den wert ca.
1,5,für die Konstante ca.
-6
entnehmen,
was wegen praktisch identischer Ordinatenwerte auch für den
log-logistischen Plot gilt.
Damit ergeben sich sowohl für den
Weibull- als auch den log-logistischen Fit grob geschätzte
Parameterwerte p=Anstieg�1,5, ln A =Konstante/p�-4, also
A"'0,018. Da die log-logistische Hazardrate für p>1 ihren
p
Maximalwert bei t=(p-1) l / f'>., annimmt, entspricht dieser Wert bei
p=1,5,
A=0,018
einer Ehedauer von etwa 35 Jahren. Erst da­
nach sinkt,im geschätzten Modell, das Scheidungsrisiko wieder.
Systematische Abweichungen zeigt auch der Weibull-Plot
bildung 20).
(Ab­
Hier wäre eine verbindende Kurve durchwegs nach
unten gekrümmt, der Vergleich mit einer dem Shape-Parameter
p=1 entsprechenden eingezeichneten Geraden zeigt für junge
Ehejahre einen stärkeren Anstieg (p>1,
also
zunehmendes Schei­
dungsrisiko), für eine längere Ehedauer einen schwächeren An­
stieg (p<1,
also abnehmendes Scheidungsrisiko). Wird unter
Berücksichtigung der oben angeführten Überlegungen (Mindest­
ehedauer ca.
log
6
Monate) der Zeitnullpunkt verschoben, also
[-log G(ti) j
gegen
(t -0.5) aufgetragen, wird die
i
Krümmung zwar flacher, die systematischen Unterschiede blei­
log
ben aber bestehen.
Diese Ergebnisse legen ein
log-logistischen Modell.
im vorliegenden Fall ln
zwei-Phasen-Modell mit erst stei­
Wie man leicht nachrechnen kann,sind
(-ln G(til }
und ln
[(1-G(til)/G(ti) J
praktisch identisch (die Differenzen werden mit
sind aber auch bei
noch relativ unbedeutend).
=15
zunehmendem
mit -2,04 gegenüber
jede Ehe mit Sicherheit irgendwann einmal geschieden wird.
Ein Versuch mit Modellen,
erscheint also sinnvoll.
Die systematischen Abweichungen
zurückzuführen ist, daß die unter diesem
bei denen das nicht der Fall ist,
Eine Gompertz-Hazardrate r(t)
mit C<O könnte z.B. adäquat sein.
Für die Gompertz-Verteilung gibt es i.a.
keinen einfachen
graphischen Test, wohl aber im vorliegenden Fall, in dem wir
die Überlebensfunktion zu regelmäßig wiederkehrenden Zeit­
(122l
ln G(tl
Für diese gilt nämlich:
t
= �(1-ec )
c
und für das darauffolgende Jahr t+1:
(123)
ln G(t+1)
�,97
von der Linearität bleiben also auch im log-logistischen Plot
erhalten, was darauf
ihre überlebensfunktionen bei t+00 gegen O gehen, daß also
punkten geschätzt haben.
gendem, dann fallendem Risiko nahe, etwa entsprechend dem
größer,
Alle bisher untersuchten Modelle haben die Eigenschaft, daß
�(
c
Differenzbildung führt zu:
(124)
ln
ln G(t)-ln G(t+1l
(1
- 163 -
- 162 -
und erneutes Logarithmieren zu:
(125) ln
ln
(1n
��;�)]
G
t
[in .ß< i)
G(t +1)
i
]
aufgetragen,
gegen
eine Gerade mit dem Anstieg C ergeben.
muß also ungefähr
Die entsprechenden Or­
dinatenwerte gehen ebenfalls aus Tabelle 14 hervor.
phische Auswertung in Abbildung 21
Die gra­
zeigt für Ehedauern ab
etwa dem dritten Ehejahr eine recht gute Anpassung und insbesondere keine systematischen Abweichungen.
Der Anstieg der
Ausgleichsgeraden ist etwa -o, 1, was einem mit jedem Ehejahr
um etwa 10 % sinkenden Scheidungsrisiko entspricht.
Konstanten der Ausgleichsgeraden ln[
ein B-Wert von ca.
0,019 berechnen,
Aus der
(1-ec)}�-4 läßt sich
was einer kohortenspezi­
fischen Wahrscheinlichkeit von exp(B/C)�0,82 entspricht,
eine Ehe nie geschieden wird
daß
(nach 15 Jahren waren 12 % der
beobachteten Ehen geschieden).
-4,0
+
-4,2
+
+
-4,4
+
+
+
-4,6
+-
+
+
-4,8
Für die ersten Ehejahre ist
dieses Modell allerdings auch nicht adäquat.
+
+
-5,0
+
Als Modell für kohortenspezifische Ehescheidungsverteilungen
wäre also die Verbindung eines Zwei-Phasen-Modells mit der
Möglichkeit, daß die Überlebensfunktion nicht gegen Null geht,
wünschenswert.
Das Sichelmodell hat diese Eigenschaft,
sich aber nicht graphisch überprüfen.
läßt
Unsere Untersuchungen
einer Vielzahl von Heiratskohorten in mehreren Ländern hat
eine ausgezeichnete Anpassung des Sichelmodells im Vergleich
+
+
-5,2
-6,3
-6,4
0
2
4
6
8
10
12
14
f
mit den fünf alternativen Modellen in Abbildung 18 ergeben
(vgl.
DIEKMANN und MITTER 1984).
Abbildun;i: 21:
Graphischer Test bei GompertzVerteilung
- 165 -
- 164
5.3.
Kovariateneffekte und
Zeitabhängigkeit
B log-linear,
Wurden in Abschnitt 1 parametrische Modelle mit Kovariaten
ohne Zeitabhängigkeit und i n Abschnitt 2 zeitabhängige Raten
ohne Kovariate thematisiert, so wollen wir in diesem Abschnitt
beide Abhängigkeiten miteinander kombinieren. Ein relativ all­
gemeines Modell ist die Gompertz-Makeham-Funktion mit Kovaria­
ten,
deren Parameter mit RATE an Daten geschätzt werden kön­
nen.
steht andererseits schon im Exponenten,
neare Schreibweise zu einer doppelt
funktion führte,
Die verallgemeinerte Gompertz-Makeham-Funktion in
Wie im vorhergehenden Abschnitt erläutert,
Hinzufügung einer Konstanten
RATE
erhält man durch
zur Gompertzfunktion die Gom­
pertz-Makeham-Funktion:
(126) r(t)
so daß eine log-li­
exponentiellen Raten­
deren empirische Interpretation mit größeren
Schwierigkeiten verbunden ist.
Wenn B ferner eine log-lineare und B* eine lineare Kovariaten­
funktion ist,
5.3.1.
so wird dadurch eine bei der Likelihood-Maxi­
mierung eventuell auftretende negative Rate vermieden. C
(129)
r{t)
so folgt für die Ratengleichung:
t
t
�
�
B*+C.t
A+e
Diese Verallgemeinerung des Gompertz-Makeham-Modells wollen
wir
jetzt auf unser Beispiel mit den vier Kovariaten Alter
(x J, Sozialkategorie (x ), Geschlecht (x ) und Arbeitslo3
2
1
sengeld
) anwenden. Wir untersuchen im ersten Schritt ein
t
allgemeines Modell
ohne Restriktionen bezüglich aller addi­
tiven Effekte. Die A-,
Zur Berücksichtigung von Heterogenität können die Parameter
B- und C-Gleichungen des Modells (129)
lauten:
A,B und C als Funktionen von Kovariaten formuliert werden.
Dabei bieten sich zwei einfache Funktionen an,
und log-lineare Funktionen wie in Abschnitt
1
nämlich lineare
Z.B. können wir für A schreiben:
(127) A
A
(131)
B
(linear)
Zur Schätzung der
oder:
(128)
(130)
beschrieben.
15 freien Parameter des Modells wird die
Likelihood-Funktion aus f(t) und G(t)
A
(log-linear).
Analoges gilt für B und C.
Asymptote des Modells.
chung (25)
wenn C negativ ist,
gebildet
in Kap.2.4 und den Anhang 2).f(t)
(siehe Glei­
und G(t)
wie­
derum sind eindeutig bestirrunt durch die Modellwahl (129)
wird A zur
Je länger die Verweildauer t,
desto
mehr nähert sich die Rate dem Wert von A an.
Es empfiehlt sich häufig, A und B als log-lineare, C hinge­
gen als lineare Kovariatengle'ichung zu schreiben.
Sind A und
den Spezifikationen von A,B und c.
mit
Das Prograrrun RATE maxi­
miert nun die Likelihood-Funktion bezüglich der 15 Parameter
ist es nur erforderlich, eine Programmkarte in dem
in Abschnitt 5.l.3wie folgt zu ändern:
MODEL
(4) A=1 B=1 C=-1. Hiermit wird Modell 4
die Gompertz-Makeham-Funktion, gewählt. A=1 und
fizieren log-lineare Modelle für A und B, C=-1
für C. Je nach Datensatz
eine lineare
tuell erforderlich,
Karte zu erhöhen.
Zahl der Iterationen mit
:)
-
M
"'
N
N
0
0
0
H
0
.µ
�
(l)
:>
1
0
8
0
8
0
0
0
0
0
„
"'
1.0
0
""
0
0
"'
M
N
0
0
0
0
0
0
lf
N
<O
II
M
<O
1
II
0
<O
1
U1
...
0
8
4
0
.µ
,;:
<ll
i>
1
0
Jr!
""
1
0
1
0
0
„
"'
"'
w
......
rl
m
0
0
0
0
0
0
0
II
(lJ
"'
r-1
r-l
:l
0
&
1
�
'!""""
""
f'
""
""
0
1
Cl
O'"l
0
"'
.....
"'
"'
„
("'"0
8
0
t.{')
0
ill
..<:;
.µ
0
P..
Wert des Modells zeigt Tabelle
ö
1
.µ
r-l
Wir sehen,
�
\D
ro
'
fl
4-1
'O
"'
.µ
�
ll
16.
daß alle Kovariate signifikante Effekte aufweisen.
Ist aber auch insgesamt das
"ökonomischere"
Parametern dem vollständigen
Modell mit neun
15-Parameter-Modell
überlegen,
oder geht die Null-Setzung von Parametern auf Kosten der Er­
klärungskraft? Der Likelihood-Ratio-Test kann hierüber Aus­
kunft geben.
0
0
Das der­
Die geschätzten Parameter und den maximalen ln-Likelihood­
lt)
8
beibehalten wollen.
>-,
�1 :;:1 -g
0
(Geschlechtseffekt)
art modifizierte Modell hat dann die Gestalt:
e.�
�
0
P a rameter c3
(i.I
"'
i? <lls
<.o
wobei wir als Ausnahme von
dieser Regel auch den nahe an der Signifikanzgrenze liegenden
.µ .,_;
0 .µ
P.. qj
N
Eine wesentliche
alle nicht-signifikanten Kova­
riate unberücksichtigt zu lassen,
ll .g
"'
0
N
Das Modell ist noch bei weitem zu komplex.
Vereinfachung bestünde darin,
�
0
ge­
um die Nullhypothese
zurückzuweisen.
4
<11
'1l
H
((j
IO;
(Abwesenheit
Dies ist nicht verwunderlich,
nügt doch schon ein Kovariateneffekt,
.u
,...
H
0
.µ
von 428 gegenüber der einfachen Nullhypothese
aller Kovariateneffekte).
H
(!)
<Q
::s
((j
0
0
U1
""
111
0
<.0
<,.Q
Der gemeinsame Einfluß aller Kovariate ist natürlich hoch­
2
signifikant. Der Likelihood-Ratio-Test liefert einen x -wert
H
w
,:::
•rl
<ll
8
Es fällt auf,
und daß alle Parame­
ter des Faktors Geschlecht nicht-signifikante Werte aufweisen.
0
;,::
1f
""'
<o
In sieben von fünfzehn Fällen ist der Betrag des Para­
daß der A-Vektor kaum eine Rolle spielt,
;::;
0
U"l
CS\
N
0
0
II
-
meters größer als der zweifache Standardfehler.
,:::
(!)
.µ
c
llJ
.µ
lll
\D
...
('")
O'.)
0
hervor.
r-l
rl
"
,:::
O'.)
M
.....
"'
0
0
0
N
167
-
Die empirischen Resultate des RATE-Laufs gehen aus Tabelle 15
"'
0\
"'
0
„
�
166
Hypothese)
Die Nullhypothese
Wert von -4765,19
<
{oder besser:
(Tabelle
16)
�
ln !.(ß*)­
gegenüber dem ln L(ß)-Wert von
-4761,86 des alternativen 15-Parameter-Modells
N
�
die restring erte
ist jetzt das 9-Parameter-Modell mit de
(Tabelle
Bei df=6 Freiheitsgraden kalkulieren wir nach Formel
einen
von:
15).
(97)
168 -
Variable
Parameter
Konstante
a.
1
„
Konstante
Sozialkategorie
(
x2
b =
0
)
Arbeitslosengeld (X )
4
Konstante
b2
c
Sozialkategorie
(x3)
=
b4=
„
(x )
1
Geschlecht
Standardfehler
2,49
Alter (x )
1
Alter
-
1
=
o, 117
- 4,71*
o,136
-0, 5 5 1*
O, 126
Tabelle 16:
Zwar ist die
0,00194
-0,000438*
0,0000599
-0,00377*
0,00163
0,00281*
0,00106
signifikant.
Rate sinkt und umgekehrt mit abnehmender Rate steigt.
Der
zeitabhängige Teil
(C-Vektor) läßt einige interessante
Besonderheiten erkennen. Gehen wir einmal von der Gruppe
männlicher Arbeiter aus (x :>
1
31
Jahre,
finden, mit
zunehmender Dauer der Arbeitslosigkeit.
len nach dem gewählten Kriterium keine besondere Verbesserung
des Modells dar.
also die Dauer der Arbeitslosigkeit
und
einmal
einen
daß wir ein relativ besseres,
(dazu weiter unten) gefunden haben. wei­
tere Likelihood-Ratio-Tests unter Einschluß oder Ausschluß
Modellen führen.
rn
qualitativer Hinsicht unterscheiden sich die Ergebnisse nicht
Rate in Abschnitt 5 .1.3.
wenn
Hier hat die Ver­
Rate und somit auf
Dem Modell
zufolge hat
einmal einen positiven
negativen Effekt auf die Chance der
Wiederbeschaftigung, und zwar in prognostizierbarer Weise
abhängig
von den Merkmalen der betroffenen Arbeitslosen.
Dies ist gewiß
nicht hingegen, daß wir das beste Modell im Zuge der induk­
zu
In Glei­
chung (133) ist der Faktor (c +c x •c x +c x ) vor dem "t"
2 2
1 1
3 3
0
positiv. Unabhängig vom Geschlecht und der Sozialkategorie
das Lebensalter höher als 32 Jahre liegt.
die zusätzli­
jün­
, x =1).
3
ist das Vorzeichen des Faktors auf jeden Fall negativ,
chen sechs Parameter des komplexeren Alternativ-Modells stel­
von dem Modell mit zeitunabhängiger
Rate, jedoch gilt
daß die Verweildauer mit wachsender
die Chance der Wiederbeschäftigung.
Betrachten wir jetzt noch die Ergebnisse in Tabelle 16.
umgekehrt.
Rate nicht mehr der reziproke Wert der Verweil­
weildauer einen negativen Effekt auf die
bestimmter Kovariate könnten zu "besseren"
sie größer als bei
Bei dieser Gruppe steigt die Chance, eine Beschäftigung
2·(-4761,68+47 6 5 ,19)=7,02.
tiven Suchstrategie
(x2=0) ist
Bezüglich der Verweildauer im zustand der Ar­
die qualitative Aussage,
gerer,
Parameter des modifizierten Modells
Der Wert ist eindeutig nicht-signifikant, d.h.
desto
{x =o) ist die Rate geringer als
3
dauer wie beim Modell mit zeitunabhängiger
0,0110*
Der Test besagt natürlich nur,
Bei Frauen
beitslosigkeit ist das Vorzeichen jeweils
0,0000261
in r, cß) �-4765,19
höher die Rate.
Angestellten.
0,00017 1*
* Bei einer Irrtumswahrscheinlichkeit von 0,05
Je älter, desto geringer, und je mehr Arbeitslosengeld,
bei Männern,und bei Arbeitern
2,20
-0,386*
169 -
eine interessante
Implikation des Modells.
tlber die Diskussion der Ratenfunktion hinaus können wir wie­
der gruppenspezifische tlberlebensfunktionen G(t) prognosti­
zieren,
die ein besonders anschauliches Bild des Prozesses
mitsamt der Kovariateneinflüsse
liefern.
(13) in Verbindung mit Definition
lautet die Formel für G(t):
(134) G(t)
e
(T)dT
=e o
Gemäß Gleichung
(12) (siehe Kap. 2. 2. 3 )
J(A•Be-c.T)dT
-
170 -
der Standardfehler und der Likclihood-Ratio-Tests Parameter
Löst man das Integral, so erhält man den Ausdruck:
als null angenommen werden.
[
Up-Strategie".
·- A.t+!!
(135) G(t)
e
C
"
lt
(137)
e
„
,.,,
(Tabelle 16):
"Bottom­
bis sozusagen der
"Grenz­
zusätzlicher Erklärungskraft den "Grenzkosten"
durch Hinzufügung weiterer Parameter entspricht. In beiden
Fällen lautet die Devise:
(2,49-0,386 x1)
so
So viel Erklärungskraft wie möglich,
viele Parameter wie nötig,
wobei der Likelihood-Ratio-Test
ein Maß der relativen Erklärungskraft sein kann.
"'
B
Für die er­
stere, die Top-Down-Strategie, spricht die Einfachheit und
die relative
,..
(138) C
Der zweite Weg ist die
Hier wird von einfachen Modellen ausgegangen,
die soweit angereichert werden,
nutzen" an
In unserem Fall ergab sich für A,B und c
(136)
171 -
�
0,0110-0,000438 x -o,oo377 x +0,00281 x
2
3
1
Eindeutigkeit der Suchstrategie. Inwieweit das
derart an den Daten modifizierte Modell auch auf andere Stich­
proben übertragbar ist, müssen deduktive Tests erweisen. Für
Für beliebige Merkmalskombinationen,
pen von Arbeitslosen, können
unter
d.h.
für beliebige Grup­
jetzt mit der Formel für G(t)
Berücksichtigung der drei A,B,C-Gleichungen die
jewei­
die zweite Strategie ist das Argument anzuführen,
daß
die Suche nach einem befriedigenden Modell mehr von
hierbei
theoreti­
schen Gesichtspunkten geleitet wird.
ligen Überlebensfunktionen prognostiziert werden, wobei man
am besten einen programmierbaren Taschenrechner zu Hilfe
Neben der eher induktiven Modellsuche gestatten die parame­
nimmt.
trischen Verfahren, wie in Abschnitt 5.1.3.
demonstriert, natür­
lich auch die Möglichkeit streng deduktiver Hypothesentests.
Die prognostizierten Werte gruppenspezifischer Überlebens­
Diesen Weg sollte man immer dann beschreiten, wenn man vor
funktionen sowie auch andere Implikationen des Modells kön­
der Datenanalyse über eine genau spezifizierte Hypothese
nen ferner mit den Beobachtungen bzw.
fügt. Die Bestätigung einer Hypothese
mit den nicht-parame­
trisch geschätzten Überlebensfunktionen
glichen werden.
von Modelltests
1979,
(siehe Kap.3}
ver­
Dadurch eröffnen sich weitere Möglichkeiten
(zu einer Anwendung siehe TUMA und HANNAN
keineswegs,
daß es sich um eine "gute"
einem Rennen mit nur einem Pferd
per"
besagt
ver­
allerdings noch
Hypothese handelt. Bei
kann auch ein "müder Klep-
gewinnen„
S.840 ff.).
Im Sinnes eines Entscheidungsexperiments empfiehlt es sich
Einige Bemerkungen noch zur Modellsuche. Wenn die theoreti­
daher,
schen Vorstellungen relativ vage sind, dann kann - analog
als Entscheidungsinstanz
zur "Stepwise-Regression"
in Kap. 4 - die Suche nach dem adä-
quatesten Modell auf zwei Wegen
•
konkurrierende Hypothesen gegeneinander
z.B.
zu testen und
den Likelihood-Ratio-Test her­
anzuziehen.
Der erste Weg,
die "Top-Down-Strategie" wurde hier beschritten. Man geht
Darüber hinaus ist es in jedem Fall ratsam, Konsequenzen des
von einem allgemeinen Modell aus und versucht das Modell
Modells
schrittweise zu vereinfachen, indem unter Berücksichtigung
mit den beobachteten Werten zu konfrontieren,
über die
(wie z.B.
gruppenspezifische Überlebensfunktionen)
um Aufschlüsse
Erklärungskraft des Modells zu erhalten.
-
1.72 -
-
5.3.2. weitere RATE-Modelle
173
-
hand sogenannter "Change-Daten" geschätzt werden. Bei Change­
Daten ist nur der Typ des ersten Ereignisses
j nach k)
Das Programm RATE2 erlaubt die Schätzung der Parameter von
von
vier Modellen:
Zeitpunkt
(1) Kovariateneffekte bei zeitunabhängiger Rate
(Exponential- oder Poisson-Modell),
Zeitab­
(Cox-Regression),
Die Modelle
(2)
(1),
(3) und
(2) und
beziehen.
Darüber hinaus gestatten die Modelle
(4) die Berücksichtigung zeitabhängiger Kovariate.
Bei zeitabhängigen Kovariaten
einer Berufskarriere)
raum in einzelne
(4) haben wir bereits kennengelernt,
ist sozusagen in doppelter Weise stochastisch. Der
(z.B. das Einkommen während
können die Parameter von Zeitperiode
zu Zeitperiode variieren,
(4) Gompertz-Makeham-Modell.
Modell
wobei der gesamte Beobachtungszeit­
Zeitperioden unterteilt wird.
Erhebliche Vorteile bezüglich der Datenfile-Organisation und
weiterer Modell-Optionen sollen
Ratengleichung mit linearen oder log-linearen Kovariateneffek­
des Nachfolge-Programms
ten wird noch ein multiplikativer Fehlerterm hinzugefügt.
Typ kann die Weibull-Verteilung
Fehler werden als gamma-verteilt betrachtet,
kann.
daß die Rate
Die
eine relativ
allgemeine Verteilung mit positiver Zufallsvariablen.
mit ist gewährleistet,
(Zustandswechsel
jedoch der exakte
bekannt.
stands-Modelle
(2) Berücksichtigung eines Fehlerterms in der Ratengleichung,
hängigkeit
nicht
Die vier Modelle können sich auf zwei- oder auch auf Mehr-Zu­
1)
(3) Partial-Likelihood-Modell mit unspezifizierter
in einem Zeitintervall,
Da­
nicht negativ werden
ten gewählt werden.
angekündigte Modifikationen
RATE3 bieten.
Als
zusätzlicher Modell­
mit Kovaria­
(siehe Kap.5.2)
Ferner wird die Möglichkeit eröffnet,
Programm selbstgewählte Ratenfunktionen hinzuzufügen,
nicht
dem
die
in das Schema der vorgegebenen Modelltypen passen.
Im Grunde handelt e s sich bei dem Modell um eine Ver­
allgemeinerung des klassischen "Compound-Poisson-Prozesses"
In letzter Zeit sind Versuche unternommen worden,
von GREENWOOD und YULE
der von RATE vorgesehenen Modelltypen sowie weitere Modelle
(CHIANG
1968),
wobei die Generalisie­
rung in der Einbeziehung von Kovariaten besteht.
in das Programm GLIM zu integrieren
(ARMINGER
die meisten
1984).
Hier bahnt
sich eine Tendenz zur Vereinheitlichung zahlreicher Programme
Mit Ausnahme von Modell
(1) sind zur Schätzung der Parameter
mit RATE Ereignisdaten erforderlich.
Modell
(1) kann auch an-
sozusagen unter dem Dach von
GLIM an. Dennoch dürften hier­
durch Programme wie RATE kaum inaktuell werden,
wenn die
Programmsprache den Vorzug der Benutzerfreundlichkeit und
leichten Erlernbarkeit aufweist.
5.4.
l) Modell (1) ist ein
technischen Gründen
Modelle des Typs (1)
von Modell (4) zu
Modell (4). Aus rechen­
en. .Lem:swer·t, einfache
als Spezialfall
Die Verfahren zur Schätzung der Parameter bei Mehr-zustands­
Modellen
(oder Multi-State-Modellen) beruhen auf einer ein­
fachen Generalisierung des Maximum-Likelihood-Schätzverfah-
174
rens.
- 175 -
-
Der Aufbau des Datenfiles wird etwas komplexer,
zu beachten ist,
wobei
daß nunmehr die Episoden die Fälle des Da­
tenfiles bilden. Wesentlich aufwendiger im Gegensatz zur Pa­
rameterschätzung wird bei Mehr-Zustands-Modellen die mathe­
matische Untersuchung der Modellkonsequenzen.
Dazu werden wir
abschließend einige Beispiele der dynamischen Anal_y� von
zustand
\\�
\�
Harte Drogen 2
Weiche Drogen
Mehr-Zustands-Modellen diskutieren.
Keine Drogen 0
5.4.1 .
schon aus Kap.1
Modell einer Drogenkarriere mit den
in Abbildung
Parameter von Kovariateneinflüssen oder
kann
22 gezeig­
geschichten erfolgen,
Episoden umf assen.
Dia,gramm der
Ereignis­
Personen-
ST
Nummer
Ein Beispiel zeigt das Diagramm in Abb.23.
Person Nr.1
T
u
in das Datenfile-Muster
der darunter stehenden Tabelle eingegangen.
4
2
Ereignisgeschichte
Ereignisdaten
zz
ET
sz
VD
0
5
5
7
7
10
10
14
0
14
14
0
5
5
5
14
Start-Zeit
Endzeit der Episode
VD
Verweildauer
SZ
Startzustand
0
0
0
0
x
2
Kovariate
"
2
"1
0
600
0
1500
0
800
0
600
1800
0
0
2
x ,
1
ST
ET
zw
0
2
0
1000
0
2050
Episodenspezifische
Messungen der Kovariate
(z.B.
(ET-ST)
x
�Geschlecht,
1
x
�
Netto-Einkommen) .
2
zz
Zielzustand
zw
Zustandswechsel
Der Datenfile sieht pro Episode
0
zensiertes Datum
eine
11
logische Lochkarte''
Zustandswechsel
(keine zensierung)
Muster eines Datenfiles
Drei-Zustands-Modell
(Jahre)
i2
der
die pro Individuum in der Regel mehrere
Beispiel ist als
t
1
t
Zeitabhängigkeiten
bei Mehr-Zustands-Modellen auf der Basis von
Dieses
2
ti
t
i1
2
1i
1
bekannte
ten drei zuständen. Die Schätzung der Übergangsraten bzw.
person i
.....,..._,
Parameterschätzung bei Mehr-Zustands-Modellen
Betrachten wir als Beispiel das uns
( "spell" l
Episode
Y(t)=k
vor.
- 176
-
-
177
-
Um Hinweise auf Verletzungen der Markov-Annahme (Unabhängig­
Zur Beschreibung der Episoden sind nunmehr mindestens die
folgenden vier Variablen in dem Datenfile vorzusehen:
Startzeit (ST)
Die
und der Startzustand (SZ) sowie die Endzeit
(ET) und der Zielzustand (ZZ).
ZW) sind redundant,
d.h.
Die übrigen Angaben (VD und
sie folgen
zwingend aus den Werten
der vier zentralen Episoden-Variablen.
Diese redundanten va­
riablen sind gelegentlich zweckmäßig für zusätzliche Analy­
sen alternativer vereinfachter Modelle. Außerdem enthält der
File noch zeitunabhängige (x J
1
und
zeitabhängige (x2) Kova­
riate (zu verschiedenen Datenfile-Mustern siehe auch CARROLL
1982).
Die Parameter können nun beispielsweise mit dem Programrq RATE
Der un­
terschied zur Schätzmethode im Falle des Zwei-Zustands-Modells
mit absorbierendem Zielzustand besteht nur in der Komplexi­
Das Mehr-Zustands-Schätzproblem ist nämlich - wie TUMA,
HANNAN und GROENEVELD
ren Zuständen) zu erhalten,
ist es mitunter ratsam,
stimmte Episoden pro Untersuchungseinheit (z.B.
erste Episode) bei der
Ergebnis
gleichen.
nur be­
nur die
Schätzung zu berücksichtigen und das
mit der Schätzung
aufgrund aller Episoden
zu ver­
Starke Unterschiede können auf eine Verletzung der
Annahme hinweisen (siehe zu dieser Möglichkeit HANNAN und
CARROLL 1981).
5.4.2. Die dynamische Analyse von Mehr-Zustands-Modellen
5.4.2.1.
mit der Maximum-Likelihood-Methode geschätzt werden.
tät:
keit der Ereignisse vom vor-vorhergehenden und allen frühe­
Wurden die Raten anhand der Daten geschätzt,
den Formeln in Kap.2.3
ziert werden.
so können gemäß
die Überlebensfunktionen prognosti­
Diese lauten für das Beispiel des Drei-Zustands­
Modells mit zeitunabhängigen Raten:
{1979) zeigen - auf eine Anzahl von
zwei-Zustands-Schätzproblemen reduzierbar.
Für jede Kombina­
tion von Ausgangs- und Zielzustand können die Parameter se­
parat geschätzt werden,
wobei Zustandswechsel
Zielzuständen als zensiert betrachtet werden.
zu den übrigen
Die Rate r
02
(bzw. die Koeffizienten der hierauf wirkenden Kovariate) in
Abbildung 22 beispielsweise kann allein auf der Basis aller
Episoden mit dem Ausgangszustand o und dem
Zielzustand 2 ge­
schätzt werden. Wechsel zum Zustand 1 sowie "echte"
Zensie­
runen werden hierbei gemeinsam als zensierte Daten behan­
)
delt. 1
1)
Da die Raten normalerweise von Kovariaten abhängig sind,
kön­
nen in die Formeln zur Prognose der gruppenspezifischen über­
lebensfunktionen die entsprechenden Ratengleichungen mit Ko­
Rechentechnisch wird in etwas anderer weise vorgegangen.
in
dazu auch die allgemeine Likelihood-Funktion
Vg.l.
TUtlA (1979) oder TUMA,
(140) G (t)
1
HANNAN und GROENEVELD (1979).
variaten eingesetzt werden.
gig,
Sind ferner die Raten zeitabhän­
so steht (gemäß Formel (20) in 2.3
J
im Exponenten der
überlebensfunktion die kumulierte Hazardfunktion R(t).
- 179 -
- 178 -
Im Falle zeitunabhängiger Raten ist die mittlere Verweildauer­
Interpretation der Kovariaten-Effekte zu modifizieren.
5.4.2.2.
riablen Y(t)
Der
E(T )' ist nun­
j
mehr der Summe der zeitunabhängigen übergangsraten vom Zu­
Erwartungswert der Ankunftszeit im Zustand j,
stand j
prok:
zu allen Zielzuständen k, also der Hazardrate rezi­
1)
In Kap.2 haben wir zwei mit einem stochastischen Prozeß ver­
Die Ankunftszeit T
knüpfte Zufallsvariablen unterschieden:
und die Zustandsraum-Variable Y(t).
Bisher haben wir uns nur
nicht jedoch explizit
mit der Verteilung der Ankunftszeiten,
mit derVerteilung von Y(t)
beschäftigt. Dies rührt daher,
daß
beim Zwei-Zustands-Modell mit absorbierendem Zielzustand die
Schreiben wir beispielsweise für
den Zustand O die beiden
Ratengleichungen (die eingeklammerten Indizes der a-Parameter
verweisen auf den Ausgangs- und Zielzustand):
X
X
2
1
.
(01) ·°'1(01) a.2(02)
(143) r
01
x
(144 )
r
02
x
1
2
Kenntnis der Verteilung von Y(t) keine neuen Einsichten bringt.
Hier ist nämlich die Verteilung von Y(t) p (t)=P[Y(t)=ü) und
0
p (t)=P[Y(t)=1] (siehe Abb.5 in Kap.2) "automatisch" mit G(t)
1
gegeben, denn es gilt ja: p (t)=G(t) und p (t) 1-G(t)=F(t).
1
0
Die absolute (unbedingte) Wahrscheinlichkeit,zum Zeitpunkt t
im Zustand 0
keit G(t),
zu sein,ist ja identisch mit der Wahrscheinlich­
den Zeitpunkt t im
Zustand 0
zu erleben,und p (t)
1
ist die dazu komplementäre Wahrscheinlichkeit F(t).
(10(02) ,(11 (02) "°'2(02) I
Bei Mehr-Zustands-Modellen ist dagegen die Ableitung der Wahr­
so erhalten wir jetzt für E(T ):
0
scheinlichkeitsverteilung bezüglich der einzelnen zustände
j
G (t} ist dabei in
j
der Regel nicht mehr mit der (unbedingten} Aufenthaltswahr­
im allgemeinen wesentlich komplizierter.
scheinlichkeit im Zustand j identisch,
da nun nicht nur so­
zusagen der "Abfluß", sondern auch der "Zufluß"
wirken also in doppelter Weise auf die mittlere
und x
x
2
1
und
Verweildauer ein, nämlich über die Beeinflussung von r
01
von r 2• Der Gesamteffekt einer Veränderung um beispielsweise
0
-Einheiten auf E(T l kann mittels Formel (145) bzw. im
0
allgemeinen Fall mittels Formel (14 2) berechnet werden.
zum Zustand
Zur Berechnung der Verteilung von Y(t),
von
aus
von Personen
j in Betracht zu ziehen ist.
(t) für die Zustände j=1,2, ••• n,
d.h.
zur Berechnung
leitet man
zunächst
Modellannahmen, insbesondere der Markov-Eigenschaft,
ein System von Differentialgleichungen her,
das den stocha­
stischen Prozeß definiert (siehe dazu Anhang 4).
Mit der
Lösung des Gleichungssystems erhält man sodann die Wahr­
1)
Allgemein gilt bei zeitabhängigen Raten:
E(T.)
J
f t f.(t)dt= lt r,(t)exp[-R.(tl]dt
J
j
J
Q
Q
Im Falle zeitunabhängiger Raten gilt R j(t)=rj.t mit der
oben angeführten Lösung (14 2) des Integrals.
scheinlichkeiten p (t).
j
181
- 180 -
Man kann zeigen,
daß das folgende System von linearen Diffe­
rentialgleichungen allgemein einen Markov- oder Semi-Markov­
�
p
-p
können wir eine Gleichung eliminieren und
0- 1
erhalten dann das Gleichungssystem:
Wegen
Prozeß mit n diskreten Zuständen festlegt:
(t)p. (t)
(146)
J
(150) P
o
n
+
z;
k=O
k;fj
Intuitiv läßt sich die Gleichung wie folgt deuten:
Der erste
Eine Lösung dieses Systems von zwei linearen Differential­
Term auf der rechten Seite ist das Produkt aus der Wahrschein­
gleichungen (d.h.
lichkeit im Zustand j zum Zeitpunkt t zu sein,
p ,
1
mit der Neigung
dem
"Abfluß"
zum Zustandswechsel.
multipliziert
Das Produkt entspricht
aus Zustand j. Analog ist der zweite Term als
Summe der "Zuflüsse" aus allen übrigen zuständen zu inter­
pretieren.
"Zufluß" minus "Abfluß"
ist dann die Wahrschein­
zu vereinfachen,
Es ist aber im Auge zu behalten,
Funktion von t ist.
matischen Standard-Verfahren ohne größere Schwierigkeiten
möglich,
wendig,
jedoch ist das Ergebnis im allgemeinen Fall so auf­
daß wir hier auf eine Wiedergabe verzichten (zur
Lösungstechnik siehe
z.B.
ROMMELFANGER 1977,
zu Beispielen
Statt­
dessen wollen wir einige Spezialfälle betrachten.
lassen
Gleichgewicht.
wir den Zeitindex t bei den Zustandswahrscheinlichkeiten
immer weg.
Zeit p
und
0
zwar mit mathe­
der dynamischen Analyse siehe auch DIEKMANN 1980).
lichkeitsänderung dp (t)/dt.
j
Um im folgenden die Notation etwas
zwei explizite Funktionen der
die die beiden Gleichungen erfüllen) ist
stets eine
Man kann leicht
chungssystem immer ein stabiles
zeigen,
daß das obige Glei­
Gleichgewicht impliziert.
Außerdem lassen sich die Gleichgewichtswerte p
Ferner schreiben wir
Schließlich wollen wir nur den Fall mit .::.!:�:.!::�::::!=::.:��:=­
größere Mühe ermitteln.
0
ohne
und p
1
Vereinbaren wir folgende Abkürzungen:
Rate betrachten.
(1 52) a
Drei-Zustands-Modell.
Gemäß dem allgemeinen Ansatz
(14
)
lau­
ten die Differentialgleichungen für das Modell mit drei zu­
( 153) b
ständen:
( 154) c
(14 7) Po
(14 8) p 1
( 14 9)
( 15 5) d
dann ist das Gleichgewicht immer dann stabil,
ROMMELFANGER 1977,
S.189
ff.):
wenn gilt
(vgl.
-
- 183 -
182 -
(156) a+d<O
keiner Therapie) auf die Gleichgewichtsverteilung läßt sich
ermitteln. Ein Beispiel hierzu findet sich in der Arbeit von
(157) ad-bc>O.
HANNAN,
Beide Stabilitätsbedingungen
sind inuner erfüllt,
TUMA und GROENEVELD 1977.
wie der
Konkurrierende Risiken.
Leser leicht nachprüfen kann.
Ein interessanter Spezialfall resul­
tiert aus den Gleichungen
Welche Verteilung von Y{t) ergibt sich nun konkret im Gleich­
gewicht
(d.h. für t+oo)? Um hierauf
es nur erforderlich,
eine Antwort
in dem Gleichungssystem
zu geben,
(150)
und
ist
(147) bis
(149),
1 und 2 als absorbierend betrachtet werden
wenn also gilt:
wenn die Zustände
(Abbildung 24),
=o
r 0=r 0=r
r
12= 21
1
2
(151)
p =p =o
zu setzen. Im Gleichgewicht existieren wohl noch Be­
0
1
wegungen zwischen den Zuständen, zu- und Abflüsse gleichen
sich dabei aber aus,
.
sind null.
d.h.
die Wahrscheinlichkeitsänderungen
.
Für p 0=o und p =o erhalten wir nun zwei einfache
1
algebraische Gleichungen mit den beiden Unbekannten p
.
Die Lösung,
0
und
also die Gleichgewichtsverteilung von Y(tl
lautet bei zeitunabhängigen Raten:
24:
Abbildung
(158) p0
Ein Modell mit konkurrierenden Risiken
In demographischen und medizinischen Anwendungen könnten die
Zustände 1 und 2
cr
(159) p
1
+ar
21
20
zwei verschiedene Todesursachen bezeichnen.
Beim Studium von Mobilitätsprozessen ließe sich an die Kon­
ad-bc
zeptualisierung von Aufwärts- und Abwärtsmobilität denken
(CARROLL und MAYER 1982) und bei Migrationsprozessen könnte
Für p
2
es sich um zwei Migrationsziele
folgt:
handeln.
dells bzw.
(160)
zustände
(z.B.
Inland versus Ausland)
Eine weitere Möglichkeit der Anwendung dieses Mo­
dessen Verallgemeinerung auf beliebig viele
einer probabilistischen Entscheidungstheorie.
Mit Hilfe der drei Gleichungen kann rr�n jeweils für bestimmte
Gruppen",
d. h.
für bestimmte Kombinationen
Gleichgewichtsverteilung prognostizieren.
von Kovariaten,
die
Auch die Effekte
und
Ziel­
(dazu weiter unten) bezieht sich auf den Kontext
2 bezeichneten dann
Die
alternative Handlungen,
Zustände
während
die Raten als Funktionen von Nutzenerwartungen aufgefaßt wer­
den könnten.
einer bestimmten unabhängigen Variablen, etwa eines experi­
mentellen Gruppenunterschieds
(z.B.
Drogentherapie versus
Mit den oben angeführten Restriktionen
chungssystem
(147) bis
(149):
folgt aus dem Glei­
- 184 -
(1 61) P
- 185 -
Es folgt hieraus,
o
daß sich je zwei Zustandswahrscheinlich­
keiten der Zielzustände wie die entsprechenden Raten verhal­
ten:
(1 62) p
1
(k#O,j!O)
(169)
Die Lösung für p 0 mit der Anfangsbedingung p0 (o)=1
(zum Zeit­
punkt t=O befinden sich alle Untersuchungseinheiten im Zu­
stand O) ist die Wachstumsfunktion:
(164)
stant bleiben. Diese Implikation ist eine strenge Testbedin­
gung des Modells.
n
E
k=O
und
(163) ein und integrieren wir die beiden Gleichungen von 0 bis
dann erhalten wir als Lösungen:
sei dem interessierten Leser als Ubung überlassen.
Eine weitere anschauliche Deutung von Gleichung
man,
(16 5)
p
(16 6)
p2
(168)
findet
wenn man folgende Beziehungen einführt:
1
m
wobei die Hazardrate r0 =r 0 +r
die Summe der beiden Raten ist.
02
1
Das Modell läßt sich ohne Probleme auf n Zustände verallge­
meinern.
(167) P
Der Nachweis, daß gilt:
t
Po = e
Setzen wir diese Funktion für p 0 in die Gleichungen (162)
t,
Beim Modell mit konstanter Rate muß der Quotient aus je zwei
Zustandswahrscheinlichkeiten dem.�ach im Zeitablauf immer kon­
o
Die Lösung,
e
d.h.
die Verteilung von Y(t),
ist die bedingte Wahrscheinlichkeit, daß unter der Vor­
jk
aussetzung, daß ein Ereignis auftritt (Zustand j also ver­
lassen wird), der Zustandswechsel zum Zielzustand k erfolgt.
Ferner gilt (Kap.2.3):
lautet:
-r .t
o
in (168)
Aufgrund dieser beiden Beziehungen können wir für P
k
schreiben:
k=1,2,
•
.
•
,n
- 186
-
-
(t)
187 -
(175) P
o
p
ist also das Produkt aus der unbedingten Wahrscheinlich­
k
keit,
daß bis
zum Zeitpunkt t ein Ereignis auftritt,
pliziert mit der bedingten Wahrscheinlichkeit,
ser Voraussetzung
daß
multi­
unter die­
zum Zielzustand k gewechselt wird.
zwei-Zustands-Modell mit reversiblen Ereignissen.
Ein weite­
rer wichtiger Spezialfall wurde insbesondere van COLEMAN
(1964a,1981) auf soziologische Probleme angewandt.
zustandsmodell mit reversiblen Ereignissen
Das Zwei­
folgt aus dem
Gleichungssystem
setzt werden
(147) bis ( 149)', wenn r02=r12=r20=r2 =o ge­
1
2
(Abbildung
5).
Als
nächsten Schritt berechnen wir allgemein die Verteilung
von Y(t),
d.h.
nicht nur die Gleichgewichtsverteilung,
dern die Werte von p0 und p
wir berücksichtigen,
son­
für beliebige Zeitpunkte t.
1
daß p1=1-p0 ist,
so folgt aus
Wenn
(173):
( 177)
Die Lösung der Differentialgleichung lautet:
r
10
��l�=======--=�;(2)
Abbildung
2
5:
1178)
Zwei-Zustands-Modell mit reversiblen Ereig­
nissen
zustand o könnte z.B.
als nicht-erwerbstätig und Zustand 1
als Erwerbstätigkeit gedeutet werden.
Die Differentialglei­
Po
[Po (OJ
-
Analog folgt aus Gleichung
(174)
1-p :
,
(1 79)
nach Substitution von p0 =
p
1
0
chungen für das Modell lauten:
Hierbei kennzeichnen p0 (o) und p (o) die Verteilung zu Beginn
1
des Prozesses, d.h. zum Zeitpunkt t=O. Man erkennt ferner an­
hand der beiden Gleichungen,
wichtsverteilung (175)
Setzen wir
:Q,
so erhalten wir die Werte der Gleichge­
wichtsverteilung als Lösungen der beiden resultierenden al­
gebraischen Gleichungen mit den beiden Unbekannten
�
und
und
daß sich für t+� die Gleichge­
(176)
ergibt.
Nebenbei bemerkt folgt aus der Gleichgewichtsverteilung:
- 188 -
p
( 180)
- 189 -
- die Übergangsrate
0
die erwartete
P1
COLEMAN
fahren
(1981,
Kap.II)
vorzuschlagen,
benützt diese Beziehung,
um ein Ver­
mit dem die Effekte der Kovariate so­
gar anhand von Querschnittsdaten geschätzt werden können.
Zwei
zusätzliche Annahmen sind dafür allerdings erforderlich:
Der stochastische Prozeß muß sich im Gleichgewicht befinden
und die Stärke der jeweiligen Kovariateneffekte auf beide
Raten wird als identisch angenommen.
Die untersuchten Beispiele
zeigen,
daß die
mathematische Ana­
lyse wichtige Modellkonsequenzen aufdeckt. l)
ten Zustandswahrscheinlichkeiten pj
Die abgeleite­
(die Verteilung von Y(t))
sind in allen Fällen als Funktion der Raten und der Zeit dar­
stellbar.
In der Regel sind die Raten wiederum Funktionen von
Kovariaten und der
a-
Effekte auf die Raten,
oder ß-Parameter für die Stärke ihrer
die z.B.
mit dem Programm RATE anhand
von Ereignisdaten geschätzt werden können.
Somit können wir
für beliebige Kombinationen von Kovariaten die
scheinlichkeiten zu beliebigen
Insgesamt hat sich gezeigt,
Zustandswahr­
Zeitpunkten ableiten.
daß wir mit stochastischen Mo­
dellen Kovariateneffekte auf:
1)
Verweildauer
- die Überlebensfunktion
Ein weiterer Spezialfall, auf den wir hinweisen möchten,
wird von TUMA, HANAN und GROENEVELD (1979) untersucht.
Es handelt sich um eine
COLEMANS Modell
durch Hinzufügung eines
Zustands.
bis (149) werden
Ausgehend von den
die Restriktionen
r
2o
=r
21
=0
·
Die resultierenden Formeln für die Zustandswahrscheinlich­
keiten finden sich in der erwähnten Schrift von TUMA
et al.
- und die Gleichgewichtsverteilung
(sofern ein Gleichgewicht
existiert)
sowie auch auf F(t),
nostizieren können.
f (t)
und die Verteilung von Y(t)
prog­
Die Aussagekraft der Modelle ist damit
wesentlich stärker als im Falle statischer Anal:l'sen.
-
6.
- 191 -
190 -
delle berücksichtigt werden. Als Einstieg sei das inzwischen
Ausblick
"klassische"
Bei der Analyse anderer Datenstrukturen als univariater An­
Werk von BARTHOLOMEW
(1964b)
COLEMAN
(1973) sowie die Arbeit von
empfohlen.
kunftszeiten plus Kovariate können im Falle der Verletzung
der Annahme eines Markov-Prozesses statistische Probleme auf­
treten.
Die Auswertung von Lebensverläufen mit mehreren Epi­
soden - die Datenstruktur der Drogenkarriere stellt hierfür
ein Beispiel dar -
bereitet dann zusätzliche Schwierigkeiten,
wenn die aufeinanderfolgenden Episoden einer Karriere nicht
voneinander unabhengig sind.
Korrellierende Ankunftszeiten kön­
nen sich darüber hinaus auch auf Individuen beziehen,
zueinander in einer bestimmten,
stehen.
oder Vererbungseffekt
(bei sukzessiven Episoden)
halt als "event histories",
Daten,
etwa Panel- oder Quantal-Response­
sei auf die Bücher von COLEMAN
(1981) und NELSON
(1982)
verwiesen. Beide Schriften befassen sich mit der Schätzung von
Parametern stochastischer Modelle - nur eben auf der Basis
weniger informationshaltiger Daten.
In COLEMANS Buch sind
auch die erforderlichen Computerprogramme abgedruckt. Eine
ausführliche kommentierte Literaturübersicht zu methodischen
etwa familiären Beziehung
In solchen Situationen mag ein wie auch immer gear­
teter Trend
(z.B.
welche
Für die Auswertung von Daten mit geringerem Informationsge­
Problemen der Analyse von Zeitverlaufsdaten sowie ein über­
blick über weitere EDV-Software findet man bei NELSON
(1982).
bei Vätern und Söhnen) präsent sein.
In diesem Buch haben wir uns auf Methoden der statistischen
Möglicherweise gelingt es,
die
stochastische Unabhängigkeit
der Episoden durch Berücksichtigung relevanter Kovariate
. garantieren.
Die Markov-Annahme bezieht sich
zu
ja immer auf
Gruppen mit gleichen Kovariatenkombinationen. Ist die Annahme
in einem Modell verletzt,
so kann durch Einbeziehung zusätz­
licher Kovariate das modifizierte Modell die Annahmen wieder­
um erfüllen.
Genau dies ist ja der Grundgedanke
sem Buch präsentierten Verfahren:
der in die­
"Realitätsgerechte"
Markov­
Modelle durch die Einführung von Kovariaten zu konstruieren.
Auswertung von Ereignisdaten konzentriert.
gene Publikation wert,
Es wäre eine ei­
Methoden der Erhebung von Ereignis­
daten zu diskutieren. Ein wichtiges Problem hierbei ist
z.B
•
die Validität retrospektiv erfragter Lebensverläufe. Welche
Merkmale können mit welchem Grad an Gültigkeit retrospektiv
erfaßt werden?
Kann man
(Siehe z.B.
PAPASTEFANOU
1980 und TöLKE 1980.)
z.B. mit gutem Erfolg Einkommensveränderungen im
Ablauf der Berufskarriere rückblickend erfassen oder sind
hierfür wesentlich aufwendigere prospektive Panel-Designs
erforderlich? Welchen Stellenwert haben qualitative Erhebungs­
Eine andere Lösung des Problems korrelierender Episoden kann
auf dem Weg der Entwicklung neuer Modelle gesucht werden.
Hierzu sei auf FLINN und HECKMANS
(1982)
soden der Arbeitslosigkeit verwiesen.
Auswertung von Epi­
Einen
überblick
zu ge­
eigneten Modellen findet man ferner in dem Buch von LAWLESS
methoden? Die Geschichte der Erhebung von Lebensverlaufsdaten
hat in Form meist qualitativer Untersuchungen von Biographien
wie in der berühmten Studie von THOMAS und ZNANIECKI
eine lange Tradition
jüngster Zeit wird wieder an diese Tradition der Durchführung
von Verlaufsanalysen angeknüpft,
(1982).
Projekten in den USA
Auch die Idee der Einführung latenter,
nicht-beobachtbarer
Zustände kann bei der Konstruktion stochastischer Prozeßmo-
(1927)
(siehe auch KOHLI 1981). Aber erst in
1982a)
wie die zunehmende Zahl von
(siehe den kurzen
Uberblick in ANDRESS
und auch der Bundesrepublik dokumentiert - z.B.
das
- 193 -
- 192 -
Projekt Lebensverläufe und Wohlfahrtsentwicklung (MAYER
und das geplante
"Sozio-ökonomische Panel"
Es ist anzunehmen, daß
(HANEFELD
1978)
1982).
diese Forschungen auch zu Problemen
1.
der Methodik der Datenerhebung neue Antworten beisteuern
werden.
Zufallsvariable Zustandsraum
Y(t)=j
(Zustände
[
(Absolute)
p.(t)=P Y(t)
J
1,2,
•
.
•
,j,
.
•
.
,n)
Zustandsraum-Wahr­
scheinlichkeiten
T.
Zufallsvariable Verweildauer
(Ankunftszeit) bezüglich Zustand j
J
tlberlebensfunktion im
Zustand j
Kumulierte Verteilung der Ver­
(t)= 1-G.(t)
J
weildauer im Zustand
j
(t)=lim �����- ,,�"""""',,-­ Dichteverteilung der Verweil­
llt+O
dauer im Zustand j
E( T. )= ft.f.(t)dt
J
J
Erwartungswert der Verweildauer
(Mittelwert, mittlere Lebenser­
Q
wartung) im Zustand j
q
[
(t,t+llt)=P Y
jk
]
Y(t)=j
(Bedingte) Übergangswahr­
scheinlichkeit vom zustand j
den Zielzustand k im
in
Zeitinter­
vall (t,t+llt)
(t)=lim ��--,-.,--�­
t+O
Wbergangsrate vom Zustand j in
den Zielzustand k (Rate, Risiko,
Intensität des Prozesses)
- 194 -
r. (t) =
J
n
r . lt)
Jk
E
k=O
kt'j
-
2.
Hazardrate (Harzardfunktion)
Zielzustand
Bezeichnen wir mit der Übergangswahrscheinlichkeit
t
l'<.(t)=Jr.(T)dT
J
J
0
195 -
Kumulierte Hazardfunktion
die Wahrscheinlichkeit,
standswechsel vom Ausgangszustand O zum
m
r " (t)
k
�
(t)=
jk
J
Bedingte Wahrscheinlichkeit ei­
nes
Zustandswechsels zum Zeit­
punkt t
unter
der Bedingung,
daß
zum Zeitpunkt t irgendein Zu­
tritt.
( unabhängige Variable)
bei log-linearer Schreibweise
l.
J_
des log-linearen Modells in der
Multiplikator-Schreibweise (�­
Effekte)
Schätzwerte von Parametern
Zur Erklä­
rung verweisen wir auf Abschnitt
Anmerkung:
2.
Zielzustand
1
ein­
bis zum Zeitpunkt t kein Er­
und bezeichnen wir mit r(t) die Über­
dann gilt:
(t,t+At)=r(t).At+O(At)
O(At)/At=O.
p (t) bezeichnet die Wahrscheinlichkeit, daß sich ein Ele­
0
ment zum Zeitpunkt t im Zustand O befindet. Wenn die Ereig­
"kein
Zustandswechsel bis t"
sel im Intervall (t,t+llt)"
Koeffizienten der Kovariate x.
Sterbetafel-Notation.
lim
At-+o
nisse
{ ß-Effekte)
3.
q
daß
O(At) ist dabei irgendeine Funktion mit der Eigenschaft
Koeffizienten der Kovariate x.
&,ß ,r
gangsrate,
(1)
standswechsel (Ereignis) auf­
Kovariate
tritt unter der Bedingung,
eignis eingetreten ist,
q (t,t+At)
daß im Intervall (t,t+At) ein Zu­
(2)
der Index o der Rate ro in Kap.4 auf die Baseline­
Hazardfunktion. In beiden Kapiteln bezeichnet der
Index nicht den Zustand.
(t).
"kein
Zustandswech­
ergibt sich:
(t). llt-0 (lit)J
für �t+O resultiert hieraus:
(3)
Definieren wir die kumulierte Hazardfunktion:
t
1.
Im Falle des Zwei-Zustands-Modells mit absorbie­
rendem Zielzustand wird bei den folgenden Termen
auf die Indizes j und k verzichtet: T,G(t)
F
f(t), E(T), r(t), q(t) und R(t). Außerdem
der Index
sich abweichend von obiger
und
der Rate ri in Kap. 3 auf das i 'te
p (t,t+At)
0
und
unabhängig sind,
(4)
R(t)
!r(T)dT
dann erhält man als Lösung der Differentialgleichung
dem Anfangswert p (0)
0
die Überlebensverteilung:
(3)
mit
- 197 -
- 196 -
(5)
R(t)
G(t)=p (t)=e-
Einige häufiger verwendete
0
Hieraus folgt die kumulierte Verteilung der Ankunftszeiten:
(6)
F(t)=1-e
-
R ( t)
constant
Ct
f(t)=--,;-� =,r(t)e
Wird Ausdruck
t
+Bee
-R(t)
durch Ausdruck
(7)
(5)
dividiert,
so kann für
"A
p
P.t) -l
p
1+(1.t)
(5)
ein weiterer Ausdruck für die Über­
Poisson
Gompertz
B
Ct
A. t+ ( e
-1)
C
Makeham
ln
Weibull
Log-
t 1 + 0. t)P]
logistisch
AC[,\- (t+,\)e-t/,\J
-t/f.
gangsrate:
r.t
p
(At)
. te
Außerdem folgt aus
Bezeichnung
� Ct_
1)
(
c
p
)tp(A.t) -l
die Übergangsrate geschrieben werden:
aufgeführt:
R(t)
Übergangsrate r(t)
mit der Wahrscheinlichkeitsdichte:
(7)
Zeitabhängigkeiten ("Entwick­
lungshypothesen") sind in der Tabelle
Sichel
Wenn die Ubergangsrate als Funktion der Zeit und Funktion von
Kovariaten geschrieben wird, dann hat die Likelihood-Funktion
bei N unabhängigen Beobachtungen die folgende Gestalt:
(9)
r(t)
N
(12)
Der Erwartungswert von T, d.h.
Ausgangszustand,
die mittlere Verweildauer
ist:
im
L(0)=!I(f(t.,x(i),
l.
i
E(T)=
und
.f(t) dt
nis
Bei zeitunabhängiger Rate r beträgt der Erwartungswert:
(11)
E(T)
Jt.re -r.
l.
,e)] (l-di)
Hierbei ist x(i) ein Vektor mit den Beobachtungswerten der
Kovariate für
(10)
(t. ,x(i)
Individuum i,
8
ist ein Vektor mit Parametern
ist eine Indikatorvariable,
die besagt,
ob ein Ereig-
zum Zeitpunkt
eingetreten ist (d �1) oder ob es sich
i
um eine zensierte Beobachtung handelt (d =O). Wie man sieht,
i
besteht die.Likelihood-Funktion aus zwei Teilen: Der Wahr­
scheinlichkeitsdichte der Ankunftszeiten für nicht-zensierte
r
und der überlebens·funktion für zensierte Daten.
198 -
-
199 -
Maximum-Likelihood-Schätzwerte sind diejenigen Werte für den
Die Summierung erfolgt immer über alle Beobachtungen i= 1,
Parametervektor 8,
bei denen die Likelihood-Funktion (bzw.
N.
deren Logarithmus)
ein Maximum aufweist.
N1=
stands-Modelle mit reversiblen Ereignissen findet man in
3.
HANNAN und GROENEVELD 1 979.
Ableitung der Maximum-Likelihood-Schätzer bei qualitativen
Kovariaten
Anzahl aller Ereignisse für die x1=1-Gruppe
v = Summe aller exakten Ankunftszeiten
0
für die x =0-Gruppe
1
v1 = Summe aller exakten Ankunftszeiten
für die x 1= 1 -Gruppe
w = Summe aller zensierten Zeiten für die x 1=o-Gruppe
0
w1= Summe aller zensierten
Gehen wir zunächst von einer qualitativen Variablen x 1 mit
der Codierung 0/1 aus und schreiben wir dafür eine log-lineare
Zeiten für die x 1=1-Gruppe,
sich (15) wie folgt schreiben:
so läßt
Ratengleichung:
(13)
Unter Berücksichtigung von G(t)=exp(-rt),
der
f (t)=r.exp(-rt)
und
zeitunabhängigen Rate (13) lautet die Likelihood-Funktion:
N
rr.{ a (a1 )
0
x 1 (i)
•
1
Als partielle Ableitungen nach a
1
dukte.
so erhält man Summen anstelle der Pro­
Die Lage des Maximums verändert sich hierdurch nicht:
ln a +rd x 1
0
i
(1
();
1
(i)
:'.1
(17)
exp
(18)
Logarithmiert man L,
In a.1-a.0raia.1
x 1 (i)
t
i
,
N = Anzahl aller Ereignisse für die x 1=0-Gruppe
0
Die Verallgemeinerung der Likelihood-Funktion auf Mehr-Zu­
TUMA,
• • •
Führen wir folgende Bezeichnungen ein:
a.,
a
ln L
ra;-
ao
-
x 1 (i)
(20)
a =
1
erhalten wir:
- a1V 1-V O- a1W 1-W O
und (18) null.
setzten wir die beiden Ablei­
Nach einigen
sich die beiden Schätzformeln:
(19)
0
V W
a.O 1 a.O 1
Um ein Maximum zu bestimmen,
tungen (17)
und a
Umformungen
ergeben
- 201 -
- 200 -
Man kann leicht zeigen,
1,2,3,
(19)
•
•
daß
im allgemeineren Fall mit l�
dichotomen 0/1-Variablen die Verallgemeinerung von
•
die Form hat:
Berücksichtigt man die Definitionen der Übergangsrate und
der Hazardrate
(Anhang
1),
so erhalten wir als
die Differentialgleichung für zustand
j:
N
l
,.,
(21>&1=v1 +w1 /ao
.'!<.
wobei die Schätzformel für
4.
a0
(23)
unverändert bleibt.
k;\j
Die Ableitung der Differentialgleichungen für die Zu­
standswahrscheinlichkeiten bei Multi-State-Modellen
Unter
der Annahme eines Markov-Prozesses
ist
die Wahrschein­
lichkeit,
daß
sich eine Untersuchungseinheit zum Zeitpunkt
(t+llt) im
Zustand j befindet, die Summe aus zwei Termen,
lich der Wahrscheinlichkeit zum
Zeitpunkt t im Zustand
näm­
j
zu
sein mal der Wahrscheinlichkeit, daß kein Ereignis eintritt,
plus der Summe aus den Produkten:
nem anderen Zustand kfj zum
Wahrscheinlichkeit in ei­
Zeitpunkt t
m�ltipliziert
der Wahrscheinlichkeit eines Wechsels zum Zustand j.
mit
Formal
geschrieben:
(t) [1-
[ Cj
k
' (t,t+l'itJ ]
Jk
+
l:
k
p (t)q ' (t,t+l\t)
k
kJ
kh
kfj
Hieraus folgt:
k
(22)
-p.(t)r.(t)+ E p (t)r .(t).
k
kJ
J
J
k
(t,t+llt)
Limes
f\t+O
-
203
-
Literatur
Andreß,
of
H.J.,
ing
Methods of Temporal Analysis: An Illustration
Anal ysis with Mobility Data, VASMA Work, Mannheim 1982a
Andreß, H.J., Tätigkeitswechsel und Berufserfahrung.
zeitbezogener Daten mit Hilfe von Sterbetafeln
eines Beispiels aus der Mobilitätsforschung, Zeitschrift
für Soziologie,
S.380-400
1984
Bartholomew,
2.Aufl.,
Becker,
4/1982b,
of Event-Histories with Generalized
A.Diekmann und P.Mitter, Hrsg., Pro­
Modelling of Social Processes, New
gress in
York
Jg.11,
H.S.,
D.J., Stochastic Models for Social Processes,
London 1973
Outsiders:
Studies in the Sociology of Deviance,
New York 1963
W.Schuboe,
Beutel, P. ,
New York
1983
Bortkiewicz,
L.v.,
SPSS 8,
3.Aufl.,
Das Gesetz der kleinen Zahlen,
Stuttgart-
Leipzig
1898
Carr-Hill, R.A. und C.D.Payne, Crime: Accident or Disease: An
Exploration Using Probability Models for the Generation
of Macro-Crirninological Data,
Journal of Research in
Crime and Delinquency,
Jg.8,
1971,
S.133-155
Carr-Hill, R.A. und K.I. Macdonald, Problems in
of Life Histories, in: R.E.A.Mapes,
Processes in Sociology,
University of
Discrete Dependent Variab­
Carroll,
les:
Nr. 1982/08,
Mannheim
1982
Carroll, G.R. und K.U.Mayer,
Wage Attainment Process,
1982
Introduction to Stochastic Processes in Bio­
,
J.,
New York 1968
Introduction to Mathematical Sociology,
New York
- 204
-
-
Coleman, J., Models of Change and Response Uncertainty,
Hall
205
W.J. und J.A.Wellner, Confidence Bands for a Survival
from Censored Data, Biometrika 67, 1980, S.133-143
Englewood Cliffs 1964b
Hannan, M.T., N.B.Tuma, L.P.Groeneveld, Incorne and Marital
Events: Evidence from an Income-Maintenance Experiment,
Coleman, J., Longitudinal Data Analysis, New York 1981
Cox, D.R., Regression Models and Life Tables, Journal of
American Journal of Sociology,
Bd.82, 1977, S.1186-1211
the Royal Statistical Society, Jg.34, 1972, S.187-220
David, H.A. und M.L. Moeschberger, The Theory of Competing
Risks, London 1978
Diekmann, A., Dynamische Modelle sozialer Prozesse, München­
Wien 1980
Diekrnann, A. und P.Mitter, The "Sickle Hypothesis". A Time
Dependent Poisson Model with Applications to Deviant
Behavior and Occupational Mobility, Journal of Mathe­
rnatical Sociology, Bd.9, 1983, S.85-101
Diekmann, A. und P.Mitter, Hrsg., Progress in Stochastic
of the
for Austrian and US Marriage
P.Mitter,
Hrsg.,
Dixon, W.J., M.B.Brown,
"Sickle Func-
Models of Divorce Rates
Cohorts, in: A.Diekmann und
Harder,Th., Dynamische Modelle in der empirischen Sozialfor­
schung, Stuttgart 1973
Kalbfleisch, J.D. und R.L.Prentice, The Statistical Analysis
Kaplan, E.L. und P.Meier, Nonparametric Estimation frorn rn­
complete Observations, J.Amer.Statist.Assoc.53, 1958,
S.457-481
Kohli, M., Wie es zur
daraus geworden ist.
1984b
L.Engelman,
J.W.Frane, M.A.Hill,
R.I.Jennrich und J.D.Toporek, BMDP Statistical Software,
Berkeley-Los Angeles-London 1981
Doeringer,
P.B. und M.I.Piore, Interna! Labor Markets and
Manpower Analysis, Lexington, Mass. 1971
Elandt-Johnson, R.C. und N.L.Johnson,
Data Analysis, New York 1980
Survival
Models and
Feller, w. , On a General Class of Contagious Distributions,
The Annals of Mathematical Statistics, Jg.14, 1943,
S.389-400
W., Probability Theory and its Applications,
New York
1950
Flinn, C.J. und J.J.Heckman, Models for the Analysis of Labor
Force Dynamics, in: R. Basmann, G.
, Advances
in Econometrics, Vol.1, London 1982, s.
Grass,
D.F., Mathematical
Criminology, New Jersey 1979
A.J. und V.A.Clark, Survival Distributions:
Applications in the Biornedical
Reliability
Sciences, New York
1975
Methode" kam und was
aus der Geschichte der
Soziologie, Jg.10,
Sozialforschung,
3/1981, S.273-293
Land, K.C., Some Exhaustible Poisson Process Models of
Divorce by Marriage Cohorts, Journal of Mathematical
Sociology, Jg.1, 1971, S.213-232
Lawless, J.F., Statistical Models and Methods for Lifetirne
Data, New York 1982
Mayer, K.U., Lebensverläufe und Wohlfahrtsentwicklung, Pro­
jektantrag im Rahmen des Sonderforschungsbereichs 3,
Universität Frankfurt und Mannheim 1978
Miller, R.G., Least
Biometrika 63, 1
with Censored Data,
Müller, W.,
für die
Murray,
Greenberg,
Das sozioökonomische Panel. Eine Kurzinforma­
tion, Arbeitspapier Nr.65 des Sonderforschungsbereichs 3,
Universität Frankfurt und Mannheim 1982
Prog:ress in Stochastic Modelling of
Social Processes, New York
Feller,
Hanefeld, U.,
of Failure Time Data, New York 1980
Modelling of Social Processes, New York 1984a
Diekmann, A. und P.Mitter, A
tion" with Alternative
Hannan, M.T. und G.R.Caroll, Dynamics of Formal Political
Structure, American Sociological Review, Jg.46, 1981,
S.19-35
Konferenzpapier
W., Hrsg., Numerical Methods for Unconstrained
Optimization,London-New York
Nelson, w. ,
Applied Life Data
1972
Analysis,
New York 1982
- 207 -
206 -
Nie,
N.H. und C.H.Hull,
ber 1978
SPSS
Release 8 Update Manual,
nisse
derforschungsbereichs
heim 1980
Rapoport, A.,
schaften,
Dezem­
Mann-
1977
A.B. und A.S�rensen,
Tarone, R.E. und
Equality of
S.1 56-160
Mathematical Sociology,
Paris
On Distribution-Free Tests for
Distributions, Biometrika 64, 1977,
Thomas, W.I. und F.Znaniecki
and America, New York 1
The Polish Peasant in Europe
retrospektiver Verlaufsdaten.
Tölke, A.,
Qualitative
Nachbefragung, Arbeitspapier
Nr. 30 des Scmcie.rfor:s<�h·unq�;biere
3, Universität Frankfurt und Mannheim 1980
Tukey,
J.W.,
Tuma
N.B.,
Tuma,
N.B.
Exploratory Data Analysis,
Invoking Rate,
Reading 1977
Arbeitspapier des
in Mannheim
(ZUMA),
1979
lichkeit 64
bedingte überlebenswahrschein­
lichkeit 65
Compound-Poisson-Prozeß 172
conditional Likelihocd 100
Cox-Modell (siehe Modell,
- �roportional-Hazards-)
Daten
- change- 173
- Ereignis- 21 ff.,
25 ff.
25 ff.
M.E., R.M.Figlio und Th.Sellin, Delinquency in a
Cohort, Chicago and London 1979
of
nisdaten)
explorative Datenanalyse 31,
58 f.
Exponentialverteilung 145 ff.
Extremwertverteilung 148 f.
Gehan-Breslow-Test (siehe
Wilcoxon-Test l
Gleichgewichtsverteilung 182
Gleichverteilungsannahme 62
Gompertz-Makeham-Verteilung
149 ff.' 164 ff.
graphische Verfahren 103,
154 ff.
Hazardrate 33, 51 f.,
Heterogenität 49
111,
178
Informationsgehalt 32
27
28
- Zeitpunkt- 26
- zensierte 23 ff.
Differentialgleichungen der
Zustandswahrscheinlich­
keiten 180, 200 f.
Dummy-Variable 99, 124
dynamische Analyse 177 ff.
Effekte 121
27
(siehe Ereig-
Gamma-Verteilung 49
bedingte Sterbewahrschein­
und M.T.Hannan, Approaches to the Censoring Problem
Tuma, N., M.T.Hannan und L.P.Groeneveld,
Event Histories, American Journal of
1979, s.820-854
18
harn-Modells 164
asymptotisch 78
Zentrums für Um­
in Analysis of Event Histories, in: K.Schuessler, Hrsg.,
Sociological Methodology 1979, San Francisco 1979, S.209240
,
Absorbieren er Zustand
Ankunftszeit
lung 12, 33, 44 ff.
- Wahrscheinlichkeitsdichte
33, 40 ff.
Asymptote des Gompertz-Make­
Mathematische Methoden in den Sozialwissen­
Würzburg-Wien 1980
und Differentialgleichungen,
Sprensen,
Sachregister
Entscheidungsexperiment 171
Entwicklungshypothesen 18
Episode 21 ff., 174
Ereignisdaten (siehe Daten)
Ereignishäufigkeit 28
Informationsmatrix 106
Intensität 38
Intervallskala 120
Kausalhypothesen 18,
Kohorte 23, 60 f.
Konfidenzintervall
129 f.
19,
50
79 f.,
konfirmatorische Datenanalyse
31
konkurrierende Risiken 183
190
korrelierende
95 ff.,
Kovariate 13, 1
124 ff.,
164
Life-Table (siehe Sterbetafel)
Likelihood-Ratio 106, 141
log-linear 98, 120
Log-logistische Verteihmg 153 ff.
- 208 Studienskripten zur Soziologie
153 ff.
Log-Rank-Test
(siehe
Test)
Mantel-Cox-Test (siehe SavageTest
Markov-Prozeß 36
Maximum
- globales
lokales 135
Maximum-Likelihood-Schätzung
52 ff.' 66 ff.' 125, 188 f.
mittlere verbleibende Lebens­
zeit 145
Modell
- stochastisches 13 ff., 30.,
33 ff.
- Zwei-Zustands- 37 ff.
- Mehr-Zustands- 51 f.,
Sichel-Modell 152
Survival-Analyse 11 f., 18
Stabilitätsbedingung 182
Standardfehler 66, 105, 129
Stepwise-Regression 105 ff.
Sterbetafel 60 ff.
stochastische Prozesse,
Modelle (siehe Modelle)
Nicht-parametrische Verfahren
D. Urban, Regressionstheorie und Regression s technik
245 Seiten. DM 16,80
37
E.
Zimmermann, Das Experiment in den Sozialwissenschaften
308 S eiten.
38
F.
DM 17,80
Böltken, Auswahlverfahren
Eine E i nführung für Sozialwissenschaftler
407 S eiten. DM 18,80
39
H.
J. Humrnell,
Probleme der Mehrebenenanalyse
160 Seiten. DM 12,80
40
überlebensfunktion 38 ff.
übergangsrate 38 ff., 48
41
F.
Golzewski/W.
Reschka,
Gegenwart sgesellschaften:
Polen
58 ff.
Harder, Dynamische Modelle
120 Seiten. DM 11,80
42
Varianz-Kovarianzmatrix 106
verallgemeinertes lineares
Modell {GLIM) 144, 173
Verweildauer (siehe Ankunfts­
zeit)
Th.
in der empirischen Sozialforschung
Übergangswahrscheinlichkeit
35 f.
Newton-Verfahren 135
W. Sodeur,
Empirische Verfahren zur Klassifikation
183 Seiten. DM 12,80
43
H.
M. Ke pplinge r , Massenkommunikation
207 Seiten. DM 15,80
44
H.-D.
Schneider, Kleingruppenforschung
351 Seiten. DM 17,80
Panel-Daten (siehe Daten
Parametrische Verfahren 15,
119 ff.
Partial-Likelihood-Methode
100 f.
Poisson-Prozeß 43 f.
Product-Limit-Schätzer 76 ff.
Proportionalitätsannahmen im
Cox-Modell 102 ff.
Quantal-Response-Daten (siehe
Daten)
Querschnittsdaten (siehe Daten)
Rate (siehe Ubergangsrate)
Residuum 107 f.
Risiko 14, 38
Risikomenge 64,
36
383 Seiten. DM 18,80
173
- Proportional-Hazards- 96 ff.
Multiplikatoren 98
15,
Savage-Test 87, 90, 94
Score-Vektor 106
Semi-Markov-Prozeß 36
Verfahren
ff.
15,
100
Wald-Test 106
Weibullverteilung 146 ff.
Wilcoxon-Test 86 f. ,
90,
45
94
Zählprozeß 19
Zeit
chronologische 25
- Prozeß 25
66
Daten
Zustandsraum 33
(siehe Daten)
Zustandsraum-Variable 33 ff.,
79 ff.
H.
J.
Helle,
Verstehende Soziologie und
Theorien der Symbolischen Interaktion
207 Seiten. DM 15,80
46
T. A. Herz, Klassen, Schichten, Mobilitäten
316 Seiten . DM
48
18,80
S. Jensen, Talc o t t Parsons
Eine Einführung
204 Seiten. DM 15,80
49
J.
Kriz, Met ho denkritik empirischer Sozialforschung
292 Seiten. DM 17,80
120
G.
Büschges,
Einführung in die Organisationssoziologie
214 Se i t en. DM 16,80
121
W. Teckenberg,
478 Seiten.
122
A.
DM
Diekmann/P. Mitter,
Methcxlen zur Analyse von Zeitabläufen
208 Seiten. DM 15,80
Preisänderungen vorbehalten
UdSSR
Herunterladen