Studienskripte n zur Soziologie Herausgeber: Prof. Dr. Prof, Erwin K. Methoden zur Analyse von Zeitverläufen Scheuch Dr. Heinz Sahner Anwendungen stochastischer Prozesse bei der Untersuchung von Ereignisdaten Von Dr. rer. und Dr. phil. pol. Andreas Diekmann Peter Mitter Institut für Höhere Studien und wissenschaftliche Forschung, Mit 25 Bildern und 17 Tabellen Teubner Studienskripten zur Soziologie sind als in sich abge­ schlossene Bausteine für das Grund- und Hauptstudium konzipiert. Sie umfassen sowohl Bände zu den Methoden der empirischen forschung, Darstellung der Grundlagen der Soziologie, in denen ver- Arbeiten zu sogenannten eines Themas und schiedene theoretische Ansätze, wichtige kutiert Sozial­ als auch Studien und Ergebnisse dargestellt und dissind Diese 1111:tar1gsseme:St<D: gedacht, sollen in erster Linie f ilr auch dem Examenskandidaten Praktiker eine rasch zugängliche Informationsquelle sein. B. G. Teubner Stuttgart 1984 Wien - Dipl.-Soz. Dr. 1951 rer. pol. in Lübeck geboren. Andreas Diekmann 1970 bis 1975 Vorwort in Hamburg. Anschließend Studium der Psychologie und stati­ Forschungsprojekten und in der Lehre am Institut für Sozio­ 1975 bis Studienaufenthalt in Ann Arbor, Michigan. 1980. Sommer 1977 Seit 1980 Assistent Bei Sozialwissenschaftlern verschiedenster Disziplinen ist in jüngster Zeit ein wachsendes Interesse a n der Untersuchung von Lebensverläufen, am Institut für Höhere Studien in Wien. nen. Publikationen zum Thema mathematische Modelle sozialer Pro­ werden, zesse, Sozialindikatoren und auf dem Gebiet der Soziologie abweichenden Verhaltens. Dr. phil. 1948 Biographien und sozialen Karrieren zu erken­ Gleichgültig, ob qualitative Erhebungsverfahren benutzt ob die Datenquellen Tagebücher oder Tiefeninterviews sind, oder ob hochstandardisierte Fragebögen Verwendung fin­ den - bei aller Unterschiedlichkeit der Erhebungsmethoden be­ steht das Ziel häufig darin, Peter Mitter in Innsbruck geboren. Studium der Mathematik und Infor­ matik an der Universität Innsbruck. - Studium der Soziologie stischen Methodenlehre in Hamburg und Wien. Mitarbeit in logie der Universität Hamburg von 5 1974 Assistent am Insti­ tut für Mathematik an der Universität Innsbruck und ab 1975 am Institut für Höhere Studien, Wien. Seit 1982 Leiter der Informationen über die zeitliche Abfolge von Ereignissen zu gewinnen. Derartige Ereignisge­ schichten - im Englischen "event histories" gangsmaterial der Datenanalyse dar. - stellen das Aus­ Auch bei experimentellen Abteilung für Mathematische Methoden und Computerverfahren Designs oder im Rahmen der Evaluierungsforschung, am Institut für Höhere Studien. Untersuchung der Wirksamkeit von Maßnahmen der Sozialplanung, Publikationen zum Thema Mathematische Methoden in den Sozial­ wissenschaften, Prognoseverfahren, Soziale Mobilität, Ar­ beitsmarktforschung. werden häufig die eignisses erhoben. also der Zeitintervalle bis zum Eintreten eines Er­ Z.B. richtet sich die Aufmerksamkeit von Kriminologen bei der Strafvollzugsevaluierung auf die Zeit­ spanne bis CIP-Kurztitelaufr.ahme der Deutschen Bibliothek zum ersten Rückfall nach der Entlassung aus einer Strafanstalt. von Zeitverläufen stochast. Prozesse bei d. von Adreas Diekmann u. Teubner, Unters. : Anwendungen von Ereignisdaten Peter Mitter. - Stuttgart / : (Teubner-Studienskripten 122 : Studienskripten zur Soziologie) besonders die der Übersetzung, des Nachdrucks, der Bild­ entnahme, der Funksendung, der Wiedergabe auf photomechanischem oder ähnlichem Wege, der Speicherung und Auswertung in Datenver­ arbeitungsanlagen, bleiben, auch bei Verwertung von Teilen des Werkes, dem Verlag vorbehalten. Bei gewerblichen Zwecken dienender Vervielfältigung ist an den § 54 zwischen Ereignissen sind in UrhG eine Vergütung zu zahlen, deren Höhe mit Diese die häufig auch unter dem Oberbegriff "Survival­ mographie und der Medizin- Das Werk ist urheberrechtlich geschützt. Die dadurch begründeten Verlag gemäß Methoden, Analyse" zusammengefaßt werden, ISBN 3-519-00122-5 NE: Mitter, Peter:; GT Rechte, Zur Analyse von Zeitintervallen den Sozialwissenschaften neue Methoden erforderlich. 1984. nicht verwunderlich: staJl1ltlen vor allem aus der De­ und Biostatistik. Der Grund ist Demographen und Mediziner waren schon im­ mer mit dem Zeitintervall bis zum Eintreten eines wichtigen Ereignisses, nämlich des Todes oder der Genesung befaßt. Be­ deutsame Weiterentwicklungen der Verfahren sind aber auch von Soziologen wie JAMES COLEMAN, MICHAEL HANNAN und NANCY TOMA und Ökonomen wie JAMES HECKMAN geleistet worden. dem Verlag zu vereinbaren ist. © B. G. Teubner Stuttgart 1984 Printed in Germany Gesamtherstellung: Beltz Oft<�t,ar,„rJc Umschlaggestaltung: W. Koch, Anwendungsgebiete der Survival-Analyse sind in der Ökonomie und Soziologie die Untersuchung von Berufskarrieren und so­ zialer Mobilität ebenso wie das Studium abweichenden Verhal- - 6 tens. - 7 - - Ereignisse sind im ersten Fall Berufswechsel und im Inhaltsverzeichnis Seite letzteren Fall abweichende Handlungen im Verlauf einer kri­ minellen Karriere. Für beide Disziplinen sind die Verfah­ 1. Einleitung: Datenanalyse mit stochastischen Modellen 11 11 ren zur Analyse von segmentierten Arbeitsmärkten von Bedeu- 1.1. Daten und Modell tung. können damit Einstellungsänderungen ge- 1.2. Beispiele und Fragestellungen 18 genüber Parteien, Kernkraft etc., 1.3. Datenarten und Datenstruktur 21 aber auch die Dynamik politischer Strukturen im Zeitablauf untersuchen, � graphen Prozesse der Migration und Psychologen z.B. Daten aus Lernexperimenten. 1.3.1. Ereignisdaten 21 1.3.2. Ereignisdaten als Individualdaten und gruppierte Daten 25 1.3.3. Bisher existierte u.w. kein Lehrbuch, Sprache unter Hinweis auf Computerprogramme Methoden der Ana­ 1.4. lyse von Ereignisdaten für Sozialwissenschaftler behandelt. Mit dem vorliegenden Buch beabsichtigen wir, eine erste Ein­ führung in das Gebiet anhand soziologischer Beispiele zu prä­ sentieren. Frau Mag. danken. 33 2.2. oas zwei-Zustands-Modell mit absorbierendem Zielzustand 37 Wir ren Dank für vielfältige kritische Diskussionen. Ohne das an­ regende Forschungsklima und die liberale Atmosphäre am Insti­ tut für Höhere Studien unter der Leitung von Prof. Rapoport wäre es schwerer gewesen, Anatol Überlebensfunktion und 2.2.2. Das Modell mit zeitunabhängiger Rate Maximum-Likelihood-Schätzung der Übergangsrate neben den Alltagsgeschäf­ Nicht-parametrische Schätzverfahren bei gruppierten Zeitbereichs-Daten: 3.2.1. die vorliegende Schrift 3.2.2. Programmbeispiele zu verfassen. 3.3. Wien, im September 1983 mit SPSS und BMDP Schätzverfahren bei Indi- vidualdaten mit exakter Ankunftszeit: Limit-Schätzer Andreas Diekmann und Peter Mitter 3.3.1. 60 68 76 Product­ Product-Limit-Schätzformeln 3.3.2. Programmbeispiel mit BMDP 3.4. 60 Life-Table-Schätzer Berechnung der Werte einer Sterbetafel Nicht-parametrische 52 58 3.1. Explorative Datenanalyse ten und Projektverpflichtungen ein einführendes Lehrbuch wie 49 58 3. Nicht-parametrische Verfahren 3. 2. 43 51 2.3. Mehr-Zustands-Modelle 2.4. 38 46 Zeitabhängige Raten 2.2.4. Berücksichtigung von Heterogenität Ranna Gutierrez-Rieger für zahlreiche Hinweise be­ tut für Höhere Studien und den Teilnehmern an unseren Semina­ 2.2.1. Übergangsrate, I Verteilungen 2.2.3. Peter Preisendörfer und Nicht zuletzt schulden wir unseren Kollegen am Insti­ 33 2.1. Arten stochastischer Prozesse Frau Helga Maier gilt unser Dank für die maschinenschriftli­ Frau Gerda Suppanz für die Anfertigung der Graphiken. 30 Einige Vorteile der Datenanalyse mit stochastischen Modellen 2. Grundlegende Konzepte stochastischer Modelle che Übersetzung unserer handschriftlichen Hieroglyphen und möchten uns besonders bei Herrn Dr. 27 Alternative Datenstrukturen das in verständlicher Verfahren für den Vergleich 77 81 86 8 4. - - Semi-parametrische Verfahren 95 4.1. Das Proportional-Hazards-Modell von COX 96 4.2. Die ?artial-Likelihood-Methode von COX 4.3. Das geschichtete Cox-Modell und die Über- 100 4.4. Signifikanztests und Stepwise-Regression Arbeitslosigkeit mit 5. 2. 195 119 5.1.2. Qualitative Variablen als Kovariate 124 5.1.3. 132 5.2.1. Exponentialverteilung 143 145 5.2.2. Weibullverteilung 146 5.2. 3. Weibullverteilung und Gompertz-Makeham- 148 Verteilung als Extremwertverteilungen 5.2.4. Das Sichel-Modell 5.2.5. 152 und log-logi- 5.2.6. Graphische Verfahren 154 5.2.7. 156 Anwendungsbeispiel Ehescheidungsdaten 5.3. Kovariateneffekte und Zeitabhängigkeit 5.4. 153 164 5.3.1. Die verallgemeinerte Gompertz-MakehamFunktion in RATE 164 5.3.2. Weitere RATE-Modelle 172 Mehr-Zustands-Modelle 173 5 . 4.1. Parameterschätzung bei Mehr-ZustandsModellen 174 5.4. 2. Die dynamische Analyse von Mehr-Zustands-Modellen 177 5.4. 2.1. Überlebensfunktionen und mittlere Ankunftszeiten 177 5.4.2.2. 179 Die Wahrscheinlichkeitsverteilung der Zustandsvariablen Y(t) Ableitung der Überlebensfunktion und einiger weiterer Beziehungen beim Zwei-Zustands-Modell mit absorbierendem Zielzustand 110 119 5.2. Parametrische Modelle der Zeitabhängigkeit 193 105 5. 1. Das log-lineare Basismodell Qualitative und quantitative Kovariate: Berechnungen mit dem Programm RATE Anhang 193 119 Das Modell und die Interpretation der Koeffizienten 190 1. Notation und Definition der wichtigsten Terme Parametrische Verfahren 5. 1.1. 6. Ausblick 102 prüfung der Proportionalitätsannahme 4. 5. 9 - 3. der Maximum-Likelihood-Schätzer bei Kovariaten 198 4. Die Ableitung der Differentialgleichungen für die Zustandswahrscheinlichkeiten bei Multi­ State-Modellen 200 Literaturverzeichnis 203 Sachregister 207 - 11 - 1. Einleitung: 1.1. Datenanalyse mit stochastischen Modellen Daten und Modell Bei Ereignisdaten handelt es sich u m spezielle, besonders in­ formationshaltige Längsschnittdaten. Zeitverläufe, d.h. Sie geben Auskunft über die Länge des Zeitintervalls bis treten eines Ereignisses, die Scheidung einer Ehe, zum Auf­ sei es der Abbruch eines Studiums, der Wechsel des Arbeitsplatzes, die Änderung der Einstellung gegenüber Gastarbeitern oder ein Mi­ litärputsch. Wie man sich vorstellen kann, sind Ereignisdaten wesentlich aussagekräftiger als beispielsweise Panel-Daten, da sie ja auch über die Geschehnisse zwischen den Erhebungs­ zeitpunkten einer Panel-Studie informieren. Eine genaue Er­ läuterung und Klassifizierung von Ereignisdaten erfolgt in Abschnitt 1.3. dieses Kapitels. Für den Sozialforscher stellt sich nun die Frage, niken geeignet sind, welche Tech­ um die Informationen aus den beobachteten Zeitverläufen optimal auszuschöpfen. Insbesondere möchte man kausales Wissen darüber erzielen, Merkmalen von welchen Bedingungen oder der Untersuchungseinheiten der Verlauf sozialer Pro­ zesse abhängt. Methoden diese und weitere Fragen geben können, zur Analyse von Ereignisdaten, (dazu Abschnitt 1.2.) die auf eine Antwort fassen wir in Anlehnung an den englischen Sprach­ gebrauch unter dem Oberbegriff Survival-Analyse zusammen. Bei Anwendungen der Survival-Analyse wird davon ausgegangen, daß der Zeitpunkt des Auftretens von Ereignisdaten normaler­ weise nicht rnit Sicherheit vorhersagbar ist. Vielmehr gibt es eine mehr oder minder große Wahrscheinlichkeit dafür, einer bestimmten Gruppe von Untersuchungseinheiten duen, Ehen, Staaten) ein bestimmtes Ereignis innerhalb eines festgelegten Zeitintervalls stattfindet. zwar zufällig auf, daß bei (Indivi­ Ereignisse treten jedoch können die Wahrscheinlichkeiten da- - - 13 - 12 - für in Abhängigkeit von den Charakteristika der Untersuchungs­ Geeignete Modelle stellt hierfür die Theorie stochastischer einheiten variieren. Die Theorie segmentierter Arbeitsmärkte Prozesse behauptet z.B., stochastischer Prozeß zwei Aspekte: daß Personen im "sekundären Arbeitsmarkt" ein größeres Risiko des unfreiwilligen Arbeitsplatzwechsels auf­ weisen (DOERINGER und PIORE, 1971). Das Zeitintervall bis zum Wechsel wird hier im allgemeinen kürzer sein als im stabile­ ren primären Arbeitsmarkt. aspekt zur Verfügung. Intuitiv gesprochen beinhaltet ein den Wahrscheinlichkeits­ (crToxa�€CT8al=durch Zufall etwas finden) (Prozeß) und den dyna­ der Zeitabhängigkeit der Wahrschein­ lichkeiten. Mit Hilfe des stochastischen Modells ist es mög­ lich, auf mathematisch-deduktivem Wege die Wahrscheinlich­ keitsverteilung der Ankunftszeiten, die Überlebensverteilung Die Grundlagen Zufälligkeit heißt also nicht Regellosigkeit. Im Gegenteil - und weitere Merkmale des Prozesses abzuleiten. man möchte der Modellkonstruktion werden ebenfalls in Kap.2 gelegt. ja gerade die Regel- oder Gesetzmäßigkeiten von Massenerscheinungen herausfinden oder vermutete Regelmäßig­ keiten an Daten überprüfen. In wenigen Worten läßt sich die Logik der Anwendung stocha­ stischer Modelle auf die Datenanalyse von Zeitintervallen fol­ Die verstrichene Zeit bis zur Ankunft eines Ereignisses weildauer, Ankunftszeit, Wartezeit) (Ver­ kann als Zufallsvariable gendermaßen skizzieren (Abbildung 11: Ausgangspunkt ist eine Hypothese über die genaue Art des stochastischen Prozesses, betrachtet werden. Die Wahrscheinlichkeitsverteilung der kon­ gewissermaßen eine Hypothese über den tinuierlichen, nismus". nicht-negativen Variablen Ankunftszeit gibt l einer Ehescheidung dann darüber Auskunft, mit welcher Wahrscheinlichkeit ein "stochastischen Mecha­ Eine solche Hypothese könnte z.B. lauten, (=Ereignis) daß das mit zunehmender Ehe­ aber bei gleicher Ehedauer in der Oberschicht ge­ Ereignis, etwa der Arbeitsplatzwechsel, bis zum Zeitpunkt t dauer sinkt, auftritt. Umgekehrt kann man auch fragen, ringer ist als in der Unterschicht. Die Hypothese besagt also, mit welcher Wahr­ scheinlichkeit eine Person bis zum Zeitpunkt t d.h. daß bis t kein Ereignis stattfindet. die Überlebensfunktion. vival-Analyse, "überlebt", Hierüber informiert Diese und weitere Konzepte der Sur­ sozusagen die grundlegenden Arbeitsinstrumente, werden in Kap.2. genauer erläutert. daß das momentane Risiko einer Ehescheidung von der Ehedauer t selbst abhängt der sogenannten Kovariaten Schicht. zum Zeitpunkt t und von (Zeitabhängigkeit) (=unabhängige Variable) soziale Wird die funktionale Abhängigkeit des Risikos von der Zeit und den Kovariaten in Form einer mathematischen Funktion spezifiziert (ähnlich wie eine Regressionsgleichung) , dann ge­ Wir wollen aber nicht bei den Verteilungen und der Überle­ stattet das stochastische Modell die Ableitung der Wahrschein­ bensfunktion stehenbleiben, lichkeitsverteilung der "Ankunftszeiten" hen. sondern einen Schritt weiterge­ Erstens stellt sich dann die Frage, durch welche grund­ und Ehescheidung) , (Zeit zwischen Heirat der Überlebensfunktion und der Wahrschein­ legende Hypothese oder vermutete Regelmäßigkeit die beobach­ lichkeitsdichteverteilung der Ankunftszeiten. Auf dieser Basis tete Verteilung der Zeitintervalle erklärt werden kann. zwei­ wiederum ist es möglich, tens fragt es sich, auf welche Weise die Parameter der Ver­ empirischer Daten teilungen und Überlebensfunktion an empirischen Daten werden können. mit einer geschätzt Zur Lösung beider Probleme benötigt man ein mathematisches Modell. die Parameter des Modells anhand (der beobachteten Ankunftszeiten) 1) zu einer genauen Definition des hier verwendeten Begriffs "Risiko" im technischen Sinne wird auf Kap.2 verwiesen. - 14 - - geeigneten Methode schätzen (z.B. 15 - der Maximum-Likelihood-Methode) zu (dazu Kap.2). Die Parameter sind wichtige Kenngrößen: Sie sind anschaulich interpretierbar und geben z.B. darüber Auskunft, die so­ wie stark eine unabhängige Variable ziale Schicht) (z.B. den Verlauf des Prozesses beeinflußt. Tests zur Modellüberprüfung und inferenzstatistische Tests zur Prü­ Mechanismus Risiko : f(Zeit, Kovariate) fung der Parameter auf Signifikanz k önnen Kriterien liefern, dafür wie gu t die Hypothesen mit den Daten übereinstimmen. Sind die Te sts negativ, so wird man das Modell revidieren müssen. Ableitung der Wahr­ scheinlichkeitsverteilung, liberlebensfunktion und Wahrscheinlichkeitsdichte Bei der Schilderung wurde unterstellt, daß das Risiko des Auf­ tretens eines Ereignisses in Abhängigkeit von den Kovariaten und der Zeit in Form einer mathematischen Gleichung - also in parametrischer Form - formuliert wurde. man von parametrischen Modellen, Parameterschätzung In diesem Fall spricht wie sie in Kap.5 behandelt werden. Wird dagegen in einem voraussetzungsärmeren Modell die Art der funktionalen Beziehung offen gelassen, so gelan­ gen die nicht-parametrischen Verfahren zur Anwendung, Inferenzstatistische denen in Kap.3 die Rede sein wird. Eine ein. Tests Modellüberprüfung scher Weise dargestellt, für die Zeitabhängigkeit werden da­ Cox-Regression wird in Kap.4 1: Die Logik der Datenanalyse mit stochastischen Modellen behandelt. Die semi-parametrische Parametrische Modelle haben einen höheren Informationsgehalt als semi-parametrische oder gar nicht-parametrische Modelle. Der Preis dafür ist in Form stärkerer Annahmen zu zahlen. Die mathematischen Modelle, Abbildung Hierbei wird nur der Einfluß der Kovariate in bestimmter parametri­ gegen beliebige Funktionen zugelassen. Aussagen über die Effekte der kausal unabhängigen Variablen auf den Prozeß und Möglichkeit von Prognosen von Zwischenstellung nimmt die den in dieser Arbeit vorge­ stellten Verfahren zugrunde liegen, der letzten Jahre, sind keine Erfindungen sondern das Ergebnis einer langen For­ schungstradition. Neu und inhaltlich bedeutsam für die Fort­ entwicklung der soziologischen Disziplin ist hingegen ihre enge Verknüpfung mit der Datenanalyse. - 16 - - 17 - Anwendungen stochastischer Modelle auf soziale Prozesse im Mit den klassischen Modellen und ihren Nachkriegsanwendungen w�itesten Sinne findet man schon bei DANIEL BERNOULLI in den Sozialwissenschaften wurde der Schwerpunkt auf die DAVID und MOESCHBERGER 1978), (vgl. der in einem berühmt gewor­ denen Vortrag im Jahre 1760 vor der Französischen Akademie Modellbildung, legt. weniger dagegen auf die Analyse von Daten ge­ Außerdem konzentrierte man sich beispielsweise in der der Wissenschaften die Auswirkungen der Eliminierung eines Soziologie primär auf die Erklärung von Mobilitätstabellen Krankheitsrisikos und gelegentlich auf die Verteilung von Ereignishäufigkeiten, (der Pocken) auf die Sterblichkeit unter­ sucht. Bei der Erforschung von Berufskarrieren mit den beiden Risiken "freiwillige Kündigung" beitgeber" kommt sein - nach heutiger Bezeichnung Risks-Modell" in soziologischen Arbeiten wieder CARROLL selten hingegen auf die Verteilung von Verweildauern. und "Kündigung durch den Ar­ "Competing­ zu Ehren (z.B. 1982). Die Arbeiten von COLEMAN (1964a,1981) und TUMA in jüngster Zeit eine Wende eingeleitet. (1979) haben Das eigentlich Neue ihrer Arbeiten ist die enge Verknüpfung von (parametrischen) stochastischen Modellen mit statistischen Schätzverfahren Einen festen Platz in der Theorie stochastischer Prozesse hat die Poisson-Verteilunq. Unfälle wurden u.W. ternommen. Anwendunqen auf seltene Ereiqnisse wie erstmaliq von L.v.BORTKIEWICZ (1898) un­ In den 20er Jahren formulierten GREENWOOD und YULE ein erweitertes Modell zur Erklärung von Unfallhäufigkeiten (zu verschiedenen Varianten siehe FELLER 1943). Aber erst i n unter Berücksichtigung von Kovariaten und die Erweiterung der Verfahren auf "Multi-State-Modelle" Abschnitt). (dazu der folgende Im Unterschied zum "statistischen Ansatz" geht die explizite Konzeptualisierung eines sozialen Prozesses durch ein stochastisches Modell der Datenanalyse voraus (COLEMAN 1981, Kap.1). Der große Vorteil dieser Strategie d e r Nachkriegszeit wurden diese Ideen in der Soziologie rezi­ besteht darin, piert. leitbaren Konsequenzen zahlreiche Charakteristika des sozia­ daß mit Hilfe des Modells und der daraus ab­ len Prozesses aufgedeckt werden Die klassischen Modelle aus der Unfallstatistik können auch können. Auf der anderen Seite wird im Gegensatz zu modellplatonischen Konstruktionen die heute gute Dienste - beispielsweise in der Kriminalsoziolo­ Zielsetzung in der Analyse empirischer Daten gesehen. gie - leisten und Techniken der Datenanalyse (zu einer übersieht siehe CARR-HILL und PAYNE 1971 sowie GREENBERG 1979, Teil II). Markov-Prozesse und Semi­ Medaille. Damit wird - wie wir sehen werden Markov-Prozesse stießen in den 50er und 60er Jahren auf wach­ lieh fruchtbarer Beitrag sendes Interesse in den Sozialwissenschaften. Die Anwendungs­ leistet. domänen waren in der Soziologie Prozesse sozialer Mobilität, in der Sozialpsychologie die Diffusion von Informationen und Neuerungen und in der Psychologie Vorgänge des Lernens und Gedächtnisleistungen und RAPOPORT 1980, (Uberblick in S�RENSEN und S�RENSEN Kap.III). 1977 Modell sind hierbei zwei Seiten einer ein außerordent- zur Analyse von Längsschnittdaten ge­ - 19 - 18 - Abbildung 2b 1.2. Beispiele und Fragestellungen Das Auftreten von Ereignissen kann in der Sprache stochasti­ scher Modelle als Zustandswechsel gedeutet werden. In der Survival-Analyse mit einem Ausgangszustand und einem absor­ (Abbildung 2a) bierenden Zielzustand eignis" auch synonym von "Tod", zeigt einen Zählprozeß. Die Zustandsvariable ist hierbei die Anzahl der Delikte. (BECKER 1963) Gemäß der Labeling-Theorie sollte das Risiko eines neuen Delikts mit der zahl vorher verübter Delikte anwachsen, kungstheorie" gemäß der "Abschrek­ ist möglicherweise eine Abnahme zu erwarten. wird anstelle von "Er­ "Ausfall" oder "failure" ge­ sprochen. 1 ) Die stochastischen Prozesse, werden, Zeit. Arbeitslos;.gkeit b) kriminelle Karrieren die in diesem Buch erläutert sind Modelle mit diskreten Zuständen und stetiger Die Zeit ist eine kontinuierliche Variable; können zu jedem Zeitpunkt auftreten. (z.B. a) Ereignisse Die Zustandsvariable arbeits·los/erwerbstätig in Abbildung 2a) weist dagegen diskrete Ausprägungen auf. Wir können jetzt zwei Fragen stellen. Antwort auf die Frage suchen, siko eines Zustandswechsels gigen Variablen usf.) (die Übergangsrate) (dem Ausbildungsniveau, beeinflußt wird. als Kausalhypothese. 0 Erstens kann man eine ob und in welcher Weise das Ri­ gegen Todes- cJ 1=����91 Attitüden­ änderung strafe von unabhän­ der Berufserfahrung Eine Hypothese hierüber bezeichnen wir "Drogenkarrieren" d) zweitens kann unser Interesse der Frage gelten, in welcher Weise das Risiko von der Verweildauer im Zustand "arbeitslos" abhängig ist. '.'.:.B. ist anzunehmen, (Mehr-Zustands­ Modell mit konkurrierenden Risiken) daß die Chance einer Beschäftigung mit zunehmender Arbeitslosig­ keit sinkt. Eine Hypothese dieser Art nennen wir Entwicklungs­ hypothese. Natürlich l!;.ann eine Hypothese auch davon ausgehen, daß sowohl Effekte unabhängiger Variablen als auch Verweil­ dauereffekte gemeinsam auftreten. r ij Risiko (tlbergangsrate für den j. oder von Kovariaten und der 1) ist aufgrund der Anwendungen der vorgeDie in verschiedensten Disziplinen (Medizinstellten statistik, Demographie, Technik, Biostatistik, sozialwis­ sensch�ften) noctt sehr uneinheitlich. Wir erwähnen häufig auch die synonyme, um dem Anwender den Weg in die Litera­ tur der Survival-Analyse zu erleichtern. Wechsel von Zustand i r kann eine Funktion von Kovariaten ij {Kausalhypothese) , von der Zeit {Entwicklungshypothesel nach Zustand Abbildung 2..:_ Zeit sein, Beispiele fur Modelle mit zwei und mehr Zuständen - - 21 - 20 - In beiden Fällen dürfte es sinnvoll sein, rücksichtigen, Kovariate zu be­ da kaum alle Personen das gleiche Risiko eines "Zustandswechsels" aufweisen dürften. die Zeitintervalle bis Anhand von Daten über zum ersten Delikt, und dem zweiten Delikt usf. zwischen dem ersten wären verschiedene interessante 1 Hypothesen über den Verlauf krimineller Karrieren prüfbar. ) Bei unseren Ausführungen in den folgenden Kapiteln wird haupt­ sächlich von dem einfachsten Modell in Abbildung 2a ausgegan­ gen. ständen, Modell mit zwei nicht-absorbierenden zu­ wie es von COLEMAN bildung 2c), (1981 ) zugrunde gestattet die Erforschung der gelegt wird (Ab­ Dynamik von Ein­ stellungsänderungen. Auch hier stellt sich wieder die Frage nach der Einflußstärke von Kovariaten auf den Prozeß der Attitüdenänderung. daß leichte Drogen als "Ein­ stiegsdrogen" das Risiko der Einnahme harter Drogen erhöhen. Das Risiko eines Wechsels von Zustand 1 in den Zustand 2 in Abbildung 2d müßte dann höher sein als der direkte Wechsel von O nach 2. Eine aussagekräftige Analyse erfordert auch bei dieser For­ relevanter unabhängiger Va­ Sonst könnte es der Fall sein, 2d nur deswegen größer ist als r , 02 daß r in Abbildung 12 weil Personen mit bestimm­ ten Merkmalen in den Zustand 1 gelangen, die auch ein erhöh­ in den Zustand 2 zu wechseln. Man muß - übrigens wie bei der Prüfung der Labeling-Hypothese in Abbil­ dung 2b - vorsichtig sein, sichtigter Heterogenität riate) 1) zur Schätzung der Modellen des in der Abbildung 2a gezeigten Typs zerlegen las­ Bei den Anwendungen der Survival-Analyse ist dieser Mo­ delltyp von grundlegender Bedeutung. 1.3. Datenarten und Datenstruktur 1.3.1. Ereignisdaten informieren Ereignisgeschichten ("Event­ Histories") oder kurz Ereignisdaten bezüglich jeder Untersu­ chungseinheit über die exakten Zeitpunkte, oder Zustandswechsel auftreten. zu denen Ereignisse Damit ist die Länge aller Zeitintervalle zwischen je zwei Ereignissen und die Abfolge der Ereignisse gegeben. Das Zeitintervall zwischen zwei be­ nachbarten Ereignissen wird schungsfrage die Berücksichtigung tes Risiko aufweisen, Mehr-Zustands-Modelle Wie schon angedeutet, Gelegentlich wird behauptet, riablen. da sich Parameter immer in eine bestimmte Anzahl von Zwei-Zustands­ sen. Ein stochastisches Es handelt sich dabei nicht um eine wesentliche Ein­ schränkung, da Fehlschlüsse wegen nicht-berück­ (=Vernachlässigung relevanter Kova­ leicht auftreten können. Daten dieser Art wurden z.B. in der Studie von WOLFGANG, Eine Sekundäranalyse in dieser Richtung wäre sicherlich von großem Interesse. FIGLIO und SELLIN 1979 erhoben. einfachsten Fall haben wir es pro nur einer Episode zu tun, z.B. der Dauer der Arbeitslosigkeit der Person i. Ereignisgeschichten lassen sich graphisch im Zustandsvariab­ len-Zeit-Diagramm (Abbildung 3) darstellen (zur Darstellung von Lebensverläufen siehe auch CARR-HILL und MACDONALD 1973, sowie MÜLLER 1977). Aus dem Diagramm gehen die Drogenkarrie­ ren für zwei Personen hervor. Es handelt sich dabei um ver­ laufsdaten, die mit dem Modell in Abbildung 2d korrespondieren. 1lDies können Individuen, Organisationen, Ehen etc.sein. Der Einfachheit halber sprechen wir im folgenden nur von Indi­ viduen, Personen oder Fällen. - 23 - - 22 - In Abbildung �ustand daten auf: harte 1 weiche 1 die letzte Episode t11 zu wird. Für den Fall, unbekannt ist, daß spricht man von linkszensiert.en Daten. Bleibt das Ende der letzten Episode 1 im Beobachtungszeitraum offen, 1 1 '10 T20 "abgeschnitten" der Beginn der ersten Episode P.erson 1 i beginnt T und endet zu einem Zeitpunkt i: ("window i1 iO of Observation"). Es kann somit passieren, daß die erste und einem Zeitpunkt Person 2 3 fällt eine häufige Besonderheit von Ereignis­ Die Beobachtungsperiode für Person so haben wir es mit rechts­ zensierten Daten zu tun. t21 Bei linkszensierten Daten ist normalerweise die problemati­ Beobachtungs-zei trawn links zensiert sche Annahme erforderlich, rechtszensiext daß die Vorgeschichte vor Beginn des Beobachtungszeitraums keinen Einfluß auf den Prozeß hat. Bei geeigneter Anlage des Erhebungsdesigns reduzieren sich hier aber die Probleme. Startereignis Endzeitpunkt von Episode m für Person i zusammen, In der Regel fällt T mit einem iO wie z.B. die Entlassung aus dem Ge­ Beginn der Beobachtungsperiode für Person i fängnis bei Rückfallstudien, der Heiratstermin bei Scheidungs­ Ende der Beobachtungsperiode für studien usf. Dieser Fall ist typisch bei Kohortenuntersuchun­ Person i �· Eine Kohorte ist sonen, die zu Abbildung 3: Zustandsvariablen-Zeit-Diagramm flüssen ja definiert als eine Gruppe von Perso­ Beginn ihrer Ereignisgeschichte gemeinsamen Ein­ ausgesetzt ist (z.B. eine Geburtskohorte von Perso­ nen mit gleichem Geburtsjahrgang, eine Heiratskohorte von Ehen mit gleichem Heiratsdatum etc.). Betrachten wir Person 1. Zeitpunkt , Die Beobachtungsperiode startet Bis zum Zeitpunkt t 11 (z.B. 10• ter) werden keinerlei Drogen genommen. Dann aber punkt t 11 im zum Zeit­ - tritt ein Ereignis oder Zustandswechsel ein. t markiert das Ende der ersten Episode bei Person 1. t zum drei Monate spä­ 11 (Allgemein: ist der Zeitpunkt der Beendigung der m'ten Episode bei Person il. Während des Zeitintervalls der Episode 2 befindet sich Person 1 im Zustand Zeitpunkt t 12 genkarriere bemerkbar. Zum Jetzt befindet sich Person 1 in Zu­ stand 2. Zum Zeitpunkt t freie Episode, 1, nimmt also weiche Drogen. macht sich eine neuerliche Änderung in der Dro­ schließlich beginnt eine drogen­ 13 die bis zum Ende der Beobachtungszeit andauert. Aber auch wenn man es nicht mit echten Kohorten zu tun hat, existiert häufig ein "natürlicher" Zeitpunkt des Prozeßbe­ ginns innerhalb der Beobachtungsperiode. Bei Studien der Arbeitslosigkeit etwa sollte der Anfang der Beobachtungs­ periode mindestens mit dem Beginn der Arbeitslosigkeit über­ einstimmen. Im Falle "echter" Kohorten ist normalerweise für alle Personen identisch wie in Abbildung 4. Hier ' iO � 'o endet auch der Beobachtungszeitraum für alle Personen zum (T � , ), was wiederum besonders typisch i1 1 für Kohortenstudien ist. Ein Beispiel ist eine Stichprobe von gleichen Zeitpunkt Personen, die zum gleichen Zeitpunkt arbeitslos wurden und für einen Zeitraum von 12 Monaten untersucht werden. 24 - - Bei rechtszensierten Daten ist die Situation anders. 1) Grei­ fen wir dazu das einfache Beispiel in Abbildung 4 das auf, mit dem Zwei-Zustands-Modell in Abbildung 2a korrespondiert. Bei Person 1 stellen wir fest, daß im Beobachtungszeitraum kein Ereignis aufgetreten ist. Die Episode ist also "abge­ schnitten"; es handelt sich um ein zensiertes Datum. bei Person 2. Zum Zeitpunkt t weggelassen werden, 2 Anders (der Episodenindex rn kann hier da beim Zwei-Zustands-Modell mit absor­ bierendem Zielzustand nur eine Episode pro Fall betrachtet wird) hat Person 2 eine Beschäftigung aufgenommen. sode Arbeitslosigkeit ist nicht zensiert, Die Epi­ und wir sprechen daher von einem nicht-zensierten Datum oder einer exakten Beobachtung. 25 - Vernachlässigt man einfach die zensierten Fälle bei der Aus­ wertung der Daten, dann führt dies zu einer u.u. krassen Verzerrung der Ergebnisse. äußerst Ein großer Vorteil der Schätzverfahren auf der Basis stochastischer Modelle ist darin zu sehen, daß sie die Informationen zensierter Daten explizit nutzen und optimal verarbeiten können. Wenn von dem Beginn der Beobachtungsperiode bei Person i die Rede war, so wurde auf die Kalenderzeit oder chro­ ( •iol nologische Zeit verwiesen. Wurde dagegen von der Verweildauer oder Ankunftszeit gesprochen, meint. son Nehmen wir an, 2 am 1. April Person so ist damit die Prozeßzeit ge­ 1 wurde am 1. arbeitslos. Januar und Per- Die Kalenderzeit ist dann bei beiden Personen unterschiedlich, während die Prozeßzeit t je­ weils bei Beginn der Arbeitslosigkeit auf 0 gesetzt wird. Wir haben es also mit '1 err,,.,l'erbs­ tä,t±g gische, Die in diesem Buch präsentierten stationären Modelle können Beobachtungsze�traum Zustandsvariablen-Zeitdiagramm für die Dauer der Arbeitslosigkeit In der Praxis stellt sich fast immer das Problem rechtszen­ geschieden, 1l wenn im so sind so ist zunächst struktion relevante Prozeßzeit erforderlich. t 'o sierter Daten. Eine mißt die chronolo­ Wird bei der Datengewin­ eine Übersetzung in die für die Datenanalyse und Modellkon­ 0 4: zu tun. nung die Kalenderzeit von Ereignissen erhoben, PeJ:."SOn 2 Person 1 Abbildung zwei Uhren die andere die Prozeßzeit. Nicht alle Ehen werden im Beobachtungszeitraum nicht alle Personen finden einen Arbeitsplatz usf. u•·Y'"'"��u· kurz von zensierten Daten die Rede ist, immer rechtszensierte ·Daten gemeint. wohl Verweildauereffekte (Zeit-Inhomogenität), Kalenderzeiteffekte explizit modellieren. möglich, nicht aber Allerdings ist es mittels des Untersuchungsdesigns, z.B. durch die Auswahl geeignet geformter Kohorten, oder auch durch Kova­ riate vermutete "Einflüsse" der Kalenderzeit zu kontrollie- ren. 1.3.2. Ereignisdaten als Individualdaten und gruppierte Daten Bei Ereignisdaten mit mehreren Episoden wie im Beispiel der Drogenkarriere sind die kleinsten Einheiten der Analyse die Episoden. Datentechnisch bedeutet dies, "logische" Lochkarte zu präparieren ist. wir in Kap.5 behandeln. daß pro Episode eine Ein Beispiel werden - 26 - 27 - Einfacher ist die Situation hingegen beim Beispiel der Ar­ beitslosigkeitsuntersuchung. nur eine Episode, Hier existiert pro Individuum so daß in üblicher Weise die Individuen die Analyseeinheit bilden. Um die Angelegenheit nicht übermäßig zu komplizieren, werden da sowohl bei der Drogenkarriere als auch bei der Arbeitslosigkeitsdauer die erhobenen Merk­ male (Episodendauer und unabhängige Variablen) Individuen zu­ geordnet werden können. Bei Individualdaten kann der exakte Zeitpunkt eines Ereig­ nisses bekannt sein, z.B. wenn die Daten darüber informieren, daß Person i nach x Tagen arbeitslos wurde. der Fall sein, Es kann aber auch daß die Daten nur über einen Zeitbereich Auf­ schluß geben, in dem ein Ereignis stattgefunden hat. Diese Situation liegt häufig vor, wenn man nach dem Alter in Jah­ ren fragt, zu dem ein Ereignis stattgefunden hat. sagt die Angabe des Alters, begangen wurde, Z.B. be­ in dem der erste Ladendiebstahl daß das Ereignis "erster Ladendiebstahl" Natürlich kann man auch Grade der Exaktheit von unterscheiden. daß bei Individualdaten die exakten Zeit­ punkte von Ereignissen bekannt sein können, oder aber nur in die die Ereignisse fallen. ersten Fall sprechen wir von ohne in nach Man weiß also nur, z.B. zwei Jahren usf. ge­ daß eine bestimmte Anzahl im dritten Ehejahr, stattgefunden hat, jedem einzelnen Fall das genaue Datum zu kennen. Solche tabellarischen Daten, bei denen eine große Anzahl Untersuchungseinheiten aggregiert wurden, folgenden als gruppierte Daten. von bezeichnen wir im Im Unterschied zu Individual­ daten können wir bei gruppierten Daten in der Regel davon ausgehen, 1.3.3. daß es sich um Zeitbereichs-Daten handelt. Alternative Datenstrukturen Die Ereignisgeschichten in Abbildung 3 und des Individuum durch Paare von zu denen ein 4 kann man für je­ Zustandswerten und Zeitpunkten, Zustandswechsel erfolgt, charakterisieren auch TUMA 1979). Für Person (siehe 1 in Abbildung 3 wird die voll­ ständige Ereignisgeschichte mit den folgenden Meßwertepaaren wiedergegeben: { (T 10,o), (t , 1), (t12, 2), (t13 ,O), (T11 ,O)} 11 Ereignisgeschichte Zeitangaben Es genügt jedoch im folgenden, von der Dicho­ abgegrenzte Zeitbereiche, schieden sind. ir­ gendwann innerhalb eines bestimmten Jahres aufgetreten ist. tomie auszugehen, kann man entnehmen, wieviele Ehen eines Eheschlies­ sungsjahrgangs nach einem Jahr, von Scheidungen, wir in Abgrenzung zu gruppierten Daten in beiden Fällen von Individualdaten sprechen, werden, Im Zeitpunkt-Daten, im letzteren Kennt man nur die Abfolge der Episoden (keine Drogen, weiche Drogen usf.) im Beobachtungszeitraum, nicht aber die punkte der Zustandswechsel, quenz-Designs. Zeit­ so spricht man von Ereignis-Se­ Für Person 1 liegt dann nur folgende Informa­ tion vor: Fall von Zeitbereichs-Daten. Veröffentlichte Daten von statistischen Ämtern sind im Gegen­ satz zu Individualdaten normalerweise aggregiert. Auch ist hier zumeist nicht der exakte Zeitpunkt eines Ereignisses er­ schließbar, sondern nur ein mehr oder minder großes tervall angegeben. z.B., Zeitin­ Aus kohortenspezifischen Scheidungsdaten wie sie gelegentlich von statistischen Ämtern publiziert Ereignissequenz ( (T 10 ,0),1,2,0,(T ,oJ}. 11 Wurden nur die Ereignishäufigkeiten achtungszeitraum erhoben, Daten noch geringer. (Event Counts) im Beob­ so ist der Informationsgehalt der Jetzt kann man nur darüber Auskunft ge­ ben, wie häufig sich eine Person im des Beobachtungszeitraums befand. Zustand 0,1,2 während - 29 - - 28 - bei einer Panel-Erhebung nach der Ereignisgeschichte {(T1Q'T11),(0,2),(1,1)(2,1)} den Befragungszeitpunkten fragen. keine Querschnitts- oder Paneldaten, Das erste Paar gibt den Beobachtungszeitraum an. rigen Paaren gibt die erste Zahl den zweimal im Zustand Bei Person o wie man sieht, gehalt. haben Ereignisdaten den höchsten Dies ist wohl auch der Grund, daten zu verzeichnen ist. in welchem Zustand sich eine befindet. also den "Wellen" der Und vermutlich ist dies auch einer der Gründe hinter der Forderung nach qualitativen Methoden zur Erfassung von Lebensverläufen. Bei einer Panel-Studie mit zwei Wel­ zum Ende des Beobachtungszeitraums erhält Von Ereignisdaten bis hin zu Querschnittsdaten existiert eine Datenhierarchie: man als Daten: Kennt man die Ereignisgeschichte, man auch alle anderen Daten, Panel-Daten { ( ,10,o), (T11,o)} Die zwischen den "Wellen" jedoch unbekannt. sponse-Daten, Panel-Daten sehr ähnlich sind Quantal-Re­ Inspektion resultieren, durch die nur festgestellt wird, das untersuchte Ereignis eingetreten ist oder nicht. ob Solche bei einer Retrospektiverhebung anfallen, in der zwar nach dem Eintreten bestimmter Ereignisse erste Ladendiebstahl, die erste Liebe), Alter bei diesem Ereignis gefragt wird, so kennt aber nicht umgekehrt. Zur Schätzung der Parameter stochastischer Modelle sind Er­ liegende Ereignisgeschichte bleibt welche bei bekanntem Episodenbeginn aus einer Daten können z.B. Informations­ daß in den letzten Jah­ ren ein z unehmendes Interesse an der Erhebung von Ereignis­ zu den Befragungszeitpunkten, len zu Beginn und war Person . ist nur bekannt, Panel-Studie, Z.B. sondern Ereignisdaten. Bei den üb­ Zustand und die zweite Zahl die Häufigkeit des Ereignisses wieder. zwischen Dann sind das Resultat (der eignisdaten besonders gut geeignet. Theorie stochastischer Analyse von Ereignisdaten. ven Daten - bis hin zahlen wäre, zur Aber auch bei weniger informati- zu Querschnittsdaten stische Modelle gute Dienst leisten. zu Umgekehrt liefert die Prozesse die geeigneten Modelle können stocha- Der Preis, der hierfür ist je nach Art der Daten die Akzeptierung mehr oder minder realistischer Annahmen. l) nicht aber nach dem etwa weil die Alters­ angabe im Gegensatz zur Ereignisangabe sehr unzuverlässig ist. Eine Querschnittsstudie zum Zeitpunkt ,11 schließlich liefert die Daten: 11 Die Bezeichnungen Panel- und Querschnittsdaten beziehen sich hier auf die Art der Daten, nicht auf die Erhebungsmethode. Bei einer einmaligen Befragung kann man Berufskarriere retrospektiv zu erfassen. z.B. versuchen, die Ebenso kann man In dieser Einführung beschäftigen wir uns nur mit der Ana­ lyse von Ereignisdaten. Verfahren und Programme zur Aus­ von Querschnittsdaten, Paneldaten und Ereignis­ mit stochastischen Modellen findet man in 1 von COLEMAN (198 ). Die sind am Lehrvon Prof.Kreutz an der Nürnberg implementiert. - 30 - - 31 - 1. 4. der stochastischen Modellbildung besteht darin, Modellen "Hardersche Dilenuna" aufgelöst wird. daß das Stochastische Modelle tragen dem Zeitverlauf und damit der I?ynamik explizit Rech­ Stellen wir zusanunenfassend noch einmal die Vorteile der Da­ tenanalyse auf der Basis stochastischer Modelle dar. nung. Welchen Beitrag zur Problemlösung leisten die hier vorgestellten Ver­ Im Unterschied zu den naturwissenschaftlichen Makrogesetzen fahren? haben es die Sozialwissenschaften vorwiegend mit Wahrschein­ lichkeitsgesetzen oder probabilistischen Regelmäßigkeiten Einige Probleme einer empirisch orientierten Sozialwissen­ zu tun. schaft lassen sich stichwortartig auflisten: keitsverteilungen erklärbar und prognostizierbar. - Problem 1: - Problem 2: wird der nicht-deterministische Dynamische Theorien versus statische Analyse Messung und Skalenprobleme - Problem 4: Explorative Datenanalyse - Problem 6: Modellen von geringerer Bedeutung. eignisdaten wird ja die ein "natürlicher" Prüfung von Hypothesen und Ermittlung der Ein­ der flußstärke unabhängiger Variablen gewählt, Geeignete Schätzverfahren zur Auswertung ver­ schiedener Arten von Längsschnittdaten, insbe­ sondere von Lebensverläufen, sozialen Karrieren und Biographien - Problem 7: - Problem 8: schaftlicher Gesetzmäßigkeiten explizit berücksichtigt. Skalenprobleme sind bei der Datenanalyse mit stochastischen - Problem 3: 5: Hierdurch Charakter sozialwissen­ Probabilistische versus deterministische Regel­ mäßigkeiten - Problem Mit stochastischen Prozessen sind Wahrscheinlich­ Berücksichtigung Bei der Auswertung von Er­ zugrunde gelegt. Beginn des Prozesses, d.h. Existiert ist der Nullpunkt Zeitskala substantiell interpretierbar und nicht beliebig so verfügt man sogar über eine Ratioskala. 1) Die sogenannten nicht-parametrischen Verfahren der Analyse Survival­ sind besonders geeignet zum Zweck explorativer Da­ tenanalysen, ohne genau spezifiziertes theoretisches Vorwis­ sen vorauszusetzen. zensierter Daten Zeitskala Zur Prüfung von Hypothesen über Zeitver­ läufe und Kausaleffekte kann hingegen auf parametrische Mo­ Gewinnung informativer Aussagen über den Verlauf delle zurückgegriffen werden. sozialer Prozesse. für ��;:..;;;.::.:!==..:::::=.:::�� Datenanalysen stehen somit Methoden zur Sowohl für explorative als auch Verfügung. Auf das Dilenm1a von dynamischen zierenden Bezeichnungen" "Mobilität", "Evolution", Theorien und in der Soziologie "Dynamik indi­ ("sozialer Wandel", "sozialer Prozeß" usf.) einerseits und meist statischen Analyseverfahren und Auswertungen von Querschnittsdaten andererseits hat schon vor einem Jahrzehnt HARDER (1973) in dieser Buchreihe hingewiesen. Ein Vorteil 1l Bei den unabhängigen Variablen können allerdings Probleme mit den Skaleneigenschaften auftreten. Diese müssen ent­ weder mindestens Intervallskalenniveau haben oder als di­ chotome Dummy-Variablen in die Analyse eingehen. Genaue­ res dazu weiter unten. - 32 - - Zur Auswertung von Ereignisdaten werden neue Methoden benö­ 2. 33 - Grundlegende Konzepte stochastischer Modelle tigt. Bekannte Verfahren wie die Regressionsanalyse sind nur in seltenen Sonderfällen anwendbar - in der Regel scheitern In diesem Kapitel wollen wir die Arbeitsinstrumente der Ana­ sie am Problem zensierter, lyse genauer behandeln. also unvollständiger darstellen, Der fahren ist ein eingehendes Verständnis der folgenden Konzepte Techniken zur Analyse der und der zwischen ihnen existierenden Beziehungen von Bedeutung: - sondern auch - ten ermöglichen. Ferner gestatten stochastische Modelle - wurden die Parameter erst einmal an Daten geschätzt - eine Vielzahl von Ableitun­ gen über den Verlauf des Prozesses. haben somit einen hohen Für die praktische Anwendung der Ver­ darin zu sehen, Vorzug der stochastischen Verfahren ist u.a. daß sie nicht nur die angemessenen Daten. Stochastische Modelle - Zustandsraum-Variable Y(t) Zustände j 1,2,3, • • . ,n Ankunftszeit Tj bezüglich Zustand j (Zufallsvariable) Ubergangsrate r (t) jk Hazardrate r im Zustand j j - Übergangswahrscheinlichkeit qj (t,t+At) k - Überlebensfunktion im Zustand j G (t) j - (Kumulierte) Wahrscheinlichkeitsverteilung der Ankunftszeiten bezüglich Zustand j Fj (t) - Wahrscheinlichkeitsdichteverteilung der Ankunftszeiten f (t), wenn T eine stetige Zufalls<rariable ist j j - Erwartungswert (Mittelwert) der Ankunftszeiten E(T ) j - Häufigkeitsverteilung (t) der diskreten ZustandsraumVariablen Y(t). Kompliziertere Ableitungen, ren die für die Anwendung der Verfah­ zur Datenanalyse nicht unbedingt erforderlich, tieferes Verständnis aber sehr nützlich sind, für ein findet der interessierte Leser im Anhang. 2.1. Arten stochastischer Prozesse Eine erste Entscheidung bei der Modellkonstruktion betrifft die Wahl des Zustandsraums. Die Zustände können diskret oder stetig sein und entsprechendes gilt für die Zustandsraum­ Variable Y(t). In Abbildung 2d in Kap.1 z.B. wird der Zustands­ raum in drei diskrete,sich gegenseitig ausschließende und erschöpfende zustände zerlegt: keine Drogen, weiche Drogen - 32 - - Zur Auswertung von Ereignisdaten werden neue Methoden benö­ 2. 33 - Grundlegende Konzepte stochastischer Modelle tigt. Bekannte Verfahren wie die Regressionsanalyse sind nur in seltenen Sonderfällen anwendbar - in der Regel scheitern In diesem Kapitel wollen wir die Arbeitsinstrumente der Ana­ sie am Problem zensierter, lyse genauer behandeln. also unvollständiger darstellen, Der fahren ist ein eingehendes Verständnis der folgenden Konzepte Techniken zur Analyse der und der zwischen ihnen existierenden Beziehungen von Bedeutung: - sondern auch - ten ermöglichen. Ferner gestatten stochastische Modelle - wurden die Parameter erst einmal an Daten geschätzt - eine Vielzahl von Ableitun­ gen über den Verlauf des Prozesses. haben somit einen hohen Für die praktische Anwendung der Ver­ darin zu sehen, Vorzug der stochastischen Verfahren ist u.a. daß sie nicht nur die angemessenen Daten. Stochastische Modelle - Zustandsraum-Variable Y(t) Zustände j 1,2,3, • • . ,n Ankunftszeit Tj bezüglich Zustand j (Zufallsvariable) Ubergangsrate r (t) jk Hazardrate r im Zustand j j - Übergangswahrscheinlichkeit qj (t,t+At) k - Überlebensfunktion im Zustand j G (t) j - (Kumulierte) Wahrscheinlichkeitsverteilung der Ankunftszeiten bezüglich Zustand j Fj (t) - Wahrscheinlichkeitsdichteverteilung der Ankunftszeiten f (t), wenn T eine stetige Zufalls<rariable ist j j - Erwartungswert (Mittelwert) der Ankunftszeiten E(T ) j - Häufigkeitsverteilung (t) der diskreten ZustandsraumVariablen Y(t). Kompliziertere Ableitungen, ren die für die Anwendung der Verfah­ zur Datenanalyse nicht unbedingt erforderlich, tieferes Verständnis aber sehr nützlich sind, für ein findet der interessierte Leser im Anhang. 2.1. Arten stochastischer Prozesse Eine erste Entscheidung bei der Modellkonstruktion betrifft die Wahl des Zustandsraums. Die Zustände können diskret oder stetig sein und entsprechendes gilt für die Zustandsraum­ Variable Y(t). In Abbildung 2d in Kap.1 z.B. wird der Zustands­ raum in drei diskrete,sich gegenseitig ausschließende und erschöpfende zustände zerlegt: keine Drogen, weiche Drogen - 35 - - 34 - und harte Drogen. Variablen Für jeden Die korrespondierenden Werte der (Zufalls-) Y(t) sind j=0,1 und 2. meisten sozialwissenschaftlichen Problemen angemessen. Zustand existiert eine Wahrscheinlichkeit. In der Regel ändern sich diese Wahrscheinlichkeiten im Zeitablauf. Die Zeit t kann hierbei diskret oder stetig sein. Fall Im ersten ist die Wahrscheinlichkeitsverteilung Y(t) nur Zeitpunkten t=0,1,2 Zeitpunkt t�o. • . • definiert, im Wie Tabelle 1 zu festen zweiten Fall zu jedem zeigt, kann man nun vier Arten stochastischer P rozesse unterscheiden: Zustandsraum-Variable Y(t) diskret stetig nisse können festgelegten Zeitpunkten. Den Ausprägungen von Y (t) entsprechen keiten, die von der Zeit abhängen. keit, daß eine Person (Zustand j=1) zum Zeitpunkt t z.B. p. (t)=P J [Y(t) =j ] . Y(t), zeß Wir befassen uns also mit Prozessen mit ste­ tiger Zeit.und diskreten Zuständen. 1) kann man von Verteilungen. man spricht auch zeitindizier­ deren zeitab­ zu erklären und zu bestimmen gilt. Wenn ein stochastischer P rozeß nicht-trivial ist, schen den zuständen Übergänge möglich. l) den "weichen Drogen" zum Zeitpunkt t "keine Drogen" tionen) Wechsels vom Zustand k im Zeitpunkt(t+ßt), sind zwi­ Eine Person kann von in einem Zeitintervall wechseln.Y(t) hätte dann den Die bedingte Wahrscheinlich­ keit eines direkten oder indirekten (d.h. Wenn die Ausprägungen von Y (t) als Zahl von Ereignissen (z.B. Deliktzahl wie in Abbildung 2b) interpretiert werden, hat Y(t) z.B. absolutes Skalenniveau. von Einen stochastischen Pro­ hängige Wahrscheinlichkeitsverteilung es Wert 1 und Y(t+�t) den Wert o. Die Wahl eines diskreten Zustandsraums ist keine Vorent­ scheidung bezüglich des Skalenniveaus der Variablen Y(t). Diese kann ebenso nominales wie Absolutskalenniveau haben. [Y(t)=1] . Zeitpunkt t existiert eine jetzt definieren als eine Familie llt in den zustand ) l (t)=P definiert für den jeweils gewählten Zu jedem positiven ter Zufallsvariablen (RAPOPORT 1980, S.101), Der für uns in Frage kommende Modelltyp ist mit einem Kreuz 1 p.(t) ist die (diskrete) Wahrscheinlichkeitsverteilung der einer "Familie" 1: Vier Typen stochastischer Prozesse gekennzeichnet. weiche Drogen nimmt, schreiben wir symbolisch p Allgemein gilt: ; X zustandswahrsoheinlioh­ Für die Wahrscheinlich­ solche Wahrscheinlichkeitsverteilung stetig zu zweitens ist das Modell mathema­ tisch relativ gut handhabbar. Zustandsraum. Zeit t Ereig­ zu jedem Zeitpunkt auftreten und nicht nur Z fallsvariablen diskret Tabelle Erstens ist der Prozeßtyp bei den Diese Wahl hat zwei Vorteile: über Zwischensta­ j im Zeitpunkt t in den Zustand also im Zeitintervall ßt, bezeichnet wan als Übergangswahrscheinlichkeit q (t,t+l)t). jk l) Andernfalls stünden in der Diagonale der Matrix der über­ weiter unten) nur Einsen gangswahrscheinlichkeiten konstant. und p.(t) wäre zu jedem J - 36 - Formal: Nehmen 1) qjk(t,t+öt) z.B. - 37 - = P Y(t+ßtl=klY(t)=j] [ scheinlichkeiten aufweisen, nach 6 Monaten 80 Personen leichte Drogen und haben von diesen nach 7 Monaten (ßt=1) 20 mit dem Drogen­ konsum vollständig aufgehört, so ergibt sich als Schätzwert der Übergangswahrscheinlichkeit für dieses Zeitintervall ein q 0C6,7) 1 von 0,25 vom zustand 1 in den Zustand die Übergangswahrscheinlichkeit nur davon abhängig, befand, ist in wel­ j sich die Untersuchungseinheit nicht jedoch vom vorvorhergehenden und allen frühe­ ren Zuständen der Ereignisgeschichte. zum Zeitpunkt t weiche Drogen nimmt, Für eine Person, die werden also unabhängig von ihrer vorherigen Drogenkarriere für die Zukunft die glei­ chen Übergangswahrscheinlichkeiten unterstellt. zesse "ohne Gedächtnis" werden als Solche Probezeich- ) net. 2 Die Modellklasse, 1 je nachdem wie lange sie sich befunden haben. mit der wir uns hier beschäftigen, können wir somit weiter einschränken: wenn die Übergangswahrscheinlichkeit zusätzlich von der Verweildauer im vorhergehenden Zustand j abhängig ist. Konsumenten von weichen Drogen können dann unterschiedliche Es In dem Drogenbeispiel wurden drei Zustände unterschieden, wo­ bei die Möglichkeit besteht, laufen. (Multi-State-Modelle) net. jeden Zustand erneut übergangswahr- zu durch­ Solche Modelle werden als Mehr-Zustands-Modelle mit reversiblen Ereignissen bezeich­ Die jeweilige Festlegung des Zustandsraums wird durch substanzwissenschaftliche Überlegungen, durch das Forschungs­ problem und die Fragestellung der Untersuchung gesteuert. Das einfachste Modell ist dagegen das Zwei-Zustands-Modell mit absorbierendem Zielzustand. Von Semi-Markov-Prozessen wird dann gesprochen, 1l o. Bei einer wichtigen Klasse von stochastischen Prozessen chem vorhergehenden Zustand schon im Zustand eignisse irreversibel. In diesem Fall sind die Er­ Die Konzepte der Analyse lassen sich am besten anhand dieses Zwei-Zustands-r.Jodells erläutern. über hinaus ist das Modell auch bei Dar­ empirischen Anwendungen von großer Bedeutung. 2.2. 1) 2) wie vorher die Wahrscheinlichkeit. Das Sym­ zu lesen als "unter der Bedingung von • • . " . P[Y(t+llt) = k!Y(t!=j und Y(T)=y(T) für P[Y(t+öt) = k IY(t) ]" T<t "j] Die Übergangswahrscheinlichkeit von j nach k ändert sich nicht, auch wenn man die gesamte Vorgeschichte Y(<) des Prozesses kennt. Verschiedene Anwendungen des Modells sowie die Notation sind in Abbildung 5 1) aufgelistet. Interpretieren wir im folgenden Bei Semi-Markov-Prozessen ist das Zeitintervall zwischen zwei Ereignissen nicht exponential verteilt wie im Fall von Markov-Prozessen. Dazu weiter unten. 2l Die Unabhängigkeit von der Vorgeschichte erscheint eine sehr restriktive Annahme zu sein. In Weise kann die den K<>v;•r1" zum Ausdruck so daß die Restriktion weniger (dazu Anschein hat. einschneidend ist, - 39 - - 38 Zustand O als "arbeitslos". Die Wartezeit bezieht sich dann � � auf das Intervall bis zum Eintreten des Ereignisses "Aufnahme einer Erwerbstätigkeit" einzigen Übergangsrate (Zustand zu 1). tun haben, Da wir es nur mit einer Zustand O = kein Ereignis verzichten wir auf die explizite Hinzufügung der Zustandsindizes bei der Rate r(t) und der Ubergangswahrscheinlichkeit q(t,t+ßtJ. stand Y(t) Da ferner Zu­ 1 absorbierend ist, sind Tj,G (t),Fj(t) und f (t) sinn­ j j vollerweise immer nur auf den Zustand j�o bezogen. Auch hier können wir die Notation vereinfachen, weglassen. 2.2.1. indem wir den Index j Übergangsrate, Uberlebensfunktion und Verteilungen Po (t) r(t) L\t+O Zeitintervalle der Länge ßt sind also Rate und Übergangswahrscheinlichkeit proportional: q(t,t+Llt) r(t) .b.t um sich in erster Näherung unter der nicht direkt beobacht­ baren übergangsrate etwas vorstellen zu können, kann man grob sagen, daß sie für kurze Zeiteinheiten der (bedingten) Wahr­ scheinlichkeit zum Zustandswechsel entspricht. Die Rate in­ formiert damit über die Intensität der momentanen Neigung ) Da sie zwar nicht-ne­ oder das Risiko zum Zustandswechsel7 gativ ist, aber größere Werte als eins annehmen kann, ist sie jedoch keine Wahrscheinlichkeit. 1l P [Y (t) Y(t) 1 z ustandsraum­ Variable = = O] p1 (t)=P(Y(t)=1} Abbildung 5: Zwei-Zustands-Modell mit absorbierendem Ziel­ zustand Beispiele lim q(t,t+ßt)/ßt ein. Für "sehr kleine" 0 r{t)=tibergangsrate q(t,t+6t)=Übergangswahrscheinlichkeit Eine herausragende Stellung nimmt die Übergangsrate (1) = = Zustand Für die tibergangsrate sind zahlreiche Synonyme gebräuchlich wie das schon erwähnte ferner Intensität mit einem Zieloder "Force of Mortality". zustand ist die Ubergangsrate auch mit der Hazardrate identisch (dazu weiter unten) . - arbeitslos konform Beruf i lebend unfallfrei alter Wohnsitz Y(t)=O - erwerbstätig abweichend Beruf j tot Unfall - neuer Wohnsitz - arbeitslos - Organisation Y(t)=1 - Ehe existiert nicht Die Übergangsrate ist deswegen von zentraler Bedeutung, sie erstens Gegenstand der Hypothesenbildung ist und weil zweitens den Verlauf des Prozesses in eindeutiger Weise festlegt. nächst jedoch noch einige Begriffe, bevor hierauf und auf zu­ weitere Interpretationen der Übergangsrate eingegangen wer­ den kann. Bei einem stochastischen Prozeß kann man, wie wir schon ge­ sehen haben, zwei Zufallsvariablen und ihre zugehörigen Ver­ teilungen betrachten: Erstens die - 41 - - 40 - und zweitens die Ankunftszeit T eines Zustandswechsels oder Wir führen jetzt folgende Funktionen ein, Ereignisses. wir uns auf Prozesse mit stetiger wobei Ankunftszeit-Variablen T beschränken: a) G(tl=tlberlebenswahrschein­ lichkeit im z u s and o bl t - G(t)=P T�t gibt die wahrscheinlich- Die keit an, [ ] daß eine Person den Zeitpunkt t kein Ereignis eintritt (Abbildung 6a). "erlebt", d.h. denn p (t) infor­ 0 wie groß die Wahrscheinlichkeit ist, sich eine Person zum daß G(t) ist identisch mit der Zustandswahrscheinlichkeit p (t), 0 miert ja darüber, daß 0 Zeitpunkt t noch im zustand o befindet. t z.B. Wahrscheinlichkeit, daß die Arbe tslosigkeit mindestens t Monate anhält. * - Die kumulierte Verteilungsfunktion der Ankunftszeiten F(t)=P gibt die Wahrscheinlichkeit an, Zeitpunkt t ein Ereignis eingetreten ist daß bis zum � z.B. Wahrscheinlichke t, daß nach spätestens t Monaten eine Beschäftigung aufgenonunen wird. (Abbildung 6b) . c) - F{t)•kumulierte Verteilung der Ankunftszeiten f(t)=Dichte dl von F(t) Physikalisches Beispiel Die Wahrscheinlichkeitsdichteverteilung der Ankunfts­ zeiten wir<l mit f{t) solute) bezeichnet, Sie Wahrscheinlichkeit Aufschluß, gibt über die (ab­ daß in einem bestimm­ ten Zeitintervall ein Ereignis eintritt (Abbildung 6c). Anhand eines einfachen physikalischen Systems kann man sich die Begriffe gut veranschaulichen. serbehälter (dessen Volumen gleich eins gesetzt wird) einem Abfluß und einem Ventil (Abbildung 6d). entspricht dann dem Abfluß dem zustand spricht G(t), Zustand 1, O, mit Der Behälter das Wasserbecken unter dem die Wassermenge in dem Behälter ent­ die abgeflossene Menge F(t) und die momentan 1l durch das Ventil fließende Menge entspricht f(t) . 1) ausgeht, daß der momentane Durchfluß f(t) Behälter proportional ist, dann erhält man sich leicht zeigen läßt - die Exponential­ der Hazardrate r als Proportionalitätskon­ diese Weise kann man eine Art "Galton-Brett" konstruieren. Das Bild mit wurde, ist einem Teil­ Nürnberg abgehaltenen Seminars zu verdanken. 0 Betrachten wir einen Was­ t f(t) rlt) z.B� Wahrscheinlichke�t, daß eine Beschäftigung im Ze�traum t ,t� gefunden 1 • wird. Dichte 1 ist eine monoton abnehmende Verteilung wie z�B. die Exponentialvertei­ l ung in Abschnitt 2.2.2. Dichte 2 ist eine nicht­ monotone eingipfelige Ver­ teilung. Abbildung 6: f(tJ entspricht hier dem momentanen und r{t) dem relativen momen­ tanen Durchfluß. Uberlebensfunktion und Verteilungen - 42 - - 43 - Zwischen den drei Funktionen bestehen einfache und eindeutige Wenn beispielsweise von 1000 Personen, die am 1.Januar ar­ Beziehungen. Die Wahrscheinlichkeit, daß eine Person bis t beitslos wurden, nach 30 Tagen immer noch 800 ohne Arbeit überlebt oder daß sich bis zum Zeitpunkt t etwas ereignet, sind (=Risikomenge), so könnte man als Schätzwert von G(30) muß ja eins sein. F(t) ist somit zu G(t) komplementär: den Wert 0,8 angeben. im Zeitintervall (2) F(t) 1-G(t) wenn weiterhin am nächsten Tag, also t+.ßt=31] 4 Personen eine Beschäftigung aufnehmen, so beträgt die absolute Wahrscheinlichkeit eines Ereignisses für dieses Intervall etwa 4/1000=0,004. Dies wäre Ferner sei hier wiederholt, was einführenden Statistik-Texten eine grobe Schätzung von f(30), dessen Wert ja auf einen Zeit­ zu entnehmen ist, daß die Dichteverteilung der ersten Ablei­ 1 tung der Verteilungsfunktion entspricht. Es gilt also: l der Übergangswahrscheinlichkeit q(30,31) und damit wegen lit=1 (3) f(t) 4/800, punkt und nicht auf ein Intervall bezogen ist. Als Schätzung ungefähre Schätzung der Rate r(30) erhielte man als Resultat unter Benützung von (4) wegen f(30) /G(30) = 0,004/0,8 dasselbe Ergebnis. Welche Beziehungen bestehen nun zwischen der Übergangsrate und den drei Funktionen G(t), F(t) und f (t)? Ohne Beweis seien hier einige Ergebnisse aufgeführt, deren Ableitung in l\l'.hang 2 nachvollzogen werden kann. Aus den Annah­ men des Modells folgt die zentrale Beziehung: (4) r(t) f(t) 1-F(t) 2.2.2. Das Modell mit zeitunabhängiger Rate Wir betrachten jetzt den Spezialfall einer im Zeitablauf kon­ stanten Rate r(t)=r. In diesem Fall, der sozusagen das Basis­ Modell darstellt, spricht man auch von einem einfachen Pois­ 1) son-Prozeß. Mit der Annahme der Zeitkonstanz der Rate kann man - wie in An­ Man kann sich den Ausdruck (4) wie folgt veranschaulichen. Die Übergangsrate entspricht der Häufigkeit von Zustands­ wechseln in einem sehr kleinen Zeitintervall dividiert durch alle "überlebenden", d.h. Kandidaten für einen Zustandswech­ sel (=Risikomenge). Bezogen auf das physikalische Beispiel hang .2 gezeigt - eine Gleichung formulieren, deren Lösung eine Beziehung zwischen der Überlebensfunktion und der Rate liefert: (5) G(t} handelt es sich um den relativen momentanen Durchfluß. 11 1) f(t) = l'im P (t<'T<t+Lit] llt Llt_,.O = F(t+tit)-F(t} l' m . i Llt Llt.+O Für kleine Zeiteinheiten entspricht (absoluten) Wahrscheinlichkeit, daß (t,t+fit) ein Ereignis eintritt. dF(t) � Die Bezeichnung rührt daher, daß bei einem Zählprozeß wie in Abbildung 2b mit konstanter Rate die Zustandsvariable "Y(t)=Anzahl von Ereignissen" einer Poisson-Verteilung mit Parameter A=r.t folgt, wobei die Zeitintervalle bis zum Eintreffen eines neuen Ereignisses gemäß Formel (7) ex­ ponentialverteilt sind. Siebe z.B. CHIANG 1968, Kap.III. - 44 - - 45 - Die Zahl e=2,718 ist hierbei die Basis des natürlichen Loga­ rithmus. nehmender Länge des Zeitintervalls.Für t=O ist G(t) =1, wie man r Berechnen wir jetzt noch den Mittelwert oder Erwartungswert erwarten darf: Alle Personen sind zum Startzeitpunkt des Pro­ der Ankunftszeit. zesses ja im zustand o. Auf der anderen Seite strebt G(t) mit wachsender Zeit gegen O (siehe Abbildung 6a). Kennt man G(t), Bei einer beobachteten Häufigkeitsverteilung der Variablen X mit den relativen Häufigkeiten f(x), berechnet so ergibt sich als Komplement sofort F(t): telwert bekanntlich nach folgender Formel: f (t) wir analog vor; t: (9) -rt re Rate eine monoton fallende Funktion (siehe auch Abbildung 6c) Für t=O ist f(t) maximal, nämlich r. Die Wahrscheinlich- keit eines Ereignisses ist zu Beginn des Prozesses am größ­ ten und sinkt dann exponentiell. 1) Die Gleichungen (4) (5), (6) und (7) folgen auch aus dem zentra­ (4) durch das Integral von f(t) man die Integralgleichung nach f(t) auf, und löst so erhält man die Dichte (7). Dies läßt sich einfach nachprüfen, indem man (7) (4) einsetzt: ft.f(t)dt E(T) Die Lösung des Integrals ist glücklicherweise eine einfache und bedeutsame Beziehung: . (10) E(T) ( 11) unter der Bedingung einer konstanten Rate. Ersetzt man F(t) in und (6) in statt der Summierung müssen wir jetzt jedoch über alle Werte von t integrieren: Auch die Dichtefunktion ist bei dem Modell mit konstanter len Theorem r 1 r oder: 1 E(T) Der Mittelwert von o, T, die mittlere Lebenserwartung im Zustand ist also einfach der reziproke Wert der Rate. Das klingt auch intuitiv einleuchtend: Je größer die Übergangsrate (ge­ wissermaßen der "Abfluß" aus dem zustand 0), desto geringer die mittlere Verweildauer im Zustand o. Beträgt z.B. die Uber­ gangsrate konstant 0,005, so können wir erwarten, daß eine Person im Mittel 1/0,005 = 200 l) wobei theoretischen Verteilung mit stetiger Zufallsvariable T gehen schließlich erhält man die Dichtefunktion f (t) durch Ableitung von F(t) nach sich der Mit­ M=rx.f(x), über sämtliche Beobachtungsklassen summier·t wird. Bei einer -rt (6) F(t) = 1-e (7) r (8) Die Uberlebenskurve fällt also exponentiell mit zu­ Dies erlaubt eine interessante Interpretation: Wenn man das Modell auf seltene Ereignisse wie Unfälle anwendet hier ist der einfache Poisson-Prozeß mitunter angemessen so ist die Wahrscheinlichkeit eines neuen Ereignisses am größten nach dem Eintreten des letzten Ereignisses. Es also zu erwarten daß zwei oder auch mehrere Unfälle aufeinander Tage arbeitslos sein wird, wenn die Zeit in Tagen gemessen wurde. Das Modell mit konstanter Rate hat eine große Bedeutung als Basis-Zufallsmodell. Im Vergleich mit komplizierteren Modeldienen. - 47 - - 46 - Die Gleichungen (5) bis (11) liefern ferner neue Interpreta­ (13) G(t) tionen der Ubergangsrate, insbesondere aber weisen sie auf Bindeglieder zwischen der Rate und den Beobachtungen hin. (14) F (t) R(t) 1-e- (15) r(t) .e Auch wenn die Rate selbst als nicht direkt beobachtbarer ma­ thematischer Grenzwert intuitiv weniger verständlich sein mag (obwohl wir uns auch an andere derartige Größen, wie z.B. f (t) die momentane Geschwindigkeit in der Mechanik, gewöhnt haben) so Man sieht, sind doch die beobachtbaren Konsequenzen anschaulich. (5) bis Und von daß aus (13), (7) daher erschließt sich auch die Rate indirekt einem genaueren daß die Chance der A ufnahme einer Beschäf­ tigung mit zunehmender Dauer der Arbeitslosigkeit geringer wird. (14) und (15) auch die Gleichungen denn es gilt ja bei konstanter Rate r: = Ir.de r.t Eine einfache Beziehung für die mittlere Verweildauer E(T) zeitabhängige Raten Es ist zu vermuten, folgen, t (16) R(t) Verständnis. 2.2.3. -R(t) Die tlbergangsrate dürfte nach 30 Tagen Arbeitslosigkeit höher sein als nach 300 Tagen. Eine Ratenfunktion r(t), bei läßt sich leider nicht allgemein, sondern nur bei wenigen 1) Spezialfällen ableiten. Man erkennt anhand der Gleichungen (13) bis (16), daß mit der Wahl der Übergangsrate auch F(t), G(t) und f(t) eindeutig bestimmt sind. Rate, Kennt man also die dann kennt man auch den vollständigen Prozeßverlauf. der die Übergangsrate als Funktion der Verweildauer spezifiziert wird, wie gesagt - bezeichnen wir als Entwicklungshypothese. Verschiedene Modelle, dargestellt wird, Die Gleichungen (5) bis um auch im Fall zeitabhängiger Raten gültige Aussagen zu er­ lauben. (7) müssen Dazu ist es erforderlich, jetzt mod�fiziert werden, die kumulierte Hazardfunk­ Wenn r(t) nicht konstant ist, keine Exponentialverteilung. erhält man gemäß (14) für F(t) In diesem Fall haben wir es mit Semi-Markov-Prozessen zu tun. tion zu definieren: t (12) R(t) bei denen r(t) als Funktion der Zeit werden wir in Kap.5 behandeln. Aus Gleichung (13) resultiert eine weitere Deutung der Rate. fr(T)dT Dazu logarithmieren wir zunächst beide Seiten von (13): R(t) ist also das Integral der Rate (Tist hierbei nur eine Hilfsvariable bei der Integration). Anschaulich gesprochen bewirkt R(t) die Aufsummierung oder Kumulierung der Rate über alle Zeitpunkte bis zum Zeitpunkt t. (17) 1) ln G(t) Es gilt ja: -R(t) E(T) = '11 Jt.f(t)dt 0 = ft.r(t)e-R(t)dt. Dieser 0 Ausdruck ist in den meisten Fällen leider nicht explizit Im Falle zeitabhängiger Raten erhält man G(tl folgende Weise: rt in Gleichung einfach auf (5) wird durch die kumu­ lierte Hazardfunktion R(t) ersetzt (siehe Anhang 2). gibt sich für G(t), F(t) und f(t): Somit er­ auflösbar. - 49 - - 48 - Unter Berücksichtigung von (12) liefert die Ableitung von (17): ( 18) 2. 2. 4. Bei den bisherigen Modellen wurde unterstellt, daß alle Un­ tersuchungseinheiten die gleiche Rate aufweisen. r(t) zeitabhängiger Raten muß man genauer sagen, Im Falle daß für alle Per­ sonen mit identischer Verweildauer gleiche Raten angenommen Die Rate entspricht also dem negativen Wert der ersten Ablei­ werden. tung des natürlichen Logarithmus der Uberlebensfunktion. die Berücksichtigung der Heterogenität der Untersuchungsein­ Die Definition der tibergangsrate und verschiedene Folgerun­ nicht alle Personen haben die gleiche Chance, gen hieraus bekommen etc. heiten. (zur Ableitung siehe Anhang2),die die Interpre­ tation der tibergangsrate erleichtern, sind nochmals übersicht­ Häufig erf.ordern wirklichkeitsnahe Modelle hingegen Nicht alle Personen haben die gleiche Unfallneigung, einen Job zu Zur Berücksichtigung von Heterogenität kann man im Prinzip zwei Wege beschreiten: lich in Tabelle 2 aufgeführt. - Der Heterogenität wird Rechnung getragen Tabelle 2: Definition der Übergangsrate und einige Beziehungen lierung einer Verteilungsannahme. Z.B. durch die Formu­ kann angenommen wer­ den, daß die Rate r in der Population gammaverteilt ist Die Übergangsrate r(t) charakterisiert die momentane Neigung einer Untersuchungseinheit zum Zustandswechsel. erbal: r(t) = lim At+O 1 (eine relativ allgemeine Verteilung) • l (Überblick bei CARR-HILL und PAYNE 1971). g(t,t+At) At - Die Heterogenität wird durch die Einführung von ten InterAt q(t,t+At) berücksichtigt. f(t} 1-F (t) z.B. die Schätzung der Übergangsrate bei Arbeitsunfällen f (t) G(t) Der Unterschied zwischen den Übergangs­ raten kann dann als kausaler Einfluß der unabhängigen Va­ riablen "Fabrik" gedeutet werden. elegantere Methode, heorem 2 dlnG(t) dt r(t) 3 r 1 = E(T) �ovaria­ Im einfachsten Fall entspräche dem die separate Schätzung der Rate bei verschiedenen Gruppen, r(t) .At in zwei Fabriken. r(t) Auf diesem Weg kommt man zu den klassischen Modellen der Unfallstatistik 'dR(t} � zu ermitteln. Es existiert jedoch eine um die Effekte unabhängiger Variablen Ähnlich wie eine Regressionsgleichung wird dabei eine parametrische Funktion formuliert, die die Rate 1) Die Gamma-Verteilung ist hier im Unterschied etwa zur Normalverteilung - deswegen sehr geeignet, weil sie für positive Zufallsvariablen definiert ist. Die Rate r ist ja stets positiv. zweitens enthält sie eine Reihe wich­ tiger Verteilungen wie die x 2-verteilung, die Exponen­ tial verteilung und die geometrische Verteilung als Spe­ zialfälle. Siehe zu diesen Modellen z.B. das. Lehrbuch von CHIANG 1968, Kap.III. - - 0 5 - 51 - in Abhängigkeit von dichotomen oder auch metrischen unab­ hängigen Variablen darstellt. 11981) und TUMA (1979) beschritten. Eine derartige Raten­ Funktion mit unabhängigen Variablen bezeichnen wir - wie gesagt - als :..:o::.:::.::c:;:.;::=uc.::..;;;;;.;;.;;;="'Um den Einfluß 2.3. Mehr-Zustands-Modelle Dieser Weg wurde von COLEMAN Zur Analyse von Mehr-Zustands-Modellen können die bisher ent­ wickelten Konzepte generalisiert werden. von unabhängigen Variablen auf die Rate gra­ Personen, die sich im zustand O befinden phisch zu veranschaulichen, vereinbaren wir eine Symbolik, zwei Risiken ausgesetzt: die aus Abbildung 7 hervorgeht. oder in den Zustand 2. zweiten Fall r02, bzw. Abbildung 7: Greifen wir dazu er­ neut das Drogenbeispiel aus Abbildung 2d auf. Zwei-Zustands-Modell mit Kovariaten (keine Drogen), sind Sie können in den Zustand 1 wechseln und im Die Rate ist im ersten Fall r0 1 bei zeitabhängigen Raten r01(t) und r0 (t). Das Risiko, daß überhaupt ein Ereignis - gleich wel­ 2 cher Art - auftritt, wird als Hazardrate oder Hazardfunktion bezeichnet. j charakterisiert das Die Hazardrate im Zustand momentane Risiko, daß eine Untersuchungseinheit den Zustand verlassen wird. Die formale Definition lautet: n (19) Hazardrate für Zustand j =*' Übergang 0 D Erwartetes Vorzeichen des Effekts auf die Rate Ausprägung der Zustandsvariablen Unabhängige Variable (z.B. X =Geschlecht mit Codie­ 1 X2 =Qualifikationsni­ rung O=männlich, 1=weiblich, veau, x =Berufserfahrung) . 3 Gemäß der Graphik werden die Hypothesen aufgestellt, daß Frauen eine geringere Chance haben, eine Beschäftigung zu finden, kh zwischen den Zuständen ("Abfluß") Effekte von unabhängigen Variablen (Kovariate) auf die Rate +/- k=1 und daß sowohl das Ausmaß der Qualifikation als auch der Grad der Berufserfahrung die Rate positiv beeinflussen. Die Hazardrate für Zu­ j entspricht also der Summe der Raten aller von j aus erreichbaren Zustände. Für das Drogenbeispiel ist r0(t)= r0 t)+r0 (t) 2 1( . 1) Wahrscheinlichkeit �j(t,t+&t), daß im zu­ Zeitin�ervall [t,t+Lltj irgendein Ereignis auftritt, ist die Sunune der Übergangswahrscheinlichkeiten bezüglich aller vom Zustand j erreichbaren Zielzustände k. Die Hazardrate ist der Limes dieser bedingten Wahrscheinlich­ keiten dividiert durch Llt für lit+O und somit die Sunune der Übergangsraten gemäß Ausdruck (19): ob die Hypothesen zutreffen und wie stark die Effekte sind, muß die empirische Analyse zeigen. r k . (tj J Hierbei ist n die Anzahl der Zustände. stand 1) r · (t) =lim J Llt+O q' (t,t+lit) Llt n = lim Llt+O r k=1 k #j q ' (t,t+&t) k i';t - - 53 - 52 - Als Generalisierung von (12) definieren wir ferner die kumu­ Man könnte nun leicht auf die Idee kommen, lierte Hazardfunktion im der beobachteten mittleren Ankunftszeit Zustand j: die Rate anhand zu schätzen. Ange­ nommen es liegen Daten über 6 Personen für einen Beobachtungs­ t (20) R (t) = j f zeitraum von zehn Monaten vor, r (T)dT j Die Überlebensfunktion G(t) und die Verteilung F(t) und �(t) sind bei Mehr-Zustands-Modellen auf den jeweiligen zustand j zu beziehen. G.(t), F.(t) und f .(t) erhält man als Generali- J J J sierungen von (13), (14) und (15), wobei R(t) durch R (t) gej mäß (20),und r(t) durch r.(t) gemäß (19) zu ersetzen ist. J Die Raten und die Effekte der Kovariate auf die Raten können bei Mehr-Zustands-Modellen anhand von Ereignisdaten geschätzt werden. wobei die Zeit bis zur Aufnahme einer Beschäftigung ermittelt wurde (z.B. Im zweiten Schritt können mit mathematischen Hilfs­ mitteln die Zustandswahrscheinlichkeiten - im Beispiel p (t), 0 p (t) und p (t) - abgeleitet werden. Von großem Interesse bei 2 1 der dynamischen Analyse von Modellen sind auch eventuell exi­ stierende Gleichgewichtszustände (dazu Kap.5) sowie die Effekte spektive Befragung). ten noch arbeitslos, für die übrigen Personen endete die Ar­ beitslosigkeit nach 2,, 4, 6 und 8 1/5=0,2 (wobei T=5 Monaten. Wäre dann r=1 dem beobachteten Mittelwert der Ankunfts­ zeiten entspricht) eine gute Schätzung der Rate? Hier ist Vorsicht geboten, da berücksichtigt wurden. Monaten arbeitslos Für waren, ja die zensierten Fälle nicht zwei Personen, die auch nach zehn ist die Ankunftszeit ja unbekannt. Möglicherweise tritt ein Ereignis erst nach ten oder gar nicht auf. 13 oder 17 Mona­ Die skizzierte Vorgehensweise liefert nur dann einen guten, d.h. möglichst unverzerrten und effi­ zienten Schätzwert der Rate, wenn keine liegen. der Kovariate auf das Niveau des Gleichgewichts. durch eine retro­ Zwei Personen waren auch nach zehn Mona­ zensierten Daten vor­ Typ ischerweise ist man jedoch bei soziologischen An­ wendungen nahezu immer mit dem Problem zensierter Daten kon­ Allerdings kann die mathematische Analyse der Dynamik von frontiert, wenn man die Ankunftszeiten erhebt. Prozessen bei Mehr-Zustands-Modellen mit zeitabhängigen Ra­ ten und reversiblen Ereignissen recht kompliziert werden. 1) Wir werden emige Beispiele nach in Kap. 5 behandeln und lassen es hier mit der knappen Skizzierung bewenden. Auch die Behandlung der zensierten Fälle als nicht-zensierte Beobachtungen stellt keine Lösung dar. teten Ankunftszeiten aus den Werten 2,4,6,8 und 10,10 zu be­ rechnen. Der hieraus resultierende Schätzwert der Rate von 2.4. Gemäß Ausdruck Man könnte leicht auf die Idee kommen, einen korrigierten Mittelwert der beobach­ 0,15 ist jedoch ebenfalls noch eine Überschätzung der Rate (11) ist die Übergangsrate (beim Modell mit (HANNAN und TUMA 1979). konstanter Rate) der reziproke Wert der mittleren Ankunfts­ Mit der Maximum-Likelihood-Schätzmethode (ML-Methode) zeit. ist es nun möglich, auch dann gute Schätzungen der Raten zu erzie­ 11 len (und damit von f(t), F(t), G(t) und E(T)), wenn der Untersuchungen von wichtigen z.B. bei COLEM.�N 1981, CARROLL und GROENEVELD 1979. finden sich TUMA, HANNAN Datensatz Zensierungen enthält. - 54 - - 55 - Die ML-Methode arbeitet dabei nach folgendem Prinzip. Zu­ nächst entscheiden wir uns für ein Modell, d.h. wir wählen Allgemein ist die Likelihood achteten Ankunftszeiten bei N1 nicht-zensierten beob� das Produkt einen bestimmten Zustandsraum und die entsprechenden Raten­ funktionen. Wir gehen dabei wieder vom zwei-Zustands-Modell mit absorbierendem Zielzustand aus. Sodann stellen wir eine Funktion auf, nämlich die Likelihood-Funktion, Auskunft gibt, welche Plausibilität die darüber (Likelihood) unsere Be­ obachtungen (die Stichprobe von Ereignisdaten) bei bestimm­ ten "wahren" Werten der Rate Grundgesamtheit haben. l) Werte für (der Modell-Parameter) in der Wie plausibel ist es, z.B. die sechs die Dauer der Arbeitslosigkeit des obigen Beispiels z u erzielen, wenn der wahre Wert der Rate 0,1 oder 0,2 oder 0,3 beträgt? Natürlich kennen wir den wahren Wert der Rate nicht, aber wir wählen denjenigen als besten Schätzwert, bei dem die Plausibilität unserer Beobachtung maximal ist. Diese Entscheidungsregel ist das Maximum-Likelihood-Prinzip. Die Likelihood, eine Verweildauer von 6 Monaten zu beobachten, ergibt sich aus der Dichtefunktion f(t). Bei der einen Beob­ Nun verfügen wir aber auch noch über die zensierten Beobach­ tungen, die wir nicht vernachlässigen dürfen. los. Aus der Überlebensfunktion wissen wir, daß f(6) kein bestimmter Wert, sondern die Likelihood-Funktion (21) bei unabhängigen Beobachtungen wie folgt erweitert werden: (23) L=f(2).f(4) f (6) .f(8) .G(10).G (10) . Oder allgemein bei N obachtungen: N (24) L= eine Funktion von Parametern ist. Im Falle zeitunabhängiger Raten z.B. müßten wir demnach genauer f(6,r) schreiben. Um die Notation nicht zu kompliziert zu gestalten, verzichten wir jedoch auf die explizite Erwähnung der Parameter. Bei den vier unabhängig voneinander erhobenen, nicht-zensierten Be­ obachtungen erhalten wir als Likelihood das Produkt: TI 1 i=1 Gleichung f(t.). 1 (24) nicht-zensierten und N 1 N 2 TI i=1 Kap.8). zensierten Be­ kann man etwas eleganter schreiben, wenn die Indikator-Variable d eingeführt wird, wobei d�1 angibt, eine nicht-zensierte Beobachtung vorliegt, sierte Beobachtung indiziert. daß und d=O eine zen­ Die Anzahl aller Beobachtungen bezeichnen wir mit N. (25) L Bei Wahrscheinlichkeitsverteilungen mit diskreten Zufalls­ variablen ist die Likelihood identisch mit der .!'.!'.<JLQ.1::§.'�El_!:� der Beobachtungen bei gegebenen nicht mehr Zufallsvariablen handelt es sich von "Plausi­ um eine Wahrscheinlichkeit. Wir sprechen bilität". Eine ausführliche Beschreibung der Maximum-Likeli­ hood-Methode findet sich in dem Lehrbuch von NELSON (1982, 2 G{t ) i (21) L = f(2).f(4).f(6).f{8) 1l daß die Wahr­ scheinlichkeit hierfür G(10) ist. Mit zensierten Daten kann achtung ist die Likelihood-Funktion genau f ( 6l. Dabei müssen wir im Auge behalten, Bei dem Bei­ spiel waren zwei Personen nach 10 Monaten immer noch arbeits­ [DatenJ f(t) und G(t) - ]- Parameter sind N II i=l d. [f(ti l ] �[G(ti)] wir wir wissen (1-d.) ;i. Funktionen der Raten, also der Modell-Parameter, deren Werte wir schätzen wollen. Das haben wir in (25) symbolisch durch den Zusatz in eckiger Klammer zum Ausdruck gebracht, der als "Likelihood der Daten in Abhängigkeit der Werte der Parameter" z u lesen ist. - 56 - - 57 - Bei dem Modell mit konstanter Rate r folgt unter Verwendung von (5) und (7) aus (25): - Die Schätzwerte sind maximal effizient, der Schätzwerte d.h. (sozusagen die Fehlerbreite) die Varianz ist geringer als bei anderen Verfahren. <25> L N IT i=1 [Daten ! - Aus der Maximum-Likelihood-Theorie folgen verfahren Prüfung der Parameter auf statistische Signifikanz. Das Maximum von L in Bezug auf r bei den gegebenen Daten t ,d i i liefert gemäß dem ML-Prinzip den Schätzwert r. den Wert von r, der L Wir suchen ja "maximal macht". Bei dem Modell mit konstanter Rate erhalten wir als Endresul­ tat obiger Überlegungen eine einfache Formel für die Schät­ zung der Raten 3). (siehe dazu Kapitel 5 und zur Ableitung Anhang Bei komplizierten Ratenfunktionen mit Kovariaten und Zeitabhängigkeit benötigt man zur Schätzung der Parameter allerdings Computerprogramme. Der Anwender ist dabei mit den komplizierten numerischen Be­ rechnungen in keiner Weise belastet. Allerdings erscheint es uns hilfreich zu sein, wenn ein Verständnis des Prinzips der Methode erlangt wird. Die Likelihood-Funktion (25) gilt für Zwei-Zustands-Modelle mit irreversiblen Ereignissen. Die allgemeine Funktion für Mehr-Zustands-Modelle und reversible in TUMA VELD Ereignisse findet sich 1979 sowie in dem Aufsatz von TUMA, HANNAN und GROENE­ (1 979). Insbesondere bei größeren Stichproben bietet die ML-Methode eine Reihe von Vorteilen: Zensierte Daten werden berücksichtigt. Damit wird ein star­ ker Bias der geschätzten Parameter vermieden und der Infor­ mationsgehalt der Daten wird in vollem Umfang ausgeschöpft. sind inferenzstatistische zur Somit Tests der Parameter möglich. - 58 - - 59 3. Nicht-parametrische Verfahren rigkeiten, da in der Regel einige der beobachteten Zeiten nicht exakt, 3.1. sondern zensiert sind, lediglich bekannt ist, größer ist als die beobachtete Jede statistische Datenauswertung beginnt zweckmäßigerweise zwar die Möglichkeit, mit einer explorativen Phase, oberste und zwar unabhängig davon, die Daten aus einem geplanten Experiment stammen, sich bei der Auswertung um eine Sekundäranalyse, waltungsstatistiken, handelt. mente wie Linearauszählungen, oder ob es etwa von Ver­ Die einfachsten dieser Instru­ Kreuztabellen, Korrelations- und Assoziationsmaße, graphische Darstellungen usw. sind allgemein bekannt und in gebräuchlichen Statistik-Softwarepaketen SPSS oder BMDP enthalten. ob wie (rechtsoffene) sierten Zeit beginnt, von diesen Fällen also daß die tatsächliche Ankunftszeit (zensierte) Zeit. daß das Zeitintervall bei der kleinsten zen­ so daß alle größeren exakten wie zen­ sierten Beobachtungen in diese Kategorie fallen. gleichsweise kurzen Hier besteht die Zeitskala so zu gruppieren, Bei ver­ zensierten Zeiten werden sich dann aller­ dings die meisten Beobachtungen in dieser Kategorie konzen­ trieren, und die Ankunftszeitverteilung wird wenig aussage­ kräftig sein. Zu Weiterentwicklungen auf diesem Gebiet sei insbesondere auf TUKEY (1977) verwiesen. Die folgenden beiden Abschnitte befassen sich mit nicht-para­ metrischen Schätzverfahren für gruppierte Zeitbereichs-Daten Die Zielsetzung dieser explorativen Techniken besteht darin, die in den Daten enthaltene Information unter möglichst all­ gemeinen Modellannahmen annahme) (im Idealfall sogar ohne jede Modell­ zu komprimieren und diese komprimierte Information in numerischer und/oder graphischer Form darzustellen. Die bzw. Individualdaten mit exakter Ankunftszeit ten, vgl. Abschnitt (ab Level 8.0) 1.3.2) und BMDP. (Zeitpunkt-Da­ und deren Realisierung in SPSS Diese Verfahren liefern insbesondere bei graphischer Unterstützung ein recht gutes Bild des unter­ suchten Prozesses. Teil schon hier, Graphische Auswertungstechniken werden zum zum Teil auch in Kapitel 5 beschrieben. Im Forderung nach einer weitgehenden Unabhängigkeit von Modell­ letzten Abschnitt des vorliegenden Kapitels befassen wir uns annahmen schließt Verteilungsannahmen und damit parametrische mit Testverfahren zum Vergleich der Überlebensfunktionen in Verfahren praktisch aus und legt die Anwendung nicht-parame­ verschiedenen Gruppen. trischer Verfahren nahe. Der Anwendungsbereich nicht-parame­ trischer Verfahren ist allerdings nicht auf die explorative Die Unterscheidung zwischen gruppierten Analyse beschränkt. und Individualdaten mit exakter Zeitangabe bezieht sich dabei Wir werden solche Verfahren etwa beim Zeitbereichs-Daten Test auf die Gleichheit von Überlebensfunktionen durchaus auf die bei der Auswertung verwendete Datenstruktur, auch im Rahmen der konfirmatorischen Statistik anwenden. nicht notwendigerweise auf die Struktur der Originaldaten. Bei gruppierten Zeitbereichs-Daten ist die Untersuchungsein­ Die zentrale abhängige Variable - die Ankunftszeit oder Ver­ heit eine Gruppe von Individuen weildauer - ist eine eindimensionale Zufallsvariable. Ankunftszeit in ein bestimmtes Zeitintervall fällt. Die also {Personen, Ehen usw.), deren Bei in­ Verwendung von vertrauten deskriptiven Konzepten wie Linear­ dividuenbezogenen Zeitpunkt-Daten dagegen auszählung chungseinheiten die Individuen selbst und die Ankunftszeiten {nach fest gewählten Zeitintervallen) gramm liegt also nahe. und Histo­ Dabei stößt man aber bald auf Schwie- müssen exakt bekannt sein. sind die Untersu­ Obwohl bei letzteren Daten der In­ formationsgehalt offensichtlich größer ist, kann es durchaus - 60 - zweckmäßig sein, vorzugehen, sie vor der Auswertung die Ankunftszeit nicht exakt scheidungen z.B. piert werden. n ur Ehe, Zeitangabe, wird man für in Jahren) also als den wert bei denen (2) angegeben ist, die Anzahl der Kohortenmitglieder, welche im betreffenden Intervall sterben. können grup­ Individual-Daten mit Zeitpunkt-Daten, welche den Beginn des und ausgewertet Diese werte werden in der Regel auf einen standardisierten ursprünglichen Kohortenumfang (z.B. 1000 Personen) bezogen. jedes Jahresintervall einen charakte­ (für eine Ehescheidung im dritten Ehe­ also nach mehr als zwei, z.B. Individual-Daten, die Anzahl der Kohortenmitglieder, betreffenden Intervalls erleben, (bei der Untersuchung von Ehe­ Sollen sie hingegen als ristischen Zeitpunkt jahr, (1) Zeitbereichs-Da­ Grenzfälle wird man ebenfalls nach dem Gesichts­ punkt der Zweckmäßigkeit zuordnen. werden, zu gruppieren und so als würde es sich um gruppierte ten handeln. "exakter" - 61 - 2,5) aber weniger als drei Jahren Zensierungsprobleme gibt es bei dieser idealen Kohorte nur insofern, als bei der Erstellung der Sterbetafel einige Ko­ hortenmitglieder noch am Leben sein können. wählen. chenden zensierten 3.2. gruppierten Da die entspre­ Zeiten aber gleichzeitig die längsten be­ obachteten Zeiten sind, fällt dieser Umstand kaum ins Gewicht. Bei einer realen Kohorte ist die Situation anders: Hier hat man es in der Regel mit unvollständigen Beobachtun­ 3.2.1. Berechnung der Werte einer Sterbetafel gen zu tun, beispielsweise dadurch, daß ein ige Fälle durch Die in der englischsprachigen Literatur gebräuchlichen Namen Emigration verlorengehen. Werden - was normalerweise der Fall für diese Methode "Life-Table-Estimator" ist - Sterbetafeln nicht aus Verlaufsdaten, Method" weisen darauf hin, and "Actuarical daß die hier dargestellten sta­ sondern aus re­ gelmäßig wiederholten Querschnittserhebungen oder der Zusam­ tistischen Techniken aus der Bevölkerungsstatistik stammen menführung von Geburts- und Sterbestatistiken erstellt, und der Auswertung von "Life Tables" kann es weitere Verzerrungen durch zusätzlich hinzukommende (Sterbetafeln) dienen. Eine Sterbetafel ist eine Datenstruktur für Beobachtungen, welche nach ihrer Lebenszeit gruppiert sind. ches Beispiel mag das Altern einer dienen, Als anschauli­ "idealen Geburtenkohorte" in der es weder Emigration noch Inunigration gibt. Bei einer einfachen nicht-parametrischen Da,rstellung dieses Alterungsprozesses wird man die Z eit in feste Intervalle ein­ teilen, welche nicht notwendigerweise gleich lang sein müs­ Fälle, etwa durch Immigration, geben. dann Beim Altern von Ge­ burtskohorten mögen die dadurch entstehenden Ungenauigkei­ ten noch in einem vertretbaren Bereich liegen, bei der Un­ tersuchung von Ehescheidungen in einer Heiratskohorte können diese Fehler mit zunehmender Ehedauer aber beträchtlichen Umfang annehmen (konkurrierendes Risiko: Eheauflösuno durch Tod eines Partners). sen. Um etwa ein genaueres Bild von der Säuglingssterblich­ keit zu erhalten, wird man zweckmäßigerweise die ersten ein, zwei Jahre in Tages-, Wochen- oder Monatsabschnitte einteilen, später werden Jahresabschnitte oder noch längere Intervalle genügen. In der Sterbetafel werden dann für jedes Intervall ausgewiesen : In vollständiger Form wird eine Sterbetafel also für jedes Zeitintervall neben den oben genannten Daten auch die Anzahl der Kohortenmitglieder, siert werden, welche i m betreffenden Intervall zen­ enthalten müssen. Dabei ist es durchaus mög- - 62 - lieh, daß die ursprünglichen - 63 - Individualdaten exakte Zeitan­ gaben beinhalten. Für die Life-Table-Methode wird auf die Information über den exakten Zeitpunkt zugunsten einer unten beschriebenen nützt wird lediglich die vall das betreffende findet. Information, Ereignis verzichtet {und zwar Verteilungsannahme). Be­ in welchem Zeitinter­ (Tod oder Zensierung) Zeitachse i 2 Intervall Nr. statt­ Das Ergebnis wird demnach auch noch von der gewähl­ ten Einteilung in immer feinerer Zeitintervalle abhängen. Der Grenzfall bei Zeiteinteilung - die Product-Limit- oder Kaplan-Meier-Methode - benützt dann wieder die vollständige Information über die Ankunftszeiten. schnitt 3.3. Dieser Methode ist Ab­ Die Verwendung eckiger bzw. das "untere Ende" das "obere Ende" des a i b ;a i+1 i runder Klammern drückt aus, jedoch zum nächsten Intervall Nr.i+1 (um Zuordnungsprobleme für den Fall, daß beobachtete Zeiten gewidmet. gerade auf Intervallgrenzen liegen, Neben den Rohdaten (dem Input-Teil) enthält eine Sterbetafel auch nicht-beobachtbare,geschätzte Informationen mittlere restliche Lebenszeit usw. etwa ELANDT-JOHNSON und JOHNSON 1980) Hazard­ Von mehreren Schätz­ verfahren für diese Funktionen und Verteilungen (siehe dazu werden wir uns hier nur mit dem in BMDP und SPSS 8 realisierten Schätzer befas­ sen. Er stützt sich auf die im Falle gruppierter Daten plau­ sible (allerdings nicht überprüfbare) Annahme, daß in jedem Zeitintervall die zensierten Beobachtungen qleichverteilt sind.Diese Annahme ist um so unproblematischer, valle sind. Ein zensierter Fall, je kürzer die z.B. zu vermeiden). Die wei­ teren Bezeichnungen lauten: zur Über­ lebensfunktion, Dichte der Sterbezeitenverteilung, rate, daß Intervalls Nr.i zu diesem gehört, Inter­ n. 1. C, 1. Anzahl von Individuen, welche den Zeitpunkt a. Anzahl von Individuen, welche im 1. Zeitintervall [a i,bi) Anzahl von Individuen, welche im Zeitintervall [ai,bi) zensiert werden, d. J_ erleben, sterben. Da wir davon ausgehen können, daß jedes Individuum aus einer konkreten Stichprobe entweder während des Beobachtungszeit­ raums "stirbt" oder zensiert wird, gilt für n ' i und d c i i folgende Beziehung: ein unbekannt verzo­ gener Arbeitsloser einer Arbeitslosenkohorte im Zeitinter­ vall 60 bi s 65 Tage nach Beginn der Arbeitslosigkeit, ja irgendwann in diesem gehen. kann J: jU (c .+d.) J J Zeitintervall der Studie verloren Man nimmt bei Gleichverteilung also an, daß die zen­ sierten Fälle im Durchschnitt bis zur Mitte des Intervalls in. der Risikomenge (27) (dazu weiter unten) enthalten sind. Für die Rohdaten verwenden wir die folgende Notation: n , die zahl der Lebenden zum Zeitpunkt , entspricht also i der Summe aller Fälle, die nach dem Zeitpunkt (jG:i) "sterben" oder zensiert werden. - 64 - 65 - - Zu den durch die gewählten Zeitintervalle festgelegten Zeit­ punkten a men: 1 läßt sich die Uberlebensfunktion rekursiv bestim- Die Wahrscheinlichkeit ("conditional proportion of surviving") 1, den Beginn des (i+1)-ten Intervalls zu erleben ist gleich der Wahrscheinlichkeit den Beginn des vorhergehenden (i-ten) Zeitintervalls zu §:E:: Überlebensfunktion, kumulierte Überlebenswahrscheinlichkeit leben mal der bedingten Wahrscheinlichkeit p , dieses Inter­ i vall zu überleben. Das Schätzproblem wird damit reduziert auf ("cumulative proportion of surviving") das Problem, Schätzwerte p für die bedingten Uberlebenswahr­ i scheinlichkeiten ("conditional proportion of surviving") zu (31) finden bzw. - komplementär dazu - für die bedingten Sterbe­ wahrscheinlichkeiten q ("conditional proportion of dying"). i Ein naheliegender Schätzwert für q ist die Anzahl der Sterbe­ i fälle im Zeitintervall Nr.i, dividiert durch die Anzahl von Individuen , welche in diesem Intervall dem Sterberisiko aus­ gesetzt sind. Beim Vorliegen von zensierten Beobachtungen ist der Umfang dieser Risikomenge allerdings nicht gleich n . i Gemäß der Annahme, daß zensierte Fälle im Durchschnitt nur die halbe Zeit über dem Risiko ausgesetzt sind, die Hälfte der zensierten Fälle abzuziehen. ist von n i Wir erhalten so­ mit die folgenden Formeln für unsere Schätzwerte (das Zeichen hin, über den entsprechenden Ausdrücken weist darauf ist die geschätzte Wahrscheinlichkeit, den Beginn des In­ i tervalls Nr.i zu erleben. Aus der Identität G (32) wobei t (a +b )/2 der Mittelpunkt des Intervalls Nr.i ist, mi i i läßt sich für die Dichtefunktion der folgende Schätzer her­ leiten: (33) daß es sich um Schätzwerte handelt): (Risikomenge, "number exposed to risk") (28) n! l Bedingte Sterbewahrscheinlichkeit ("conditional proportion of Hazardfunktion. Diese für die Interpretation des untersuch­ ten Prozesses zentrale Funktion läßt sich - wieder für den Intervallmittelpunkt aus der Identität r(t)=f(t)/G(t) )/2 (unter Berücksichtigung und der Näherung G(t i) (G +G i 1+1 m von (31) und (33) herleiten�) (34) dying") 1l Um Mißverständnisse zu vermeiden, sei darauf für das daß r1 die Hazardrate oder auf das Intervall, i bezeichnet. Der Index i nicht auf den Zustand. Gemäß unserer Vereinbarung in Kap.2 sind die zustände nicht indiziert, da die einfache Sterbeeinem Zwei-Zustands-Modell mit absorbierendem Zieltafel entspricht. - 66 - - 67 Auch Formel zur Schätzung der Hazardrate Standardfehler von G , f , t . Zu diesen Schätzwerten werden i i i in SPSS und BMDP Standardfehler berechnet. Der Vollständig­ bestimmten Bedingungen ein ML-Schätzer. keit halber geben wir hier die entsprechenden Formeln ohne nahme einer stufenförmigen Hazardfunktion mit konstantem Wert A bleitung an: im Intervall r i Schätzer ableiten A - (36) (37) Var var (fi) O\l Gi 2 A � � 2 r. J. 2 i-1 l: j =1 { _s_ n z j= 1 n + � ·P. ) J 1- n sierten Zeiten im Intervall Zeitpunkte etwa im Falle :i_ .qi und JOHNSON und j_qi 1975 ("Green­ oder ELANDT-JOHNSON Als Warnung sei vermerkt, daß dadurch die tatsächliche Varianz beträchtlich unterschätzt werden kann, wenn der Anteil zensierter Beobachtungen groß ist. sich daher, Sind diese genauen Daten nicht bekannt, ersetzt (oder, äquivalent, gleichverteilten Zeiten t vall I ij i daß alle Zeiten auf den Intervallmittelpunkt fallen),dann gilt: 2) siehe GROSS und CLARK 1980). erstreckt. wird dieses Informationsdefizit durch die Annahme von im Inter­ Diese Formeln gelten allerdings nur näherungsweise wood-Formel", der folgende ML[a ,b ) lä!t sich f�r r i i i 1980). (KALBFLEISCH und PRENTICE wobei sich die Summation im Nenner über alle exakten und zen- i-1 n ist unter Unter der Modellan­ {38) ·Pj j {34) bei der Auswertung das ''Zeitpattern" Es empfiehlt (39) und damit: (40) von zensier­ ten und exakten Beobachtungen im Auge zu behalten. In BMDP wird diese Vorgangsweise graphisch unterstützt. Die hier angegebenen, in BMDP und SPSS realisierten Schätzer, mögen recht heuristisch erscheinen. Tatsächlich lassen sie sich unter allgemeinen Voraussetzungen als Maximum-Likeli­ hood-Schätzer (ML-Schätzer} herleiten und damit wahrschein­ lichkeitstheoretisch rechtfertigen. die exakten Beobachtungen Unter der Annahme, (also die Sterbefälle) daß in jedem Zeitintervall exponentialverteilt und die zensierten Beob­ achtungen (wie oben angenommen) ben sich und und JOHNSON 1980). gleichverteilt sind, erge- als ML-Schätzer (siehe ELANDT-JOHNSON was gerade wieder der oben a ngegebene Life-Table-Schätzer ist. Für die Uberlebensfunktion und die Dichte der Ankunftszeiten­ verteilung ergeben sich hier aber andere Ausdrücke KALBFLEISCH und PRENTICE 1980). (siehe - 69 - 68 - Ein einfaches Berechnungsbeispiel mag die Vorgangsweise ver­ anschaulichen. Wir gehen von folgenden beobachteten Zeiten {in Tagen) aus, wobei ein "+" hinter einer Zahl andeutet, daß die entsprechende Beobachtung zensiert ist: 19, 21,21+,24. 3,4,7+,10,13+,14, Bei einer Gruppierung in Wochen enthält die folgende Tabelle Zwischen- und Endergebnisse der Berechnung nach der Life Table-Methode: d. n. 1 1 [o, 7) [7' 14) 2 10 8 [14,21) 5 2 3 2 Tabelle 3: n'. c. ]. l 0 10 2 7 0 5 2,5 Gi i 0,80 1,00 0,029 0,86 0,80 i\ 0,20 0, 14 0,40 0,60 0,80 0,20 (28) bis (34) geschätzten Varianzen mit den Formeln 0,69 0,41 0,016 0,035 0,047 0,032 0,022 0,071 o, 190 ten und zensierten Beobachtungen dient. Zeit sowie eine In BMDP ist die Un­ ( "withdrawn", etwa durch etwa durch in der Versuchsplanung nicht vorgesehe­ nes Ausscheiden einzelner Individuen vor dem Ende der Unter­ suchungsperiode) möglich, aber ohne Einfluß auf die Schätz­ werte. :::::'.'.:E:::'!:!:S�:'.2��.::._��s_���:2.'.:l.:..:��L...��I.11��� Angabe von Beginndatum und Enddatum, nachzurechnen und die (35), (36) und (37) zu Wie im Falle der Monat, Jahr) und Scheidungsdatum z.B. Beiratsdatum (Tag, Monat, (Tag, Jahr). Mit diesen Daten werden die oben angeführten Schätzwerte und deren approximative Standardfehler berechnet, außerdem der (interpolierte) Median der Lebenszeit, bei BMDP zusätzlich das erste und dritte Quartil sowie die dazugehörenden Stan­ Programmbeispiele mit SPSS und BMDP dardfehler. Der oben beschriebene Life-Table-Schätzer ist sowohl in BMDP (DIXON et al.1981) als auch in SPSS 8 in NIE und HULL (Programmbeschreibung 1978 sowie BEUTEL, KUEFFNER und SCHUBOE 1983) wobei in beiden Fällen drei verschiedene Rohdaten­ strukturen verarbeitet werden können: Life Table: zu jedem Individual­ bzw. zensierte Ankunftszeiten, aber statt der Angabe der Dauer erfolgt die ermitteln. verfügbar, (survival time as input): statusvariable angegeben, welche der Unterscheidung von exak­ ("lost", Dem Leser sei empfohlen, zur Übung einmal die Werte in der 3.2.2. Ankunftszeiten fall werden die Ankunftszeit das Ende der Untersuchungsperiode) und ungeplanter zensierung Beispiel einer Sterbetafel Tabelle mit den Formeln SPSS ist die.se Datenstruktur praktisch identisch mit einer ge­ wichteten Version der Ankunftszeiten -Datenstruktur. terscheidung zwischen geplanter gi - Zu einer gewählten BMDP beliebig, Zeitintervalleinteilung {in in SPSS mit Einschränkung beliebig - vorzugs- weise konstante Intervallängen) werden die c und angegeben i (bei BMDP optional auch n , was an sich überflüssig ist). In i Für die explorative Phase von großer Wichtigkeit sind die verfügbaren Plot-Optionen für die graphische Dar­ stellung. Überlebensfunktion und deren Logarithmus, Hazard­ rate und Dichte der Lebenszeiten sind in beiden Programm­ paketen verfügbar. Die in BMDP zusätzlich enthaltene kumula­ tive Hazardfunktion ist bis auf das Vorzeichen mit der loga­ rithrnierten Überlebensfunktion identisch in Kap.2). Wie bereits erwähnt, werden in (siehe Formel (17) BMDP auch die zeit­ lichen Muster von exakten und zensierten Beobachtungen aus­ gedruckt und können so als Indikator für die Zuverlässigkeit der geschätzten Werte dienen. - - 70 - 71 - Als konkretes Beispiel soll die Auswertung von Ladendieb­ Diskutieren wir zunächst das Rechenbeispiel mit dem BMDP-Programm. stahlsdaten dienen. Die Zeitintervalle entsprechen hier Die gewählte Methode geht aus dem Programmaufruf P1L (vollendeten) Altersjahren beim ersten Ladendiebstahl bzw. Zum Zeitpunkt der Befragung, wenn kein Diebstahl begangen wurde (zensiertes Datum). Jede (logische) Lochkarte des Da­ teninputs enthält bei BMDP die Information über ein solches Alters- Zeitintervall: Beginnzeitpunkt (der Endzeitpunkt IS LIFE hervor. Für jedes Zeitintervall werden die Werte der drei Variablen AGE,DEAD und WD wobei AGE dem In­ tervallbeginn, DEAD der Anzahl der Gestorbenen welche in diesem Alter begehen), WD der Anzahl der und d . Die zusätzliche Angabe der ist mög­ i i lich, hier aber redundant. Bei SPSS sind für jedes Intervall noch keinen Ladendiebstahl begangen haben und bis zu zwei Lochkarten anzugeben. exakte Beobachtungen gibt, Sofern es im Intervall eine Lochkarte mit Intervallmit- telpunkt, Status "exakt" und Falls es zensierte Beob- Zensierten der Befragung dieses Alter hatten) (=Individuen, welche entspricht. zum funktion und deren Logarithmus, die Hazardfunktion und die vom Programm graphisch dargestellt werden. Dateninput: erste Datenkarte z.B. vallmittelpunkt, Status "zensiert" ginnenden ersten besagt, daß (=Ladendiebstahl) und O Für das gleiche Beispiel lau­ tet das SPSS- Programm: TITLE IS /INPUT VARIABLES ARE 3. FORMAT IS 'ANWENDUNGSBEISPIEL LADENDIEBSTAHL'. '(3F5.0) ' Runbeispiel SPSS 16 . /VARIABLE NAMES ARE AGE,DEAD,WD. RUN NAME /FORM INTERVAL IS AGE. INPUT MEDIUM CARD NDEAD IS DEAD. N OF CASES UNKNOWN /ESTIMATE ANWENDUNGSBEISPIEL LADENDIEBSTAHL NWITH IS WD. VARIABLE LIST AGE, METHOD IS LIFE. WEIGHT WEIGHT INPUT FORMAT FIXED SURVIVAL TABLES=AGE/ PLOTS ARE SURV,LOG,HAZ ,DEN. /END STATE, WEIGHT (F5.1,2F5.�J 4. 1. o. INTERVALS=THRU 36 5. 2. o. STATUS=STATE(1) 6. 6. o. Daten Die in dem im Zeitpunkt 4.0 be­ (und laut 2.Datenkarte im Zeitpunkt 5.0 endenden) Zeitintervall ein Todesfall Zensierungen beobachtet wurden. /PROBLEM Zeitpunkt Die tlberlebens­ Dichtefunktion des Alters beim ersten Ladendiebstahl sollen achtungen gibt, eine zweite Lochkarte ebenfalls mit Inter­ und c . Die Intervall­ i länge wird bei SPSS im Progranun festgelegt. (=Individuen, zum ersten Mal einen Ladendiebstahl wird durch den Beginn des darauffolgenden Intervalls defi­ niert), c ("Life Tables and Survival Functions") und aus der Anweisung METHOD PLOTS/ BY 1/ FOR AGE/ - 73 - - 72 - READ INPUT DATA 4.5 1. § o�w-NMN��o�o��-o ooo�--�--MNMNNNM 0000000000000000 1. 5.5 1. 2. 6.5 1. 6. � Daten • daß zu berechnen sind, Zeitpunkt 36 in gleich lange �w ��� � Life-Table-Funktionen für die „ • � „ „ • • „ g • • • „ • • • g „ · · · · · · · · · · � · · wobei die Zeitskala bis b'i zum Zeitintervalle der Länge 1 · · · · · · � „ · · · . . . . . . . . . . . . . . � . . . . . . . . " • • • • • • • • . • • . • • • • • • • • • • • • . liegt also im Intervall (Plots) � • „ • • • • · · � · · � · � . . . . . . � . • • • . . • • • 000000000�00000000000000000000000 • • • � • • " • • • • • • • • • • • „ „ • „ • • • • „ • • • • • O �N���Mro�-N�-��--�--���m�m�w��w�w 0��--�NNroOO�M�����N00�0�roro��NNNNNN 0�ro�M��-��OONOO�M00��mN-����������� O����rororo���������MMMMMNNNNN.----�- Fälle [35,36)). mit Statusvariable STATE=1 sind exakte Beobachtungen, anderen Fälle sind zensiert. g • 8������������0��8��gg��oggg�ggggg 80000000000 OOQNNMN�M-OO�MM-MOMNON-� zu (die größte beobachtete Zeit entspricht einem Alter von 35 Jahren, g ��ON�� oo� o oo M�o��o eo� o oo 00000-ooooNOOOOO • g���������������g��o;��oooogggggg 8��ro 8888 oooooo NMMN���N-����oro� 888000000---ocoooooooo-oooo�ooooo • Darstellungen • (wobei die Variable WEIGHT das variable AGE unterteilen ist • ��MW0N��-NMMMMM�MMM����-�������� oo��NNNNMMM�MM����MMM����������� 00000000000000000000000000000000 Die dem "Control Word" SURVIVAL folgen­ den Informationen besagen, • § als würde es sich um gewich­ . Gewicht darstellt). • ��0 FINISH tete Individualdaten handeln ' 0 -NO�N0WWM -�NO�M 0N � §§80�88888 - --g�� 0----�-N-----N 88000000000000g0g000000 00000000 · Die Verarbeitung erfolgt hier so, � alle • . . . . . . . . . . . . . . . . . . . . . . � � . . . . . . . . . Alle verfügbaren graphischen sind anzufertigen. Im Datenteil wurde jede Altersangabe einheitlich auf den entsprechenden Inter­ vallmittelpunkt (4.5, 5.5 usw.) verlegt. Da beide Programmpakete im wesentlichen dieselben Informatio­ nen liefern, beschränkt sich die im folgenden angeführte Er­ gebnisbesprechung auf SPSS-Resultate schied ist lediglich zu beachten, daß (Tabelle 4). 000000000000000000000000000000000 . Als Unter­ nicht auf den Beginn, . . . . � . . . . . . . . N-M �M also auf den Beginn des nach­ folgenden Intervalls beziehen. Numerisch sind die berechneten Bei der Auswertung der Ergebnisse sind vor allem die Plots von Hazardfunktion und kumulativer Hazardfunktion bzw. und . loga­ . . . . . . � . .. . . . . � . � . . . . . ,,, . . . . . . . . . ���N��-�-��roM-���Mm�roNoo-m�W�M--­ MMMMN--O�W�MN-m��W�MNN.­ NNNNNNNN,,.--..-..-.-..- •ri 0 Werte bis auf Rundungsfehler völlig identisch. rithmierter Überlebensfunktion von Nutzen, oooooooooooooo�oooooo�o�mmooo�oom sondern auf das Ende des betreffenden, blick auf Entwicklungstheorien, � sich bei SPSS - im Ge­ gensatz zu BMDP und den oben angeführten Formeln - die ("cumula­ tive proportion of surviving") . -Nw�ro��row��m��� N�� . °.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°. ��o�OroN���M-M Nr �����������������������������qq�� ���N�����M�OOM�-o�roMNO�OMO����N--­ MMMMN�-o�oo�MN-O������NN-­ NNNNNNNN-t-...-....:--.-,,.- zwar im Hin­ welche ein vom Alter unab- ������°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.°.��qqqqq M������O�N�����ro�O-NM����oo�O-NM�� ----------NNNNNNNNNNMMMMMM - 74 - - 75 - r(t} 0,4 I I I 1 l 1 l 1 I 1 0,20 <V .<: 0 "1 ·.-l s :5 0,10 I l l 1 0,05 I 0,02 1 I 1 11 11 1 111 1 1 II 111 1 1 I•-- -----+----_:__4 ----- --+- ---- - -+ ---- ---+--- ---- +- --- ---+---- ---+-------+-------t I 0,01 I 0 I 1 1 1 1 I 4 8 Abbildung 8; 12 16 20 24 28 Beispiel Ladendiebstahl, 32 36 Hazardrate 40 t(Jahre) oder fallendes ersten Fall ("negative aging") (r konstant) Risiko postulieren. Im zu Die aus den Laden­ diebstahlsdaten geschätzten Ergebnisse legen ein zuerst bis des Risiko nahe. 30 12 Jahren zunehmendes, dann abnehmen­ Die hohen Werte der Hazardrate bei 25 bzw. Jahren sollten unter Berücksichtigung der oben ausgespro­ chenen Warnung nicht äberinterpretiert werden. 1 1l l l l I l I I l 1 I l 1 1 1 I I 1 I l 1 I 1 I I I I I 1 1 I I I I 1 I I l I I I I l I I ! ! l l 1 I l I ! I l I I t-- - --- - t--- ----+-- - ----+-- -----1"-- ---- -+-- ---- -+- -----• ---- ---+-- - ---- t-- -- ----tl 4 8 12 16 24 20 28 32 36 40 Der Verlauf 9: Beispiel Ladendiebstahl, Logarithmus der Über­ der logarithmierten Überlebensfunktion erlaubt eine Untertei­ wäre ein linearer verlauf der loga­ bei positivem Altern ein nach unten, bei negativem zu einem Höhepunkt bei l l I I I I I lebensfunktion (SPSS) ("positive aging"J Altern ein nach oben gekrümmter Verlauf. 1 1 l (SPSS) rithmierten Überlebensfunktion (mit negativem Anstieg -r) erwarten, l I l I l 0 Abbildung hängiges, ein mit dem Alter steigendes 1l 1 I ·ri k nl Ö' 0 r-1 1 I 0,0 nj r-1 nj ..'>< <Jl I 1 l 1 I l 1 l 1 l 1 l 1 l I I 1 ! I I+-------+-------t--- ____.,.___ - -- -+- - -- --�+-------+--- -- --+-------+-------+----- --tI ll 1 1 1 l l l 1 l I 1 l l l I 11 ! l l ! 1 I l 1 l l l l 11 1 1 1 I 1 I l l o, 1 0,50 I 1 1 1 1 I I 1 1 1 I l 1 I I I I I I I 1 I l l I 0,2 1,00 1 I I I 0,3 G(t) I+-------+-------+-------+-------i-------+---��--+------�+�-----�+-------+-�-----+1 l I I 1 I I I lung des Lebenszyklus in vier Phasen: zendes, ein allmählich einset­ dann relativ konstantes Risiko in der Kindheit zum Alter von etwa 10 Jahren), wieder abnehmendes Risiko in der Pubertät und 15 Jahren), (bis ein stark zunehmendes, dann (etwa zwischen 10 ein wiederum relativ konstantes Risiko in der nachpubertären Entwicklung (bis etwa 20 Jahre) rasch auf O zurückgehendes Risiko danach. und ein recht t - 76 - - Nicht vergessen werden sollte hier allerdings, daß diese In­ geht diese Probleme. 77 - Im Falle großer Stichproben kann es terpretation auf der Annahme einer homogenen Population be­ a1-lerdings bei der Benutzung von Computer-Programmen Schwie­ ruht, rigkeiten mit der Rechenzeit und dem Speicherbedarf geben. und daß nicht beobachtete Heterogenitäten die Form der geschätzten Hazardfunktion maßgeblich beeinflussen. schnell einsieht, stante, Wie man wird selbst eine für jedes Individuum kon­ aber individualspezifische Hazardrate zu einer abneh­ menden geschätzten (Gruppen-) Hazardfunktion führen, da zu­ Die nach ihren Erfindern auch Kaplan-Meier-Schätzer und MEIER Idee, 1958) durch immer feinere erst die Individuen mit hohem Risiko ausscheiden und mit zu­ Intervalle) nehmendem Alter nurmehr die Individuen mit geringem Risiko jedes übrigbleiben. Ohne zusätzliche Informationen ist die Unter­ auch gar nicht möglich. anzunehmen, 3.4. auch ANDRESS zwi­ 3.3.1. Product-Limit-Schätzformein Wir werden in Abschnitt und in den folgenden Kapitein darauf einer soziologischen Anwendung der Wenn die Intervalleinteilung derart ge­ sind Life-Tab1-e- und Product-Limit-Schätzwerte also etwa bei Männern und Frauen unterschied1-ich ist und auch schen sozialen Schichten variiert. (aber möglicherweise mehrere Beobachtungen/Zensierungen zu tatsächlich auch identisch. daß das Verlaufsmuster der Hazardfunktion von Sozia1-isations- und Entwicklungsbedingungen abhängt, in der Zeitintervall_ nur mehr höchstens eine beobachtete zeit wählt wird, Im vorliegenden Fall ist durchaus Zeiteinteilungen, (in immer kleinere sch1-ießlich zu einer Situation zu kommen, dieser Zeit) enthält. scheidung zwischen Lebenszykluseffekten und Heterogenität (KAPLAN genannte Product-Limit-Methode beruht auf der zurückkommen Die Beobachtungen werden nach aufsteigenden Zeiten geordnet, (zu Life-Table-Methode siehe wobei davon ausgegangen wird, daß nicht zu ein und demselben Zeitpunkt sowoh1- Todesfäl1-e als auch Zensierungen auftreten 1982b). {sollte das trotzdem der Fall sein, wird die Zensierung ais "etwas später eintretend" betrachtet). Bei genügend feiner 3.3. Zeiteinteilung befindet sich dann in jedem Intervall höch­ stens ein Beobachtungszeitpunkt, zu dem entweder nur Todes­ Die Life-Tab1-e-Methode kann auch bei der Auswertung von Indi­ fälle oder nur zensierungen vidua1-daten mit exakten Zeitangaben von Nutzen sein, Notwendigkeit, wie im letzten Abschnitt die Risikomenge um besonders dann, und zwar wenn der Stichprobenumfang sehr groß ist. Bei der Einteilung der Zeitachse in Intervaiie wird man sich in Intervalle, in denen Todesfälle auftreten, etwa Tagesdaten in Wochen- oder Monatsintervalle gruppieren. erst kürzere, kann aber auch eine Einteilung in dann längere Intervalle zweckmäßig sein. terschiedliche Intervalleinteilungen führen unterschiedlichen Schätzergebnissen, jedoch i.a. Un­ zu und die dadurch auftre­ tenden Ungenauigkeiten können sehr stören. Der bei nicht zu großen Stichproben vorzuziehende Product-Limit-Schätzer um- Damit entfäl1-t die einen Anteil der zensierten Fälle zu reduzieren. diesem Fall wohl an allgemein übliche Aggregate ha1-ten und Wie schon oben erwähnt, auftreten. für alle anderen Intervalle: Für alle gilt dann: - 78 - - 79 - Wegen der Diskontinuitäten der Überlebensfunktion ist es und für die Überlebensfunktion: (44) G(tl"' lI p. ilt.<t l. l. wobei hier wegen {43) gebildet werden muß, il nicht sinnvoll, eine Hazardfunktion zu schätzen, "Hazardkomponenten" TI Zeitpunkte, das Produkt nur über jene Zeitpunkte zu denen Todesfälle auftreten. Die For­ ) mel für die Varianz von G(t) wird asymptotisch 1 (KALBFLEISCH und PRENTICE 1980): FLEISCH und PRENTICE (46) Var(ln schrieben, G{t) sind aber asymptotisch � Varianz {siehe KALB- G(t)) Graphische Checks, (45) Var(G(t)) -In und Hazardrate R(t)= i äquivalent mit � wohl aber r1=d /n für die Sprungstellen, d.h. die i i zu denen Todesfälle auftreten. Die kumulative wie am Ende des letzten Abschnitts be­ sind natürlich ebenfalls möglich. T;otz der - mo­ �ellimmanenten - Diskontinuitäten lassen sich R(t) und - ln Im Grenzübergang bei immer feinerer Zeiteinteilung - und dar­ um geht es beim Product-Limit-Schätzer - fallen für die In­ tervalle, in denen Todesfälle auftreten, Intervallbeginn und Beobachtungszeitpunkt zusammen, und b�zum nächsten Zeitpunkt, in dem ein Todesfall auftritt, bleibt G(t) konstant. Die mit der Product-Limit-Methode geschätzte Überlebensfunktion ist also eine Stufenfunktion mit Sprüngen zu denen ein Todesfall obachtete Zeit zensiert ist, blem auf, zu jenen Zeitpunkten, beobachtet wurde. tritt dabei Falls die größte bedas Pro- daß die geschätzte Überlebensfunktion G(t) nicht gegen 0 strebt. In diesem Fall ist es üblich, G(t) für alle Zeitpunkte nach der größten beobachteten exakten Todeszeit als nicht definiert zu betrachten. G{t) so wie früher interpretieren. Ein steiler Verlauf dieser Funktionen entspricht einer großen Neigung zum Wechsel, flacher Verlauf einer geringen Neigung. ein Der Product-Limit-Schätzer hat einige recht angenehme stati­ stische Eigenschaften. Er kann als Maximum-Likelihood-Schätzer hergeleitet werden und liefert unter relativ allgemeinen Be­ dingungen über den Zensierungsmechanismus asymptotisch nor­ malverteilte Schätzer (siehe etwa KALBFLEISCH und PRENTICE 1980). Damit lassen sich Konfidenzintervalle für G(t) be­ stimmen (für ein festes t), G(t)±1,96 '0f ar (�(t))• 1 etwa ein 95 %-Konfidenzintervall Mit Hilfe der in BMDP ebenfalls be­ rechneten Standardfehleri{Var (G(t ))' können für die exakt i beobachteten Zeitpunkte t1 solche Konfidenzintervalle leicht berechnet werden. 1) "Asymptotisch" heißt hier und im chen - für "große" Stichproben. In Praxis man die entsprechenden Formeln bzw. Teststatistiken so als ob sie exakt gelten bzw. exakt mit der asymptotisch�n Verteilung (meist x2- oder Normalverteilung) übereinstim­ men würden. Bei kleinen Stichproben muß man dabei aller­ dings Ungenauigkeiten in Kauf nehmen. Es kann natürlich vorkommen, daß ein derart berechnetes Kon­ fidenzintervall negative Werte oder Werte >1 enthält. Da G(t) eine Wahrscheinlichkeit darstellt, ist ein solches Ergebnis nicht sinnvoll. Es läßt sich aber durch eine geschickte Trans­ formation von G(t) vermeiden. Für den interessierten Leser - 80 - führen - 81 wir die entsprechende� Formeln hier an. Die log­ minus-log Transformation von G(t) besitzt die asymptotische Varianz: d 2 ; (t) � G(t) r i i l t.<t n. (n.-d ) 2 l. l. l. i ni-di 2 log( ) n i [ t <t i i [ 1 r %-Konfidenzintervall: � exp(±1,96s(t)) (t) (49) zur Product-Limit-Methode 3 10 0, 10 0 ,90 1,00 4 9 0,11 0,89 0,90 7 0, 14 0 ,86 0 ,80 5 0,20 0,80 o,69 4 0,25 0, 7 5 0,55 3 0,33 0,67 0,41 1,00 o,oo 0,27 7 0 10 1 13 0 14 Nach Rücktransformation ergibt sich für G(t) das folgende 95 Rechenbeispiel log(-log G(t)) (47) V(t) (48) Tabelle 5: - 19 21 1 0 21 24 *) 1=exakte, o�zensierte Beobachtung 1) Dieses nimmt nur zulässige Werte zwischen O und 1 an. Für die Bestimmung simultaner Konfidenzbänder für die gesamte Zeitachse (also nicht nur für einen festen Zeitpunkt t ) sind z.B. G ( 14) 10-1 2..:..1 11=..l> = 0,69 ( )( ) 7 9 10 3.3.2. . allerdings recht kompl·izierte Berechnungen notwendig (siehe etwa HALL und WELLNER 1980). In BMDP sind entsprechende Routinen leider nicht implementiert, Auch hier soll ein einfaches Beispiel mit den zehn Beobach­ tungen in Abschnitt 3.2.1. die Berechnungen veranschaulichen (vgl. dazu Tab.5). Der Product-Limit-Schätzer ist in BMDP implementiert (in SPSS bis Level 8.0 nicht). Die Beobachtungen werden nach den Zeiten geordnet und einzeln : zunehmen­ Zeile für Zeile - mit dem dazu berechneten Schätzwert für G(t) und dessen Standardfeh­ ler ausgedruckt. Für große Stichproben empfiehlt es sich da­ her, diesen Teil des Ausdrucks zu unterdrücken (NO PRINT). Für die gesamte Stichprobe werden die mittlere Überlebens­ zeit sowie Median, erstes und drittes Quartil berechnet. Die graphische Darstellung von Uberlebensfunktion und deren Loga­ l) x Statt der Schreibweise e für die Exponentialfunktion verwenden wir auch exp{x), um die Lesbarkeit der Formeln zu rithrnus bzw. nicht kumulierter Hazardrate kann angefordert werden, jedoch - aus den oben angeführten Gründen - die Hazard­ funktion und die Dichte der Ankunftszeit. - 82 - - 83 - Als Anwendungsbeispiel betrachten wir die Auswertung von In­ Das Programm für unser Beispiel lautet: dividualdaten zur Dauer von Arbeitslosigkeit. Die Stichprobe entspricht im vorliegenden Fall einer Kohorte, also einem Sample von Erwerbstätigen, welche in einem bestimmten Zeit­ raum arbeitslos wurden. Das Ereignis "Tod" ist hier durchaus erfreulich: wird. es besagt, daß der Betreffende wieder beschäftigt Ein hoher Wert der Hazardrate (hohes "Todesrisiko") entspricht also einer hohen Chance, wieder beschäftigt zu werden. Zensierungen entstehen bei unseren Daten dadurch, /PROBLEM TITLE IS /INPUT VARIABLES ARE 7. /VARIABLE NAMES ARE ENTDAY,ENTMONTH,ENTYEAR, /FORM ENTRY IS ENTMONTH,ENTDAY,ENTYEAR. F ORMAT IS Es sind aber auch andere RESPONSE IS 1 • /ESTIMATE Buch zwar nicht behandelt werden, aber trotzdem nicht über­ sehen werden sollten: die Beziehungen zwischen dem untersuch­ ten Prozeß und dem Zensierungsmechanisrnus. Es ist sicher leicht einzusehen, daß ein Zensierungsschema, nach dem Indi­ viduen genau dann aus der Studie entfernt (also zensiert wer­ den), wenn ihr Todesrisiko besonders groß (oder klein) zu verzerrten Schätzwerten führen muß. Streng METHOD IS PRODUCT. NO PRINT. nach längerer erfolgloser Suche diese Meldung unterläßt. Das letzte Beispiel weist auf Probleme hin, welche in diesem · STATUS IS STATE. Zensierungsursachen denkbar, z.B. beitsamt gebunden ist, und der betreffende Arbeitssuchende ' TERMINATION IS TERMONTH,TERDAY,TERYEAR. endet. wenn die Beobachtung an eine regelmäßige Meldung beim Ar­ '(3F2.0,1x,3F2.0, 1x,F1.0) TERDAY,TERMONTH,TERYEAR,STATE. daß die Beobachtungsperiode zu einem festgesetzten Zeitpunkt (zu dem einzelne Befragte noch arbeitslos sein können) 'ANWENDUNGSBEISPIEL ARBEITSLOSIGKEIT'. PLOTS ARE SURV,LOG. /END 180279 220379 20 0279 0 10379 Daten 270279 310879 0 ist, genommen wäre hier eine sorgfältige Modellierung der Wechse lwirkungen zwi­ Neben den selbsterklärenden Anweisungen METHOD IS PRODUCT und NO PRINT sind im Vergleich zum BMDP-Beispiel in 3.2.2. schen untersuchtem Prozeß und Zensierungsmechanismus erfor­ die Anweisungen ENTRY IS derlich, dafür sind in der Literatur allerdings kaum Vor­ Paragraphen neu. Sie besagen, daß die Daten chronologische schläge zu finden. Für uns sollte als Anhaltspunkt ausrei­ chend sein, daß etwa bei "random censoring" derartige Prcblerre Zeiten (Kalenderzeiten) • . . und TERMINATION IS darstellen, und (Jahr) • im FORM­ ausgedrückt wird, daß (Monat), nicht auftreten. Ein solches Zensierungsschema liegt beispiels­ ENTDAY. weise dann vor, wenn für Beendigung der Arbeitslosigkeit bzw. Zensierung analog durch jedes Individuum a priori eine feste ENTYEAR • zwar in der Form, das Eintrittsdatum durch die Variablen ENTMONTH (Tag) , • das Datum der Zensierungszeit gewählt wird, oder wenn Individuen über einen TERMONTH, TERDAY und TERYEAR. Die Daten der bestimmten Zeitraum hinweg zufällig in die Studie aufgenommen B. gehören zu einem Arbeitslosen, der am 18.2.1979 arbeits­ werden und die Beobachtung zu einem festgewählten Zeitpunkt los wurde und am 22.3.1979 abbricht. den hat. Beide Arten sind für sozialwissenschaftliche Unter­ suchungen durchaus typisch. 1. Lochkarte z. wieder eine Beschäftigung gefun­ - 85 - - 84 - G(t) (109-Skala) •*·· • ,;-. • • ,+ . Sprung nach unten, was einem kurzfristig wirksamen, aber • • t., • • + • • • . T • • ,.t. • • .+ • • , .+. , , •'*'· •·i'·, .,+ . . , ,:t-, . ,.+ . . , .+ • • . . T,, • • t. deutlichen Anstieg der !lbergangsrate (aus der Arbeitslosig­ keit in ein Beschäftigungsverhältnis) 1 ,ooo entspricht. Die bei­ den anderen Termine sind nicht so deutlich ersichtlich. der Nähe des o,so o Knick, 12-Wochen-Termins hat die Log-Kurve wobei sich die tlbei::gangsrate (=Anstieg der Kurve) geschätzt auf die Hälfte reduziert. rung einer Notstandshilfe kommen jedoch, daß nach 46=20+26 lativ 0,050 O grob Für das Ende der Gewäh­ je nach der Arbeitslosen­ geld-Bezugsdauer sogar drei Termine in Frage. o, 100 In einen Auffallend ist Wochen die llbergangsrate wieder re­ hoch ist, nachdem sie unmittelbar vorher praktisch auf zurückgegangen ist. Natürlich können auch hier Verweildauereffekte durch Kova­ riateneinflüsse überlagert werden. 0,010 Om diese 0,005 1) Untergliederung der gesamten Population nach geeigneten Kriterien in homogene Subgruppeni 0 120 360 240 480 Abbildung 10: Beispiel Arbeitslosigkeit, lebensfunktion 600 t (Tage) der Ergebnisse logarithmierte Über- (Hypothesentests, zu behalten. • Nullhypothese: Subgrup­ in Bezug auf die Über­ Diese Vorgangsweise wird im folgenden Abschnitt erläutert. zweckmäßig, die We­ senszüge des österreichischen Arbeitslosenversicherungsge­ setzes im Auge lebensfunktion) (BMDP) Bei der Auswertung der Ergebnisse ist es Schätzen der entspre­ chenden Funktionen in den einzelnen Gruppen und Vergleich pen unterscheiden sich nicht z.B. besteht Effekte zu tren­ nen bieten sich im wesentlichen zwei Vorgangsweisen an: Ein Anspruch auf Arbeitslosengeld (bei Erfüllung weiterer Bedingungen) für einen Zeit­ 2) Variation der Hazardrate in Abhängigkeit der Kovariate. Dieser Vorgangsweise entsprechen die in den nächsten beiden Kapiteln beschriebenen Regressionsmodelle. raum, der je nach der Dauer der vorhergehenden versicherungs­ pflichtigen Beschäftigung 12, 20 oder 30 Wochen beträgt. Bei Erschöpfung dieses An spruchs kann für maximal weitere 26 Wo­ chen eine Notstandshilfe gewährt werden, Bedingungen erfüllt sein müssen. wobei aber weitere Der 20- und der 30-Wochen­ Termin sind im PLOT der logarithmierten Uberlebensfunktion deutlich ausgeprägt: zu beiden Zeitpunkten gibt es einen Im ersten Fall genügen dafür zwar grundsätzlich doppelt nach der zeit und nach der Untergruppe gruppierte Daten. (d.h. In der Regel wird man sich aber auch hier auf Individualdaten stützen, welche neben der Ankunftszeit noch Informationen über die den untersuchten Prozeß beeinflussenden Kovariaten enthalten. - 86 - - 87 - 3.4. züglich der Anzahl aller mit Gewißheit kleineren Überlebens­ Subgruppen zeiten ist. "Mit Gewißheit" soll dabei bedeuten, daß· nur zweifelsfrei entscheidbare Größenunterschiede zu berück­ Beim Vergleich von Subgruppen liegt es nahe, die oben be­ sichtigen sind. schriebenen Verfahren für jede Untergruppe durchzuführen. So­ Bei zwei zensierten Beobachtungen z.B. die Feststellung, ist welche der beiden dazugehörenden Lebens­ wohl SPSS als auch BMDP sehen diese Möglichkeit, vor und er­ zeiten größer ist, lauben insbesondere die simultane graphische Darstellung der ten und einer exakten Beobachtung, welche größer ist als die Ergebnisse. Damit können gruppenspezifische Unterschiede im zensierte. Verlauf von Überlebensfunktionen, Hazardrate usw. nicht möglich, ebenso bei einer zensier­ auf einen Blick erfaßt werden. Der Score-Wert einer Beobachtung kann also als ihre Ordnungs­ nummer (Rang) interpretiert werden, wobei kleine Zeiten einem Wünschenswert ist darüber hinaus natürlich auch die Verfüg­ hohen Rang, barkeit von Teststatistiken mit wenn sich die Gruppen nicht unterscheiden, (zumindest asymptotisch) be­ kannter Verteilung, um bei einem gewählten Signifikanzniveau 2 etwa analog zur Varianzanalyse oder�urn x -Test die Nullhypo­ große Zeiten einem niedrigen Rang entsprechen. sollte die Ver­ teilung der Ränge auf die verschiedenen Gruppen ungefähr gleich sein. these identischer Uberlebenswahrscheinlichkeiten testen zu können. Unter der Annahme identischer Überlebensverteilungen (Null­ hypothese) sowie gleicher Zensierungsmuster in allen Gruppen Die gebräuchlichen nicht-parametrischen Testverfahren benüt­ lassen sich Erwartungswert und Varianz der gruppenspezifi­ zen Rangordnungsstatistiken und sind im wesentlichen Modifi­ schen Scoresummen berechnen, und die davon abgeleitete Test­ kationen von Rangordnungstests für vollständige statistik: zensierte) (d.h. nicht­ Daten. Dabei werden alle beobachteten Zeiten der Größe nach geordnet, Ränge auf die einzelnen Untergruppen ist die in die Test­ statistiken eingehende Information. • (50) j=1 k j 2 ( uij) /n j i=1 � n. i:J u i=1 ij 2 / (n-1) Sub­ n -Fälle umfaßt, bei einem j Gesamtstichprobenumfang n=n1+n + +n . In jeder Unter­ k 2 gruppe werden die Beobachtungen der Größe nach geordnet. wobei die Gruppe Nr.j • E E j�1 Im a llgemeinen Fall zerfällt die Stichprobe in k(k<:2) gruppen, k die Verteilung der dadurch gewonnenen • ist asymptotisch mit k-1 Im verallgemeinerten Savage-Test Für den verallgemeinerten Wilcoxon-Test (Gehan-Breslow-Test) wird für jede beobachtete Zeit ein obachtung Nr.i in der Gruppe Nr.j) "score" U (für die Be­ ij ermittelt, welcher gleich der Anzahl aller mit Gewißheit größeren tlberlebenszeiten ab- Freiheitsgraden. Dieser Test ist sowohl in SPSS als auch in BMDP realisiert. Test) (Mantel-Cox-Test, Log-Rank­ wird zu jedem Todeszeitpunkt die unter der Nullhypo­ these zu erwartende Verteilung der Todesf�lle auf die k Sub­ gruppen berechnet und der beobachten Verteilung gegenüber­ gestellt. Eine gewichtete Quadratsumme der Differenzen beob­ achtete-erwartete Verteilung dient als Teststatistik. - 88 - und d die Anzahl der einen Todeszeit­ Wir bezeichnen mit n i i erlebenden bzw. zu diesem Zeitpunkt sterbenden In­ t punkt i die und d dividuen in der ganzen Stichprobe sowie mit n ij ij entsprechenden Anzahlen in der Subgruppe Nr.j. Wenn die Uber­ lebensfunktionen in allen Subgruppen identisch sind hypothese), 89 - - (Null­ dann werden sich die Todesfälle im Mittel propor­ der dem Risiko ausgesetzten Individuen n ij ist auf die Subgruppen aufteilen. Der Erwartungswert von d ij daher tional zur Anzahl Anzahl der Subgruppen ist). TARONE und WARE (1977) zeigen, daß sich beide Tests nur in der Gewichtung der Beobachtungen un­ terscheiden, konkret: daß sich auch die Gehan-Breslow-Test­ statistik als Summe von Differenzen beobachtete minus erwar­ tete Häufigkeiten darstellen läßt, n 1 tet. allerdings mit der Anzahl erlebenden Individuen gewich­ der einen Todeszeitpunkt Statt der oben angegebenen Differenzen v i werden also die gewichteten Differenzen (51) w ij und deren Varianz-Kovarianz-Matrix in der Teststatistik verUnter der Nullhypothese hat also die Differenz beobachtete­ wendet. n. l. erwartete Todesfallhäufigkeiten t , 1 Da für kleine beobachtete Zeiten das zugehörige relativ groß ist verglichen mit großen beobachteten Zeiten bedeutet das, ��_..':!:�_:!.��;..!:.';��!.!!.§!����.:::!�� sensitiv auf Unterschiede zu Beginn des Prozesses reagiert, der Log-Rank-Test eher auf Unterschiede gegen das Ende de�; Prozesses. den Erwartungswert o. Unter Benützung der hier nicht ange- führten Varianz-Kovarianz-Matrix Teststatistik läßt sich die von v i Falls die Hazardfunktionen in verschiedenen Unter­ gruppen proportional sind, besitzt der Log-Rank-Test asymp­ totisch sogar volle Effizienz. Die Eigenschaften der beiden Tests sind in Tabelle 6 zusammengefaßt. wenn sich gruppenspezifische Überlebensfunktionen schneiden, können beide Tests zu irreführenden Ergebnissen führen. bilden, welche asymptotisch ist. Da bei Summation über die Gruppen die Anzahl der beobachteten gleich der An­ zahl der erwarteten Todesfallhäufigkeiten ist, der Freiheitsgrade Gruppen. lauf der geschätzten gruppenspezifischen Uberlebensfunktio­ nen mitberücksichtigt werden. um eins kleiner als die Zahl der Für nähere Details verweisen wir auf die weiterfüh­ rende Literatur, LAWLESS (k-1} ist die Zahl Bei der Interpretation der Testergebnisse sollte daher der Ver­ etwa KALBFLEISCH und PRENTICE (1980) oder (1982). Die Annahme identischer kritischen Würdigung. treffend sein, Zensierungsmuster bedarf noch einer Sie wird insbesondere dann nicht zu­ wenn das Auftreten ungeplanter Zensierungen (lost cases) mit dem Subgruppenkriterium korreliert. Die beiden hier vorgestellten Teststatistiken sind also 2 asymptotisch x -verteilt mit k-1 Freiheitsgraden {wobei k die Wenn etwa in einem klinischen Versuch mit Kontrollgruppe und Ver- - 90 - - suchsgruppen, Verallgemeinerter Verallgemeinerter Wilcoxon-Test Savage-Test scheiden, - welche sich durch Behandlungsintensität unter­ infolge unangenehmer oder schmerzhafter Behandlung in unterschiedlichem Umfang Ausfälle aus dem Untersuchungs­ programm auftreten, ist eine Korrelation und Zensierungen gegeben. Synonyme Bezeichnungen 91 zwischen Subgruppe Wenn es ferner bei pen von Arbeitslosen häufiger vorkommt, bestimmten Grup­ daß infolge Entmuti­ gung eine weitere Meldung am Arbeitsamt unterbleibt, Gehan-Breslow-Test Mantel-Cox-Test Log-Rank-Test die obige Annahme ebenfalls nicht gerechtfertigt Nachprüfung ist dabei nicht immer leicht möglich, Test hat sich der folgende eher sensitiv bei fol­ genden Alternativhypothesen "Trick" bewährt: Eine aber als Durch ein gegen­ seitiges Vertauschen der Statusausprägungen "exakt" siert" wird sein. und "zen­ können mit denselben verfahren die Ankunftszeitenver­ teilungen der zensierten Zeiten in jeder Gruppe geschätzt G(t) G(t) werden. Wenn sich diese nicht sehr unterscheiden, wird man die Annahme konstanter Zensierungsrnuster getrost akzeptie­ ren. Bei nur wenigen zensierten Fällen gibt es ohnedies kaum Probleme. Als Anwendungsbeispiel greifen wir noch einmal auf unsere Ladendiebstahldaten zurück, wobei die an sich gruppierten Ankunftszeiten als individuelle Beobachtungen jeweils Altersjahresmitte interpretiert werden. t zur In diesem Fall be­ handeln wir also die Ladendiebstahlsdaten als individuenbe­ zogene Zeitpunkt-Daten. Wie schon erwähnt, lassen unter­ schiedliche Entwicklungs- und Sozialisationsbedingungen Software-Realisierung einen unterschiedlichen Verlauf warten. BMDP BMDP SPSS Tabelle 6: Nicht-parametrische Tests für Subgruppenvergleich bei Männern und Frauen er­ - Runbeispiel BMDP - 93 G(t) (Programm P1L) /PROBLEM TITLE rs /INPUT VARIABLES ARE 3. FORMAT IS /VARIABLE 92 - . ... . , • . + • • , . + . ' . . • . . +. . 'ANWENDUNGSBEISPIEL LADENDIEBSTAHL'. lt 0, 75 TIME IS AGE. RESPONSE IS 1 • 0,50 METHOD IS PRODUCT. F - Fff -f Kf Hf H FFf f H H ffF IM< Fff lt Fff fff f H M f fffff II fff fffffffff F f F '(F4.1,2F3.0) '. NAMES ARE AGE,STATE,SEX. . >t-. . . . ... . . . t. ' .. +.' . . .... . ..... . .t . . ................ + . • • • + • • • . +. tfffffffffffMiH fFFFfFF l<ll f ffff -f M fff HHHHf fffff 1,00 STATUS IS STATE, /ESTIMATE ' . - GROUP IS SEX. PLOTS ARE SURV,LOG. - STATISTICS ARE BRESLOW,MANTEL. /GROUP F MMMF CODES (3)ARE 0,1. NAMES f - -ffffffffffffffffff 0,25 II II H - (3) ARE FRAUEN,MAENNER. /END 4.5 0 5.5 1 Daten o,oo .+ . • . . + . • • ·*"· 0 Überlebensfunktionen kommen: 1) Im ESTIMATE-Paragraph (SEX) mit der die s ubgruppende­ vereinbart wird die Anweisung STATISTICS ARE BRESLOW,MANTEL, Merkmale nungen mit der in dem die Subgruppen-definierenden (Codes O bzw. (FRAUEN,MAENNER) 1) sowie dafür verwendete Bezeich­ festgelegt werden. Die Anfangs­ buchstaben dieser Namen werden in den angeforderten Plots verwendet. die üblichen Berechnungen, gegeben. beide in BMDP verfügbaren Tests angefordert werden 2) Ein GROUP-Paragraph, 25 •• . . •+. 30 • • + . • • . + • • • ·'*· 35 40 t geschlechtsspezifische (BMDP) Die Programmexekution liefert für jede der beiden Subgruppen die Anweisung GROUP IS SEX, finierende Variable b) 10 ' ·*' · · · .+ • • . . 20 15 Beispiel Ladendiebstahl, Im vergleich zu den bisherigen Runstreams ist neu hinzuge­ a) 5 ... + • • • • + • • • • +. die Graphiken werden simultan aus­ Der Vergleich der Überlebensfunktionen zeigt, daß - von einer Ausnahme am Anfang abgesehen - die Uberlebenswahr­ scheinlichkeiten bei den Frauen durchwegs größer sind als bei den Männern, Männer, daß also Frauen im allgemeinen älter sind als wenn sie zum ersten Mal einen Ladendiebstahl begehen. Da sich die überlebensfunktionen in zunehmendem Alter wieder annähern, ist zu erwarten, daß der Gehan-Breslow-Test stärker anspricht als der Log-Rank-Test. werden die Werte der Für die angeforderten Tests entsprechenden Teststatistiken und die - 94 - - 95 - zugehörigen Irrtumswahrscheinlichkeiten sowie die Zahl der Freiheitsgrade ausgedruckt. 95 4. Semi-parametrische Verfahren Bei einem Signifikanzniveau von % z.B. würde der Gehan-Breslow-Test zu einer Ablehnung der Nullhypothese identischer Überlebensfunktionen führen. Im Unterschied zum vorhergehenden Kapitel ist Heterogenität auch als kontinuierliche Variation entlang einer oder mehre­ rer Kovariatendimensionen Test Statistik Einkommen d.f. 4,67 0,031 verallg.Savage 3, 72 054 2) Anzahl der Freiheitsgrade = • ) (Alter, sozioökonomischer Status, vorstellbar und - in Abhängigkeit davon - eine so daß idealtypisch jeder Kovariatenkonfiguration eine spezifische Hazardfunktion entspricht. kommen, Um zu geeigneten Verfahren zu ist es allerdings unumgänglich, die Beziehungen zwi­ schen Kovariaten und dem untersuchten Prozeß Anzahl der Gruppen -1 2 Restwahrscheinlichkeit der x -Verteilung der Teststatistik • kontinuierliche Variation etwa der Hazardfunktion, verallg.Wilcoxon 1) • zu operationa­ lisieren. (d.f.=1) zum Wert Dazu gibt es im wesentlichen zwei verschiedene Entwicklungs­ Tabelle 7: Ladendiebstahlsstudie, gleich Männer/Frauen Testergebnisse beim ver­ linien: Der erste, in diesem Buch nicht weiter verfolgte An­ satz, spezifiziert Beziehungen der Ankunftszeit zwischen den Kovariaten und (oder transformierten Werten davon) und lei­ tet daraus Regressionsmodelle für unvollständige Beobachtun­ gen ab {siehe etwa MILLER ziert Beziehungen tion. 1976). Der zweite Ansatz spezifi­ zwischen den Kovariaten und der Hazardfunk­ Diese Beziehung kann vollständig (siehe Kapitel 5) oder teilweise parametrisiert sein. Der semi-pararnetrische Ansatz beruht auf der Modellannahme eines allgemeinen, nicht weiter spezifizierten (also nicht­ pararnetrischen) Verlaufsmusters der Hazardfunktion, durch Kovariateneinfluß welche individuell modifiziert wird. Die Effekte der Kovariate werden demnach in parametrischer Weise modelliert. Der Vorteil der semi-parametrischen Verfahren ist in der großen Flexibilität des Ansatzes zu sehen. tet sich ja das Hauptinteresse auf das sal bedeutsamer Effekte zu ermitteln. Sehr häufig rich­ Ziel, die Stärke kau­ Mit den semi-parametri­ schen Verfahren ist es möglich, das Gewicht von qualitativen - 96 - oder quantitativen Kovariaten - 97 - Die beiden verbleibenden Annahmen (multiplikativer und log­ zu schätzen, ohne wie bei den parametrischen Verfahren a priori Annahmen über die genaue linearer Kovariateneinfluß) mathematische Funktion der Verweildauerabhängigkeit zu tref­ dellrestriktionen dar. fen. Risiko eines Zustandswechsels unabhängig vom Zeitpunkt bei 4.1. stellen noch zwei bedeutsame Mo­ Gemeinsam besagen sie, Veränderung eines Kovariatenwerts Das Proportional-Hazards-Modell von COX satz erhöht bzw. erniedrigt. daß sich das ei11en festen Prozent­ um In einem konkreten Regressions­ beispiel kann das etwa bedeuten, Im Proportional-Hazards-Modell von COX wird angenommen, daß der Einfluß der Kovariate multiplikativ und log-linear ist, d.h., daß bei gegebenen Kovariaten x=(x , ... ,x ) die indivi­ 1 n folgende Gestalt hat: dual-spezifische Hazardfunktion r(t,x) daß sich die Chance eines Arbeitslosen, zu werden, mit jedem wiederbeschäftigt zusätzlichem Altersjahr um einen fe­ sten Prozentsatz ändert (in diesem Fall vermutlich verrin­ gert) - daß sich diese Chance mit jedem zusätzlichen Ausbildungs­ wobei die "Baseline-Hazard-Function" steht hier fUr Baseline r0{t) - der Index jahr um einen festen Prozentsatz ändert "O" das nicht-parametrisierte Ver­ laufsmuster der Hazardrate darstellt und ß'=(ß , 1 Parametervektor der Kovariateneinflüsse ist. daß ,ß ) der n Die Bezeich­ . • • - daß sich das Scheidungsrisiko mit der Quotient zweier individual-spezifischer Hazardraten eine Zeit abhänqige Konstante ist, sich das Scheidungsrisiko mit jedem zusätzlichen Kind um einen festen Prozentsatz ändert nung "proportional hazard" erinnert an die Eigenschaft, daß nur von den beiden Kovari.atenkonfigurationen, und zwar unabhängig von der Dauer der Arbeitslosigkeit bzw. Ehe. Baseline-Funktion läßt sich damit als Hazardfunktion zu den rate, Kovariatenausprägungen x =o,x2=o, 1 nächsten Augenblick ein wie man anhand von Gleichung (55) rung liegt der Wunsch zugrunde, schätzen (und testen) jeder zusätzlichen DM Haushaltseinkonunen um einen festen Prozentsatz ändert, zifischen Hazardfunktionen zueinander proportional sind. Die ,x =O interpretieren, n erkennt. Dieser Modellie­ • (vermutlich verringert) nicht aber der daß also alle individual-spe­ • (in diesem Fall vermutlich erhöht) • Kovariateneinflüsse B1, . • . ,ß zu können, "Chance" also dingung, n oder "Risiko" (näherungsweise) steht hier synonym für die Hazard­ die Wahrseheinlichkeit, daß im Zustandswechsel eintritt unter der Be­ daß bis zu diesem Zeitpunkt kein Wechsel stattgefun­ den hat. Einschränkend ist das Cox-Modell also nur in der Lage, suchte Population rauß also in bezug auf das Verlaufsmuster der Baseline-Hazardfunktion homogen sein. ser Homogenitätsannahme Eine Lockerung die­ subgruppenspezifische Baseline-Ha­ eine für bestimmte Art des Kovariateneinflusses Richtung und Größe dieses Einflusses zu bestimmen. das Modell insbesondere dann, Nicht zielführend ist wenn dieser Einfluß nicht eini­ zardfunktionen bei subgruppenunabhängigem Kovariateneinfluß - germaßen monoton ist. werden wir später beim geschichteten Cox-Modell untersuchen. etwa bei Ehen mit sehr wenigen und sehr vielen Kindern rela- Ist das tatsächliche Scheidungsrisiko - 98 tiv gering, - 99 bei einer mittleren Kinderzahl aber relativ groß, - die Rate bei einer Erhöhung von x um eine Einheit unter Kon­ i stanz der übrigen Variablen um 14 % sinken wird. a -Werte i größer als eins signalisieren dagegen positive Effekte auf die Rate (zu einer a usführlichen Interpretation der Effekte später im Rahmen des geschichteten Modells, welches ja eine Modifikation für den Fall der Verletzung der Proportionali­ tätsannahme darstellt, einen graphischen Test kennenlernen. siehe auch die Zusammenstellung in Abschnitt wenn eine qualitative Variable mehr als 5.1.1 ). 2 Ausprägungen hat, bleibt nichts anderes übrig, als wieder eine Basiskategorie zu wählen, für jede der anderen (Vergleichs-) Kategorien aber Die J?..o:rlinearität des Einflusses hat die angenehme Eigen­ eine künstliche "Dummy-Variable" schaft, dann den Wert 1 erhält, daß die individual-spezifische Hazardfunktion nicht negativ werden kann (was bei einer linearen Modellierung nicht ausgeschlossen ist). diese Kategorie fällt. Sie erfordert allerdings zumin­ einzuführen, welche genau wenn das betreffende Individuum in Andernfalls wird der Wert Null zugeschrie­ ben. Hat die Variable "Sozialrechtliche Stellung" etwa die dest ein Intervallskalenniveau der Kovariaten mit mehr als Ausprägungen Arbeiter, Angestellter und Selbständiger, und zwei Ausprägungen. Die Aufnahme von qualitativen Kovariaten wählen wir "Arbeiter" als Basiskategorie, ist dann möglich und "Dummy-Variable" sinnvoll, wenn es sich um dichotome Variablen handelt. In diesem Fall ist es zweckmäßig, eine x und dann sind zwei einzuführen, wobei ein Arbeiter Ang. die Dummy-Werte (0,0), ein Angestellter (1,0) und ein Selb­ der beiden Ausprägungen als Basiskategorie zu wählen und mit ständiger (0,1) erhält. O zu codieren und die andere als Vergleichskategorie mit wie oben relativ zur Basiskategorie interpretiert werden: zu codieren. Wird z.B. die Variable Geschlecht mit O=männlich, 1=weiblich codiert, ß Ang Die geschätzten ß-Werte können aber bestimmt das Risiko eines Angestellten relativ zum Ar­ dann entspricht die Baseline-Hazardfunkß 0 tion wegen r(t,O) ( t).e 1 =r (t). (t) genau der Hazard0 rate für Männer, während das "Risiko" (die Hazardrate) für 8 1 1 Frauen wegen r(t,1)/r(t,O) (t).e 1 ;r (t) =a um 100 mal 1 0 8 (1-e 1) Prozent größer (bei negativem Vorzeichen kleiner) ist beiter und ßs das Risiko eines Selbständigen wiederum rela­ als für Männer. Konstruktion der Dummy-Variablen erfordert nicht nur Bei kleinen Werten für a tbis etwa ß =0,1) 1 1 ist diese Prozentzahl nicht sehr verschieden von 100.ß , man 1 kann sich dann die obige Umrechnung ersparen. Wenn im fol­ genden von den ß-Parametern im Exponenten die Rede ist, sprechen wir auch von B-Effekten. Die "Multiplikatoren" bezeichnen wir dagegen als a-Effekte. formieren die a-Effekte darüber, so Allgemein in­ daß bei einer Veränderung der unabhängigen Variable x um eine Einheit 1 sich die i Rate um 100(1-a ) Prozent verändert. Ein a -Wert kleiner als i i eins, z.B. 0,86 besagt also, daß der Effekt negativ ist und tiv zum Arbeiterrisiko. Die Aufnahme von qualitativen Variablen mit vielen Ausprägun­ gen bringt eine Reihe von technischen Problemen mit sich. Die einen mit der Anzahl der Kategorien steigenden Recodierungsaufwand, sondern senkt auch die Zahl der Freiheitsgrade. rufssystematik mit 2000 Berufen 1999 ieren Aus einer Be­ Dummy-Variablen konstru­ zu· 'Wollen, ist wohl kaum zielführend. Durch eine gleich­ zeitige Aufblähung der Parameterzahl wird die Auswertung der geschätzten Ergebnisse schwieriger und ihre Aussagekraft ge­ ringer .Auch die Proportionalitätsannahme, die dem Modell zu- 100 - - grundeliegt, wird, wenn schon nicht weniger plausibel, so, 101 - ein Teil der (vollen) Likelihoodfunktion aller Beobachtungen doch schwieriger nachzuprüfen sein. Sofern mit dem Untersu­ ist - daher die jetzt gebräuchliche Bezeichnung "Partial chungsziel vereinbar, kelihood" - und daß sich die aus der Maximierung von ist eine weitgehende Aggregation der qualitativen Merkmale zu empfehlen. Li­ L(ß) er­ gebenden Schätzer vergleichbare asymptotische Eigenschaften wie Maximuro-Likelihood-Schätzer haben, 4. 2. also asymptotisch nor­ roalverteilt sind mit einer Varianz-Kovarianz-Matrix, welche durch die negative Inverse der Matrix der zweiten Ableitun­ Dieser Methode zur Schätzung der ß-Parameter liegt ursprüng- gen von 1 ich folgende Idee zugrunde: nen nicht nur die Parameter, punkt t ein Todesfall Individuen, in der Risikomenge M(t) welche zum sind) eintritt, Wenn zu einem bestimmten Zeit­ (das sind alle Zeitpunkt t noch dem Risiko ausgesetzt dann ist die bedingte Wahrscheinlichkeit, daß lnL(ß) konsistent geschätzt werden kann. Damit kön­ sondern auch deren (asympto­ tische) Standardfehler berechnet und Signifikanztests durch­ geführt werden. Für nähere Details verweisen wir auf die wei- terführende Literatur (KALBFLEISCH und PRENTICE 1980)· dieser Todesfall gerade ein bestimmtes Individuum iEM(t) trifft, Die Maximierung nur eines Teils der vollen gerade Likelihoodfunktion bedingt natürlich einen gewissen Effizienzverlust (56) E r(t,x(i)) r(t,x(j)) ß x(i) / e ' jEM(t) E jEM(t) Standardfehler der Schätzwerte wächst) , ß x(j) e ' tisch relevanten Fällen nicht sehr groß ist. Da die partielle Likelihood trotzdem noch eine verhältnismäßig komplizierte Gestalt hat (insbesondere nicht-linear ist), wobei x(i) die Kovariatenausprägungen des Individuums i ent­ hält. (d.h. der welcher aber in prak­ Durch die Proportionalitätseigenschaft kann bei der benötigt man zur Berechnung der Schätzwerte iterative Lösungsverfahren, welche eine von Hand- oder Taschenrechnerberechnung selbst bei ein­ obigen Quotientenbildung die nicht-spezifizierte Baseline­ fachsten Modellen praktisch ausschließen. Funktion r tl stimmung der ß anschließende Schätzung der Baseline-Hazard­ i funktion gibt es mehrere Möglichkeiten, welche in der Regel J gekürzt werden. cox• Idee (COX 1972, 1975) bestand darin, analog zur Maximum-Likelihood-Methode das Pro­ Für die an die Be­ dukt dieser bedingten Wahrscheinlichkeiten über alle Todes­ Modifikationen von nicht-parametrischen Schätzern sind (d.h. zeitpunkte t , 1 die Kovariateneinflüsse werden berücksichtigt). Für den Fall, • • • , zu bilden und dieses Produkt daß alle geschätzten ß-Koeffizienten Null sind, ist z.B. der (57) L(ß) k IT i= 1 ß ' x(il e ; in BMDP verwendete Schätzer mit der Product-Limit-M ethode o: identisch. ji::M welches er ursprünglich "Conditional Likelihood" nannte, eine Likelihoodfunktion zu behandeln wie (im Falle von Bindungen, also mehreren Todesfällen zu einem Zeitpunkt, ist L(ß) zu mo­ Die Berücksichtigung von lich, zeitabhängigen Kovariaten ist mög­ erfordert aber eine erhöhte Aufmerksamkeit. Wenn eine solche Zeitabhängigkeit vorbestimmt ist oder zumindest vorn difizieren). Obwohl sich diese Begründung als nicht richtig untersuchten Prozeß nicht beeinflußt wird, herausgestellt hat, sonderen Probleme - außer möglicherweise einem erhöhten Re- konnte später gezeigt werden, daß L(ß) gibt es keine be­ - 102 - - 103 - codierungsaufwand und längerer Rechenzeit. Beispiele für die­ sen Typ von zeitabhängigen Kovariaten (nach der Klassifika­ tion von KALBFLEISCH und PRENTICE (1980) ten") "externe Kovaria­ sind z.B. bei der Untersuchung von Arbeitslosigkeit das Alter (vorbestimmt), die wöchentliche oder monatliche Unterstützungsleistung (durch Gesetz in Abhängigkeit von der Arbeitslosigkeitsdauer vorbestimmt) beitsmarktindikator, oder ein geeigneter Ar­ welcher von der Wiederbeschäftigung eines bestimmten Arbeitslosen praktisch nicht beeinflußt wird, flußt. wohl aber dessen Wiedereingliederungschancen beein­ hingegen aber die Annahme identischer Kovariateneinflüsse für alle Schichten, bietet sich folgende Modifikation an: (58) ( r j) (t,x) (j) (t) .e11 'x ) wobei j ein Schichtindex, r (j (t) die nicht-spezifizierte 0 ( Baseline-Hazardfunktion in Schicht j und r j) (t,x) die indi­ vidual-spezifische Hazardfunktion in Schicht sogar reduziert wird. portionalität geschichtet wird, Zeitabhängige Kovariate können aber auch das Ergebnis eines der von den untersuchten Individuen generiert und nur solange beobachtet wird, als das viduum am ten") . "Leben" betreffende Indi­ und nicht zensiert ist ("interne Kovaria­ Bei�pielsweise wäre vorstellbar, daß eine Ehe vor ei­ ner eventuellen Scheidung mehrere Zustände durchläuft, und daß ein geeigneter Ehezustandsindikator als Kovariate zur Er­ klärung des Scheidungsrisikos beitragen kann. Da in diesem Fall zweifellos eine wechselseitige Beziehung zwischen der Bei der che innerhalb der jeweiligen Schichten durchzuführen, der Rechenaufwand i.a . Prozesses sein, ist. j Bestimmung der partiellen Likelihood sind dabei nur Verglei­ wodurch Falls trotz Pro­ ist allerdings mit einem Ef­ fizienzverlust zu rechnen, dieser ist aber in der Regel nicht übermäßig groß (siehe etwa KALBFLEISCH und PRENTICE 1980). Die Berücksichtigung von Schichten erlaubt einen einfachen graphischen Check der Proportionalitätsannahme. vermutet, Wird etwa daß die Baseline-Hazardfunktionen für Männer und sind, Frauen disproportional unterschiedlich wir das Geschlecht benutzen als Schichtungskriterium und schätzen im geschichteten Modell die Parameter ß. der übrigen Kovaria- Entwicklung des Ehezustands und dem untersuchten Eheauflä­ ten und die beiden schichtspezifischen Baseline-Uberlebens- unumgänglich. KALBFLEISCH und PRENTICE (1980) nahme zutrifft,also r sungsprozeß besteht, ist eine Modellierung dieser Beziehung schläge für eine vergleichbare Situation; machen Vor­ die statistische Inferenz bei internen Kovariaten ist aber noch recht unzu­ reichend erforscht. funktionen (vgl. Wenn die Annahme einer allgemeinen Baseline-Hazardfunktion (wohl aber innerhalb abgegrenzter "Schichten" P, und G 2\t) . Wenn die Proportionalitätsan­ � 2(t)=c.r J 1\t) mit der Proportionali­ dann gilt für die Baseline-Uberlebens­ Formel (13) in Abschnitt . .3 ): 2 2 ( ) G 2 (t) 0 und nach einer log-minus-log-Transformation: Proportionalitätsannahme Subgruppen, welche hier GJ1tt) tätskonstanten c>O, (59) 4.3. nicht gerechtfertigt ist funktionen 1. oder "Strata" heißen) , (60) ln -ln [ 12 h1 ] = ln c + ln ( -ln (1) (t) J - 1 05 - - 104 - Das Minus zwischen den beiden logs ist notwendig, da G(t) nur Werte zwischen O und 1 annimmt, ln G(t) daher negativ ist Der Verletzung der Proportionalitätsannahme und vor einer weiteren log-Transformation erst ins Positive transformiert werden muß. Wenn man die Frauen gegen die Zeit aufträgt, ler Verlauf der beiden Kurven ist ein einigermaßen paralle­ (Distanz: H1 so transformier- ten geschätzten Baseline-überlebensfunktionen für Männer bzw. ln c) ein Indikator dafür, daß die Proportionalitätsannahme zutrifft. entspricht die Alternativhypothese : ß 2 f 0 Diese können unter Benützung der asymptotischen Normalver­ teilung von ß 2 leicht getestet werden, wie im folgenden Ab­ schnitt gezeigt wird. Diese Mög­ lichkeit ist in BMDP vorgesehen und sollte in explorativen 4.4. Studien bereits bei der Überlegung, welche Kovariaten ins Modell aufgenommen werden sollen, genützt werden. Aus den asymptotischen Eigenschaften der mit der Partial-Li­ kelihood-Methode berechneten Schätzwerte lassen sich über den Umweg mit konstruierten zeitabhängigen Kovariaten sind sogar Signifikanztests möglich; nativen spezifiziert werden. etwa sein, dabei müssen aber Alter­ Eine solche Alternative könnte tests für einzelne Parameter ableiten. Wird z.B. die Null­ hypothese: daß der Quotient der Baseline-Hazardfunktionen von Männern und Frauen nicht konstant, zumin­ dest für nicht zu kleine Stichproben einfache Signifikanz­ o (Kovariate Nr.i hat keinen sondern proportional zu Einfluß) einer Potenz der Verweildauer ist, Bezeichnen wir das Geschlecht mit x , eine neue zeitabhängige Kovariate x •ln t (t=Zeit) 1 1 mit und die anderen Kovariaten mit x , ... ,x , 3 n und schätgetestet, d �nn ist ß /a (wobei a der geschätzte Standard­ i i i fehler von ß ist) t-verteilt. Be einem Signifikanzniveau von i 95 % ist der kritische Wert für ß /a für den beidseitigen i i Test bei größeren Stichproben 1.96, bei einem Signifikanzni­ zen wir das Modell: � (61 ) r(t,x) so erhalten wir bei der x -codierung männlich=O, 1 weiblich=1 die folgenden schichtenspezifischen Hazard-Funktionen: Männer: r(t,x) Frauen: r(t,x) veau von 99 % sind dies 2,58. Als Faustregel geht man häufig davon aus, daß jeder geschätzte Parameter betragsmäßig zumin­ dest doppelt so groß sein sollte wie sein Standardfehler. 8 ß l t (t)e 1e 2 n =r 0 ß x3+ e 3 • • • +ßnxn Dieser Test bietet allerdings nur einen sehr groben überblick, da er immer nur die Signifikanz eines einzigen Parameters be­ ß (t)e 1 Wir erhalten darnit die gewünschte Alternative. u rteilt. Der Propor­ tionalitätsannahme entspricht die Nullhypothese einzeln Wenn der '.liest für mehrere für sich genommen Parameter die Annahme der jeweils Nullhypo­ these zuläßt, ist der Schluß, daß diese Parameter auch ge­ meinsam keinen Einfluß haben, nicht gerechtfertigt. - 106 - - Für den Fall, daß der simultane Einfluß einer Gruppe von Ko­ variaten getestet werden soll, schlägt LAWLESS Möglichkeiten vor: (1) (1982) drei I(ß) die negativ genommene Matrix der zwei­ ten Ableitungen der logarithmierten Partial-Likelihood­ Funktion ist (WALD). Der Test auf der Basis der varianz­ Kovarianzmatrix ist eine Verallgemeinerung des Tests auf Signifikanz eines einzelnen Einflusses. (2) Tests auf der Grundlage von Likelihood-Ratio-Statistiken (vgl. Abschnitt Als Spezialfall kann natürlich getestet werden, 5.1 .3 ) mit x2 2[1n L(B) In L(B*J], wobei L(ß) die maximale Partial-Likelihood im vollen Mo­ dell ist, L(B*) die maximale geschränkten Modell, Partial-Likelihood im ein­ welches man durch Weglassen der testenden Kovariaten erhält (LRATIO). zu daß alle B-Koeffizienten Null sind. dem Score-Test entsprechende globale und mit der (3) Tests, welche auf den "Score-Vektoren" U(ß)=(<l ln L(BJ/aß l i basieren. In großen Stichproben können diese Scores eben­ falls als normalverteilt mit Erwartungswert 0 und Varianz­ Kovarianzmatrix I(ß) ! betrachtet werden (SCORE). Klammer angeführten Stichwörter sind die in BMDP verwendeten Bezeichnungen. Die Eigenschaften dieser Tests bei der Anwen­ dung in der Survival-Analyse sind zwar noch recht wenig er­ forscht, der Vergleich der Teststatistiken mit der x2-vertei­ lung (Freiheitsgrade=Anzahl der zu testenden Parameter) dürf­ te im allgemeinen aber gerechtfertigt sein. wenn dieser Test - was in der Regel kann daraus aller­ (Goodness dings noch keineswegs auf die Güte der Anpassung achtete of fit) geschlossen werden, da ja noch nichtbeob He­ verletzt sein terogenität vorliegen oder eine Modellannahme KALBFLEISCH kann. Für die Beurteilung der Anpassung schlagen und PRENTICE (1980) einen einfachen graphischen Check vor. Für das Individuum Nr.i mit Ankunftszeit t1 definieren wir das "Residumn" e i folgendermaßen: 'x(i) r (c)dt wobei R (t) die kumulierte Baseline-Hazardfunktion 0 0 wenn wir wir, für die Residuen erhalten ist. Schätzwerte � i Werte en geschätzt l in die obige Gleichung die im Cox-Model t · gungen x(i) ein­ für R (t ) und ß sowie die Kovariatenausprä i 0 sfunktionen Uberleben setzen. Für die individual-spezifischen (13) in AbG(t.,x(i))gilt folgende Beziehung (siehe Formel i Alle drei Möglichkeiten sind in BMDP vorgesehen, die oben in berechnet wohl zu erwarten ist - positiv ausfällt, die Idee, daß sich bei Hinzunahme nicht signifikanter Einflüsse der maximale Wert der Partial-Likelihood­ also die Nullhypothese, In BMDP wird dazu eine Ko­ x2-verteilung (Freiheitsgrade�Anzahl aller variaten) verglichen. Dahinter steckt Funktion nur unwesentlich erhöhen sollte. ob die durch die Kovariaten beschriebene Heterogenität überhaupt einen Ein­ fluß auf die Uberlebensverteilung hat, ß wird als normalverteilt betrachtet mit Erwartungswert ß und varianz-Kov�rianzmatrix I(B) 1 , wobei die "Informa­ tionsmatrix" 107 - schnitt .2.3.): 2 (63) G(t 1x(i)) = e i exp(ß 'x (i)) = e Betrachtet man die e als transformierte Zeiten i folgt: , so - Die t * - 108 - sind also exponentialverteilt mit konstanter Hazard- i rate 1. Dies müßte die Gültigkeit der Modellannahmen voraus­ gesetzt - auch für die geschätzten Die Gültigkeit gelten. der Modellannahme und damit auch die Güte der Anpassung kann also dadurch überprüft werden, daß man untersucht, ob die tatsächlich aus einer Exponentialverteilung mit der Hazard­ rate 1 stammen. werden nach erfolgter Schätzung des Cox-Mowobei exakten berechnet, dells die Residuen Zeiten exakte Residuen, zensierten Zeiten zensierte Residuen entsprechen. Zu diesen Residuen aufgefaßt nunmehr als neu definierte "Zeiten" t � l. kann jetzt mit einer der im vorigen Kapitel be- schriebenen nicht-parametrischen Methoden die dazugehörige kumulative Hazardrate geschätzt werden. * 1. Ein Plot, t;n Methoden geschätz gen die "Zeit" t in dem diese - mit nicht-parametrischen - kumulierten Hazardraten der Residuen ge­ d.h. , gegen die aus dem Cox-Modell ge­ schätzten Residuen selbst aufgetragen werden, muß bei zu­ treffenden Modellannahmen eine Gerade mit dem Anstieg 1 er­ geben. Weicht die Darstellung deutlich davon ab, das ein sicheres Zeichen dafür, sind. dann ist daß Modellannahmen verletzt In BMDP ist dieser graphische Check verfügbar. ner Variablen behilflich sein, Modell aufzunehmen sind. welche letztendlich in das Zu diesem Zweck sind zwei unter­ schiedliche Arten schrittweisen Vorgehens gebräuchlich thode welche der Kovariaten als nächste in das Modell auf­ zunehmen ist bzw. ELANDT-JOHNSON ("Step-Up") und JOHNSON 1980). (siehe Bei der ersten Me­ geht man von einem Modell ohne Kovariaten - in späteren Schritten - aus dem Modell Ausscheiden auszuscheiden ist. Dazu sind für Aufnahme bzw. Grenzwerte für die Irrtumswahrscheinlichkeit festzulegen. Unter allen Aufnahmekandidaten wird die Kovariate mit der günstigsten Statistik (=kleinster p-Wert) für die Aufnahme unter allen Ausscheidungskandidaten analog dazu die Kovariate mit der ungünstigsten Statistik Wert) setzt, (=größter p­ ausgeschieden. Diese Prozedur wird so lange fortge­ bis es keine Aufnahme- und Ausscheidungskandidaten mehr gibt, bis also bei allen Kovariaten im Modell der p-Wert kleiner als die vorgegebene p-Grenze für das Ausscheiden und bei allen nicht aufgenommenen Kovariaten der p-Wert größer als die vorgegebene Grenze für die Aufnahme ist. ("Step-Down") Bei der geht man spiegelbildlich dazu von einem Modell mit allen Kovariaten aus und reduziert bzw. erweitert analog. Step-Up- und Step-Down-Ergebnis müssen nicht identisch sein, außerdem kann die Verwendung einer anderen Teststatistik auch ein anderes Ergebnis bringen, ebenso die Wahl unterschiedlicher p-Grenzen. Stepwise Re­ gression ist lediglich eine Hilfe bei der Modellkonstruktion, eine fundierte Theorie über die Variation von Überlebensver­ teilungen kann sie gewiß nicht ersetzen. modifizierbare Step-Up-Verfahren statistiken) verfügbar. In BMDP sind zwei (mit unterschiedlichen Test­ Mit zunehmender Anzahl von Kovaria­ ten-Kandidaten kann der Rechenaufwand allerdings recht groß werden. Die oben beschriebenen Tests können auch bei der Auswahl je­ etwa Tests, zweiten Methode Gemäß der Überlebensfunktion G(t ) erwarten wir für die Hai zardrate einen Wert von eins uhd für die kumulierte Hazard­ * rate eine Gerade mit dem in Abhängigkeit von der "Zeit" t Anstieg aus und entscheidet schrittweise aufgrund eines geeigneten ausgewählt, Zu diesem Zweck 109 - Stepwise-Regression sollte deshalb nur mit entspre­ chender Sorgfalt durchgeführt werden. 110 - 4.5. - 111 Anwendungsbeispiel Arbeitslosigkeit mit dem Programm BMDP muß, ist aber die Proportionalitätsannahme mit zu entscheiden, Die Dauer der Arbeitslosigkeit oder Chance, spiegelbildlich wieder eine Beschäftigung zu finden, los von vielen Bestimmungsgründen beeinflußt. die wird zweifelIndividuelle zu testen und da­ ob die einzelnen Variablen als Kovaria­ ten oder als Schichtungsmerkmale in das Modell aufzunehmen sind. Zu diesem Zweck wird abwechselnd eine der Variablen als Schichtungsmerkmal aufgefaßt (wobei Alter und die Höhe Charakteristika wie Alter, Geschlecht, der letzte der Arbeitslosenunterstützung geeignet gruppiert werden) , ausgeübte Beruf, die Höhe der bezogenen Arbeitslosenunterstüt­ die restlichen Variablen als Kovariaten.Das resultierende zung werden eine Rolle spielen, ren wie die Arbeitslosenquote, Ausbildung, - ebenso Arbeitsmarktindikato­ das Verhältnis Arbeitssuchende zu offenen Stellen oder Regionalindikatoren. solcher Stehen sehr viele zusätzlicher Informationen zur Verfügung, fiehlt es sich, stimmen, dann emp­ geschichtete Cox-Modell wird geschätzt, durch Vergleich der schichtspezifischen log-minus-log-Über­ lebensfunktionen. in einer ersten Phase jene Variablen zu be­ welche letztlich in das Regressionsmodell aufgenom­ Wir demonstrieren diese Vorgangsweise am Beispiel des Alters, men werden. Dabei sind die nicht-parametrischen Verfahren von welches in Gruppen bis Kapitel 3 sicher von Nutzen. Jahre rauf zu achten, Bei der Auswahl ist auch da­ daß hoch korrelierende unabhängige Variablen nicht gemeinsam in das Modell aufgenonunen werden. Wenn die variablen Beruf z.B. (mit den Ausprägungen Produktionsberuf/ Dienstleistungsberuf) stellter) und soziale Stellung (Arbeiter/Ange­ im Extremfall in der Stichprobe so verteilt sind, daß es nur Arbeiter in Produktionsberufen und Angestellte in Dienstleistungsberufen gibt, Aussicht, dann besteht natürlich keine ist es aber durchaus zweckmäßig, mehrere Modellvarianten zu terschiedlich sein kann. ten Arbeitslosendaten entfällt allerdings diese Phase, Stellung, 10 Jahren haben, ist bei Gültigkeit warten, daß die log-minus-log-Darstellung der Gruppen-Über­ lebensfunktionen: a) parallel verlaufen b) monoton angeordnet sind, d.h. Altersgruppe ist die unterste, die Kurve für die jüngste die Kurve für die zweit­ jüngste Altersgruppe ist die nächste usw., von oben nach unten, c) der Abstand aber in derselben oder umgekehrt Reihenfolge, zwischen der untersten und der nächsten Kurve gleich groß ist wie zwischen dieser und der übernächsten Kurve usw. Im vorliegenden Fall der .bereits im letzten Kapitel benütz­ jeder der vier verfügbaren Kovariaten Alter, 26-35,36-45,46-55 und über 55 Da die Gruppenmittelpunkte etwa der Proportionalitätsannahme in bezug auf das Alter zu er­ Bei hoch korrelierenden Variablen schätzen, d a die Erklärungskraft solcher Variablen sehr un­ 25, zusammengefaßt wird. konstante Abstände von sowohl einen Berufs- als auch einen Sozialstellungs­ effekt schätzen zu können. von und der Test auf Proportionalität erfolgt - wie oben beschrieben - graphisch da soziale Geschlecht und Höhe der Arbeitslosenunterstützung ein Einfluß auf die Dauer der Arbeitslosigkeit erwartet wer­ den kann. Da die Wirkung nicht zwangsläufig proportional sein Der entsprechende BMDP-Runstream sieht folgendermaßen aus: - 113 - - 112 - Runbeispiel BMDP Im Vergleich zu den früher angeführten BMDP-Runstrearns (Programm P2L) gibt es folgende Neuerungen: /PROBLEM TITLE IS /INPUT VARIABLES ARE 11. CUTPOINTS, welche die Gruppengrenzen definieren, FORMAT IS '(3F2.0,1x,3F2.0,1x,F2.0,1x,F1.0,1x, ben. Bei qualitativen Variablen - Geschlecht, Kategorie - F1.0,1x,F8.0) '. würden wir wieder wie in 3.4. /VARIABLES 'PROPORTIONALITAETSTEST'. NAMES ARE ENTDAY,ENTMONTH,ENTYEAR,TERDAY, TERMONTH,TERYEAR,STATE,AGE,CAT,SEX,PAY. /FORM a) Im c) Die Steuerung für den graphischen Output erfolgt nicht STATUS IS STATE. wie im Programm P1L (nicht-parametrische Verfahren) RESPONSE IS 1 ESTIMATE-Paragraph, • CUTPOINTS (8) NAMES (8) ARE im sondern in einem eigenen PLOT-Para­ graph. ARE 25.0,35.0,45.0,55.0. '-25','26-35','36.-45','46-55','5 6-'. Bei der Exekution des Runstreams werden die Parameter der Kovariaten Geschlecht, Soziale Stellung, Arbeitslosenunter­ /REGRESSION COVARIATES ARE CAT,SEX,PAY. /PLOT CODES-Statements verwenden. men der Kovariaten und des Schichtmerkmals an. UNIT IS DAY. /GROUP angege­ b) Der REGRESSION-Paragraph ist völlig neu und gibt die Na­ ENTRY IS ENTMONTH,ENTDAY,ENTYEAR. TERMINATION IS TERMONTH,TERDAY,TERYEAR. GROUP-Paragraph wird die Gruppenzusammenfassung durch STRATA IS AGE. stützung und die um diese Effekte bereinigten altersgruppen­ TYPE IS LOG. spezifischen Uberlebensfunktionen berechnet. In der gegen­ wärtigen Phase interessieren uns nur die letzteren. /END Ihr Ver­ 180279 220379 28 5276. lauf nach der log-minus-log-Transformation ist in Abbildung 200279 010379 24 4657. dargestellt. Dabei wurden für jede der drei Kovariaten deren 270279 310879 0 55 0 0 5012. Mittelwert in der gesamten Stichprobe eingesetzt. Die jüng­ Daten ste Altersgruppe ist mit A dargestellt, die 35-jährigen mit B usw., die Bei einer Geschlechts-Codierung O=weiblich, 1=männlich und einer Sozialstellungs-Codierung O=Arbeiter, 1=Angestellter entspricht der erste Fall 12 einem männlichen, 28-jährigen Gruppe der 26- Gruppe der über 55-jährigen mit E. Etwa während des ersten Monats gibt es einige Irregilari­ täten und Uberschneidungen, welche nicht unbedingt den Pro­ portionalitätsbedingungen entsprechen. Von der E-Gruppe ab­ Angestellten, welcher am 18.2.1979 arbeitslos wurde (die so­ gesehen, sind die ziale Stellung bezieht sich auf die letzte Tätigkeit vor der füllt: Arbeitslosigkeit), eine Arbeitslosenunterstützung von gleichsweise höheren Chance für junge Arbeitslose entspricht, öS 5.276,- bezog und am 22.3.1979 wieder eine Beschäftigung wieder beschäftigt zu werden) , darunter liegt die Kurve der fand. B-Gruppe usw. Die einigermaßen konstante Differenz je Bedingungen nachher aber recht gut er­ die oberste Kurve gehört zur A-Gruppe (was einer ver­ zwischen zwei benachbarten Kurven entspricht der für zehn zusätz­ liche Altersjahre geminderten Chance, wieder eine Anstellung zu finden. - 2 114 - 115 - .+ • . . . T . • • • t . . , .t . . , .+. .+ + , .. t... ·*· aber nicht mehr lo:r--linear mit dem Alter verbunden ist, ... T • MAMA AAAA.AJ.A eaaA"'CC BBBeBBBCBB"'CCC MAAA BBBBa CCCCCC EEEE AAAMAM ß6Sat\ßS8ßBBaS CC:CCCCDD""'•""""lll""u CC"'"'""U[,ED""'EE B8BßB8ii AAAA einer Alters-Dummy-Variablen - -5 -6 dem Wert 1 (mit dem Wert O für die für die über 55-jährigen) abschätzen. bis Durch diese Vorgangsweise werden auch Verzerrungen bei der Parame­ terschätzung vermieden. Auf analoge Weise wird die Proportionalitätsannahme bei den anderen drei Variablen überprüft. EEC"""' EC"'B E11"8 -2 -4 HE(•"""'**..,."HPODDPOOO P'"O E"'"''D • .„ E"BI> 1 -3 55-, MA Bß8 EEE""'.,."'CCCC OOOOOODOOD AA "'""E"'u ....ccc IIDilOOOfl AB„"'CCCC ODOOOOODIJD AAß><tC 0000 AB-""0000 AA"'""D 0 läßt sich der Kompensationseffekt durch zusätzliches Einführen AAAAAAA.A AAA ßaeaBaeBS - Bei den vorliegenden Daten zeigen die entsprechenden Kurven immer den erwarteten paral­ "ß .„ lelen Verlauf. Lediglich beim Geschlecht gibt es Überschnei­ . C"B . "E"' dungen, ... . '""B ' .C" ·"'"'6 +i"'B nalitätsannahme t "f" allerdings liegen hier die Kurven für Männer bzw • Frauen so dicht beisammen, daß man auch hier die Proportio­ (hier eher: Identitätsannahme) gelten las­ sen kann • . '"8 .•s +'B .•a . '8 ... Das endgültige Modell ist also ungeschichtet und hat folgende Form: . + „ . . + . • . . + . • • • .+., 0 35 .t .. 70 . +.. ...... ... + 105 . . • + . • • • +. . . . + 140 k . . . + . . . .+ . . • . i 175 210 245 280 t ..., J:l u Abbildung 1 2 : Beispiel Arbeitslosigkeit. test k Proportionalitäts­ " ..., nach dem Alter ';;! " ,..., .c: u "' <V <.!J <ll <: " <tln .„ ..... N <ll 0 .µ .... ''"" ' tl'> i:: Q <lJ" :tl N 0..., ;,...;:::i " "'..., 'Ö .µ III .„ k " "" .C:..O+l lil ;.i § " .0 :>.. :::; h<lJ 'Ö .0 k III .c: kk <tl " "'"' ..., ..., .-; <: U1 ..: ::lll1 Lediglich die Altersgruppe der über 55-jährigen tanzt aus der Reihe. Ihre log-minus-log-überlebensfunktion liegt nicht unterhalb der D-Kurve (wo sie bei Angemessenheit des Proportionalitätsmodells eigentlich liegen müßte),sondern zwischen den anderen Kurven. Einflüsse, Offensichtlich gibt es hier welche den ungünstigen Alterseffekt zumindest teilweise kompensieren. über die Ursachen dieser Kompensa­ tion können wir ohne weitere Informationen keine Aussagen machen, wohl aber über deren Ausmaß. Da auch in dieser Al­ tersgruppe die Hazardrate noch einigermaßen proportional, Abbildung 13: Kovariateneffekte auf die Wiederbeschäftigungs­ chance - 1 17 - - 116 - Die Schätzergebnisse sind in Tabelle 8 enthalten. für etwa 15 Altersjahre (0,4551/0,0275�16,55) entspricht. � Dieser Effekt ist ;ignifi ant bei einer Irrtumswahrschein­ Nr. 2 3 4 5 1) Kovariate SE(ß) ß exp(ß) 1l Alter -0,0275 0,0033 -8,22 0,973 soziale 2) Stellung -0,6222 0,0753 -8 '26 o,537 0,1049 0,0693 1 '51 1 ,111 ) Geschlecht3 Arbeitslosen4) untersj:ützung 5) Altersdumroy in Jahren 2) o,1460 0,0235 6,22 1'157 o,4551 0,1921 2,37 1 ,576 O=Arbeiter, 4) 3 ) O= wei blich, 1=männlich 5) SE(ß) Tabelle 8: 186,43 1=Angestellter signifikant: bei Angestellten (Code 1) beschäftigt zu werden, nür wie bei den Arbeitern halb (Code 0). Chance, wieder so groß (exp(ß )=0,537 2 Bei einer konstanten Base- line-Hazardfunktion - was hier allerdings nicht der Fall ist - wären Angestellte damit im Durchschnitt fast doppelt so lange arbeitslos wie Arbeiter. Die österreichische Arbeits­ Möglicherweise gibt es bei unserer Stichprobe Repräsentativitätsprobleme, was auch den Umstand, daß der Einfluß des Geschlechts zwar die erwartete Richtung hat (die Wiederbeschäftigungschance (df=5) Beispiel Arbeitslosigkeit, Schätzergebnisse des Cox-Modells für Männer/Code 1 ist um 11 % gr0fte r Code Ol, aber nicht signifikant ist als die für Frauen / (p=0,132), erklären könnte. Wie nicht anders zu erwarten war, kann die durch die Kovaria­ ten ausgedrückte Heterogenität maßgeblich zur Erklärung der 2 Hazardraten-Variation beitragen: der globalen x -statistik entspricht ein p-Wert von praktisch 0. Unter der Annahme normalverteilter Schätzwerte und eines Signifikanzniveaus von 95 % sind alle Einflüsse bis auf das Geschlecht signifikant. Der Einfluß des Alters wirkt in die erwartete Richtung: mit zunehmendem Alter wird es für Arbeitslose schwieriger, wieder Auch die Höhe der Arbeitslosenunterstützung hat einen signi­ fikanten Einfluß. Je höher diese ist, desto größer ist die Wiederbeschäftigungschance (bei zusätzlichen 1.000 ÖS sie um 15 %) Der graphische Anpassungstest (kumulative Hazardfunktion der Residuen) ist einigermaßen zufriedenstellend, ledigl�ch für große Residuenwerte sind die Abweichungen von der 45 -Geraden nicht mehr zu rechtfertigen, und auch im mittleren Bereich (Residuen zwischen 2, 5 und 5) diese noch besser sein. % (=100 - 97131 Arbeitslosengruppe (über 55) ab. In der ältesten gibt es aber einen Kompensa­ tionseffekt, welcher größenordnungsmäßig einer Kompensation steigt • eine Beschäftigung zu finden, mit jedem Lebensjahr nimmt Chance um knapp 3 ist die der Unterschied beträgt aber nur etwa 20 %. in 1.000 öS p-Wert=0,0000 Der Einfluß der "Sozialen Stellung" ist beträchtlich und hoch­ marktstatistik zeigt zwar ein Gefälle in dieser Richtung auf, o für ein Alter von 5 5 Jahren oder weniger, 1=über 55 Jahre Globaler Wert von o,4551/0,1921=2,37), seine lichkeit von 5 % (ß /SE !ß l 5 5 Ursachen sind aber aus den Daten nicht ersichtlich. Wegen der Residuum des Individuums Nr.i könnte die Anpassung durchaus (definito ischen) Beziehung: : (t )exp(ß 'x(i)) entsprechen die 1 großen Residuen Individuen mit großer kumulierter Hazardrate - - 118 R (t ), also längerer Arbeitslosigkeit, und einem großen Wert 1 0 ß'x(i). Wegen der Vorzeichen der geschätzten ß-Koeffizienten, 5. 119 - Parametrische Verfahren sind das jüngere Arbeiter mit einer hohen Arbeitslosenunter­ stützung. Treffen diese Merkmale mit einer länger dauernden Zur Ermittlung der Effekte kausal unabhängiger Variablen auf Arbeitslosigkeit zusammen, dann erscheint unser Modell nicht die Übergangsrate und die Verweildauer mit parametrischen angemessen. Verfahren ist es Die Residuen im mittleren Bereich lassen sich we­ gen der Kompensationsmöglichkeiten zwischen R (t) und den Ko­ 0 variaten (bei der Berechnung der Residuen) nicht einfach lo­ kalisieren. Für kleine Residuen, also insbesondere für eine kurze Dauer der Arbeitslosigkeit, ist die Anpassung des Mo­ dells sehr gut. ,+. 10,0 + tion Im allgemeinen empfiehlt sich, mit einfachen Modellen zu beginnen, die die wünschens­ werte Eigenschaft aufweisen, daß die Rate nicht-negativ werden kann und deren Parameter gut interpretierbar . . + • • '.+ ... »t,. ' • ..-• • • t . . . . +• • . • t • . . . + . • • . + • . . . + . . '·1"· ' • • + • . + . • . . +. sind. Das log­ lineare Basismodell erfüllt die genannten drei Kriterien. t Das log-lineare Basismodell 5.1.1. • eine genaue Ratenfunk­ Welche Ratenfunktion aufgestellt wird, ist eine Frage der Hypothesenbildung. es 5.1. 7,5 zunächst erforderlich, zu spezifizieren. Das Modell und die Interpretation der Koeffizienten + Für praktische Anwendungen des Modells ist eine genaue Vor­ stellung von der Bedeutung der Koeffizienten besonders wich­ tig. In Zusammenhang mit dem Cox-Modell wurden schon einige Interpretationsmöglichkeiten erwähnt. Bei zeitunabhängigen 5,0 parametrischen Modellen kommt hinzu, daß die Koeffizienten AA ... AA A AA ... A AA A AA AA 2,5 direkt über die Stärke der Effekte auf die mittlere Verweil­ dauer Auskunft geben. Wir wollen an dieser Stelle noch ein­ mal ausführlich und übersichtlich die verschiedenen Inter­ p retationsmöglichkeiten der Koeffizienten zusammenstellen und erläutern. Wir gehen im folgenden wieder von einem o,o .• • + •• 0 1,5 Abbildung 14: 3 4,5 . .+ . • . . + . • ' .+.'. ,+ • . • • +. 6 7,5 9 10,5 12 Beispiel Arbeitslosigkeit. Graphischer An­ (kumulierte Iiazardfunktion der - senkrecht - gegen die Residuen waagrecht) Zwei-Zustands-Modell aus. Sind x ,• . •x die Kova­ mit der tlbergangsrate r=r0 m 1 1 empirisch riate (=unabhängige variablen) und B ,B ,ß2, • • • ,ß m 0 1 zu schätzende Parameter, so hat das log-lineare Modell die Form: - - 120 - Werden beide Seiten der Gleichung logarithmiert, man einen log-linearen Ausdruck. so erhält - Die u -Parameter sind Multiplikatoren, i 1, st positive Werte aufweisen ß : i für positiv, Rate die auf Effekt der variable x so i ist der Effekt negativ und für u =1 existiert kein Ef­ i fekt, wie man anhand von Gleichung (68) erkennen kann. Ein � Auf der linken Seite steht der natürliche Logarithmus der Rate, 121 auf der rechten Seite eine Linearkombination der Kovariate. wert von 1,08 signalisiert also einen positiven Einfluß der Variablen Bildung. Zur Interpretation der Koeffizienten Schreibweise von (65) ist noch eine andere zweckmäßig (CARROLL 1982). Gleichung (65) wird wie folgt umgeformt: Aus Gleichung stärke des Effekts. einer (68) folgt, daß sich bei Erhöhung der unabhängigen Variablen um eine Einheit 6x die Rate um 100. (� -1) i i 1,08 weist also daraufhin, jahr die Rate um 8 dierung 0/1 Prozent verändert. Ein Wert von daß bei einem zusätzlichen Schul­ % steigt. Bei Dummy-Variablen mit der Co­ gibt der Koeffizient an, um wieviel Prozent höher oder niedriger die Übergangsrate für die Gruppe mit der 1-Co­ dierung ist. Hierbei gilt: Verweildauer-Interpretation. Die Rate selbst ist nicht beob­ achtbar. Die Effektstärke-Interpretation ist daher eventuell Wir sprechen von a- und von ß-Koeffizienten, weniger anschaulich, die mit einer einfachen Rechenoperation ineinander überführbar sind. Die a-Koeffizienten lassen pretieren, sich inhaltlich besonders gut inter­ wie sich im folgenden zeigen wird. Schreibweise (68) Daher ist der meist der Vorzug zu geben. (0/1-Variablen) in die Gleichung eingehen. Ferner können wie in einer Regressionsgleichung auch Interaktions­ ef fekte (Zusammenwirken von zwei oder mehreren Variablen) in der Ratengleichung berücksichtigt werden. Was bedeutet es nun, wenn man z.B. für a1, etwa den a-Koeffi­ zienten der unabhängigen Variablen x =Bildung in Schuljahren, 1 einen wert von 1,08 ermittelt? Zuwachs der nicht beob­ Eine recht anschaulich erfaß­ bare Größe ist dagegen die mittlere Verweildauer im Ausgangs­ zustand. Unter der mittleren Lebenserwartung können sich die meisten Menschen etwas vorstellen. zwischen Wenn es gelingt, den a-Koeffizienten und der mittleren Verweildauer E(T) Die Kovariate x müssen quantitatives Skalenniveau aufweisen i (mindestens Intervallskala) oder aber als qualitative Dummy­ variablen da sie über den achtbaren Rate Auskunft gibt. eine Brücke zu bauen, dann kann a als Maß für die Stärke des i Effekts der variablen x auf E(T) angesehen werden. Beim Mo­ i dell mit zeitunabhängiger Rate liefert Formel (10) in Kap.2 eine solche Brücke. Die Rate entspricht ja dem reziproken Wert der Verweildauer. Gleichung (69) E(T)= (68) Gemäß der Spezifikation der Rate in folgt: (1 � 0 1 X 1 • • • - 122 - - 123 - Hieraus ergibt sich folgende Interpretation der a-Koeffizienten: Wird die unabhängige Variable um eine Einheit erhöht, [ !1/ai)-1 ] so verändert sich die mittlere Verweildauer um .100 Prozent. Ein Wert von 1,08 gibt also an, daß ein zusätzliches Jahr Bildung die erwartete Verweildauer zustand der Arbeitslosigkeit - um 7,4 % z.B. tion von ß bezüglich des Einflusses auf die Verweildauer i folgt aus der Beziehung: (70) ln E(T) im Ausgangs­ vermindert. Wie bereits in Kap.4 erwähnt, erleichtert eine einfache grobe Faustregel mitunter die Abschätzung der Effekte.Für ß-Koeffi­ zienten nahe null -Koeffizient Typ des Effekts Richtung des Effekts pos:if.:iv a.=1 kein Effekt 1 negativ Rate verändert sich um Zuwachs der Rate für lix. =1 (a> -1) .100 % i 1. Effekt auf er- erwartete Ver­ weildauer E(T) ändert sich u m -1).100% ß-Koeffizient ( 71) ß.>O oder a-Koeffizienten nahe gilt ungefähr: 1+ß. i Und für den Effekt auf die Verweildauer ist die Abschätzung 1 nach folgender Näherungsformel möglich: ß.=O l. ß.<O (72) %-Effekt auf E(T) i natürlicher Logarithmus der Rate ver­ ändert sich um ß i natürlicher Lqgarithmus der 8 % zu­ wachs 100 Bei einem ß -Wert von 0,08 kann man also sofort sagen: i fekt auf die mittlere Verweildauer ungefähr -8 %. 7,4 % Vermin­ erwarteten Ver­ derung weildauer ändert sich um -ß i Interpretation der Koeffizienten ist ungefähr 1,08, der Effekt auf die Rate somit 8 % und der Ef­ Bei Werten von ß absolut größer als 0,10 wird die Faustregel allerdings i sehr ungenau. Wie werden nun die Parameter an empirischen Daten geschätzt? Da dieRate keine beobachtbare Größe darstellt, können die Ko­ effizienten in Gleichung (65) sionsanalyse geschätzt werden. Tabelle 9: 1 auf der Basis von Gleichung nicht wie z.B. bei der Regres­ Man könnte auf die Idee kommen, (69) eine Regressionsschätzung mit der beobachteten Verweildauer als abhängiger Variable durchzu­ führen. Diese Schätzung wäre jedoch weniger gut, da wegen der Die Interpretation der ß-Koeffizienten bezüglich der Richtung zensierten Beobachtungen des Effekts folgt aus der Beziehung ß =ln Ist a z.B. i i 1,08, so hat B den Wert 0,077. Für Werte von a <1 ist ß da­ 1 i i gegen kleiner als null, d.h. der Effekt wäre negativ. Der Schätzprobleme können jedoch mit der Maximum-Likelihood-Methode Effekt auf den Zuwachs des natürlichen Logarithmus der Rate ist anhand von Gleichung (66) erkennbar, und die Interpreta- gelast werden ein starker Bias auftreten kann. Die (TUM11. 1979, TUM1I. U."ld H1\NNi'\N 1979). Dazu betrachten wir im folgenden Abschnitt zunächst den Fall qualitativer Kovariate. - 125 - - 124 - Oder ab.er man untersucht im Rahmen einer Evaluierungsstudie 5.1.2. Qualitative variablen als Kovariate den Einfluß von zwei Strafanstaltstypen stodiale Anstalt, Bei dem Spezialfall der Untersuchung des Einflusses von m di­ chotomen Variablen mit der Codierung 0/1 Variablen) formeln, (sogenannten Dummy­ auf die Übergangsrate existieren einfache Schätz­ so daß die Koeffizienten per Hand oder mittels Ta­ schenrechner ermittelt werden können. fälligkeit. x 1 (x =o ist eine ku­ 1 ist eine Reformanstalt) auf die Rück­ 1 Gemessen wird hierbei die Zeit in Monaten bis zum Rückfalldelikt. Als drittes Beispiel könnte man sich vorstel­ len, daß für zwei Gruppen von Arbeitslosen (Gruppe O hat eine Ausbildung absolviert, Gruppe 1 ist ohne Ausbildung) weildauer im die Ver­ Zustand der Arbeitslosigkeit in Monaten erhoben wird. Qualitative Variablen mit mehr als zwei Ausprägungen müssen zuvor in R-1 Dummy-Variablen umgeformt werden, wenn R die An­ Ein für alle drei Beispiele passender zahl der Ausprägungen bezeichnet könnte die folgenden Ankunftszeiten enthalten: (vgl. auch Kap.4). Der Einfachheit halber gehen wir im folgenden von einer Glei­ chung mit einer Dummy-Variablen aus. Dies entspricht dem Ver­ gleich von zwei Gruppen: Gruppe O: 1,1,1,2,2,3,4,6+,8,13 Gruppe 1: 1,2,2,3+,5+,8,12+,19,28 Ein "+" bezeichnet zensierte Zeiten. Die Zustandsvariable hat hier den Wert O, x Hat x 1 (fiktiver) Datensatz andernfalls den Wert 1. 1 Bei Gruppe o weist Unter Berücksich­ 1 tigung dieser Konventionen kann der Datensatz in einen im die Ausprägung O, so gilt für die 0-Gruppe: den Wert O, bei Gruppe den Wert 1 auf. Prinzip maschinenlesbaren Datenfile übersetzt werden, wie ihn Tabelle 10 zeigt. Betrachten wir z.B. Fall 8. Hier wurde eine Ankunftszeit von 19 bis zum Eintreten des Ereignisses gemes­ a ist allgemein immer die Rate fü r d\ie Referenzgruppe, bei 0 der alle Dummy-Variablen den Wert O a fweisen. Für x =1 wird 1 der Wert der Referenzgruppe mit a 1 h sen (Zustand=1). Ferner gehört Person 8 zur Gruppe 1 Tabelle 10 zeigt den Datenfile und das Modell. sich nun das Problem der (x =1). 1 Für uns stellt Schätzung der beiden Parameter a a (bzw. ß und ß ). 0 1 1 Nehmen wir an, in einem Experiment zur Untersuchung kultur­ spezifischer Einflüsse auf die Aggression im Straßenverkehr wurde gemessen, nach wieviel Sekunden eine Reaktion erfolgt, wenn ein Fahrzeug den Verkehr blockiert. (Hupen) Die Dummy­ variable könnte dann zwei Städte unterschiedlicher Kultur­ kreise bezeichnen (z.B. x =o ist Wien, x =1 ist Stockholm). 1 1 0 und Die Maximum-Likelihood-Methode liefert in unserem speziellen Fall einfache Schätzformeln. Funktion (26) in Kap.2.4. unsere Ratenfunktion (73). Gehen wir von der Likelihood­ aus und berücksichtigen wir dabei Das Resultat der Maximierung der Likelihood-Funktion in Bezug auf die Parameter a0 und die beiden folgenden Schätzformeln Anhang 3): a1 (siehe zur Ableitung sind - 126 - Fallnummer 2 0 4 3 8 0 3 5 2 6 12 8 19 9 1 0 0 0 10 2 11 6 0 5 0 13 0 2 1 1 14 13 15 1 16 8 17 1 12 18 3 19 28 (77) N a1 0 1 7 ** Zustand** 2 4 * Verweildauer* - 127 - 0 0 1 0 0 0 Zeit bis zum Eintreten des Ereignisses oder bis zum Ab­ bruch der Beobachtung Zustand, in dem sich die Person am Ende der Beobachtungs­ periode befindet. "O" indiziert eine zensierte Beobach­ tung, "1" einen Zustandswechsel. Aller Personen befanden sich vorher im zustand o. Da es sich bei a und a um Schätzwerte und nicht um die 1 0 "wahren" werte der Grundgesamtheit handelt, kennzeichnen wir wie in den vorhergehenden Kapiteln die Schätzungen mit dem Symbol „�„ . N ist die Zahl der Ereignisse in der 0-Gruppe, 0 v die Summe der Zeiten bei den nicht-zensierten, w die 0 0 Summe der Zeiten bei den zensierten Fällen und T0 die Summe aller Zeiten in der 0-Gruppe. 1-Gruppe. Entsprechendes gilt für die Für unser Datenbeispiel erhalten wir die Schätzwerte: ao= 9 35+6 6 = o,22 &1= 60+20 /0,22=0,3� Wegen ß =ln � folgt: B =-1,52 und B =-1,07. Der Effekt auf i i 1 0 die Rate beträgt ( � -1).100, also -66 %. M.a.w. ist die über­ 1 gangsrate in der 1-Gruppe um 66 % geringer als in der O-Gruppe. Besonders anschaulich weildauer=[(1 )-1 ] ist der :::::.��=:...::::.!:=-�:;::._-""��:::.:=,::=__-'"":.::..._ .100. Es zeigt sich, Verweildauer in der 1-Gruppe 193 % daß die mittlere höher ist als in der 0- Gruppe. Natürlich können wir die Schätzungen der gruppenspe­ zifischen Raten und mittleren Verweildauern auch direkt an­ geben. Tabelle 10: Hypothetischer Datenfile mit einer unabhängigen Dummy-Variablen x für das Zwei-Zustands-Modell 1 (78) Wie oben erwähnt, r(O) haben die Raten die Form: 0,22 0,22.0,34=0,075 - 129 - - 128 - Ferner wissen wir, daß die Raten im reziproken Verhältnis zur mittleren Verweildauer stehen: 1 -iü) , r 1 ), O r Af; (O)J also E LT G(tl 4,56 "r (11 also E LT ] ,.. 13 ,33 / Die mittlere Verweildauer ist in der Gruppe länger als in der Gruppe 0. 1 1 (z.B. Reformanstalt) also erheblich Für das Beispiel der Strafvoll­ zugsevaluierung würde dies bedeuten, Gruppe daß die Reformanstalt (z.B. "Normal­ vollzug") 0,5 einen positiven Effekt auf die mittlere Verweildauer bis zum Rück­ fall (und einen negativen Effekt auf die Rate) ausübte. Man erkennt auch, daß die Survival-Analyse wichtige Kennziffern zur Beurteilung des Effekts von Maßnahmen beisteuert. Ohne die Akzeptierung eines bestimmten Survival-Modells wäre die Schätzung der mittleren Verweildauer wegen der zensierten Be­ 0 obachtungen ja nicht möglich gewesen. 30 20 10 t Schließlich läßt sich auch die gesamte erwartete tlberlebens­ funktion G(t) für jede Gruppe berechnen Dichte f(t) ). (82) G {O)(t) (sowie F(t) und deren In unserem Fall: e e ( -t O) -t<•) .t e .t e Abbildung 15: Erwartete gruppenspezifische Uberlebensfunk­ tionen -0,22.t -0,075.t Als weiteres Problem stellt sich die inferenzstatistische der Effekte und der Berechnung von Für jeden Zeitpunkt t kann für jede Gruppe aufgrund der bei­ den Formeln der Anteil der "Uberlebenden" berechnet und gra­ phisch veranschaulicht werden (siehe Abbildung 15). sieht man eine der Stärken der Modellkonstruktion: Hier Mit Hilfe des Modells ist eine Vielzahl informativer Folgerungen ableit­ bar. Allerdings ist auch der kriti sche Punkt, die empirische Angemessenheit der Modellannahmen, im Auge zu behalten. Maximum-Likelihood-Theorie weiß auch auf diese Fragen eine Antwort Kap.3). (KALBFLEISCH und PRENTICE 1980, Es läßt sich nachweisen, daß die Parameterschätzungen asymptotisch normalverteilt sind mit dem folgenden Standard­ schätzfehler oder "Standarderror" für ß 1 (Standardabweichung - 131 130 - SE der Stichprobenverteilung (84) SE(ß1) � (86) � =vl�IC 0,53 = t;i y Bei einer Normalverteilung weiß man, daß 95 Bereich von ungefähr 2 (genau: liegen. Für ß berechnet 1 intervall: % der Fläche im 1,96) Standardabweichungen sich daher das folgende Konfidenz­ Konfidenzintervall für B 1 B ±1,96.SE (ß1) =-1,07± 1 1 ,04 ( ) ( ) wenn kein Gruppeneinfluß e istiert, also r O =r l , lautet x die Nullhypothese: ß =0. 1 zum Test der Nullhypothese kann man entweder vom Konfidenzintervall ausgehen und danach fragen, ob der Nullpunkt im Konfidenzintervall liegt. Man sieh!, daß das bei unserem Beispiel nicht der Fall ist, daß also ß einer Irrtumswahrscheinlichkeit von 5 kant ist. bei 1 % gerade noch signifi­ Äquivalent hiermit ist die zweite Vorgehensweise. Man berechnet zunächst den standardisierten z-Wert: (85) z ß 1 ,07 0,53 (i#O) (87) (i) (88) � Anhand der Schätzformel 2,02. für die Rate erkennt man, daß die (W =O) zu einer Über­ i schätzung der Rate und somit zu einer Unterschätzung der er­ Ignorierung der zensierten Beobachtungen warteten Verweildauer führt (siehe dazu auch TUMA und HANNAN 1979). Im Strafvollzugsbeispiel erhielte man eine verzerrte Schätzung der mittleren Verweildauer in der 0-Gruppe von 3,89 Monaten bzw. und in der 13,33 Monaten). 1-Gruppe von 10 Monaten (anstelle von 4,56 Auch bei der Behandlung der zensierten Beobachtungen als exakte Zeiten - eine zensierte Zeit von z.B. zehn Monaten wird wie ein Rückfall nach und die mittlere Verweildauer als bei korrekter Behandlung zensierter Zeiten. In diesem Fall ist der Zähler von (88) größer verglichen, wobei ein gerade noch signifikanter Grup­ Verweildauer von, 4,10 bzw. 8,89 Monaten. daß sich hier mehrere zensierte Beobachtungen im In der 1-Gruppe sind der Fälle zensierte Beobachtungen. für die Gleichung 1) Gruppen bzw. m Dununy-Variablen Die Schätzformeln lauten im allgemeinen Fall x1 a x2 2 a xm : m Ein weiterer Test ist der Likelihood-Ratio-Test. Die For­ mel für den Gruppenvergleich findet sich in KALBFLEISCH und PRENTICE 1980, s.53. Siehe dazu auch den folgenden Abschnitt. Das größere Ausmaß der Unterschätzung in der 1-Gruppe ist darauf zurückzuführen, (88) bemerkbar machen. Die Untersuchung von zwei Gruppen läßt sich ohne Schwierig­ verallgemeinern. Wie man leicht nachrechnen kann, ergäbe sich eine Schätzung der mittleren 1) peneinfluß erkennbar wird. keiten auf die Analyse von m+1 zehn Monaten einge­ stuft - wird die Rate überunterschätzt. Sodann wird dieser Wert mit dem kritischen za-Wert (z0 1,96) - Zähler von ja ein Drittel Wie schon erwähnt, ist bei parametrischen Verfahren der kri­ tische Punkt inuner die Akzeptierung der Modellannahmen. wohl die deduzierten Folgerungen, So­ als auch die Schätzformeln und die inferenzstatistischen Tests sind nur gültig, wenn das gewählte Modell angemessen ist. Zur Prüfung der Annahmen aber kann auf nicht-parametrische Verfahren zurückgegriffen werden. So kann die nicht-parametrische Analyse beispielsweise dar- - 132 - über Auf sc!hluß geben, - 133 ob das Modell mit zeitunabhängiger Rate eine zutreffende Beschreibung der Daten liefert. Der natür­ liche Logarithmus der nicht-parametrisch geschätzten bensfunktion müßte dann für jede Gruppe im Gerade mit negativer Steigung darstellbar sein 5. 2 ) tlberle­ a) ßreiqnisdaten Zeitdiagramm als (vgl. Zustand Abschnitt • 0 2_,_1.3. Qualitative und quantitative Kovariate: "1 .,___140 mit dem Programm RATE b) Die bisherige Auswertung der Ereignis) Berechnungen Datenfile in den Kapiteln 3 und 4 erwähn­ ten Stichprobe österreichischer Arbeitsloser hat ergeben, zial- Sex t!!'goe daß Da nach 20 Wochen aus institutionellen Gründen Strukturbrüche in den Daten erkennbar sind, 24 beschrän­ 45 ken wir uns bei der Schätzung auf die ersten 140 Tage. Wir wollen für diesen Zeitraum die Kovariateneinflüsse im Rahmen eines vollparametrischen Modells neu dabei alle Zeiten, zensiert. schätzen und betrachten welche größer als 140 sind, als am 140.Tag Abbildung 16a veranschaulicht noch einmal die Er­ eignisdaten anhand von zwei typischen Fällen, gestellter, zustand 6320 3940 0 0 * O c Arbeiter 1 = •• O i>.ngestellte = weiblich = männlich •�• (Ab­ Sozialkategorie An­ also nicht-zensierte Beobachtung, Wiederbe­ schäftigung erfolgt nach 89 Tagen. Bezogen auf den Prozeß sind alle Kovariate zeitunabhängig: so­ wohl das Lebensalter als auch die Höhe der Arbeitslosenunter­ stützung wurden zu einem bestimmten Stichtag ermittelt. bildung 16c veranschaulicht die Hypothesen. daß das Alter und die Sozialkategorie stellte 1) (Codierung für Ange­ einen negativen und das Geschlecht r = r 0a0 +s1x1+a2x2+a3x3+s4 x4 ao„°'1 X1 .(12 ''< .a3 X3 .a.4 X4 Ab­ Wir nehmen an, (Codierung für 89 140 Höhe der Arbeits­ losenunterstützwig plus sonstige Trans­ ferzahlungen in österreichischen Schillinq pro Monat Geschlecht männlich, Arbeitslosengeld 6.320 öS, Zielzustand=1, Verweildauer im zustand o {Tage) 1055 c)� Betrachten wir als Beispiel den nicht-zensierten Fall 1 Das Alter beträgt 24 Jahre, 0 Abbildung 16b informiert über den Aufbau des Datenfiles. bildung 16b): �;�) "2l die kumulative Hazardrate während der ersten Monate einiger­ maßen linear verläuft. 'Ziel- 11.rgeld (;,i Abbildung 16: Modell und Datenmuster - Männer 1) - 135 - 134 - einen positiven Einfluß auf die Rate haben. Bei der Höhe der Arbeitslosenunterstützung gehen wir von einem posi­ tiven Effekt aus. Dabei benutzt RATE eine Variante des klassischen Newton-Ver­ fahrens, 1979}. die von GILL und MURRAY vorgeschlagen wurde den speziellen Iterationsverfahren zu befassen. Natürlich handelt es sich hierbei streng genommen nicht mehr um einen deduktiven Test, wenn die Hypothesen im Einklang mit den nicht-parametrischen Ergebnissen formuliert werden. Zur Prüfung der Hypothesen formulieren wir eine Gleichung mit zeitunabhängiger Rate: {TUMA Normalerweise braucht sich der Anwender aber nicht mit Wer an einem überblick zu verschiedenen Optimierungsalgorithmen interessiert ist, sei auf das Buch von MURRAY (1972) verwiesen. Nur einen Punkt sollte auch der Benutzer der Programme im Auge behalten. Wenn die Likelihood-Funktion mehrere Maxima aufweist, kann kein Programm garantieren, daß die erzielte Lösung wirklich das globale Maximum ist. Vielmehr können die berechneten Werte (89) r nur ein suboptimales lokales sprochen (90) r Maximum darstellen. hätte man in diesem mensionalen Raum Bildlich ge­ Fall bezogen auf einen dreidi­ (Likelihood-Funktion mit zwei Parametern) nur einen Nebenhügel erklommen und nicht den höchsten Berg Hierbei bedeuten: der "Likelihoodlandschaft". Wenn man jedoch die iterativen Lebensalter in Jahren x2= Sozialkategorie x3= Geschlecht Berechnungen mit unterschiedlichen Startwerten durchführt, (Arbeiter=O, Angestellte=1) erkennt man leicht, (weiblich=O, männlich=1) ob eventuell mehrere Maxima existieren. Praktisch heißt dies nur, x4= Höhe der monatlichen Arbeitslosenunterstüzung in öS, daß man das Programm RATE mehrfach startet, wobei man jeweils andere Startwerte für die zu schätzenden Parameter eingibt. Im Unterschied zum Spezialfall von Gruppenvergleichen sind nur die Variablen x und x 4 und x qualitativ, während die Variablen x 3 2 1 quantitativen Charakter aufweisen. Dieser Unterschied Startwerten Unterläßt man die Eingabe von (wie in dem Beispiel in Tabelle 11), so werden diese von RATE automatisch bestimmt. In diesem Fall kann man aber auch nicht testen, wie stabil die Lösung ist. macht sich rechentechnisch stark bemerkbar. erlernbar. l) Die Anwendung von RATE ist sehr leicht Zur Schätzung der Parameter wird beim Zwei-Zustands-Modell (mit zeitunabhängiger Rate) wiederum von der Likelihood-Funk­ tion chung (26) in Kap.2.2. ausgegangen, gramm zur Schätzung der Koeffizienten unseres kurzen Kommentaren versehen in Tabelle Das Pro­ Modells ist mit 11 wiedergegeben. wobei für r die Ratenglei­ (89) eingesetzt wird. Die Maximierung der Likelihood­ Funktion in Bezug auf die Parameter B ,ß ,B ,ß3 und B lie­ 4 0 2 1 fert jedoch nicht so einfache Schätzformeln wie bei rein qua­ litativen Kovariaten. Vielmehr benötigt man iterativ arbei­ tende Computerroutinen, die bei gegebenen Daten das Maximum der Likelihood-Funktion suchen. Ein Computerprogramm, das bei verschiedensten Arten von Modellen diese Leistung erbringt, ist TUMAS Progranun RATE (TUMA 1979). � TUMA 1979) sowie da� Die Programmbeschreibung von RATE2 Programm selbst ist beim "Zentrum fur Umfrageforschung in Mannheim e.V. (ZUMAr' erhältlich. Die Anschrift lautet: D. ist inzwischen eine 6800 Mannheim, B2,1. In . Siehe dazu auch wesentlich verbesserte Version weiter unten. - 136 - - 137 - Kommentar Programm 9RUN ANDY01,IHS-S4711,DIEKMANN aSYM PRINT$,1,I9 ilASG,AZ ARSURV :IUSE 4,ARSURV aASG,AZ RATE*RATE2 �XQT RATE*RATE2.RATE Rechnerspezifische Steuer­ karten zum Aufruf des Pro­ gramms. Hier: UNIVAC 1100/81 RUN NAME ARBEIT Beliebiger Titel N OF CASES 1055 Fallzahl VARIABLES 7 ALT 2 soz 3 SEX 4 ARGELD 5 ZUSTAND ZEIT 6 Zahl der Variablen auf der A=1 VECTOR (1) A=1 bedeutet, daß Position der Variablen Alter, Sozialkategorie, Geschlecht, Arbeitslosengeld, Zielzu­ stand und der beobachteten Ankunftszeit auf der Loch­ karte Angabe der Position der Kova­ riate auf der Lochkarte für 2 3 4 5 das Modell A=1. (1) bezieht sich auf die Vektor-Nr., in unserem Beispiel auf den er­ sten und einzigen Vektor. SOLVE Mit diesem Befehl beginnt RATE die Berechnungen. FINISH Tabelle 11: Fortsetzung Neben anderen Informationen (zu Einzelheiten siehe die Pro­ grammbeschreibung TUMA 1979) allem druckt RATE die uns hier vor interessierenden Werte der "1" besagt, daß Event-Histor:y­ Daten eingelesen werden. Die Daten werden über die logi­ sche Gerätenr.4 eingelesen. (Hierfür ist eine rechner­ spez if i sche Steuerkarte er­ the parameter" Bei UNIVAC eine Datenfile ARSURV angeordnet.) Forrnatangabe für alle sieben Variablen auf der-cTögischen) Lochkarte im FORTRAN-Format. Tabelle 11: Position der Verweildauer­ Variablen ZEIT (7) und der Zielzustands-Variablen (6). J. (in und die "Antilogs of F-Werte -3,74 0,138 731,48 0,0238 alter x1 -0,0329 0,00322 104,97 0,968 0,00311 Sozialkategorie x2 -0,739 0,0823 80,59 0,478 0,0393 O, 153 0,0731 4,38 1 ( 17 0,0851 0,000154 0,0000247 1,00015 0,0000247 Konstante Lebens- (F4.0,F2.0,2F1.0,F5.0,F1.0,F3.0) ß. a ) sowie die Standardfehler aus. Für unsere i Stichprobe wurden die Werte in Tabelle 12 berechnet: USE 4-Karte. Die Daten sind wie in Abbildung 16b auf dem 7 6 und �-Koeffizienten ß- der Sprache von RATE die "Parameter" forderlich. T AND S ein lineares Modell für die variate spezifiziert wird. Lochkarte 7 READ DATA MODEL Geschlecht x3 Arbeitslo- sengeld x4 38,69 RATE - Programm für das Beispiel in Abbildung 16 Tabelle 12: Schätzwerte der ß- und �-Koeffizienten sowie der Standardfehler - 138 - - 139 Wie anhand des Vorzeichens der �-Koeffizienten in Tabelle 12 erkennbar,ist der Geschlechtseffekt positiv und der Effekt des Lebensalters negativ. für die Sozial­ Der kategorie ist dagegen positiv. Angestellte sind also in der Regel länger arbeitslos als Arbeiter. Möglicherweise ist bei Arbeitern die Fluktuation sowohl bei der Beschäftigung als - fung der Nullhypothese der Quotient den Standardfehler größer als 2 sein tumswahrscheinlichkei t von 0,05). (ct1 1) dividiert durch (bezogen auf eine Irr­ Betrachten wir jetzt noch das quantitative Ausmaß der Effekte auf die Rate und die mittlere Verweildauer (Tabelle 13). auch im Zustand der Arbeitslosigkeit relativ hoch. Diese Idee könnte verständlich machen, daß Arbeiter kürzere Ver­ weildauern aufweisen als Angestellte. Zur Prüfung der Hypo­ these benötigten wir allerdings Ereignisdaten, die für einen längeren Zeitraum über Episoden der Beschäftigung und Arbeits­ losigkeit Aufschluß geben. Der Grund hierfür ist möglicherweise, daß Ar­ beitslose mit höherem Arbeitslosengeld eher diejenigen Berufe ausüben, die eine höhere Chance der Wiederbeschäftigung ga� rantieren. Lebens- Um letztere Behauptung zu überprüfen, erneute Analyse unter Kontrolle der Variablen wäre eine Qualifikation df2=Fallzahl) ist ablesbar, Effekte aufweisen. 1) + sozialkategorie x 0,478 2 -52,2 +109,2 + +17,0 -14,5 + Geschlecht x3 Arbe i tslosengeld ter für den Geschlechtseffekt liegt scheinlichkeit von 0,05) Nur der Parame­ (bei einer Irrtumswahr­ gerade an der Signif ikanzgrenze (im semi-parametrischen Modell war dieser Effekt nicht signifikant). Das Programm druckt auch die Standardfehler der ten. H·ier ist zu berücksichtigen, die Nullhypothese � =1 i 1l entspricht. &-Koeff izien­ daß der Nullhypothese B =O i Daher sollte zur Verwer- Die F-Werte berechnen sich nach der Formel: A 2 F=(ß /Standardfehlerl „ i 1' 17 1 ,00015 X4 Tabelle 13: -0,015 +0,015 (+15') * Tausend Schilling Die ß-Koeffizienten dividiert durch den Standardfehler sind wesentlich größer als 2. Signifi- kanz** + 3,3 * pro (df =1, 1 daß alle Kovariate signifikante %-Effekte auf die mittlere Verweil<lauer -3,2 ratsam. Sowohl anhand der Standardfehler als auch der F-Werte %-Effekte auf die Rate 0,968 alter x 1 Die Höhe des Arbeitslosengeldes hat einen positiven Effekt auf die Rate. ,.. (;!.. 1 (-15) * ** + Irrtumswahrscheinlichkeit=0,05 Stärke der Effekte auf die Rate und die Verweildauer Ein zusätzliches Lebensjahr erhöht die Dauer der Arbeitslo­ sigkeit im Durchschnitt um 3,3 %. Bei Angestellten erhöht sich die mittlere Verweildauer auf mehr als das Doppelte (109 %). Männer haben im Schnitt eine 14,5 % geringere Ver­ weildauer, und pro 1.000 öS mehr Arbeitslosenunterstützung sinkt die mittlere Dauer der Arbeitslosigkeit um 15 %. Mit Hilfe der folgenden beiden Gleichungen gestattet das Modell Prognosen der Ubergangsrate und der mittleren Dauer der Arbeitslosigkeit für beliebige Kombinationen von unab- 140 hängigen Variablen, beitslosen: - 141 - also für hypothetische Gruppen von Ar­ Die Maximum-Likelihood-Methode gestattet ein weiteres infe­ renzstatistisches Testverfahren, mit dem einzelne Parameter oder simultan Gruppen von Parametern auf werden können. Da die erwartete Verweildauer der reziproke Wert der Rate ist, ergibt sich für �(T): Merkmale: Alter 45 Jahre, Angestellte, weiblich, 3.000 öS Ar­ und Gruppe 2 umfaßt männliche Arbeiter, Jahre alt mit 6.000 ös monatlicher Unterstützung. nosegleichungen für �(T) lauten dann: 25 Die Prog­ Gruppe 1: 45 3000 (93) �(T)=(42,02). (1,033) • (2,092). (0,99985) = Gruppe 2: (94) E'(T) 2 (96) [B] ( ) * 2 ln L L(ß) , mit df�u Freiheitsgraden. Der Likelihood-Ratio-Test basiert auf dieser Formel. L(ß*) ist dabei der maximale wert der Likelihood-Funktion eines Mo­ dells mit u restringierten Parametern (Nullhypothese). stringierte Parameter" besagt normalerweise, daß "u re­ u Parameter 242 als null angenommen werden (z.B. u=4 und B =B =B =B =o in der 4 3 1 2 Ratengleichung (89)) ,aber auch andere Arten von Restriktionen, 25 000 {42,02). {1,033) • (0,855).(0,99985) 6 = ternativhypothese geht dagegen von einem nicht-restringierten 33 Die erwartete Dauer der Arbeitslosigkeit in Gruppe 1 beträgt somit 242 Tage, in Kap.4 angedeutet - daß die sogenannte Likelihood-Ratio zweier gegeneinander zu testender Modelle näherungsweise x verteilt ist: Nehmen wir als Beispiel zwei Extremgruppen. Gruppe 1 hat die beitslosengeld, Signifikanz geprüft Aus der Likelihood-Theorie folgt, - wie schon in Gruppe 2 sind es dagegen nur 33 Tage. Ent­ sprechend können die Uberlebensverteilungen G(t) sowie F(t} und f(t) für beliebige Gruppen prognostiziert werden. " dierter stochastischer Modelle. A Für G(t) lautet die Prognosegleichung: -� t x x (95) G'Ctl=e ' =exp(-(0,0238)(0,968)X1(0,478) 2(1,17) 3 . x4 (1, 0001 5) t J sind denkbar. Die Al­ Modell aus ldie Werte von ß0,B ,ß ,ß ,B werden nicht fest­ 4 2 3 1 gelegt). L(ß) ist der maximale Likelihood-Wert des alterna­ tiven Modells. Die obige Gleichung kann man auch folgender­ maßen schreiben: L (ß)- ln L (ß Auch hier zeigt sich der hohe Informationsgehalt empirisch vali­ • etwa die Gleichsetzung von Parametern, *)] Intuitiv läßt sich die Formel wie folgt deuten: L(ß*) ist normalerweise das Produkt aus vielen Werten kleiner eins und daher eine Zahl, die nahe bei null im positiven Bereich liegt. Für den Likelibood-Wert der Alternativhypothese gilt ähnli­ ches, jedoch wird der Wert etwas größer sein, je nachdem wie signifikant die freien Parameter sind. Die Logarithmen der Likelihoods sind dann relativ hohe negative Werte, deren 2 Differenz mit zwei multipliziert den positiven x -wert ergibt. - 142 Dieser ist um so größer, dell ist, d.h. - je überlegener das alternative Mo­ je größer der Wert der Differenz in der ecki­ riable Alter Das Programm RATE druckt standardmäßig den natürlichen Loga­ Nullhypothese: these aus: Alle als null angenommen, d.h. aus. Nullhypo­ bis auf die Konstante ß 0 werden die Kovariate üben keinen Einfluß Der von RATE ausgedruckte Wert für die Alternativhypo­ these bezieht sich dagegen auf ein Modell, bei dem alle Parameter als "frei" betrachtet werden. Ferner gibt RATE den 2 x -wert für den simultanen Einfluß aller Kovariate an. In unserem Beispiel ist u=4.RATE berechnet die folgenden Werte: ln L(ß*) -4975,99 (Nullhypothese) ln L(ß) -4827,44 ( A lternativhypothese) - liehen signifikanten Effekt hat, kann mit dem Likelihood­ Ratio-Test beantwortet werden. gen Klammer ist. rithmus der maximalen Likelihood für die folgende 143 (x J 1 Dies sei am Beispiel der Va­ demonstriert. Die Nullhypothese lautet: ß =o,B ,ß ,ß beliebig (u=1) 4 1 3 2 Alternativhypothese: B fo,ß ,ß3,B4 1 2 beliebig Zur Berechnung der maximalen Likelihoods für beide Hypothe­ sen sind jetzt z wei RATE-Läufe erforderlich, da die "einge­ baute Nullhypothese" des Programms sich ja immer darauf be­ zieht, daß alle Koeffizienten null sind. Wir berechnen daher zunächst den Likelihood-Wert für das Modell mit den Kovaria­ ,x4 und dann den Likelihood-Wert für das Modell mit ten allen vier Kovariaten. Das Programm liefert die Werte: ln L(ß*) -4886,19 Nullhypothese ln L(ß) -4827,44 Alternativhypothese 2 Den x -wert berechnen wir nach Formel = 297 mit df=4 Der gemeinsame Effekt aller vier Kovariate ist somit hoch Setzt man die Likelihoods in Formel (97) ein, so 2 kann man nachprüfen, daß der x -wert 297 beträgt. 2 x = 2 I-4827,44-(-4886,19> ] = (97): 118 signifikant. Bei df=1 ist der wert hoch signifikant, die Variable Alter hat also einen signifikanten zusätzlichen Einfluß, Der Likelihood-Ratio-Test eröffnet darüber hinaus noch we­ sentlich mehr Möglichkeiten. So kann man beliebige Modelle gegeneinander testen, sofern nur gewährleistet ist, Modell mit den angenommenen Effekten von x und x , die Al­ 2 1 ternativhypothese ein Modell mit allen vier Kovariaten (df= Auch die Frage, 5.2. Parametrische Modelle der Zeitabhängigkeit könnte man da­ nach fragen, ob die Variablen und x gemeinsam einen zu­ 4 sätzlichen Effekt ausüben. Die Nullhypothese ist dann ein u=2). raschen wird. daß das Null-Modell durch Restriktionen aus dem Alternativ-Modell hervorgeht ( sogenannte "nested models").Z.B. was bei dem hohen F-Wert in Tabelle 12 allerdings auch nicht über­ ob eine einzelne Variable einen zusätz- In diesem Abschnitt Rate ist betrachten wir Modelle, bei denen die in parametrischer Weise von der Verweildauer abhängig nicht hingegen von Kovariaten. Das Modell einer konstanten Hazardrate (und die daraus re­ sultierende Exponentialverteilung) dient in der Regel als - 144 - - 145 - Nullhypothese ("kein spezifisches Entwicklungsmuster"), 5. 2. 1. ob­ wohl das Eintreten seltener, nicht koordinierter Ereignisse durchaus diesem Modell entsprechen kann. Jenseits dieser Null­ Wie schon mehrfach erwähnt (Kap.2), hypothese befindet sich der weite Bereich konstanten Hazardrate r(t)=r ster Hazard-Verlaufsmuster, verschiedenartig­ dessen Einschränkung auf die ein­ führt die Annahme einer zur Exponentialverteilung der Ankunftszeiten: fachsten funktionalen Formen immer noch die Operationalisie­ rung einer Vielzahl von Entwicklungshypothesen erlaubt. Die einfachsten Entwicklungsalternativen umfassen monoton fallende oder steigende Risiken. Auf der nächsten Stufe wären Zwei-Pha­ sen-Modelle mit zuerst zunehmendem, oder umgekehrt zuerst fallendes, bar. dann abnehmendem Risiko spricht dieser letzte Typus recht gut dem altersspezifischen Sterberisiko des Menschen: für einen längeren Hohe, aber rasch abnehmende Zeitraum, schließlich erfolgt im Alter laufsmuster ("bathtub shaped hazard·function", 1982) recht beliebt. siehe etwa Wir werden uns in den folgen- den Abschnitten aber nur mit den für sozialwissenschaftliche Anwendungen relevanteren Alternativen eines nur steigenden oder nur fallenden oder erst steigenden, dann fallenden Ri­ sikos beschäftigen. weder in SPSS noch in BMDP sind RATE 2 erlaubt Parame­ terschätzungen für das Exponential-, Gompertz- und Gompertz­ für RATE 3 ist die Möglichkeit der Parame­ terschätzung für praktisch beliebige Verteilungen geplant. Auch im Rahmen des verallgerreinerten linearen Modells etwa ARMINGER 1984) (GLH1, sind Parameterschätzungen möglich, es eine Reihe sehr einfacher, zensierten Daten ist der Maximum-Likelih ood-Schätzwert der Rate der Quotient aus der Anzahl aller Ereignisse im Zähler und der Summe aller unzensierten und kunftszeiten im Nenner zensierten An­ (siehe dazu auch Formel (88) in 5.1.2). quenz des Modells sei an dieser Stelle hingewiesen. vorausgesetzt, daß bis zu einem bestimmten Zeitpunkt t noch kein Ereignis eingetreten ist, Lebensd er­ Da robuster graphischer Techniken werden wir uns vor allem mit diesen beschäftigen. Bei ist die s(t) kurioserweise immer noch mit der mittleren 1l ch. auer seit Beginn des Prozesses identis siehe fordern aber Vertrautheit mit der GLIM-Modellphilosophie. gibt, Damit läßt sich - bei vollständigen Daten - der Parameter r leicht aus dem Mittelwert der beobachteten Zeiten schätzen. sem Buch schon mehrfach diskutiert. Auf eine weitere Konse­ einschlägige Routinen implementiert. Makeham-Modell, var(T) 1/r Implikationen des Modells mit konstanter Rate wurden in die­ Die Softwareunterstützung für die parametrischen Verlaufs­ modelle ist eher dürftig, (99) E(T)=1/r (100) Auch bei technischen Sta­ tistikern sind Modelle mit diesem "badewannenförmigen" Ver­ NELSON ist - wie wir und für die Varianz ergibt sich der gleiche Wert: dann ein relativ konstantes Risiko wieder eine Zunahme des Risikos. Der Erwartungswert ("mittlere Lebensdauer") wissen: dann steigendes Risiko - denk­ Mit einer dazwischen eingeschobenen dritten Phase ent­ Säuglingssterblichkeit, - l) Das Ergebnis folgt mit partieller Integration s(t) f(T J T t'.)d'r= f Tf(T ! T ?;t)dT-t=1/r, t t)=r exp(-n)/exp(-rt). (T-t)f(T JT aus: wobei - 1 46 (101) s(t)=E(T-t l T - 147 t)=l r Wenn beispielsweise bei Ereignissen wie Arbeitsunfällen die r(t) konstante Rate einen Wert von 0,1 bezogen auf die Zeitmessung in Jahren hat, so hat ein Arbeiter bei Beginn der Beschäfti­ gung eine erwartete unfallfreie Periode von sich. 10 Jahren vor Das gleiche gilt aber auch für jemanden, der schon 10, 20 oder 30 Jahre lang in dem Betrieb tätig ist, setzt das diese Eigenschaft, sitzt, vorausge­ Auf Unfallrisiko bleibt im Zeitablauf unverändert. welche das Exponentialmodell exklusiv be­ sind die gebräuchlichen Bezeichnungen "memory loss" "no aging" oder zurückzuführen. t f(t) 5.2.2. Weibullverteilung Die Weibullverteilung kann als Verallgemeinerung der Exponen­ tialverteilung angesehen werden. zwei Parameter A>p, (102) r(t) =l.p(:\t) Ihre Hazardfunktion enthält p>O: P-1 0 . t Der wichtigste Grund für die Beliebtheit dieser Verteilung ist wohl ihre Flexibilität. p<1 monoton abnehmend, Die Hazardfunktion (102) für p>1 monoton zunehmend, p=1 G(t) ist für ent­ spricht dem Exponentialmodell mit konstanter Rate r(t)=A (siehe Abbildung 17). Mit diesem Modell läßt sich daher ins­ besondere die Nullhypothese einer konstanten Hazardrate (p=O) gegen monotone Alternativen (p<O oder p>O) testen. Für die Ankunftszeitverteilung gilt: 0 t Abbildung 17: Hazardfunktion, Dichte und Uberlebens­ funktion der Weibullverteilung - (103) f(t)=Ap(At) - 148 - p-l Die "Standard-" oder "Typ 1-" 149 - Extremwertverteilung mit der Überlebensfunktion: p 1-exp -(Atl [ (104) F(t) (105 ) P G(t) = exp -(a) ] (106) [ ] G(t) [ lt+O . ist auch für negative t-Werte definiert. Aus (104) läßt sich ableiten, meters A das teilung ist. daß der reziproke Wert des Para­ 100. (1-1/e)=63,2te Perzentil der Dies erkennt man leicht, Überlebensver­ wenn man in (104) t durch Weibullverteilung insofern zusammen, rithmus einer weibullverteilten Sie hängt mit der als der natürliche Löga­ Zufall s variablen extremwert­ v e rteilt ist. 1/ >. ersetzt. Wird die Extremwertverteilung als Modell für die Ankunftszeiten Wie im nächsten Abschnitt gezeigt wird, gibt es auch eine andere Begründung der Weibullverteilung, nämlich als Extrem­ selbst (und nicht deren Logarithmen) benützt, dann gibt e s insofern Probleme, a l s d a s Modell negative Zeiten zuläßt (die Wahrscheinlichkeit dafür wird aber in der Regel sehr klein wertverteilung. sein). Der einfachste Weg, dies zu umgehen, besteht darin, die Extremwertverteilung bei 0 abzuschneiden. 5. 2. 3. Man erhält dann die abgeschnittene Extremwertverteilung oder Gompertzvertei­ lung mit der Hazardrate (Abbildung 18): Extremverteilungen sind bei der Modellierung von Lebensdauer­ prozessen recht beliebt, weil sie nicht nur sehr flexibel sind und auf beobachtete Werte oft sehr gut passen, auch eine Herleitung aus Beziehungen Makroebene erlauben. ihr schwächstes Glied in die Brüche geht, kann bei komplexen, zusammengesetzten Systemen der Aus­ Sind i m einfachsten Fall alle Komponenten gleichartig und voneinander unabhängig, und ist die Zufallsvariable T i dann ist T= Min(T ) die i Lebensdauer des ganzen Systems. Sowohl die Weibullverteilung die Lebenszeit der Komponente Nr.i, als auch die der Gompertz-Verteilung zugrundeliegende Ex­ tremwertverteilung lassen sich aus einem solchen Kontext als Grenzfälle bei n�oo (also sehr vielen Komponenten) ten (siehe dazu LAWLESS und der überlebensfunktion: wenn fall einer einzigen Komponente zum Ausfall des ganzen Systems führen. et rltl =Be sondern zwischen der Mikro- und So wie eine Kette eben dann reißt, aus vielen Komponenten (107) 1982 oder NELSON 1982). herlei- bei einer Heparametrisierung von (106) mit C=1/0>0,B=exp(l;;/El)>O. Der Gam­ pertzverteilung entspricht also eine wachsende Hazardfunktion. In der Demographie ist die Gompertzverteilung ein altbewähr­ tes Modell für das Ableben infolge natürlicher Todesursachen. Bei sehr vielen voneinander unabhängigen Todesursachen ist die tatsächliche Lebenszeit durch die erste eintretende Todes­ ursache gegeben, stellen. läßt sich also als Extremwertverteilung dar­ Durch Addition einer Konstanten A>O (für Todesfälle durch Unfälle) erhält man die Eazardrate der Gompertz-Makeham­ Verteilung: - 150 - - 151 - r!tl (109) i ! !;-- ---------- r i Exponential r(t ) Gompertz- und Gompertz-Makeham-Verteilung sind ursprünglich nur für C>O definiert, 1 Risiko zuzuordnen. sind also den Modellen mit steigendem Wenn wir für C auch negative Werte zulas­ p>2 sen, 1 <p<2 sikos miteinbeziehen kö nnen wir auf einfache Art die Situation fallenden Ri­ (Abbildung 18). Im Fall der Gompertz­ Verteilung kommt dann ein völlig neuer Gesichtspunkt dazu: bei C<O ist limG(t)=exp(B/C)>O.Die Wahrscheinlichkeit bei t+00 Weibu:u p<1 zu sterben, ist größer als o. � Diese Eigenschaft mag bei bio­ logischen, physikalischen oder technischen Systemen keine Rolle spielen, daß LAND Log-logistisch bei sozialen Phänomenen kann die Möglichkeit, ein bestirruntes Ereignis nie eintritt, (1971) sehr nützlich sein. benützt die Gornpertz-Hazardrate mit C<O zur Mo­ dellierung von Scheidungsrisiken, also in einem Kontext, dem die Annahme, daß wenn auch möglicherweise nach sehr langer Zeit - das untersuchte Ereignis sicher ein­ tritt, d.h. irgendwann jede Ehe geschieden wird, in nicht unbedingt ange­ messen ist. Eine positive Wahrscheinlichkeit, Gompertz nis nie eintritt, delliert werden, ein Teil Mover-Stayer nicht vor. nach dem dem betreffenden Risiko ausgesetzt ist, (die Stayer) dagegen nicht Im Gompertz-Modell mit negativem c gesetzt, Heterogenität mo­ etwa in einem Mover-Stayer-Modell, (die Mover) ein anderer Teil daß das untersuchte Ereig­ kann natürlich auch durch Hier ist jedes (Abbildung 18). liegt aber Heterogenität Individuum dem gleichen Risiko aus­ aber nicht notwendigerweise betroffen, so wie im Fall einer Epidemie in der Regel nur ein Teil der Bevölkerung er­ krankt, Sichel Abbildung 18: Einige Hazardraten-Modelle ohne daß die anderen deshalb irrunun sein müssen. - 153 - - 1 52 - 5. 2. 4. Die Wahrscheinlichkeit, daß das Ereignis nie eintritt, ist (111) : gemäß DIEKMANN und MITTER (1983, 1984) haben das folgende Hazard­ modell vorgeschlagen, welches besonders bei Scheidungsdaten eine sehr gute Anpassung erbrachte: (110) r(t)=c.t.e -t/A (113) lim G(t) t+ro Nach Konstruktion der Likelihood-Funktion auf der Basis von (111) und (112) findet man eine explizite Lösung des Maximie­ c,J.>O rungsproblems in bezug auf den Parameter c. Mit einem Itera­ Diese Hazardfunktion hat die Form einer Sichel mit einem tionsverfahren ist dann nur noch das Maximum bezüglich des einzigen Maximum bei t=A und einem einzigen Wendepunkt bei einen Parameters A zu bestimmen. l) t=2A. den, Das Verlaufsmuster entspricht einem zuerst steigen­ 5. 2. 5. dann fallenden Risiko (Abbildung 18). Das Sichel-Modell ist besonders bei bestimmten Prozessen mit nicht-monotoner Risikofunktion angemessen. ten ist z.B. Bei Heiratskohor­ das Scheidungsrisiko direkt nach der Hochzeit ebenso wie nach der "silbernen Hochzeit" gering mit einem da­ zwischen liegenden Maximum nach etwa zwei bis drei Jahren. Ein ähnlicher Verlauf ist bei Migrationsprozessen oder im Falle von Berufswechseln zu erwarten. negativem Parameter C auch das Sichel-Modell eine positive Wahrscheinlichkeit dafür impliziert, daß ein Ereignis nie z.B. Bei der Untersuchung von Scheidungsdaten kann man davon ausgehen, Ehen (70 bis 90 dann fallenden Risikoverlauf sind die Log-Normal­ und die log-logistische Verteilung. Die erste entspricht einem Modell, ist, in dem der Logarithmus der Ankunftszeit normalverteilt bei der zweiten ist dieser Logarithmus logistisch verteilt. Die Hazardfunktion der log-logistischen Verteilung (Abbildung 18): Hinzu kommt die häufig günstige Eigenschaft, daß wie bei dem Gompertz-Modell mit eintritt. Zwei in der Literatur häufig empfohlene Verteilungen mit erst steigendem, daß ein relativ hoher Prozentsatz von % je nach Zeitraum und Land) erst mit dem ( 114) r(t) ist bis auf den Faktor 1+(J.t)P im Nenner mit der Weibull-Ha­ zardrate identisch. Sie ist ebenfalls sehr flexibel: ist sie monoton fallend, für p>1 1 (p-1) 1P;;1., dann fallend. für p�1 zuerst steigend (bis t= Im Gegensatz zum Sichel-Modell ist die Wahrscheinlichkeit, daß das untersuchte Ereignis nie ein­ Tod eines Ehepartners aufgelöst wird. tritt, null. Für die log-logistische Überlebensfunktion gilt: Aus (110) folgt für die überlebensfunktion und die Dichte (115) G(t) = der Ankunftszeitverteilung: (111) G(t)=exp{-k [;\.-(t+f.) --- 1+ p,t) exp(-t/f.J [ ]} (112) f (t)=c.t.exp(-t/;I.) exp{-Ac A-(t+A) exp(-t/A 1> fl } zur Maximum-Likelihood-Schätzung der Parameter des Sichel­ Modells existiert am Institut für Höhere Studien, Wien, ein FORTRAN-Programm, das bei den Verfassern erhältlich ist. - 5.2.6. - 155 - 154 Dieser Test wurde bereits in Kap.3 Graphische Verfahren geführt. Eine sinnvolle Strategie bei der Modellauswahl besteht darin, möglichst allgemeine Verteilungstypen zu konstruieren, konkurrierende Hypothesen als Spezialfälle umfassen. laubt z.B. die Weibull-Verteilung die Modellierung welche So er­ wegen G(t)�exp(-rt), also ln G (t)�-rt, logarithmierten werte der geschätzten gen die Zeit auf getragen, an­ müssen die Uberlebensfunktion, ge- eine Gerade durch den Ursprung mit Anstieg -r bilden. steigen­ den und fallenden Risikos und enthält die Exponentialvertei­ lung als Spezialfall. Noch allgemeinere, umfassendere Ver­ teilungstypen sind die verallgemeinerte Gamma- oder die ver­ allgemeinerte F-Verteilung (siehe etwa KALBFLEISCH und PREN­ TICE 1980). Letztere enthält alle in diesem Kapitel bP­ schriebenen echten Verteilungen als Spezialfälle. Durch Tests auf bestimmte Parameterwerte - die Nullhypothese H :p�1 im 0 Weibull-Modell z.B. entspricht der Exponentialverteilung kann dann das passendste Modell herausgefiltert werden. Lei­ der sind diese Tests bei den allgemeineren Modelltypen (z.B. der verallgemeinerten F-Verteilung) nicht sehr trennscharf. Man wird in der Regel also um mehrere Versuche und die Be­ urteilung der Güte der Anpassung nicht herumkommen. Dabei (116) G{t)=exp(-(AtlP]folgt (117) ln G(t)=-(At)P und (118) ln{-ln G(t)j=p ln t + p ln Die doppelt logarithmierte geschätzte Uberlebensfunktion, gen den Logarithmus der Zeit aufgetragen, rade mit dem Anstieg p und der Konstanten p.ln setzt man ln t durch t, Grenzen können sie sogar die Parameterschätzung mit geeig­ neten (i.a. aufwendigen) Computerprogrammen ersetzen. A bilden. Er­ der Extremwertver­ bull- und Extremwertverteilung in Abschnitt 5.2.3.). Für die Gompertz-Verteilung ist ein derart einfacher Test leider nur Die graphischen Verfahren stützen sich in der Regel auf Trans­ welche die betreffende Verteilung beschreiben (in der Regel die kumulierte Hazardrate oder - äquivalent - der Loga­ rithmus der Uberlebensfunktion). Bei geschickter Wahl dieser Transformationen kann eine lineare Beziehung hergestellt und in der graphischen Darstellung durch eine Ausgleichsgerade dargestellt werden. Die Parameter der Ausgleichsgeraden kön­ die Konzentration der Meßpunkte um die Ausgleichsgerade erlaubt die Beurteilung der Güte der Anpassung. können die Parameter in Sonderfällen möglich (siehe nächster Abschnitt)· formationen sowohl der beobachteten Zeiten als auch der Funk­ nen bei der Schätzung der Modellparameter benutzt werden, ge­ muß also eine Ge­ teilung geschätzt werden (vgl. die Beziehung zwischen Wei­ haben sich graphische Verfahren sehr bewährt. In gewissen tionen, A Bei dieser Verteilung führt die bei logistischen Konzepten gebräuchliche"log-odds-Transfor­ mation" (119) zum Ziel: G(t) p (120) (At) ( 121) ln 1+ (At) ) 1 ���f 1-G(t) -mt) . Hieraus folgt: , und nach Logarithmierung: p.ln t + p.ln A. - 156 - Die log-odds ln ( (1-G(t))/G (t) ] - 157 - gegen den Logarithmus der Zeit G(t aufgetragen, müssen also eine Gerade bilden mit dem Anstieg p und der Konstanten p.ln A. Graphische Auswertungstechniken und dabei nützliche Hilfs­ mittel, z.B. pier verschiedene Arten von Wahrscheinlichkeitspa­ (Millimeterpapier mit nicht-dezimaler, sondern loga­ rithmierter, normalverteilter usw. Skala), werden sehr de­ tailliert in dem Buch von NELSON (1982) 5.2. 7. beschrieben. Die Rohdaten sind gruppiert und auf 10.000 Eheschließungen bezogen der Scheidungen im Jahr der Eheschließung, im sie (Anzahl 1. Jahr danach Die Beobachtung endet im Jahr 1974, alle in diesem Jahr noch nicht geschiedenen Ehen sind also zensierte Beob­ achtungen. Tabelle 134 3-4 121 4-5 115 5-6 89 8-9 stammen vom österreichischen Statistischen Zentralamt; usw.). 134 2-3 7-8 Als Anwendungsbeispiel wollen wir die Scheidungen einer öster­ reichischen Heiratskohorte von 1960 auswerten. 105 1-2 6-7 Anwendungsbei��.!_..._E:.11.e_,;.cheidungsdaten 0 18 0-1 10-11 11-12 12-13 15- 2 0,693 ,988 3 1,099 4 1,386 5 1,609 6 1 ,792 7 1,946 8 2 ,079 9 2, 197 63 10 2,303 58 11 2 ,398 50 12 2 ,485 13 2,565 45 14-15 ,998 83 51 13-14 14 878o**11s ]_ 2,639 2 ,708 (1 ) -,002 -6, 21 -,01 2 -4,42 ,974 -,026 ,961 -,040 -3,22 -,065 -2,73 ,052 ,949 1937 ,928 -,075 -,083 ,920 ,912 -,092 ,898 '108 ,1 00 ,905 ,8 93 ,883 -4,29 -4 ,28 -2,95 -4,41 -2,59 -2,48 -2,38 -2,30 -2,23 -2,18 -,124 -2,08 - ,130 ,878 -4,55 -3,64 -, 113 - ,119 ,888 (2) -6,32 0 1,000 0 81 73 9-10 log G(t.) i) -2,13 -4,37 -4 ,65 -4 '74 -4 '70 -4 ,82 -4,96 -5,04 -5, 18 -5,16 -5,27 -2, 04 14 enthält die in den einzelnen Jahren ge­ zählten Ehescheidungen und nach der Life-Table-Methode be­ rechnete Überlebenswahrscheinlichkeiten sowie die für die graphische Auswertung erforderlichen Transformationen von t und G(t). ln[ ( 21 ln Die Abbildungen 19 und 20 sind die entsprechenden Darstel­ lungen für das Exponential- bzw. Abbildung (1) weibull-Modell. 19 liefert keine Unterstützung der Nullhypothese einer konstanten Hazardrate. von einer Geraden ab! punkte ist bis etwa einem steigenden Der Verlauf weicht systematisch Eine verbindende Kurve durch die Meß­ zum 2. Jahr nach unten Risiko entspricht) nach oben gekrümmt gekrümmt (was und ab etwa dem 6. {abnehmendes Risiko) , Jahr lediglich im mitt­ leren Bereich erscheint die Annahme eines konstanten Risikos -ln [ 1n G (t1H G (t i) G(t +1) i } *) Life-Table-Schätzwerte Tabelle 14: **) zensiert Beispiel Ehescheidungen: Geschätzte Überlebens- - - 158 ln [in ln 159 G(t)) G(tl 0 0 + -1 0,02 + 0,04 -2 + ++++ + ,0,06 + - + 3 + + + -4 + 0,10 + + + o, 12 + + -5 + + -6 0,14 2 t 3 5 7 ++ + + 0,08 + ++ 9 11 13 15 0 0,5 3 4 5 1, 5 8 10 6 2 15 2,5 t log t t Test bei ExponentialGraphischer Test bei Weibullverteilung - gerechtfertigt. - 161 160 - Außerdem geht eine durchgelegte Ausgleichs­ gerade kaum durch den Nullpunkt, sondern schneidet die t-Achse bei etwa o,5. Dieser Umstand ist durchaus gerechtfertigt: rechtliche und prozedurale Gegebenheiten lassen eine Schei­ dung unmittelbar nach der Eheschließung kaum zu, Schnittpunkt bei t =0,5=6 "Vorbereitungszeit" den. und der Monate kann als durchschnittliche für eine Scheidung sicher akzeptiert wer­ Konsequenterweise wäre dann der Nullpunkt auf der achse zu verschieben bzw. Zeit­ wären alle Zeiten um den Wert 0,5 zu verringern. Die verbleibenden systematischen Abweichungen von einem linearen Verlauf lassen das Exponentialmodell trotz­ dem inadäquat erscheinen. Modell geschätzte Hazardfunktion - ihren maximalen Wert erst sehr spät einnimmt, das den Schätzwerten entsprechende Schei­ dungsrisiko also während des gesamten Beobachtungszeitraums zunimmt. Aus dem Weibull-Plot können wir nämlich für den An­ stieg den wert ca. 1,5,für die Konstante ca. -6 entnehmen, was wegen praktisch identischer Ordinatenwerte auch für den log-logistischen Plot gilt. Damit ergeben sich sowohl für den Weibull- als auch den log-logistischen Fit grob geschätzte Parameterwerte p=Anstieg�1,5, ln A =Konstante/p�-4, also A"'0,018. Da die log-logistische Hazardrate für p>1 ihren p Maximalwert bei t=(p-1) l / f'>., annimmt, entspricht dieser Wert bei p=1,5, A=0,018 einer Ehedauer von etwa 35 Jahren. Erst da­ nach sinkt,im geschätzten Modell, das Scheidungsrisiko wieder. Systematische Abweichungen zeigt auch der Weibull-Plot bildung 20). (Ab­ Hier wäre eine verbindende Kurve durchwegs nach unten gekrümmt, der Vergleich mit einer dem Shape-Parameter p=1 entsprechenden eingezeichneten Geraden zeigt für junge Ehejahre einen stärkeren Anstieg (p>1, also zunehmendes Schei­ dungsrisiko), für eine längere Ehedauer einen schwächeren An­ stieg (p<1, also abnehmendes Scheidungsrisiko). Wird unter Berücksichtigung der oben angeführten Überlegungen (Mindest­ ehedauer ca. log 6 Monate) der Zeitnullpunkt verschoben, also [-log G(ti) j gegen (t -0.5) aufgetragen, wird die i Krümmung zwar flacher, die systematischen Unterschiede blei­ log ben aber bestehen. Diese Ergebnisse legen ein log-logistischen Modell. im vorliegenden Fall ln zwei-Phasen-Modell mit erst stei­ Wie man leicht nachrechnen kann,sind (-ln G(til } und ln [(1-G(til)/G(ti) J praktisch identisch (die Differenzen werden mit sind aber auch bei noch relativ unbedeutend). =15 zunehmendem mit -2,04 gegenüber jede Ehe mit Sicherheit irgendwann einmal geschieden wird. Ein Versuch mit Modellen, erscheint also sinnvoll. Die systematischen Abweichungen zurückzuführen ist, daß die unter diesem bei denen das nicht der Fall ist, Eine Gompertz-Hazardrate r(t) mit C<O könnte z.B. adäquat sein. Für die Gompertz-Verteilung gibt es i.a. keinen einfachen graphischen Test, wohl aber im vorliegenden Fall, in dem wir die Überlebensfunktion zu regelmäßig wiederkehrenden Zeit­ (122l ln G(tl Für diese gilt nämlich: t = �(1-ec ) c und für das darauffolgende Jahr t+1: (123) ln G(t+1) �,97 von der Linearität bleiben also auch im log-logistischen Plot erhalten, was darauf ihre überlebensfunktionen bei t+00 gegen O gehen, daß also punkten geschätzt haben. gendem, dann fallendem Risiko nahe, etwa entsprechend dem größer, Alle bisher untersuchten Modelle haben die Eigenschaft, daß �( c Differenzbildung führt zu: (124) ln ln G(t)-ln G(t+1l (1 - 163 - - 162 - und erneutes Logarithmieren zu: (125) ln ln (1n ��;�)] G t [in .ß< i) G(t +1) i ] aufgetragen, gegen eine Gerade mit dem Anstieg C ergeben. muß also ungefähr Die entsprechenden Or­ dinatenwerte gehen ebenfalls aus Tabelle 14 hervor. phische Auswertung in Abbildung 21 Die gra­ zeigt für Ehedauern ab etwa dem dritten Ehejahr eine recht gute Anpassung und insbesondere keine systematischen Abweichungen. Der Anstieg der Ausgleichsgeraden ist etwa -o, 1, was einem mit jedem Ehejahr um etwa 10 % sinkenden Scheidungsrisiko entspricht. Konstanten der Ausgleichsgeraden ln[ ein B-Wert von ca. 0,019 berechnen, Aus der (1-ec)}�-4 läßt sich was einer kohortenspezi­ fischen Wahrscheinlichkeit von exp(B/C)�0,82 entspricht, eine Ehe nie geschieden wird daß (nach 15 Jahren waren 12 % der beobachteten Ehen geschieden). -4,0 + -4,2 + + -4,4 + + + -4,6 +- + + -4,8 Für die ersten Ehejahre ist dieses Modell allerdings auch nicht adäquat. + + -5,0 + Als Modell für kohortenspezifische Ehescheidungsverteilungen wäre also die Verbindung eines Zwei-Phasen-Modells mit der Möglichkeit, daß die Überlebensfunktion nicht gegen Null geht, wünschenswert. Das Sichelmodell hat diese Eigenschaft, sich aber nicht graphisch überprüfen. läßt Unsere Untersuchungen einer Vielzahl von Heiratskohorten in mehreren Ländern hat eine ausgezeichnete Anpassung des Sichelmodells im Vergleich + + -5,2 -6,3 -6,4 0 2 4 6 8 10 12 14 f mit den fünf alternativen Modellen in Abbildung 18 ergeben (vgl. DIEKMANN und MITTER 1984). Abbildun;i: 21: Graphischer Test bei GompertzVerteilung - 165 - - 164 5.3. Kovariateneffekte und Zeitabhängigkeit B log-linear, Wurden in Abschnitt 1 parametrische Modelle mit Kovariaten ohne Zeitabhängigkeit und i n Abschnitt 2 zeitabhängige Raten ohne Kovariate thematisiert, so wollen wir in diesem Abschnitt beide Abhängigkeiten miteinander kombinieren. Ein relativ all­ gemeines Modell ist die Gompertz-Makeham-Funktion mit Kovaria­ ten, deren Parameter mit RATE an Daten geschätzt werden kön­ nen. steht andererseits schon im Exponenten, neare Schreibweise zu einer doppelt funktion führte, Die verallgemeinerte Gompertz-Makeham-Funktion in Wie im vorhergehenden Abschnitt erläutert, Hinzufügung einer Konstanten RATE erhält man durch zur Gompertzfunktion die Gom­ pertz-Makeham-Funktion: (126) r(t) so daß eine log-li­ exponentiellen Raten­ deren empirische Interpretation mit größeren Schwierigkeiten verbunden ist. Wenn B ferner eine log-lineare und B* eine lineare Kovariaten­ funktion ist, 5.3.1. so wird dadurch eine bei der Likelihood-Maxi­ mierung eventuell auftretende negative Rate vermieden. C (129) r{t) so folgt für die Ratengleichung: t t � � B*+C.t A+e Diese Verallgemeinerung des Gompertz-Makeham-Modells wollen wir jetzt auf unser Beispiel mit den vier Kovariaten Alter (x J, Sozialkategorie (x ), Geschlecht (x ) und Arbeitslo3 2 1 sengeld ) anwenden. Wir untersuchen im ersten Schritt ein t allgemeines Modell ohne Restriktionen bezüglich aller addi­ tiven Effekte. Die A-, Zur Berücksichtigung von Heterogenität können die Parameter B- und C-Gleichungen des Modells (129) lauten: A,B und C als Funktionen von Kovariaten formuliert werden. Dabei bieten sich zwei einfache Funktionen an, und log-lineare Funktionen wie in Abschnitt 1 nämlich lineare Z.B. können wir für A schreiben: (127) A A (131) B (linear) Zur Schätzung der oder: (128) (130) beschrieben. 15 freien Parameter des Modells wird die Likelihood-Funktion aus f(t) und G(t) A (log-linear). Analoges gilt für B und C. Asymptote des Modells. chung (25) wenn C negativ ist, gebildet in Kap.2.4 und den Anhang 2).f(t) (siehe Glei­ und G(t) wie­ derum sind eindeutig bestirrunt durch die Modellwahl (129) wird A zur Je länger die Verweildauer t, desto mehr nähert sich die Rate dem Wert von A an. Es empfiehlt sich häufig, A und B als log-lineare, C hinge­ gen als lineare Kovariatengle'ichung zu schreiben. Sind A und den Spezifikationen von A,B und c. mit Das Prograrrun RATE maxi­ miert nun die Likelihood-Funktion bezüglich der 15 Parameter ist es nur erforderlich, eine Programmkarte in dem in Abschnitt 5.l.3wie folgt zu ändern: MODEL (4) A=1 B=1 C=-1. Hiermit wird Modell 4 die Gompertz-Makeham-Funktion, gewählt. A=1 und fizieren log-lineare Modelle für A und B, C=-1 für C. Je nach Datensatz eine lineare tuell erforderlich, Karte zu erhöhen. Zahl der Iterationen mit :) - M "' N N 0 0 0 H 0 .µ � (l) :> 1 0 8 0 8 0 0 0 0 0 „ "' 1.0 0 "" 0 0 "' M N 0 0 0 0 0 0 lf N <O II M <O 1 II 0 <O 1 U1 ... 0 8 4 0 .µ ,;: <ll i> 1 0 Jr! "" 1 0 1 0 0 „ "' "' w ...... rl m 0 0 0 0 0 0 0 II (lJ "' r-1 r-l :l 0 & 1 � '!"""" "" f' "" "" 0 1 Cl O'"l 0 "' ..... "' "' „ ("'"0 8 0 t.{') 0 ill ..<:; .µ 0 P.. Wert des Modells zeigt Tabelle ö 1 .µ r-l Wir sehen, � \D ro ' fl 4-1 'O "' .µ � ll 16. daß alle Kovariate signifikante Effekte aufweisen. Ist aber auch insgesamt das "ökonomischere" Parametern dem vollständigen Modell mit neun 15-Parameter-Modell überlegen, oder geht die Null-Setzung von Parametern auf Kosten der Er­ klärungskraft? Der Likelihood-Ratio-Test kann hierüber Aus­ kunft geben. 0 0 Das der­ Die geschätzten Parameter und den maximalen ln-Likelihood­ lt) 8 beibehalten wollen. >-, �1 :;:1 -g 0 (Geschlechtseffekt) art modifizierte Modell hat dann die Gestalt: e.� � 0 P a rameter c3 (i.I "' i? <lls <.o wobei wir als Ausnahme von dieser Regel auch den nahe an der Signifikanzgrenze liegenden .µ .,_; 0 .µ P.. qj N Eine wesentliche alle nicht-signifikanten Kova­ riate unberücksichtigt zu lassen, ll .g "' 0 N Das Modell ist noch bei weitem zu komplex. Vereinfachung bestünde darin, � 0 ge­ um die Nullhypothese zurückzuweisen. 4 <11 '1l H ((j IO; (Abwesenheit Dies ist nicht verwunderlich, nügt doch schon ein Kovariateneffekt, .u ,... H 0 .µ von 428 gegenüber der einfachen Nullhypothese aller Kovariateneffekte). H (!) <Q ::s ((j 0 0 U1 "" 111 0 <.0 <,.Q Der gemeinsame Einfluß aller Kovariate ist natürlich hoch­ 2 signifikant. Der Likelihood-Ratio-Test liefert einen x -wert H w ,::: •rl <ll 8 Es fällt auf, und daß alle Parame­ ter des Faktors Geschlecht nicht-signifikante Werte aufweisen. 0 ;,:: 1f ""' <o In sieben von fünfzehn Fällen ist der Betrag des Para­ daß der A-Vektor kaum eine Rolle spielt, ;::; 0 U"l CS\ N 0 0 II - meters größer als der zweifache Standardfehler. ,::: (!) .µ c llJ .µ lll \D ... ('") O'.) 0 hervor. r-l rl " ,::: O'.) M ..... "' 0 0 0 N 167 - Die empirischen Resultate des RATE-Laufs gehen aus Tabelle 15 "' 0\ "' 0 „ � 166 Hypothese) Die Nullhypothese Wert von -4765,19 < {oder besser: (Tabelle 16) � ln !.(ß*)­ gegenüber dem ln L(ß)-Wert von -4761,86 des alternativen 15-Parameter-Modells N � die restring erte ist jetzt das 9-Parameter-Modell mit de (Tabelle Bei df=6 Freiheitsgraden kalkulieren wir nach Formel einen von: 15). (97) 168 - Variable Parameter Konstante a. 1 „ Konstante Sozialkategorie ( x2 b = 0 ) Arbeitslosengeld (X ) 4 Konstante b2 c Sozialkategorie (x3) = b4= „ (x ) 1 Geschlecht Standardfehler 2,49 Alter (x ) 1 Alter - 1 = o, 117 - 4,71* o,136 -0, 5 5 1* O, 126 Tabelle 16: Zwar ist die 0,00194 -0,000438* 0,0000599 -0,00377* 0,00163 0,00281* 0,00106 signifikant. Rate sinkt und umgekehrt mit abnehmender Rate steigt. Der zeitabhängige Teil (C-Vektor) läßt einige interessante Besonderheiten erkennen. Gehen wir einmal von der Gruppe männlicher Arbeiter aus (x :> 1 31 Jahre, finden, mit zunehmender Dauer der Arbeitslosigkeit. len nach dem gewählten Kriterium keine besondere Verbesserung des Modells dar. also die Dauer der Arbeitslosigkeit und einmal einen daß wir ein relativ besseres, (dazu weiter unten) gefunden haben. wei­ tere Likelihood-Ratio-Tests unter Einschluß oder Ausschluß Modellen führen. rn qualitativer Hinsicht unterscheiden sich die Ergebnisse nicht Rate in Abschnitt 5 .1.3. wenn Hier hat die Ver­ Rate und somit auf Dem Modell zufolge hat einmal einen positiven negativen Effekt auf die Chance der Wiederbeschaftigung, und zwar in prognostizierbarer Weise abhängig von den Merkmalen der betroffenen Arbeitslosen. Dies ist gewiß nicht hingegen, daß wir das beste Modell im Zuge der induk­ zu In Glei­ chung (133) ist der Faktor (c +c x •c x +c x ) vor dem "t" 2 2 1 1 3 3 0 positiv. Unabhängig vom Geschlecht und der Sozialkategorie das Lebensalter höher als 32 Jahre liegt. die zusätzli­ jün­ , x =1). 3 ist das Vorzeichen des Faktors auf jeden Fall negativ, chen sechs Parameter des komplexeren Alternativ-Modells stel­ von dem Modell mit zeitunabhängiger Rate, jedoch gilt daß die Verweildauer mit wachsender die Chance der Wiederbeschäftigung. Betrachten wir jetzt noch die Ergebnisse in Tabelle 16. umgekehrt. Rate nicht mehr der reziproke Wert der Verweil­ weildauer einen negativen Effekt auf die bestimmter Kovariate könnten zu "besseren" sie größer als bei Bei dieser Gruppe steigt die Chance, eine Beschäftigung 2·(-4761,68+47 6 5 ,19)=7,02. tiven Suchstrategie (x2=0) ist Bezüglich der Verweildauer im zustand der Ar­ die qualitative Aussage, gerer, Parameter des modifizierten Modells Der Wert ist eindeutig nicht-signifikant, d.h. desto {x =o) ist die Rate geringer als 3 dauer wie beim Modell mit zeitunabhängiger 0,0110* Der Test besagt natürlich nur, Bei Frauen beitslosigkeit ist das Vorzeichen jeweils 0,0000261 in r, cß) �-4765,19 höher die Rate. Angestellten. 0,00017 1* * Bei einer Irrtumswahrscheinlichkeit von 0,05 Je älter, desto geringer, und je mehr Arbeitslosengeld, bei Männern,und bei Arbeitern 2,20 -0,386* 169 - eine interessante Implikation des Modells. tlber die Diskussion der Ratenfunktion hinaus können wir wie­ der gruppenspezifische tlberlebensfunktionen G(t) prognosti­ zieren, die ein besonders anschauliches Bild des Prozesses mitsamt der Kovariateneinflüsse liefern. (13) in Verbindung mit Definition lautet die Formel für G(t): (134) G(t) e (T)dT =e o Gemäß Gleichung (12) (siehe Kap. 2. 2. 3 ) J(A•Be-c.T)dT - 170 - der Standardfehler und der Likclihood-Ratio-Tests Parameter Löst man das Integral, so erhält man den Ausdruck: als null angenommen werden. [ Up-Strategie". ·- A.t+!! (135) G(t) e C " lt (137) e „ ,.,, (Tabelle 16): "Bottom­ bis sozusagen der "Grenz­ zusätzlicher Erklärungskraft den "Grenzkosten" durch Hinzufügung weiterer Parameter entspricht. In beiden Fällen lautet die Devise: (2,49-0,386 x1) so So viel Erklärungskraft wie möglich, viele Parameter wie nötig, wobei der Likelihood-Ratio-Test ein Maß der relativen Erklärungskraft sein kann. "' B Für die er­ stere, die Top-Down-Strategie, spricht die Einfachheit und die relative ,.. (138) C Der zweite Weg ist die Hier wird von einfachen Modellen ausgegangen, die soweit angereichert werden, nutzen" an In unserem Fall ergab sich für A,B und c (136) 171 - � 0,0110-0,000438 x -o,oo377 x +0,00281 x 2 3 1 Eindeutigkeit der Suchstrategie. Inwieweit das derart an den Daten modifizierte Modell auch auf andere Stich­ proben übertragbar ist, müssen deduktive Tests erweisen. Für Für beliebige Merkmalskombinationen, pen von Arbeitslosen, können unter d.h. für beliebige Grup­ jetzt mit der Formel für G(t) Berücksichtigung der drei A,B,C-Gleichungen die jewei­ die zweite Strategie ist das Argument anzuführen, daß die Suche nach einem befriedigenden Modell mehr von hierbei theoreti­ schen Gesichtspunkten geleitet wird. ligen Überlebensfunktionen prognostiziert werden, wobei man am besten einen programmierbaren Taschenrechner zu Hilfe Neben der eher induktiven Modellsuche gestatten die parame­ nimmt. trischen Verfahren, wie in Abschnitt 5.1.3. demonstriert, natür­ lich auch die Möglichkeit streng deduktiver Hypothesentests. Die prognostizierten Werte gruppenspezifischer Überlebens­ Diesen Weg sollte man immer dann beschreiten, wenn man vor funktionen sowie auch andere Implikationen des Modells kön­ der Datenanalyse über eine genau spezifizierte Hypothese nen ferner mit den Beobachtungen bzw. fügt. Die Bestätigung einer Hypothese mit den nicht-parame­ trisch geschätzten Überlebensfunktionen glichen werden. von Modelltests 1979, (siehe Kap.3} ver­ Dadurch eröffnen sich weitere Möglichkeiten (zu einer Anwendung siehe TUMA und HANNAN keineswegs, daß es sich um eine "gute" einem Rennen mit nur einem Pferd per" besagt ver­ allerdings noch Hypothese handelt. Bei kann auch ein "müder Klep- gewinnen„ S.840 ff.). Im Sinnes eines Entscheidungsexperiments empfiehlt es sich Einige Bemerkungen noch zur Modellsuche. Wenn die theoreti­ daher, schen Vorstellungen relativ vage sind, dann kann - analog als Entscheidungsinstanz zur "Stepwise-Regression" in Kap. 4 - die Suche nach dem adä- quatesten Modell auf zwei Wegen • konkurrierende Hypothesen gegeneinander z.B. zu testen und den Likelihood-Ratio-Test her­ anzuziehen. Der erste Weg, die "Top-Down-Strategie" wurde hier beschritten. Man geht Darüber hinaus ist es in jedem Fall ratsam, Konsequenzen des von einem allgemeinen Modell aus und versucht das Modell Modells schrittweise zu vereinfachen, indem unter Berücksichtigung mit den beobachteten Werten zu konfrontieren, über die (wie z.B. gruppenspezifische Überlebensfunktionen) um Aufschlüsse Erklärungskraft des Modells zu erhalten. - 1.72 - - 5.3.2. weitere RATE-Modelle 173 - hand sogenannter "Change-Daten" geschätzt werden. Bei Change­ Daten ist nur der Typ des ersten Ereignisses j nach k) Das Programm RATE2 erlaubt die Schätzung der Parameter von von vier Modellen: Zeitpunkt (1) Kovariateneffekte bei zeitunabhängiger Rate (Exponential- oder Poisson-Modell), Zeitab­ (Cox-Regression), Die Modelle (2) (1), (3) und (2) und beziehen. Darüber hinaus gestatten die Modelle (4) die Berücksichtigung zeitabhängiger Kovariate. Bei zeitabhängigen Kovariaten einer Berufskarriere) raum in einzelne (4) haben wir bereits kennengelernt, ist sozusagen in doppelter Weise stochastisch. Der (z.B. das Einkommen während können die Parameter von Zeitperiode zu Zeitperiode variieren, (4) Gompertz-Makeham-Modell. Modell wobei der gesamte Beobachtungszeit­ Zeitperioden unterteilt wird. Erhebliche Vorteile bezüglich der Datenfile-Organisation und weiterer Modell-Optionen sollen Ratengleichung mit linearen oder log-linearen Kovariateneffek­ des Nachfolge-Programms ten wird noch ein multiplikativer Fehlerterm hinzugefügt. Typ kann die Weibull-Verteilung Fehler werden als gamma-verteilt betrachtet, kann. daß die Rate Die eine relativ allgemeine Verteilung mit positiver Zufallsvariablen. mit ist gewährleistet, (Zustandswechsel jedoch der exakte bekannt. stands-Modelle (2) Berücksichtigung eines Fehlerterms in der Ratengleichung, hängigkeit nicht Die vier Modelle können sich auf zwei- oder auch auf Mehr-Zu­ 1) (3) Partial-Likelihood-Modell mit unspezifizierter in einem Zeitintervall, Da­ nicht negativ werden ten gewählt werden. angekündigte Modifikationen RATE3 bieten. Als zusätzlicher Modell­ mit Kovaria­ (siehe Kap.5.2) Ferner wird die Möglichkeit eröffnet, Programm selbstgewählte Ratenfunktionen hinzuzufügen, nicht dem die in das Schema der vorgegebenen Modelltypen passen. Im Grunde handelt e s sich bei dem Modell um eine Ver­ allgemeinerung des klassischen "Compound-Poisson-Prozesses" In letzter Zeit sind Versuche unternommen worden, von GREENWOOD und YULE der von RATE vorgesehenen Modelltypen sowie weitere Modelle (CHIANG 1968), wobei die Generalisie­ rung in der Einbeziehung von Kovariaten besteht. in das Programm GLIM zu integrieren (ARMINGER die meisten 1984). Hier bahnt sich eine Tendenz zur Vereinheitlichung zahlreicher Programme Mit Ausnahme von Modell (1) sind zur Schätzung der Parameter mit RATE Ereignisdaten erforderlich. Modell (1) kann auch an- sozusagen unter dem Dach von GLIM an. Dennoch dürften hier­ durch Programme wie RATE kaum inaktuell werden, wenn die Programmsprache den Vorzug der Benutzerfreundlichkeit und leichten Erlernbarkeit aufweist. 5.4. l) Modell (1) ist ein technischen Gründen Modelle des Typs (1) von Modell (4) zu Modell (4). Aus rechen­ en. .Lem:swer·t, einfache als Spezialfall Die Verfahren zur Schätzung der Parameter bei Mehr-zustands­ Modellen (oder Multi-State-Modellen) beruhen auf einer ein­ fachen Generalisierung des Maximum-Likelihood-Schätzverfah- 174 rens. - 175 - - Der Aufbau des Datenfiles wird etwas komplexer, zu beachten ist, wobei daß nunmehr die Episoden die Fälle des Da­ tenfiles bilden. Wesentlich aufwendiger im Gegensatz zur Pa­ rameterschätzung wird bei Mehr-Zustands-Modellen die mathe­ matische Untersuchung der Modellkonsequenzen. Dazu werden wir abschließend einige Beispiele der dynamischen Anal_y� von zustand \\� \� Harte Drogen 2 Weiche Drogen Mehr-Zustands-Modellen diskutieren. Keine Drogen 0 5.4.1 . schon aus Kap.1 Modell einer Drogenkarriere mit den in Abbildung Parameter von Kovariateneinflüssen oder kann 22 gezeig­ geschichten erfolgen, Episoden umf assen. Dia,gramm der Ereignis­ Personen- ST Nummer Ein Beispiel zeigt das Diagramm in Abb.23. Person Nr.1 T u in das Datenfile-Muster der darunter stehenden Tabelle eingegangen. 4 2 Ereignisgeschichte Ereignisdaten zz ET sz VD 0 5 5 7 7 10 10 14 0 14 14 0 5 5 5 14 Start-Zeit Endzeit der Episode VD Verweildauer SZ Startzustand 0 0 0 0 x 2 Kovariate " 2 "1 0 600 0 1500 0 800 0 600 1800 0 0 2 x , 1 ST ET zw 0 2 0 1000 0 2050 Episodenspezifische Messungen der Kovariate (z.B. (ET-ST) x �Geschlecht, 1 x � Netto-Einkommen) . 2 zz Zielzustand zw Zustandswechsel Der Datenfile sieht pro Episode 0 zensiertes Datum eine 11 logische Lochkarte'' Zustandswechsel (keine zensierung) Muster eines Datenfiles Drei-Zustands-Modell (Jahre) i2 der die pro Individuum in der Regel mehrere Beispiel ist als t 1 t Zeitabhängigkeiten bei Mehr-Zustands-Modellen auf der Basis von Dieses 2 ti t i1 2 1i 1 bekannte ten drei zuständen. Die Schätzung der Übergangsraten bzw. person i .....,..._, Parameterschätzung bei Mehr-Zustands-Modellen Betrachten wir als Beispiel das uns ( "spell" l Episode Y(t)=k vor. - 176 - - 177 - Um Hinweise auf Verletzungen der Markov-Annahme (Unabhängig­ Zur Beschreibung der Episoden sind nunmehr mindestens die folgenden vier Variablen in dem Datenfile vorzusehen: Startzeit (ST) Die und der Startzustand (SZ) sowie die Endzeit (ET) und der Zielzustand (ZZ). ZW) sind redundant, d.h. Die übrigen Angaben (VD und sie folgen zwingend aus den Werten der vier zentralen Episoden-Variablen. Diese redundanten va­ riablen sind gelegentlich zweckmäßig für zusätzliche Analy­ sen alternativer vereinfachter Modelle. Außerdem enthält der File noch zeitunabhängige (x J 1 und zeitabhängige (x2) Kova­ riate (zu verschiedenen Datenfile-Mustern siehe auch CARROLL 1982). Die Parameter können nun beispielsweise mit dem Programrq RATE Der un­ terschied zur Schätzmethode im Falle des Zwei-Zustands-Modells mit absorbierendem Zielzustand besteht nur in der Komplexi­ Das Mehr-Zustands-Schätzproblem ist nämlich - wie TUMA, HANNAN und GROENEVELD ren Zuständen) zu erhalten, ist es mitunter ratsam, stimmte Episoden pro Untersuchungseinheit (z.B. erste Episode) bei der Ergebnis gleichen. nur be­ nur die Schätzung zu berücksichtigen und das mit der Schätzung aufgrund aller Episoden zu ver­ Starke Unterschiede können auf eine Verletzung der Annahme hinweisen (siehe zu dieser Möglichkeit HANNAN und CARROLL 1981). 5.4.2. Die dynamische Analyse von Mehr-Zustands-Modellen 5.4.2.1. mit der Maximum-Likelihood-Methode geschätzt werden. tät: keit der Ereignisse vom vor-vorhergehenden und allen frühe­ Wurden die Raten anhand der Daten geschätzt, den Formeln in Kap.2.3 ziert werden. so können gemäß die Überlebensfunktionen prognosti­ Diese lauten für das Beispiel des Drei-Zustands­ Modells mit zeitunabhängigen Raten: {1979) zeigen - auf eine Anzahl von zwei-Zustands-Schätzproblemen reduzierbar. Für jede Kombina­ tion von Ausgangs- und Zielzustand können die Parameter se­ parat geschätzt werden, wobei Zustandswechsel Zielzuständen als zensiert betrachtet werden. zu den übrigen Die Rate r 02 (bzw. die Koeffizienten der hierauf wirkenden Kovariate) in Abbildung 22 beispielsweise kann allein auf der Basis aller Episoden mit dem Ausgangszustand o und dem Zielzustand 2 ge­ schätzt werden. Wechsel zum Zustand 1 sowie "echte" Zensie­ runen werden hierbei gemeinsam als zensierte Daten behan­ ) delt. 1 1) Da die Raten normalerweise von Kovariaten abhängig sind, kön­ nen in die Formeln zur Prognose der gruppenspezifischen über­ lebensfunktionen die entsprechenden Ratengleichungen mit Ko­ Rechentechnisch wird in etwas anderer weise vorgegangen. in dazu auch die allgemeine Likelihood-Funktion Vg.l. TUtlA (1979) oder TUMA, (140) G (t) 1 HANNAN und GROENEVELD (1979). variaten eingesetzt werden. gig, Sind ferner die Raten zeitabhän­ so steht (gemäß Formel (20) in 2.3 J im Exponenten der überlebensfunktion die kumulierte Hazardfunktion R(t). - 179 - - 178 - Im Falle zeitunabhängiger Raten ist die mittlere Verweildauer­ Interpretation der Kovariaten-Effekte zu modifizieren. 5.4.2.2. riablen Y(t) Der E(T )' ist nun­ j mehr der Summe der zeitunabhängigen übergangsraten vom Zu­ Erwartungswert der Ankunftszeit im Zustand j, stand j prok: zu allen Zielzuständen k, also der Hazardrate rezi­ 1) In Kap.2 haben wir zwei mit einem stochastischen Prozeß ver­ Die Ankunftszeit T knüpfte Zufallsvariablen unterschieden: und die Zustandsraum-Variable Y(t). Bisher haben wir uns nur nicht jedoch explizit mit der Verteilung der Ankunftszeiten, mit derVerteilung von Y(t) beschäftigt. Dies rührt daher, daß beim Zwei-Zustands-Modell mit absorbierendem Zielzustand die Schreiben wir beispielsweise für den Zustand O die beiden Ratengleichungen (die eingeklammerten Indizes der a-Parameter verweisen auf den Ausgangs- und Zielzustand): X X 2 1 . (01) ·°'1(01) a.2(02) (143) r 01 x (144 ) r 02 x 1 2 Kenntnis der Verteilung von Y(t) keine neuen Einsichten bringt. Hier ist nämlich die Verteilung von Y(t) p (t)=P[Y(t)=ü) und 0 p (t)=P[Y(t)=1] (siehe Abb.5 in Kap.2) "automatisch" mit G(t) 1 gegeben, denn es gilt ja: p (t)=G(t) und p (t) 1-G(t)=F(t). 1 0 Die absolute (unbedingte) Wahrscheinlichkeit,zum Zeitpunkt t im Zustand 0 keit G(t), zu sein,ist ja identisch mit der Wahrscheinlich­ den Zeitpunkt t im Zustand 0 zu erleben,und p (t) 1 ist die dazu komplementäre Wahrscheinlichkeit F(t). (10(02) ,(11 (02) "°'2(02) I Bei Mehr-Zustands-Modellen ist dagegen die Ableitung der Wahr­ so erhalten wir jetzt für E(T ): 0 scheinlichkeitsverteilung bezüglich der einzelnen zustände j G (t} ist dabei in j der Regel nicht mehr mit der (unbedingten} Aufenthaltswahr­ im allgemeinen wesentlich komplizierter. scheinlichkeit im Zustand j identisch, da nun nicht nur so­ zusagen der "Abfluß", sondern auch der "Zufluß" wirken also in doppelter Weise auf die mittlere und x x 2 1 und Verweildauer ein, nämlich über die Beeinflussung von r 01 von r 2• Der Gesamteffekt einer Veränderung um beispielsweise 0 -Einheiten auf E(T l kann mittels Formel (145) bzw. im 0 allgemeinen Fall mittels Formel (14 2) berechnet werden. zum Zustand Zur Berechnung der Verteilung von Y(t), von aus von Personen j in Betracht zu ziehen ist. (t) für die Zustände j=1,2, ••• n, d.h. zur Berechnung leitet man zunächst Modellannahmen, insbesondere der Markov-Eigenschaft, ein System von Differentialgleichungen her, das den stocha­ stischen Prozeß definiert (siehe dazu Anhang 4). Mit der Lösung des Gleichungssystems erhält man sodann die Wahr­ 1) Allgemein gilt bei zeitabhängigen Raten: E(T.) J f t f.(t)dt= lt r,(t)exp[-R.(tl]dt J j J Q Q Im Falle zeitunabhängiger Raten gilt R j(t)=rj.t mit der oben angeführten Lösung (14 2) des Integrals. scheinlichkeiten p (t). j 181 - 180 - Man kann zeigen, daß das folgende System von linearen Diffe­ rentialgleichungen allgemein einen Markov- oder Semi-Markov­ � p -p können wir eine Gleichung eliminieren und 0- 1 erhalten dann das Gleichungssystem: Wegen Prozeß mit n diskreten Zuständen festlegt: (t)p. (t) (146) J (150) P o n + z; k=O k;fj Intuitiv läßt sich die Gleichung wie folgt deuten: Der erste Eine Lösung dieses Systems von zwei linearen Differential­ Term auf der rechten Seite ist das Produkt aus der Wahrschein­ gleichungen (d.h. lichkeit im Zustand j zum Zeitpunkt t zu sein, p , 1 mit der Neigung dem "Abfluß" zum Zustandswechsel. multipliziert Das Produkt entspricht aus Zustand j. Analog ist der zweite Term als Summe der "Zuflüsse" aus allen übrigen zuständen zu inter­ pretieren. "Zufluß" minus "Abfluß" ist dann die Wahrschein­ zu vereinfachen, Es ist aber im Auge zu behalten, Funktion von t ist. matischen Standard-Verfahren ohne größere Schwierigkeiten möglich, wendig, jedoch ist das Ergebnis im allgemeinen Fall so auf­ daß wir hier auf eine Wiedergabe verzichten (zur Lösungstechnik siehe z.B. ROMMELFANGER 1977, zu Beispielen Statt­ dessen wollen wir einige Spezialfälle betrachten. lassen Gleichgewicht. wir den Zeitindex t bei den Zustandswahrscheinlichkeiten immer weg. Zeit p und 0 zwar mit mathe­ der dynamischen Analyse siehe auch DIEKMANN 1980). lichkeitsänderung dp (t)/dt. j Um im folgenden die Notation etwas zwei explizite Funktionen der die die beiden Gleichungen erfüllen) ist stets eine Man kann leicht chungssystem immer ein stabiles zeigen, daß das obige Glei­ Gleichgewicht impliziert. Außerdem lassen sich die Gleichgewichtswerte p Ferner schreiben wir Schließlich wollen wir nur den Fall mit .::.!:�:.!::�::::!=::.:��:=­ größere Mühe ermitteln. 0 ohne und p 1 Vereinbaren wir folgende Abkürzungen: Rate betrachten. (1 52) a Drei-Zustands-Modell. Gemäß dem allgemeinen Ansatz (14 ) lau­ ten die Differentialgleichungen für das Modell mit drei zu­ ( 153) b ständen: ( 154) c (14 7) Po (14 8) p 1 ( 14 9) ( 15 5) d dann ist das Gleichgewicht immer dann stabil, ROMMELFANGER 1977, S.189 ff.): wenn gilt (vgl. - - 183 - 182 - (156) a+d<O keiner Therapie) auf die Gleichgewichtsverteilung läßt sich ermitteln. Ein Beispiel hierzu findet sich in der Arbeit von (157) ad-bc>O. HANNAN, Beide Stabilitätsbedingungen sind inuner erfüllt, TUMA und GROENEVELD 1977. wie der Konkurrierende Risiken. Leser leicht nachprüfen kann. Ein interessanter Spezialfall resul­ tiert aus den Gleichungen Welche Verteilung von Y{t) ergibt sich nun konkret im Gleich­ gewicht (d.h. für t+oo)? Um hierauf es nur erforderlich, eine Antwort in dem Gleichungssystem zu geben, (150) und ist (147) bis (149), 1 und 2 als absorbierend betrachtet werden wenn also gilt: wenn die Zustände (Abbildung 24), =o r 0=r 0=r r 12= 21 1 2 (151) p =p =o zu setzen. Im Gleichgewicht existieren wohl noch Be­ 0 1 wegungen zwischen den Zuständen, zu- und Abflüsse gleichen sich dabei aber aus, . sind null. d.h. die Wahrscheinlichkeitsänderungen . Für p 0=o und p =o erhalten wir nun zwei einfache 1 algebraische Gleichungen mit den beiden Unbekannten p . Die Lösung, 0 und also die Gleichgewichtsverteilung von Y(tl lautet bei zeitunabhängigen Raten: 24: Abbildung (158) p0 Ein Modell mit konkurrierenden Risiken In demographischen und medizinischen Anwendungen könnten die Zustände 1 und 2 cr (159) p 1 +ar 21 20 zwei verschiedene Todesursachen bezeichnen. Beim Studium von Mobilitätsprozessen ließe sich an die Kon­ ad-bc zeptualisierung von Aufwärts- und Abwärtsmobilität denken (CARROLL und MAYER 1982) und bei Migrationsprozessen könnte Für p 2 es sich um zwei Migrationsziele folgt: handeln. dells bzw. (160) zustände (z.B. Inland versus Ausland) Eine weitere Möglichkeit der Anwendung dieses Mo­ dessen Verallgemeinerung auf beliebig viele einer probabilistischen Entscheidungstheorie. Mit Hilfe der drei Gleichungen kann rr�n jeweils für bestimmte Gruppen", d. h. für bestimmte Kombinationen Gleichgewichtsverteilung prognostizieren. von Kovariaten, die Auch die Effekte und Ziel­ (dazu weiter unten) bezieht sich auf den Kontext 2 bezeichneten dann Die alternative Handlungen, Zustände während die Raten als Funktionen von Nutzenerwartungen aufgefaßt wer­ den könnten. einer bestimmten unabhängigen Variablen, etwa eines experi­ mentellen Gruppenunterschieds (z.B. Drogentherapie versus Mit den oben angeführten Restriktionen chungssystem (147) bis (149): folgt aus dem Glei­ - 184 - (1 61) P - 185 - Es folgt hieraus, o daß sich je zwei Zustandswahrscheinlich­ keiten der Zielzustände wie die entsprechenden Raten verhal­ ten: (1 62) p 1 (k#O,j!O) (169) Die Lösung für p 0 mit der Anfangsbedingung p0 (o)=1 (zum Zeit­ punkt t=O befinden sich alle Untersuchungseinheiten im Zu­ stand O) ist die Wachstumsfunktion: (164) stant bleiben. Diese Implikation ist eine strenge Testbedin­ gung des Modells. n E k=O und (163) ein und integrieren wir die beiden Gleichungen von 0 bis dann erhalten wir als Lösungen: sei dem interessierten Leser als Ubung überlassen. Eine weitere anschauliche Deutung von Gleichung man, (16 5) p (16 6) p2 (168) findet wenn man folgende Beziehungen einführt: 1 m wobei die Hazardrate r0 =r 0 +r die Summe der beiden Raten ist. 02 1 Das Modell läßt sich ohne Probleme auf n Zustände verallge­ meinern. (167) P Der Nachweis, daß gilt: t Po = e Setzen wir diese Funktion für p 0 in die Gleichungen (162) t, Beim Modell mit konstanter Rate muß der Quotient aus je zwei Zustandswahrscheinlichkeiten dem.�ach im Zeitablauf immer kon­ o Die Lösung, e d.h. die Verteilung von Y(t), ist die bedingte Wahrscheinlichkeit, daß unter der Vor­ jk aussetzung, daß ein Ereignis auftritt (Zustand j also ver­ lassen wird), der Zustandswechsel zum Zielzustand k erfolgt. Ferner gilt (Kap.2.3): lautet: -r .t o in (168) Aufgrund dieser beiden Beziehungen können wir für P k schreiben: k=1,2, • . • ,n - 186 - - (t) 187 - (175) P o p ist also das Produkt aus der unbedingten Wahrscheinlich­ k keit, daß bis zum Zeitpunkt t ein Ereignis auftritt, pliziert mit der bedingten Wahrscheinlichkeit, ser Voraussetzung daß multi­ unter die­ zum Zielzustand k gewechselt wird. zwei-Zustands-Modell mit reversiblen Ereignissen. Ein weite­ rer wichtiger Spezialfall wurde insbesondere van COLEMAN (1964a,1981) auf soziologische Probleme angewandt. zustandsmodell mit reversiblen Ereignissen Das Zwei­ folgt aus dem Gleichungssystem setzt werden (147) bis ( 149)', wenn r02=r12=r20=r2 =o ge­ 1 2 (Abbildung 5). Als nächsten Schritt berechnen wir allgemein die Verteilung von Y(t), d.h. nicht nur die Gleichgewichtsverteilung, dern die Werte von p0 und p wir berücksichtigen, son­ für beliebige Zeitpunkte t. 1 daß p1=1-p0 ist, so folgt aus Wenn (173): ( 177) Die Lösung der Differentialgleichung lautet: r 10 ��l�=======--=�;(2) Abbildung 2 5: 1178) Zwei-Zustands-Modell mit reversiblen Ereig­ nissen zustand o könnte z.B. als nicht-erwerbstätig und Zustand 1 als Erwerbstätigkeit gedeutet werden. Die Differentialglei­ Po [Po (OJ - Analog folgt aus Gleichung (174) 1-p : , (1 79) nach Substitution von p0 = p 1 0 chungen für das Modell lauten: Hierbei kennzeichnen p0 (o) und p (o) die Verteilung zu Beginn 1 des Prozesses, d.h. zum Zeitpunkt t=O. Man erkennt ferner an­ hand der beiden Gleichungen, wichtsverteilung (175) Setzen wir :Q, so erhalten wir die Werte der Gleichge­ wichtsverteilung als Lösungen der beiden resultierenden al­ gebraischen Gleichungen mit den beiden Unbekannten � und und daß sich für t+� die Gleichge­ (176) ergibt. Nebenbei bemerkt folgt aus der Gleichgewichtsverteilung: - 188 - p ( 180) - 189 - - die Übergangsrate 0 die erwartete P1 COLEMAN fahren (1981, Kap.II) vorzuschlagen, benützt diese Beziehung, um ein Ver­ mit dem die Effekte der Kovariate so­ gar anhand von Querschnittsdaten geschätzt werden können. Zwei zusätzliche Annahmen sind dafür allerdings erforderlich: Der stochastische Prozeß muß sich im Gleichgewicht befinden und die Stärke der jeweiligen Kovariateneffekte auf beide Raten wird als identisch angenommen. Die untersuchten Beispiele zeigen, daß die mathematische Ana­ lyse wichtige Modellkonsequenzen aufdeckt. l) ten Zustandswahrscheinlichkeiten pj Die abgeleite­ (die Verteilung von Y(t)) sind in allen Fällen als Funktion der Raten und der Zeit dar­ stellbar. In der Regel sind die Raten wiederum Funktionen von Kovariaten und der a- Effekte auf die Raten, oder ß-Parameter für die Stärke ihrer die z.B. mit dem Programm RATE anhand von Ereignisdaten geschätzt werden können. Somit können wir für beliebige Kombinationen von Kovariaten die scheinlichkeiten zu beliebigen Insgesamt hat sich gezeigt, Zustandswahr­ Zeitpunkten ableiten. daß wir mit stochastischen Mo­ dellen Kovariateneffekte auf: 1) Verweildauer - die Überlebensfunktion Ein weiterer Spezialfall, auf den wir hinweisen möchten, wird von TUMA, HANAN und GROENEVELD (1979) untersucht. Es handelt sich um eine COLEMANS Modell durch Hinzufügung eines Zustands. bis (149) werden Ausgehend von den die Restriktionen r 2o =r 21 =0 · Die resultierenden Formeln für die Zustandswahrscheinlich­ keiten finden sich in der erwähnten Schrift von TUMA et al. - und die Gleichgewichtsverteilung (sofern ein Gleichgewicht existiert) sowie auch auf F(t), nostizieren können. f (t) und die Verteilung von Y(t) prog­ Die Aussagekraft der Modelle ist damit wesentlich stärker als im Falle statischer Anal:l'sen. - 6. - 191 - 190 - delle berücksichtigt werden. Als Einstieg sei das inzwischen Ausblick "klassische" Bei der Analyse anderer Datenstrukturen als univariater An­ Werk von BARTHOLOMEW (1964b) COLEMAN (1973) sowie die Arbeit von empfohlen. kunftszeiten plus Kovariate können im Falle der Verletzung der Annahme eines Markov-Prozesses statistische Probleme auf­ treten. Die Auswertung von Lebensverläufen mit mehreren Epi­ soden - die Datenstruktur der Drogenkarriere stellt hierfür ein Beispiel dar - bereitet dann zusätzliche Schwierigkeiten, wenn die aufeinanderfolgenden Episoden einer Karriere nicht voneinander unabhengig sind. Korrellierende Ankunftszeiten kön­ nen sich darüber hinaus auch auf Individuen beziehen, zueinander in einer bestimmten, stehen. oder Vererbungseffekt (bei sukzessiven Episoden) halt als "event histories", Daten, etwa Panel- oder Quantal-Response­ sei auf die Bücher von COLEMAN (1981) und NELSON (1982) verwiesen. Beide Schriften befassen sich mit der Schätzung von Parametern stochastischer Modelle - nur eben auf der Basis weniger informationshaltiger Daten. In COLEMANS Buch sind auch die erforderlichen Computerprogramme abgedruckt. Eine ausführliche kommentierte Literaturübersicht zu methodischen etwa familiären Beziehung In solchen Situationen mag ein wie auch immer gear­ teter Trend (z.B. welche Für die Auswertung von Daten mit geringerem Informationsge­ Problemen der Analyse von Zeitverlaufsdaten sowie ein über­ blick über weitere EDV-Software findet man bei NELSON (1982). bei Vätern und Söhnen) präsent sein. In diesem Buch haben wir uns auf Methoden der statistischen Möglicherweise gelingt es, die stochastische Unabhängigkeit der Episoden durch Berücksichtigung relevanter Kovariate . garantieren. Die Markov-Annahme bezieht sich zu ja immer auf Gruppen mit gleichen Kovariatenkombinationen. Ist die Annahme in einem Modell verletzt, so kann durch Einbeziehung zusätz­ licher Kovariate das modifizierte Modell die Annahmen wieder­ um erfüllen. Genau dies ist ja der Grundgedanke sem Buch präsentierten Verfahren: der in die­ "Realitätsgerechte" Markov­ Modelle durch die Einführung von Kovariaten zu konstruieren. Auswertung von Ereignisdaten konzentriert. gene Publikation wert, Es wäre eine ei­ Methoden der Erhebung von Ereignis­ daten zu diskutieren. Ein wichtiges Problem hierbei ist z.B • die Validität retrospektiv erfragter Lebensverläufe. Welche Merkmale können mit welchem Grad an Gültigkeit retrospektiv erfaßt werden? Kann man (Siehe z.B. PAPASTEFANOU 1980 und TöLKE 1980.) z.B. mit gutem Erfolg Einkommensveränderungen im Ablauf der Berufskarriere rückblickend erfassen oder sind hierfür wesentlich aufwendigere prospektive Panel-Designs erforderlich? Welchen Stellenwert haben qualitative Erhebungs­ Eine andere Lösung des Problems korrelierender Episoden kann auf dem Weg der Entwicklung neuer Modelle gesucht werden. Hierzu sei auf FLINN und HECKMANS (1982) soden der Arbeitslosigkeit verwiesen. Auswertung von Epi­ Einen überblick zu ge­ eigneten Modellen findet man ferner in dem Buch von LAWLESS methoden? Die Geschichte der Erhebung von Lebensverlaufsdaten hat in Form meist qualitativer Untersuchungen von Biographien wie in der berühmten Studie von THOMAS und ZNANIECKI eine lange Tradition jüngster Zeit wird wieder an diese Tradition der Durchführung von Verlaufsanalysen angeknüpft, (1982). Projekten in den USA Auch die Idee der Einführung latenter, nicht-beobachtbarer Zustände kann bei der Konstruktion stochastischer Prozeßmo- (1927) (siehe auch KOHLI 1981). Aber erst in 1982a) wie die zunehmende Zahl von (siehe den kurzen Uberblick in ANDRESS und auch der Bundesrepublik dokumentiert - z.B. das - 193 - - 192 - Projekt Lebensverläufe und Wohlfahrtsentwicklung (MAYER und das geplante "Sozio-ökonomische Panel" Es ist anzunehmen, daß (HANEFELD 1978) 1982). diese Forschungen auch zu Problemen 1. der Methodik der Datenerhebung neue Antworten beisteuern werden. Zufallsvariable Zustandsraum Y(t)=j (Zustände [ (Absolute) p.(t)=P Y(t) J 1,2, • . • ,j, . • . ,n) Zustandsraum-Wahr­ scheinlichkeiten T. Zufallsvariable Verweildauer (Ankunftszeit) bezüglich Zustand j J tlberlebensfunktion im Zustand j Kumulierte Verteilung der Ver­ (t)= 1-G.(t) J weildauer im Zustand j (t)=lim �����- ,,�"""""',,-­ Dichteverteilung der Verweil­ llt+O dauer im Zustand j E( T. )= ft.f.(t)dt J J Erwartungswert der Verweildauer (Mittelwert, mittlere Lebenser­ Q wartung) im Zustand j q [ (t,t+llt)=P Y jk ] Y(t)=j (Bedingte) Übergangswahr­ scheinlichkeit vom zustand j den Zielzustand k im in Zeitinter­ vall (t,t+llt) (t)=lim ��--,-.,--�­ t+O Wbergangsrate vom Zustand j in den Zielzustand k (Rate, Risiko, Intensität des Prozesses) - 194 - r. (t) = J n r . lt) Jk E k=O kt'j - 2. Hazardrate (Harzardfunktion) Zielzustand Bezeichnen wir mit der Übergangswahrscheinlichkeit t l'<.(t)=Jr.(T)dT J J 0 195 - Kumulierte Hazardfunktion die Wahrscheinlichkeit, standswechsel vom Ausgangszustand O zum m r " (t) k � (t)= jk J Bedingte Wahrscheinlichkeit ei­ nes Zustandswechsels zum Zeit­ punkt t unter der Bedingung, daß zum Zeitpunkt t irgendein Zu­ tritt. ( unabhängige Variable) bei log-linearer Schreibweise l. J_ des log-linearen Modells in der Multiplikator-Schreibweise (�­ Effekte) Schätzwerte von Parametern Zur Erklä­ rung verweisen wir auf Abschnitt Anmerkung: 2. Zielzustand 1 ein­ bis zum Zeitpunkt t kein Er­ und bezeichnen wir mit r(t) die Über­ dann gilt: (t,t+At)=r(t).At+O(At) O(At)/At=O. p (t) bezeichnet die Wahrscheinlichkeit, daß sich ein Ele­ 0 ment zum Zeitpunkt t im Zustand O befindet. Wenn die Ereig­ "kein Zustandswechsel bis t" sel im Intervall (t,t+llt)" Koeffizienten der Kovariate x. Sterbetafel-Notation. lim At-+o nisse { ß-Effekte) 3. q daß O(At) ist dabei irgendeine Funktion mit der Eigenschaft Koeffizienten der Kovariate x. &,ß ,r gangsrate, (1) standswechsel (Ereignis) auf­ Kovariate tritt unter der Bedingung, eignis eingetreten ist, q (t,t+At) daß im Intervall (t,t+At) ein Zu­ (2) der Index o der Rate ro in Kap.4 auf die Baseline­ Hazardfunktion. In beiden Kapiteln bezeichnet der Index nicht den Zustand. (t). "kein Zustandswech­ ergibt sich: (t). llt-0 (lit)J für �t+O resultiert hieraus: (3) Definieren wir die kumulierte Hazardfunktion: t 1. Im Falle des Zwei-Zustands-Modells mit absorbie­ rendem Zielzustand wird bei den folgenden Termen auf die Indizes j und k verzichtet: T,G(t) F f(t), E(T), r(t), q(t) und R(t). Außerdem der Index sich abweichend von obiger und der Rate ri in Kap. 3 auf das i 'te p (t,t+At) 0 und unabhängig sind, (4) R(t) !r(T)dT dann erhält man als Lösung der Differentialgleichung dem Anfangswert p (0) 0 die Überlebensverteilung: (3) mit - 197 - - 196 - (5) R(t) G(t)=p (t)=e- Einige häufiger verwendete 0 Hieraus folgt die kumulierte Verteilung der Ankunftszeiten: (6) F(t)=1-e - R ( t) constant Ct f(t)=--,;-� =,r(t)e Wird Ausdruck t +Bee -R(t) durch Ausdruck (7) (5) dividiert, so kann für "A p P.t) -l p 1+(1.t) (5) ein weiterer Ausdruck für die Über­ Poisson Gompertz B Ct A. t+ ( e -1) C Makeham ln Weibull Log- t 1 + 0. t)P] logistisch AC[,\- (t+,\)e-t/,\J -t/f. gangsrate: r.t p (At) . te Außerdem folgt aus Bezeichnung � Ct_ 1) ( c p )tp(A.t) -l die Übergangsrate geschrieben werden: aufgeführt: R(t) Übergangsrate r(t) mit der Wahrscheinlichkeitsdichte: (7) Zeitabhängigkeiten ("Entwick­ lungshypothesen") sind in der Tabelle Sichel Wenn die Ubergangsrate als Funktion der Zeit und Funktion von Kovariaten geschrieben wird, dann hat die Likelihood-Funktion bei N unabhängigen Beobachtungen die folgende Gestalt: (9) r(t) N (12) Der Erwartungswert von T, d.h. Ausgangszustand, die mittlere Verweildauer ist: im L(0)=!I(f(t.,x(i), l. i E(T)= und .f(t) dt nis Bei zeitunabhängiger Rate r beträgt der Erwartungswert: (11) E(T) Jt.re -r. l. ,e)] (l-di) Hierbei ist x(i) ein Vektor mit den Beobachtungswerten der Kovariate für (10) (t. ,x(i) Individuum i, 8 ist ein Vektor mit Parametern ist eine Indikatorvariable, die besagt, ob ein Ereig- zum Zeitpunkt eingetreten ist (d �1) oder ob es sich i um eine zensierte Beobachtung handelt (d =O). Wie man sieht, i besteht die.Likelihood-Funktion aus zwei Teilen: Der Wahr­ scheinlichkeitsdichte der Ankunftszeiten für nicht-zensierte r und der überlebens·funktion für zensierte Daten. 198 - - 199 - Maximum-Likelihood-Schätzwerte sind diejenigen Werte für den Die Summierung erfolgt immer über alle Beobachtungen i= 1, Parametervektor 8, bei denen die Likelihood-Funktion (bzw. N. deren Logarithmus) ein Maximum aufweist. N1= stands-Modelle mit reversiblen Ereignissen findet man in 3. HANNAN und GROENEVELD 1 979. Ableitung der Maximum-Likelihood-Schätzer bei qualitativen Kovariaten Anzahl aller Ereignisse für die x1=1-Gruppe v = Summe aller exakten Ankunftszeiten 0 für die x =0-Gruppe 1 v1 = Summe aller exakten Ankunftszeiten für die x 1= 1 -Gruppe w = Summe aller zensierten Zeiten für die x 1=o-Gruppe 0 w1= Summe aller zensierten Gehen wir zunächst von einer qualitativen Variablen x 1 mit der Codierung 0/1 aus und schreiben wir dafür eine log-lineare Zeiten für die x 1=1-Gruppe, sich (15) wie folgt schreiben: so läßt Ratengleichung: (13) Unter Berücksichtigung von G(t)=exp(-rt), der f (t)=r.exp(-rt) und zeitunabhängigen Rate (13) lautet die Likelihood-Funktion: N rr.{ a (a1 ) 0 x 1 (i) • 1 Als partielle Ableitungen nach a 1 dukte. so erhält man Summen anstelle der Pro­ Die Lage des Maximums verändert sich hierdurch nicht: ln a +rd x 1 0 i (1 (); 1 (i) :'.1 (17) exp (18) Logarithmiert man L, In a.1-a.0raia.1 x 1 (i) t i , N = Anzahl aller Ereignisse für die x 1=0-Gruppe 0 Die Verallgemeinerung der Likelihood-Funktion auf Mehr-Zu­ TUMA, • • • Führen wir folgende Bezeichnungen ein: a., a ln L ra;- ao - x 1 (i) (20) a = 1 erhalten wir: - a1V 1-V O- a1W 1-W O und (18) null. setzten wir die beiden Ablei­ Nach einigen sich die beiden Schätzformeln: (19) 0 V W a.O 1 a.O 1 Um ein Maximum zu bestimmen, tungen (17) und a Umformungen ergeben - 201 - - 200 - Man kann leicht zeigen, 1,2,3, (19) • • daß im allgemeineren Fall mit l� dichotomen 0/1-Variablen die Verallgemeinerung von • die Form hat: Berücksichtigt man die Definitionen der Übergangsrate und der Hazardrate (Anhang 1), so erhalten wir als die Differentialgleichung für zustand j: N l ,., (21>&1=v1 +w1 /ao .'!<. wobei die Schätzformel für 4. a0 (23) unverändert bleibt. k;\j Die Ableitung der Differentialgleichungen für die Zu­ standswahrscheinlichkeiten bei Multi-State-Modellen Unter der Annahme eines Markov-Prozesses ist die Wahrschein­ lichkeit, daß sich eine Untersuchungseinheit zum Zeitpunkt (t+llt) im Zustand j befindet, die Summe aus zwei Termen, lich der Wahrscheinlichkeit zum Zeitpunkt t im Zustand näm­ j zu sein mal der Wahrscheinlichkeit, daß kein Ereignis eintritt, plus der Summe aus den Produkten: nem anderen Zustand kfj zum Wahrscheinlichkeit in ei­ Zeitpunkt t m�ltipliziert der Wahrscheinlichkeit eines Wechsels zum Zustand j. mit Formal geschrieben: (t) [1- [ Cj k ' (t,t+l'itJ ] Jk + l: k p (t)q ' (t,t+l\t) k kJ kh kfj Hieraus folgt: k (22) -p.(t)r.(t)+ E p (t)r .(t). k kJ J J k (t,t+llt) Limes f\t+O - 203 - Literatur Andreß, of H.J., ing Methods of Temporal Analysis: An Illustration Anal ysis with Mobility Data, VASMA Work, Mannheim 1982a Andreß, H.J., Tätigkeitswechsel und Berufserfahrung. zeitbezogener Daten mit Hilfe von Sterbetafeln eines Beispiels aus der Mobilitätsforschung, Zeitschrift für Soziologie, S.380-400 1984 Bartholomew, 2.Aufl., Becker, 4/1982b, of Event-Histories with Generalized A.Diekmann und P.Mitter, Hrsg., Pro­ Modelling of Social Processes, New gress in York Jg.11, H.S., D.J., Stochastic Models for Social Processes, London 1973 Outsiders: Studies in the Sociology of Deviance, New York 1963 W.Schuboe, Beutel, P. , New York 1983 Bortkiewicz, L.v., SPSS 8, 3.Aufl., Das Gesetz der kleinen Zahlen, Stuttgart- Leipzig 1898 Carr-Hill, R.A. und C.D.Payne, Crime: Accident or Disease: An Exploration Using Probability Models for the Generation of Macro-Crirninological Data, Journal of Research in Crime and Delinquency, Jg.8, 1971, S.133-155 Carr-Hill, R.A. und K.I. Macdonald, Problems in of Life Histories, in: R.E.A.Mapes, Processes in Sociology, University of Discrete Dependent Variab­ Carroll, les: Nr. 1982/08, Mannheim 1982 Carroll, G.R. und K.U.Mayer, Wage Attainment Process, 1982 Introduction to Stochastic Processes in Bio­ , J., New York 1968 Introduction to Mathematical Sociology, New York - 204 - - Coleman, J., Models of Change and Response Uncertainty, Hall 205 W.J. und J.A.Wellner, Confidence Bands for a Survival from Censored Data, Biometrika 67, 1980, S.133-143 Englewood Cliffs 1964b Hannan, M.T., N.B.Tuma, L.P.Groeneveld, Incorne and Marital Events: Evidence from an Income-Maintenance Experiment, Coleman, J., Longitudinal Data Analysis, New York 1981 Cox, D.R., Regression Models and Life Tables, Journal of American Journal of Sociology, Bd.82, 1977, S.1186-1211 the Royal Statistical Society, Jg.34, 1972, S.187-220 David, H.A. und M.L. Moeschberger, The Theory of Competing Risks, London 1978 Diekmann, A., Dynamische Modelle sozialer Prozesse, München­ Wien 1980 Diekrnann, A. und P.Mitter, The "Sickle Hypothesis". A Time Dependent Poisson Model with Applications to Deviant Behavior and Occupational Mobility, Journal of Mathe­ rnatical Sociology, Bd.9, 1983, S.85-101 Diekmann, A. und P.Mitter, Hrsg., Progress in Stochastic of the for Austrian and US Marriage P.Mitter, Hrsg., Dixon, W.J., M.B.Brown, "Sickle Func- Models of Divorce Rates Cohorts, in: A.Diekmann und Harder,Th., Dynamische Modelle in der empirischen Sozialfor­ schung, Stuttgart 1973 Kalbfleisch, J.D. und R.L.Prentice, The Statistical Analysis Kaplan, E.L. und P.Meier, Nonparametric Estimation frorn rn­ complete Observations, J.Amer.Statist.Assoc.53, 1958, S.457-481 Kohli, M., Wie es zur daraus geworden ist. 1984b L.Engelman, J.W.Frane, M.A.Hill, R.I.Jennrich und J.D.Toporek, BMDP Statistical Software, Berkeley-Los Angeles-London 1981 Doeringer, P.B. und M.I.Piore, Interna! Labor Markets and Manpower Analysis, Lexington, Mass. 1971 Elandt-Johnson, R.C. und N.L.Johnson, Data Analysis, New York 1980 Survival Models and Feller, w. , On a General Class of Contagious Distributions, The Annals of Mathematical Statistics, Jg.14, 1943, S.389-400 W., Probability Theory and its Applications, New York 1950 Flinn, C.J. und J.J.Heckman, Models for the Analysis of Labor Force Dynamics, in: R. Basmann, G. , Advances in Econometrics, Vol.1, London 1982, s. Grass, D.F., Mathematical Criminology, New Jersey 1979 A.J. und V.A.Clark, Survival Distributions: Applications in the Biornedical Reliability Sciences, New York 1975 Methode" kam und was aus der Geschichte der Soziologie, Jg.10, Sozialforschung, 3/1981, S.273-293 Land, K.C., Some Exhaustible Poisson Process Models of Divorce by Marriage Cohorts, Journal of Mathematical Sociology, Jg.1, 1971, S.213-232 Lawless, J.F., Statistical Models and Methods for Lifetirne Data, New York 1982 Mayer, K.U., Lebensverläufe und Wohlfahrtsentwicklung, Pro­ jektantrag im Rahmen des Sonderforschungsbereichs 3, Universität Frankfurt und Mannheim 1978 Miller, R.G., Least Biometrika 63, 1 with Censored Data, Müller, W., für die Murray, Greenberg, Das sozioökonomische Panel. Eine Kurzinforma­ tion, Arbeitspapier Nr.65 des Sonderforschungsbereichs 3, Universität Frankfurt und Mannheim 1982 Prog:ress in Stochastic Modelling of Social Processes, New York Feller, Hanefeld, U., of Failure Time Data, New York 1980 Modelling of Social Processes, New York 1984a Diekmann, A. und P.Mitter, A tion" with Alternative Hannan, M.T. und G.R.Caroll, Dynamics of Formal Political Structure, American Sociological Review, Jg.46, 1981, S.19-35 Konferenzpapier W., Hrsg., Numerical Methods for Unconstrained Optimization,London-New York Nelson, w. , Applied Life Data 1972 Analysis, New York 1982 - 207 - 206 - Nie, N.H. und C.H.Hull, ber 1978 SPSS Release 8 Update Manual, nisse derforschungsbereichs heim 1980 Rapoport, A., schaften, Dezem­ Mann- 1977 A.B. und A.S�rensen, Tarone, R.E. und Equality of S.1 56-160 Mathematical Sociology, Paris On Distribution-Free Tests for Distributions, Biometrika 64, 1977, Thomas, W.I. und F.Znaniecki and America, New York 1 The Polish Peasant in Europe retrospektiver Verlaufsdaten. Tölke, A., Qualitative Nachbefragung, Arbeitspapier Nr. 30 des Scmcie.rfor:s<�h·unq�;biere 3, Universität Frankfurt und Mannheim 1980 Tukey, J.W., Tuma N.B., Tuma, N.B. Exploratory Data Analysis, Invoking Rate, Reading 1977 Arbeitspapier des in Mannheim (ZUMA), 1979 lichkeit 64 bedingte überlebenswahrschein­ lichkeit 65 Compound-Poisson-Prozeß 172 conditional Likelihocd 100 Cox-Modell (siehe Modell, - �roportional-Hazards-) Daten - change- 173 - Ereignis- 21 ff., 25 ff. 25 ff. M.E., R.M.Figlio und Th.Sellin, Delinquency in a Cohort, Chicago and London 1979 of nisdaten) explorative Datenanalyse 31, 58 f. Exponentialverteilung 145 ff. Extremwertverteilung 148 f. Gehan-Breslow-Test (siehe Wilcoxon-Test l Gleichgewichtsverteilung 182 Gleichverteilungsannahme 62 Gompertz-Makeham-Verteilung 149 ff.' 164 ff. graphische Verfahren 103, 154 ff. Hazardrate 33, 51 f., Heterogenität 49 111, 178 Informationsgehalt 32 27 28 - Zeitpunkt- 26 - zensierte 23 ff. Differentialgleichungen der Zustandswahrscheinlich­ keiten 180, 200 f. Dummy-Variable 99, 124 dynamische Analyse 177 ff. Effekte 121 27 (siehe Ereig- Gamma-Verteilung 49 bedingte Sterbewahrschein­ und M.T.Hannan, Approaches to the Censoring Problem Tuma, N., M.T.Hannan und L.P.Groeneveld, Event Histories, American Journal of 1979, s.820-854 18 harn-Modells 164 asymptotisch 78 Zentrums für Um­ in Analysis of Event Histories, in: K.Schuessler, Hrsg., Sociological Methodology 1979, San Francisco 1979, S.209240 , Absorbieren er Zustand Ankunftszeit lung 12, 33, 44 ff. - Wahrscheinlichkeitsdichte 33, 40 ff. Asymptote des Gompertz-Make­ Mathematische Methoden in den Sozialwissen­ Würzburg-Wien 1980 und Differentialgleichungen, Sprensen, Sachregister Entscheidungsexperiment 171 Entwicklungshypothesen 18 Episode 21 ff., 174 Ereignisdaten (siehe Daten) Ereignishäufigkeit 28 Informationsmatrix 106 Intensität 38 Intervallskala 120 Kausalhypothesen 18, Kohorte 23, 60 f. Konfidenzintervall 129 f. 19, 50 79 f., konfirmatorische Datenanalyse 31 konkurrierende Risiken 183 190 korrelierende 95 ff., Kovariate 13, 1 124 ff., 164 Life-Table (siehe Sterbetafel) Likelihood-Ratio 106, 141 log-linear 98, 120 Log-logistische Verteihmg 153 ff. - 208 Studienskripten zur Soziologie 153 ff. Log-Rank-Test (siehe Test) Mantel-Cox-Test (siehe SavageTest Markov-Prozeß 36 Maximum - globales lokales 135 Maximum-Likelihood-Schätzung 52 ff.' 66 ff.' 125, 188 f. mittlere verbleibende Lebens­ zeit 145 Modell - stochastisches 13 ff., 30., 33 ff. - Zwei-Zustands- 37 ff. - Mehr-Zustands- 51 f., Sichel-Modell 152 Survival-Analyse 11 f., 18 Stabilitätsbedingung 182 Standardfehler 66, 105, 129 Stepwise-Regression 105 ff. Sterbetafel 60 ff. stochastische Prozesse, Modelle (siehe Modelle) Nicht-parametrische Verfahren D. Urban, Regressionstheorie und Regression s technik 245 Seiten. DM 16,80 37 E. Zimmermann, Das Experiment in den Sozialwissenschaften 308 S eiten. 38 F. DM 17,80 Böltken, Auswahlverfahren Eine E i nführung für Sozialwissenschaftler 407 S eiten. DM 18,80 39 H. J. Humrnell, Probleme der Mehrebenenanalyse 160 Seiten. DM 12,80 40 überlebensfunktion 38 ff. übergangsrate 38 ff., 48 41 F. Golzewski/W. Reschka, Gegenwart sgesellschaften: Polen 58 ff. Harder, Dynamische Modelle 120 Seiten. DM 11,80 42 Varianz-Kovarianzmatrix 106 verallgemeinertes lineares Modell {GLIM) 144, 173 Verweildauer (siehe Ankunfts­ zeit) Th. in der empirischen Sozialforschung Übergangswahrscheinlichkeit 35 f. Newton-Verfahren 135 W. Sodeur, Empirische Verfahren zur Klassifikation 183 Seiten. DM 12,80 43 H. M. Ke pplinge r , Massenkommunikation 207 Seiten. DM 15,80 44 H.-D. Schneider, Kleingruppenforschung 351 Seiten. DM 17,80 Panel-Daten (siehe Daten Parametrische Verfahren 15, 119 ff. Partial-Likelihood-Methode 100 f. Poisson-Prozeß 43 f. Product-Limit-Schätzer 76 ff. Proportionalitätsannahmen im Cox-Modell 102 ff. Quantal-Response-Daten (siehe Daten) Querschnittsdaten (siehe Daten) Rate (siehe Ubergangsrate) Residuum 107 f. Risiko 14, 38 Risikomenge 64, 36 383 Seiten. DM 18,80 173 - Proportional-Hazards- 96 ff. Multiplikatoren 98 15, Savage-Test 87, 90, 94 Score-Vektor 106 Semi-Markov-Prozeß 36 Verfahren ff. 15, 100 Wald-Test 106 Weibullverteilung 146 ff. Wilcoxon-Test 86 f. , 90, 45 94 Zählprozeß 19 Zeit chronologische 25 - Prozeß 25 66 Daten Zustandsraum 33 (siehe Daten) Zustandsraum-Variable 33 ff., 79 ff. H. J. Helle, Verstehende Soziologie und Theorien der Symbolischen Interaktion 207 Seiten. DM 15,80 46 T. A. Herz, Klassen, Schichten, Mobilitäten 316 Seiten . DM 48 18,80 S. Jensen, Talc o t t Parsons Eine Einführung 204 Seiten. DM 15,80 49 J. Kriz, Met ho denkritik empirischer Sozialforschung 292 Seiten. DM 17,80 120 G. Büschges, Einführung in die Organisationssoziologie 214 Se i t en. DM 16,80 121 W. Teckenberg, 478 Seiten. 122 A. DM Diekmann/P. Mitter, Methcxlen zur Analyse von Zeitabläufen 208 Seiten. DM 15,80 Preisänderungen vorbehalten UdSSR