3 Modelle der Ereignisanalyse 3.1 Grundlagen der Ereignisanalyse Ging es im vorangegangenen Kapitel 2 um diskrete oder begrenzt abhängige Variablen, die wir im Kern auf latent stetige und unbegrenzt abhängige Variablen zurückgeführt haben, so betrachten wir nun im Rahmen der Ereignisanalysen explizit diskrete Ereignisse und untersuchen, wieviel von diesen Ereignissen in einem bestimmten Zeitraum auftreten (Zähldaten-Modelle), wie lange es dauert bis das nächste Ereignis auftritt (Verweildauer-Modelle), bzw. wie hoch zu einem Zeitpunkt die Wahrscheinlichkeit des Auftretens eines Ereignisses ist (Übergangsraten- bzw. Hazard-Rate- oder SurvivalModelle). Die Grundlage der Ereignisanalysen bildet der Poisson-Prozeß (vgl. Mood, Graybill und Boes, 1974, Kapitel III, Abschnitt 2.4.) als spezieller stochastischer Prozeß. Als stochastischen Prozeß bezeichnet man die Folge von Zufallsvariablen zt in der Zeit, die durch die Folge von Wahrscheinlichkeitsdichten ( f ( x( t1 )), f (x (t 2 )),K) kurz: f ( x( t ); t ∈T ) beschrieben wird. Der Poisson-Prozeß ist durch folgende Annahmen auf Bernoulli-Experimente zurückzuführen: 1. Der Zeitraum T wird in n gleich große Intervalle der Länge ∆t unterteilt, so daß T = n∆t ist. 2. In jedem Intervall der Länge ∆t vollzieht sich genau ein Versuch der Ziehung aus einer Bernoulli-Verteilung, d.h. im Zeitraum T finden genau n Versuche statt. 3. Dabei tritt entweder ein bestimmtes Ereignis (z.B. ein Telefonanruf, eine Patentanmeldung etc.) auf oder nicht. Es gibt also zwei Merkmalsausprägungen: (3.1) 1 wenn das Ereignis auftritt x= 0 wenn das Ereignis nicht auftritt 4. die Wahrscheinlichkeit, daß im Intervall der Länge ∆t ein Ereignis auftritt, ist unabhängig davon, was im vorhergehenden Intervall und im nachfolgenden Intervall geschieht, d.h. die n Versuche sind unabhängig. 76 5. Die Wahrscheinlichkeit, daß in einem Intervall der Länge ∆t ein Ereignis auftritt, hängt von der Länge des Zeitintervalls ∆t ab, d.h. p = c ⋅ ∆t . Damit gilt np = nc∆t = cT . Dabei ist c ist die durchschnittliche Anzahl der Ereignisse in der Einheitsperiode T = 1 (mean rate of occurence). 6. Die Ereignisse erfolgen in sehr kleinen Intervallen, d.h. ∆t → 0 (also auch p → 0 ) und n → ∞ und np = cT = λ = konstant Dies sind gerade die Bedingungen, unter denen sich die Binomial-Verteilung durch die Poisson-Verteilung approximieren läßt. Die Wahrscheinlichkeiten für ein Signal bei größerem ∆t folgen der Binomial-Verteilung, im Grenzwert geht die Binomial-Verteilung in die Poisson-Verteilung über. Die Wahrscheinlichkeit für die Anzahl der Ereignisse lautet dann bei gegebenem T : (3.2) f ( y) = ( cT ) y e− cT y! bzw. f ( y) = λ y e− λ y! Beispiel: Eine Telefonvermittlungszentrale wird in der Zeit T = 1 Stunde im langfristigen Durchschnitt sechsmal verlangt, d.h. np = c = 6 . Die Wahrscheinlichkeit, daß in einer Stunde kein Anruf ( y = 0 ) erfolgt ist dann : f ( y = 0) = 60 e −6 = 0,003 . 0! Der Poisson-Prozeß bestimmt die Verteilung für die Anzahl der Ereignisse in einer gegebenen Zeitspanne T. Man kann allerdings auch nach der Zeit bis zum nächsten Ereignis fragen. Die Zeit ist dann ebenfalls eine Zufallsvariable, deren Wahrscheinlichkeitsverteilung sich wie folgt aus dem Poisson-Prozeß herleitet: 1. Man zerlege den Zeitraum bis zum nächsten Signal in sehr kleine konstante Intervalle der Länge ∆t , so daß n∆t der Zeitraum bis zum nächsten Ereignis ist. Dabei ist ∆t so klein, daß in dieser Zeit höchstens ein Ereignis auftritt, d.h. in der Zeitspanne ∆t sind nur die Ereignisse z = 1 (das Ereignis tritt auf) oder z = 0 (das Ereignis tritt nicht auf) möglich. 2. Wir nehmen jetzt an, daß für die Zufallsvariable z ein Poisson-Prozeß gilt mit f (z) = (c∆t ) z ⋅ e −e ∆t . Der Zeitraum bis zum nächsten Ereignis ist dann dadurch gez! 77 kennzeichnet, daß in den ersten ( n − 1) Zeiträumen der Länge ∆t kein Ereignis auftritt ( z = 0 ) und im letzten Zeitraum ein Ereignis erfolgt ( z = 1 ). Es gilt also: z1 = 0, z2 = 0,L , z n−1 = 0, z n = 1. Wegen der im Poisson-Prozeß unterstellten Unabhängigkeit ist dann f (n ) = f ( z1 = 0, z 2 = 0,L , zn−1 = 0, zn = 1) = f ( z1 = 0) ⋅ f ( z2 = 0) ⋅ L ⋅ f ( zn−1 = 0) ⋅ f ( z n = 1) −c ∆t − c∆ t − c∆ t 1 − c∆t (c ⋅ ∆t ) e ( c ⋅ ∆t ) e ( c ⋅ ∆t ) e (c ⋅ ∆t ) e ⋅ L ⋅ 0! 0! 0! 1! − c∆ tn − λn = c ⋅ ∆t ⋅ e = λ ⋅e mit λ = c∆t und n > 0 0 = 0 0 Man bezeichnet die Verteilung f (n ) = λe − λn als Exponential-Verteilung. Sie ist der Ausgangspunkt für Verweildauer-Modelle bzw. Übergangsraten- oder HazardratenModelle. Wir bezeichnen die Zeit im Rahmen der Hazardraten-Modelle wieder mit t statt mit n . 3.2 Zähldaten-Modelle Wir betrachten zunächst ökonometrische Zähldaten-Modelle, also Modelle, die die Anzahl des Auftretens von Ereignissen, wie beispielsweise die Anzahl von Patentanmeldungen innerhalb eines Jahres, erklären. Neben dem Poisson-Modell wird häufig eine flexiblere Verallgemeinerung, basierend auf der Negativ-Binomialverteilung (vgl. Mood, Graybill und Boes, 1974) verwendet, das Negbin-Modell. Zu ökonometrischen Zähldaten-Modellen existiert mit Winkelmann (1997) eine exzellente Monographie. 3.2.1 Das Poisson-Modell Das einfachste Modell, das die Anzahl der Ereignisse innerhalb eines Zeitraums zu erklären versucht, ist das Poisson-Modell (Frome, Kutner, und Beauchamp, 1973, sowie Hausman, Hall, und Griliches, 1984). Wir können uns beispielsweise die Frage nach den Determinanten der Anzahl von Patentanmeldungen eines FuE-treibenden Unternehmens in einem Jahr vorstellen. Das Poisson-Modell hat folgende Form 78 P( yi ) = (3.3) = e − λi λi yi yi ! mit λi = exp X i β für yi = 0,1,2,K e − exp( Xi β ) (exp( X i β )) yi yi ! d.h. der Parameter λi ist als exp X i β exponentiell in Abhängigkeit von erklärenden Variablen parametrisiert. Für den Erwartungswert und die Varianz gilt im Poisson-Modell: (3.4) E ( yi ) = V ( yi ) = λi = e Xi β und für die marginalen Effekte: (3.5) ∂E ( yi ) = λi β k = e X i β βk ∂xi k Aus den Eintrittswahrscheinlichkeiten (3.3) läßt sich leicht die Log-Likelihoodfunktion konstruieren, N (3.6) ( ln LPoisson = ∑ − e i =1 X iβ ) + yi X i β − ln yi ! die der Maximum-Likelihood-Schätzung zugrunde liegt. An der Gleichheit von Erwartungswert und Varianz gemäß Gleichung (3.4) wird bereits der Schwachpunkt des Poisson-Modells ersichtlich. Die Gleichheitsbedingung ist in empirischen Anwendungen sehr häufig verletzt, d.h. die Varianz ist größer. Man spricht in diesem Zusammenhang von Overdispersion. Einen einfachen Test auf Overdispersion haben Cameron und Trivedi (1990) entwickelt. Die Null-Hypothese lautet: V ( yi ) = E ( yi ) und die Gegen-Hypothese: V ( yi ) = E ( yi ) + α g (E ( y i ) ) . 3.2.2 Das Negbin-Modell Das Negbin-Modell (Negatie-Binomial-Regressionsmodel) folgt als Gamma-Mixture einer Poisson-Verteilung (vgl. Mood, Graybill, und Boes, 1974), indem wir für den Parameter λi der Poisson-Verteilung folgende Funktion spezifizieren: (3.7) ln λi = X i β + ln ε i 79 wobei ε i Gamma-verteilt ist mit Parameter θ und der Dichte: θ θ −θεi θ −1 g (ε i ) = e εi Γ(θ ) (3.8) Für das Zähldaten-Modell folgt aus der Gamma-Verteilung des Parameters der Poisson-Verteilung die Negativ-Binomial-Verteilung: ∞ e − exp( X i β )ε i (exp( X i β )ε i ) yi θ θ ε θi −1e−θεi dε i y ! Γ ( θ ) i 0 P( yi ) = ∫ (3.9) yi θ Γ(θ + yi ) exp( X i β ) exp( X i β ) = 1− Γ( yi + 1)Γ (θ ) exp( X i β ) + θ exp( X i β ) + θ Das Negbin-Modell (Cameron und Trivedi, 1986) kann ebenfalls mit der MaximumLikelihood-Methode geschätzt werden. 3.2.3 Beispiel: Der Einfluß des Patentwertes auf die Zitationshäufigkeit von Patenten Harhoff, Narin, Scherer und Vopel (1999) haben in einer vergleichenden Studie zwischen den U.S.A. und Deutschland den Einfluß des Patentwertes auf die Zitationshäufigkeit von Patenten in nachfolgenden Patenten untersucht. Der Patentwert wurde in direkten Unternehmesbefragungen erhoben, indem Patenthalter gefragt wurden, zu welchem Preis sie bereit wären, ihr Patent zu verkaufen. Folgende Ergebnisse des Negbin-Modells haben sich ergeben: Tabelle 3.1 Zitation von Patenten (Negbin-Modell) Variable USA Konstante 2.267 *** Patentwert (log) 0,136 *** Deutschland -0,703 0,105 *** N 192 752 Pseudo R2 0,10 0,03 Ein wesentliches Ergebnis dieser Studie, die als eine der wenigen Patente nach ihrem tatsächlichen Wert unterscheidet, ist, daß die Zitationshäufigkeit deutlich mit dem Wert der Patent zunimmt. 80 3.3 Hazardraten-Modelle Auch im Hazardraten-Modell wird versucht, geeignete erklärende Variablen für den Parameter λ zu finden. Allerdings interessiert nicht die Anzahl der Ereignisse innerhalb eines Zeitraums sondern die Dauer bis zum nächsten Ereignis. Unter Umständen handelt es sich hierbei um das erste Ereignis, da Ereignisse wie der Konkurs eines Unternehmens oder der Tod einer Person zumindest für ein Individuum nicht mehrfach beobachtet werden kann. Die Basisverteilung ist die Exponential-Verteilung : f (t ) = λe λt . (3.10) Man nimmt nun an, daß die durchschnittliche Verweildauer in der Arbeitslosigkeit, die im Exponential-Modell 1 λ ist, für verschiedene Individuen sich je nach Schulbildung, Le- bensalter, bisheriger Berufserfahrung, Beruf unterscheidet. Bezeichnen wir diese Merkmale als X i so erhalten wir für jedes Individuum i eine andere zeitkonstante Hazardrate: (3.11) λ ( X i ) = exp( X i β ) Bevor wir uns der Schätzung dieser Modelle zuwenden, führen wir einige wichtige Grundkonzepte für Hazardraten-Modelle ein. Wir nehmen an, daß die Dauer Ti der i -ten Beobachtung eine kontinuierliche Zufallsvariable mit Dichtefunktion f (t ) und Verteilungsfunktion F (t ) ist. Die Survivor- oder Überlebensfunktion S ( t) ist die Wahrscheinlichkeit, daß ein Individuum den Zeitpunkt t erlebt, d.h. daß ein Episode mindestens bis t andauert oder ein Ereignis nicht vor t eintritt (3.12) S ( t ) = P( T ≥ t ) = 1 − F ( t ). Die Hazard- oder Übergangsrate ist der Grenzwert der bedingten Wahrscheinlichkeit, daß die Episode im Intervall [t , t + dt] zu Ende geht unter der Voraussetzung, daß die Episode bis zum Beginn dieses Intervalls andauert, d.h. die bedingte Wahrscheinlichkeit, daß das Ereignis in t eintritt, gegeben, daß es vorher nicht eingetreten ist: (3.13) P (t ≤ T < t + dt | T ≥ t ) P(t ≤ T < t + dt ) / dt f ( t ) f (t ) = lim = = dt →0 + dt →0 + dt P(T ≥ t ) S (t ) 1 − F (t ) λ (t ) = lim 81 Für die Beziehung zwischen Survivorfunktion und Hazardrate gilt außerdem: (3.14) t S (t ) = exp − ∫ λ (u ) du und 0 t f (t ) = λ (t ) S (t ) = λ (t) e x p −∫ λ (u ) d u 0 da t (3.15) t f (u ) du = − ln(1 − F ( u)) t0 = − ln(1 − F (t )) = − ln S ( T ). 1 − F ( u ) 0 Λ( t ) = ∫ λ (u )du = ∫ 0 Λ(t) bezeichnet die sogenannte kumulierte Hazardrate. Aus den Beziehungen zwischen λ ( t ) , S ( t) und f (t ) wird deutlich, daß die Dauer der Episode durch die Spezifikation einer dieser drei Größen eindeutig beschrieben ist. Die Spezifikation des Hazardraten-Modells erfolgt entweder 1. parametrisch, d.h. durch bestimmte Verteilungsannahmen und Annahmen über den zeitlichen Verlauf (positive Zeitabhängigkeit: dλ( t ) / dt > 0 ; negative Zeitabhängigkeit: dλ( t ) / dt < 0 ; Zeitkonstanz: dλ( t ) / dt = 0 der Hazardrate, 2. oder nichtparametrisch (z.B. Sterbetafel-Methode, Kaplan-Meier-Schätzung). 3.3.1 Parametrische Hazardraten-Modell 3.3.1.1 Exponential-Verteilung Die parametrische Spezifikation geht von der Annahme spezieller Wahrscheinlichkeitsverteilungen für die Episodendauer aus. Das einfachste Modell verwendet die Expnential-Verteilung. Die Exponential-Verteilung impliziert eine im Zeitablauf konstante Hazardrate. 82 * Beweis der Konstanz der Hazardrate im Exponential-Modell Wir verwenden die Tatsache, z = −λt → dz = −λ dt → dt = − daß ∫ e dz = e z z . Dazu setzen wir t 1 −λ z dz. Aus λ ∫ e− λt dt = e dz = −ez = −e − λt = 1 − e −λ t folgt ∫ 0 λ 0 λ 0 t t für die Überlebensfunktion T (3.16) S ( t ) = P( T ≥ t ) = ∫ λe t − λt t dt = 1 − ∫ λe − λt dt = e − λt , 0 so daß (3.17) λ (t ) = f ( t ) λe − λ t = − λt = λ S (t) e gilt. Die kumulierte Hazardrate ergibt sich als (3.18) Λ( t ) = − ln S ( t ) = λt . * Ende des Beweises. 3.3.1.2 Weibullverteilung Die Weibull-Verteilung ist eine Verallgemeinerung der Exponential-Verteilung. Sie erlaubt verschiedene Entwicklungen der Hazardrate über die Zeit abhängig von der Wahl eines Parameters α . Sie ist monoton steigend für α > 1 , abnehmend für α < 1 und konstant für α = 1 und besitzt daher eine hohe Flexibilität. Die Weibull-Verteilung ist durch folgende Funktionen beschrieben (3.19) f (t ) = λα t α −1 exp( −λt α ), E(T ) = Γ( (3.20) S (t ) = exp( −λt α ) (3.21) λ (t ) = λα t α −1 α +1 α wobei α , λ , t > 0 . 83 ) , V(T ) = Γ(α +2α ) − Γ( α +1α )2 λ λ2 3.3.1.3 Einbeziehung erklärender Variablen In der Regel müssen zur Erklärung der beobachteten Verweildauern weitere erklärende Variablen, also z.B. individuenspezifische oder sozio-demographische Variablen, sog. Kovariablen, in dem Modell berücksichtigt werden. Sie können zeitkonstant, d.h. konstant über den Verlauf der Episode, oder zeitvariabel sein. Im folgenden werden zur Vereinfachung zeitkonstante Kovariablen unterstellt, d.h. z.B. Eigenschaften wie beispielsweise Beruf oder Geschlecht. Während das klassische Regressionsmodell den Mittelwert einer Normalverteilung von Kovariablen X i abhängig macht, werden im Hazardraten-Modellen ein oder mehrere Parameter der Verteilung in Abhängigkeit vom individuenspezifischen Kovariablenvektor X i modelliert. Die Verweildauer-Verteilung wird dann durch die zu den Kovariablen gehörenden Regressionskoeffizienten β determiniert: Im Exponential-Modell (mit zeitkonstanter Hazardrate) nehmen wir λ als lineare Funktion der Kovariablen an: (3.22) λ i (t X i ) = exp( X i β ) 3.3.2 Das Proportionale Hazardraten-Modell Bisher wurde davon ausgegangen, daß die Hazardrate und damit die Verteilung der Verweildauer bis auf einige Parameter bekannt ist. Das Proportionale HazardratenModell von Cox (1972), auch PH-Modell genannt, ist ein semi-parametrischer Ansatz mit einer unspezifizierten Basisübergangsrate λ 0 (t ), d.h. λ 0 (t ) ist i.d.R. ebenfalls zu schätzen: (3.23) λ i (t | X i ) = λ 0()exp( t Xiβ ) Der Name des Modells ergibt sich aus der Tatsache, daß Hazardraten zweier Individuen proportional zueinander sind, d.h. das Verhältnis zweier Hazardraten ist zeitunabhängig, da sich λ 0 (t ) herauskürzt. (3.24) λi ( t | X i ) = exp ( ( X i − X j ) β ) . λ j (t | X j ) Der Nachteil des PH-Modells ergibt sich dadurch, daß die Annahme der Proportionalität eine Einschränkung der Anwendungsmöglichkeiten bedeutet. Bei der Einbeziehung der 84 Kovariablen „Geschlecht“ darf beispielsweise das Verhältnis der Hazardraten von Männern und Frauen nicht über die Zeit hinweg variieren. Eine Lockerung dieser Restriktion kann durch Einführung subpopulationsspezifischer, hier also geschlechtsspezifischer, Basisübergangsraten λ0 (t , X i ) erreicht werden. 3.3.3 Schätzmethoden Für die Schätzung ist es wichtig, eine eventuelle Zensierung der Verweildauern zu berücksichtigen, weil die Dauer aufgrund von Zensierungen nicht unmittelbar als abhängige Variable verwendet werden, wenn 1. sich zu Beginn einer Untersuchung bereits Individuen in dem interessierenden Zustand befinden, wenn Personen beispielsweise arbeitslos sind oder bereits im Krankenhaus liegen, oder wenn ein Unternehmen bereits gegründet ist. Es ist dann i.d.R. unbekannt, wie lange diese Episode bereits andauert. Man spricht hier von Linkszensierung. 2. sich Individuen am Ende des Untersuchungszeitraumes (oder bei Ausscheiden von Individuen aus der Befragung) noch in dem interessierenden Zustand befinden, also Personen noch arbeitslos sind, Kranke noch im Krankenhaus liegen, oder Unternehmen noch nicht konkurs gegangen sind. Es ist dann unbekannt, wie lange diese Episoden noch andauern werden. Man spricht hier von Rechtszensierung. Die anderen Episoden, bei denen sowohl der Beginn als auch das Ende im Untersuchungszeitraum beobachtet wird, sind unzensiert. Andere Beobachtungen sind möglicherweise sogar beidseitig zensiert. Im folgenden wird von Linkszensierungen abgesehen, da ihre Berücksichtigung schwieriger ist als die der Rechtszensierung. Bei Rechtszensierung kann die Information, daß ein Individuum mindestens bis zum Zeitpunkt t1 arbeitslos war, in der Likelihoodfunktion berücksichtigt werden. 3.3.3.1 Maximum-Likelihood-Schätzung Die ML-Methode setzt die Kenntnis der Dichtefunktion der Verweildauer f (t , θ ) voraus. Dabei bezeichnet θ den Vektor der Parameter der gewählten Dichtefunktion. Sofern 85 keine Zensierungen vorliegen, werden die N beobachteten Episoden als voneinander unabhängig angesehen, so daß sich die Likelihoodfunktion als N (3.25) LDuration (θ ) = ∏ i =1 ti f i ( ti ,θ ) = ∏ λi (t i ,θ )Si ( ti ,θ ) = ∏ λi ( ti ,θ )exp −∫ λ i ( u | xi ) d u i =1 i =1 0 N N ergibt. Ist eine Episode zensiert, z.B. bei einer Verweildauer von t j , so ist die einzige verfügbare Information, daß diese Episode mindestens bis t j angedauert hat. Der Beitrag dieser Episode zu einer Likelihoodfunktion ist folglich der Wert der Überlebensfunktion Si ( t j ,θ ) . Mit einer Dummyvariablen Di die den Wert Eins (bzw. Null) annimmt, wenn Episode i unzensiert (zensiert) ist, lautet die Likelihoodfunktion für eine Stichprobe, in der auch λ i (ti ,θ ) = (3.26) zensierte Episoden vorhanden sind unter Berücksichtigung von f i (t ,θ ) S i (t ,θ ) N N i =1 i =1 D 1− D D L(θ ) = ∏ f i ( ti ,θ ) i Si (t i ,θ ) i = ∏ λ i( ti ,θ ) i Si (t i ,θ ) 3.3.3.2 Partial-Likelihood-Schätzung des PH-Modells t Für das PH-Modell lautet die Likelihood-Funktion wegen S ( t ) = exp[ −∫ λ ( u) du] 0 t L( β , λ 0 (t) ) = ∏[ λ 0()exp( t X i β) ] exp −∫ λ 0( u)exp( X i β ) du i =1 0 (3.27) ∞ N Di λ ()exp( t X β ) exp [ ] − ∫ ∑ exp( X i β ) λ 0(u ) du. ∏ 0 i i =1 0 i∈R (t ) N Di Die Ausweitung der Integration von t auf ∞ wird durch Einschränkung der Summation { auf die Individuen, für die ti > t ist, d.h. R( t ) = i ti ≥ t } berücksichtigt. Die LikelihoodFunktion enthält nicht nur den unbekannten Parametervektor β , sondern auch die unbekannte Funktion λ0 (t ) . Man kann natürlich auch λ0 (t ) parametrisch spezifizieren und so zu einem vollparametrischen Modell kommen. Allerdings geht dann der Vorteil der Flexibilität des Modells 86 verloren. Cox (1972) hat deshalb eine alternative Methode vorgeschlagen, die auf einer Faktorisierung der Likelihood (Partial-Likelihood) beruht und die Schätzung von β ohne eine Spezifizierung von λ0 (t ) ermöglicht. Die individuellen Verweildauern seien geordnet, d.h. t 1 < t 2 <L < t N . Von Zensuren wird zunächst abgesehen. Die bedingte Wahrscheinlichkeit, daß zum Zeitpunkt ti gerade die Episode i abschließt, gegeben daß jede der übrigen noch nicht beendeten Episoden zu ti (die sogenannte Risikomenge R(ti ) ) hätte abschließen können und daß zum Zeitpunkt ti genau ein Ereignis stattfindet, lautet: (3.28) λ i (t i | X i ) = ∑ λ i(ti | X k ) kε R ( ti ) exp( X i β ) ∑ exp( X k β ) k εR ( ti ) Das Produkt dieser bedingten Wahrscheinlichkeiten bezeichnet Cox (1972) als PartialLikelihood und schlug vor, es wie eine gewöhnliche Likelihood-Funktion zu behandeln und in Abhängigkeit von β zu maximieren: N (3.29) PL( β ) = ∏ i =1 exp( X i β ) ∑ exp( X k β ) kε R ( ti ) Die Partial-ML-Schätzer sind unter bestimmten Voraussetzungen konsistent (Andersen und Gill, 1982). Treten jedoch Episoden mit genau gleichen Verweildauern auf (sog. Ties), so muß die Partial-Likelihood korrigiert werden (Breslow, 1974). Zensierte Beobachtungen werden im Nenner, nicht jedoch im Zähler berücksichtigt (Kiefer, 1988a und 1988b). 3.3.4 Modelle mit unbeobachteter Heterogenität Durch Einbeziehung von Kovariablen wird die Heterogenität der hinter den Episoden stehenden Individuen berücksichtigt. Allerdings kann man nur beobachtete (erfaßte) Merkmale berücksichtigen. Wird diese unbeobachtete Heterogenität nicht im Modell Rechnung getragen, so besteht die Gefahr einer scheinbaren Zeitabhängigkeit (spurious time dependence) der Hazardrate. Sind in der Stichprobe z.B. tatsächlich zwei Teilpopulationen mit unter- 87 schiedlichen Hazardraten vorhanden, die sich aufgrund der beobachtbaren Merkmale nicht identifizieren (trennen) lassen, so wird die Hazardrate der Gesamtstichprobe über die Zeit fallen. Es werden nämlich eher die Individuen der Teilpopulation mit der höheren Hazardrate die Risikomenge verlassen, so daß der Anteil der Individuen aus der Teilpopulation mit der niedrigeren Hazardrate an der Gesamtpopulation über die Zeit zunimmt. Zur Vermeidung entsprechender Verzerrung ist eine Zufallsvariable ε i in den Ansatz aufzunehmen, die die unbeobachtete Heterogenität abbildet. Für die Randdichte f (t X i ) gilt dann z.B.: (3.30) ∞ ∞ 0 0 f (t | X i ) = ∫ f ( t | X i , ε i )dg ( εi ) = ∫ λ (t | X i , ε i ) S ( t | X i , ε i ) dg (ε i ) . g (ε i ) ist die Verteilungsfunktion von ε i und wird als mischende Verteilung bezeichnet. Sie ist jedoch unbekannt. Es werden zwei alternative Verfahren zur Behandlung dieser unbekannten Verteilung vorschlagen: 1. Nichtparametrische Verfahren: g (ε i ) wird durch eine diskrete Verteilung approximiert, deren Stützstellen simultan mit den Modellparametern zu schätzen ist. Vorteil: Flexibilität, Nachteil: Anzahl der Stützstellen ist a priori unbekannt (Heckman und Singer, 1984). 2. Parametrische Verfahren: g (ε i ) wird durch eine parametrische Verteilung spezifiziert, etwa die Gamma-Verteilung (vergleiche auch den Übergang von der PoissonVerteilung auf die Negativ-Binomial-Verteilung im Zähldaten-Modell (3.8)) (3.31) g (ε i ) = θ θ −θεi θ −1 e εi Γ(θ ) Dies hat den Vorteil einer einfachen Handhabung, aber den Nachteil einer eventuellen Verzerrung der Parameterschätzwerte. (Lancaster, 1979, sowie Tuma und Hannan, 1984) 88 3.3.5 Empirisches Beispiele 3.3.5.1 Determinanten der Arbeitslosigkeit Hujer und Schneider (1994) analysieren die Determinanten der Arbeitslosigkeit von Männern mit Hilfe von Weibull-Modellen (hier ausgewählte Ergebnisse ohne Berücksichtigung unbeobachtbarer Heterogenität): Tabelle 3.1 Determinanten der Arbeitslosigkeit Weibull-Modell Variable exp (Parameter) Signifikanzniveau Funktionsparameter 1.0648 0.1222 Konstante 0.0880 0.0000 Nationalität (1=deutsch) 1.2155 0.0906 Realschulabschluß 1.0274 0.8579 (Fach-) Abitur 1.7812 0.0001 Alter zwischen 30 und 40 Jahre 0.8390 0.1889 Alter zwischen 40 und 50 Jahre 0.8678 0.3386 Alter über 50 Jahre 0.2780 0.0000 Bezug von Arbeitslosengeld 1.0998 0.4988 Auslaufphase von AL-Geld 0.2216 0.0030 Februar/März/April 1.8484 0.0001 Juli/August/September 1.7550 0.0001 Dezember 3.2845 0.0000 3.3.5.2 Determinanten der Unternehmenssterblichkeit Prantl (1997) hat mit den Daten des ZEW-Gründungspanels die Bestimmungsfaktoren der Unternehmenssterblichkeit untersucht. Sie analysiert getrennt für Unternehmensneugründungen und Transformationsunternehmen der neuen Bundesländer die konkursspezifischen Hazardraten mit dem PH-Modell. Folgende Schätzergebnisse ergeben sich für ein Modell unter besonderer Berücksichtigung der Humankapitalausstattung der Unternehmen 89 Tabelle 3.1 Determinanten des Unternehmenskonkurses Erklärende Variable Größe (log) Größe (log, quadriert) Unternehmensneugründungen in den NBL Transformationsunternehmen in den NBL 0,70 0,55 - 0,08 - 0,05 Genossenschaft (0/1) 0,70 BGB-Gesellschaft (0/1) - 0,72 0,73 Kapitalgesellschaft (0/1) 1,02 2,12 Unternehmensbet. (0/1) 0,02 - 0,83 Vollbeteiligung (0/1) - 0,70 - 0,23 Westkapitalbeteil. (0/1) - 0,01 - 0,33 Diversifikation 1 (0/1) - 0,19 - 0,16 Diversifikation 2 (0/1) 0,26 0,09 Treuhand-Bezug (0/1) 0,98 In den Analysen von Prantl (1997) ergeben sich erheblich Unterschiede bei den Determinanten der Unternehmenssterblichkeit zwischen Unternehmen, die nach der Wende neugegründet wurden, und Unternehmen, die durch Transformation staatseigener Betreibe entstanden sind. 90