λ - ZEW

Werbung
3 Modelle der Ereignisanalyse
3.1
Grundlagen der Ereignisanalyse
Ging es im vorangegangenen Kapitel 2 um diskrete oder begrenzt abhängige Variablen, die wir im Kern auf latent stetige und unbegrenzt abhängige Variablen zurückgeführt haben, so betrachten wir nun im Rahmen der Ereignisanalysen explizit diskrete
Ereignisse und untersuchen, wieviel von diesen Ereignissen in einem bestimmten Zeitraum auftreten (Zähldaten-Modelle), wie lange es dauert bis das nächste Ereignis auftritt
(Verweildauer-Modelle), bzw. wie hoch zu einem Zeitpunkt die Wahrscheinlichkeit des
Auftretens eines Ereignisses ist (Übergangsraten- bzw. Hazard-Rate- oder SurvivalModelle).
Die Grundlage der Ereignisanalysen bildet der Poisson-Prozeß (vgl. Mood, Graybill
und Boes, 1974, Kapitel III, Abschnitt 2.4.) als spezieller stochastischer Prozeß. Als stochastischen Prozeß bezeichnet man die Folge von Zufallsvariablen zt in der Zeit, die
durch
die
Folge
von
Wahrscheinlichkeitsdichten
( f ( x( t1 )), f (x (t 2 )),K)
kurz:
f ( x( t ); t ∈T ) beschrieben wird. Der Poisson-Prozeß ist durch folgende Annahmen auf
Bernoulli-Experimente zurückzuführen:
1. Der Zeitraum T wird in n gleich große Intervalle der Länge ∆t unterteilt, so daß
T = n∆t ist.
2. In jedem Intervall der Länge ∆t vollzieht sich genau ein Versuch der Ziehung aus
einer Bernoulli-Verteilung, d.h. im Zeitraum T finden genau n Versuche statt.
3. Dabei tritt entweder ein bestimmtes Ereignis (z.B. ein Telefonanruf, eine Patentanmeldung etc.) auf oder nicht. Es gibt also zwei Merkmalsausprägungen:
(3.1)
1 wenn das Ereignis auftritt
x=
0 wenn das Ereignis nicht auftritt
4. die Wahrscheinlichkeit, daß im Intervall der Länge ∆t ein Ereignis auftritt, ist unabhängig davon, was im vorhergehenden Intervall und im nachfolgenden Intervall geschieht, d.h. die n Versuche sind unabhängig.
76
5. Die Wahrscheinlichkeit, daß in einem Intervall der Länge ∆t ein Ereignis auftritt,
hängt von der Länge des Zeitintervalls ∆t
ab, d.h.
p = c ⋅ ∆t . Damit gilt
np = nc∆t = cT . Dabei ist c ist die durchschnittliche Anzahl der Ereignisse in der
Einheitsperiode T = 1 (mean rate of occurence).
6. Die Ereignisse erfolgen in sehr kleinen Intervallen, d.h. ∆t → 0 (also auch p → 0 )
und n → ∞ und np = cT = λ = konstant
Dies sind gerade die Bedingungen, unter denen sich die Binomial-Verteilung durch die
Poisson-Verteilung approximieren läßt. Die Wahrscheinlichkeiten für ein Signal bei größerem ∆t folgen der Binomial-Verteilung, im Grenzwert geht die Binomial-Verteilung in
die Poisson-Verteilung über. Die Wahrscheinlichkeit für die Anzahl der Ereignisse lautet
dann bei gegebenem T :
(3.2)
f ( y) =
( cT ) y e− cT
y!
bzw.
f ( y) =
λ y e− λ
y!
Beispiel: Eine Telefonvermittlungszentrale wird in der Zeit T = 1 Stunde im langfristigen
Durchschnitt sechsmal verlangt, d.h. np = c = 6 . Die Wahrscheinlichkeit, daß in einer
Stunde kein Anruf ( y = 0 ) erfolgt ist dann :
f ( y = 0) =
60 e −6
= 0,003 .
0!
Der Poisson-Prozeß bestimmt die Verteilung für die Anzahl der Ereignisse in einer gegebenen Zeitspanne T. Man kann allerdings auch nach der Zeit bis zum nächsten Ereignis fragen. Die Zeit ist dann ebenfalls eine Zufallsvariable, deren Wahrscheinlichkeitsverteilung sich wie folgt aus dem Poisson-Prozeß herleitet:
1. Man zerlege den Zeitraum bis zum nächsten Signal in sehr kleine konstante Intervalle
der Länge ∆t , so daß n∆t der Zeitraum bis zum nächsten Ereignis ist. Dabei ist ∆t
so klein, daß in dieser Zeit höchstens ein Ereignis auftritt, d.h. in der Zeitspanne ∆t
sind nur die Ereignisse z = 1 (das Ereignis tritt auf) oder z = 0 (das Ereignis tritt
nicht auf) möglich.
2. Wir nehmen jetzt an, daß für die Zufallsvariable z ein Poisson-Prozeß gilt mit
f (z) =
(c∆t ) z ⋅ e −e ∆t
. Der Zeitraum bis zum nächsten Ereignis ist dann dadurch gez!
77
kennzeichnet, daß in den ersten ( n − 1) Zeiträumen der Länge ∆t kein Ereignis auftritt ( z = 0 ) und im letzten Zeitraum ein Ereignis erfolgt ( z = 1 ). Es gilt also:
z1 = 0, z2 = 0,L , z n−1 = 0, z n = 1.
Wegen der im Poisson-Prozeß unterstellten Unabhängigkeit ist dann
f (n ) = f ( z1 = 0, z 2 = 0,L , zn−1 = 0, zn = 1)
= f ( z1 = 0) ⋅ f ( z2 = 0) ⋅ L ⋅ f ( zn−1 = 0) ⋅ f ( z n = 1)
−c ∆t
− c∆ t
− c∆ t
1 − c∆t
(c ⋅ ∆t ) e
( c ⋅ ∆t ) e
( c ⋅ ∆t ) e
(c ⋅ ∆t ) e
⋅
L
⋅
0!
0!
0!
1!
− c∆ tn
− λn
= c ⋅ ∆t ⋅ e
= λ ⋅e
mit λ = c∆t und n > 0
0
=
0
0
Man bezeichnet die Verteilung f (n ) = λe − λn als Exponential-Verteilung. Sie ist der
Ausgangspunkt für Verweildauer-Modelle bzw. Übergangsraten- oder HazardratenModelle. Wir bezeichnen die Zeit im Rahmen der Hazardraten-Modelle wieder mit t
statt mit n .
3.2
Zähldaten-Modelle
Wir betrachten zunächst ökonometrische Zähldaten-Modelle, also Modelle, die die Anzahl des Auftretens von Ereignissen, wie beispielsweise die Anzahl von Patentanmeldungen innerhalb eines Jahres, erklären. Neben dem Poisson-Modell wird häufig eine
flexiblere Verallgemeinerung, basierend auf der Negativ-Binomialverteilung (vgl. Mood,
Graybill und Boes, 1974) verwendet, das Negbin-Modell. Zu ökonometrischen
Zähldaten-Modellen existiert mit Winkelmann (1997) eine exzellente Monographie.
3.2.1 Das Poisson-Modell
Das einfachste Modell, das die Anzahl der Ereignisse innerhalb eines Zeitraums zu erklären versucht, ist das Poisson-Modell (Frome, Kutner, und Beauchamp, 1973, sowie
Hausman, Hall, und Griliches, 1984). Wir können uns beispielsweise die Frage nach
den Determinanten der Anzahl von Patentanmeldungen eines FuE-treibenden Unternehmens in einem Jahr vorstellen. Das Poisson-Modell hat folgende Form
78
P( yi ) =
(3.3)
=
e − λi λi yi
yi !
mit λi = exp X i β
für
yi = 0,1,2,K
e − exp( Xi β ) (exp( X i β )) yi
yi !
d.h. der Parameter λi ist als exp X i β exponentiell in Abhängigkeit von erklärenden Variablen parametrisiert.
Für den Erwartungswert und die Varianz gilt im Poisson-Modell:
(3.4)
E ( yi ) = V ( yi ) = λi = e Xi β
und für die marginalen Effekte:
(3.5)
∂E ( yi )
= λi β k = e X i β βk
∂xi k
Aus den Eintrittswahrscheinlichkeiten (3.3) läßt sich leicht die Log-Likelihoodfunktion
konstruieren,
N
(3.6)
(
ln LPoisson = ∑ − e
i =1
X iβ
)
+ yi X i β − ln yi !
die der Maximum-Likelihood-Schätzung zugrunde liegt. An der Gleichheit von Erwartungswert und Varianz gemäß Gleichung (3.4) wird bereits der Schwachpunkt des Poisson-Modells ersichtlich. Die Gleichheitsbedingung ist in empirischen Anwendungen sehr
häufig verletzt, d.h. die Varianz ist größer. Man spricht in diesem Zusammenhang von
Overdispersion. Einen einfachen Test auf Overdispersion haben Cameron und Trivedi
(1990) entwickelt. Die Null-Hypothese lautet: V ( yi ) = E ( yi ) und die Gegen-Hypothese:
V ( yi ) = E ( yi ) + α g (E ( y i ) ) .
3.2.2 Das Negbin-Modell
Das Negbin-Modell (Negatie-Binomial-Regressionsmodel) folgt als Gamma-Mixture
einer Poisson-Verteilung (vgl. Mood, Graybill, und Boes, 1974), indem wir für den Parameter λi der Poisson-Verteilung folgende Funktion spezifizieren:
(3.7)
ln λi = X i β + ln ε i
79
wobei ε i Gamma-verteilt ist mit Parameter θ und der Dichte:
θ θ −θεi θ −1
g (ε i ) =
e εi
Γ(θ )
(3.8)
Für das Zähldaten-Modell folgt aus der Gamma-Verteilung des Parameters der Poisson-Verteilung die Negativ-Binomial-Verteilung:
∞
e − exp( X i β )ε i (exp( X i β )ε i ) yi θ θ ε θi −1e−θεi
dε i
y
!
Γ
(
θ
)
i
0
P( yi ) = ∫
(3.9)
yi
θ
Γ(θ + yi )  exp( X i β )  
exp( X i β ) 
=
1−



Γ( yi + 1)Γ (θ )  exp( X i β ) + θ   exp( X i β ) + θ 
Das Negbin-Modell (Cameron und Trivedi, 1986) kann ebenfalls mit der MaximumLikelihood-Methode geschätzt werden.
3.2.3 Beispiel: Der Einfluß des Patentwertes auf die Zitationshäufigkeit von
Patenten
Harhoff, Narin, Scherer und Vopel (1999) haben in einer vergleichenden Studie zwischen den U.S.A. und Deutschland den Einfluß des Patentwertes auf die Zitationshäufigkeit von Patenten in nachfolgenden Patenten untersucht. Der Patentwert wurde in direkten Unternehmesbefragungen erhoben, indem Patenthalter gefragt wurden, zu welchem Preis sie bereit wären, ihr Patent zu verkaufen.
Folgende Ergebnisse des Negbin-Modells haben sich ergeben:
Tabelle 3.1 Zitation von Patenten (Negbin-Modell)
Variable
USA
Konstante
2.267 ***
Patentwert (log)
0,136 ***
Deutschland
-0,703
0,105 ***
N
192
752
Pseudo R2
0,10
0,03
Ein wesentliches Ergebnis dieser Studie, die als eine der wenigen Patente nach ihrem
tatsächlichen Wert unterscheidet, ist, daß die Zitationshäufigkeit deutlich mit dem Wert
der Patent zunimmt.
80
3.3
Hazardraten-Modelle
Auch im Hazardraten-Modell wird versucht, geeignete erklärende Variablen für den Parameter λ zu finden. Allerdings interessiert nicht die Anzahl der Ereignisse innerhalb
eines Zeitraums sondern die Dauer bis zum nächsten Ereignis. Unter Umständen handelt es sich hierbei um das erste Ereignis, da Ereignisse wie der Konkurs eines Unternehmens oder der Tod einer Person zumindest für ein Individuum nicht mehrfach beobachtet werden kann. Die Basisverteilung ist die Exponential-Verteilung :
f (t ) = λe λt .
(3.10)
Man nimmt nun an, daß die durchschnittliche Verweildauer in der Arbeitslosigkeit, die
im Exponential-Modell
1
λ
ist, für verschiedene Individuen sich je nach Schulbildung, Le-
bensalter, bisheriger Berufserfahrung, Beruf unterscheidet. Bezeichnen wir diese
Merkmale als X i so erhalten wir für jedes Individuum i eine andere zeitkonstante Hazardrate:
(3.11)
λ ( X i ) = exp( X i β )
Bevor wir uns der Schätzung dieser Modelle zuwenden, führen wir einige wichtige
Grundkonzepte für Hazardraten-Modelle ein. Wir nehmen an, daß die Dauer Ti der i -ten
Beobachtung eine kontinuierliche Zufallsvariable mit Dichtefunktion f (t ) und Verteilungsfunktion F (t ) ist.
Die Survivor- oder Überlebensfunktion S ( t) ist die Wahrscheinlichkeit, daß ein Individuum den Zeitpunkt t erlebt, d.h. daß ein Episode mindestens bis t andauert oder ein
Ereignis nicht vor t eintritt
(3.12)
S ( t ) = P( T ≥ t ) = 1 − F ( t ).
Die Hazard- oder Übergangsrate ist der Grenzwert der bedingten Wahrscheinlichkeit,
daß die Episode im Intervall [t , t + dt] zu Ende geht unter der Voraussetzung, daß die
Episode bis zum Beginn dieses Intervalls andauert, d.h. die bedingte Wahrscheinlichkeit, daß das Ereignis in t eintritt, gegeben, daß es vorher nicht eingetreten ist:
(3.13)
P (t ≤ T < t + dt | T ≥ t )
P(t ≤ T < t + dt ) / dt f ( t )
f (t )
= lim
=
=
dt →0 +
dt →0 +
dt
P(T ≥ t )
S (t ) 1 − F (t )
λ (t ) = lim
81
Für die Beziehung zwischen Survivorfunktion und Hazardrate gilt außerdem:
(3.14)
 t

S (t ) = exp  − ∫ λ (u ) du  und
 0

 t

f (t ) = λ (t ) S (t ) = λ (t) e x p  −∫ λ (u ) d u 
 0

da
t
(3.15)
t
f (u )
du = − ln(1 − F ( u)) t0 = − ln(1 − F (t )) = − ln S ( T ).
1
−
F
(
u
)
0
Λ( t ) = ∫ λ (u )du = ∫
0
Λ(t) bezeichnet die sogenannte kumulierte Hazardrate.
Aus den Beziehungen zwischen λ ( t ) , S ( t) und f (t ) wird deutlich, daß die Dauer der
Episode durch die Spezifikation einer dieser drei Größen eindeutig beschrieben ist.
Die Spezifikation des Hazardraten-Modells erfolgt entweder
1. parametrisch, d.h. durch bestimmte Verteilungsannahmen und Annahmen über den
zeitlichen Verlauf (positive Zeitabhängigkeit: dλ( t ) / dt > 0 ; negative Zeitabhängigkeit: dλ( t ) / dt < 0 ; Zeitkonstanz: dλ( t ) / dt = 0 der Hazardrate,
2. oder nichtparametrisch (z.B. Sterbetafel-Methode, Kaplan-Meier-Schätzung).
3.3.1 Parametrische Hazardraten-Modell
3.3.1.1 Exponential-Verteilung
Die parametrische Spezifikation geht von der Annahme spezieller Wahrscheinlichkeitsverteilungen für die Episodendauer aus. Das einfachste Modell verwendet die Expnential-Verteilung. Die Exponential-Verteilung impliziert eine im Zeitablauf konstante Hazardrate.
82
* Beweis der Konstanz der Hazardrate im Exponential-Modell
Wir
verwenden
die
Tatsache,
z = −λt → dz = −λ dt → dt = −
daß
∫ e dz = e
z
z
.
Dazu
setzen
wir
t
1
−λ z
dz. Aus λ ∫ e− λt dt =
e dz = −ez = −e − λt = 1 − e −λ t folgt
∫
0
λ 0
λ
0
t
t
für die Überlebensfunktion
T
(3.16)
S ( t ) = P( T ≥ t ) = ∫ λe
t
− λt
t
dt = 1 − ∫ λe − λt dt = e − λt ,
0
so daß
(3.17)
λ (t ) =
f ( t ) λe − λ t
= − λt = λ
S (t)
e
gilt. Die kumulierte Hazardrate ergibt sich als
(3.18)
Λ( t ) = − ln S ( t ) = λt .
* Ende des Beweises.
3.3.1.2 Weibullverteilung
Die Weibull-Verteilung ist eine Verallgemeinerung der Exponential-Verteilung. Sie erlaubt verschiedene Entwicklungen der Hazardrate über die Zeit abhängig von der Wahl
eines Parameters α . Sie ist monoton steigend für α > 1 , abnehmend für α < 1 und konstant für α = 1 und besitzt daher eine hohe Flexibilität. Die Weibull-Verteilung ist durch
folgende Funktionen beschrieben
(3.19)
f (t ) = λα t α −1 exp( −λt α ), E(T ) = Γ(
(3.20)
S (t ) = exp( −λt α )
(3.21)
λ (t ) = λα t α −1
α +1
α
wobei α , λ , t > 0 .
83
) , V(T ) = Γ(α +2α ) − Γ( α +1α )2
λ
λ2
3.3.1.3 Einbeziehung erklärender Variablen
In der Regel müssen zur Erklärung der beobachteten Verweildauern weitere erklärende
Variablen, also z.B. individuenspezifische oder sozio-demographische Variablen, sog.
Kovariablen, in dem Modell berücksichtigt werden. Sie können zeitkonstant, d.h. konstant über den Verlauf der Episode, oder zeitvariabel sein. Im folgenden werden zur
Vereinfachung zeitkonstante Kovariablen unterstellt, d.h. z.B. Eigenschaften wie beispielsweise Beruf oder Geschlecht. Während das klassische Regressionsmodell den
Mittelwert einer Normalverteilung von Kovariablen X i abhängig macht, werden im Hazardraten-Modellen ein oder mehrere Parameter der Verteilung in Abhängigkeit vom
individuenspezifischen Kovariablenvektor X i modelliert. Die Verweildauer-Verteilung
wird dann durch die zu den Kovariablen gehörenden Regressionskoeffizienten β determiniert: Im Exponential-Modell (mit zeitkonstanter Hazardrate) nehmen wir λ als lineare Funktion der Kovariablen an:
(3.22)
λ i (t X i ) = exp( X i β )
3.3.2 Das Proportionale Hazardraten-Modell
Bisher wurde davon ausgegangen, daß die Hazardrate und damit die Verteilung der
Verweildauer bis auf einige Parameter bekannt ist. Das Proportionale HazardratenModell von Cox (1972), auch PH-Modell genannt, ist ein semi-parametrischer Ansatz
mit einer unspezifizierten Basisübergangsrate λ 0 (t ), d.h. λ 0 (t ) ist i.d.R. ebenfalls zu
schätzen:
(3.23)
λ i (t | X i ) = λ 0()exp(
t
Xiβ )
Der Name des Modells ergibt sich aus der Tatsache, daß Hazardraten zweier Individuen proportional zueinander sind, d.h. das Verhältnis zweier Hazardraten ist zeitunabhängig, da sich λ 0 (t ) herauskürzt.
(3.24)
λi ( t | X i )
= exp ( ( X i − X j ) β ) .
λ j (t | X j )
Der Nachteil des PH-Modells ergibt sich dadurch, daß die Annahme der Proportionalität
eine Einschränkung der Anwendungsmöglichkeiten bedeutet. Bei der Einbeziehung der
84
Kovariablen „Geschlecht“ darf beispielsweise das Verhältnis der Hazardraten von Männern und Frauen nicht über die Zeit hinweg variieren. Eine Lockerung dieser Restriktion
kann durch Einführung subpopulationsspezifischer, hier also geschlechtsspezifischer,
Basisübergangsraten λ0 (t , X i ) erreicht werden.
3.3.3 Schätzmethoden
Für die Schätzung ist es wichtig, eine eventuelle Zensierung der Verweildauern zu berücksichtigen, weil die Dauer aufgrund von Zensierungen nicht unmittelbar als abhängige Variable verwendet werden, wenn
1. sich zu Beginn einer Untersuchung bereits Individuen in dem interessierenden Zustand befinden, wenn Personen beispielsweise arbeitslos sind oder bereits im
Krankenhaus liegen, oder wenn ein Unternehmen bereits gegründet ist. Es ist dann
i.d.R. unbekannt, wie lange diese Episode bereits andauert. Man spricht hier von
Linkszensierung.
2. sich Individuen am Ende des Untersuchungszeitraumes (oder bei Ausscheiden von
Individuen aus der Befragung) noch in dem interessierenden Zustand befinden, also
Personen noch arbeitslos sind, Kranke noch im Krankenhaus liegen, oder Unternehmen noch nicht konkurs gegangen sind. Es ist dann unbekannt, wie lange diese
Episoden noch andauern werden. Man spricht hier von Rechtszensierung.
Die anderen Episoden, bei denen sowohl der Beginn als auch das Ende im Untersuchungszeitraum beobachtet wird, sind unzensiert. Andere Beobachtungen sind möglicherweise sogar beidseitig zensiert.
Im folgenden wird von Linkszensierungen abgesehen, da ihre Berücksichtigung schwieriger ist als die der Rechtszensierung. Bei Rechtszensierung kann die Information, daß
ein Individuum mindestens bis zum Zeitpunkt t1 arbeitslos war, in der Likelihoodfunktion
berücksichtigt werden.
3.3.3.1 Maximum-Likelihood-Schätzung
Die ML-Methode setzt die Kenntnis der Dichtefunktion der Verweildauer f (t , θ ) voraus.
Dabei bezeichnet θ den Vektor der Parameter der gewählten Dichtefunktion. Sofern
85
keine Zensierungen vorliegen, werden die N beobachteten Episoden als voneinander unabhängig angesehen, so daß sich die Likelihoodfunktion als
N
(3.25)
LDuration (θ ) = ∏
i =1
 ti

f i ( ti ,θ ) = ∏ λi (t i ,θ )Si ( ti ,θ ) = ∏ λi ( ti ,θ )exp  −∫ λ i ( u | xi ) d u  


i =1
i =1
 0

N
N
ergibt.
Ist eine Episode zensiert, z.B. bei einer Verweildauer von t j , so ist die einzige verfügbare Information, daß diese Episode mindestens bis t j angedauert hat. Der Beitrag
dieser Episode zu einer Likelihoodfunktion ist folglich der Wert der Überlebensfunktion
Si ( t j ,θ ) . Mit einer Dummyvariablen Di die den Wert Eins (bzw. Null) annimmt, wenn
Episode i unzensiert (zensiert) ist, lautet die Likelihoodfunktion für eine Stichprobe, in
der
auch
λ i (ti ,θ ) =
(3.26)
zensierte
Episoden
vorhanden
sind
unter
Berücksichtigung
von
f i (t ,θ )
S i (t ,θ )
N
N
i =1
i =1
D
1− D
D
L(θ ) = ∏  f i ( ti ,θ ) i Si (t i ,θ ) i  = ∏  λ i( ti ,θ ) i Si (t i ,θ )
3.3.3.2 Partial-Likelihood-Schätzung des PH-Modells
t
Für das PH-Modell lautet die Likelihood-Funktion wegen S ( t ) = exp[ −∫ λ ( u) du]
0
 t

L( β , λ 0 (t) ) = ∏[ λ 0()exp(
t
X i β) ] exp  −∫ λ 0( u)exp( X i β ) du 
i =1
 0

(3.27)
∞
N
 

Di
λ
()exp(
t
X
β
)
exp
[
]
− ∫  ∑ exp( X i β )  λ 0(u ) du.
∏
0
i
i =1

 0  i∈R (t )
N
Di
Die Ausweitung der Integration von t auf ∞ wird durch Einschränkung der Summation
{
auf die Individuen, für die ti > t ist, d.h. R( t ) = i ti ≥ t } berücksichtigt. Die LikelihoodFunktion enthält nicht nur den unbekannten Parametervektor β , sondern auch die unbekannte Funktion λ0 (t ) .
Man kann natürlich auch λ0 (t ) parametrisch spezifizieren und so zu einem vollparametrischen Modell kommen. Allerdings geht dann der Vorteil der Flexibilität des Modells
86
verloren. Cox (1972) hat deshalb eine alternative Methode vorgeschlagen, die auf einer
Faktorisierung der Likelihood (Partial-Likelihood) beruht und die Schätzung von β ohne
eine Spezifizierung von λ0 (t ) ermöglicht.
Die individuellen Verweildauern seien geordnet, d.h. t 1 < t 2 <L < t N . Von Zensuren wird
zunächst abgesehen. Die bedingte Wahrscheinlichkeit, daß zum Zeitpunkt ti gerade die
Episode i abschließt, gegeben daß jede der übrigen noch nicht beendeten Episoden
zu ti (die sogenannte Risikomenge R(ti ) ) hätte abschließen können und daß zum
Zeitpunkt ti genau ein Ereignis stattfindet, lautet:
(3.28)
λ i (t i | X i )
=
∑ λ i(ti | X k )
kε R ( ti )
exp( X i β )
∑ exp( X k β )
k εR ( ti )
Das Produkt dieser bedingten Wahrscheinlichkeiten bezeichnet Cox (1972) als PartialLikelihood und schlug vor, es wie eine gewöhnliche Likelihood-Funktion zu behandeln
und in Abhängigkeit von β zu maximieren:
N
(3.29)
PL( β ) = ∏
i =1
exp( X i β )
∑ exp( X k β )
kε R ( ti )
Die Partial-ML-Schätzer sind unter bestimmten Voraussetzungen konsistent (Andersen
und Gill, 1982). Treten jedoch Episoden mit genau gleichen Verweildauern auf (sog.
Ties), so muß die Partial-Likelihood korrigiert werden (Breslow, 1974). Zensierte Beobachtungen werden im Nenner, nicht jedoch im Zähler berücksichtigt (Kiefer, 1988a und
1988b).
3.3.4 Modelle mit unbeobachteter Heterogenität
Durch Einbeziehung von Kovariablen wird die Heterogenität der hinter den Episoden
stehenden Individuen berücksichtigt. Allerdings kann man nur beobachtete (erfaßte)
Merkmale berücksichtigen.
Wird diese unbeobachtete Heterogenität nicht im Modell Rechnung getragen, so besteht die Gefahr einer scheinbaren Zeitabhängigkeit (spurious time dependence) der
Hazardrate. Sind in der Stichprobe z.B. tatsächlich zwei Teilpopulationen mit unter-
87
schiedlichen Hazardraten vorhanden, die sich aufgrund der beobachtbaren Merkmale
nicht identifizieren (trennen) lassen, so wird die Hazardrate der Gesamtstichprobe über
die Zeit fallen. Es werden nämlich eher die Individuen der Teilpopulation mit der höheren
Hazardrate die Risikomenge verlassen, so daß der Anteil der Individuen aus der Teilpopulation mit der niedrigeren Hazardrate an der Gesamtpopulation über die Zeit zunimmt.
Zur Vermeidung entsprechender Verzerrung ist eine Zufallsvariable ε i in den Ansatz
aufzunehmen, die die unbeobachtete Heterogenität abbildet. Für die Randdichte
f (t X i ) gilt dann z.B.:
(3.30)
∞
∞
0
0
f (t | X i ) = ∫ f ( t | X i , ε i )dg ( εi ) = ∫ λ (t | X i , ε i ) S ( t | X i , ε i ) dg (ε i ) .
g (ε i ) ist die Verteilungsfunktion von ε i und wird als mischende Verteilung bezeichnet.
Sie ist jedoch unbekannt. Es werden zwei alternative Verfahren zur Behandlung dieser
unbekannten Verteilung vorschlagen:
1. Nichtparametrische Verfahren: g (ε i ) wird durch eine diskrete Verteilung approximiert, deren Stützstellen simultan mit den Modellparametern zu schätzen ist. Vorteil:
Flexibilität, Nachteil: Anzahl der Stützstellen ist a priori unbekannt (Heckman und
Singer, 1984).
2. Parametrische Verfahren: g (ε i ) wird durch eine parametrische Verteilung spezifiziert, etwa die Gamma-Verteilung (vergleiche auch den Übergang von der PoissonVerteilung auf die Negativ-Binomial-Verteilung im Zähldaten-Modell (3.8))
(3.31)
g (ε i ) =
θ θ −θεi θ −1
e εi
Γ(θ )
Dies hat den Vorteil einer einfachen Handhabung, aber den Nachteil einer eventuellen Verzerrung der Parameterschätzwerte. (Lancaster, 1979, sowie Tuma und
Hannan, 1984)
88
3.3.5 Empirisches Beispiele
3.3.5.1 Determinanten der Arbeitslosigkeit
Hujer und Schneider (1994) analysieren die Determinanten der Arbeitslosigkeit von
Männern mit Hilfe von Weibull-Modellen (hier ausgewählte Ergebnisse ohne Berücksichtigung unbeobachtbarer Heterogenität):
Tabelle 3.1 Determinanten der Arbeitslosigkeit
Weibull-Modell
Variable
exp (Parameter)
Signifikanzniveau
Funktionsparameter
1.0648
0.1222
Konstante
0.0880
0.0000
Nationalität (1=deutsch)
1.2155
0.0906
Realschulabschluß
1.0274
0.8579
(Fach-) Abitur
1.7812
0.0001
Alter zwischen 30 und 40 Jahre
0.8390
0.1889
Alter zwischen 40 und 50 Jahre
0.8678
0.3386
Alter über 50 Jahre
0.2780
0.0000
Bezug von Arbeitslosengeld
1.0998
0.4988
Auslaufphase von AL-Geld
0.2216
0.0030
Februar/März/April
1.8484
0.0001
Juli/August/September
1.7550
0.0001
Dezember
3.2845
0.0000
3.3.5.2 Determinanten der Unternehmenssterblichkeit
Prantl (1997) hat mit den Daten des ZEW-Gründungspanels die Bestimmungsfaktoren
der Unternehmenssterblichkeit untersucht. Sie analysiert getrennt für Unternehmensneugründungen und Transformationsunternehmen der neuen Bundesländer die konkursspezifischen Hazardraten mit dem PH-Modell.
Folgende Schätzergebnisse ergeben sich für ein Modell unter besonderer Berücksichtigung der Humankapitalausstattung der Unternehmen
89
Tabelle 3.1 Determinanten des Unternehmenskonkurses
Erklärende Variable
Größe (log)
Größe (log, quadriert)
Unternehmensneugründungen in den NBL
Transformationsunternehmen in den NBL
0,70
0,55
- 0,08
- 0,05
Genossenschaft (0/1)
0,70
BGB-Gesellschaft (0/1)
- 0,72
0,73
Kapitalgesellschaft (0/1)
1,02
2,12
Unternehmensbet. (0/1)
0,02
- 0,83
Vollbeteiligung (0/1)
- 0,70
- 0,23
Westkapitalbeteil. (0/1)
- 0,01
- 0,33
Diversifikation 1 (0/1)
- 0,19
- 0,16
Diversifikation 2 (0/1)
0,26
0,09
Treuhand-Bezug (0/1)
0,98
In den Analysen von Prantl (1997) ergeben sich erheblich Unterschiede bei den Determinanten der Unternehmenssterblichkeit zwischen Unternehmen, die nach der Wende
neugegründet wurden, und Unternehmen, die durch Transformation staatseigener Betreibe entstanden sind.
90
Herunterladen