Workshop Erweiterte Methoden für

Werbung
Workshop
Erweiterte Methoden für Überlebenszeiten
Statistische Methoden in Epidemiologie und Medizin
18. und 19. November 2004
in Halle (Saale)
- 24 -
-2-
- 23 -
Workshop
Erweiterte Methoden für Überlebenszeiten
Statistische Methoden in Epidemiologie und Medizin
Gemeinsamer Workshop der Arbeitsgruppen
Statistische Methoden in der Medizin (IBS-DR)
Statistische Methodik in der klinischen Forschung (GMDS)
Statistische Methoden in der Epidemiologie (DAE, DR-IBS)
Organisation des Workshops
Dr. Oliver Kuss
PD Dr. Ralf Bender
PD Dr. Siegfried Kropf
Dirk Taeger
Dr. Jürgen Wellmann
Termin:
Donnerstag/Freitag, 18./19. November 2004
Ort:
Hörsaal des Instituts für Humangenetik und
Medizinische Biologie,
Magdeburger Str. 2
Martin-Luther Universität Halle-Wittenberg
06097 Halle (Saale)
Workshop-Homepage:
http://medweb.uni-muenster.de/institute/epi/StatMethMed/2004/Halle/index.html
- 22 -
-3-
Programm
Donnerstag, 18.11.04
14:30 – 14:35
Oliver Kuß (Halle), Siegfried Kropf (Magdeburg), Ralf Bender (Köln), Dirk
Taeger (Bochum)
Begrüßung und Organisatorisches
14:35 – 16:00
Andreas Wienke (Halle)
Einführung in Frailty-Modelle (Tutorium)
16:00 – 16:30
Pause
16:30 – 18:30
Session I
Vorsitz: Dirk Taeger (Bochum)
16:30 – 17:00
Peter Rzehak (Ulm), Lloyd Chambless (Chapel Hill), Stephan K Weiland (Ulm)
Analysis of disproportionate stratified subsamples in epidemiological studies
17:00 – 17:30
Ekkehart Dietz, Heike Englert, Stefan Willich (Berlin)
Eine Methode zur Schätzung von Relativen Risiken aus Querschnittsstudien mit
Krankheitsdauerdaten
17:30 – 18:00
Jürgen Wellmann, Burkhard Dasch, Hans-Werner Hense (Münster)
Ein Regressionsmodell für korrelierte ordinale Daten an paarigen Organen
18:00 – 18:30
P. Ramlau, P. Schlattmann (Berlin)
Evaluierung statistischer Verfahren zur Modellierung rekurrenter Ereignisse in
der Biometrie
18:30 – 19:00
T. Stürmer, D. Spiegelman, S. Schneeweiss, J. Avorn, R.J. Glynn (Boston)
Correcting Effect Estimates for Unmeasured Confounding in Cohort Studies
with Validation Data using Propensity Score Calibration
Ab 20:00 Uhr
Gemütliches Beisammensein in einem Restaurant und
Kneipenbummel
-4-
- 21 -
Alternative Analyses of Risk Factors for Composite Endpoints (Tutorium)
Freitag,19.11.04
Robert J Glynn (Boston)
09:00 – 11:00
Associate Professor of Medicine (Biostatistics), Harvard Medical School
Division of Preventive Medicine,
Division of Pharmacoepidemiology and Pharmacoeconomics,
Brigham and Women's Hospital
Department of Biostatistics, Harvard School of Public Health
9:00 – 09:30
Thomas Kneib and Ludwig Fahrmeir (München)
A mixed model approach for geoadditive hazard regression
Clinical trials and observational studies commonly consider composite endpoints, such as
total mortality, all cancer or cardiovascular disease, to provide a broad evaluation of the
benefits or risks on an intervention. Polytomous logistic regression and competing risk
survival analysis offer alternative approaches to compare the overall and componentspecific effects of risk factors and identify heterogeneity in these effects. We compared
these approaches for evaluation of risk factors for a composite endpoint including
myocardial infarction, stroke and venous thromboembolism in 20-year follow-up of 18,662
participants in the Physicians' Health Study. Strengths of both approaches include ready
implementation in available software, likelihood-based strategies for comparing effects
across components, interpretable parameters, and ability to include time-varying
covariates. Polytomous logistic regression has the advantage of being fully parametric with
accessible measures of goodness-of-fit and explained variance. Survival analysis better
accounts for censoring and accommodates variables such as age that may have nonproportional effects on outcomes over time.
Session II
Vorsitz: Siegfried Kropf (Magdeburg)
9:30 – 10:00
V. Henschel, U. Mansmann (Heidelberg)
Frailty in einem Bayesschen Cox Proportional Hazards Modell für
intervallzensierte Daten
10:00 – 10:30
M. Pfirrmann, J. Hasford (München)
A simulation study using validated prognostic factors to assess the expected
survival advantage of imatinib over interferon-alpha-based treatment in chronic
phase chronic myeloid leukemia patients
10:30 – 11:00
A. Neuhaus, M. Daumer (München), L. Kappos (Basel), Th. Augustin, H.
Küchenhoff (München)
Modelling time to progression in Multiple Sclerosis regarding the error in the
response variable
11:00 – 11:15
Pause
11:15 – 13:15
Session III
Vorsitz: Ralf Bender (Köln)
11:15 – 11:45
Martin Kappler, Beate Pesch, Sylvia Rabstein, Hans-Peter Rihs, Thomas
Brüning (Bochum)
Modelling Genetic Polymorphisms: A Cross-Sectional Study of Occupational
Exposure to Polycyclic Aromatic Hydrocarbons (PAHs)
11:45 – 12:15
Mathias Schaller, Markus P. Stoffel, Conrad A. Baldamus, Karl W. Lauterbach
(Köln)
Modellierung von Morbiditäten in der Dialyse
- 20 -
-5-
12:15 – 12:45
C. Lamina , F. Kronenberg, I. Heid, C. Meisinger, H. Löwel,H.-E. Wichmann
(Neuherberg), W. Koenig (Ulm) für die KORA Studiengruppe
Assoziation zwischen Ankle-Brachial-Index und Koronarereignissen in der
MONICA Augsburg Studie
12:45 – 13:15
Waltraud Kahle (Magdeburg)
Modellierung unvollständiger Reparaturen und ihre Anwendung in Technik und
Medizin
13:15 – 13:45
Arbeitsgruppentreffen
13:45 – 14:30
Mittagspause
14:30 – 16:30
Prof. Dr. Robert J. Glynn (Boston)
Alternative Analyses of Risk Factors for Composite
Endpoints (Tutorium)
ENDE
multivariaten Cox Modells untersucht. Im ersten Schritt wurden die Modellannahmen
getestet. Dies beinhaltet einen Test auf PH-Annahme und Test auf Nichtlinearität anhand
eines P-Spline 3.Grades.
Basierend auf Wiederholungsmessungen wurde außerdem ein Fehlermodell für den
Messfehler im ABI erstellt, um den geschätzten Odds Ratio für diesen Fehler zu
korrigieren. Mit der Annahme eines geringen absoluten Krankheitsrisikos für alle Werte
der messfehlerbehafteten Kovariable („rare disease“ Annahme) konnten hierbei
Regressionskalibierungsmethoden angewendet werden.
Ein ABI kleiner als 0.9 wurde bei 5.8% der männlichen (n=41) und 2.5% der weiblichen
(n=17) Teilnehmer gemessen. Insgesamt wurde bei 95 Männern und 32 Frauen ein
inzidentes Koronarereignis beobachtet. Univariate Kaplan-Meier Kurven zeigten ein
deutlich erhöhtes Risiko für koronare Ereignisse bei Probanden mit einem ABI <0.9 und
bei einer größeren Anzahl von Gefäßen mit atherosklerotischen Plaques. Im multivariaten
Modell zeigte sich ein linearer Effekt von ABI für das Auftreten der Koronarereignisse.
Außerdem zeigten die Anzahl der Gefäße mit Plaques, Alter, Geschlecht, Rauchstatus und
Diabetes einen signifikanten Einfluss.
Es konnte gezeigt werden, dass der ABI ein eigenständiger Risikofaktor für
Koronarereignisse darstellt, dessen Effekt aber durch Nichtbeachtung von Messfehlern
unterschätzt wird. Informationen aus externen Validierungsdaten können zur Korrektur
dieses Schätzers verwendet werden.
Modellierung unvollständiger Reparaturen und ihre Anwendung in Technik und
Medizin
Waltraud Kahle
Otto-von-Guericke-Universität Magdeburg
Institut für Mathematische Stochastik
D-39016 Magdeburg
Germany
url: http://www.math.uni-magdeburg.de/~wkahle/
Unvollständige Reparaturen führen zu einem Zustand, der schlechter als derjenige eines
neuen Elementes ist, jedoch besser, als wenn die Reparatur nicht stattgefunden hätte. Im
Vortrag werden verschiedene Modelle für solche unvollständigen Reparaturen vorgestellt
und hinsichtlich ihrer Anwendbarkeit untersucht.
-6-
- 19 -
Abstracts
Modellierung von Morbiditäten in der Dialyse
1
Einführung in Frailty-Modelle
1
2
Mathias Schaller , Markus P. Stoffel , Conrad A. Baldamus , Karl W. Lauterbach
1
2
1
Institut für Gesundheitsökonomie, QiN-Projekt, Köln
Kuratorium für Dialyse und Nierentransplantation e. V., Köln
Die Daten des QiN (Qualität in der Nephrologie) - Projektes umfassen medizinische Daten
von Dialysepatienten seit 1999. Ziel einer Auswertung ist es Faktoren zu finden, die einer
Krankenhauseinweisung von Dialysepatienten entgegenwirken. Um die Zeit bis zur
Krankenhauseinweisung zu modellieren, wird ein Cox Proportional Hazard Modell
angepasst.
Die Effekte der Einflussvariablen können dabei die verschiedensten Formen annehmen.
Die Effekte der Einflussvariablen werden mit penalised splines erfasst. Die so erreichten
Modelle werden im folgenden mit Modellen verglichen, die sich aus dem Anpassen
einfacher Funktionen ergeben.
Daraus wird ein Cox Proportional Hazard Modell erstellt, dass diese Effekte
zusammenfasst. Das daraus resultierende Modell wird auf seine medizinische Plausibilität
überprüft und die Resultate werden vorgestellt.
Assoziation zwischen Ankle-Brachial-Index und Koronarereignissen in der MONICA
Augsburg Studie
1
1
1
1
1
1
Lamina C , Kronenberg F , Heid I , Meisinger C , Löwel H , Wichmann H.-E. , Koenig
W2 für die KORA Studiengruppe
Andreas Wienke
Martin-Luther-Universität Halle-Wittenberg
Institut für Medizinische Epidemiologie, Biometrie und Informatik
Magdeburger Strasse 27
06097 Halle (Saale)
email: [email protected]
Ausgehend vom populären proportionalen Hazardmodell von Cox (1972) ergibt sich die
Frage nach dem Umgang mit Kovariablen, über die keine verlässlichen Informationen
vorliegen, entweder aufgrund von verlorenen Daten oder weil diese Variablen nicht
erhoben wurden oder werden konnten. An Beispielen wird erläutert, welche Auswirkungen
Heterogenität in Populationen haben kann. Als Konsequenz wird der Begriff der Frailty
eingeführt zur Beschreibung von Heterogenität in der Lebensdaueranalyse. An Beispielen
werden zahlreiche univariate und bivariate Frailty-Modelle vorgestellt und die ihnen
zugrunde liegenden Annahmen diskutiert. Breiten Raum nimmt dabei die mögliche
Interpretation der Ergebnisse sowie die Diskussion von Vor- und Nachteilen dieser
Modelle ein, während auf detaillierte mathematische Herleitungen und Beweise im
Interesse der Verständlichkeit verzichtet wird. Zahlreiche Beispiele mit konkreten Daten
demonstrieren die Anwendbarkeit der vorgestellten Modelle und Methoden.
Analysis of disproportionate stratified subsamples in epidemiological studies
Peter Rzehak1, Lloyd Chambless2, Stephan K Weiland1
1
1
Institut für Epidemiologie, GSF Forschungszentrum für Umwelt und Gesundheit,
Neuherberg
2
Abteilung Innere Medizin II, Kardiologie, Universität Ulm
[email protected]
Personen mit einer Peripheren Arteriellen Verschlusskrankheit (PAVK) weisen ein
erhöhtes Risiko für kardiovaskuläre Morbidität und Mortalität auf. Als nichtinvasive
Untersuchung bietet sich der Ankle-Brachial-Index (ABI), der Quotient aus Blutdruck am
Unterschenkel zu Blutdruck am Oberarm, an, wobei ein ABI von <0.9 auf eine PAVK
hinweist.
Wir untersuchten den ABI zusammen mit dem Vorhandensein von atherosklerotischen
Plaques im Bereich der Carotis-und Femoralarterien in Hinblick auf das Auftreten
tödlicher und nicht-tödlicher Koronarereignisse. Die Datenbasis bilden 1378 Personen im
Alter von 25-74 Jahren, die 1989/90 an der zweiten MONICA Augsburg Survey
teilgenommen hatten und im Rahmen von KORA bis zu 13 Jahre nachbeobachtet wurden.
Der Zusammenhang zwischen ABI und koronaren Endpunkten wurde mit Hilfe eines
- 18 -
Department of Epidemiology, University of Ulm, Germany
Department of Biostatistics, School of Public Health, University of North Carolina,
Chapel Hill, USA
2
Problem
Allocation of limited resources has always been a relevant topic in conducting
epidemiologic studies. Hence collecting data by a disproportionate stratified subsample e.g. on a sample of 100 wheezers and non-wheezers -can be a cost-efficient design.
However this design is not without a price, when we turn to analyze such a subsample.
Ignoring disproportionality and stratification when estimating crude or adjusted odds ratios
(OR) by standard logistic regression can give severely biased results. A frequently
proposed solution is to include the stratum variable as a covariate in the model to account
for stratification and reduce bias. However this solution gives, by definition, stratum
variable adjusted OR, and this is not always the OR of interest. In this situation using a
weighted logistic regression to account for the stratified sampling scheme, say with
SUDAAN-software, is more appropriate.
-7-
Material and Methods
A simulation study is conducted on data of the International Study of Asthma and Allergies
in Childhood (ISAAC II) selecting 500 subsamples of 100 wheezers and non-wheezers out
of 3283 pupils from Munich being 9-11 yrs old. Outcome in the illustrative example is
specific IgE and predictor is parental asthma or allergy. Logistic regression coefficients for
various models are compared with the coefficients in the full sample. Variance and bias are
calculated and compared for both methods.
Results
Simulation shows that OR estimates by weighted logistic regression yield crude OR that
are not adjusted for the stratum variable and that have very low bias, though variances of
the estimates are much larger (2.5 fold) than that of the method with stratum as covariate.
However the stratum covariate method has at least 2 fold the bias of the stratified OR
method, for estimation of the crude OR.
Conclusion
If OR are needed that adjust for the stratum variable then unweighted logistic regression
including stratum as covariate may be preferred because of smaller variances. However if
adjustment by the stratum variable is not relevant to the research question it may be
preferable to use weighted regression without the stratum variable as covariate because of
smaller bias.
Eine Methode zur Schätzung von Relativen Risiken aus Querschnittsstudien mit
Krankheitsdauerdaten
Ekkehart Dietz, Heike Englert, Stefan Willich
Institut für Sozialmedizin, Epidemiologie und Gesundheitsökonomie,
Charité Berlin, Abteilung Internationale Gesundheitswissenschaften
Fabeckstrasse 60-62, 14195 Berlin
e-mail: [email protected]
Modelling Genetic Polymorphisms: A Cross-Sectional Study of Occupational
Exposure to Polycyclic Aromatic Hydrocarbons (PAHs)
Martin Kappler, Beate Pesch, Sylvia Rabstein, Hans-Peter Rihs, Thomas Brüning
Berufsgenossenschaftliches Forschungsinstitut für Arbeitsmedizin (BGFA)
Bürkle-de-la-Camp-Platz 1
44789 Bochum
email: [email protected]
The impact of genetic polymorphisms in genes of PAH-metabolizing enzymes on the
development of PAH-related cancers has received particular interest regarding the
association of exogenous and internal exposure assessed with PAH metabolites in urine. As
influences of single genetic polymorphisms on cancer could not be confirmed for most of
the studied cancers and more complex relationships have to be assumed (Caporaso, 2002),
analyses of polymorphisms as predictors of health outcomes implicate the problem of a
great number of variables. Additionally, in occupational settings and notably in high
exposure situations the number of observations is generally limited.
In a cross-sectional study of 170 workers exposed to PAH we analyzed the impact of
genetic polymorphisms in genes of PAH-metabolizing enzymes (CYP1A1, CYP1A2,
CYP3A4, CYP1B1, EPHX1, GSTM1, GSTT1, and GSTP1) and their interactions on the
excretion of urinary metabolites (1-hydroxypyrene and sum of 1-, 2+9-, 3-, and 4hydroxyphenanthrenes) after adjustment for airborne PAH, type of industry and current
smoking. First, results of ANCOVA are presented examining each polymorphism
separately, all polymorphisms together and with additional inclusion of one interactionterm at a time. Further, we examined more complex methods to identify "important"
polymorphisms as well as two-way and higher-order interactions. Approaches using
variable selection with Gibbs sampling (Dellaportas et al., 2002; Ntzoufras, 2002),
Bayesian model averaging (Hoeting et al., 1999) and hierarchical modelling (Witte, 1997;
Dellaportas et al., 2002; Ntzoufras, 2002; Hung et al., 2004) are presented and compared to
conventional variable selection in combination with a permutation test.
Manchmal müssen Prävalenzstudien in der Krankheits-Ursachenforschung herangezogen
werden. Diese erlauben es nicht, auf direktem Wege geeignete Effektmaßzahlen wie
relative Risiken und Inzidenzdichteverhältnisse zu schätzen. Um zu Schätzungen von
Inzidenzdichten aus Querschnittsstudien zu gelangen, wird eine stabile Prävalenzrate, d.h.
ein Gleichgewicht zwischen Neuerkrankungen auf der einen Seite und Genesungen bzw.
Todesfälle mit Krank-heit auf der anderen Seite, angenommen. Unter dieser Annahme wird
dann die bekannte epidemiologische Variante der Little-Formel
mittlere Prävalenz = mittlere Inzidenz pro Zeiteinheit *mittlerer Erkrankungsdauer
oder equivalent
mittlere Prävalenz odds = Inzidenzdichte*mittlerer Erkrankungsdauer
genutzt, um durch Multiplikation von Prävalenzodds Ratios mit dem Verhältnis der
mittleren
References
Caporaso, N.E. 2002. Why have we failed to find the low penetrance genetic constituents
of common cancers? Cancer Epidemiol. Biomarkers Prev. 11, 1544-1549.
Dellaportas, P., Forster, J.J., Ntzoufras, I. 2002. On Bayesian model and variable selection
using MCMC. Statistics and Computing 12, 27-36.
Hoeting, J.A., Madigan, D., Raftery A.E., Volinsky, C.T. 1999. Bayesian model averaging:
A tutorial (with discussion). Statistical Science 14, 382-417.
Hung, R.J., Brennan, P., Malaveille, C., Porru, S., Donato, F., Boffetta, P., Witte, J.S.
2004. Using hierarchical modeling in genetic association studies with multiple markers:
application to a case-control study of bladder cancer. Cancer Epidemiol. Biomarkers
Prev. 13, 1013-1021.
Ntzoufras, I. 2002. Gibbs variable selection using BUGS. Journal of Statistical Software 7,
1-19.
Witte, J.S. 1997. Genetic analysis with hierarchical models. Genetic Epidemiology 14,
1137-1142.
-8-
- 17 -
Zusammenfassung
Modelling time to progression in Multiple Sclerosis regarding the error in the
response variable
A. Neuhaus1, M. Daumer1, L. Kappos2, Th. Augustin3, H. Küchenhoff3
Sylvia Lawry Centre for Multiple Sclerosis Research
2
Kantonsspital Basel, Switzerland
3
Department of Statistics, Ludwig Maximilians University of Munich
1
Background
Multiple Sclerosis frequently starts with a relapsing remitting (rr) phase which in many
cases changes at a later time tau to a secondary progressive (sp) phase. The aim of our
study is to examine factors which might have an effect on the time of changing to the
progressive phase in the context of clinical trials. Such information could be used for
prediction and / or improving common outcome measures. For our analysis we use data
from the Sylvia Lawry Centre for Multiple Sclerosis Research (SLCMSR).
Methods
In the SLCMSR “open dataset” 278 rr placebo patients from clinical trials had complete
information on EDSS, duration of disease, age at disease onset, gender and the number of
attacks before entering the trial available.
To find predictive variables on the time to progression (tau) we performed a two-step
analysis. First, tau was defined as a change-point estimated using a piecewise linear
regression model [1]. Neglecting errors in estimating tau could lead to biased effect
estimates. We follow a new idea of Skinner et al. [2], who propose a non-standard model to
adjust for the measurement error in survival data. We compared the results derived from a
standard survival model and the results from the error adjusted survival model.
Results
The 278 patients used in the analysis were examined 4 to 29 times in an observation period
ranging from 85 to 1778 days. In 53 % of all cases tau was estimated to lie in the
observation period, the rest was treated as censored.
The survival analysis revealed that a higher attack number is associated with a decreasing
chance to switch to the progressive phase of the disease. This result followed from both,
the standard and error adjusted survival analysis, however, a strong difference in the odds
ratios was observed.
Simulations concerning the accuracy of the estimates revealed the adjusted model to be
superior to the naive one. If the occurrence of an error cannot be excluded the adjusted
model should be used in favor of the standard model. Otherwise one will obtain strong
biased estimates.
The presented results are preliminary and have to be validated using the closed SLCMSR
dataset. Furthermore, it would be important to verify the results using long term data.
References
[1] Hellriegel et al. (2003): Analysing the course of multiple sclerosis with segmented
regression models, LMU Munich, SFB Discussion Paper, 355.
[2] Skinner C.J., Humphreys K. (1999): Weibull Regression for Lifetimes Measured with
Error, Lifetime Data Analysis, 5, 23-37.
- 16 -
Erkrankungsdauer von nicht exponierten Kranken und von exponierten Kranken zu
Schätzungen von Inzidenzdichteverhältnissen zu kommen. Rechentechnisch elegant lässt
sich das durch eine logistische Regressionsanalyse realisieren, bei der für jeden Probanden
die logarithmierte erwartete Krankheitsdauer als Offset in den linearen Prediktor
aufgenommen wird. Damit wird dem Umstand Rechnung getragen werden, dass nicht nur
die Erkrankungs-risiken inhomogen sind und von Einflussvariablen abhängen sondern
auch die Krankheits-dauerverteilung.
Da man die jeweils erwartete Krankheitsdauer jedoch nicht kennt, muss man sie durch
geeignete Schätzungen ersetzen, welche man aus einer Kohortenstudie von inzidenten
Erkrankungsfällen mittels einer geeigneten Überlebenszeitanalysemethode gewinnt. Die
Kombination einer Querschnittsstudie mit einer solchen Kohortenstudie, kann sich als
deutlich kostengünstiger als eine gewöhnliche Kohortenstudie herausstellen.
In diesem Vortrag soll es jedoch um den Versuch gehen, auf eine zusätzliche
Kohortenstudie völlig zu verzichten. Dazu wird vorausgesetzt, dass man die bisherige
Krankheitsdauer (BKD) der prävalenten Fälle kennt. Aus einer Modellanpassung an diese
Daten werden dann Schätzungen der erwarteten Erkrankungsdauer für inzidente Fällen
gewonnen. Dabei spielt erneut die oben genannte Stabilitätsannahme eine zentrale Rolle.
Es werden jedoch auch typische Abweichungen von der Stabilität und die sich daraus
ergebenden Verfälschungen der Schätzungen diskutiert.
Die Schätzmethode wird an Studiendaten demonstriert. Als eine Schlussfolgerung wird für
die verstärkte Erfassung der BKD in Prävalenzstudien plädiert, falls diese möglich ist.
Ein Regressionsmodell für korrelierte ordinale Daten an paarigen Organen
Jürgen Wellmann, Burkhard Dasch, Hans-Werner Hense
Institut für Epidemiologie und Sozialmedizin der Universität Münster
In der "Münsteraner Altern und Retina-Studie" (MARS) wird der Einfluss von
Lebensstilfaktoren und Blutparametern auf das Risiko für die altersabhängige
Makulopathie (ARM) untersucht. Letztere ist eine Erkrankung der Augen, die für die
MARS-Studie in den drei ordinalen Kategorien gesund, Frühform und Spätform an beiden
Augen erhoben wurde.
Für die Auswertung derartiger Daten schlagen wir eine Erweiterung des "Continuation
Ratio Model" vor, bei dem die Assoziationen zwischen den beiden Befunden an dem
paarigen Organ Auge durch einen GEE-Ansatz erfasst werden.
Wir demonstrieren diese Methode anhand einer Auswertung der MARS-Daten im Hinblick
auf die Frage, ob die Konzentration von C-reaktivem Protein im Blut, einem Marker für
entzündliche Prozesse, ein Risikofaktor für ARM ist. Die statistischen Eigenschaften dieser
Methode werden anhand einer kleinen Simulation näher untersucht.
-9-
Evaluierung statistischer Verfahren zur Modellierung rekurrenter Ereignisse in der
Biometrie
Ramlau P1, Schlattmann P2
1
Epidemiologie, Deutsches Rheumaforschungszentrum Berlin, Deutschland
Institut für Medizinische Informatik, Biometrie und Epidemiologie, Charité
Universitätsmedizin Berlin, Campus Benjamin Franklin, Deutschland
[email protected]
2
Einleitung
In vielen Bereichen der Medizin gibt es das Problem rekurrenter Ereignisse. Diese treten
vor allem bei chronischen Erkrankungen auf. Problematisch für die Analyse sind dabei die
möglichen Abhängigkeiten zwischen den Ereignissen. Das Cox-Regressionsmodell [1],
welches Unabhängigkeit voraussetzt, lässt sich nur unter Informationsverlust, für die Zeit
bis zum ersten Ereignis verwenden.
Mittlerweile gibt es eine Reihe von Regressionsmodellen, die für die Analyse von Daten
mit rekurrenten Ereignissen vorgeschlagen werden. Dabei kann man die zwei Gruppen der
marginalen Modelle und der Frailty-Modelle unterscheiden. Diese Modelle können bei
einem konkreten Datensatz zu durchaus unterschiedlichen Ergebnissen führen.
Methoden
In einer Simulationsstudie wurden das Cox-Regressionsmodell, zwei marginale Modelle
sowie zwei Frailty-Modelle an künstlich erzeugten Datensätzen bewertet. Zielkriterien
waren Erwartungstreue und Effizienz der Schätzer.
Die marginalen Modelle sind dadurch gekennzeichnet, dass nach Anpassung eines
geeigneten Modells ohne Berücksichtigung möglicher Abhängigkeiten der gewöhnliche
Varianzschätzer durch einen robusten ersetzt wird. Hier werden die Modelle von Andersen
und Gill (kurz: AG-Modell) [2] sowie von Prentice, Williams und Peterson (kurz: PWPModell) [3] betrachtet. Beim AG-Modell wird davon ausgegangen, dass der BaselineHazard unverändert über die Ereignisse bleibt. Beim PWP-Modell, welches auch als
konditionales Modell bekannt ist, wird von der Bedingung ausgegangen, dass ein Subjekt
erst unter Risiko für das k-te Ereignis stehen kann, wenn es das (k-1)-te Ereignis noch nicht
erlebt hat.
Die Frailty-Modelle modellieren einen unbeobachteten Zufallseffekt (Frailty), von dem
angenommen wird, dass er eine Verteilung besitzt. Üblicherweise wird dabei eine GammaVerteilung oder eine Normalverteilung angenommen. Vorteil dieser Modelle ist, dass sie
mit Hilfe von Frailties auch Abhängigkeiten berücksichtigen können. In diesem Paper
werden das AG-Modell mit shared Frailty und das PWP-Modell mit shared Frailty
betrachtet, wobei eine Gammaverteilung für die Frailties angenommen wird.
Für die Simulation der Datensätze werden drei über die Zeit konstante Kovariaten
berücksichtigt,
für
die
verschieden
große
Hazard-Ratios
(exponierter
Regressionkoeffizient) festgelegt wurden. Die Anzahl der rekurrenten Ereignisse wurde
mittels einer Poissonverteilung, die Zeiten zwischen den Ereignissen durch eine
Exponentialverteilung simuliert. Dabei wurde von einem konstanten Baseline-Hazard
ausgegangen. Zensierungen wurden mittels einer Binomialverteilung erzeugt. Die
Anpassungen der Modelle erfolgte bei Datensätzen mit Stichprobenumfängen von n = 30,
50, 100, 250 und 1000. Alle Kombinationen aus Effekten und Umfängen wurden mit 2000
Replikationen durchgeführt. Die Simulation wurde mit den Statistikpaketen R und S-Plus
- 10 -
better alternative, imatinib mesylate was developed. Due to the promising safety profile
and much higher response rates, most of the patients randomised in a major clinical trial to
a treatment based on interferon-alpha crossed over to imatinib [1]. However, long-term
survival data on imatinib is still lacking. By means of a simulation study based on validated
prognostic factors known from interferon-alpha and on the higher major cytogenetic
remission rates of the new treatment, the expected survival advantage with imatinib was
sought to be assessed.
Methods
The New CML score, a prognostic system based on six variables measured at diagnosis,
discriminates three risk groups with significantly different survival probabilities [2]. A
major cytogenetic remission (MCR) describes the reduction of the abnormal Philadelphia
chromosome-positive bone marrow cells in patients with chronic myeloid leukaemia to
less or equal 35%.
We collected data of individual patients with a confirmed diagnosis of Philadelphia
chromosome-positive CML and treated with interferon-alpha from 10 prospective studies
in Europe and Japan. In the patients with intermediate-risk and low-risk according to the
New CML score, survival probabilities of patients with MCR were significantly higher
when compared to those of patients without MCR. However, MCR rates in both risk
groups are much higher with imatinib (85% in both groups [1] vs. 24% and 33% in our
interferon-treated samples).
For our simulation study, we assumed that survival probabilities of interferon-treated and
imatinib-treated patients would be the same within each of the four samples defined by the
combination out of the New CML score risk group (intermediate-risk, low-risk) and MCR
(yes, no). According to this assumption and the MCR rate of 85% achieved by imatinib, a
sample simulating survival probabilities of intermediate-risk patients treated by imatinib
was constituted by randomly drawing 85% of its survival times from the interferon-alphatreated intermediate-risk patients with MCR and 15% from the group without MCR. The
same procedure was applied to the low-risk patients.
Results
Compared to the 10-year survival probabilities 0.22 and 0.37 of interferon-alpha-treated
intermediate-risk and low-risk patients, the corresponding survival probabilities of 0.53 and
0.66 in the simulated samples showed an absolute increment of around 0.30.
Conclusions
The simulation study prognosticated a highly relevant increment of survival probabilities
by imatinib treatment. Most likely, the best prognostic factors for imatinib differ from the
prognostic factors validated for interferon-alpha. However, judging from short-term
survival probabilities for imatinib-treated patients, assuming the same survival probabilities
for both treatment has to be regarded as a rather conservative approach. Although serious
adverse events as long-term toxicity can not be excluded, the expected survival advantage
with imatinib is increasingly backed by advancing observation time of imatinib-treated
patients.
- 15 -
used. The methodology is implemented in BayesX, a public domain software package
available from the internet.
Frailty in einem Bayesschen Cox Proportional Hazards Modell für intervallzensierte
Daten
V. Henschel, U. Mansmann
Institut für med. Biometrie, Universität Heidelberg
Die Einführung eines Frailty-Terms in das Cox Proportional Hazards Modell (CPHM)
erlaubt das adäquate Modellieren von potentiell geclusterten Ereigniszeiten. Wird dieses
CPHM des weiteren mit einer einfachen Datenaugmentation kombiniert ergibt sich die
Möglichkeit der Handhabung von geclusterten intervallzensierten Ereigniszeiten.
Insbesondere bei einem Bayesschen Ansatz ist diese Idee leicht umzusetzen.
In unserem Bayesschen Modell nutzen wir eine Idee von Dani Gamerman (1996) für
verallgemeinerte gemischte lineare Modelle, die ein schnelles Updating der
Regressionskoeffizienten erlaubt und ein Blockupdating in Markov Random Field
Modellen nach Rue (2001), welches das Sampling des Baseline Hazards verbessert. Die
nichtbeobachteten Ereigniszeiten werden mit Hilfe von stückweise exponentialverteilten
Variablen modelliert.
Das Verhalten der vorgeschlagenen Prozedur wird an Hand von Simulationsstudien
dargestellt und ein Beispiel aus der Rinderzucht mit Zufallseffekten von Vater und Mutter
wird gezeigt.
Literatur
Gamerman D. Sampling from the posterior distribution in generalized linear mixed models.
Statistics and Computing 1997; 7: 57 – 68.
Rue H. Fast sampling of Gaussian Markov random fields. Journal of the Royal Statistical
Society B 2001; 63: 325 – 338.
realisiert.
Ergebnisse
Alle Modelle lieferten gute Schätzungen bei keinem bzw. geringem Effekt. Bei größeren
Effekten zeigten im Mittel die AG-Modelle mit und ohne shared Frailty im Vergleich zu
den übrigen Modellen einen kleineren Bias. Das Cox-Modell kann für die Analyse
rekurrenter Ereignissen nicht empfohlen werden, da der mittlere quadratische Fehler im
Mittel größer war als bei den übrigen Modellen. Für die PWP-Modelle gilt, dass die
Schätzungen einen größeren Bias aufweisen können. Ihre Anwendung ist auf Grund der
Simulationsergebnisse ebenfalls nicht empfehlenswert.
Diskussion
In der Literatur gibt es wenig vergleichbare Untersuchungen. Bei Therneau und Grambsch
(2000) [4] wurde beispielhaft eine ähnliche Studie durchgeführt. Der individuelle Hazard
wurde dabei mit nur zwei Kovariaten spezifiziert. Das Ergebnis dieser Simulation ist, dass
das Cox-, AG- und PWP-Modell grundsätzlich keinen Bias aufweisen. Dabei zeigt sich das
AG-Modell leicht besser in der Effizienz als das PWP-Modell. Beide sind jedoch
effizienter gegenüber dem Cox-Modell. Bezüglich der Effizienz ist unser Ergebnis mit dem
von Therneau und Grambsch (2000) [4] vergleichbar. Im Gegensatz dazu kann die
Aussage, dass die Modelle grundsätzlich keinen Bias aufweisen, nicht bestätigt werden.
Weitere systematische Untersuchungen sind notwendig, um die Eigenschaften dieser
Modelle zu untersuchen.
Literatur
[1]
Cox D. Regression models and life-tables. Journal of the Royal Statistical
Society, Ser. B 34, 1972, 187-220.
[2]
Andersen P, Gill R. Cox´s regression model for counting processes: A large
sample study. Ann. Stat. 10, 1982, 1100-1120.
[3]
Prentice R, Williams B, Peterson A. On the regression analysis of multivariate
failure time data. Biometrika 68, 1981, 373-379
[4]
Therneau T, Grambsch P. Modeling survival data: Extending the Cox model.
Statistics for Biology and Health. New York, NY: Springer. 2000
A simulation study using validated prognostic factors to assess the expected survival
advantage of imatinib over interferon-alpha-based treatment in chronic phase
chronic myeloid leukemia patients
M. Pfirrmann 1, 2, J. Hasford 1
1)
Institut für Medizinische Informatik, Biometrie und Epidemiologie (IBE), LudwigMaximilians-Universität, München, Germany
2)
Gesellschaft für Informationsverarbeitung und Statistik in der Medizin (GIS) e.V.,
München, Germany
Background and objectives
Until the end of the nineties, interferon-alpha-based treatments were preferred as
conservative therapy for patients with chronic myeloid leukaemia (CML). In search for a
- 14 -
- 11 -
Correcting Effect Estimates for Unmeasured Confounding in Cohort Studies with
Validation Data using Propensity Score Calibration.
Til Stürmer1,2, Donna Spiegelman3,4, Sebastian Schneeweiss1, Jerry Avorn1, Robert J
Glynn1,2,4
1 Division of Pharmacoepidemiology and Pharmacoeconomics, Brigham and Women's
Hospital, Harvard Medical School, Boston, USA
2 Division of Preventive Medicine, Brigham and Women's Hospital, Harvard Medical
School, Boston, USA
3 Department of Epidemiology, Harvard School of Public Health, Boston, USA
4 Department of Biostatistics, Harvard School of Public Health, Boston,USA
Background: Often important confounders are not available in cohort studies, particularly
in claims databases. Sensitivity analyses based on the relation of unmeasured confounders
with an exposure of interest in a separate validation study have been proposed. No
applicable method exists that takes the joint distribution of unobserved confounders into
account.
Objectives: To incorporate information on the joint distribution of unobserved
confounders when assessing the sensitivity of effect estimates to unobserved confounding.
Methods: We estimated a propensity score (PS) to adjust for confounding in the main
claims database cohort. We then used cross-sectional interview data as a validation sample
to estimate two additional PS. The ‘error-prone’ PS exclusively used information available
in the main cohort (claims data). The ‘gold-standard’ PS additionally included covariates
available only in the validation study (interview data). Based on these two PS in the
validation study, regression calibration was applied to correct the regression coefficient for
the exposure of interest in the main cohort.
This propensity score calibration (PSC) was used to assess nonsteroidal antiinflammatory
drugs (NSAID) and 1-year mortality from all causes in a cohort of 103,133 New Jersey
residents who were 65 years or older and who filled prescriptions within Medicaid or the
Pharmaceutical Assistance to the Aged and Disabled program when they were hospitalized
any time between January 1, 1995 and December 31, 1997. We chose this relation because
it is subject to strong confounding, and the most plausible relation is at or near the null.
The validation study consisted of 5,108 age and sex matched participants of the Medicare
Current Beneficiary Survey (MCBS).
Results: ‘Traditional’ multivariate adjustment resulted in a relative risk (RR) in NSAID
users of 0.80 (95% confidence interval: 0.77–0.83) compared to an unadjusted RR of 0.68
(0.66–0.71). Application of PSC resulted in a more plausible RR of 1.06 (1.00–1.12).
Conclusions: This novel approach of propensity score calibration helps to correct for
unmeasured and residual confounding in cohort studies with validation data including a
richer set of confounders by taking the joint distribution of covariates into account. The
approach might be especially advantageous for pharmacoepidemiologic research using
claims data since it might help to address one of the main problems in this area of research,
- 12 -
i.e. lack of information on important confounders, and thus lead to a major improvement in
the quality of research in this field.
A mixed model approach for geoadditive hazard regression
Thomas Kneib and Ludwig Fahrmeir
Department of Statistics, Ludwig-Maximilians-University Munich.
A standard tool for analyzing the impact of covariates on continuous survival times is the
Cox proportional hazards model where a multiplicative structure consisting of an
individual-independent baseline hazard rate and a linear predictor is assumed for the hazard
rate. In the traditional Cox model the baseline hazard rate remains unspecified and
estimation of the regression coefficients is based on the partial likelihood. In a second step
the baseline hazard can be approximated by a step function using Breslow's estimate.
However, it is often desirable to estimate the baseline in a smooth way simultaneously with
covariate effects, for example if we are interested in predicting survival times for new
observations or if we are interested in analytic properties of the baseline. Furthermore a
linear predictor is often not flexible enough to describe data situations of realistic
complexity in an adequate way. As an example we will present results from a study on
leukemia survival times, where spatial information has to be included in the analysis and
some covariate effects clearly are of nonlinear form.
We propose an extended Cox-type model that allows for the simultaneous estimation of the
baseline hazard and a geoadditive predictor acting multiplicatively on the baseline. Both
the log-baseline hazard and effects of continuous covariates or further time scales such as
calendar time are weakly parameterized using penalized splines. Two-dimensional
extensions of these P-splines can be used to model flexible interaction surfaces between
two continuous covariates. If exact spatial locations are available, spatial effects can be
estimated using stationary Gaussian random fields (kriging) or again two-dimensional Pspline surface smoothers. If observations are clustered in connected geographical regions,
we propose to use the Markov random field approach commonly known from disease
mapping. Our approach also supports cluster-specific random effects (or frailties) and
varying coefficient terms both with continuous and spatial effect modifiers. Inclusion of
covariates with time-varying effects leads to models that relax the proportional hazards
assumption. Such time-varying effects can be subsumed into the varying coefficients
framework, where survival time acts as effect modifier and is again modeled as a P-spline.
The estimation procedure for our hazard regression approach is based on a mixed model
representation of the geoadditive predictor, which has gained considerable attention within
a generalized additive model context throughout the last years. We extend existing
methods for the estimation of Cox models with uncorrelated cluster-specific frailties to
more general mixed models for survival times. Variance components of the mixed model,
corresponding to inverse smoothing parameters of nonparametric or spatial effects, are
estimated using (approximate) marginal or restricted maximum likelihood. Since the
marginal likelihood can not be derived analytically, certain approximations have to be
- 13 -
Herunterladen