Workshop Erweiterte Methoden für Überlebenszeiten Statistische Methoden in Epidemiologie und Medizin 18. und 19. November 2004 in Halle (Saale) - 24 - -2- - 23 - Workshop Erweiterte Methoden für Überlebenszeiten Statistische Methoden in Epidemiologie und Medizin Gemeinsamer Workshop der Arbeitsgruppen Statistische Methoden in der Medizin (IBS-DR) Statistische Methodik in der klinischen Forschung (GMDS) Statistische Methoden in der Epidemiologie (DAE, DR-IBS) Organisation des Workshops Dr. Oliver Kuss PD Dr. Ralf Bender PD Dr. Siegfried Kropf Dirk Taeger Dr. Jürgen Wellmann Termin: Donnerstag/Freitag, 18./19. November 2004 Ort: Hörsaal des Instituts für Humangenetik und Medizinische Biologie, Magdeburger Str. 2 Martin-Luther Universität Halle-Wittenberg 06097 Halle (Saale) Workshop-Homepage: http://medweb.uni-muenster.de/institute/epi/StatMethMed/2004/Halle/index.html - 22 - -3- Programm Donnerstag, 18.11.04 14:30 – 14:35 Oliver Kuß (Halle), Siegfried Kropf (Magdeburg), Ralf Bender (Köln), Dirk Taeger (Bochum) Begrüßung und Organisatorisches 14:35 – 16:00 Andreas Wienke (Halle) Einführung in Frailty-Modelle (Tutorium) 16:00 – 16:30 Pause 16:30 – 18:30 Session I Vorsitz: Dirk Taeger (Bochum) 16:30 – 17:00 Peter Rzehak (Ulm), Lloyd Chambless (Chapel Hill), Stephan K Weiland (Ulm) Analysis of disproportionate stratified subsamples in epidemiological studies 17:00 – 17:30 Ekkehart Dietz, Heike Englert, Stefan Willich (Berlin) Eine Methode zur Schätzung von Relativen Risiken aus Querschnittsstudien mit Krankheitsdauerdaten 17:30 – 18:00 Jürgen Wellmann, Burkhard Dasch, Hans-Werner Hense (Münster) Ein Regressionsmodell für korrelierte ordinale Daten an paarigen Organen 18:00 – 18:30 P. Ramlau, P. Schlattmann (Berlin) Evaluierung statistischer Verfahren zur Modellierung rekurrenter Ereignisse in der Biometrie 18:30 – 19:00 T. Stürmer, D. Spiegelman, S. Schneeweiss, J. Avorn, R.J. Glynn (Boston) Correcting Effect Estimates for Unmeasured Confounding in Cohort Studies with Validation Data using Propensity Score Calibration Ab 20:00 Uhr Gemütliches Beisammensein in einem Restaurant und Kneipenbummel -4- - 21 - Alternative Analyses of Risk Factors for Composite Endpoints (Tutorium) Freitag,19.11.04 Robert J Glynn (Boston) 09:00 – 11:00 Associate Professor of Medicine (Biostatistics), Harvard Medical School Division of Preventive Medicine, Division of Pharmacoepidemiology and Pharmacoeconomics, Brigham and Women's Hospital Department of Biostatistics, Harvard School of Public Health 9:00 – 09:30 Thomas Kneib and Ludwig Fahrmeir (München) A mixed model approach for geoadditive hazard regression Clinical trials and observational studies commonly consider composite endpoints, such as total mortality, all cancer or cardiovascular disease, to provide a broad evaluation of the benefits or risks on an intervention. Polytomous logistic regression and competing risk survival analysis offer alternative approaches to compare the overall and componentspecific effects of risk factors and identify heterogeneity in these effects. We compared these approaches for evaluation of risk factors for a composite endpoint including myocardial infarction, stroke and venous thromboembolism in 20-year follow-up of 18,662 participants in the Physicians' Health Study. Strengths of both approaches include ready implementation in available software, likelihood-based strategies for comparing effects across components, interpretable parameters, and ability to include time-varying covariates. Polytomous logistic regression has the advantage of being fully parametric with accessible measures of goodness-of-fit and explained variance. Survival analysis better accounts for censoring and accommodates variables such as age that may have nonproportional effects on outcomes over time. Session II Vorsitz: Siegfried Kropf (Magdeburg) 9:30 – 10:00 V. Henschel, U. Mansmann (Heidelberg) Frailty in einem Bayesschen Cox Proportional Hazards Modell für intervallzensierte Daten 10:00 – 10:30 M. Pfirrmann, J. Hasford (München) A simulation study using validated prognostic factors to assess the expected survival advantage of imatinib over interferon-alpha-based treatment in chronic phase chronic myeloid leukemia patients 10:30 – 11:00 A. Neuhaus, M. Daumer (München), L. Kappos (Basel), Th. Augustin, H. Küchenhoff (München) Modelling time to progression in Multiple Sclerosis regarding the error in the response variable 11:00 – 11:15 Pause 11:15 – 13:15 Session III Vorsitz: Ralf Bender (Köln) 11:15 – 11:45 Martin Kappler, Beate Pesch, Sylvia Rabstein, Hans-Peter Rihs, Thomas Brüning (Bochum) Modelling Genetic Polymorphisms: A Cross-Sectional Study of Occupational Exposure to Polycyclic Aromatic Hydrocarbons (PAHs) 11:45 – 12:15 Mathias Schaller, Markus P. Stoffel, Conrad A. Baldamus, Karl W. Lauterbach (Köln) Modellierung von Morbiditäten in der Dialyse - 20 - -5- 12:15 – 12:45 C. Lamina , F. Kronenberg, I. Heid, C. Meisinger, H. Löwel,H.-E. Wichmann (Neuherberg), W. Koenig (Ulm) für die KORA Studiengruppe Assoziation zwischen Ankle-Brachial-Index und Koronarereignissen in der MONICA Augsburg Studie 12:45 – 13:15 Waltraud Kahle (Magdeburg) Modellierung unvollständiger Reparaturen und ihre Anwendung in Technik und Medizin 13:15 – 13:45 Arbeitsgruppentreffen 13:45 – 14:30 Mittagspause 14:30 – 16:30 Prof. Dr. Robert J. Glynn (Boston) Alternative Analyses of Risk Factors for Composite Endpoints (Tutorium) ENDE multivariaten Cox Modells untersucht. Im ersten Schritt wurden die Modellannahmen getestet. Dies beinhaltet einen Test auf PH-Annahme und Test auf Nichtlinearität anhand eines P-Spline 3.Grades. Basierend auf Wiederholungsmessungen wurde außerdem ein Fehlermodell für den Messfehler im ABI erstellt, um den geschätzten Odds Ratio für diesen Fehler zu korrigieren. Mit der Annahme eines geringen absoluten Krankheitsrisikos für alle Werte der messfehlerbehafteten Kovariable („rare disease“ Annahme) konnten hierbei Regressionskalibierungsmethoden angewendet werden. Ein ABI kleiner als 0.9 wurde bei 5.8% der männlichen (n=41) und 2.5% der weiblichen (n=17) Teilnehmer gemessen. Insgesamt wurde bei 95 Männern und 32 Frauen ein inzidentes Koronarereignis beobachtet. Univariate Kaplan-Meier Kurven zeigten ein deutlich erhöhtes Risiko für koronare Ereignisse bei Probanden mit einem ABI <0.9 und bei einer größeren Anzahl von Gefäßen mit atherosklerotischen Plaques. Im multivariaten Modell zeigte sich ein linearer Effekt von ABI für das Auftreten der Koronarereignisse. Außerdem zeigten die Anzahl der Gefäße mit Plaques, Alter, Geschlecht, Rauchstatus und Diabetes einen signifikanten Einfluss. Es konnte gezeigt werden, dass der ABI ein eigenständiger Risikofaktor für Koronarereignisse darstellt, dessen Effekt aber durch Nichtbeachtung von Messfehlern unterschätzt wird. Informationen aus externen Validierungsdaten können zur Korrektur dieses Schätzers verwendet werden. Modellierung unvollständiger Reparaturen und ihre Anwendung in Technik und Medizin Waltraud Kahle Otto-von-Guericke-Universität Magdeburg Institut für Mathematische Stochastik D-39016 Magdeburg Germany url: http://www.math.uni-magdeburg.de/~wkahle/ Unvollständige Reparaturen führen zu einem Zustand, der schlechter als derjenige eines neuen Elementes ist, jedoch besser, als wenn die Reparatur nicht stattgefunden hätte. Im Vortrag werden verschiedene Modelle für solche unvollständigen Reparaturen vorgestellt und hinsichtlich ihrer Anwendbarkeit untersucht. -6- - 19 - Abstracts Modellierung von Morbiditäten in der Dialyse 1 Einführung in Frailty-Modelle 1 2 Mathias Schaller , Markus P. Stoffel , Conrad A. Baldamus , Karl W. Lauterbach 1 2 1 Institut für Gesundheitsökonomie, QiN-Projekt, Köln Kuratorium für Dialyse und Nierentransplantation e. V., Köln Die Daten des QiN (Qualität in der Nephrologie) - Projektes umfassen medizinische Daten von Dialysepatienten seit 1999. Ziel einer Auswertung ist es Faktoren zu finden, die einer Krankenhauseinweisung von Dialysepatienten entgegenwirken. Um die Zeit bis zur Krankenhauseinweisung zu modellieren, wird ein Cox Proportional Hazard Modell angepasst. Die Effekte der Einflussvariablen können dabei die verschiedensten Formen annehmen. Die Effekte der Einflussvariablen werden mit penalised splines erfasst. Die so erreichten Modelle werden im folgenden mit Modellen verglichen, die sich aus dem Anpassen einfacher Funktionen ergeben. Daraus wird ein Cox Proportional Hazard Modell erstellt, dass diese Effekte zusammenfasst. Das daraus resultierende Modell wird auf seine medizinische Plausibilität überprüft und die Resultate werden vorgestellt. Assoziation zwischen Ankle-Brachial-Index und Koronarereignissen in der MONICA Augsburg Studie 1 1 1 1 1 1 Lamina C , Kronenberg F , Heid I , Meisinger C , Löwel H , Wichmann H.-E. , Koenig W2 für die KORA Studiengruppe Andreas Wienke Martin-Luther-Universität Halle-Wittenberg Institut für Medizinische Epidemiologie, Biometrie und Informatik Magdeburger Strasse 27 06097 Halle (Saale) email: [email protected] Ausgehend vom populären proportionalen Hazardmodell von Cox (1972) ergibt sich die Frage nach dem Umgang mit Kovariablen, über die keine verlässlichen Informationen vorliegen, entweder aufgrund von verlorenen Daten oder weil diese Variablen nicht erhoben wurden oder werden konnten. An Beispielen wird erläutert, welche Auswirkungen Heterogenität in Populationen haben kann. Als Konsequenz wird der Begriff der Frailty eingeführt zur Beschreibung von Heterogenität in der Lebensdaueranalyse. An Beispielen werden zahlreiche univariate und bivariate Frailty-Modelle vorgestellt und die ihnen zugrunde liegenden Annahmen diskutiert. Breiten Raum nimmt dabei die mögliche Interpretation der Ergebnisse sowie die Diskussion von Vor- und Nachteilen dieser Modelle ein, während auf detaillierte mathematische Herleitungen und Beweise im Interesse der Verständlichkeit verzichtet wird. Zahlreiche Beispiele mit konkreten Daten demonstrieren die Anwendbarkeit der vorgestellten Modelle und Methoden. Analysis of disproportionate stratified subsamples in epidemiological studies Peter Rzehak1, Lloyd Chambless2, Stephan K Weiland1 1 1 Institut für Epidemiologie, GSF Forschungszentrum für Umwelt und Gesundheit, Neuherberg 2 Abteilung Innere Medizin II, Kardiologie, Universität Ulm [email protected] Personen mit einer Peripheren Arteriellen Verschlusskrankheit (PAVK) weisen ein erhöhtes Risiko für kardiovaskuläre Morbidität und Mortalität auf. Als nichtinvasive Untersuchung bietet sich der Ankle-Brachial-Index (ABI), der Quotient aus Blutdruck am Unterschenkel zu Blutdruck am Oberarm, an, wobei ein ABI von <0.9 auf eine PAVK hinweist. Wir untersuchten den ABI zusammen mit dem Vorhandensein von atherosklerotischen Plaques im Bereich der Carotis-und Femoralarterien in Hinblick auf das Auftreten tödlicher und nicht-tödlicher Koronarereignisse. Die Datenbasis bilden 1378 Personen im Alter von 25-74 Jahren, die 1989/90 an der zweiten MONICA Augsburg Survey teilgenommen hatten und im Rahmen von KORA bis zu 13 Jahre nachbeobachtet wurden. Der Zusammenhang zwischen ABI und koronaren Endpunkten wurde mit Hilfe eines - 18 - Department of Epidemiology, University of Ulm, Germany Department of Biostatistics, School of Public Health, University of North Carolina, Chapel Hill, USA 2 Problem Allocation of limited resources has always been a relevant topic in conducting epidemiologic studies. Hence collecting data by a disproportionate stratified subsample e.g. on a sample of 100 wheezers and non-wheezers -can be a cost-efficient design. However this design is not without a price, when we turn to analyze such a subsample. Ignoring disproportionality and stratification when estimating crude or adjusted odds ratios (OR) by standard logistic regression can give severely biased results. A frequently proposed solution is to include the stratum variable as a covariate in the model to account for stratification and reduce bias. However this solution gives, by definition, stratum variable adjusted OR, and this is not always the OR of interest. In this situation using a weighted logistic regression to account for the stratified sampling scheme, say with SUDAAN-software, is more appropriate. -7- Material and Methods A simulation study is conducted on data of the International Study of Asthma and Allergies in Childhood (ISAAC II) selecting 500 subsamples of 100 wheezers and non-wheezers out of 3283 pupils from Munich being 9-11 yrs old. Outcome in the illustrative example is specific IgE and predictor is parental asthma or allergy. Logistic regression coefficients for various models are compared with the coefficients in the full sample. Variance and bias are calculated and compared for both methods. Results Simulation shows that OR estimates by weighted logistic regression yield crude OR that are not adjusted for the stratum variable and that have very low bias, though variances of the estimates are much larger (2.5 fold) than that of the method with stratum as covariate. However the stratum covariate method has at least 2 fold the bias of the stratified OR method, for estimation of the crude OR. Conclusion If OR are needed that adjust for the stratum variable then unweighted logistic regression including stratum as covariate may be preferred because of smaller variances. However if adjustment by the stratum variable is not relevant to the research question it may be preferable to use weighted regression without the stratum variable as covariate because of smaller bias. Eine Methode zur Schätzung von Relativen Risiken aus Querschnittsstudien mit Krankheitsdauerdaten Ekkehart Dietz, Heike Englert, Stefan Willich Institut für Sozialmedizin, Epidemiologie und Gesundheitsökonomie, Charité Berlin, Abteilung Internationale Gesundheitswissenschaften Fabeckstrasse 60-62, 14195 Berlin e-mail: [email protected] Modelling Genetic Polymorphisms: A Cross-Sectional Study of Occupational Exposure to Polycyclic Aromatic Hydrocarbons (PAHs) Martin Kappler, Beate Pesch, Sylvia Rabstein, Hans-Peter Rihs, Thomas Brüning Berufsgenossenschaftliches Forschungsinstitut für Arbeitsmedizin (BGFA) Bürkle-de-la-Camp-Platz 1 44789 Bochum email: [email protected] The impact of genetic polymorphisms in genes of PAH-metabolizing enzymes on the development of PAH-related cancers has received particular interest regarding the association of exogenous and internal exposure assessed with PAH metabolites in urine. As influences of single genetic polymorphisms on cancer could not be confirmed for most of the studied cancers and more complex relationships have to be assumed (Caporaso, 2002), analyses of polymorphisms as predictors of health outcomes implicate the problem of a great number of variables. Additionally, in occupational settings and notably in high exposure situations the number of observations is generally limited. In a cross-sectional study of 170 workers exposed to PAH we analyzed the impact of genetic polymorphisms in genes of PAH-metabolizing enzymes (CYP1A1, CYP1A2, CYP3A4, CYP1B1, EPHX1, GSTM1, GSTT1, and GSTP1) and their interactions on the excretion of urinary metabolites (1-hydroxypyrene and sum of 1-, 2+9-, 3-, and 4hydroxyphenanthrenes) after adjustment for airborne PAH, type of industry and current smoking. First, results of ANCOVA are presented examining each polymorphism separately, all polymorphisms together and with additional inclusion of one interactionterm at a time. Further, we examined more complex methods to identify "important" polymorphisms as well as two-way and higher-order interactions. Approaches using variable selection with Gibbs sampling (Dellaportas et al., 2002; Ntzoufras, 2002), Bayesian model averaging (Hoeting et al., 1999) and hierarchical modelling (Witte, 1997; Dellaportas et al., 2002; Ntzoufras, 2002; Hung et al., 2004) are presented and compared to conventional variable selection in combination with a permutation test. Manchmal müssen Prävalenzstudien in der Krankheits-Ursachenforschung herangezogen werden. Diese erlauben es nicht, auf direktem Wege geeignete Effektmaßzahlen wie relative Risiken und Inzidenzdichteverhältnisse zu schätzen. Um zu Schätzungen von Inzidenzdichten aus Querschnittsstudien zu gelangen, wird eine stabile Prävalenzrate, d.h. ein Gleichgewicht zwischen Neuerkrankungen auf der einen Seite und Genesungen bzw. Todesfälle mit Krank-heit auf der anderen Seite, angenommen. Unter dieser Annahme wird dann die bekannte epidemiologische Variante der Little-Formel mittlere Prävalenz = mittlere Inzidenz pro Zeiteinheit *mittlerer Erkrankungsdauer oder equivalent mittlere Prävalenz odds = Inzidenzdichte*mittlerer Erkrankungsdauer genutzt, um durch Multiplikation von Prävalenzodds Ratios mit dem Verhältnis der mittleren References Caporaso, N.E. 2002. Why have we failed to find the low penetrance genetic constituents of common cancers? Cancer Epidemiol. Biomarkers Prev. 11, 1544-1549. Dellaportas, P., Forster, J.J., Ntzoufras, I. 2002. On Bayesian model and variable selection using MCMC. Statistics and Computing 12, 27-36. Hoeting, J.A., Madigan, D., Raftery A.E., Volinsky, C.T. 1999. Bayesian model averaging: A tutorial (with discussion). Statistical Science 14, 382-417. Hung, R.J., Brennan, P., Malaveille, C., Porru, S., Donato, F., Boffetta, P., Witte, J.S. 2004. Using hierarchical modeling in genetic association studies with multiple markers: application to a case-control study of bladder cancer. Cancer Epidemiol. Biomarkers Prev. 13, 1013-1021. Ntzoufras, I. 2002. Gibbs variable selection using BUGS. Journal of Statistical Software 7, 1-19. Witte, J.S. 1997. Genetic analysis with hierarchical models. Genetic Epidemiology 14, 1137-1142. -8- - 17 - Zusammenfassung Modelling time to progression in Multiple Sclerosis regarding the error in the response variable A. Neuhaus1, M. Daumer1, L. Kappos2, Th. Augustin3, H. Küchenhoff3 Sylvia Lawry Centre for Multiple Sclerosis Research 2 Kantonsspital Basel, Switzerland 3 Department of Statistics, Ludwig Maximilians University of Munich 1 Background Multiple Sclerosis frequently starts with a relapsing remitting (rr) phase which in many cases changes at a later time tau to a secondary progressive (sp) phase. The aim of our study is to examine factors which might have an effect on the time of changing to the progressive phase in the context of clinical trials. Such information could be used for prediction and / or improving common outcome measures. For our analysis we use data from the Sylvia Lawry Centre for Multiple Sclerosis Research (SLCMSR). Methods In the SLCMSR “open dataset” 278 rr placebo patients from clinical trials had complete information on EDSS, duration of disease, age at disease onset, gender and the number of attacks before entering the trial available. To find predictive variables on the time to progression (tau) we performed a two-step analysis. First, tau was defined as a change-point estimated using a piecewise linear regression model [1]. Neglecting errors in estimating tau could lead to biased effect estimates. We follow a new idea of Skinner et al. [2], who propose a non-standard model to adjust for the measurement error in survival data. We compared the results derived from a standard survival model and the results from the error adjusted survival model. Results The 278 patients used in the analysis were examined 4 to 29 times in an observation period ranging from 85 to 1778 days. In 53 % of all cases tau was estimated to lie in the observation period, the rest was treated as censored. The survival analysis revealed that a higher attack number is associated with a decreasing chance to switch to the progressive phase of the disease. This result followed from both, the standard and error adjusted survival analysis, however, a strong difference in the odds ratios was observed. Simulations concerning the accuracy of the estimates revealed the adjusted model to be superior to the naive one. If the occurrence of an error cannot be excluded the adjusted model should be used in favor of the standard model. Otherwise one will obtain strong biased estimates. The presented results are preliminary and have to be validated using the closed SLCMSR dataset. Furthermore, it would be important to verify the results using long term data. References [1] Hellriegel et al. (2003): Analysing the course of multiple sclerosis with segmented regression models, LMU Munich, SFB Discussion Paper, 355. [2] Skinner C.J., Humphreys K. (1999): Weibull Regression for Lifetimes Measured with Error, Lifetime Data Analysis, 5, 23-37. - 16 - Erkrankungsdauer von nicht exponierten Kranken und von exponierten Kranken zu Schätzungen von Inzidenzdichteverhältnissen zu kommen. Rechentechnisch elegant lässt sich das durch eine logistische Regressionsanalyse realisieren, bei der für jeden Probanden die logarithmierte erwartete Krankheitsdauer als Offset in den linearen Prediktor aufgenommen wird. Damit wird dem Umstand Rechnung getragen werden, dass nicht nur die Erkrankungs-risiken inhomogen sind und von Einflussvariablen abhängen sondern auch die Krankheits-dauerverteilung. Da man die jeweils erwartete Krankheitsdauer jedoch nicht kennt, muss man sie durch geeignete Schätzungen ersetzen, welche man aus einer Kohortenstudie von inzidenten Erkrankungsfällen mittels einer geeigneten Überlebenszeitanalysemethode gewinnt. Die Kombination einer Querschnittsstudie mit einer solchen Kohortenstudie, kann sich als deutlich kostengünstiger als eine gewöhnliche Kohortenstudie herausstellen. In diesem Vortrag soll es jedoch um den Versuch gehen, auf eine zusätzliche Kohortenstudie völlig zu verzichten. Dazu wird vorausgesetzt, dass man die bisherige Krankheitsdauer (BKD) der prävalenten Fälle kennt. Aus einer Modellanpassung an diese Daten werden dann Schätzungen der erwarteten Erkrankungsdauer für inzidente Fällen gewonnen. Dabei spielt erneut die oben genannte Stabilitätsannahme eine zentrale Rolle. Es werden jedoch auch typische Abweichungen von der Stabilität und die sich daraus ergebenden Verfälschungen der Schätzungen diskutiert. Die Schätzmethode wird an Studiendaten demonstriert. Als eine Schlussfolgerung wird für die verstärkte Erfassung der BKD in Prävalenzstudien plädiert, falls diese möglich ist. Ein Regressionsmodell für korrelierte ordinale Daten an paarigen Organen Jürgen Wellmann, Burkhard Dasch, Hans-Werner Hense Institut für Epidemiologie und Sozialmedizin der Universität Münster In der "Münsteraner Altern und Retina-Studie" (MARS) wird der Einfluss von Lebensstilfaktoren und Blutparametern auf das Risiko für die altersabhängige Makulopathie (ARM) untersucht. Letztere ist eine Erkrankung der Augen, die für die MARS-Studie in den drei ordinalen Kategorien gesund, Frühform und Spätform an beiden Augen erhoben wurde. Für die Auswertung derartiger Daten schlagen wir eine Erweiterung des "Continuation Ratio Model" vor, bei dem die Assoziationen zwischen den beiden Befunden an dem paarigen Organ Auge durch einen GEE-Ansatz erfasst werden. Wir demonstrieren diese Methode anhand einer Auswertung der MARS-Daten im Hinblick auf die Frage, ob die Konzentration von C-reaktivem Protein im Blut, einem Marker für entzündliche Prozesse, ein Risikofaktor für ARM ist. Die statistischen Eigenschaften dieser Methode werden anhand einer kleinen Simulation näher untersucht. -9- Evaluierung statistischer Verfahren zur Modellierung rekurrenter Ereignisse in der Biometrie Ramlau P1, Schlattmann P2 1 Epidemiologie, Deutsches Rheumaforschungszentrum Berlin, Deutschland Institut für Medizinische Informatik, Biometrie und Epidemiologie, Charité Universitätsmedizin Berlin, Campus Benjamin Franklin, Deutschland [email protected] 2 Einleitung In vielen Bereichen der Medizin gibt es das Problem rekurrenter Ereignisse. Diese treten vor allem bei chronischen Erkrankungen auf. Problematisch für die Analyse sind dabei die möglichen Abhängigkeiten zwischen den Ereignissen. Das Cox-Regressionsmodell [1], welches Unabhängigkeit voraussetzt, lässt sich nur unter Informationsverlust, für die Zeit bis zum ersten Ereignis verwenden. Mittlerweile gibt es eine Reihe von Regressionsmodellen, die für die Analyse von Daten mit rekurrenten Ereignissen vorgeschlagen werden. Dabei kann man die zwei Gruppen der marginalen Modelle und der Frailty-Modelle unterscheiden. Diese Modelle können bei einem konkreten Datensatz zu durchaus unterschiedlichen Ergebnissen führen. Methoden In einer Simulationsstudie wurden das Cox-Regressionsmodell, zwei marginale Modelle sowie zwei Frailty-Modelle an künstlich erzeugten Datensätzen bewertet. Zielkriterien waren Erwartungstreue und Effizienz der Schätzer. Die marginalen Modelle sind dadurch gekennzeichnet, dass nach Anpassung eines geeigneten Modells ohne Berücksichtigung möglicher Abhängigkeiten der gewöhnliche Varianzschätzer durch einen robusten ersetzt wird. Hier werden die Modelle von Andersen und Gill (kurz: AG-Modell) [2] sowie von Prentice, Williams und Peterson (kurz: PWPModell) [3] betrachtet. Beim AG-Modell wird davon ausgegangen, dass der BaselineHazard unverändert über die Ereignisse bleibt. Beim PWP-Modell, welches auch als konditionales Modell bekannt ist, wird von der Bedingung ausgegangen, dass ein Subjekt erst unter Risiko für das k-te Ereignis stehen kann, wenn es das (k-1)-te Ereignis noch nicht erlebt hat. Die Frailty-Modelle modellieren einen unbeobachteten Zufallseffekt (Frailty), von dem angenommen wird, dass er eine Verteilung besitzt. Üblicherweise wird dabei eine GammaVerteilung oder eine Normalverteilung angenommen. Vorteil dieser Modelle ist, dass sie mit Hilfe von Frailties auch Abhängigkeiten berücksichtigen können. In diesem Paper werden das AG-Modell mit shared Frailty und das PWP-Modell mit shared Frailty betrachtet, wobei eine Gammaverteilung für die Frailties angenommen wird. Für die Simulation der Datensätze werden drei über die Zeit konstante Kovariaten berücksichtigt, für die verschieden große Hazard-Ratios (exponierter Regressionkoeffizient) festgelegt wurden. Die Anzahl der rekurrenten Ereignisse wurde mittels einer Poissonverteilung, die Zeiten zwischen den Ereignissen durch eine Exponentialverteilung simuliert. Dabei wurde von einem konstanten Baseline-Hazard ausgegangen. Zensierungen wurden mittels einer Binomialverteilung erzeugt. Die Anpassungen der Modelle erfolgte bei Datensätzen mit Stichprobenumfängen von n = 30, 50, 100, 250 und 1000. Alle Kombinationen aus Effekten und Umfängen wurden mit 2000 Replikationen durchgeführt. Die Simulation wurde mit den Statistikpaketen R und S-Plus - 10 - better alternative, imatinib mesylate was developed. Due to the promising safety profile and much higher response rates, most of the patients randomised in a major clinical trial to a treatment based on interferon-alpha crossed over to imatinib [1]. However, long-term survival data on imatinib is still lacking. By means of a simulation study based on validated prognostic factors known from interferon-alpha and on the higher major cytogenetic remission rates of the new treatment, the expected survival advantage with imatinib was sought to be assessed. Methods The New CML score, a prognostic system based on six variables measured at diagnosis, discriminates three risk groups with significantly different survival probabilities [2]. A major cytogenetic remission (MCR) describes the reduction of the abnormal Philadelphia chromosome-positive bone marrow cells in patients with chronic myeloid leukaemia to less or equal 35%. We collected data of individual patients with a confirmed diagnosis of Philadelphia chromosome-positive CML and treated with interferon-alpha from 10 prospective studies in Europe and Japan. In the patients with intermediate-risk and low-risk according to the New CML score, survival probabilities of patients with MCR were significantly higher when compared to those of patients without MCR. However, MCR rates in both risk groups are much higher with imatinib (85% in both groups [1] vs. 24% and 33% in our interferon-treated samples). For our simulation study, we assumed that survival probabilities of interferon-treated and imatinib-treated patients would be the same within each of the four samples defined by the combination out of the New CML score risk group (intermediate-risk, low-risk) and MCR (yes, no). According to this assumption and the MCR rate of 85% achieved by imatinib, a sample simulating survival probabilities of intermediate-risk patients treated by imatinib was constituted by randomly drawing 85% of its survival times from the interferon-alphatreated intermediate-risk patients with MCR and 15% from the group without MCR. The same procedure was applied to the low-risk patients. Results Compared to the 10-year survival probabilities 0.22 and 0.37 of interferon-alpha-treated intermediate-risk and low-risk patients, the corresponding survival probabilities of 0.53 and 0.66 in the simulated samples showed an absolute increment of around 0.30. Conclusions The simulation study prognosticated a highly relevant increment of survival probabilities by imatinib treatment. Most likely, the best prognostic factors for imatinib differ from the prognostic factors validated for interferon-alpha. However, judging from short-term survival probabilities for imatinib-treated patients, assuming the same survival probabilities for both treatment has to be regarded as a rather conservative approach. Although serious adverse events as long-term toxicity can not be excluded, the expected survival advantage with imatinib is increasingly backed by advancing observation time of imatinib-treated patients. - 15 - used. The methodology is implemented in BayesX, a public domain software package available from the internet. Frailty in einem Bayesschen Cox Proportional Hazards Modell für intervallzensierte Daten V. Henschel, U. Mansmann Institut für med. Biometrie, Universität Heidelberg Die Einführung eines Frailty-Terms in das Cox Proportional Hazards Modell (CPHM) erlaubt das adäquate Modellieren von potentiell geclusterten Ereigniszeiten. Wird dieses CPHM des weiteren mit einer einfachen Datenaugmentation kombiniert ergibt sich die Möglichkeit der Handhabung von geclusterten intervallzensierten Ereigniszeiten. Insbesondere bei einem Bayesschen Ansatz ist diese Idee leicht umzusetzen. In unserem Bayesschen Modell nutzen wir eine Idee von Dani Gamerman (1996) für verallgemeinerte gemischte lineare Modelle, die ein schnelles Updating der Regressionskoeffizienten erlaubt und ein Blockupdating in Markov Random Field Modellen nach Rue (2001), welches das Sampling des Baseline Hazards verbessert. Die nichtbeobachteten Ereigniszeiten werden mit Hilfe von stückweise exponentialverteilten Variablen modelliert. Das Verhalten der vorgeschlagenen Prozedur wird an Hand von Simulationsstudien dargestellt und ein Beispiel aus der Rinderzucht mit Zufallseffekten von Vater und Mutter wird gezeigt. Literatur Gamerman D. Sampling from the posterior distribution in generalized linear mixed models. Statistics and Computing 1997; 7: 57 – 68. Rue H. Fast sampling of Gaussian Markov random fields. Journal of the Royal Statistical Society B 2001; 63: 325 – 338. realisiert. Ergebnisse Alle Modelle lieferten gute Schätzungen bei keinem bzw. geringem Effekt. Bei größeren Effekten zeigten im Mittel die AG-Modelle mit und ohne shared Frailty im Vergleich zu den übrigen Modellen einen kleineren Bias. Das Cox-Modell kann für die Analyse rekurrenter Ereignissen nicht empfohlen werden, da der mittlere quadratische Fehler im Mittel größer war als bei den übrigen Modellen. Für die PWP-Modelle gilt, dass die Schätzungen einen größeren Bias aufweisen können. Ihre Anwendung ist auf Grund der Simulationsergebnisse ebenfalls nicht empfehlenswert. Diskussion In der Literatur gibt es wenig vergleichbare Untersuchungen. Bei Therneau und Grambsch (2000) [4] wurde beispielhaft eine ähnliche Studie durchgeführt. Der individuelle Hazard wurde dabei mit nur zwei Kovariaten spezifiziert. Das Ergebnis dieser Simulation ist, dass das Cox-, AG- und PWP-Modell grundsätzlich keinen Bias aufweisen. Dabei zeigt sich das AG-Modell leicht besser in der Effizienz als das PWP-Modell. Beide sind jedoch effizienter gegenüber dem Cox-Modell. Bezüglich der Effizienz ist unser Ergebnis mit dem von Therneau und Grambsch (2000) [4] vergleichbar. Im Gegensatz dazu kann die Aussage, dass die Modelle grundsätzlich keinen Bias aufweisen, nicht bestätigt werden. Weitere systematische Untersuchungen sind notwendig, um die Eigenschaften dieser Modelle zu untersuchen. Literatur [1] Cox D. Regression models and life-tables. Journal of the Royal Statistical Society, Ser. B 34, 1972, 187-220. [2] Andersen P, Gill R. Cox´s regression model for counting processes: A large sample study. Ann. Stat. 10, 1982, 1100-1120. [3] Prentice R, Williams B, Peterson A. On the regression analysis of multivariate failure time data. Biometrika 68, 1981, 373-379 [4] Therneau T, Grambsch P. Modeling survival data: Extending the Cox model. Statistics for Biology and Health. New York, NY: Springer. 2000 A simulation study using validated prognostic factors to assess the expected survival advantage of imatinib over interferon-alpha-based treatment in chronic phase chronic myeloid leukemia patients M. Pfirrmann 1, 2, J. Hasford 1 1) Institut für Medizinische Informatik, Biometrie und Epidemiologie (IBE), LudwigMaximilians-Universität, München, Germany 2) Gesellschaft für Informationsverarbeitung und Statistik in der Medizin (GIS) e.V., München, Germany Background and objectives Until the end of the nineties, interferon-alpha-based treatments were preferred as conservative therapy for patients with chronic myeloid leukaemia (CML). In search for a - 14 - - 11 - Correcting Effect Estimates for Unmeasured Confounding in Cohort Studies with Validation Data using Propensity Score Calibration. Til Stürmer1,2, Donna Spiegelman3,4, Sebastian Schneeweiss1, Jerry Avorn1, Robert J Glynn1,2,4 1 Division of Pharmacoepidemiology and Pharmacoeconomics, Brigham and Women's Hospital, Harvard Medical School, Boston, USA 2 Division of Preventive Medicine, Brigham and Women's Hospital, Harvard Medical School, Boston, USA 3 Department of Epidemiology, Harvard School of Public Health, Boston, USA 4 Department of Biostatistics, Harvard School of Public Health, Boston,USA Background: Often important confounders are not available in cohort studies, particularly in claims databases. Sensitivity analyses based on the relation of unmeasured confounders with an exposure of interest in a separate validation study have been proposed. No applicable method exists that takes the joint distribution of unobserved confounders into account. Objectives: To incorporate information on the joint distribution of unobserved confounders when assessing the sensitivity of effect estimates to unobserved confounding. Methods: We estimated a propensity score (PS) to adjust for confounding in the main claims database cohort. We then used cross-sectional interview data as a validation sample to estimate two additional PS. The ‘error-prone’ PS exclusively used information available in the main cohort (claims data). The ‘gold-standard’ PS additionally included covariates available only in the validation study (interview data). Based on these two PS in the validation study, regression calibration was applied to correct the regression coefficient for the exposure of interest in the main cohort. This propensity score calibration (PSC) was used to assess nonsteroidal antiinflammatory drugs (NSAID) and 1-year mortality from all causes in a cohort of 103,133 New Jersey residents who were 65 years or older and who filled prescriptions within Medicaid or the Pharmaceutical Assistance to the Aged and Disabled program when they were hospitalized any time between January 1, 1995 and December 31, 1997. We chose this relation because it is subject to strong confounding, and the most plausible relation is at or near the null. The validation study consisted of 5,108 age and sex matched participants of the Medicare Current Beneficiary Survey (MCBS). Results: ‘Traditional’ multivariate adjustment resulted in a relative risk (RR) in NSAID users of 0.80 (95% confidence interval: 0.77–0.83) compared to an unadjusted RR of 0.68 (0.66–0.71). Application of PSC resulted in a more plausible RR of 1.06 (1.00–1.12). Conclusions: This novel approach of propensity score calibration helps to correct for unmeasured and residual confounding in cohort studies with validation data including a richer set of confounders by taking the joint distribution of covariates into account. The approach might be especially advantageous for pharmacoepidemiologic research using claims data since it might help to address one of the main problems in this area of research, - 12 - i.e. lack of information on important confounders, and thus lead to a major improvement in the quality of research in this field. A mixed model approach for geoadditive hazard regression Thomas Kneib and Ludwig Fahrmeir Department of Statistics, Ludwig-Maximilians-University Munich. A standard tool for analyzing the impact of covariates on continuous survival times is the Cox proportional hazards model where a multiplicative structure consisting of an individual-independent baseline hazard rate and a linear predictor is assumed for the hazard rate. In the traditional Cox model the baseline hazard rate remains unspecified and estimation of the regression coefficients is based on the partial likelihood. In a second step the baseline hazard can be approximated by a step function using Breslow's estimate. However, it is often desirable to estimate the baseline in a smooth way simultaneously with covariate effects, for example if we are interested in predicting survival times for new observations or if we are interested in analytic properties of the baseline. Furthermore a linear predictor is often not flexible enough to describe data situations of realistic complexity in an adequate way. As an example we will present results from a study on leukemia survival times, where spatial information has to be included in the analysis and some covariate effects clearly are of nonlinear form. We propose an extended Cox-type model that allows for the simultaneous estimation of the baseline hazard and a geoadditive predictor acting multiplicatively on the baseline. Both the log-baseline hazard and effects of continuous covariates or further time scales such as calendar time are weakly parameterized using penalized splines. Two-dimensional extensions of these P-splines can be used to model flexible interaction surfaces between two continuous covariates. If exact spatial locations are available, spatial effects can be estimated using stationary Gaussian random fields (kriging) or again two-dimensional Pspline surface smoothers. If observations are clustered in connected geographical regions, we propose to use the Markov random field approach commonly known from disease mapping. Our approach also supports cluster-specific random effects (or frailties) and varying coefficient terms both with continuous and spatial effect modifiers. Inclusion of covariates with time-varying effects leads to models that relax the proportional hazards assumption. Such time-varying effects can be subsumed into the varying coefficients framework, where survival time acts as effect modifier and is again modeled as a P-spline. The estimation procedure for our hazard regression approach is based on a mixed model representation of the geoadditive predictor, which has gained considerable attention within a generalized additive model context throughout the last years. We extend existing methods for the estimation of Cox models with uncorrelated cluster-specific frailties to more general mixed models for survival times. Variance components of the mixed model, corresponding to inverse smoothing parameters of nonparametric or spatial effects, are estimated using (approximate) marginal or restricted maximum likelihood. Since the marginal likelihood can not be derived analytically, certain approximations have to be - 13 -