Zusammenführung der epidemiologischen Krebsregisterdaten für bundesweite Auswertungen im ZfKD* Ute Wolf, Stefan Meisegeier, Jörg Haberland, Manuela Franke, Klaus Kraywinkel *Zentrum für Krebsregisterdaten (ZfKD) im Robert Koch-Institut, Berlin Einleitung Regelmäßig, etwa alle zwei Jahre, wird vom Zentrum für Krebsregisterdaten (ZfKD) im Robert Koch-Institut (RKI) gemeinsam mit der Gesellschaft der epidemiologischen Krebsregister in Deutschland e.V. (GEKID) die Broschüre »Krebs in Deutschland« mit aktuellen Daten zum Krebsgeschehen herausgegeben. Im Jahr 2012 ist die 8. Ausgabe mit den Daten für 2007/2008 erschienen [1]. Die nächste Ausgabe mit Ergebnissen für 2009/2010 ist in Vorbereitung. In dem hier präsentierten Poster werden die einzelnen Schritte zur Qualitätsprüfung der Daten im ZfKD bis hin zum »Endprodukt«, der Broschüre »Krebs in Deutschland«, skizziert und schematisch dargestellt sowie Ergebnisse für Krebs gesamt präsentiert. Daneben werden diese Daten für weitere wissenschaftliche Analysen und Publikationen sowie für die Verbreitung der Ergebnisse über eine interaktive Datenbank im Internet (www.krebsdaten.de) verwendet. Externen Wissenschaftlern kann der geprüfte ZfKD-Datensatz auch auf Antrag als Scientific Use File zur Verfügung gestellt werden. Robert Koch-Institut, Standort Berlin-Tempelhof Material und Methoden Ergebnisse Datengrundlage bilden die von den epidemiologischen Krebsregistern (EKR) der Länder nach Bundeskrebsregisterdatengesetz (BKRG) jährlich an das ZfKD zu übermittelnden anonymisierten Daten und Kontrollnummern (KN). Diese Daten werden im Zentrum für Krebsregisterdaten zunächst auf Vollständigkeit, Plausibilität und evtl. Mehrfachübermittlungen geprüft. Die qualitätsgeprüften Daten werden dann zu einem gemeinsamen Datensatz zusammengeführt. Auf der Basis der Vollzähligkeitsprüfung des ZfKD erfolgt anschließend hier die wichtige Schätzung der Krebsneuerkrankungsraten und Neuerkrankungsfälle (Inzidenz) für Deutschland sowie die Berechnung weiterer epidemiologischer Maßzahlen, wie Erkrankungsund Sterberisiken, Überlebensraten und 5-Jahres-Prävalenzen unter Einbeziehung der Mortalitäts- und Bevölkerungsdaten der Statistischen Ämter. Schematisch werden der Weg der Datenprüfung und Vollzähligkeitsschätzung im ZfKD dargestellt (Abb.1) und am Beispiel für Krebs gesamt (ICD-10 C00-97, ohne C44) Ergebnisse zu den wichtigsten epidemiologischen Maßzahlen in einer tabellarischen Übersicht präsentiert (Tab.1). Da bisher noch nicht alle EKR der Länder Krebsneuerkrankungen vollzählig erfassen, müssen trotz inzwischen deutlich verbesserter Datenlage derzeit im ZfKD die Zahlen für Deutschland geschätzt werden. Die für 2008 geschätzten 470.000 Krebsneuerkrankungen in Deutschland beruhen bereits auf ca. 390.000 gemeldeten Erkrankungsfällen, die von den Krebsregistern aus 15 der 16 Bundesländer in anonymisierter Form an das ZfKD übermittelt worden sind. Scientific Use File Qualitätsgeprüfter ZfKD-Datensatz 5. Ebene: Finale Daten Vollzähligkeitsschätzung Kennzeichnung Mehrfachmeldungen 4. Ebene: Prüfdaten Umformungen, Korrekturen, Plausibilitätsprüfungen 3. Ebene: Rohdaten Transponieren, Plausibilitätsprüfungen 3. Ebene: Rohdaten Zusammenführung Einzellieferungen 2. Ebene: Originaldaten Zusammenführung Einzellieferungen 2. Ebene: Originaldaten Daten Einlesen 1. Ebene: Importdaten Daten Einlesen 1. Ebene: Importdaten EPI KN GKR BY § BKRG Abbildung 1b: Screenshot des im ZfKD erstellten, vereinheitlichten und qualitätsgeprüften Datensatzes ... ... 3 Veröffentlichung der Ergebnisse InternetDatenbank »Krebs in Deutschland« SQL Server im ZfKD GKR Epidemiologische Krebsregister Weitere Publikationen Legende Zentrum für Krebsregisterdaten Epidemiologisches Krebsregister Bundeskrebsregisterdatengesetz Epidemiologische Daten Kontrollnummern ZfKD EKR BKRG EPI KN BY Abbildung 1: Der Weg der Daten aus den EKR der Bundesländer im ZfKD Epidemiologische Maßzahlen 2007 Männer Neuerkrankungen Frauen Frauen Männer Frauen 246 700 223 100 258 000 228 200 rohe Erkrankungsrate 1 605,5 512,5 613,0 532,7 646,9 551,1 standardisierte Erkrankungsrate 1,2 453,1 338,2 450,0 349,9 441,2 350,0 69 69 69 69 113 121 98 137 115 870 99 572 280,8 233,8 288,0 237,8 205,9 129,8 205,6 130,5 637 400 669 200 658 500 697 900 698 000 rohe Sterberate 1 standardisierte Sterberate 1,2 5-Jahres-Prävalenz Männer Frauen 650 Brustdrüse 700 17,6 25,7 Lunge 13,7 12,2 Darm 4 12,1 10,3 Prostata Lunge 7,3 6,0 Bauchspeicheldrüse Bauchspeicheldrüse 4 5,7 5,3 Magen Eierstöcke 5,0 3,6 Niere Magen 3,4 3,3 Leukämien Leukämien 2,8 4 Non-Hodgkin-Lymphome 3,2 Speiseröhre 3 Median Europabevölkerung in Prozent (niedrigster 2,7 Niere 3,2 Mundhöhle und Rachen 2,6 Nervensystem 3,2 Harnblase 2,4 Gebärmutterkörper Nervensystem 2,6 1,9 Harnblase Non-Hodgkin-Lymphome 2,4 1,5 Gebärmutterhals Kehlkopf Malignes Melanom der Haut Mundhöhle und Rachen Schilddrüse Speiseröhre Morbus Hodgkin Malignes Melanom der Haut Hoden Schilddrüse Kehlkopf Morbus Hodgkin Darm 1 Männer Prognose 2012 215 100 Sterbefälle Abbildung 1a: 2008 243 900 mittleres Erkrankungsalter 3 Screenshot einer aus den EKR im ZfKD in anonymisierter Form eingegangenen Datenlieferung 2 unter anderem: - Inzidenzschätzung - Prävalenzschätzung - Überlebenszeitschätzung Bevölkerungsdaten Screenshot zur mehrdimensionalen Analyse der qualitätsgeprüften Daten mittels der Spezialsoftware CARESS 1 Mortaliltätsdaten Abbildung 1c: Analyse 5 4 absolute 5-Jahres-Überlebensrate (2007–2008) 50 (44–52) 57 (50–59) relative 5-Jahres-Überlebensrate (2007–2008) 59 (52–60) 64 (57–52) je 100 000 Personen 2 alterstandardisiert nach alter Tabelle 1: und höchster Wert der einbezogenen Bevölkerung) Übersicht über die wichtigsten epidemiologischen Maßzahlen [1] Diskussion 30 25 20 15 10 5 0 0 5 10 15 20 25 30 Wie die regelmäßigen Vollzähligkeitsschätzungen im Zentrum für Krebsregisterdaten zeigen, erfassen bisher noch nicht alle epidemiologischen Krebsregister die Krebsneuerkrankungen vollzählig (insbesondere die jüngsten Register). Daher sind im ZfKD neben der Zusammenführung und Plausibilitätsprüfung dieser Daten für bundesweite Analysen, u.a. der Inzidenzschätzung, noch zeitaufwändige Arbeitsschritte erforderlich. Eine vollzählige Registrierung in allen Bundesländern, wie im BKRG vorgesehen, wird daher in Zukunft nicht nur zu exakteren bundesweiten Ergebnissen führen, sondern auch die Bearbeitungszeit im ZfKD deutlich verkürzen und damit für eine schnellere Verbreitung dieser Ergebnisse sorgen. Die Analysen der Daten werden auch durch die jetzt im ZfKD eingesetzte Spezialsoftware CARESS erleichtert, die eine Darstellung der Ergebnisse sowohl in Tabellenform als auch in Grafiken und als Karten erlaubt. Für dieses Programm angebotene Statistikpakete ermöglichen daneben automatische Berechnungen komplexer Kennzahlen. Zusammenfassung In dem hier präsentierten Poster werden die einzelnen Schritte der Datenverarbeitung und -prüfung im ZfKD bis hin zur wissenschaftlichen Nutzung der Daten und Publikation der Ergebnisse skizziert. Literatur [1] Krebs in Deutschland 2007/2008. 8. Ausgabe. Robert Koch-Institut (Hrsg) und die Gesellschaft der epidemiologischen Krebsregister der Länder e. V. (Hrsg), Berlin, 2012 Impressum: Herausgeber: Robert Koch-Institut, Zentrum für Krebsregisterdaten, April 2013, General-Pape-Straße 62 – 66, 12101 Berlin, E-Mail: [email protected] Redaktion: Ute Wolf; Gestaltung: Hans-Günter Bredow; Foto: Robert Koch-Institut