Deutsches Diabetes-Zentrum Institut für Biometrie und Epidemiologie Direktor: Prof. Dr. rer. nat. G. Giani Querschnittsfach „Epidemiologie, Medizinische Biometrie und Medizinische Informatik“ WS 2006-2007 Seminar 12 Übungsaufgaben aus Biometrie und Epidemiologie zur Vorbereitung auf die Klausur Aufgabe 1: Diskutieren Sie den Inzidenzbegriff anhand von Aufgabe 1 aus Seminar 7: Nachfolgende Tabelle gibt einen Überblick über Daten, die im Rahmen einer Inzidenzstudie zu eine bestimmten Krankheit bei Kindern bis 15 Jahren erhoben wurden. ♀ Alterskl. ♂ Jahre Fälle Personenjahre Fälle Personenjahre 0-4 22 140626 13 146314 5–9 28 130428 18 136036 10 – 14 56 122424 25 128968 Beantworten Sie dabei insbesondere folgende Fragen: a) Schätzen Sie getrennt für Jungen und Mädchen die Inzidenzen in den Altersklassen und insgesamt. b) Berechnen Sie ein 95%-Konfidenzintervall für die Inzidenz in der obersten Altersklasse für die Mädchen. c) Berechnen Sie das relative Erkrankungsrisiko für den Vergleich von Jungen und Mädchen altersspezifisch und insgesamt, letzteres mit 95%-Konfidenzintervall. d) Schätzen Sie die nach Alter standardisierten Gesamt-Inzidenzen für Jungen und Mädchen mit der Methode der direkten Standardisierung unter Verwendung der folgenden gemeinsamen Altersverteilung der Personenjahre von Jungen und Mädchen: Altersklasse 0-4: Altersklasse 5-9: Altersklasse 10-14: 0,357 0,331 0,312 e) Wie groß ist für ein 9-jähriges, nicht-erkranktes Mädchen die exakte Wahrscheinlichkeit, bis zum Alter von 13 Jahren nicht zu erkranken? (vom Beginn des 10. bis zum Beginn des 14. Lebensjahres Aufgabe 2: Vergegenwärtigen Sie sich die Eigenschaften von normalverteilten Variablen ausgehend von Aufgabe 1 aus Seminar 4: Bei gesunden Erwachsenen wird angenommen, dass die Eisenbindungskapazität normalverteilt mit Erwartungswert µ = 320 (Einheit: µg/100 ml Serum) und Standardabweichung σ sei. a) Wie groß ist die Standardabweichung σ, wenn 2 von 100 gesunden Erwachsenen eine Eisenbindungskapazität > 381,65 haben. Nehmen Sie im folgenden an, dass die Standardabweichung aus Aufgabe 2a) zutrifft. b) Wie groß ist die Wahrscheinlichkeit bei gesunden Erwachsenen, dass die Eisenbindungskapazität größer als 335 ist? c) Wie groß ist die Wahrscheinlichkeit bei gesunden Erwachsenen, dass die Eisenbindungskapazität zwischen 305 und 335 liegt? d) Unterhalb welchen Schwellenwertes liegt die Eisenbindungskapazität von höchstens 75% der gesunden Erwachsenen? e) Zum Testen der Hypothesen H0 : 320 gegen H1 : 320 wurde bei 100 zufällig ausgewählten Erwachsenen die Eisenbindungskapazität bestimmt. Das arithmetische Mittel der100 Mesungen lag bei 325.9. Führen Sie einen Test zum Niveau = 10% durch. Hinweis: Berechnen Sie ein geeignetes Konfidenzintervall (σ bekannt!). Aufgabe 3: Der BMI (Body-Mass-Index) stellt eine (wenn auch sehr großzügige) Bestimmung des Normalgewichtes dar. Man dividiert das Gewicht durch das Quadrat der Größe (in Metern), das Ergebnis sollte nicht über 25 liegen. Der Zusammenhang zwischen dem BMI und dem systolischen Blutdruck (mm Hg) von Versuchspersonen wurde durch die Regressionsgerade y = 45.784 + 4.801 x geschätzt. Dabei bezeichnet y den systolischen Blutdruck und x den BMI. (a) Stellen Sie diese Regressionsgerade grafisch dar. 2 (b) Angela hat einen BMI von 28.02, wie groß ist der zu erwartende systolische Blutdruck? (c) Welche Steigung hat die Regressionsgerade und wie lässt sie sich interpretieren? (d) Unterhalb welchem BMI liegt der Erwartungswert des systolischen Blutdrucks niedriger als 140 mm Hg? (e) Diskutieren Sie weitere Formeln und Kennzahlen der linearen Regression. (Korrelationskoeffizient, Bestimmtheitsmaß, Parameterschätzung (Normalengleichungen)) Aufgabe 4: Wiederholen Sie den Begriff Confounding in epidemiologischen Studien anhand von Aufgabe 2 aus Seminar 11: Eine Fall-Kontroll-Studie zum Zusammenhang zwischen Kaffeekonsum und nicht-tödlichem Myokardinfarkt ergab die folgenden nach dem Raucherverhalten stratifizierten Daten. (Rosenberg et al. 1988, Am. J. Epidemiol. 128) Infarkt Raucher Kaffeekonsum ja nein ja ja 1011 390 nein 81 77 ja 383 365 nein 66 123 nein a) Schätzen Sie getrennt für Raucher und Nichtraucher das Odds-Ratio für den Risikofaktor „Kaffeetrinken“. b) Vergleichen Sie das nach Woolf für den Risikofaktor „Rauchen“ adjustierte Odds-Ratio mit dem rohen Odds-Ratio. c) Beeinflusst der Raucherstatus den Zusammenhang von Kaffeekonsum und Myokardinfarkt? Führen Sie einen geeigneten Test durch. d) Besteht nach Adjustierung für den Raucherstatus ein signifikanter Zusammenhang zwischen Kaffeekonsum und Myokardinfarkt? Beantworten Sie diese Frage durch Schätzung eines geeigneten Konfidenzintervalls ! 3 Aufgabe 5: Wiederholen Sie Schätzverfahren für die Überlebenszeitfunktion sowie für die integrierte Hazardrate anhand von Aufgabe 2 aus Seminar 8: In der folgenden Liste sind die Überlebenszeiten (in Wochen) von 10 Patienten mit einem superfizialen Harnblasenkarzinom nach Beginn einer Chemotherapie festgehalten. Dabei sind zensierte Beobachtungen mit einem Kreuz gekennzeichnet! 63, 59, 57+, 37, 33, 21+, 11, 57, 44+, 37 a) Schätzen Sie die Überlebenszeitfunktion nach der Kaplan-Meier-Methode und zeichnen Sie die Überlebenskurve. b) Geben Sie ein 95%-Konfidenzintervall für eine 37-wöchige Überlebenszeit an. Interpretieren Sie das Ergebnis. c) Schätzen Sie die integrierte Hazardfunktion kanonisch bzw. nach dem Ansatz von Nelson. Aufgabe 6: Diskutieren Sie wichtige Eigenschaften der Survivalfunktion. Welches wahrscheinlichkeitstheoretische Modell bezüglich der Überlebenszeitfunktion entspricht der Vorstellung zeitlich konstanter Inzidenzraten? Aufgabe 7: Man diskutiere im Zusammenhang mit statistischen Tests die Begriffe „Fehler 1. Art“, „Fehler 2. Art“, „Signifikanzniveau“, „Gütefunktion“, „Prüfgröße“ und „Entscheidungsregel“, einseitiger und zweiseitiger Test. Welche Interpretationen erlauben statistische Tests? Aufgabe 8: Ein neuer Screeningtest für Darmkrebs wurde evaluiert. Der Test wurde bei 1.250 Personen angewandt, von denen 312 einen Darmkrebs hatten. Der neue Test fiel bei 269 der Erkrankten positiv aus, aber identifizierte auch 121 der nicht an Darmkrebs Erkrankten als „krank“. Berechnen Sie: a) Sensitivität und Spezifität des Tests b) den Anteil mit falsch-positivem und falsch-negativen Testergebnis c) den positiven und negativen Vorhersagewert. d) Wie hängen die Vorhersagewerte beim Screening von der Prävalenz der Erkrankung ab? (siehe auch Seminar 2, Aufgabe 4) Aufgabe 9: Diskutieren und vergleichen Sie verschiedene Studientypen. 4 Aufgabe 10: Die ärztliche Schweigepflicht ist die älteste Datenschutzregelung der Welt und besitzt universelle Gültigkeit. Sie ist u.a. in der Berufsordnung für die nordrheinischen Ärztinnen und Ärzte festgelegt (siehe http://www.aekno.de). Beantworten Sie folgende Fragen: a) Was versteht man unter ärztlicher Schweigepflicht ? b) Was kann ein Bruch der ärztlichen Schweigepflicht nach sich ziehen ? Aufgabe 11: Gemäß Bundesdatenschutzgesetz ist bei automatischer Verarbeitung und Nutzung personenbezogener Daten die Organisation so zu gestalten, dass Sie den besonderen Anforderungen des Datenschutzes gerecht wird. Erläutern Sie die folgenden Maßnahmen: 1. Zutrittskontrolle 2. Zugangskontrolle 3. Zugriffskontrolle 4. Weitergabekontrolle 5. Eingabekontrolle 6. Auftragskontrolle 7. Verfügbarkeitskontrolle 5