Methoden epidemiologischer Forschung 1. Planung: Spezifische Studienformen („Studiendesigns“) Beobachtung: Ökologische St., Querschnittsst., Fall-Kontroll-St., Kohortenst. Intervention: ? 2. Analyse: Allgemeine und spezielle statistische Verfahren Maßzahlen: Prävalenz, Inzidenz, Rate, Absolutes und Relatives Risiko Biometrische Analyse: ? 3. Interpretation: Kontrolle von Verzerrungen („Bias & Confounding“) Typen: Selektions-B., Informations-B., Confounding Kontrolle: ? Anwendungsfeld Epidemiologie und Biometrie in der Klinischen Forschung ‚Klinische‘ Epidemiologie: Abnormalität Was ist krank / gesund? Diagnose Wie gut sind welche Tests für welche Krankheit? Ursache Was verursacht eine Krankheit? Risiko Welche Faktoren erhöhen die Wahrscheinlichkeit für eine Krankheit? Prognose Wie verläuft die Erkrankung in welchem Stadium? Therapie Wie verändert eine Behandlung den Verlauf? Kosten Welche Kosten verursachen Krankheit / Therapie? QS, PS FKS, PS FKS, PS PS Klinische Epidemiologie: Abnormalität Was ist krank / gesund? Diagnose Wie gut sind welche Tests für welche Krankheit? Ursache Was bedingt eine Krankheit? Risiko Welche Faktoren erhöhen die Wahrscheinlichkeit für eine Krankheit? Prognose Wie verläuft die Erkrankung in welchem Stadium? Therapie Wie verändert eine Behandlung den Verlauf? Kosten Welche Kosten verursachen Krankheit / Therapie? Klinische Epidemiologie und Biometrie Wahrscheinlichkeit und Diagnose Diagnostische Tests Diagnostische Tests zielen darauf ab, möglichst wirkungsvoll Kranke von Gesunden zu unterscheiden. Hierzu werden Diagnoseverfahren oder Tests verwendet, deren Eigenschaften und Güte es zu bestimmen gilt. Fragen zu Diagnostischen Tests - Wie geeignet ist ein bestimmtes Untersuchungsverfahren als Diagnostischer Test? - Ist das gleiche Testergebnis für alle Patienten von gleicher Wertigkeit? - Welche Tests mit welchen Eigenschaften sollte man für welche klinische Situation einsetzen? Wald NJ et al., BMJ 1999;1562-5 Wald NJ et al., BMJ 1999;1562-5 Sicht des „Wissenden“ Krankheit Diagnosetest Positiv Negativ Total ja nein a b (echt positiv) (falsch positiv) c d (falsch negativ) (echt negativ) a+c b+d (alle Kranken) (alle Gesunden) Total a+b (mit Verdacht) c+d (ohne Verdacht) a+b+c+d Alle Untersuchten Krankheit Diagnosetest Sicht des „Suchenden“ Total Positiv Negativ ja nein a b (echt positiv) (falsch positiv) c d (falsch negativ) (echt negativ) a+c b+d (alle Kranken) (alle Gesunden) Total a+b (mit Verdacht) c+d (ohne Verdacht) a+b+c+d Alle Untersuchten Von der Wahrscheinlichkeit zu den Kenngrößen diagnostischer Tests Eine (fiktive) Grundgesamtheit Wirklichkeit Testergebnis W +: (Mamma-Ca:Ja) W-: (Mamma-Ca: nein) Gesamt 10.353 1.468.220 1.478.573 T+: (Mamma-Ca: Ja) T-: (Mamma-Ca: nein) Gesamt Nach NL Mammographie Programm 1990-1997 Eine (fiktive) Grundgesamtheit Wirklichkeit Testergebnis W +: (Mamma-Ca:Ja) W-: (Mamma-Ca: nein) Gesamt 10.353 1.468.220 1.478.573 T+: (Mamma-Ca: Ja) T-: (Mamma-Ca: nein) Gesamt P(W+) = 10353/1478573 = 0,007 oder 7 pro 1000 heißt Prävalenz P(W-) = 1469543/1478573 = 0,993 (= Anteil ohne Mamma-Ca in der Grundgesamtheit) Eine (fiktive) Grundgesamtheit Wirklichkeit Testergebnis W +: (Mamma-Ca:Ja) T+: (Mamma-Ca: Ja) 9.030 T-: (Mamma-Ca: nein) 1.323 Gesamt 10.353 W-: (Mamma-Ca: nein) Gesamt 1.468.220 1.478.573 P(T+|W+) = 9.030/10.353 = 0,87 heißt Sensitivität (= Anteil der Echt-positiven), P(T-|W+) = 1.323/10.353 = 0,13 ist der Anteil der falsch-negativen Testergebnisse Eine (fiktive) Grundgesamtheit Wirklichkeit Testergebnis W +: (Mamma-Ca:Ja) T+: (Mamma-Ca: Ja) 9.030 T-: (Mamma-Ca: nein) 1.323 Gesamt 10.353 W-: (Mamma-Ca: nein) Gesamt 10.332 19.362 1.457.888 1.459.211 1.468.220 1.478.573 P(T+|W-) = 10.332/1.468.220 = 0,007 ist der Anteil falsch-positiver Testergebnisse, P(T-|W-) = 1.457.888/1.468.220 = 0,993 heißt Spezifität (=Anteil der Echt-negativen). Eine (fiktive) Grundgesamtheit Wirklichkeit Testergebnis W +: (Mamma-Ca:Ja) T+: (Mamma-Ca: Ja) 9.030 T-: (Mamma-Ca: nein) 1.323 Gesamt 10.353 W-: (Mamma-Ca: nein) Gesamt 10.332 19.362 1.457.888 1.459.211 1.468.220 1.478.573 Eine (fiktive) Grundgesamtheit Wirklichkeit Testergebnis W +: (Mamma-Ca:Ja) T+: (Mamma-Ca: Ja) 9.030 T-: (Mamma-Ca: nein) 1.323 Gesamt 10.353 ppV = P(W+|T+) = 9030/19362 = 0,47 W-: (Mamma-Ca: nein) Gesamt 10.332 19.362 1.457.888 1.459.211 1.468.220 1.478.573 heißt positiver Prädiktivwert npV = P(W-|T- ) = 1457888 / 1459211 = 0,999 heißt negativer Prädiktivwert Formel von Bayes Thomas Bayes ~1702 - 1761 ppV = P(W+|T+) = P(T+|W+) · P(W+) P(T+|W+) · P(W+) + P(T+|W-) · P(W-) Beispiel Mammografie: Prävalenz: 0,7%, Sensitivität: 87%, Spezifität: 99,3% 0.87 · 0.007 ppV = 0.87 · 0.007 + 0.007 · 0.993 = 0.47 Formel von Bayes Sensitivität Thomas Bayes ~1702 - 1761 ppV = P(W+|T+) = P(T+|W+) · P(W+) P(T+|W+) · P(W+) + P(T+|W-) · P(W-) Beispiel Mammografie: Prävalenz: 0,7%, Sensitivität: 87%, Spezifität: 99,3% 0.87 · 0.007 ppV = 0.87 · 0.007 + 0.007 · 0.993 = 0.47 Formel von Bayes 1 - Spezifität Thomas Bayes ~1702 - 1761 ppV = P(W+|T+) = P(T+|W+) · P(W+) P(T+|W+) · P(W+) + P(T+|W-) · P(W-) Beispiel Mammografie: Prävalenz: 0,7%, Sensitivität: 87%, Spezifität: 99,3% 0.87 · 0.007 ppV = 0.87 · 0.007 + 0.007 · 0.993 = 0.47 Formel von Bayes Prävalenz Thomas Bayes ~1702 - 1761 ppV = P(W+|T+) = P(T+|W+) · P(W+) P(T+|W+) · P(W+) + P(T+|W-) · P(W-) Beispiel Mammografie: Prävalenz: 0,7%, Sensitivität: 87%, Spezifität: 99,3% 0.87 · 0.007 ppV = 0.87 · 0.007 + 0.007 · 0.993 = 0.47 Herleitung PPV = P(W+|T+) = P ( T+ Λ W+ ) P(T+) P(T+|W+) · P(W+) = NPV = P(W-|T-) = P(T+|W+) · P(W+) + P(T+|W-) · P(W-) P ( T- Λ W- ) P(T-) P(T-|W-) · P(W-) = P(T-|W+) · P(W+) + P(T-|W-) · P(W-) Formel von Bayes Thomas Bayes ~1702 - 1761 ppV = P(W+|T+) = P(T+|W+) · P(W+) P(T+|W+) · P(W+) + P(T+|W-) · P(W-) Beispiel Prostatakarzinom (Rektale Palpation): Prävalenz: 5%, Sensitivität: 56%, Spezifität:94% 0.56 · 0.05 ppV = 0.56 · 0.05 + 0.06 · 0.95 = 0.33 Zusammenfassung Wahrscheinlichkeit = fester Anteil der Grundgesamtheit Beispiel: Prävalenz P(W+) Bedingte Wahrscheinlichkeit = fester Anteil eines definierten Teils der Grundgesamtheit Beispiel: Sensitivität: Spezifität: P(T+|W+) P(T-|W-) positiver Prädiktivwert negativer Prädiktivwert P(W+|T+) P(W-|T-) Wahrscheinlichkeiten sind feste (i. a. unbekannte) Größen, die aus zufälligen Stichproben geschätzt werden können. Wahrscheinlichkeit und relative Häufigkeit Beispiel: Prävalenz einer Erkrankung Theoretische Wahrscheinlichkeit = Relative Häufigkeit der Erkrankung in der Grundgesamtheit Empirische Information Gewinnung einer repräsentativen Stichprobe -> Bestimmung der relativen Häufigkeit der Erkrankung in der Stichprobe z.B. Untersuchung von n=100 Patienten Relative Häufigkeit der Erkrankung = 19% Wahrscheinlichkeit und relative Häufigkeit Beispiel: Prävalenz einer Erkrankung Theoretische Wahrscheinlichkeit = Relative Häufigkeit der Erkrankung in der Grundgesamtheit Nutzung der relativen Häufigkeit der Stichprobe zur Schätzung der entsprechenden Rate in der Grundgesamtheit Wie viele Erkrankten würde ich finden, wenn ich nicht nur die n Patienten der Stichprobe untersuchen würde, sondern sämtliche Patienten der Grundgesamtheit? Empirische Information Gewinnung einer repräsentativen Stichprobe -> Bestimmung der relativen Häufigkeit der Erkrankung in der Stichprobe z.B. Untersuchung von n=100 Patienten Relative Häufigkeit der Erkrankung = 19% Wahrscheinlichkeit und relative Häufigkeit Beispiel: Prävalenz einer Erkrankung Theoretische Wahrscheinlichkeit = Relative Häufigkeit der Erkrankung in der Grundgesamtheit Nutzung der relativen Häufigkeit der Stichprobe zur Schätzung der entsprechenden Rate in der Grundgesamtheit Empirische Information Gewinnung einer repräsentativen Stichprobe -> Bestimmung der relativen Häufigkeit der Erkrankung in der Stichprobe z.B. Untersuchung von n=100 Patienten Relative Häufigkeit der Erkrankung = 19% Wie viele Erkrankten würde ich Deskriptive Statistik: finden, wenn ich nicht nur die n Patienten der Stichprobe Beschreibung des empirischen Stichprobenergebnisses untersuchen würde, sondern Induktive Statistik: sämtliche Patienten der Induktiver Schluss von der empirischen Information Grundgesamtheit? der Stichprobe auf die Grundgesamtheit. Wahrscheinlichkeit und relative Häufigkeit Beispiel: Prävalenz einer Erkrankung Theoretische Wahrscheinlichkeit = Relative Häufigkeit der Erkrankung in der Grundgesamtheit Nutzung der relativen Häufigkeit der Stichprobe zur Schätzung der entsprechenden Rate in der Grundgesamtheit Empirische Information Gewinnung einer repräsentativen Stichprobe -> Bestimmung der relativen Häufigkeit der Erkrankung in der Stichprobe z.B. Untersuchung von n=100 Patienten Relative Häufigkeit der Erkrankung = 19% Wie viele Erkrankten würde ich Deskriptive Statistik: finden, wenn ich nicht nur die n Patienten der Stichprobe Relative Erkrankungsrate in der Stichprobe, z.B.=19% untersuchen würde, sondern Induktive Statistik: sämtliche Patienten der Schätzung der unbekannten Rate in der GG, Grundgesamtheit? z.B. p̂=19% mit Konfidenzintervall 11.8% – 28.1% Konfidenzintervall Wahrscheinlichkeit P=? ― ― ― 0 ? ? ? ? ? ?? ? ? ? ? h 1 Rel. Häufigkeit in der Stichprobe Konfidenzintervall Das Konfidenzintervall enthält mit 95%iger Wahrscheinlichkeit den unbekannten Wert P Wahrscheinlichkeit P=? ― ― ― 0 ? ? ? ? ? ?? ? ? ? ? h 1 Rel. Häufigkeit in der Stichprobe Konfidenzintervall KI h z1 2 h(1n h) Das Konfidenzintervall enthält mit 95%iger Wahrscheinlichkeit den unbekannten Wert P Wahrscheinlichkeit P=? ― ― ― 0 ? ? ? ? ? ?? ? ? ? ? h 1 Rel. Häufigkeit in der Stichprobe Konfidenzintervall KI h z1 2 h(1n h) Relative Häufigkeit h Fallzahl n (Approximatives) Konfidenzintervall der Wahrscheinlichkeit P 19 % 100 11.3 % - 26.7 % 19 % 1000 16.6 % - 21.4 % 19 % 10000 18.2 % - 19.8 % 19 % 100000 18.8 % - 19.2 % Eine zufällige Stichprobe Wirklichkeit Testergebnis T+: (Mamma-Ca: Ja) T-: (Mamma-Ca: nein) Gesamt (nach Goldstandard ermittelt) W +: (Mamma-Ca:Ja) W-: (Mamma-Ca: nein) Gesamt 12 97 109 2 889 891 14 986 1000 Eine zufällige Stichprobe Wirklichkeit Testergebnis T+: (Mamma-Ca: Ja) T-: (Mamma-Ca: nein) Gesamt (nach Goldstandard ermittelt) W +: (Mamma-Ca:Ja) W-: (Mamma-Ca: nein) Gesamt 12 97 109 2 889 891 14 986 1000 Schätzwerte: Prävalenz = 14/1000 = 0.014, Sensitivität = 12/14 = 0.86, Spezifität = 889/986 = 0.90, ppV = 12/109 = 0.11 Vertrauensgrenzen Schätzwerte untere Grenze obere Grenze 0.008 0.023 = 0.86 0.57 0.98 Spezifität 889/986 = 0.90 0.88 0.92 ppV 12/109 0.06 0.18 Prävalenz 14/1000 = 0.014 Sensitivität 12/14 = 0.11 Die angegebenen Grenzen sind so berechnet, dass sie mit 95%-Wahrscheinlichkeit den (unbekannten) wahren Wert umschließen. Das so berechnete Intervall ist das 95%-Konfidenzintervall. Fragen zu Diagnostischen Tests - Wie geeignet ist ein bestimmtes Untersuchungsverfahren als Diagnostischer Test? - Welche Tests mit welchen Eigenschaften sollte man für welche klinische Situation einsetzen? - Ist das gleiche Testergebnis für alle Patienten von gleicher Wertigkeit? Guter diagnostischer Test Schlechter diagnostischer Test Fragen zu Diagnostischen Tests - Wie geeignet ist ein bestimmtes Untersuchungsverfahren als Diagnostischer Test? - Welche Tests mit welchen Eigenschaften sollte man für welche klinische Situation einsetzen? - Ist das gleiche Testergebnis für alle Patienten von gleicher Wertigkeit? Wahl des Diagnosekriteriums (Cutpoint) Creatin Kinase und Myokardinfarkt CK ≥ 80 IU MI + MI Ø 190 30 220 100 140 Se 83% CK < 80 IU 40 Sp 77% 230 130 360 PPV = 0.86 Creatin Kinase und Myokardinfarkt CK ≥ 80 IU MI + MI Ø 190 30 220 100 140 Se 83% CK < 80 IU 40 PPV = 0.86 Sp 77% CK ≥ 160 IU 230 130 360 MI + MI Ø 97 1 231 98 129 129 262 Se 42% CK < 160 IU 133 Sp 99% 230 130 360 PPV = 0.99 Wahl des Diagnosekriteriums (Cutpoint) • Spezifisch eingestellte Tests werden vor allem zur Sicherung einer Diagnose eingesetzt Für den Arzt ist ein hochspezifischer Test insbesondere dann hilfreich, wenn er positiv ausfällt! Faustregel (engl.): SpPIn Creatin Kinase und Myokardinfarkt CK ≥ 80 IU MI + MI Ø 190 30 220 100 140 Se 83% CK < 80 IU 40 Sp 77% CK ≥ 40 IU 230 130 MI + MI Ø 228 42 270 88 90 NPV = 0.71 360 Se 99% CK < 40 IU 2 NPV = 0.98 Sp 68% 230 130 360 Wahl des Diagnosekriteriums (Cutpoint) • Sensitiv eingestellte Tests werden vor allem zum Ausschluß einer Erkrankung (Screening) eingesetzt Für den Arzt ist ein hochsensitiver Test insbesondere dann hilfreich, wenn er negativ ausfällt! Faustregel (engl.): SnNOut ROC-Kurve 100 Echt-Positive (Sensitivität) 90 CK ≥ 40 80 CK ≥ 80 70 60 50 40 30 CK ≥ 160 20 10 0 0 10 20 30 40 50 60 70 Falsch-Positive (1 - Spezifität) 80 90 100 ROC-Kurve ‚optimaler‘ Test 100 Echt-Positive (Sensitivität) 90 CK ≥ 40 80 CK ≥ 80 70 60 50 40 30 CK ≥ 160 20 10 0 0 10 20 30 40 50 60 70 Falsch-Positive (1 - Spezifität) 80 90 100 Fragen zu Diagnostischen Tests - Wie geeignet ist ein bestimmtes Untersuchungsverfahren als Diagnostischer Test? - Welche Tests mit welchen Eigenschaften sollte man für welche klinische Situation einsetzen? - Ist das gleiche Testergebnis für alle Patienten von gleicher Wertigkeit? Formel von Bayes Prävalenz Thomas Bayes ~1702 - 1761 ppV = P(W+|T+) = P(T+|W+) · P(W+) P(T+|W+) · P(W+) + P(T+|W-) · P(W-) Beispiel Mammografie: Prävalenz: 0,7%, Sensitivität: 87%, Spezifität: 99,3% 0.87 · 0.007 ppV = 0.87 · 0.007 + 0.007 · 0.993 = 0.47 Patientengut und Diagnostische Wertigkeit DMW 2006;131:1078-1084 Patienten: Stabile AP mit CCS I-III. Nicht-invasiver Ischämietest vor Katheteruntersuchung! (Szinti, Belastungs-EKG oder Stress-Echo) Patientengut und Diagnostische Wertigkeit Frauen Männer Test Stenose >50% Stenose <50% Ischämie + 3554 4152 Ischämie - 1083 4637 P Se Sp Test Stenose >50% Stenose <50% 7706 Ischämie + 8623 3437 12060 2122 3205 Ischämie - 2227 2189 4416 6274 10911 10850 5626 16476 42.5% 76.6% 33.8% ppV 46.1% P Se Sp 65.9% 79.5% 38.9% ppV 71.5% Die Eigenschaften Diagnostischer Tests werden weitgehend unabhängig von der Untersuchungssituation (d.h. konstant) charakterisiert durch Sensitivität Spezifität Die Eigenschaften Diagnostischer Tests werden abhängig von der Untersuchungssituation (d.h. variabel) charakterisiert durch Prävalenz (oder Vor-Test-Wahrscheinlichkeit) Positiver Prädiktiver Wert (PPV) Negativer Prädiktiver Wert (NPV) Der Nutzen eines Untersuchungsverfahren als Diagnostischer Tests hängt u. a. ab von der Wahl der Grenzwerte (Cutpoints), Patientengruppe, … Fragen – und Antworten? 1. Eine pharmazeutische Firma entwickelt einen neuen Enzymtest auf Darmkrebs und untersucht ihn bei 60 Patienten mit bekanntem Darmkrebs und bei 144 endoskopisch karzinomfreien Kontrollen. Es findet sich bei 44(73%) Krebspatienten und 32 (22%) Kontrollen ein positiver Test. A) Welche Sensitivität und Spezifität hat der Test? SE = 73% SP = 78% B) Welchen PPV hat der Test in der Studie? PPV = 44 / (44 + 32) = 58% C) Welchen NPV hat der Test in der Studie? NPV = 112 / (112 + 16) = 87.5% 2. Wie wäre der PPV, wenn die Vor-Test-Wahrscheinlichkeit nur 3% ist (Screening)? PPV = SE * PR / SE*PR +(1-SP)*(1-PR) = 0.73 * 0.03 / 0.73*0.03 + 0.22*0.97 = 0.093 oder 9.3% Fragen – und Antworten? 3. Bei Frauen, die an der Krebsvorsorgeuntersuchung teilnehmen, deckt die Inspektion und Palpation der Brust etwa 14% aller prävalenten Mammakarzinome auf. Welche Testcharakteristik beschreibt diesen Sachverhalt? Sensitivität 4. Die Sensitivität eines Tests erhöht sich in dem Maße wie seine Spezifität steigt. Richtig? NEIN! 5. BNP im Plasma wird in der Notaufnahme bei Dyspnoe unklarer Genese eingesetzt. Bei einem Trennwert von 50 pg/ml wird hinsichtlich der Diskrimination kardialer (HI) von nicht-kardialen Ursachen (COPD, PH) die Sensitivität mit 97% und die Spezifität mit 62% angegeben. Mit welchem Ziel würden Sie den Test einsetzen? Ausschluss einer kardialen Ursache Fragen – und Antworten? 6. In Ihrer ophthalmologischen Praxis können Sie 100 neue Patienten pro Woche mit einem innovativen nicht-invasiven Verfahren zur Diagnose der AMD untersuchen, das eine Sensitivität von 90% und eine Spezifität von 90% besitzt. Sie wissen, dass eine AMD bei ca. 10% Ihrer neuen Patienten vorliegt. - Wie schätzen Sie die Qualität des Tests anhand der verfügbaren Angaben des Herstellers ein (interessant oder nicht interessant)? Fragen – und Antworten? 6. In Ihrer ophthalmologischen Praxis können Sie 100 neue Patienten pro Woche mit einem innovativen nicht-invasiven Verfahren zur Diagnose der AMD untersuchen, das eine Sensitivität von 90% und eine Spezifität von 90% besitzt. Sie wissen, dass eine AMD bei ca. 10% Ihrer neuen Patienten vorliegt. - Wie schätzen Sie die Qualität des Tests anhand der verfügbaren Angaben des Herstellers ein (interessant oder nicht interessant)? - Wie oft werden Sie im Durchschnitt pro Woche einen Patienten mit einem positiven Testergebnis sehen („Treffsicherheit“)? Neues nicht-invasives Verfahren bei AMD AMD Keine AMD Test positiv Test negativ 100 Neues nicht-invasives Verfahren bei AMD AMD Keine AMD 10 90 Test positiv Test negativ 100 Neues nicht-invasives Verfahren bei AMD AMD Test positiv 9 Test negativ 1 10 Keine AMD 90 100 Neues nicht-invasives Verfahren bei AMD AMD Keine AMD Test positiv 9 9 Test negativ 1 81 10 90 100 Neues nicht-invasives Verfahren bei AMD AMD Keine AMD Test positiv 9 9 18 Test negativ 1 81 82 10 90 100 PPV = 50% oder 1 von 2 test-positiven hat nichts… Fragen – und Antworten? 6. In Ihrer ophthalmologischen Praxis können Sie 100 neue Patienten pro Woche mit einem innovativen nicht-invasiven Verfahren zur Diagnose der AMD untersuchen, das eine Sensitivität von 90% und eine Spezifität von 90% besitzt. Sie wissen, dass eine AMD bei ca. 10% Ihrer neuen Patienten vorliegt. - Wie schätzen Sie die Qualität des Tests anhand der verfügbaren Angaben des Herstellers ein (interessant oder nicht interessant)? - Wie oft werden Sie im Durchschnitt pro Woche einen Patienten mit einem positiven Testergebnis sehen („Treffsicherheit“)? - Wie schätzen Sie Aufwand und Nutzen des Tests ein? Vorlesungsdatei (.pdf) unter http://epi.klinikum.uni-muenster.de/lehre/vl_epi_bio.htm