Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik Diagnose und Prognose SS 10 – Kurzfassung 4 Diagnose und Prognose: Kurzfassung 4 Ziele der 4. Vorlesung Inhaltliche Problemstellung Information über Verlauf einer Erkrankung Prognostische Aussagen treffen Verbindung zwischen inhaltlicher Problemstellung und statistischem Konzept/Methode Prospektive Kohortenstudie: Beobachtung der Patienten im Zeitverlauf Prognose als Überlebenswahrscheinlichkeit Schätzen von Überlebensraten mit Kaplan-Meier Methode Prognostische Faktoren absichern Vergleich von Survivalfunktionen mit dem Log-Rank Test Prognostische Aussagen in komplexeren Situationen Einflus̈ prognostischer Faktoren kann mit Hilfe von Regressionsmodellen untersucht werden Statistisches Konzept / statistische Methode Kohortenstudie Vergleich von Ereigniszeiten Analyse von Ereigniszeiten Zensierung Kaplan-Meier Schätzer Log-Rank Test Cox-Regression Statistischer Test (am Beispiel für den Vergleich zweier Ereignisraten) Ein statistischer Test ist eine Entscheidungsregel, ob eine vorgegebene Hypothese über die betrachtete Grundgesamtheit anhand der Beobachtungen aus einer Stichprobe verworfen werden muss oder nicht verworfen werden kann; die Irrtums-(Fehler)-Wahrscheinlichkeit wird vorab festgelegt. 1. Schritt: Formulierung von Hypothesen Nullhypothese H0 : Der prognostische Faktor hat keine Auswirkungen auf die Wahrscheinlichkeit für das Auftreten des Ereignisses. p1 = p2 (”kein Unterschied”). Alternativhypthese H1 : Der prognostische Faktor hat Auswirkungen auf die Wahrscheinlichkeit für das Auftreten des Ereignisses. p1 6= p2 (”Unterschied”). 2. Schritt: Festlegung von Irrtumswahrscheinlichkeiten Entscheidungsmatrix Entscheidung für H0 (kein Unterschied) H1 (Unterschied) es liegt tatsächlich vor H0 (kein Unterschied) H1 (Unterschied) richtige Entscheidung falsch negative Entscheidung (1 − α) Fehler 2. Art (β) falsch positive Entscheidung richtige Entscheidung Fehler 1. Art (α) (1 − β) Anforderungen: Die Wahrscheinlichkeit für einen Fehler 1. Art soll kleiner als ein vorgegebener Wert α (Signifikanzniveau) und die Wahrscheinlichkeit für einen Fehler 2. Art (β) möglichst niedrig sein. Stand: 27. März 2010 1 Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik Diagnose und Prognose SS 10 – Kurzfassung 4 • Festlegen eines Signifikanzniveaus (etwa α = 5%) • Verwendung einer geeigneten Prüfgrös̈e, die zu einem möglichst ”mächtigen” (d.h. 1 − β groß!) statistischen Test führt. • (1 − β) wird auch Power des statistischen Tests genannt. 3. Schritt: Berechnung einer Prüfgröße (Teststatistik) T = p̂1 − p̂2 SE(p̂1 − p̂2 ) mit p̂1 = a a+b und p̂2 = c c+d Unter der Nullhypothese H0 : p1 = p2 = p vereinfacht sich die Formel zur Berechnung des Standardfehlers SE(p̂1 − p̂2 ) zu s p̂ (1 − p̂) p̂ (1 − p̂) (a + c) SE(p̂1 − p̂2 ) = + mit p̂ = (a + b) (c + d) n 4. Schritt: Entscheidungsregel Falls |T | ≥ kritischer Wert k Entscheidung für H1 (”Nullhypothese wird verworfen”) Test ist ”signifikant” Falls |T | < kritischer Wert k Beibehaltung von H0 (”Nullhypothese kann nicht verworfen werden”) Test ist ”nicht signifikant” Der kritische Wert k wird so gewählt, dass die Wahrscheinlichkeit für den Fehler 1. Art kleiner oder gleich dem vorgegebenen Signifikanzniveau ist (z.B. k = 1, 96 für α = 5%.) p-Wert (”Überschreitungswahrscheinlichkeit”): gibt bei einem statistischen Test die Wahrscheinlichkeit an, mit der sich unter der Nullhypothese für die Prüfgröße Werte größer oder gleich dem beobachteten Wert einstellen können. Ist der p-Wert kleiner als das festgelegte Signifikanzniveau, wird die Nullhypothese verworfen (Entscheidung für H1 ). Dualität von statistischem Test und Konfidenzintervall Einen statistischen Test zum Signifikanzniveau α kann man auch in der Weise durchführen, indem man prüft, ob der unter der Nullhypothese angenommene Wert einer statistischen Mas̈zahl im jeweiligen (1 − α)-Konfidenzintervall enthalten ist. Analyse von Überlebenszeiten • Einbeziehung von zensierten Beobachtungen • Schätzung von Überlebenswahrscheinlichkeiten nach Kaplan-Meier • Logrank-Test zum Vergleich von Überlebenskurven • Cox-Modell als Multivariables Regressionsmodell für Überlebenszeiten analog zur logistischen Regression für dichotome Daten Stand: 27. März 2010 2 Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik Diagnose und Prognose SS 10 – Kurzfassung 4 Schematische Darstellung eines typischen Ablaufs einer klinischen Studie: ◦ Zeitpunkt der Aufnahme in die Studie ⊣ Ereigniszeitpunkt → Zeitpunkt des letzten Kontakts (zensierte Beobachtung) T Zeit bis zum Ereignis bekannt A Zensierung aus administrativen Gründen (Studienende) L Zensierung aus anderen Gründen (Lost to Follow Up) 6◦ T - 5◦ 4◦ T - 3◦ A L - 2◦ 1◦ A T - 1996 Rekrutierungsperiode (1996–2000) Kalenderzeit 2000 Nachbeobachtung 2003 (2000–2003) Studienende Schätzung von Überlebenswahrscheinlichkeit S(t) (Kaplan-Meier-Schätzer) Survival Funtion S(t) S(t) = Wahrscheinlichkeit bis zum Zeitpunkt t zu überleben. Ein Beispieldatensatz Überlebeszeit (in Monaten) 5 7 10 12 13 17 20 Status tot tot tot zensiert tot zensiert zensiert Kaplan–Meier Kurve Bei jedem Ereignis (Tod) fällt die Kaplan-Meier-Kurve um 1/n. Zensierte Beobachtungen werden auf alle zuküngtigen Ereignisse verteilt. Dadurch wird der Abfall der Kurve bei einem Ereignis entsprechend größer. Die Kaplan-Meier Kurve erlaubt zu jedem Zeitpunkt t die geschätzte Wahrscheinlichkeit des Überlebens bis zum Zeitpunkt t abzulesen. Z.B können wir ablesen, dass die geschätzte Wahrscheinlichkeit 8 Monate zu überleben 71% beträgt. Stand: 27. März 2010 3 Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik Diagnose und Prognose SS 10 – Kurzfassung 4 100% 75% 50% 25% 0% 0 3 6 9 12 months 15 18 21 Vergleich von zwei Überlebenszeitverteilungen (Logrank-Test) • Betrachte 2 Gruppen von Patienten (A und B) • SA (t) und SB (t) wahre Überlebensfunktionen von Gruppe A bzw. B Testproblem: H0 : “Die Überlebensfunktionen sind gleich” gegen H1 : “Die Überlebensfunktionen unterscheiden sich”. mathematisch: H0 : SA (t) = SB (t) für alle t vs. H1 : SA (t) 6= SB (t) für alle t Cox–Regression (für zensierte Überlebenszeiten) Hazard Ratio (von FaktorXj ) = um wieviel steigt die Wahrscheinlichkeit an einem beliebigen Zeitpunkt t zu sterben, (gegeben man hat bis zum Zeitpunkt t überlebt), wenn wirXj um 1 erhöhen ? Typische Beispiele: HR(Therapie A vs.Therapie B)=0.8 → Risiko zu sterben ist unter Therapie A um den Faktor 0.8 kleiner HR(Alter)=1.02 → Risiko zu sterben wächst mit jedem Jahr um 1.02 prognostische und prädiktive Faktoren prognostische Faktoren: Erlauben, die Prognose (Überlebenswahrscheinlichkeit) eines Patienten zu bestimmen. prädiktive Faktoren: Erlauben, einen Therapiererfolg vorherzusagen. Lernziele der Vorlesung Stand: 27. März 2010 4 Querschnittsbereich Epidemiologie, Med. Biometrie und Med. Informatik Diagnose und Prognose SS 10 – Kurzfassung 4 1. Prognostische Fragestellungen werden typischerweise in prospektiven Kohortenstudien untersucht. Dabei werden Patienten im Zeitverlauf bis zum Eintreten eines interessierenden Ereignisses beobachtet. 2. Prognose kann als Wahrscheinlichkeit angegeben werden, dass das interessierende Ereignis zu einem Zeitpunkt eingetreten ist: Statistischer Test zum Vergleich von Ereignisraten. 3. Die spezielle Datenstruktur (Zensierungen) erfordert eine spezielle Methodik (KaplanMeier Schätzung). 4. Methoden für komplexere Fragestellungen: Log-Rank Test, Cox Modell. 5. Die Interaktion prognostischer Faktoren mit einer Therapie kann in prospektiv geplanten Analysen untersucht werden. 6. Der Einfluss prognostischer Faktoren kann in Regressionsmodellen untersucht werden. Im Cox-Modell können die Parameter als Relative Risiken (Hazard Ratios) interpretiert werden. Tabelle der Verteilungsfunktion der Standardnormalverteilung Stand: 27. März 2010 z 0.000 0.126 0.253 0.385 0.524 Φ(z) 0.5 0.55 0.6 0.65 0.7 Φ(−z) 0.5 0.45 0.4 0.35 0.3 0.674 0.842 1.036 1.282 1.645 0.75 0.8 0.85 0.9 0.95 0.25 0.2 0.15 0.1 0.05 1.960 2.054 2.326 2.576 2.878 0.975 0.98 0.99 0.995 0.998 0.025 0.02 0.01 0.005 0.002 3.090 3.291 3.540 3.749 ∞ 0.999 0.9995 0.9998 0.9999 1.0000 0.001 0.0005 0.0002 0.0001 0.000 5