1 STATISTISCHE KRANKHEITSTESTS 18.11.2008 Simon Schimpf und Nico Schmitt Gliederung 2 Hintergrund des Themas (worum geht es) Voraussetzungen Lernziele Die intuitive Herangehensweise ohne Satz von Bayes Baumdiagramm, umgedrehtes Baumdiagramm, Vierfeldertafel Satz von der totalen Wahrscheinlichkeit, Satz von Bayes Statistische Begriffe (Prävalenz, Sensitivität, Spezifität, u.a.) A-priori und a-posteriori Wahrscheinlichkeiten Ethische und moralische Fragestellungen Worum geht es? 3 Aufgabentyp, welcher den Ausgang eines Tests, mit Hilfe des Satz von Bayes, hinterfragt Aufgabenschema: Durchführung eines (medizinischen) Tests Test kann positiv oder negativ ausfallen (dies nicht aus der Sicht des zu testenden Patienten oder Gegenstandes) Test positiv Patient ist wahrscheinlich krank Gegenstand ist wahrscheinlich defekt Test negativ Patient ist wahrscheinlich gesund Gegenstand ist wahrscheinlich in Ordnung Frage: Welche Aussage liefert das Testergebnis über den Zustand des Patienten oder des Gegenstandes? Beispiel 4 Bei Infektionskrankheiten ist es wichtig, dass man schnell die Art der Krankheit erkennt, damit man sie bekämpfen kann. Hierzu führt man Schnelltests durch, die allerdings Mängel haben: Manchmal wird eine Krankheit angezeigt, obwohl sie nicht vorliegt; gelegentlich wird eine Krankheit nicht angezeigt, obwohl sie vorhanden ist. 129 von 15.748 untersuchten Personen haben eine seltene Krankheit. Bei 118 der 129 Personen, die tatsächlich krank sind, wird die Krankheit mit dem Testverfahren auch erkannt. Bei 412 der restlichen 15619 Personen, die nicht erkrankt sind, weist das Testverfahren fälschlicherweise dennoch auf das Vorliegen der Krankheit hin. Voraussetzungen 5 Typischen Begriffe der Wahrscheinlichkeitsrechnung, also (absolute Häufigkeiten, Wahrscheinlichkeiten, etc.) Dazu gehören: Prozentwerte, Dezimalbrüche (30 %; 0,3) Bruchzahlen (3/10) Absolute Häufigkeiten (3 von 10) Chancenverhältnisse (3:7) Beherrschen von Baumdiagrammen Lernziele 6 Das Verstehen und Anwenden der bedingten Wahrscheinlichkeitsrechnung: Vierfeldertafel Satz von Bayes und Satz von der totalen Wahrscheinlichkeit Fachbegriffe, wie z.B. Prävalenz, Sensitivität, Spezifität, positiver Vorhersagewert / positives Testergebnis Kritisches Hinterfragen der Aussagen von Testergebnissen und Zeitungsschlagzeilen Herangehensweisen 7 Zurück zum Beispiel: Bei Infektionskrankheiten ist es wichtig, dass man schnell die Art der Krankheit erkennt, damit man sie bekämpfen kann. Hierzu führt man Schnelltests durch, die allerdings Mängel haben: Manchmal wird eine Krankheit angezeigt, obwohl sie nicht vorliegt; gelegentlich wird eine Krankheit nicht angezeigt, obwohl sie vorhanden ist. 129 von 15748 untersuchten Personen haben eine seltene Krankheit. Bei 118 der 129 Personen, die tatsächlich krank sind, wird die Krankheit mit dem Testverfahren auch erkannt. Bei 412 der restlichen 15619 Personen, die nicht erkrankt sind, weist das Testverfahren fälschlicherweise dennoch auf das Vorliegen der Krankheit hin. 8 Studie über BayesWahrscheinlichkeiten 9 Gelöste Aufgaben Angaben in Prozent Angaben in absoluten Zahlen 9-Jährige 10-Jährige 11-Jährige Erwachsene 0% 0% 0% 49% 18,7% 39% 53,5% 76,1% (vgl. Zhu/Gigerenzer 2006) Gruppe 1 10 Ein Arzt informiert seine Patienten über den anstehenden HIV-Test: Er verweist auf gute Kennwerte des Tests, nach denen ein tatsächlich Infizierter mit 99,8%-iger Sicherheit positiv und ein nicht Infizierter mit 99,7%-iger Sicherheit negativ getestet wird. Auf die Frage eines Patienten, mit welcher Sicherheit denn ein positives Ergebnis eine HIV-Erkrankung anzeigen würde, antwortet der Arzt: „Wie ich schon sagte: äußerst sicher, 99,8%.“ Gruppe 2 11 Eine fiktive Geschichte, mit dennoch realen Vorbildern: Man findet bei einem Mordopfer DNA-Spuren des Täters und führt daher ein Massenscreening (10 Millionen Männer) durch. Das verwendete Testverfahren gibt mit an Sicherheit grenzender Wahrscheinlichkeit keine fehlerhaften Ergebnisse aus (Fehler mit nur 0,001%). Einer der Männer weist ein DNA-Muster auf, das mit dem vorgefundenen identisch ist. Ein Gutachter ergänzt und behauptet, dass nur in 0,0001% der Fälle Personen ein gleiches DNA-Muster habe. Wie würden Sie als Richter urteilen, wenn keine weiteren Indizien vorliegen? Gruppe 3 12 Heftiger Streit um Legalisierung von Drogen: Vor einigen Jahren fand die bayrische Polizei in einer statistischen Erhebung, dass 60 % der Heroinabhängigen Haschisch geraucht hatten, bevor sie heroinabhängig wurden. Der bayrische Innenminister (Anm.: Edmund Stoiber) betrachtet das als Beweis dafür, dass Haschisch eine „Einsteigerdroge“ ist. Wenn jemand Haschisch raucht, so argumentiert er, wird er später (ungefähr mit einer Wahrscheinlichkeit von 60%) als Heroinabhängiger enden. Gruppe 4 13 Drei Lokalzeitungen A, B, und C haben Marktanteile von 45 %, 37 % und 18 %. Bei Zeitung A erfolgt 10 % des Verkaufs an Abonnenten, bei Zeitung B sind dieses 60 % und bei Zeitung C 75 %. Pro Tag werden insgesamt 10.000 Exemplare ausgeliefert. An einem Kiosk wird gerade eine Lokalzeitung verkauft. Mit welcher Wahrscheinlichkeit ist dies Zeitung B? Satz von der totalen Wahrscheinlichkeit 14 (, P) sei ein Wahrscheinlichkeitsraum. A1 ,..., Am disjunkte Ereignisse. m P( A ) 1. i 1 i m P( B) P( Ai ) P( B | Ai ) i 1 Satz von Bayes 15 (, P) sei ein diskreter Wahrscheinlichkeitsraum. sei in m disjunkte Teilmengen zerlegt, also m Ai mit Ai Aj für i j i 1 Dann gilt für jede Zahl j und jedes Ereignis B mit P( B) 0 P( Ak | B) P( Ak ) P( B | Ak ) m P( A ) P( B | A ) i 1 i i Statistische Begriffe 16 Prävalenz P(K) - Wahrscheinlichkeit, dass die Krankheit innerhalb einer bestimmten Personengruppe auftritt. Krank und Positiver Test Sensitivität P(T+|K) Gesund und negativer Test Wahrscheinlichkeit, dass bei einem kranken Patienten der Test auch wirklich positiv ausfällt. Spezifität P(T-|G) Wahrscheinlichkeit, dass bei einem gesunden Patienten der Test auch wirklich negativ ausfällt. Beide Werte sollten möglichst nahe bei 1 liegen. Positives Testergebnis P(K|T+) Wahrscheinlichkeit, dass ein Patient, der positiv getestet wurde, wirklich krank ist. Neg. Testergebnis P(G|T-) Wahrscheinlichkeit, dass ein Patient, der negativ getestet wurde, wirklich gesund ist. K=Krank G=Gesund T+=Test positiv T-=Test negativ Prävalenz P(K) K G Sensitivität P(T+|K) Spezifität P(T-|G) T+ T- T+ T+ T- Pos. Testergebnis P(K|T+) K 17 T- Neg. Testergebnis P(G|T-) G K G Aufgabe: Zuordnen Aufgabenstellung – Statistischer Begriff 18 Spezifität Sensitivität Pos. Testergebnis Neg. Testergebnis 1 Gib die Wahrscheinlichkeit an, dass der Test negativ ausfällt, wenn ein Patient gesund ist. P(T-|G) 2 Wie hoch ist die Wahrscheinlichkeit, dass ein negativ getesteter Patient gesund ist? P(G|T-) 3 Wie hoch ist die Wahrscheinlichkeit, dass bei einem kranken Patienten der Test positiv ausfällt? P(T+|K) 4 Gib die Wahrscheinlichkeit einer Infektion bei einem positiv getesteten Patienten an. P(K|T+) a-priori und a-posteriori 19 a-priori-Wahrscheinlichkeiten Unkenntnis über genaue Wahrscheinlichkeit Häufig LaplaceWahrscheinlichkeiten oder statistische Werte Beispiel: Laplace-Würfel (p=1/6) Anteil an Erkrankten in einer Bevölkerung (p=0,05 %) a-posteriori-Wahrscheinlichkeiten Präzisierung der Wahrscheinlichkeit eines Ereignisses auf Grund näherer Informationen z.B. durch einen durchgeführten Test Beispiel: Würfel nach Test Zahl p= 1 2 3 4 5 6 0,15 0,18 0,2 0,11 0,19 0,17 Akt. Testergebnisse; veränderter Anteil an Erkrankten (p=0,1%) a-priori und a-posteriori bei Bayes 20 1. Test 2. Test P(A1) P(A2) P(A3) a-priori-Wahrscheinlichkeit P(A1|B) P(A2|B) P(A3|B) a-posteriori-Wahrscheinlichkeit =P(A1) =P(A2) =P(A3) A-priori-Wahrscheinlichkeit für das nächste Experiment P(A1|B) P(A2|B) P(A3|B) Neue a-posterioriWahrscheinlichkeit P(K) 1. Test P(G) a-priori-Wahrscheinlichkeit P(T+|G) a-posteriori-Wahrscheinlichkeit =P(G) A-priori-Wahrscheinlichkeit für das nächste Experiment P(T+|G) Neue a-posterioriWahrscheinlichkeit Prävalenz P(K|T+) Pos. Testergebnis =P(K) 2. Test Neue Prävalenz P(K|T+) Neues Pos. Testerg. Aufgabe: HIV-Test 21 Testet man eine Bezugsgruppe von 10.000 Personen aus der durchschnittlichen deutschen Bevölkerung, so wird man im Mittel 5 HIV-Infizierte finden. Der HIV-Test ist sehr empfindlich: von 100 HIV-Infizierten werden 99 gefunden. Er schlägt aber auch bei 100 Gesunden fälschlicherweise zweimal positiv an. Man bestimme Spezifität, Sensitivität und Prävalenz. Wie hoch sind die Wahrscheinlichkeiten für ein positives und ein negatives Testergebnis? Um bei dem Testergebnis sicher zu gehen, wird unter den positiv getesteten Personen ein weiterer Test angeschlossen und zwar a) b) c) i. ii. mit den gleichen Werten für Spezifität und Sensitivität wie aus der Aufgabenstellung, mit Sensitivität = 0,99 und Spezifität = 0,999? Wiederholung eines Tests 22 Wiederholung des Tests mit den Werten: Prävalenz 0,024 0,024 Sensitivität 0,99 0,99 Spezifität 0,98 0,999 Positives Testergebnis 0,551 0,96 Spezialform Satz von Bayes als Funktion mit drei Unbekannten 23 P( K ) P(T | K ) P( K | T ) P( K ) P(T | K ) P(G) P(T | G) P(K) p Prävalenz P(T+|K) r Sensitivität P(T-|G) s Spezifität pr f ( p, r , s ) p r (1 p) (1 s) Moralische und ethische Fragestellungen 24 In welchem Alter kann man Schüler/innen mit welcher Krankheit konfrontieren? Wann könnte man diese Thematik im Unterricht behandeln? (Thüringer Lehrplan: 10. Klasse (Freiraum)) Gibt es evtl. persönlich Betroffene in der Klasse? Wie ist die Reaktion darauf? Literatur 25 Knechtl, Heiko: Rückwärtsschließen im Baumdiagramm Pinkernell, Guido: Test positiv, Diagnose negativ, in: mathematiklehren: Daten und Zufall. Heft 138, Oktober 2006. Boer, Heinz: AIDS – Welche Aussagekraft hat ein „positives“ Test-Ergebnis?, in: Stochastik in der Schule. Jahrgang 13/93, Heft 2. Mathenetz. Jahrgangsstufe 9. Büchter, A. und H.-W. Henn: Elementare Stochastik. Berlin 2000. S. 218 ff. Zhu, Liqi; Gigerenzer, Gerd: Children Can Solve Bayesian Problems: The Role of Representation in Mental Computation. In: Cognition, 98, 2006, 287–308.