Statistische KrankheitstestsV3

Werbung
1
STATISTISCHE
KRANKHEITSTESTS
18.11.2008
Simon Schimpf und Nico Schmitt
Gliederung
2









Hintergrund des Themas (worum geht es)
Voraussetzungen
Lernziele
Die intuitive Herangehensweise ohne Satz von Bayes
Baumdiagramm, umgedrehtes Baumdiagramm,
Vierfeldertafel
Satz von der totalen Wahrscheinlichkeit, Satz von Bayes
Statistische Begriffe (Prävalenz, Sensitivität, Spezifität,
u.a.)
A-priori und a-posteriori Wahrscheinlichkeiten
Ethische und moralische Fragestellungen
Worum geht es?
3


Aufgabentyp, welcher den Ausgang eines Tests, mit Hilfe des
Satz von Bayes, hinterfragt
Aufgabenschema:





Durchführung eines (medizinischen) Tests
Test kann positiv oder negativ ausfallen (dies nicht aus der Sicht
des zu testenden Patienten oder Gegenstandes)
Test positiv 
Patient ist wahrscheinlich krank
Gegenstand ist wahrscheinlich defekt
Test negativ  Patient ist wahrscheinlich gesund
Gegenstand ist wahrscheinlich in Ordnung
Frage:
Welche Aussage liefert das Testergebnis über den
Zustand des Patienten oder des Gegenstandes?
Beispiel
4
Bei Infektionskrankheiten ist es wichtig, dass man schnell
die Art der Krankheit erkennt, damit man sie bekämpfen
kann. Hierzu führt man Schnelltests durch, die allerdings
Mängel haben: Manchmal wird eine Krankheit angezeigt,
obwohl sie nicht vorliegt; gelegentlich wird eine Krankheit
nicht angezeigt, obwohl sie vorhanden ist.
129 von 15.748 untersuchten Personen haben eine seltene
Krankheit. Bei 118 der 129 Personen, die tatsächlich
krank sind, wird die Krankheit mit dem Testverfahren auch
erkannt. Bei 412 der restlichen 15619 Personen, die nicht
erkrankt sind, weist das Testverfahren fälschlicherweise
dennoch auf das Vorliegen der Krankheit hin.
Voraussetzungen
5


Typischen Begriffe der Wahrscheinlichkeitsrechnung,
also (absolute Häufigkeiten, Wahrscheinlichkeiten,
etc.)
Dazu gehören:
 Prozentwerte,
Dezimalbrüche (30 %; 0,3)
 Bruchzahlen (3/10)
 Absolute Häufigkeiten (3 von 10)
 Chancenverhältnisse (3:7)

Beherrschen von Baumdiagrammen
Lernziele
6

Das Verstehen und Anwenden der bedingten
Wahrscheinlichkeitsrechnung:
 Vierfeldertafel
 Satz
von Bayes und Satz von der totalen
Wahrscheinlichkeit
 Fachbegriffe, wie z.B. Prävalenz, Sensitivität, Spezifität,
positiver Vorhersagewert / positives Testergebnis

Kritisches Hinterfragen der Aussagen von
Testergebnissen und Zeitungsschlagzeilen
Herangehensweisen
7
Zurück zum Beispiel:
Bei Infektionskrankheiten ist es wichtig, dass man schnell die
Art der Krankheit erkennt, damit man sie bekämpfen kann.
Hierzu führt man Schnelltests durch, die allerdings Mängel
haben: Manchmal wird eine Krankheit angezeigt, obwohl sie
nicht vorliegt; gelegentlich wird eine Krankheit nicht
angezeigt, obwohl sie vorhanden ist.
129 von 15748 untersuchten Personen haben eine seltene
Krankheit. Bei 118 der 129 Personen, die tatsächlich krank
sind, wird die Krankheit mit dem Testverfahren auch erkannt.
Bei 412 der restlichen 15619 Personen, die nicht erkrankt
sind, weist das Testverfahren fälschlicherweise dennoch auf
das Vorliegen der Krankheit hin.
8
Studie über BayesWahrscheinlichkeiten
9
Gelöste Aufgaben
Angaben in Prozent
Angaben in absoluten Zahlen
9-Jährige
10-Jährige
11-Jährige
Erwachsene
0%
0%
0%
49%
18,7%
39%
53,5%
76,1%
(vgl. Zhu/Gigerenzer 2006)
Gruppe 1
10

Ein Arzt informiert seine Patienten über den
anstehenden HIV-Test: Er verweist auf gute
Kennwerte des Tests, nach denen ein tatsächlich
Infizierter mit 99,8%-iger Sicherheit positiv und ein
nicht Infizierter mit 99,7%-iger Sicherheit negativ
getestet wird. Auf die Frage eines Patienten, mit
welcher Sicherheit denn ein positives Ergebnis eine
HIV-Erkrankung anzeigen würde, antwortet der Arzt:
„Wie ich schon sagte: äußerst sicher, 99,8%.“
Gruppe 2
11

Eine fiktive Geschichte, mit dennoch realen Vorbildern:
Man findet bei einem Mordopfer DNA-Spuren des Täters
und führt daher ein Massenscreening (10 Millionen
Männer) durch. Das verwendete Testverfahren gibt mit an
Sicherheit grenzender Wahrscheinlichkeit keine
fehlerhaften Ergebnisse aus (Fehler mit nur 0,001%).
Einer der Männer weist ein DNA-Muster auf, das mit dem
vorgefundenen identisch ist. Ein Gutachter ergänzt und
behauptet, dass nur in 0,0001% der Fälle Personen ein
gleiches DNA-Muster habe. Wie würden Sie als Richter
urteilen, wenn keine weiteren Indizien vorliegen?
Gruppe 3
12

Heftiger Streit um Legalisierung von Drogen:
Vor einigen Jahren fand die bayrische Polizei in einer
statistischen Erhebung, dass 60 % der
Heroinabhängigen Haschisch geraucht hatten, bevor
sie heroinabhängig wurden. Der bayrische
Innenminister (Anm.: Edmund Stoiber) betrachtet das
als Beweis dafür, dass Haschisch eine
„Einsteigerdroge“ ist. Wenn jemand Haschisch raucht,
so argumentiert er, wird er später (ungefähr mit einer
Wahrscheinlichkeit von 60%) als Heroinabhängiger
enden.
Gruppe 4
13

Drei Lokalzeitungen A, B, und C haben Marktanteile
von 45 %, 37 % und 18 %. Bei Zeitung A erfolgt
10 % des Verkaufs an Abonnenten, bei Zeitung B
sind dieses 60 % und bei Zeitung C 75 %. Pro Tag
werden insgesamt 10.000 Exemplare ausgeliefert.
An einem Kiosk wird gerade eine Lokalzeitung
verkauft. Mit welcher Wahrscheinlichkeit ist dies
Zeitung B?
Satz von der totalen Wahrscheinlichkeit
14
(, P) sei ein Wahrscheinlichkeitsraum.
A1 ,..., Am disjunkte Ereignisse.
m
 P( A )  1.
i 1
i
m
P( B)   P( Ai )  P( B | Ai )
i 1
Satz von Bayes
15
(, P) sei ein diskreter Wahrscheinlichkeitsraum.
 sei in m disjunkte Teilmengen zerlegt, also
m
   Ai
mit
Ai  Aj  
für i  j
i 1
Dann gilt für jede Zahl j und jedes Ereignis B mit P( B)  0
P( Ak | B) 
P( Ak )  P( B | Ak )
m
 P( A )  P( B | A )
i 1
i
i
Statistische Begriffe
16
Prävalenz P(K) - Wahrscheinlichkeit, dass die Krankheit innerhalb einer bestimmten
Personengruppe auftritt.
Krank und Positiver Test

Sensitivität P(T+|K)

Gesund und negativer Test

Wahrscheinlichkeit, dass bei
einem kranken Patienten der Test
auch wirklich positiv ausfällt.
Spezifität P(T-|G)

Wahrscheinlichkeit, dass bei
einem gesunden Patienten der
Test auch wirklich negativ
ausfällt.
Beide Werte sollten möglichst nahe bei 1 liegen.

Positives Testergebnis P(K|T+)

Wahrscheinlichkeit, dass ein
Patient, der positiv getestet
wurde, wirklich krank ist.

Neg. Testergebnis P(G|T-)

Wahrscheinlichkeit, dass ein
Patient, der negativ getestet
wurde, wirklich gesund ist.
K=Krank
G=Gesund
T+=Test positiv
T-=Test negativ
Prävalenz P(K)
K
G
Sensitivität P(T+|K)
Spezifität P(T-|G)
T+
T-
T+
T+
T-
Pos. Testergebnis P(K|T+)
K
17
T-
Neg. Testergebnis P(G|T-)
G
K
G
Aufgabe: Zuordnen Aufgabenstellung –
Statistischer Begriff
18
Spezifität
Sensitivität
Pos. Testergebnis
Neg. Testergebnis
1
Gib die Wahrscheinlichkeit an, dass der
Test negativ ausfällt, wenn ein Patient
gesund ist.
P(T-|G)
2
Wie hoch ist die Wahrscheinlichkeit,
dass ein negativ getesteter Patient
gesund ist?
P(G|T-)
3
Wie hoch ist die Wahrscheinlichkeit,
dass bei einem kranken Patienten der
Test positiv ausfällt?
P(T+|K)
4
Gib die Wahrscheinlichkeit einer
Infektion bei einem positiv getesteten
Patienten an.
P(K|T+)
a-priori und a-posteriori
19
a-priori-Wahrscheinlichkeiten



Unkenntnis über genaue
Wahrscheinlichkeit
Häufig LaplaceWahrscheinlichkeiten
oder statistische Werte
Beispiel:
Laplace-Würfel (p=1/6)
 Anteil an Erkrankten in
einer Bevölkerung
(p=0,05 %)

a-posteriori-Wahrscheinlichkeiten


Präzisierung der
Wahrscheinlichkeit eines
Ereignisses auf Grund
näherer Informationen z.B.
durch einen
durchgeführten Test
Beispiel:

Würfel nach Test
Zahl
p=

1
2
3
4
5
6
0,15
0,18
0,2
0,11
0,19
0,17
Akt. Testergebnisse;
veränderter Anteil an
Erkrankten (p=0,1%)
a-priori und a-posteriori bei Bayes
20
1. Test
2. Test
P(A1)
P(A2)
P(A3)
a-priori-Wahrscheinlichkeit
P(A1|B)
P(A2|B)
P(A3|B)
a-posteriori-Wahrscheinlichkeit
=P(A1)
=P(A2)
=P(A3)
A-priori-Wahrscheinlichkeit für
das nächste Experiment
P(A1|B)
P(A2|B)
P(A3|B)
Neue a-posterioriWahrscheinlichkeit
P(K)
1. Test
P(G)
a-priori-Wahrscheinlichkeit
P(T+|G)
a-posteriori-Wahrscheinlichkeit
=P(G)
A-priori-Wahrscheinlichkeit für
das nächste Experiment
P(T+|G)
Neue a-posterioriWahrscheinlichkeit
Prävalenz
P(K|T+)
Pos. Testergebnis
=P(K)
2. Test
Neue Prävalenz
P(K|T+)
Neues Pos. Testerg.
Aufgabe: HIV-Test
21
Testet man eine Bezugsgruppe von 10.000 Personen
aus der durchschnittlichen deutschen Bevölkerung, so
wird man im Mittel 5 HIV-Infizierte finden. Der HIV-Test
ist sehr empfindlich: von 100 HIV-Infizierten werden 99
gefunden. Er schlägt aber auch bei 100 Gesunden
fälschlicherweise zweimal positiv an.
Man bestimme Spezifität, Sensitivität und Prävalenz.
Wie hoch sind die Wahrscheinlichkeiten für ein positives und ein
negatives Testergebnis?
Um bei dem Testergebnis sicher zu gehen, wird unter den positiv
getesteten Personen ein weiterer Test angeschlossen und zwar
a)
b)
c)
i.
ii.
mit den gleichen Werten für Spezifität und Sensitivität wie aus der
Aufgabenstellung,
mit Sensitivität = 0,99 und Spezifität = 0,999?
Wiederholung eines Tests
22
Wiederholung des Tests mit den Werten:
Prävalenz
0,024
0,024
Sensitivität
0,99
0,99
Spezifität
0,98
0,999
Positives Testergebnis
0,551
0,96
Spezialform Satz von Bayes als
Funktion mit drei Unbekannten
23
P( K )  P(T  | K )
P( K | T ) 
P( K )  P(T  | K )  P(G)  P(T  | G)
P(K)
p Prävalenz
P(T+|K)
r
Sensitivität
P(T-|G)
s
Spezifität
pr
f ( p, r , s ) 
p  r  (1  p)  (1  s)
Moralische und ethische
Fragestellungen
24



In welchem Alter kann man Schüler/innen mit
welcher Krankheit konfrontieren?
Wann könnte man diese Thematik im Unterricht
behandeln? (Thüringer Lehrplan: 10. Klasse
(Freiraum))
Gibt es evtl. persönlich Betroffene in der Klasse?
Wie ist die Reaktion darauf?
Literatur
25





Knechtl, Heiko: Rückwärtsschließen im Baumdiagramm
Pinkernell, Guido: Test positiv, Diagnose negativ, in:
mathematiklehren: Daten und Zufall. Heft 138, Oktober
2006.
Boer, Heinz: AIDS – Welche Aussagekraft hat ein
„positives“ Test-Ergebnis?, in: Stochastik in der Schule.
Jahrgang 13/93, Heft 2.
Mathenetz. Jahrgangsstufe 9.
Büchter, A. und H.-W. Henn: Elementare Stochastik.
Berlin 2000. S. 218 ff.
Zhu, Liqi; Gigerenzer, Gerd: Children Can Solve Bayesian
Problems: The Role of Representation in Mental
Computation. In: Cognition, 98, 2006, 287–308.
Herunterladen