Positiver prädiktiver Wert

Werbung
Zur Kommunikation von Wahrscheinlichkeiten
Relative Häufigkeiten sind grundsätzlich leichter zu erfassen
als Wahrscheinlichkeitsaussagen:
• „An 30 von 100 solchen Tagen wie morgen regnet es“
• „Von 100 Männern im Alter von 40, die Nichtraucher sind
erleiden 3 in den nächsten 10 Jahren einen Herzinfarkt“
• „In einem von 20 Fällen ist meine Prognose falsch“
• „10 von 100 Lesern missfällt diese Werbung“
Aber: Wahrscheinlichkeiten sind keine relativen Häufigkeiten
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Beispiel: Lotto
• Beim Lotto ist die Wahrscheinlichkeit bei einem
Spiel einen 6er zu bekommen:
1
1

 0.000000071
 49  13983816
 
6
• „Einmal in 13 Millionen Spielen“
• „Einmal in 268 000 Jahren“
• „Es ist wahrscheinlicher, den Tag der Ziehung nicht mehr zu
erleben, als zu gewinnen“
• Simulationsexperiment
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Zur Risikokommunikation
Es gibt drei Arten der Beschreibung von Risiken
für die Gesundheit:
–
–
–
Absolutes Risiko
Relatives Risiko
Anzahl der zusätzlich geschädigten Individuen
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Beispiel 2 : Perinatale Sterblichkeit und Reaktorunfall
von Tschernobyl
Körblein und Küchenhoff (1997):
• Sterblichkeit 1987 von 0.8% auf 0.836 % erhöht
• Risiko um 4.5 % erhöht (relatives Risiko 1.045)
• ca. 317 zusätzlich verstorbene Kinder in Deutschland
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Beispiel 3 : Wirkung von Pravastatin
„ Menschen mit hohem Cholesterinspiegel können das Risiko
eines erstmaligem Herzinfarkts sehr schnell um 22 Prozent
vermindern, wenn sie einen häufig angewandten Wirkstoff
namens Pravastatin einnehmen“
• Reduktion der Todesfälle von 41 auf 32 pro 1000 Patienten
mit hohem Cholesterin 4.1% auf 3.2%. Differenz 0.9%.
• Reduktion um 22% (relatives Risiko 0.78) „22% werden gerettet“
• Es müssen 111 Patienten behandelt werden, um ein Menschenleben
zu retten
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Medizinische Tests
1000 Personen
10 Erkrankt
9 Test P
1 Test N
990 Gesund
10 Test P
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
980 Test N
Bedingte Wahrscheinlichkeiten
Beachte:
Die Bedingung entspricht der Bezugspopulation:
Sensitivität: 9 von 10 Kranken werden als solche erkannt:
P(Test positiv| Patient krank) = 9/10
Spezifität: 980 von 990 Gesunden werden als solche erkannt:
P (Test negativ| Patient gesund) = 98/99
Positiver prädiktiver Wert: 9 von 19 Test P sind krank:
P (Patient krank|Test positiv) = 9/19
Prävalenz: 1 von 100 Personen ist krank: P (krank) = 1/100
Bezugspopulation von zentraler Bedeutung
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Fehlspezifikationswahrscheinlichkeiten
(bedingte) Klassifikationswahrscheinlichkeiten
Diagnose:
wahrer Status
Klassifikation positiv
negativ
positiv
negativ
Sensitivität
Empfindlichkeit
P(T+|K+)
Spezifität
Treffsicherheit
P(T-|K-)
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Krankheitswahrscheinlichkeiten im Diagnosetest
In der Praxis interessieren in der Regel die Klassifikationswahrscheinlichkeiten
weniger, wohl aber die Frage, ob ein Test-positives Tier wirklich krank ist, d.h.
(bedingten) Krankheitswahrscheinlichkeiten
Klassifikation Wahrheit (goldener Status)
Test
positiv
negativ
positiv
negativ
positiver
prädiktiver Wert
P(K+|T+)
negativer
prädiktiver Wert
P(K-|T-)
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Beispiel
• Sensitivität P(T+|K+) = 0.98
• Spezifität
P(T-|K-) = 0.95
• Prävalenz
P(K+) = 0.2
Wie hoch ist die Wahrscheinlichkeit, dass ein
positiv getestetes Tier wirklich krank ist ?
Prädiktiver Wert = ????
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Lösung durch hypothetische Population
1000
200 krank
196 positiv
800 gesund
4 negativ 40 positiv
Positiver prädiktiver Wert:
196
 0.83
196  40
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
760 negativ
Theorie: Satz von Bayes
P( A  B)
Def.: P( A | B) 
P( B)
Multiplikationssatz: P ( A  B )  P( A)  P ( B | A)
Satz von Bayes:
P( A | B) 
P( A  B)
P( B | A)  P( A)

P( B)
P( B)
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Satz von Bayes: Diagnosetests
Kennt man Sensitivität, Spezifität und Prävalenz, so gilt für den
positiven prädiktiven Wert
P( K  | T )
P (T  | K  )  P ( K  )

P (T  )
P (T  | K  )  P ( K  )

P (T   K  )  P (T   K )
P ( K  )  P (T  | K  )

P ( K  )  P (T  | K  )  P ( K )  P (T  | K )
Pv  Sens

Pv  Sens  (1  Pv)  (1  Spez )
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Lösung durch Satz von Bayes
• Sensitivität P(T+|K+) = 0.98
• Spezifität
P(T-|K-) = 0.95
• Prävalenz
P(K+) = 0.2
Dann gilt für den positiven prädiktiven Wert
0.2  0.98
0.196
P( K  | T ) 

0.2  0.98  0.8  0.05 0.196  0.040
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Diagnosetests: Beispiel II
• Sensitivität P(T+|K+) = 0.98
• Spezifität
P(T-|K-) = 0.95
• Prävalenz
P(K+) = 0.01
Dann gilt für den positiven prädiktiven Wert
0.98  0.01
P( K  | T ) 
 0.18
0.98  0.01  0.99  0.05
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Lösung durch hypothetische Population
10 000
100 krank
98 positiv
9 900 gesund
2 negativ 495 positiv
Positiver prädiktiver Wert:
98
 0.18
98  495
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
9 405 negativ
Diagnosetests: Beispiel BSE ???
• Sensitivität P(T+|K+) = 0.99 (???)
• Spezifität
P(T-|K-) = 0.99 (???)
• Prävalenz
P(K+) = 0.001 (???)
Dann gilt für den postitiven prädiktiven Wert
P(K+|T+)
Übung
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Diagnosetests und (kleine) Prävalenzen
Wenn die Prävalenz gering ist,
• ist die (absolute) Anzahl falsch positiver Diagnosen hoch
• ist der positive prädiktive Wert gering
Achtung:
Bei der Bewertung von diagnostischen Verfahren, falls die
Prävalenz der Erkrankung sehr klein ist (BSE, HIV, …)
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Begriff der Zufallsgröße
Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt:
Beispiele:
• Punkte beim Werfen zweier Würfel
• Zeit beim Warten auf den Bus
• Ja= 1 nein = 0
Formal Abbildung:
Im Beispiel:
X : 
(1,1)  2
(1,2)  3
( 2,1)  3
( 2,2)  4
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Verteilungsfunktion einer Zufallsgröße
Zur Charakterisierung von Zufallsgrößen benutzt
man die Verteilungsfunktion. Sie ist für eine
Zufallsgröße X definiert als F ( x)  P ( X  x)
Im Beispiel:
P( X
P( X
P( X
P( X
 1)  0
 2)  1 / 36
 3)  (1  2) / 36
 4)  (1  2  3) / 36
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Wahrscheinlichkeitsfunktion einer diskreten
Zufallsgröße
Zur Charakterisierung von diskreten Zufallsgrößen
benutzt man die Wahrscheinlichkeitsfunktion.
Sie ist definiert als f ( x)  P ( X  x) .
Im Beispiel:
P( X
P( X
P( X
P( X
 1)  0
 2)  1 / 36
 3)  2 / 36
 4)  3 / 36
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Erwartungswert und Varianz diskreter Zufallsgrößen
X sei eine diskrete Zufallsgröße mit den möglichen
Werten x1 ,...x n .
Dann sind der Erwartungswert E ( X ) und die Varianz Var ( X )
wie folgt definiert:
n
E ( X )   xi P( X  xi )
i 1
n
Var ( X )  E (( X  E ( X )) )   ( xi  E ( X )) 2 P( X  xi )
2
i 1
 x  Var ( X )
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Beispiel: Einfacher Würfel
1
1
1
1
1
1
E ( X )  *1  * 2  * 3  * 4  * 5  * 6  3.5
6
6
6
6
6
6
1
1
1
2
2
V ( X )  * (1  3.5)  * (2  3.5)  * (3  3.5) 2 
6
6
6
1
1
1
2
2
* (4  3.5)  * (5  3.5)  * (6  3.5) 2  2.9
6
6
6
X  1.7
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Erwartungswert von linear transformierten
Zufallsgrößen
Für eine Zufallsvariable
a und b):
X gilt (mit beliebigen Konstanten
E (a  b  X )  a  b  E ( X )
Var (a  b  X )  b 2  Var ( X )
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Binomialverteilung: Idee
Betrachtet wird ein Bestand mit
• insgesamt N Tieren
• davon sind M erkrankt
• und (N-M) nicht erkrankt
Frage:
Wenn man aus diesem Bestand zufällig n Tiere auswählt (mit
Zurücklegen), wie groß ist die Wahrscheinlichkeit, dass hiervon
m Tiere erkrankt sind?
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Binomialverteilung: Formal
X i ist Zufallsvariable mit möglichen Realisierungen
1, falls i  tes gezogenes Tier erkrankt
Xi  
0, falls i  tes gezogenes Tier nicht erkrankt
Dann gilt:
M
P ( X i  1) 
P
N
n
Frage:
P ( X  m)  ?, mit X   X i
i 1
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Binomialverteilung: Definition
Die Zufallsvariable der Summe aus n unabhängigen
n
0-1-Variablen X   X i , heißt binomial-verteilt mit
i 1
Parametern n und P, kurz X~Bin(n, P)
Es gilt
n  m
P( X  m)    P (1  P) n m
 m
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Binomialkoeffizient: Definition
Die Größe
n 
n!
(1 2  ...  n)
  

 m  m!(n  m)! (1 2  ...  m)  (1 2  ...  (n  m))
heißt Binomialkoeffizient.
Beispiel
5 
(1 2  ...  5)
120
  

 10
 2  (1 2)  (1 2  3) 2  6
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Binomialverteilung: Anwendungen
Die Binomialverteilung kann stets angewendet werden, wenn
dichotome bzw. binäre, d.h. nomial skalierte Merkmale mit nur
zwei Merkmalsausprägungen vorliegen
• krank vs. gesund
• schwarzbunt vs. braun
• Niedersachsen vs. Bayern
• Grenzwert überschritten vs. unterschritten
• Versuch war erfolgreich vs. nicht erfolgreich
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Binomialverteilung: Beispiel
• Hormonuntersuchung bei Kälbern
Wahrscheinlichkeit für Antibiotika positiv P = 1/10
gezogene Stichprobe
5
P ( X  0)   0.10 (0.9) 5  1 1  0.591  0.591
0
 5
P ( X  1)   0.11 (0.9) 4  5  0.1  0.656  0.329
1 
5
P ( X  2)   0.12 (0.9) 3  10  0.01  0.729  0.0729
 2
etc.
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
n=5
Binomialverteilung: Eigenschaften
• Anzahl der erwarteten erkrankten Tiere
E(X) = n P
Beispiel: E(X) = 5  0.1 = 0.5
• Varianz
Var(X) = n P (1-P)
Beispiel: Var(X) = 5  0.1  0.9 = 0.45
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Weitere diskrete Verteilungen
• hypergeometrische Verteilung
wenn die Auswahl ohne Zurücklegen erfolgt und die
Gesamtheiten klein sind
•
Poisson-Verteilung
wenn die Ereignisse sehr selten sind
Vorlesung Biometrie für Studierende
der Veterinärmedizin 03.11.2005
Herunterladen