Zur Kommunikation von Wahrscheinlichkeiten Relative Häufigkeiten sind grundsätzlich leichter zu erfassen als Wahrscheinlichkeitsaussagen: • „An 30 von 100 solchen Tagen wie morgen regnet es“ • „Von 100 Männern im Alter von 40, die Nichtraucher sind erleiden 3 in den nächsten 10 Jahren einen Herzinfarkt“ • „In einem von 20 Fällen ist meine Prognose falsch“ • „10 von 100 Lesern missfällt diese Werbung“ Aber: Wahrscheinlichkeiten sind keine relativen Häufigkeiten Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Beispiel: Lotto • Beim Lotto ist die Wahrscheinlichkeit bei einem Spiel einen 6er zu bekommen: 1 1 0.000000071 49 13983816 6 • „Einmal in 13 Millionen Spielen“ • „Einmal in 268 000 Jahren“ • „Es ist wahrscheinlicher, den Tag der Ziehung nicht mehr zu erleben, als zu gewinnen“ • Simulationsexperiment Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Zur Risikokommunikation Es gibt drei Arten der Beschreibung von Risiken für die Gesundheit: – – – Absolutes Risiko Relatives Risiko Anzahl der zusätzlich geschädigten Individuen Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Beispiel 2 : Perinatale Sterblichkeit und Reaktorunfall von Tschernobyl Körblein und Küchenhoff (1997): • Sterblichkeit 1987 von 0.8% auf 0.836 % erhöht • Risiko um 4.5 % erhöht (relatives Risiko 1.045) • ca. 317 zusätzlich verstorbene Kinder in Deutschland Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Beispiel 3 : Wirkung von Pravastatin „ Menschen mit hohem Cholesterinspiegel können das Risiko eines erstmaligem Herzinfarkts sehr schnell um 22 Prozent vermindern, wenn sie einen häufig angewandten Wirkstoff namens Pravastatin einnehmen“ • Reduktion der Todesfälle von 41 auf 32 pro 1000 Patienten mit hohem Cholesterin 4.1% auf 3.2%. Differenz 0.9%. • Reduktion um 22% (relatives Risiko 0.78) „22% werden gerettet“ • Es müssen 111 Patienten behandelt werden, um ein Menschenleben zu retten Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Medizinische Tests 1000 Personen 10 Erkrankt 9 Test P 1 Test N 990 Gesund 10 Test P Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 980 Test N Bedingte Wahrscheinlichkeiten Beachte: Die Bedingung entspricht der Bezugspopulation: Sensitivität: 9 von 10 Kranken werden als solche erkannt: P(Test positiv| Patient krank) = 9/10 Spezifität: 980 von 990 Gesunden werden als solche erkannt: P (Test negativ| Patient gesund) = 98/99 Positiver prädiktiver Wert: 9 von 19 Test P sind krank: P (Patient krank|Test positiv) = 9/19 Prävalenz: 1 von 100 Personen ist krank: P (krank) = 1/100 Bezugspopulation von zentraler Bedeutung Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Fehlspezifikationswahrscheinlichkeiten (bedingte) Klassifikationswahrscheinlichkeiten Diagnose: wahrer Status Klassifikation positiv negativ positiv negativ Sensitivität Empfindlichkeit P(T+|K+) Spezifität Treffsicherheit P(T-|K-) Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Krankheitswahrscheinlichkeiten im Diagnosetest In der Praxis interessieren in der Regel die Klassifikationswahrscheinlichkeiten weniger, wohl aber die Frage, ob ein Test-positives Tier wirklich krank ist, d.h. (bedingten) Krankheitswahrscheinlichkeiten Klassifikation Wahrheit (goldener Status) Test positiv negativ positiv negativ positiver prädiktiver Wert P(K+|T+) negativer prädiktiver Wert P(K-|T-) Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Beispiel • Sensitivität P(T+|K+) = 0.98 • Spezifität P(T-|K-) = 0.95 • Prävalenz P(K+) = 0.2 Wie hoch ist die Wahrscheinlichkeit, dass ein positiv getestetes Tier wirklich krank ist ? Prädiktiver Wert = ???? Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Lösung durch hypothetische Population 1000 200 krank 196 positiv 800 gesund 4 negativ 40 positiv Positiver prädiktiver Wert: 196 0.83 196 40 Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 760 negativ Theorie: Satz von Bayes P( A B) Def.: P( A | B) P( B) Multiplikationssatz: P ( A B ) P( A) P ( B | A) Satz von Bayes: P( A | B) P( A B) P( B | A) P( A) P( B) P( B) Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Satz von Bayes: Diagnosetests Kennt man Sensitivität, Spezifität und Prävalenz, so gilt für den positiven prädiktiven Wert P( K | T ) P (T | K ) P ( K ) P (T ) P (T | K ) P ( K ) P (T K ) P (T K ) P ( K ) P (T | K ) P ( K ) P (T | K ) P ( K ) P (T | K ) Pv Sens Pv Sens (1 Pv) (1 Spez ) Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Lösung durch Satz von Bayes • Sensitivität P(T+|K+) = 0.98 • Spezifität P(T-|K-) = 0.95 • Prävalenz P(K+) = 0.2 Dann gilt für den positiven prädiktiven Wert 0.2 0.98 0.196 P( K | T ) 0.2 0.98 0.8 0.05 0.196 0.040 Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Diagnosetests: Beispiel II • Sensitivität P(T+|K+) = 0.98 • Spezifität P(T-|K-) = 0.95 • Prävalenz P(K+) = 0.01 Dann gilt für den positiven prädiktiven Wert 0.98 0.01 P( K | T ) 0.18 0.98 0.01 0.99 0.05 Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Lösung durch hypothetische Population 10 000 100 krank 98 positiv 9 900 gesund 2 negativ 495 positiv Positiver prädiktiver Wert: 98 0.18 98 495 Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 9 405 negativ Diagnosetests: Beispiel BSE ??? • Sensitivität P(T+|K+) = 0.99 (???) • Spezifität P(T-|K-) = 0.99 (???) • Prävalenz P(K+) = 0.001 (???) Dann gilt für den postitiven prädiktiven Wert P(K+|T+) Übung Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Diagnosetests und (kleine) Prävalenzen Wenn die Prävalenz gering ist, • ist die (absolute) Anzahl falsch positiver Diagnosen hoch • ist der positive prädiktive Wert gering Achtung: Bei der Bewertung von diagnostischen Verfahren, falls die Prävalenz der Erkrankung sehr klein ist (BSE, HIV, …) Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Begriff der Zufallsgröße Ergebnisse von Zufallsexperimenten werden als Zahlen dargestellt: Beispiele: • Punkte beim Werfen zweier Würfel • Zeit beim Warten auf den Bus • Ja= 1 nein = 0 Formal Abbildung: Im Beispiel: X : (1,1) 2 (1,2) 3 ( 2,1) 3 ( 2,2) 4 Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Verteilungsfunktion einer Zufallsgröße Zur Charakterisierung von Zufallsgrößen benutzt man die Verteilungsfunktion. Sie ist für eine Zufallsgröße X definiert als F ( x) P ( X x) Im Beispiel: P( X P( X P( X P( X 1) 0 2) 1 / 36 3) (1 2) / 36 4) (1 2 3) / 36 Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Wahrscheinlichkeitsfunktion einer diskreten Zufallsgröße Zur Charakterisierung von diskreten Zufallsgrößen benutzt man die Wahrscheinlichkeitsfunktion. Sie ist definiert als f ( x) P ( X x) . Im Beispiel: P( X P( X P( X P( X 1) 0 2) 1 / 36 3) 2 / 36 4) 3 / 36 Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Erwartungswert und Varianz diskreter Zufallsgrößen X sei eine diskrete Zufallsgröße mit den möglichen Werten x1 ,...x n . Dann sind der Erwartungswert E ( X ) und die Varianz Var ( X ) wie folgt definiert: n E ( X ) xi P( X xi ) i 1 n Var ( X ) E (( X E ( X )) ) ( xi E ( X )) 2 P( X xi ) 2 i 1 x Var ( X ) Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Beispiel: Einfacher Würfel 1 1 1 1 1 1 E ( X ) *1 * 2 * 3 * 4 * 5 * 6 3.5 6 6 6 6 6 6 1 1 1 2 2 V ( X ) * (1 3.5) * (2 3.5) * (3 3.5) 2 6 6 6 1 1 1 2 2 * (4 3.5) * (5 3.5) * (6 3.5) 2 2.9 6 6 6 X 1.7 Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Erwartungswert von linear transformierten Zufallsgrößen Für eine Zufallsvariable a und b): X gilt (mit beliebigen Konstanten E (a b X ) a b E ( X ) Var (a b X ) b 2 Var ( X ) Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Binomialverteilung: Idee Betrachtet wird ein Bestand mit • insgesamt N Tieren • davon sind M erkrankt • und (N-M) nicht erkrankt Frage: Wenn man aus diesem Bestand zufällig n Tiere auswählt (mit Zurücklegen), wie groß ist die Wahrscheinlichkeit, dass hiervon m Tiere erkrankt sind? Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Binomialverteilung: Formal X i ist Zufallsvariable mit möglichen Realisierungen 1, falls i tes gezogenes Tier erkrankt Xi 0, falls i tes gezogenes Tier nicht erkrankt Dann gilt: M P ( X i 1) P N n Frage: P ( X m) ?, mit X X i i 1 Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Binomialverteilung: Definition Die Zufallsvariable der Summe aus n unabhängigen n 0-1-Variablen X X i , heißt binomial-verteilt mit i 1 Parametern n und P, kurz X~Bin(n, P) Es gilt n m P( X m) P (1 P) n m m Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Binomialkoeffizient: Definition Die Größe n n! (1 2 ... n) m m!(n m)! (1 2 ... m) (1 2 ... (n m)) heißt Binomialkoeffizient. Beispiel 5 (1 2 ... 5) 120 10 2 (1 2) (1 2 3) 2 6 Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Binomialverteilung: Anwendungen Die Binomialverteilung kann stets angewendet werden, wenn dichotome bzw. binäre, d.h. nomial skalierte Merkmale mit nur zwei Merkmalsausprägungen vorliegen • krank vs. gesund • schwarzbunt vs. braun • Niedersachsen vs. Bayern • Grenzwert überschritten vs. unterschritten • Versuch war erfolgreich vs. nicht erfolgreich Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Binomialverteilung: Beispiel • Hormonuntersuchung bei Kälbern Wahrscheinlichkeit für Antibiotika positiv P = 1/10 gezogene Stichprobe 5 P ( X 0) 0.10 (0.9) 5 1 1 0.591 0.591 0 5 P ( X 1) 0.11 (0.9) 4 5 0.1 0.656 0.329 1 5 P ( X 2) 0.12 (0.9) 3 10 0.01 0.729 0.0729 2 etc. Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 n=5 Binomialverteilung: Eigenschaften • Anzahl der erwarteten erkrankten Tiere E(X) = n P Beispiel: E(X) = 5 0.1 = 0.5 • Varianz Var(X) = n P (1-P) Beispiel: Var(X) = 5 0.1 0.9 = 0.45 Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005 Weitere diskrete Verteilungen • hypergeometrische Verteilung wenn die Auswahl ohne Zurücklegen erfolgt und die Gesamtheiten klein sind • Poisson-Verteilung wenn die Ereignisse sehr selten sind Vorlesung Biometrie für Studierende der Veterinärmedizin 03.11.2005