Wahrscheinlichkeit • „Wahrscheinlich wird morgen die Sonne scheinen“ • „Die Chancen, dass ich die Klausur bestehe, sind 50:50“ • „Das jährliche Risiko, durch einen Blitzschlag zu sterben, beträgt 1:10 Millionen“ Struktur: Wahrscheinlichkeitsaussagen beziehen sich auf Ereignisse, deren Eintreten unbekannt ist. Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Die Wahrscheinlichkeit nach Laplace Laplace (1749 - 1822): Zahl der günstigen Fälle Zahl aller (gleich) möglichen Fälle Beispiel: P(„Es wird eine 6 gewürfelt“) = 1/6 P(Es wir eine gerade Zahl gewürfelt) = 3/6 Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Laplace-Wahrscheinlichkeit (2) Problem: P(„Morgen scheint die Sonne“) Möglichkeiten = {Sonne, Regen, bewölkt} P(Sonne) = 1/3 ???? Definition ist zyklisch (gleich) möglich = gleich wahrscheinlich Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Frequentistischer Wahrscheinlichkeitsbegriff R. von Mises (1883-1953) „ Die Wahrscheinlichkeit eines Ereignisses ist die langfristige relative Häufigkeit seines Auftretens“ nA P( A) lim n nA : Anzahl der Erfolge n : Anzahl der Versuche Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Frequentistischer Wahrscheinlichkeitsbegriff Probleme: • Einmalige Ereignisse • Grenzwertdefinition • Experimentdurchführung Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Subjektivistischer Wahrscheinlichkeitsbegriff Laplace, Ramsey, de Finetti: „Die Wahrscheinlichkeit eines Ereignisses ist der Grad der Überzeugung, mit der ein Beobachter aufgrund eines bestimmten Informationsstandes an das Eintreten eines Ereignisses glaubt“ P(A) ist der Wetteinsatz (€) in , die eine Person höchstens einzugehen bereit ist, falls er bei Eintreten von A 1 € gewinnt. Beispiele: Münzwurf: Einsatz auf Zahl bis zu 0,50 € sinnvoll Würfel: Einsatz bis zu 1/3 € auf „5 oder 6“ Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Subjektivistischer Wahrscheinlichkeitsbegriff Probleme: • Subjektiv = Unwissenschaftlich ? • Wettdefinition • Informationsstand Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Axiomatische Einführung der Wahrscheinlichkeitsrechnung Kolmogorov (1933): Wahrscheinlichkeit ist Funktion, die gewissen Regeln, den sog. Kolmogorov‘schen Axiomen genügt Grundlage bildet das Zufallsexperiment: Vorgang, der genau ein Ergebnis liefert, das nicht deterministisch bestimmt ist. Menge der Ergebnisse: W Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Zufallsexperimente Experiment Ergebnismenge W Würfelwurf 1, 2, 3, 4, 5, 6 Münzwurf Kopf, Zahl Diagnosetest positiv, negativ Blutwert alles positive Zahlen EKG-Parameter alle positiven Zahlenpaare (0, ) x (0, ) Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Ereignisse Ereignisse sind Teilmengen von W Beispiele: 1. „gerade Zahl“ = {2,4,6} „1 oder 2“ = {1,2} 2. „Kopf“ = {K} 3. Blutwert > 90 (90, ) 4. Beide EKG-Werte >10 {(x, y)|x >10, y >10} Ereignissen sollen Wahrscheinlichkeiten zugeordnet werden. Wir bezeichnen Ereignisse mit A,B,C... Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Ereignisoperationen A B : Vereinigung = „A oder B“ A B : Durchschnitt = „A und B“ AC : Komplement = „Nicht A“ Beispiel: W A B AB AB AC = {1,2,3,4,5,6} = {2,4,6} „gerade“ = {4,5,6} „groß“ = {2,4,5,6} „groß oder gerade = {4,6} „gerade und groß“ = {1,3,5} „ungerade“ Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Axiome von Kolmogorov W mit Ereignissen A,B,C... Eine Wahrscheinlichkeit P hat folgende Eigenschaften 1. 0 P(A) 1 für alle Ereignisse 2. P(A B) P(A) + P(B) für disjunkte Ereignisse 3. P(W) 1 Beispiel: Laplace-Wahrscheinlichkeit für Würfel: P({1,2,3,4,5,6}) = 6/6 = 1 P({1,2} {5,6}) 4/6 2/3 P({1,2}) + P({3,4}) Positivität ist offensichtlich Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Positivität Additivität Normiertheit Axiome und Wahrscheinlichkeitsbegriff Die Laplace-Wahrscheinlichkeit und die frequentistische Wahrscheinlichkeit erfüllen die Axiome. Auch von den subjektiven Wahrscheinlichkeiten ist die Forderung der Erfüllung der Axiome sinnvoll. Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Wichtige Rechenregeln für Wahrscheinlichkeiten Gegenereignis: P(AC) = 1- P(A) Additionssatz : P(A B) = P(A) + P(B) - P(A B) P(A B) = P(A) + P(B) - P(A B) Beispiel : A = {2,4,6} B = {4,5,6} A B = {2,4,5,6} A B = {4,6} „gerade“ „groß“ „groß oder gerade“ „ groß und gerade “ P(A B ) = 4/6 P(A) + P(B) - P(A B) = 3/6+3/6-2/6 Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Beispiel zur bedingten Wahrscheinlichkeit: „Herzoperation im Krankenhaus“ Überleben der Operation Alle Fälle Operation überlebt Operation nicht überlebt P (nicht ü) Krankenh U 500 500 0.5 Krankenh K 900 100 0.1 „Risiko“ Frage: „In welchem Krankenhaus würden Sie sich behandeln lassen?“ Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Schwere der behandelten Fälle schwere Fälle leichte Fälle Krankenhaus U 900 100 Krankenhaus K 100 900 Frage: „Bleiben Sie bei Ihrer Entscheidung?“ Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Überleben der Operation aufgeteilt nach der Schwere der behandelten Fälle Schwere Fälle Operation überlebt Operation nicht überlebt P (nicht ü) Krankenh U 400 500 0.56 Krankenh K 30 70 Leichte Fälle Operation überlebt Operation nicht überlebt Krankenh U 100 0 Krankenh K 870 30 Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 „Risiko“ 0.7 P(nicht ü) „Risiko“ 0 0.033 Definition der bedingten Wahrscheinlichkeit In dem Beispiel betrachten wir das Risiko gegeben „schwerer Fall“: Das Risiko wird berechnet durch Anzahl ( schwer und nicht überlebt ) Anzahl ( schwer ) Allgemein definieren wir die Wahrscheinlichkeit von „Ereignis B gegeben A“ P( A B) P( B | A) : P( A) Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Im Beispiel B: nicht Überleben A: Schwerer Fall Krankenhaus U Krankenhaus K P( B) 500 / 1000 0.5 P( A) 900 / 1000 0.9 P( A B) 500 / 1000 0.5 P( B | A) 0.5 / 0.9 56% P( B) 100 / 1000 0.1 P( A) 100 / 1000 0.1 P( A B) 70 / 1000 0.07 P( B | A) 0.07 / 0.1 70% Schwere Fälle Operation überlebt Operation nicht überlebt P (nicht ü) Krankenh U 400 500 0.56 Krankenh K 30 70 0.7 Leichte Fälle Operation überlebt Operation nicht überlebt Krankenh U 100 0 0 Krankenh K 870 30 0.033 „Risiko“ Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 P (nicht ü) „Risiko“ Beispiel: Würfeln W = {1,2,3,4,5,6} A = {2,4,6} „gerade“ B = {4,5,6} „groß“ P(A) = 3/6 P(A B) = 2/6 P(B|A) = (2/6)/(3/6) =2/3 Interpretation: Wenn bekannt ist, daß die gewürfelte Zahl gerade ist, steigt die Wahrscheinlichkeit für „groß“ auf 2/3. Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Beispiel: Test 1000 Tiere werden getestet 600 Männlich, davon 450 positiv 400 Weiblich, davon 300 positiv 1 Tier P(M) = 0.6 P(W) = 0.4 P(Pos) = 0.75 P(MPos) = 0.45 P(Pos|M) = 0.45/0.6 = 0.75 P(M|Pos) = 0.45/0.75 = 0.6 Interpretation: Die Ereignisse „Männlich“ und „Positiv“ sind unabhängig Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Definition stochastische Unabhängigkeit Zwei Ereignisse A und B heißen unabhängig, falls gilt: P ( B | A) P ( B ) P ( A | B ) P ( A) P ( A B ) P ( A) P ( B ) Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Beispiel: mehrmaliges Würfeln Annahme: Zwei Würfel fallen voneinander unabhängig P(„keine 6“) = P(„1. Würfel keine 6“ und „2. Würfel keine 6“) = P(„1. Würfel keine 6“)* P(„2. Würfel keine 6“) = 5/6* 5/6 = 25/36 Mit der Regel für das Gegenereignis ergibt sich: P(„mindestens eine 6“) = 1- 25/36 = 11/36 Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Fehlklassifikation Ein diagnostischer Schnelltest T prüft, ob ein Symptom vorliegt oder nicht. Anhand eines Standardverfahrens K kann mit großem Aufwand der Nachweis zweifelsfrei erbracht werden. Diagnose Test T positiv (=1) negativ (=0) Wahrheit (goldener Standard K) positiv (=1) negativ (=0) richtig falsch negativ falsch positiv richtig Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Fehlspezifikationswahrscheinlichkeiten (bedingte) Klassifikationswahrscheinlichkeiten Diagnose: wahrer Status Klassifikation positiv negativ positiv negativ Sensitivität Empfindlichkeit P(T+|K+) Spezifität Treffsicherheit P(T-|K-) Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Goldener Standard Ist ein „Goldener Standard“ als „Definition der Wahrheit“ bekannt, so können die Diagnosewahrscheinlichkeiten aus einer Stichprobe geschätzt werden. Diagnose: Klassifikation positiv (=1) negativ (=0) Goldener Standard positiv (=1) negativ (=0) n(+|+) n(-|+) n(+|-) n(-|-) Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Schätzung von Sensitivität und Spezifität Schätzer für Sensitivität: n( | ) Sen n( | ) n( | ) Schätzer für Spezifität: n ( | ) Spez n ( | ) n ( | ) Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006 Schätzung von Sensitivität und Spezifität „Goldener Standard“: Beispiel Bei 500 wahr positiven und 300 wahr negativen Proben wird ein neues Testsystem validiert Test wahrer Befund positiv negativ positiv negativ 450 50 10 290 Schätzer für Sensitivität: Schätzer für Spezifität: 450 500 290 300 Vorlesung Biometrie für Studierende der Veterinärmedizin 26.10.2006