Wiederholung und Beispiele Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Biologische Variabilität • In der belebten Natur gibt es viele Phänomene, die im Einzelfall nicht vorhersehbar sind. • Verschiedene Menschen und Tiere reagieren verschieden, haben verschiedene Eigenschaften etc. • Unter exakt gleichen Haltungsbedingungen werden manche Tiere krank, manche bleiben gesund. • Manche Individuen reagieren auf ein Medikament, manche nicht. Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Biologische Variabilität (2) Einerseits: • Besonderer Reiz von Phänomenen in der belebten Natur • Weiterentwicklung ohne natürliche Variabilität nicht möglich Andererseits: • Erkenntnisse zu gewinnen ist wesentlich schwieriger • Wirkungsmechanismen häufig nicht deterministisch • Absolute Sicherheit bei Prognosen in Einzelfällen oft unmöglich Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Modell für biologische Variabilität: Wahrscheinlichkeitsrechnung Aussagen der Form: • „Die Heilungschance ist mit Medikament A höher als mit Medikament B“ • „Nebenwirkungen des Medikaments treten in 1 von 1000 Fällen auf“ • „Die Herzfrequenz ist bei schweren Leguanen im Durchschnitt höher“ • „Die Herzfrequenz von gesunden Leguanen liegt mit einer Wahrscheinlichkeit von 99% unter dem Wert x“ Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Wichtige Rechenregeln für Wahrscheinlichkeiten Gegenereignis: P(AC) = 1- P(A) Additionssatz : P(A B) = P(A) + P(B) - P(A B) P(A B) = P(A) + P(B) - P(A B) Beispiel : A = {2,4,6} B = {4,5,6} A B = {2,4,5,6} A B = {4,6} „gerade“ „groß“ „groß oder gerade“ „ groß und gerade “ P(A B ) = 4/6 P(A) + P(B) - P(A B) = 3/6+3/6-2/6 Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Definition der bedingten Wahrscheinlichkeit In dem Beispiel betrachten wir das Risiko gegeben „schwerer Fall“: Das Risiko wird berechnet durch Anzahl ( schwer und nicht überlebt ) Anzahl ( schwer ) Allgemein definieren wir die Wahrscheinlichkeit von „Ereignis B gegeben A“ P( A B) P( B | A) : P( A) Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Definition stochastische Unabhängigkeit Zwei Ereignisse A und B heißen unabhängig, falls gilt: P ( B | A) P ( B ) P ( A | B ) P ( A) P ( A B ) P ( A) P ( B ) Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Bedingte Wahrscheinlichkeiten SZ vom 8.2.: Krebshäufigkeit gestiegen Aber: Alterspezifische Krebsraten gefallen Hypothetisches Beispiel: 1960: Jung: 2% Alt : 10% Anteil Jung und Alt jeweils 50% Daraus Gesamtrate 0.5*2%+0.5*10% = 6% 2006: Jung : 1% Alt : 9% Anteil Alt 2/3 Jung 1/3 Gesamt: 2/3*9% + 1/3*1% = 6.33% Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Fehlspezifikationswahrscheinlichkeiten (bedingte) Klassifikationswahrscheinlichkeiten Diagnose: wahrer Status Klassifikation positiv negativ positiv negativ Sensitivität Empfindlichkeit P(T+|K+) Spezifität Treffsicherheit P(T-|K-) Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Medizinische Tests 1000Personen 10 Erkrankt 9 Test P 1 Test N 990Gesund 10 Test P Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 980 Test N Alte Klausur • Aufgabe 2 • Bei einer Krankheit sei bekannt, dass die Prävalenz bei 10% liegt. Zur Diagnose wird ein Test mit einer Sensitivität von 0.9 und einer Spezifität von 0.8 benutzt. • Wie groß ist die Wahrscheinlichkeit, dass ein positiv getestetes Tier die Krankheit tatsächlich hat. • Wie groß ist die Wahrscheinlichkeit, dass ein gesund getestetes Tier tatsächlich gesund ist? Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Lösung 1000Tiere 100 Erkrankt 90 Test P 900Gesund 10 Test N 180 Test P Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 720 Test N Binomialverteilung: Definition Die Zufallsvariable der Summe aus n unabhängigen n 0-1-Variablen X X i , heißt binomial-verteilt mit i 1 Parametern n und P, kurz X~Bin(n, P) Es gilt n m P( X m) P (1 P) n m m Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Schwankungsbereiche der Normalverteilung Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Der Median Definition: Wert für den gilt 50% der Daten sind kleiner oder gleich med 50% der Daten sind größer oder gleich med med = n 1 (k ) x falls k ganze Zahl 2 1 ( x ( k ) x ( h 1) ) falls k n ganze Zahl 2 2 x (1) x ( n ) sind geordnete Werte Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Das Quantil (Perzentil) Definition: Wert für den gilt Anteil p der Daten sind kleiner oder gleich xp Anteil 1-p der Daten sind größer oder gleich xp (k ) x falls np keine ganze Zahl und k kleinsteZahl np 1 (k ) ( h 1) ( x x ) falls k np ganze Zahl 2 Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Das Histogramm Darstellung der relativen Häufigkeiten durch Flächen (Prinzip der Flächentreue) Vorgehen: 1. Aufteilung in Klassen (falls die Daten noch nicht gruppiert sind) 2. Bestimmung der relative Häufigkeiten 3. Bestimmung der Höhen hi , so dass gilt: bi hi fi wobei bi: Breite der Klasse i. Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Boxplot Beispiel: Hämatokrit bei Mastenten Maximum 75%-Quantil Median 25%-Quantil Ausreißer Extremwerte Minimum Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Boxplot 1. 2. 3. x0.25 = Anfang der Schachtel (Box) x0.75 = Ende der Schachtel d = Länge der Schachtel Der Median wird durch den Strich in der Box markiert Zwei Linien („whiskers“) außerhalb der Box gehen bis zu xmin und xmax. Modifizierter Boxplot Die Linien außerhalb der Schachtel werden nur bis zu xmin bzw. xmax gezogen, falls xmin und xmax innerhalb des Bereichs [zu,zo] der Zäune liegen. zu = x0.25 +1.5d ,zo x= x0.75 +1.5d Ansonsten gehen die Linien nur bis zum kleinsten bzw. größten Wert innerhalb der Zäune, die außerhalb liegenden Werte werden individuell eingezeichnet. Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Der Mittelwert (arithmetisches Mittel) 1 n x xi n i 1 • bekanntestes Lagemaß • instabil gegen extreme Werte • geeignet für Intervallskalierte Daten Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007 Standardabweichung 2 Definition: S S 1 2 ( x x ) i n 1 S2 • „Mittlere Abweichung vom Mittelwert“ • Manchmal auch 1/n statt 1/(n-1) • Intervallskala Voraussetzung Vorlesung Biometrie für Studierende der Veterinärmedizin 8.2.2007