Timischl/Womastek: Angewandte Statistik Übungsblatt 2 Beispiel 1 Ein einfacher Prüfplan besteht darin, dass 55 Einheiten aus einem Los zufällig ausgewählt und auf Fehlerhaftigkeit überprüft werden. Das Los wird zurückgewiesen, wenn eine Einheit oder mehrere Einheiten fehlerhaft sind. Wie groß ist die Wahrscheinlichkeit für die Annahme des Loses, wenn der Anteil p von fehlerhaften Einheiten (Ausschussanteil) gleich po=0,5% ist? (Für die Rechnung nehme man an, dass der Umfang des Prüfloses sehr groß ist, so dass sich der Ausschussanteil während der Entnahme der Prüfstichprobe nicht ändert.) Gesucht: P(Los fehlerfrei)= P(X=0) Aus der Angabe wissen wir: Die Stichprobengröße n = 55, der Anteil p (fehlerhaft) = 0.005. Es wird angenommen, dass der Umfang des Prüfloses sehr groß ist und sich der Ausschussanteil während der Entnahme nicht ändert, es handelt sich also um ein Experiment, bei dem der Auswahlvorgang „mit Zurücklegen“ modelliert wird. Die Zufallsvariable X (= Anzahl der fehlerhaften Einheiten im Los) ist also binomialverteilt mit n=55 und p=0.005. Zur Erinnerung: X ist eine binomialverteilte Zufallsvariable mit Parametern n und p, wenn ein n-stufiges Bernoulli-Experiment vorliegt, das aus n unabhängigen Wiederholungen von einfachen Bernoulli-Experimenten besteht. Jedes dieser Experimente hat zwei Ausgänge: E und Ec. E tritt mit einer Wahrscheinlichkeit p ein und Ec mit einer Wahrscheinlichkeit q=1-p. Die Zufallsvariable X mit den Realisationen k=0, 1,…, n gibt die Anzahl der Wiederholungen mit dem Ausgang E an. Die Wahrscheinlichkeit dafür, dass k Wiederholungen mit dem Ergebnis E auftreten, ist: Lösungsweg: Wir setzen in die Formel für die Binomialverteilung ein: Antwort: Die Wahrscheinlichkeit, dass das Los angenommen wird, beträgt 5.95% Uebung2_10 1 Timischl/Womastek: Angewandte Statistik Beispiel 2 Bei einem Patienten stehen drei Diagnosen A, B oder C zur Wahl. Es wird ein diagnostischer Test angewendet, der bei Vorliegen von A mit 90%iger Wahrscheinlichkeit positiv ausfällt, bei Vorliegen von B mit 20%iger Wahrscheinlichkeit und bei Vorliegen von C mit 10%iger Wahrscheinlichkeit. Das Testresultat für den Patienten ist positiv. Wie groß ist die Wahrscheinlichkeit, dass A vorliegt, wenn alle drei Krankheiten als gleichwahrscheinlich angesehen werden? Aus der Angabe wissen wir: P(Diagnose A) = P(Diagnose B) = P(Diagnose C) = 1/3 P(Test positiv| Diagnose A) = 0,9; P(Test positiv| Diagnose B) = 0,2; P(Test positiv| Diagnose C) = 0,1 Gesucht: P(Diagnose A| Test positiv) Lösungsweg: Wir setzen in die Formel für bedingte Wahrscheinlichkeiten ein: Aus der Angabe wissen wir bereits: P(Test positiv| Diagnose A) = 0.9 und P(Diagnose A) = 1/3. Um in die Formel einsetzen zu können, muss also nur noch P(Test positiv) berechnet werden. Dazu wenden wir den Satz von der totalen Wahrscheinlichkeit an. Zur Erinnerung: Wir gehen von einem Zufallsexperiment mit Ergebnismenge Ω aus. Ist B ein beliebiges Ereignis mit P(B)>0 und sind A1, …, An eine (endliche) Folge von Ereignissen mit den Eigenschaften 1) 2) (Die Ereignisse A1, …, An sind paarweise disjunkt), (Die Ereignisse A1, …, An bilden die Ergebnismenge Ω), 3) P(Ai ) > 0 für i= 1, …, n. Dann gilt der Satz von der totalen Wahrscheinlichkeit: P(B) = P(B|A1) P(A1) + P(B|A2) P(A2) + … + P(B|An) P(An) P(Test positiv) wird also folgendermaßen berechnet: Uebung2_10 2 Timischl/Womastek: Angewandte Statistik P(Test positiv) = P(Test positiv| Diagnose A) P(Diagnose A) + P(Test positiv| Diagnose B) P(Diagnose B) + P(Test positiv| Diagnose C) P(Diagnose C) = 0,9 (1/3) + 0,2 (1/3) + 0,1 (1/3) = 0,4 Somit ist P(Diagnose A| Test positiv) = 0.9 (1/3)/0.4 = 0.75 Antwort: Die Wahrscheinlichkeit, dass der Patient an Krankheit A leidet, wenn ein positives Testergebnis vorliegt, beträgt also 75%. Lösung mit Excel: Erstellen eines Entscheidungsbaumes Beispiel 3 Bei einem Test werden 3 Aufgaben derart gestellt, dass es bei jeder Aufgabe 4 Antwortmöglichkeiten gibt, von denen genau eine die richtige ist. Wie groß ist die Wahrscheinlichkeit, dass man mehr als die Hälfte der Aufgaben richtig löst, wenn die Lösungsauswahl aufs Geratewohl erfolgt, d.h., jeder Lösungsvorschlag mit der Wahrscheinlichkeit 1/4 gewählt wird? Aus der Angabe wissen wir: X ist eine binomialverteilte Zufallsvariable mit n=3 und p=0.25, d.h. X ~ B3,0.25 Gesucht: P(X ≥ 2) = P(X=2) + P(X=3) = 1 – [P(X=0) + P(X=1)] Uebung2_10 3 Timischl/Womastek: Angewandte Statistik Lösungsweg: Wir setzen in die Formel für Binomialverteilung ein: P(X ≥ 2)= 1 – P(X <2) = 1 – [0.422 + 0.422) = 0.157 Kontrolle: P(X ≥ 2) = P(X=2) + P(X=3) = 0.141 + 0.016 = 0.157 Antwort: Die Wahrscheinlichkeit, dass mehr als die Hälfte der Aufgaben richtig gelöst wird, beträgt 15.7%. Lösung mit Excel: Lösung mit R: > n <- 3 > p <- 0.25 > Pgesucht <- 1-pbinom(1,3,0.25) > print(Pgesucht) [1] 0.15625 Uebung2_10 4