Lösungen zum Übungs-Blatt 7 Wahrscheinlichkeitsrechnung BMT Biostatistik Prof. Dr. B. Grabowski ----------------------------------------------------------------------------------------------Satz von Bayes und totale Wahrscheinlichkeit Formel der totalen Wahrscheinlichkeit : P( B) = P( B | A) P( A) + P( B | A ) P( A ) P( B | A) P ( A) Formel von Bayes: P( A / B) = P( B) Zu Aufgabe 1) Ein bestimmtes Bauteil wird auf seine Zuverlässigkeit untersucht. Die technische Prüfung erfolgt dabei so: Das Bauteil Gerät wird als defekt eingestuft, wenn eine Lampe bei Eingabe eines bestimmten Stromsignals aufleuchtet (Ereignis B). In jedem anderen Fall wird das Bauteil als O.K. eingestuft. Es soll die Es soll die Zuverlässigkeit dieses Testverfahrens, d.h. die Trennschärfe des Verfahrens, untersucht werden. Sei A also das Ereignis „das Bauteil ist defekt“ und B das Ereignis: „das Bauteil wird als defekt eingestuft “, bzw. die Lampe brennt. Aus vorhergehenden Untersuchungen sei bekannt, dass 2 % aller Bauteile defekt sind. Es sei weiterhin bekannt, dass bei 90% aller Bauteile, die defekt sind, die Lampe tatsächlich aufleuchtet, aber leider auch bei 1% aller Bauteile, die O.K. sind. a) Wie groß ist die Wahrscheinlichkeit dafür, dass ein Bauteil, welches als defekt eingestuft wurde auch wirklich defekt ist? b) Wie groß ist die Wahrscheinlichkeit dafür, dass ein nicht defekt eingestuftes Bauteil O.K. ist? c) Sind die Ereignisse A (Bauteil ist defekt) und B („Lampe leuchtet“) stochastisch unabhängig voneinander? (Zwei Ereignisse A und B heißen stochastisch unabhängig, falls gilt P(A/B)=P(A)). Lösung: Gegeben: Ereignisse: B =“Wird als defekt eingestuft“ A = „Bauteil ist defekt“ Wahrscheinlichkeiten: P(A) = 0,02, P(B/A) = 0,9, P(B/ A ) = 0,01 Zu a) Ges: P(A/B) P( A / B) = P( B / A) P( A) P( B / Á ) P( A) = totale P( B) P( B / A) P( A) + P( B / A ) P( A ) Wahrscheinlichkeit = 0,9 ⋅ 0,02 0,018 180 = = = 0,647 = 64,7% 0,9 ⋅ 0,02 + 0,01(1 − 0,02) 0,018 + 0,0098 278 Satz von Bayes D.h. 64,7% aller Bauteile, die als defekt eingestuft wurden sind auch wirklich defekt. 1 Zu b) P( A / B ) P( B / A ) P( A ) P( B / A ) P( A ) = Satz von Bayes totale P( B ) P( B / A ) P( A ) + P( B / A) P( A) Wahrscheinlichkeit = = (1 − 0,01) ⋅ (1 − 0,02) 0,9702 9702 = = = 0,998 = 99,8% (1 − 0,01) ⋅ (1 − 0,02) + (1 − 0,9)0,02 0,9702 + 0,002 9722 D.h. 99,8% aller Bauteile, die als OK eingestuft wurden sind auch wirklich OK. Damit ist das Konsumentenrisiko sehr gering. (Das ist gut!) Zu c) Es ist P(A/B)=0,647 ≠P(A) = 0,02. Damit sind A und B nicht stochastisch unabhängig voneinander. Zu Aufgabe 2) Ein praktisches Beispiel für die Anwendung des Satzes von Bayes und die Besonderheiten bei der Auswertung der Ergebnisse ist der sogenannte Elisa-Test auf HIV. Der Elisa-Test hat zwei Kennzeichen: 1. Die Sensitivität; das ist die Wahrscheinlichkeit, mit der der Test korrekterweise ein positives Ergebnis liefert (Aids anzeigt), sofern die Person infiziert ist. Diese Wahrscheinlichkeit beträgt 99.9%. 2. Die Spezifität, das ist die Wahrscheinlichkeit, dass der Test ebenfalls korrekterweise kein positives Ergebnis liefert, wenn die Person nicht infiziert ist. Beim Elisa-Test beträgt sie 99.5%. Weiterhin sei die Prävalenz, das ist die Häufigkeit der HIV-Infektion in einer bestimmten Bevölkerungsgruppe gleich 0,1% . a) Berechnen Sie die Wahrscheinlichkeit dafür, dass eine Person tatsächlich infiziert ist, wenn sie ein positives Testresultat hat. b) Untersuchen Sie, wie sich beim Elisa-Test die Wahrscheinlichkeit für ein falsch positives Resultat (d.h. eine als HIV-infiziert diagnostizierte Person ist gesund) ändert, wenn Sie die Prävalenz auf 0.01 und 0.02 erhöhen (und die Eigenschaften des Tests, also Sensitivität und Spezifität, sonst unverändert lassen). Was stellen Sie fest? c) Berechnen Sie für eine Prävalenz von 0,1% die Wahrscheinlichkeit dafür, dass eine Person tatsächlich nicht infiziert ist, wenn sie ein negatives Testresultat hat. Lösung: Um das formal zu fassen, übersetzen wir die Angaben in formale Schreibweisen. Gegeben sind zwei Ereignisse: 2 Für diese Ereignisse sind folgende Wahrscheinlichkeiten bekannt: P(A) = 0,001 Prävalenz P(B/A) = 0,999 P( B / A ) = 0,995 Gesucht: Zu a) P(A/B), Zu b) P( A / B ) , Zu c) P( A / B) für verschiedene P(A) (= 0,01 und 0,02) Lösung zu a) Damit ergibt sich für die Wahrscheinlichkeit für das Vorliegen einer Infektion bei positivem Testergebnis: D.h., es kommt eine relativ geringe Wahrscheinlichkeit zustande, dass jemand tatsächlich infiziert ist, wenn er ein positives Testresultat hat. Andersherum: Mit großer Wahrscheinlichkeit erhält er ein falsch positives Ergebnis P( A / B) = 1 − P( A / B) = 1 − 0,167 = 0,833 wird also zu Unrecht beunruhigt. Zu b) Wir erhöhen die Prävalenz auf 0.01 , also P(A) = 0,01 bzw. 0,02 und lassen Sensitivität und Spezifität unberücksichtigt. Dann ändert sich die Wahrscheinlichkeit für das Vorliegen einer Infektion bei positivem Testergebnis wie folgt: Für P(A) = 0,01 3 Für P(A) = 0,02 Wir sehen, dass die Wahrscheinlichkeit für ein falsch positives Ergebnis stark von der Prävalenz (Häufigkeit des Auftretens der HIV-Krankheit in der Bevölkerung) ist. Je kleiner diese Häufigkeit ist, desto größer ist die Wahrscheinlichkeit eines falsch positiven Ergebnisses. Ist P(A) gering, P(A) = 0,1%, so ist bei einem positiven Testergebnis die Wahrscheinlichkeit nur ca. 16,7%, dass tatsächlich eine Infektion vorliegt. Für P(A) = 1% erhöht sich diese Wahrscheinlichkeit bereits auf ca. 67 % und für P(A) = 80% Zu c) P( A | B ) = P( B | A ) P( A ) 0.995 ⋅ 0,999 0,994005 = = ≈1 P( B ) 1 − (0,999 ⋅ 0,001 + 0,005 ⋅ 0,999) 0,994006 D.h., mit nahezu 100 % Sicherheit ist eine Person tatsächlich gesund, wenn sie ein negatives Testergebnis hat. (Das Patientenrisiko ist gleich 0). Satz von Bayes und totale Wahrscheinlichkeit für mehr als 2 Ereignisse Seien A1,...,An n Ereignisse aus der Grundmenge Ω mit folgenden Eigenschaften: 1. Ai ∩ A j = Φ für i≠ j (keine 2 Ereignisse treten gleichzeitig ein) 2. A1 ∪ A2 ∪ ... ∪ An = Ω (Ai bilden eine vollständige Zerlegung von Ω) Dann gilt: n Formel der totalen Wahrscheinlichkeit : P ( B ) = ∑ P ( B / Ai ) P ( Ai ) i =1 P ( B | Ai ) P ( Ai ) Formel von Bayes: P ( Ai / B ) = P( B) Zu Aufgabe 3) Im Einzugsbereich eines Arztes befinden sich folgende Bevölkerungsgruppen: 30 % im Alter von 18 bis 50 Jahre (A1) , 20% unter 18 Jahre (A2) und 50% über 50 Jahren (A3). Aus statistischen Erhebungen ist bekannt, dass sich die Patienten, die den Arzt aufsuchen, sich pro Monat wie folgt auf die Altersgruppen verteilen: 1% der Patienten stammen aus A1, 2% sind unter 18 jährig und 0,5 % der über 50 jährig. 4 a) Wie viel % aller Personen suchen den Arzt insgesamt pro Monat auf? b) Mit welcher Wahrscheinlichkeit gehört ein Patient zur 1. Gruppe der zwischen 18 und 50 jährigen? c) Sind die beiden Ereignisse: ‚Person ist krank (sucht Arzt auf)’ und ‚Person gehört zu den zwischen 18 und 50 jährigen’ stochastisch unabhängig voneinander ? (Begründung!) Lösung: Gegeben: Ereignisse: Ai =“Person gehoert zur Alterskalsse Ai“, i=1,2,3. K = „Person ist Patient (Krank, bzw. geht zum Arzt)“ Wahrscheinlichkeiten: P(A1) = 0,3, P(A2)=0,2, P(A3)=0,5, P(K/A1)=0,01, P(K/A2)=0,02, P(K/A3)=0,005. Wir lösen die Aufgaben mit Hilfe der Formel der totalen Wahrscheinlichkeit und dem Satz von Bayes. Zu a) Gesucht: P(K) Wir berechnen P(K) gemäß der Formel der totalen Wahrscheinlichkeit: P(K) =P(K/A1)P(A1) + P(K/A2)P(A2) + P(K/A3)P(A3)= 0,01*0,3 + 0,02*0,2 + 0,005*0,5 = 0,0095 Zu b) Gesucht: P(A1/K) Wir berechnen P(A1/´K) gemäß dem Satz von Bayes: P ( A1 / K ) = P ( K / A1) P ( A1) 0,003 30 = = = 0,316 P( K ) 0,0095 95 Zu c) 30 = 0,316 ≠ P ( A1) = 0,3 95 d.h. es gilt nicht P(A1/K)=P(A1). Demzufolge sind die beiden Ereignisse A1 und K nicht stochastisch unabhängig voneinander! P ( A1 / K ) = Zu Aufgabe 4) Eine Firma bezieht jeweils 30 %, 20% bzw. 50% von benötigten Teilen von 3 verschiedenen Zulieferern Z1, Z2 bzw. Z3. Über die Ausschussrate (Anteil der defekten Teile unter den gelieferten) sei bekannt, dass sie bei Z1 1%, bei Z2 und Z3 0,5 % beträgt. d) Wie viel % Ausschuss (Ereignis A) erhält die Firma insgesamt? e) Mit welcher Wahrscheinlichkeit stammt ein defektes Teil von Z1? f) Sind die beiden Ereignisse: ‚Teil ist Ausschuss’ und ‚Teil stammt von Zulieferer Z1’ stochastisch unabhängig voneinander ? (Begründung!) Lösung: Wir definieren folgende Ereignisse: Zi = „Teil kommt von Zulieferer Zi“ A = „Teil ist Ausschuss“ 5 Dann sind folgende Wahrscheinlichkeiten gegeben: P(A/Z1) = 0,01 P(Z1)=0,3 P(A/Z2)= 0,005 P(Z2)=0,2 P(A/Z3)=0,005 P(Z3)=0,5 Zu a) P(A) = P(A/Z1)P(Z1)+P(A/Z2)P(Z2)+P(A/Z3)P(Z3) = 0,0065 Zu b) P(Z1/A) = P(A/Z1)P(Z1) / P(A) = 0,003/0,0065 = 0,6415 Zu c) P(A) = 0,0065 ≠ P(A/Z1) = 0,01 Demzufolge sind A und Z1 nicht stochastisch unabhängig (A hängt von Z1 ab)! Bedingte Wahrscheinlichkeit und stochastische Unabhängigkeit Zu Aufgabe 5) Sei G ein System, welches aus 2 hintereinandergeschalteten Baueinheiten E1 und E2 besteht. Das System G arbeitet nur dann fehlerfrei, wenn beide Baueinheiten fehlerfrei arbeiten. Berechnen Sie für die Szenarien a) und b) die Wahrscheinlichkeit dafür, dass das Gesamtsystem G fehlerfrei arbeitet! a) Die Fehlerrate von E2 wird durch die von E1 beeinflusst. Die Wahrscheinlichkeit, dass E2 fehlerfrei arbeitet unter der Vorrausetzung, dass auch E1 fehlerfrei arbeitet, ist 0,90. Die Wahrscheinlichkeit, dass E1 fehlerfrei arbeitet sei 0,85. b) Die Fehlerrate von E2 wird nicht durch die von E1 beeinflusst, d.h., E1 und E2 verhalten sich stochastisch unabhängig!. Die Wahrscheinlichkeit, dass E1 fehlerhaft arbeitet sei 20 % und die Wahrscheinlichkeit dafür, dass E2 fehlerhaft arbeitet sei 10 %. Lösung: Sei G=“Gerät arbeitet fehlerfrei“, E1=“E1 arbeitet fehlerfrei“, E2=“E2 arbeitet fehlerfrei“. Zu a) P (G ) = P ( E1 ∩ E 2) = P ( E 2 / E1) P ( E1) = 0,9 ⋅ 0,85 = 0,765 Zu b) P (G ) = P ( E1 ∩ E 2) = P ( E 2) P ( E1) = (1 − 0,1) ⋅ (1 − 0,2) = 0,72 Zu Aufgabe 6) Si = „Beobachter i übersieht das Signal) Gesuchte Wahrscheinlichkeit: N P(S1∩…∩SN )= ∩ P( Si) = p N i =1 6 Zuverlässigkeitstheorie mit stochastischer Unabhängigkeit Zu Aufgabe 7) G sei ein Gerät mit n parallelen Reihen, die jeweils 2 Bauelemente in Reihe geschaltet enthalten. Das Gerät fällt aus, falls alle Reihen ausfallen. Eine Reihe fällt aus, falls eines der beiden Bauelemente der Reihe ausfällt. Die Bauelemente Ei j fallen stochastisch unabhängig voneinander mit der gleichen Wahrscheinlichkeit P(Ei j = not OK) = 0,1 für alle i = 1,...,n; j = 1, 2, aus. Wieviele Reihen muß das Gerät haben, damit die Ausfallwahrscheinlichkeit p des Gerätes 0,1 % nicht überschreitet, d.h. damit gilt p = P(G = not OK) ≤ 0,001 ? Lösung: Es ist: p = P(G = not OK ) = P(Re ihe1 = notOK ∩ Re ihe2 = notOK ∩ ⋯ ∩ Re ihen = notOK ) n = unabhängig keit n ∏ P(Re ihe i =1 i = notOK ) = ∏ (1 − P (Re ihe i = OK )) i =1 n = ∏ (1 − P( Ei1 = OK ∩ Ei 2 = OK )) i =1 n = Unabhängigkeit n ∏ (1 − P( Ei1 = OK ) P( Ei 2 = OK )) = ∏ (1 − (1 − 0,1) 2 ) i =1 n = (1 − 0,81) = 0,19 i =1 n Wir lösen jetzt die Ungleichung P (G = notOK ) = 0,19 n ≤ 0,001 nach n auf! Es ist: 0,19 n ≤ 0,001 ⇔ n ln(0,19) ≤ ln(0,001) ⇔ n ≥ ln(0,001) = 4,159 ln(0,19) D.h. dass Gerät muss mindestens n=5 Reihen besitzen! 7