Grundlagen der Statistik nach Bayes

Werbung
1
13. Grundlagen der Statistik nach Bayes
Beispiel: Der Grad der Bösartigkeit (Malignität) eines Tumors wird
gewöhnlich in zwei Stufen bestimmt:
1. Stufe : „Schnelltest“: während der Operation wird eine Gewebeprobe
entnommen und analysiert – das Ergebnis ist gewöhnlich mit einem
Fehler behaftet.
2. Stufe: Ausführliche mehrere Wochen dauernde Untersuchung mit
„100prozentigem“ Ergebnis.
Problem: Bestimmung der Wahrscheinlichkeit, daß der Schnelltest schon
das richtige Ergebnis (d.h., das gleiche Ergebnis wie bei 2. Stufe) liefert.
Zahlenbeispiel (BSE-Schnelltest):
Wir betrachten die folgenden Ereignisse:
A: „Schnelltest ist positiv“ (zeigt BSE)
B: „die Kuh hat BSE“ (2.Stufe zeigt das)
Die „Sicherheit“ des Schnelltest betrage 99,9 %
Frage: Mit welcher Wahrscheinlichkeit kann aus A auf B geschlossen
werden ?
Wir benötigen folgendes „Handwerkszeug“
Bedingte Wahrscheinlichkeit: Seien A, B   mit P(B)>0.
P( A / B) :=
P ( A B )
P( B)
heißt bedingte Wahrscheinlichkeit von A unter der Bedingung B.
A und B heißen unabhängig, wenn gilt:
P( A  B) = P( A) P( B)
Die Formel der totalen Wahrscheinlichkeit:
Sei ( Bk ) nk 1 eine Folge paarweise disjunkter Ereignissen mit  Bk  
k
Dann gilt für jedes Ereignis A
 P( A / Bk ) P( Bk )  P( A)
k
2
Die Formel von Bayes
Sei wieder ( Bk ) nk 1 eine Folge paarweise disjunkter Ereignissen mit
 Bk   . Weiter sei P(A)>0. Dann gilt für alle k=1,..,n
k
P( Bk / A) 
P( A / Bk ) P( Bk )
 P( A / B j ) P( B j )
j
Anwendung auf Beispiel BSE-Schnelltest
A: „Schnelltest ist positiv“ (zeigt BSE)
B: „die Kuh hat BSE“ (2.Stufe zeigt das)
Betrachten den Fall n = 2 mit
B2  B c = „Kuh hat nicht BSE“
B1 : B
Testsicherheit 99,9 % bedeutet dann
P(A/B)=P( Ac / B c ) =99,9%
P( Ac / B ) P( A / B c ) =0,1 %
Das Vorkommen von BSE in Deutschland ist sehr selten. Wir nehmen an,
daß ein zufällig ausgewählte „deutsche“ Kuh mit Wahrscheinlichkeit 10  6
BSE hat, d.h., wir haben
P( B1 ) = P(B)= 10  6 = 0,0001 %
P( B2 ) = P ( B c ) = 1- 10  6
In die obige Formel eingesetzt ergibt:
P( B / A)  0,1 %
Diskussion:
- Diagnose seltener Krankheiten
- Fragwürdigkeit von Indizienprozessen
Herunterladen