Vortrag

Werbung
Bayessche Statistik-Denken in
Wahrscheinlichkeit
Habe ich Aids?
●
Test fällt bei 98% der Aids kranken positiv aus.
●
P(positiv|Aids)=0.98
●
Test fällt bei 97% der gesunden negativ aus.
●
P(negativ|kein Aids)=0.97
Ereignis
N
Test
positiv
Test
negativ
Aids
100
98
2
Gesund
100
3
97
N von
Test
Ereignis 100000
positiv
Menschen
Aids
100
98
Test
negativ
Gesund
96900
99900
3000
2
P = 98/3098 = 1/30 = 3.3%
●
Gesucht:
–
●
Gegeben:
–
–
–
●
P(Aids|positiv)
P(positiv|Aids)
P(negativ|kein Aids)
P(Aids)
Formel?
●
P(A) – Wahrscheinlichkeit für A
●
P(A Λ B) – Wahrscheinlichkeit für A und B
●
●
P(A|B) – Wahrscheinlichkeit für A, wenn B
bereits eingetreten ist
P(A Λ B) = P(B)*P(A|B) = P(A)*P(B|A)
●
P(A)=1
●
P(B) = P(B|A)
●
●
Ω
P(Ω)=1
P(B) = P(B|A)*P(A) =
P(B|Ω)
Ω
P(A Λ B)
=
P(B|A)*P(A) = P(A|B)*P(B)
Formel von Bayes
Likelihood
Posterior
P(A|B) =
P(B|A)*P(A)
P(B)
Evidenz
Prior
Evidenz P(B)?
●
Beispiel: Münzwurf
1/2
●
P(Kopf) ?
1
}
Verschiedene
Hypothesen
●
A: Münze ist manipuliert → P(Kopf) = 1
●
B: Münze ist fair → P(Kopf) = ½
●
P(3xKopf) = P(3xKopf|A)*P(A) + P(3xKopf|B)*P(B)
= 1 * 0.1 + (1/2)^3 * 0.9 = 0.21
●
P(3xKopf|A)*P(A)
P(A|3xKopf) =
= 0.1/0.21 = 47%
P(3xKopf)
P(B) = Σ P(BΛ Ai) = Σ P(Ai)*P(B|Ai)
P(A|B) =
P(B|A)*P(A)
∑ P(Ai)*P(B|Ai)
Kontinuierliche Wahrscheinlichkeitsdichten:
P(θ|x) =
f(x|θ)*P(θ)
∫P(θ)*f(x|θ)dθ
●
Frequentist
●
Bayesian
●
Frequentist
Messunsicherheit
●
Bayesian
Parameterunsicherheit
●
Frequentist:
In wiederholten Datensätzen wird der wahre Wert
mit einer Wahrscheinlichkeit von 68% innerhalb der
Messunsicherheit liegen.
–
●
Bayesian:
–
Für den vorliegenden Datensatz ist die
Wahrscheinlichkeit 68%, dass der wahre Wert
innerhalb der Unsicherheit liegt.
●
Frequentismus
●
Relative Häufigkeit
●
Anwendbar auf wiederholbare Ereignisse
●
Hypothese wird akzeptiert, wenn p(x|H)>α
●
●
●
●
●
Bayesian
Erlaubt es die Wahrscheinlichkeit von
Ereignissen/Hypothesen anzugeben
Man benötigt einen Prior (Vorwissen)
Wie viel Geld wäre man bereit auf die
Richtigkeit einer Hypothese zu wetten?
Kritik:
–
Prior ist unwissenschaftlich
Beispiel: Messung der Lebensdauer
eines Teilchens
Messwerte:
Prior:
Was ist besser?
●
●
●
Richtig angewandt führen beide Methoden zu
richtigen Ergebnissen
Je nach Problem kann die eine, oder andere
Vorgehensweise Vorteile haben.
Die Bestmögliche Datenauswertung erfordert
daher immer auch Kompromisse
P-Wert, Was bedeutet statistisch
Signifikant?
●
Medizinischer Test mit 6 Probanden
●
3 erhalten neues Medikament X
●
3 erhalten einen Placebo
●
●
●
Ergebnis:
Alle mit neuem Medikament behandelten
Personen leben länger
Wie wahrscheinlich ist dieses Ergebnis?
●
●
●
Ergebnis:
Alle mit neuem Medikament behandelten
Personen leben länger
Wie wahrscheinlich ist dieses Ergebnis?
●
Kombinatorisches Problem
●
PPPNNN, PPNNNP, PPNNPN
●
6!
Anzahl Möglichkeiten: N=
3!3!
=20
●
Kombinatorisches Problem
●
PPPNNN, PPNNNP, PPNNPN
●
6!
Anzahl Möglichkeiten: N=
3!3!
=20
●
Es gibt genau eine Realisierung mit PPPNNN
●
P = 1/20 = 5%
●
Statistisch signifikantes Ergebnis
p-Wert
●
●
Wie wahrscheinlich ist
das Ergebnis, wenn
Medikament X
unwirksam ist?
Was man wissen will:
●
●
P(Daten| Unwirksam)
Wie wahrscheinlich ist
es, dass Medikament X
wirkt, bzw. nicht wirkt.
P(Wirksam|Daten)
Bzw.
●
P(Unwirksam|Daten)
p-Wert
P(U|D) =
P(D|U)*P(U)
P(D|U)*P(U)+P(D|W)*P(W)
P(B|A)*P(A)
P(B)
P(Unwirksam)?
Naturheilkunde oder Pharma?
●
NHK: testet irgendwelche Pflanzen auf gut
Glück
●
Pharma: Gezielte Erforschung von Wirkstoffen
●
P(Wirksam)??
Nochmal zum Arzt
N von
Test
Ereignis
3000
positiv
Menschen
Test
negativ
Aids
100
98
2
Gesund
2990
90
2900
P = 98/188 = 50 %
Folgerung
●
Prior sollte so wenig Information wie möglich
enthalten, aber so viel wie nötig
Nicht informativer Prior
●
Keine Information über θ
Gleichverteilung als Prior?
Keine Information über 1/θ
1/θ ebenfalls Gleichverteilt?
z.B. Messung der Frequenz und Periodendauer
∫P(θ)dθ = 1
Substitution: Φ = 1/θ, dθ = θ^2dΦ = dΦ/Φ^2
∫P(Φ) dΦ/Φ^2 = ∫Ṕ(Φ)dΦ
●
●
●
Ein Prior sollte einen möglichst geringen Effekt
auf die Daten haben
Ein Prior sollte Symmetrien des Problems
ausnutzen
Im Zweifel: mehrere Priors durchprobieren
Lokalisationsparameter
●
f(x-θ) invariant unter Y=X+a
z.B. Mittelwert
●
P(θ)=P(θ-a) → P(θ)=1
Skalen Parameter
1
●
σ
x
f( σ ) invariant unter Y=c*X
z.B. Standardabweichung
●
P(σ) =
1
c
σ
P( c ) → P(σ) = 1/σ
Konjugierter Prior
=
+
Prior
Likelihood
Posterior
Herunterladen