Bayessche Statistik-Denken in Wahrscheinlichkeit Habe ich Aids? ● Test fällt bei 98% der Aids kranken positiv aus. ● P(positiv|Aids)=0.98 ● Test fällt bei 97% der gesunden negativ aus. ● P(negativ|kein Aids)=0.97 Ereignis N Test positiv Test negativ Aids 100 98 2 Gesund 100 3 97 N von Test Ereignis 100000 positiv Menschen Aids 100 98 Test negativ Gesund 96900 99900 3000 2 P = 98/3098 = 1/30 = 3.3% ● Gesucht: – ● Gegeben: – – – ● P(Aids|positiv) P(positiv|Aids) P(negativ|kein Aids) P(Aids) Formel? ● P(A) – Wahrscheinlichkeit für A ● P(A Λ B) – Wahrscheinlichkeit für A und B ● ● P(A|B) – Wahrscheinlichkeit für A, wenn B bereits eingetreten ist P(A Λ B) = P(B)*P(A|B) = P(A)*P(B|A) ● P(A)=1 ● P(B) = P(B|A) ● ● Ω P(Ω)=1 P(B) = P(B|A)*P(A) = P(B|Ω) Ω P(A Λ B) = P(B|A)*P(A) = P(A|B)*P(B) Formel von Bayes Likelihood Posterior P(A|B) = P(B|A)*P(A) P(B) Evidenz Prior Evidenz P(B)? ● Beispiel: Münzwurf 1/2 ● P(Kopf) ? 1 } Verschiedene Hypothesen ● A: Münze ist manipuliert → P(Kopf) = 1 ● B: Münze ist fair → P(Kopf) = ½ ● P(3xKopf) = P(3xKopf|A)*P(A) + P(3xKopf|B)*P(B) = 1 * 0.1 + (1/2)^3 * 0.9 = 0.21 ● P(3xKopf|A)*P(A) P(A|3xKopf) = = 0.1/0.21 = 47% P(3xKopf) P(B) = Σ P(BΛ Ai) = Σ P(Ai)*P(B|Ai) P(A|B) = P(B|A)*P(A) ∑ P(Ai)*P(B|Ai) Kontinuierliche Wahrscheinlichkeitsdichten: P(θ|x) = f(x|θ)*P(θ) ∫P(θ)*f(x|θ)dθ ● Frequentist ● Bayesian ● Frequentist Messunsicherheit ● Bayesian Parameterunsicherheit ● Frequentist: In wiederholten Datensätzen wird der wahre Wert mit einer Wahrscheinlichkeit von 68% innerhalb der Messunsicherheit liegen. – ● Bayesian: – Für den vorliegenden Datensatz ist die Wahrscheinlichkeit 68%, dass der wahre Wert innerhalb der Unsicherheit liegt. ● Frequentismus ● Relative Häufigkeit ● Anwendbar auf wiederholbare Ereignisse ● Hypothese wird akzeptiert, wenn p(x|H)>α ● ● ● ● ● Bayesian Erlaubt es die Wahrscheinlichkeit von Ereignissen/Hypothesen anzugeben Man benötigt einen Prior (Vorwissen) Wie viel Geld wäre man bereit auf die Richtigkeit einer Hypothese zu wetten? Kritik: – Prior ist unwissenschaftlich Beispiel: Messung der Lebensdauer eines Teilchens Messwerte: Prior: Was ist besser? ● ● ● Richtig angewandt führen beide Methoden zu richtigen Ergebnissen Je nach Problem kann die eine, oder andere Vorgehensweise Vorteile haben. Die Bestmögliche Datenauswertung erfordert daher immer auch Kompromisse P-Wert, Was bedeutet statistisch Signifikant? ● Medizinischer Test mit 6 Probanden ● 3 erhalten neues Medikament X ● 3 erhalten einen Placebo ● ● ● Ergebnis: Alle mit neuem Medikament behandelten Personen leben länger Wie wahrscheinlich ist dieses Ergebnis? ● ● ● Ergebnis: Alle mit neuem Medikament behandelten Personen leben länger Wie wahrscheinlich ist dieses Ergebnis? ● Kombinatorisches Problem ● PPPNNN, PPNNNP, PPNNPN ● 6! Anzahl Möglichkeiten: N= 3!3! =20 ● Kombinatorisches Problem ● PPPNNN, PPNNNP, PPNNPN ● 6! Anzahl Möglichkeiten: N= 3!3! =20 ● Es gibt genau eine Realisierung mit PPPNNN ● P = 1/20 = 5% ● Statistisch signifikantes Ergebnis p-Wert ● ● Wie wahrscheinlich ist das Ergebnis, wenn Medikament X unwirksam ist? Was man wissen will: ● ● P(Daten| Unwirksam) Wie wahrscheinlich ist es, dass Medikament X wirkt, bzw. nicht wirkt. P(Wirksam|Daten) Bzw. ● P(Unwirksam|Daten) p-Wert P(U|D) = P(D|U)*P(U) P(D|U)*P(U)+P(D|W)*P(W) P(B|A)*P(A) P(B) P(Unwirksam)? Naturheilkunde oder Pharma? ● NHK: testet irgendwelche Pflanzen auf gut Glück ● Pharma: Gezielte Erforschung von Wirkstoffen ● P(Wirksam)?? Nochmal zum Arzt N von Test Ereignis 3000 positiv Menschen Test negativ Aids 100 98 2 Gesund 2990 90 2900 P = 98/188 = 50 % Folgerung ● Prior sollte so wenig Information wie möglich enthalten, aber so viel wie nötig Nicht informativer Prior ● Keine Information über θ Gleichverteilung als Prior? Keine Information über 1/θ 1/θ ebenfalls Gleichverteilt? z.B. Messung der Frequenz und Periodendauer ∫P(θ)dθ = 1 Substitution: Φ = 1/θ, dθ = θ^2dΦ = dΦ/Φ^2 ∫P(Φ) dΦ/Φ^2 = ∫Ṕ(Φ)dΦ ● ● ● Ein Prior sollte einen möglichst geringen Effekt auf die Daten haben Ein Prior sollte Symmetrien des Problems ausnutzen Im Zweifel: mehrere Priors durchprobieren Lokalisationsparameter ● f(x-θ) invariant unter Y=X+a z.B. Mittelwert ● P(θ)=P(θ-a) → P(θ)=1 Skalen Parameter 1 ● σ x f( σ ) invariant unter Y=c*X z.B. Standardabweichung ● P(σ) = 1 c σ P( c ) → P(σ) = 1/σ Konjugierter Prior = + Prior Likelihood Posterior