Einführung in die Bayes-Statistik Prof. Dr. Helga Wagner, Gero Walter Übungsblatt 1 WiSe 2010/11 Aufgabe 1 Gegeben sei eine i.i.d. Stichprobe X1 , . . . , Xn eines mit unbekanntem Mittelwert µ und bekannter Varianz σ02 normalverteilten Merkmals. Wählt man als PrioriVerteilung eine Normalverteilung mit Mittelwert m0 und Varianz M0 , so ist die a posteriori Verteilung eine Normalverteilung mit Mittelwert m1 und Varianz M1 , wobei gilt: m1 = X̄ · M0 + m0 · M0 + σ02 n σ02 n , M1 = σ02 n σ2 M0 + n0 M0 · . a) Bestätigen Sie die Gleichungen für m1 und M1 . b) Diskutieren Sie jeweils ceteris paribus die Fälle i) n → ∞ ii) M0 → 0 iii) M0 → ∞, d.h. geben Sie an, wie sich m1 bzw. M1 verhalten, wenn alle anderen Größen unverändert bleiben, und interpretieren Sie die Ergebnisse anschaulich! Aufgabe 2 Seien X1 , . . . , Xn unabhängig und identisch geometrisch verteilt mit Parameter π, also Xi ∼ G(π), i = 1, . . . , n, d.h. P (X = x) = π(1 − π)x−1 . a) Bestimmen Sie den ML-Schätzer π̂ML für π. b) Nehmen Sie nun eine Betaverteilung als Priori-Verteilung für den unbekannten Parameter π an, das heißt, es gelte Xi | π ∼ G(π), i = 1, . . . , n unabhängig und π ∼ Beta(a0 , b0 ). Bestimmen Sie die Dichte der PosterioriVerteilung von π | X1 , . . . , Xn . Um welchen Verteilungstyp handelt es sich? Wie lauten die Parameter der Verteilung? c) Wie lauten Posteriori-Modus und Posteriori-Erwartungswert von π? d) Für welche Werte von a0 und b0 stimmt der Posteriori-Modus mit dem ML-Schätzer überein? 1 Aufgabe 3 (Datierung von Gestein) Die ersten zuverlässigen Datierungen der Vulkan-Gesteinsart Granophyr aus dem Ennerdale, West Cumbria, UK wurden in den 1960er mit der sogenannten K/ArMethode vorgenommen. Mit dieser Methode wurde das Alter des Gesteins auf 370 ± 20 Millionen Jahren geschätzt. Die in den späten 70er Jahren entwickelte präzisere Rb/Sr-Methode ergab eine Schätzung des Alters von 421 ± 8 Millionen Jahren. a) Angenommen, die obigen Messfehler sind normalverteilt, so dass die angegebenen Unsicherheiten den Standardabweichungen entsprechen. Verwenden Sie die Resultate der K/Ar-Methode als Priori-Wissen für die Rb/SrMethode in einem Normal-Normal-Modell (siehe Aufgabe 1) und bestimmen Sie die Posteriori-Verteilung für das Alter des Gesteins. b) Angenommen, die Resultate K/Ar-Methode stehen Ihnen nicht zu Verfügung. Beruhend auf Messungen von ähnlichen Gesteinsarten vermuten Sie jedoch, dass das Alter 400 ± 50 Millionen Jahre ist. Berechnen Sie die Posteriori-Verteilung für das Alter nach der Rb/Sr-Messung. c) Stellen Sie für beide Szenarien die jeweiligen Priori- und PosterioriVerteilungen grafisch dar. Aufgabe 4 iid Seien X = (X1 , . . . , Xn ) ∼ Binom(n, π). Die Priori-Verteilung für π sei gegeben durch die Mischung zweier Betaverteilungen: p(π) = λ · p1 (π | a1 , b1 ) + (1 − λ) · p2 (π | a2 , b2 ), 0 < λ < 1, wobei pi (π | ai , bi ) für i = 1, 2 jeweils die Dichte der Beta-Verteilung mit Parametern ai und bi ist. a) Geben Sie die Posteriori-Verteilung p(π | x) an. b) Berechnen Sie den Posteriori-Erwartungswert. c) Bestimmen Sie ein gleichendiges (1 − α)-Kredibilitätsintervall, indem Sie die α/2- und (1 − α/2)-Quantile der Posteriori-Verteilung in R numerisch berechnen. d) Testen Sie ihre Resultate für den Fall, dass λ = 0.5, a1 = 10, b1 = 20, a2 = 20, b2 = 10 und bei 10 Experimenten insgesamt 3 Mal die 0 beobachtet wurde. Herzlichen Dank an T. Augustin und M. Höhle für die Bereitstellung von Übungsaufgaben. 2