Übungen zur Wahrscheinlichkeitstheorie und Statistik Prof. Dr. C. Löh/M. Blank Blatt 13 vom 12. Juli 2012 Aufgabe 1 (Exponentialfamilien). Welche der folgenden Aussagen sind wahr? Begründen Sie jeweils kurz Ihre Antwort. 1. Ist N, Pot(N), (Poi(ϑ))ϑ∈R>0 eine Exponentialfamilie? 2. Sei a ∈ R. Ist R, B(R), (N (a, ϑ2 ))ϑ∈R>0 eine Exponentialfamilie? Lösungshinweise. 1. Ja, denn: Für jedes ϑ ∈ R>0 ist fϑ : N −→ [0, 1] k 7−→ e−ϑ · ϑk 1 = e−ϑ+k·ln ϑ · k! k! eine Zähldichte für Poi(ϑ). [Also ist N, Pot(N), (Poi(ϑ))ϑ∈R>0 eine Exponentialfamilie bzgl. des Zählmaßes auf N und der Inklusion N ,→ R (und a = ln, b = (R>0 ,→ R) und h : k 7−→ 1/k! in der Notation der Vorlesung. Die Abbildung h ist natürlich eine Zufallsvariable bzgl. Pot(N))]. 2. Ja, denn: Für jedes ϑ ∈ R>0 ist fϑ : R −→ R x 7−→ √ 1 2 · π · ϑ2 · e− (x−a)2 2·ϑ2 =√ (x−a)2 1 · e− 2·ϑ2 −ln ϑ . 2·π eine λ1 -Wahrscheinlichkeitsdichte für N (a, ϑ2 ). Also ist R, B(R), (N (a, ϑ2 ))ϑ∈R>0 eine Exponentialfamilie bzgl. λ1 und T : R −→ R x 7−→ 1/2 · (x − a)2 . (In der Notation der Vorlesung ist hier b = ln und a“ : R>0 −→ R ” 1 ϑ 7−→ 2 ϑ h : R −→ R √ ω 7−→ 1/ 2 · π. Als konstante Abbildung ist h eine Zufallsvariable.) Aufgabe 2 (Eindeutigkeit gleichmäßig bester Schätzer). Sei (Ω, S, (Pϑ )ϑ∈Θ ) ein statistisches Modell und seien T, Te : (Ω, S) −→ (R, B(R)) gleichmäßig beste erwartungstreue Schätzer für eine Abbildung τ : Θ −→ R. Zeigen Sie: Für alle ϑ ∈ Θ gilt dann Pϑ (T = Te) = 1. Lösungshinweise. Sei ϑ ∈ Θ. Nach Voraussetzung sind T und Te (und damit auch T − Te und T + Te) bzgl. Pϑ quadratintegrierbar. Es gilt VarPϑ (T − Te) = 0, denn: Es gilt VarPϑ (T ) + VarPϑ (1/2(T − Te)) ≤ VarPϑ (1/2 · (T + Te)) + VarPϑ (1/2 · (T − Te)) 1 = · (VarPϑ (T ) + VarPϑ (Te) + Cov(T, Te) + VarPϑ (T ) + VarPϑ (Te) + Cov(T, −Te)) 4 1 = · (VarPϑ (T ) + VarPϑ (Te) + VarPϑ (T ) + VarPϑ (Te)) 4 = VarPϑ (T ), wobei wir in der ersten Ungleichung ∀ϑ0 ∈Θ EPϑ0 (1/2 · (T + Te)) = 1/2 · (EPϑ0 (T ) + EPϑ0 (Te)) = EPϑ0 (T ) und die Minimalität von T benutzt haben. Somit gilt 0 ≤ VarPϑ ((T − Te)) = 4 · VarPϑ (1/2(T − Te)) ≤ 0. Es ist T − Te also Pϑ -fast sicher konstant, und daher gilt Pϑ -fast sicher T − Te = Eϑ (T − Te) = 0. [Mit anderen Worten Pϑ (T = Te) = 1.] Aufgabe 3 (Maximum-Likelihood-Schätzer for Poisson-Verteilungen). Wir betrachten das statistische Modell (Ω, S, (Pϑ )ϑ∈Θ ), wobei Ω := N, S := Pot(Ω), Θ := R>0 und Pϑ := Poi(ϑ) für ϑ ∈ Θ ist. 1. Zeigen Sie, dass der nachfolgende Beweis“ nicht korrekt ist, indem Sie ” erklären, welcher Schritt nicht korrekt ist und erklären, warum die Behauptung nicht korrekt ist. Behauptung. Dann ist T : Ω −→ Θ ω 7−→ ω ein Maximum-Likelihood-Schätzer für idΘ (bezüglich der offensichtlichen Zähldichten und der Borel-σ-Algebra auf Θ = R>0 ). Beweis. Offensichtlich ist T bezüglich S und B(R) messbar. Es bleibt also zu zeigen, dass T das entsprechende Maximierungsproblem löst: Die entsprechende Likelihoodfunktion ist L : Ω × Θ −→ R≥0 (ω, ϑ) 7−→ e−ϑ · ϑω . ω! Sei ω ∈ Ω. Indem man ln ◦L(ω, · ) differenziert und die Methoden der reellen Analysis zur Lösung von Extremwertproblemen anwendet, sieht man, dass die einzige Maximalstelle von ln ◦L(ω, · ) bzw. L(ω, · ) an der Stelle ϑ = ω liegt. Damit folgt die Behauptung. 2. Wie kann man die obige Situation so modifizieren, dass die der in der Behauptung angegebenen entsprechende Abbildung ein Maximum-Likelihood-Schätzer für die Identitätsabbildung ist? Lösungshinweise. 1. Der Fehler liegt darin, dass die Funktion L(0, ·) kein Maximum auf Θ = R>0 annimmt. Anders formuliert: ω = 0 ∈ Ω liegt nicht in Θ, also lässt sich T : Ω −→ Θ nicht wie oben definieren. 2. Wir definieren Poi0 := δ0 und betrachten das modifizierte statistische Modell (Ω, S, (Pϑ )ϑ∈R≥0 ). Dann ist die Likelihoodfunktion dieses Modells gegeben durch L : Ω × Θ −→ R≥0 −ϑ e · (ω, ϑ) 7−→ 1 0 ϑω ω! für ϑ > 0 für ϑ = 0 und ω = 0 sonst. Dann ist T : Ω −→ Θ ω 7−→ ω der gesuchte Maximum-Likelihood-Schätzer, denn: Für ω = 0 nimmt L(ω, ·) ein eindeutiges Maximum in 0 an. Für alle ω > 0 gilt (wie im fehlerhaften Beweis): L(ω, ·) : R≥0 7−→ R>0 ist (zweimal) differenzierbar auf R>0 , also ist auch ϕ := ln ◦L(ω, ·)|R>0 (zweimal) differenzierbar, und es gilt für alle ϑ ∈ R>0 ω ϑ 1 ϕ00 (ω) = −1 − < 0 ω ϕ0 (ϑ) = −1 + Also ist ϑ = ω die einzige lokale Maximalstelle von ϕ und nach dem Satz von Rolle auch die einzige globale Maximalstelle. Wegen der Monotonie des Logarithmus ist ω auch die einzige Maximalstelle von L(ω, ·)|R>0 . Wegen L(ω, 0) = 0 für ω > 0 folgt daher die Behauptung. Aufgabe 4 (German Tank Problem). Wir betrachten das statistische Modell (Ω, S, (Pϑ )ϑ∈Θ ) für das German Tank Problem, das wie folgt gegeben ist: Sei n ∈ N>0 (die beobachtete Anzahl der Seriennummern), sei N>0 Ω := , S := Pot(Ω), Θ := N≥n , n und für alle ϑ ∈ Θ bezeichne Pϑ die Gleichverteilung auf {1,...,ϑ} . Hierbei n A schreiben für eine Menge A kurz n := B ⊂ A |B| = n für die Menge der n-elementigen Teilmengen von A. 1. Zeigen Sie, dass es für das Modell (Ω, S, (Pϑ )ϑ∈Θ ) einen Maximum-Likelihood-Schätzer (bezüglich der offensichtlichen Zähldichten und der σ-Algebra Pot(Θ) auf Θ) gibt und bestimmen Sie einen solchen. 2. Zeigen Sie durch vollständige Induktion: Für alle r ∈ N, s ∈ N≥r gilt m−1 s X r · (s + 1) r−1 . m · s = r+1 r m=r 3. Ist Ihr Maximum-Likelihood-Schätzer aus dem ersten Aufgabenteil ein erwartungstreuer Schätzer für die Inklusion Θ ,→ R ? 4. Bestimmen Sie einen (weiteren) erwartungstreuen Schätzer für die Inklusion Θ ,→ R. Lösungshinweise. 1. Wir erhalten als Likelihood-Funktion L : Ω × Θ −→ R ( −1 ϑ n (ω, ϑ) 7−→ 0 für max ω ≤ ϑ sonst. Damit ist T : (Ω, S) −→ (Θ, Pot(Θ)) ω 7−→ max ω ein Maximum-Likelihood-Schätzer, denn: Die Abbildung T ist natürlich messbar bzgl S = Pot(Ω). Sei ω ∈ Ω und ϑ ∈ Θ. Für ϑ > max ω = T (ω) gilt L(ω, ϑ) = 0 ≤ L(ω, T (ω)). Für ϑ ≤ max ω gilt −1 −1 ϑ T (ω) L(ω, ϑ) = ≤ = L(ω, T (ω)). n n 2. Sei r ∈ N. Wir zeigen die Behauptung mit vollständiger Induktion nach a s ∈ N≥r . Für s = r erhalten wir [wobei wir etwa −1 := 0 setzen für alle a ∈ Z] m−1 r X r · (r + 1) r−1 . m · r = r = r+1 r m=r Sei die Aussage für s ∈ N≥r bereits gezeigt. Dann folgt m−1 s m−1 s+1 s X X r−1 r−1 r−1 · r! · (s + 1 − r)! m · s+1 = (s + 1) · s+1 + m· (s + 1)! r r m=r m=r s s! · r! · (s + 1 − r)! s+1−r X = (s + 1) · + · m· (s + 1)! · (r − 1)! · (s + 1 − r)! s+1 m=r s + 1 − r r · (s + 1) · s+1 r+1 r · (r + 1) + r · (s + 1 − r) = r+1 r · (s + 2) = . r+1 IV = r+ m−1 r−1 r s 3. Nein, denn: Wir erhalten für alle ϑ ∈ Θ: Der Schätzer T ist ausserhalb einer Pϑ -Nullmenge beschränkt, ist also bzgl Pϑ integrierbar, und es gilt EPϑ (T ) = X max ω · n ω∈({1,...,ϑ} ) n = ϑ X 1 ϑ X m=n ω∈({1,...,m−1}) m· 1 ϑ n n−1 = ϑ X m=n = m−1 m· n−1 ϑ n n · (ϑ + 1) . n+1 (Teil 2) Für alle ϑ ∈ Θ>n gilt also EPϑ (T ) 6= ϑ. Daher ist T nicht erwartungstreu. 4. Nach Teil 3 [und der Linearität des Erwartungswertes] ist T · erwartungstreuer Schätzer für Θ ,→ R. n+1 n − 1 ein Bonusaufgabe (Modellbau). Da Commander Blorx nicht jünger wird und demnächst in Rente geht, möchte er sich ein bizarres Hobby für seinen Ruhestand zulegen. Seine Wahl fällt dabei auf Modellbau. Helfen Sie Commander Blorx bei der Modellierung der folgenden Probleme! 1. Commander Blorx möchte sich mit einem Freund aus der Studienzeit treffen. Beide nehmen es mit der Pünktlichkeit nicht so genau und werden daher (jeweils unabhängig voneinander, gleichverteilt) innerhalb von einer Stunde nach der verabredeten Zeit am vereinbarten Treffpunkt eintrudeln. Da beide etwas ungeduldig sind, werden sie aber nicht länger als 10 Minuten auf den jeweils anderen warten. Wie groß ist die Wahrscheinlichkeit, dass sie sich tatsächlich treffen? 2. Was ist eine vernünftige Approximation für die Anzahl der Tipfehler pro Seite in der Encyclopedia Blorxica? 3. Ein von Commander Blorx ausgesetzter Schachkönig steht auf einem unendlich breiten und unendlich langen (ansonsten leeren) Schachbrett. In jedem Zug bewegt er sich zufällig gleichverteilt ein Feld in eine der zulässigen acht Richtungen. Mit welcher Wahrscheinlichkeit kehrt er nach einer endlichen Anzahl von Zügen zu seinem Ausgangsfeld zurück? 4. Wie kann Commander Blorx abschätzen, ob der garantiert faire“ Würfel, ” den er von einem dubiosen Casinobetreiber erhalten hat, tatsächlich fair ist? Hinweis. Es genügt, die jeweiligen wahrscheinlichkeitstheoretischen bzw. statistischen Modelle anzugeben und kurz zu begründen; es geht nicht darum, die entsprechenden Probleme tatsächlich zu lösen. Lösungshinweise. 1. Seien T, T 0 : (Ω, S, P ) −→ ([0, 1], B([0, 1])) unabhängige gleichverteilte Zufallsvariablen. Dann lässt sich das gesuchte Ereignis beschreiben durch (Blorx und sein Freund treffen sich) = {|T − T 0 | ≤ 1/6} und die gesuchte Wahrscheinlichkeit ist P ({|T − T 0 | ≤ 1/6}). Dabei beschreibe T den Ankunftszeitpunkt von Blorx und T 0 den seines Freundes und [0, 1] das Zeitintervall in welchem sich die beiden treffen wollten. Alternativ betrachte man das Maß P|T −T 0 | auf ([0, 1], B([0, 1])) und das Ereignis [0, 1/6] ⊂ [0, 1]. 2. Wir betrachten das folgende (unrealistische) Modell: Wir nehmen an, dass es ein (globales) p ∈ [0, 1] gibt, so dass jedes Zeichen in der Encyclopedia Blorxica unabhängig von den anderen Zeichen mit Wahrscheinlichkeit p falsch ist. [Dabei nehmen wir insbesondere an, dass die Zeichen unabhängig voneinander entweder richtig oder falsch sind.] Sei n ∈ N>0 die Anzahl der Zeichen in der Encyclopedia Blorxica. Wir erhalten dann das Binomialmodell ({0, . . . , n}, Pot({0, . . . , n}), B(n, p)) für die Anzahl der Tippfehler in der Encyclopedia Blorxica. Für große Werte von n sind die entsprechenden Wahrscheinlichkeit numerisch schwierig zu berechen. Wir betrachten daher stattdessen als Approximation“ das ” Poisson-Modell (N, Pot(N), Poi(n · p)). [Die Fehler pro Seite“ modellieren wir dann als Gesamtfehlerzahl geteilt ” durch die Anzahl der Seiten.] 3. Sei Ω := {−1, 0, 1}2 \ {(0, 0)}. Wir verwenden als Modell den Wahrscheinlichkeitsraum (Ω, Pot(Ω), UΩd )⊗N>0 Wir beschreiben also das Schachbrett durch Z2 und modellieren dann die Folge der Züge des Königs durch (πi )i∈N>0 . Das gesuchte Ereignis lässt sich dann schreiben als n o [ nX (Der König kehrt zum Ausgangsfeld zurück) = πi = (0, 0) n∈N>0 i=1 und die gesuchte Wahrscheinlichkeit ist P n [ nX n∈N>0 πi = (0, 0) o . i=1 P6 4. Sei Θ6 = {p ∈ [0, 1]6 | i=1 pi = 1} die Menge der möglichen Zähldichten auf {1, . . . , 6} und (Pϑ )ϑ∈Θ6 die zugehörige Familie von Wahrscheinlichkeitsmaßen auf ({1, . . . , 6}, Pot({1, . . . , 6})). Wir betrachten das statistische Modell ({1, . . . , 6}, Pot({1, . . . , 6}), (Pϑ )ϑ∈Θ6 )⊗N . Für ϑ ∈ Θ6 und i ∈ {1, . . . , 6} beschreibt ϑi die Wahrscheinlichkeit mit dem Würfel i Augen zu werfen. Man lege nun geeignete Hypothesenmengen fest, etwa (willkuerlich) Θ6 = ((1/12, 3/12)6 ∩ Θ6 ) ∪ (([0, 1]6 \ (1/12, 3/12)6 ) ∩ Θ6 ) mit Nullhypothese ([0, 1]6 \(1/12, 3/12)6 )∩Θ6 , und wähle einen passenden Test. keine Abgabe; Lösungshinweise werden zu Beginn der vorlesungsfreien Zeit zur Verfügung gestellt