5 Aufgaben zur Punktschätzung Zoltán Zomotor Versionsstand: 20. Mai 2015, 10:04 This work is licensed under the Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Germany License. To view a copy of this license, visit http://creativecommons.org/licenses/by-nc-sa/3.0/de/ or send a letter to Creative Commons, 171 Second Street, Suite 300, San Francisco, California, 94105, USA. Aufgabe 1: Reviewfragen (a) Wozu dient die Punktschätzung? (b) Was bedeutet erwartungstreu und asymptotisch erwartungstreu? (c) Wozu dient die Bestimmung der Wirksamkeit einer Schätzufunktion? (d) Was bedeutet hier der Begriff Konsistenz? (e) Was ist der Unterschied zwischen einem Maximum-Likelihood-Schätzwert und einer Maximum-Likelihood-Schätzfunktion (f) Θ̂ = f (X1 , X2 , . . . , Xn ) sei eine Maximum-Likelihood-Schätzfunktion für den Parameter ϑ. Unter welcher Voraussetzung ist sin Θ̂ eine Maximum-Likelihood-Schätzfunktion von sin ϑ? Aufgabe 2: Der Erwartungswert µ in der Grundgesamtheit soll durch folgende Stichprobenfunktionen geschätzt werden: Θ̂ n = 1 · (X1 + X2 + · · · + Xn ), n Θ̂ 0n = n 2 X iXi , n2 i=1 Θ̂ 00n = 2 · (X1 + 2X2 + · + nXn ) n(n + 1) Prüfen Sie die Erwartungstreue der Schätzfunktionen und ermitteln Sie die wirksamste unter den erwartungstreuen Schätzfunktionen. Sind die Schätzfunktionen konsistent? Hinweis: n X n(n + 1) i= 2 i=1 und n X 1 1 i2 = n(n + 1)(n + ) 3 2 i=1 1 Aufgaben zur Punktschätzung 5 Aufgabe 3: Es sei x1 , . . . , xn das Ergebnis einer einfachen Stichprobe aus einer Poisson-verteilten Grundgesamtheit mit dem unbekannten Parameter µ. a) Bestimmen Sie die Likelihood-Funktion für dieses Stichprobenergebnis b) Zeigen Sie, dass X̄ die Maximum-Likelihood-Schätzfunktion für den unbekannten Parameter µ ist. √ c) Bestimmen Sie die Maximum-Likelihood-Schätzfunktion für die Standardabweichung µ. Aufgabe 4: In einem gut gefüllten Saal befinden sich N Personen, die mit 1 bis N durchnummeriert sind. Herr Maier von der Gewerbeaufsicht kennt N nicht und wird vom Veranstalter mit allerlei Tricks am Betreten des Saals gehindert. Herr Maier, der N ermitteln möchte, ist lediglich in der Lage, die Nummer eines Teilnehmers, der zufällig den Saal verlässt, zu erkennen. Fassen Sie diese Nummer als Realisation x einer Zufallsvariablen X auf. a) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X (in Abhängigkeit von N ). b) Ist 2X − 1 eine erwartungstreue Schätzfunktion für N ? Aufgabe 5: X1 , . . . , Xn und Y1 , . . . , Yn seien einfache Stichproben, wobei die Verteilung der Xi , Yi vom 1 unbekannten Parameter p ∈ [0, ] abhängt. Für alle i = 1, . . . , n gelte: 2 E(Xi ) = E(Xi2 ) = p E(Yi ) = 1.5p Var(Yi ) = 1.5p(1 − 1.5p) E(Xi · Yi ) = p2 a) Berechnen Sie in Abhängigkeit von p die Größen Var(Xi ), Cov(Xi , Yi ), E(Xi + Yi ) und Var(Xi + Yi ) b) Bestimmen Sie unter den drei Schätzfunktionen Θ̂ 1 = n 1X Xi n i=1 Θ̂ 2 = n 1X Yi n i=1 Θ̂ 3 = n 2 X (Xi + Yi ) 5n i=1 die für p erwartungstreuen, und bestimmen Sie unter den erwartungstreuen die wirksamste. 2 Aufgaben zur Punktschätzung 5 Aufgabe 6: Zwei unterschiedliche Messgeräte A und B messen laufend den Salzgehalt in einem Meerwasseraquarium. Beide Messgeräte liefern „im Mittel richtige“ Werte, was sich durch E(X) = E(Y ) = E(S) = µ beschreiben lässt, wobei X (bzw. Y ) das vom Messgerät A (bzw. B) verwendete Messverfahren zur Messung des Salzgehalts S ist. Es ist bekannt, dass A ungenauere Messungen als B liefert, was sich durch Var(X) = 1.5 · Var(Y ) beschreiben lässt. Ferner sind X und Y unkorreliert. Beide Messgeräte liefern ihre Messergebnisse an einen Zentralrechner, der aus X und Y mittels den Gewichten a und b die Schätzfunktion Z =a·X +b·Y bildet. (a) Wie müssen a und b gewählt werden, damit Z erwartungstreu für µ ist? (b) Welche unter den erwartungstreuen Schätzfunktionen Z ist die wirksamste? Aufgabe 7: Gegeben sei eine einfache Stichprobe X1 , . . . , Xn aus einer Grundgesamtheit mit unbekanntem Erwartungswert µ, der mit folgender Stichprobenfunktion geschätzt werden soll X 1 n−1 Xi + α · Xn Θ̂ = n − 1 i=1 mit α ∈ [−1; 1]. (a) Bestimmen Sie α so, dass Θ̂ erwartungstreu für µ ist. Ist die resultierende Schätzfunktion konsistent? (b) Begründen Sie, ob das die wirksamste Schätzfunktion für µ ist. (c) Angenommen, die Grundgesamtheit ist N (µ, 9) verteilt. Wie hoch ist dann die Wahrscheinlichkeit, dass der von Θ̂ gelieferte Schätzwert ϑ̂ bei einem Stichprobenumfang von n = 82 im Intervall µ − 1; µ + 1 liegen wird? Aufgabe 8: Eine einfache Stichprobe bezüglich eines Merkmals X in einer Grundgesamtheit ergab folgende Ergebnisse: x h(x) 0 3 1 4 2 4 Nehmen Sie zunächst an, X sei exponentialverteilt. 3 3 3 4 2 5 1 Aufgaben zur Punktschätzung 5 (a) Bestimmen Sie den Maximum-Likelihood-Schätzwert für λ. (b) Wie groß ist unter Verwendung des Ergebnisses aus (a) die Wahrscheinlichkeit, dass X einen Wert annimmt, der nicht kleiner als 2 ist? (c) Lösen Sie die Teile (a) und (b) nun unter der Annahme, dass X Poisson-verteilt ist. (d) Bei dem Merkmal X handelt es sich um die Anzahl der zwischen 23:00 und 24:00 Uhr an einer Tankstelle tankenden Kraftfahrzeuge. Begründen Sie kurz, welche der beiden obigen Verteilungsannahmen sinnvoller ist. Aufgabe 9: Die Zeitdauer T für einen bestimmten Vorgang sei gemäß der Verteilungsfunktion √ F (t) = 1 − e −b t für t > 0 verteilt (mit F (t) = 0 für t ≤ 0). (a) Bestimmen Sie den Median tMed in Abhängigkeit vom Parameter b. (b) Bei einer einfachen Stichprobe zum Merkmal T vom Umfang n = 10 wurden die Zeitdauern (1, 4, 9, 9, 4, 4, 4, 1, 1, 4) registriert. Berechnen Sie den Maximum-Likelihood-Schätzwert b̂ für b. (Die zweite Ableitung muss nicht ausgewertet werden.) (c) Berechnen Sie den Maximum-Likelihood-Schätzwert t̂Med für den Median aus der in (b) angegebenen Stichprobenrealisation. Aufgabe 10: Freikletterer Hans interessiert, wie groß die Entfernung Z von seiner frei werdenden Hand zu einem zufällig gewählten Zeitpunkt während des Kletterns zum nächsten „Henkel“ (großer guter Griff für alle Finger) ist. Er geht davon aus, dass Z gleichverteilt über dem Intervall [0, d] ist. (a) Stellen Sie die Likelihood-Funktion f (z1 , z2 , . . . , zn |d) für eine Stichprobenrealisation (z1 , z2 , . . . , zn ) auf. (b) Für n = 5 Entfernungsmessungen (in Armlängen) hat er sich die Stichprobenrealisation (z1 , . . . , z5 ) = (6, 18, 11, 20, 9) gemerkt. Bestimmen Sie den Maximum-Likelihood-Schätzwert dˆ für d. 4 Aufgaben zur Punktschätzung 5 Lösung 1: (a) Schätzung eines unbekannten Parameters θ auf Basis einer Stichprobe. (b) E(Θ̂) = ϑ, lim E(Θ̂) = θ n→∞ (c) Vergleich zweier Schätzfunktionen aufgrund ihrer Varianz. Die mit der kleineren Varianz ist wirksamer und damit besser. (d) E(Θ̂ n ) = ϑ und lim Var()Θ̂ n = 0 n→∞ (e) ML-Schätzwert: Maximierung der Likelihoodfunktion für ein konkretes Stichprobenergebnis. ML-Schätzfunktion: Maximierung der Likelihoodfunktion für allgmeine Stichprobe. (f) Xi > 0 Lösung 2: E(Θ̂ n ) = E( 1 · (X1 + X2 + · · · + Xn )) n 1 1 1 · (E(X1 ) + E(X2 ) + · · · + E(Xn )) = · (µ + µ + · · · + µ) = · (nµ) n n n =µ⇒ erwartungstreu. 1 Var(Θ̂ n ) = Var( · (X1 + X2 + · · · + Xn )) n 1 1 = 2 · (Var(X1 ) + Var(X2 ) + · · · + Var(Xn )) = 2 · (nσ 2 ) n n σ2 = n = E(Θ̂ 0n ) = E( = n n n 2 X 2 X 2 X iX ) = iE(X ) = µ i i i n2 i=1 n2 i=1 n2 i=1 2µ n(n + 1) 1 · = µ(1 + ) ⇒ nicht erwartungstreu und nicht konsistent n2 2 n 5 Aufgaben zur Punktschätzung 5 2 2 · (X1 + 2X2 + · + nXn ) = · E(X1 ) + 2E(X2 ) + · + nE(Xn ) n(n + 1) n(n + 1) 2 n(n + 1) = µ n(n + 1) 2 =µ⇒ erwartungstreu. E(Θ̂ 00n ) = E Var(Θ̂ 00n ) 2 = Var · (X1 + 2X2 + · + nXn ) = n(n + 1) !2 = 2 n(n + 1) = 4(n + 12 ) 2 σ 3n(n + 1) 2 n(n + 1) 1 1 · n(n + 1)(n + ) · σ 2 3 2 Wirksamkeit: Var(Θ̂ 00n ) > Var(Θ̂ n ) ⇔ 4(n + 12 ) 2 σ 2 σ > 3n(n + 1) n 1 4 1 + 2n >1 ⇔ 3 1 + n1 ist für n → ∞ gegeben, d.h. Θ̂ n ist die wirksamste Schätzfunktion. Lösung 3: a) f (x1 , . . . , xn |µ) = µ Pn i=1 xi −nµ e Qn i=1 xi ! µnx̄ e −nµ = Qn i=1 xi ! b) ln f (x1 , . . . , xn |µ) = nx̄ ln µ − nµ − n Y i=1 d ln f nx̄ ! = −n=0 dµ µ ⇒ µ̂ = x̄ c) s = p µ̂ = √ x̄ Lösung 4: 1, (a) f (x) = N 0, für x = 1, . . . , N sonst 6 xi ! !2 · (12 Var(X1 ) + 22 Var(X2 ) + · + n2 V Aufgaben zur Punktschätzung 5 (b) Ja, weil: E(2X − 1) = 2 E(X) − 1 = 2 N X if (i) − 1 = i=1 2 N (N + 1) · −1=N N 2 Lösung 5: (a) Var(Xi ) = p (1 − p) Cov(Xi , Yi ) = 0.5p2 E(Xi + Yi ) = 2.5p Var(Xi + Y i) = p (1 − p) + 1.5p(1 − 1.5p) − 2 · 0.5p2 = 2.5p − 4.25p2 (b) E(Θ̂ 1 ) = E(Xi ) = p ⇒ Θ̂ 1 ist erwartungstreu für p E(Θ̂ 2 ) = E(Yi ) = 1.5p ⇒ Θ̂ 2 ist nicht erwartungstreu für p 2 E(Θ̂ 3 ) = E(Xi ) + E(Y i) = p ⇒ Θ̂ 3 ist erwartungstreu für p 5 1 Var(Θ̂ 1 ) = p (1 − p) n 0.4 p (1 − 1.7p) Var(Θ̂ 3 ) = n 1 0.4 Var(Θ̂ 1 ) ≥ Var(Θ̂ 3 ) ⇔ p (1 − p) ≥ p (1 − 1.7p) ⇒ p ≤ 1.875 n n 1 Wegen p ∈ [0, ] ist p ≤ 1.875 immer erfüllt ⇒ Θ̂ 3 ist wirksamer als Θ̂ 3 2 Lösung 6: ! (a) E(Z) = aµ + bµ = (a + b)µ = µ ⇔ a+b=1 (b) Minimiere die Varianz von Z = aX + (1 − a)Y bezüglich a: d Var(Z) 2 3 ! = 3a · Var(Y ) − 2(1 − a) · Var(Y ) = 0 ⇒ a = , b = da 5 5 2 d Var(Z) = 5 · Var(Y ) > 0, also wurde ein Minimum erreicht da2 Lösung 7: ! (a) E Θ̂) = µ · (1 + α) = µ ⇔ α = 0 Var(Xi ) → 0 für n → ∞ ⇒ Θ̂ ist konsistent dann: Var(Θ̂) = n−1 (b) Nein, denn X̄ = n 1X Xi ist wirksamer. n i=1 7 Aufgaben zur Punktschätzung 5 (c) Var(Θ̂) = 92 82−1 = 1 ⇒ Θ̂ ∼ N (µ, 1) ⇒ P (µ − 1 < Θ̂ < µ + 1) = 2Φ(1) − 1 = 0.683 Lösung 8: (a) λ̂ = x̄1 , x̄ = 2 ⇒ λ̂ = 0.5 (b) stetige Zufallsvariable: P (X ≥ 2) = 1 − P (X ≤ 2) = 1 − (1 − e −0.5·2 ) = 0.368 (c) λ̂ = x̄ = 2 diskrete Zufallsvariable: P (X ≥ 2) = 1 − F (1) = 1 − 0.406 = 0.594 (d) Die Poisson-Verteilung ist sinnvoller, weil X hier eine diskrete Zufallsvariable ist. Außerdem werden hier seltene Ereignisse betrachtet. Die Exponentialverteilung ist dagegen eher zur Modellierung von Wartezeiten oder Lebensdauern geeignet. Lösung 9: (a) F (Med ) = 1 − e √ −b tMed = 0.5 ⇒ tMed = ln 2 b !2 (b) √ dF (t) be −b t f (t) = = √ dt 2 t 10 −19b b ·e √ f (1, . . . , 4|b) = 10 √ 2 · 1 · ··· · 4 √ √ ln f (1, . . . , 4|b) = 10 ln b − 19b − ln(210 · 1 · · · · · 4) ∂ 10 1 ln f (1, . . . , 4|b) = − 19 = 0 ∂b b 10 = 0.526 b̂ = 19 (c) t̂Med = ln 2 0.526 !2 = 1.737 Lösung 10: (a) Dichtefunktion der Gleichverteilung über [0, a]: f (z) = 1, a 0, für 0 ≤ z ≤ a sonst ⇒ LikelihoodFunktion: f (z1 , . . . , zn |a) = 1n , a 0, falls min zi ≥ 0 und max zi ≤ a i i sonst 8 5 Aufgaben zur Punktschätzung (b) Wegen min(6, 18, 11, 20, 9) = 6 ≥ 0, max(6, 18, 11, 20, 9) = 20 gilt: 1, 5 f (6, 18, 11, 20, 9|a) = a 0, für a ≥ 20 sonst ⇒ f (6, 18, 11, 20, 9|a) maximal, falls a ≥ 20 minimal ⇒ â = 20 9