Prüfungsaufgaben Vordiplom Statistik III/IV Prof. Dr. T. Hothorn Aufgabe 1 Zeigen Sie, daß für Mengen Ai , i ∈ I beliebig, die ”de Morganschen Regeln” [ Ai = i∈I \ Āi und i∈I \ Ai = i∈I [ Āi i∈I gelten. Aufgabe 2 Seien Ai ∈ F, i ∈ I, wobei F σ-Algebra über Ω. Zeigen Sie, daß T Ai ∈ F ist. i∈I Aufgabe 3 Sei Ω1 = {1, 2, . . . , 6} und F1 = σ(E) die vom Mengensystem E = {{1, 2, 3, 4}, {3, 4, 5, 6}} auf Ω1 erzeugte σ-Algebra. Weiterhin sei Ω2 = {a, b, c} und F2 = P(Ω2 ) eine σ-Algebra über Ω2 . Sei f : Ω1 → Ω2 mit ω 7→ f (ω) = und g : Ω1 → Ω2 mit a ω ∈ {1, 2, 3, 4} b ω ∈ {5, 6} a ω ∈ {2, 3, 4} b ω ∈ {5, 6} ω→ 7 g(ω) = c ω ∈ {1} Sind f und g F1 − F2 meßbar? Aufgabe 4 Bestimmen Sie Z lim n→∞ 0 1 1 + nx2 dx (1 + x2 )n indem Sie den Satz von der dominierten Konvergenz ausnutzen (zeigen Sie dazu mit der Bernoulli-Ungleichung, daß (1 + nx2 )/(1 + x2 )n ≤ 1 für alle x ∈ [0, 1] ist). Aufgabe 5 Das Übungsblatt der aktuellen Woche wird dienstags zwischen 10 und 11 Uhr mit einer Wahrscheinlichkeit von rund 80% (genauer: 0.7949691) mindestens 20 Mal und maximal 32 Mal aufgerufen. Weniger als 20 Aufrufe gibt es mit Wahrscheinlichkeit 0.1335748. Beschreiben Sie diesen Zufallsprozess mittels eines geeigneten Wahrscheinlichkeitsraumes und wählen Sie eventuell vorhandene freie Parameter sinnvoll. Hinweis: Sie können das Problem analytisch lösen, aber R ist dazu da, das Leben einfacher zu machen. Aufgabe 6 Gegeben seien die W’keiten P(A) = 1/4, P(B̄) = 2/3, P(C) = 1/2 und P(Ā ∩ B) = 1/4, P(B̄ ∪ C̄) = 5/6 sowie P(A ∩ C) = 0. Wie groß ist P(A ∪ B ∪ C)? –1– Prüfungsaufgaben Vordiplom Statistik III/IV Prof. Dr. T. Hothorn Aufgabe 7 1. Zeigen Sie, daß zwei disjunkte Ereignisse genau dann unabhängig sind, wenn eines der Ereignisse die W’keit Null hat. 2. Seien A und B stu mit P(A) = P(B) = 1/2. Mit welcher W’keit tritt genau eines der beiden Ereignisse ein? Aufgabe 8 Sei X eine Zufallsvariable und folge einer Weibull-Verteilung mit Parametern α > 0 und β > 0, d.h. mit Dichte f (x) = αβxβ−1 exp(−αxβ )I(x ≥ 0). Welcher Verteilung folgt Y = X β ? Bestimmen Sie hierzu die Dichte von Y und suchen Sie diese im Vorlesungsskript. Aufgabe 9 Sei X eine n-dimensionale Zufallsvariable. Zeigen Sie, daß die Kovarianzmatrix von X positiv semidefinit ist. Aufgabe 10 Sei X ∼ P (λ1 ) und Y ∼ P (λ2 ) stu. Welcher Verteilung folgt Z = X + Y ? Aufgabe 11 Zeigen Sie, daß zwei normalverteile Zufallsvariablen genau dann unabhängig sind, wenn sie auch unkorreliert sind. Aufgabe 12 1 1. Sei Xn → X. Zeigen Sie: E(Xn ) → E(X). 2 2. Sei Xn → X. Zeigen Sie: V(Xn ) → V(X). Aufgabe 13 Es seien X1 , . . . , Xn stu mit Xi ∼ U (0, b) mit b > 0 für alle i = 1, . . . , n. Zeigen Sie, daß P max (Xi ) → b. i=1,...,n Aufgabe 14 Bei der Lufthansa ist aus Erfahrung bekannt, daß etwa 18% der Fluggäste ihre gebuchte Reise nicht antreten. Um die Auslastung der Flugzeuge möglichst hoch zu halten, werden mehr als die verfügbaren 150 Plätze in einem Airbus A320 verkauft. 1. Berechnen Sie mit Hilfe des zentralen Grenzwertsatzes die Wahrscheinlichkeit dafür, daß ein Passagier nicht mitgenommen werden kann, wenn 170 Plätze verkauft werden. 2. Wieviele Plätze sollte die Lufthansa maximal verkaufen, wenn die Wahrscheinlichkeit für ein solches Mißgeschick kleiner 0.01 sein soll? –2– Prüfungsaufgaben Vordiplom Statistik III/IV Prof. Dr. T. Hothorn Hinweis: Nehmen Sie an, daß die Entscheidungen über das Antreten der Reise zwischen den einzelnen Passagiere unabhängig sind. Desweiteren in R: Φ(x) = pnorm(x) und Φ−1 (x) = qnorm(x). Aufgabe 15 Es seien X1 , . . . , Xn unabhängig identisch verteilt mit gemeinsamem Erwartungswert E(Xi ) = µ und Varianz V(Xi ) = σ 2 . Zeigen Sie, daß v u n u1 X 2 P t Xi − X̄ → σ n i=1 Hinweis: X̄ = n−1 P i Xi . Aufgabe 16 Sei X1 , X2 , . . . , Xn eine Stichprobe aus einer exponentialverteilten Grundgesamtheit. D.h. Xi ∼ Exp(λ), λ > 0. n P Hinweis: Wenn Xi ∼ Exp(λ) = Γ (1, λ) , i = 1, . . . , n, dann gilt: Y = Xi ∼ Γ (n, λ). i=1 a) Zeigen Sie, dass T = X̄ −1 kein erwartungstreuer Schätzer für λ ist. b) Ist T = X̄ −1 asymptotisch erwartungstreu für λ? c) Bestimmen Sie einen erwartungstreuen Schätzer für λ. (nur a und b) Aufgabe 17 Eine Grundgesamtheit besitze den Mittelwert µ und die Varianz σ 2 . Die Stichprobenvariablen X1 , . . . , X5 seien unabhängige Ziehungen aus dieser Grundgesamtheit. Folgende Schätzfunktionen für µ werden betrachtet: T1 = T2 = T3 = T4 = T5 = 1 (X1 + X2 + X3 + X4 + X5 ) 5 1 (X1 + X2 + X3 ) 3 1 1 (X1 + X2 + X3 + X4 ) + X5 8 2 X1 + X2 X1 a) Welche der Schätzfunktionen sind erwartungstreu für µ? b) Berechnen Sie für jede Schätzfunktion den mittleren quadratischen Fehler (M SE). Hinweis: Der M SE ist definiert als Eϑ ((t(x) − ϑ)2 ) = Vϑ (t(x)) + Bias(t(x), ϑ)2 . (nur a) Aufgabe 18 Seien X1 , . . . , Xn unabhängig identisch normalverteilt mit µ = 0 und unbekannter Varianz σ 2 . Betrachtet wird nun die folgende Schätzstatistik für σ 2 : n 2 n−2 X 2 Tn = X12 + X n n(n − 1) i=2 i –3– Prüfungsaufgaben Vordiplom Statistik III/IV Prof. Dr. T. Hothorn a) Ist Tn ein unverzerrter Schätzer für σ 2 ? P b) Ist Tn ein konsistenter Schätzer für σ 2 , d.h. gilt Tn → σ 2 für n → ∞? c) Bestimmen Sie die Varianz von Tn . (nur a und b) Aufgabe 19 Zeigen Sie, dass es sich bei {N (µ0 , σ 2 )|σ 2 > 0} um eine Exponentialfamilie handelt. Aufgabe 20 Gegeben sei eine unabhängig identisch verteilte Stichprobe X = (X1 , . . . , Xn ) eines exponentialverteilten Untersuchungsmerkmals Xi mit dem unbekannten Parameter λ. Es gilt also Xi ∼ Exp(λ). a) Ist die Verteilungsannahme PX, Θ eine Exponentialfamilie? Wie lautet t(x) in dieser Exponentialfamilie? b) Bestimmen Sie außerdem die Momente erster und zweiter Ordnung der Statistik T = t(x). Aufgabe 21 Gegeben sei eine Stichprobe X = (X1 , . . . , Xn ), wobei Xi unabhängig identisch exponentialverteilt ist mit λ > 0 für i = 1, . . . , n. n P Man zeige, dass die Statistik T (X) = Xi suffizient für λ ist. i=1 Sind die Statistiken X̄ und X̄ −1 ebenfalls suffizient? Aufgabe 22 Sei X = (X1 , X2 , . . . , Xn ) eine unabhängig identisch verteilte Stichprobe, wobei Xi poissonverteilt ist, mit unbekanntem Parameter λ > 0 für i = 1, . . . , n. Man zeige a) durch direkte Angabe der bedingten Verteilung von X gegeben T (X) = t, b) mit Hilfe des Faktorisierungssatzes von Fisher und Neyman, dass die Statistik T (X) = n P Xi suffizient für λ ist. i=1 Hinweis: In a) ist zu zeigen, dass die bedingte Verteilung von X nicht vom unbekannten Parameter abhängt. Aufgabe 23 Ein Versuch, bei dem ein Ereignis A mit der unbekannten Wahrscheinlichkeit p eintrifft, wird so oft unabhängig voneinander wiederholt bis zum ersten Mal ein Erfolg eintritt. Sei X die Anzahl der dafür benötigten Versuche und Xi ∼ G(p). Bestimmen Sie a) die Score-Funktion von x und b) die Fisher-Information IX (p). Aufgabe 24 Sei X = (X1 , . . . , Xn ) mit Xi ∼ G(p) unabhängig identisch verteilt, also mit Dichten fXi (xi , p) = p(1 − p)(xi −1) . –4– Prüfungsaufgaben Vordiplom Statistik III/IV Prof. Dr. T. Hothorn a) Berechnen Sie den ML-Schätzer p̂ analytisch. b) Bestimmen Sie den ML-Schätzer p̂ für x = (0, 3, 0, 49, 16, 1, 40, 26, 16, 12). Aufgabe 25 In der Vorlesung wurde besprochen, dass ein unverzerrter Schätzer keine beliebig kleine Varianz haben kann. Sei X = (X1 , . . . , Xn ) eine unabhängig identisch poissonverteilte Zufallsstichprobe mit Xi ∼ P (λ), i = 1, . . . , n. a) Bestimmen Sie einen unverzerrten ML-Schätzer für λ. b) Verwenden Sie Satz 1.36, um die Cramer-Rao-Schranke der Varianz dieses Schätzers zu bestimmen. c) Begründen Sie für dieses Beispiel, dass Satz 2.4 gilt, also dass der ML-Schätzer konsistent ist. Aufgabe 26 Sei X = (X1 , . . . , Xn ) eine unabhängig identisch verteilte Stichprobe, mit Xi ∼ B(1, π). a) Geben Sie einen ML-Schätzer für das Chancenverhältnis ϑ an, wobei ϑ= π . 1−π Hinweis: Verwenden Sie Satz 2.5 aus der Vorlesung. b) Bestimmen Sie die (asymptotische) Verteilung des Schätzers ϑ̂ML . Hinweis: Nutzen Sie dazu Satz 10.16 aus Statistik III. c) Sei nun Xi ∼ B(1, 0.5). Wie groß ist dann die Wahrscheinlichkeit, dass das aus einer Stichprobe x geschätzte ϑ̂ML kleiner als 1.5 ist? Hinweis: Nutzen Sie Satz 2.9 aus der Vorlesung. (nur a und b) Aufgabe 27 Formulieren Sie für die folgenden Problemstellungen jeweils die Likelihood. a) In einer Untersuchung eines wurzelinfizierenden Pilzes bei Getreide wird eine Saat von 250 Samen gepflanzt. Aus technischen Gründen kann nur beobachtet werden, dass x ≤ 25 Samen gekeimt sind. Sei ϑ die Wahrscheinlichkeit, dass ein Samen keimt. Geben Sie einen Ausdruck für die Likelihood von ϑ basierend auf der Information des obigen Experiments an. iid b) Sei X1 , . . . , Xn ∼ N (ϑ, 1). Aus verschiedenen Gründen wird aber nur der größte Wert der Stichprobe gemeldet: Y = max(X1 , . . . , Xn ). Zeigen Sie, dass die Dichte von Y folgende Form hat: n−1 fY (y) = n Φ(y − ϑ) φ(y − ϑ), wobei Φ(·) die Verteilungsfunktion und φ(·) die Dichte der Standardnormalverteilung ist. Wie lautet somit die Likelihoodfunktion L(ϑ; y)? Hinweis: Bestimmen Sie zuerst die Verteilungsfunktion von Y . –5– Prüfungsaufgaben Vordiplom Statistik III/IV Prof. Dr. T. Hothorn c) Seien X1 , X2 , X3 unabhängig identisch verteilt mit Xi ∼ C(ϑ, 1), wobei ϑ ∈ R der Lokationsparameter der Cauchyverteilung mit Dichte f (x) = 1 1 , π 1 + (x − ϑ)2 x∈R ist. Bestimmen Sie einen Ausdruck für die Likelihood von ϑ. d) Erstellen Sie in R einen Plot der Likelihood für (i) L(ϑ; x) in a) (ii) L(ϑ; x) in b) bei Beobachtungen x = (1.5, 0.25, 3.75, 3.0, 2.5). (iii) L(ϑ; x) für c) bei Beobachtungen x = (0, 5, 9). Aufgabe 28 Gegeben sei eine unabhängig identisch verteilte Zufallsstichprobe X = (X1 , . . . , Xn ), mit Xi ∼ N (µ, 1). Von Interesse ist die Verteilung des Schätzers für den Parameter µ. a) Bestimmen Sie die Verteilung des Schätzers µ̂ = x̄. b) Entspricht die Varianz der Grenzverteilung der exakten Varianz dieses Schätzers? Hinweis: Verwenden Sie auch hier Satz 2.10 aus der Vorlesung. Aufgabe 29 Sei X = (X1 , . . . , Xn ) eine unabhängig identisch verteilte Stichprobe, wobei Xi ∼ P (λ), mit unbekanntem Parameter λ > 0. Es soll die Hypothese H0 : λ ≤ 0.01 gegen die Alternative H1 : λ > 0.01 zum Niveau α = 0.1 getestet werden. Dazu wird folgender Test ϕ verwendet: ( P 1, falls xi > 0 ϕ(x) = P 0, falls xi = 0 a) Bestimmen Sie die Gütefunktion dieses Tests und stellen Sie sie für eine Stichprobe vom Umfang n = 10 grafisch dar (in Abhängigkeit von λ). b) Wie groß ist die maximale Wahrscheinlichkeit für den Fehler 1. Art? c) Geben Sie einen Test an, der das Niveau α = 0.1 ganz ausschöpft. Aufgabe 30 Bei der Abfüllung von Mineralwasser in 1 l-Flaschen soll der Sollwert von 1 l eingehalten werden. Für die verwendete Abfüllanlage gilt nach Herstellerangaben, dass die Abfüllungen normalverteilt sind mit µ = 1 000 ml und σ 2 = 100 ml2 . Zur Überprüfung der Abfüllmenge wird von einem Getränkemarkt eine Stichprobe vom Umfang n = 10 aus einer Lieferung von 1 000 Flaschen gezogen. Dabei ergab sich eine durchschnittliche Abfüllmenge von 1 020 ml. a) Befindet sich der Abfüllprozess nicht mehr unter statistischer Kontrolle (α = 0.01)? Wie lässt sich diese Frage als statistisches Testproblem erfassen? b) Was sagt der Fehler 1. Art hier aus? –6–