Lehrstuhl für Statistik und Ökonometrie der Otto-Friedrich-Universität Bamberg Prof. Dr. Susanne Rässler Klausur zu Methoden der Statistik II (mit Kurzlösung) Sommersemester 2013 Aufgabe 1 In einer Urne U1 befinden sich 3 schwarze und 2 weiße Kugeln; in einer zweiten Urne U2 sind 4 schwarze und 5 weiße Kugeln. a) Geben Sie die Wahrscheinlichkeit an, aus U1 eine schwarze Kugel zu ziehen. Geben Sie die Wahrscheinlichkeit an, aus U2 eine schwarze Kugel zu ziehen. b) Sie ziehen ohne Zurücklegen aus U1 zwei Kugeln. Wieviele Möglichkeiten gibt es, zwei schwarze Kugeln zu ziehen? c) Sie ziehen nacheinander ohne Zurücklegen aus U1 zwei Kugeln. Mit welcher Wahrscheinlichkeit ist die zweite Kugel weiß, wenn die erste schwarz ist? d) Es wird blind aus einer der Urnen eine Kugel gezogen. Sie ist weiß. Mit welcher Wahrscheinlichkeit stammt sie aus U1 ? Nehmen Sie nun an, dass alle Kugeln aus den zwei Urnen in eine Urne zusammengelegt werden. Es wird eine Stichprobe von n Kugeln ohne Zurücklegen gezogen. e) Geben Sie eine Verteilung für die Wahrscheinlichkeit an, dass in der n-elementigen Stichprobe k schwarze Kugeln enthalten sind. Geben Sie explizit die Wahrscheinlichkeitsfunktion an. f) Es wird eine Stichprobe vom Umfang n = 6 gezogen. Wie groß ist die Wahrscheinlichkeit, dass darin 3 schwarze Kugeln enthalten sind? Aufgabe 2 In einem Produktionsprozess kommt es aufgrund eines Engpassfaktors zu Wartezeiten zwischen zwei Produktionsschritten. In den letzten Wochen wurden die folgenden Wartezeiten (in Stunden) beobachtet 2 1 4 2,3 4,5 2 3 1 . Der leitende Ingenieur nimmt an, dass die zufällige Wartezeit Z (in Stunden) dabei einer Exponentialverteilung mit der Dichtefunktion 1 1 fZ (z) = exp − z falls z ∈ [0, ∞), λ > 0 λ λ und korrespondierender Verteilungsfunktion 1 FZ (z) = 1 − exp − z λ folgt. Der Erwartungswert von Z ist damit λ und die Varianz von Z ist λ2 . a) Was versteht man im Allgemeinen unter einer stetigen Zufallsvariablen? b) Welche Eigenschaften weist eine beliebige Dichtefunktion auf? c) Bestimmen Sie den Maximum-Likelihood-Schätzer für den Parameter λ bei Vorliegen einer einfachen Stichprobe. Gehen Sie dabei von Pn zi n ∂ ln L(λ; z1 , . . . , zn ) = i=1 − 2 ∂λ λ λ aus. Welchen Wert nimmt der Schätzer aufgrund der vorliegenden Daten an? d) Überprüfen Sie den Maximum-Likelihood-Schätzer auf seine Erwartungstreue. e) Geben Sie die Wahrscheinlichkeit an, dass die Wartezeit e.1) länger als der Erwartungswert ist. e.2) zwischen 3 und 5 Stunden liegt. Verwenden Sie dazu den unter c) berechneten Schätzwert für λ. Hinweis: Falls Sie den Maximum-Likelihood-Schätzer für λ in Teilaufgabe c) nicht bestimmen konnten, verwenden Sie den Wert λ̂ML = 2. Aufgabe 3 Sei R1 die monatliche Rendite eines Dachfonds und R2 die monatliche Rendite einer Staatsanleihe. Es wird angenommen, dass R1 normalverteilt ist mit µ1 = 5 und σ12 = 10. Auch die Rendite der Staatsanleihe R2 wird als normalverteilt angenommen mit µ2 = 3 und σ22 = 4. Außerdem sind die beiden Renditen korreliert mit ρ = 0, 2. a) Skizzieren Sie die Dichtefunktion von R2 . b) Geben Sie die Wahrscheinlichkeit an, dass R1 zwischen 4 und 6 liegt. c) Wie groß ist die Wahrscheinlichkeit, dass die Summe der beiden Renditen gleich 12 ist? Es soll überprüft werden, wie sich die Differenz D = R1 −R2 der beiden durchschnittlichen Renditen entwickelt hat. Bezeichnen Sie dazu R1 als arithmetisches Mittel der monatlichen Renditen des Dachfonds über einen Zeitraum von 20 Monaten und R2 als arithmetisches Mittel der monatlichen Renditen der Staatsanleihe, ebenfalls über einen Zeitraum von 20 Monaten. d) Wie und mit welchen Parametern sind R1 und R2 jeweils verteilt? e) Berechnen Sie den Erwartungswert E R1 − R2 und die Varianz Var R1 − R2 . Hinweis: Cov[R1 , R2 ] = 0.0632. f) Für eine Stichprobe von 20 Monaten ergibt sich eine beobachtete mittlere Differenz 2 = 20. D = R1 − R2 von 2,03 und eine Stichprobenvarianz der Differenz von SD Überprüfen Sie mittels eines Mittelwertdifferenzentests für verbundene Stichproben, ob die Mittelwertdifferenz δ = µ1 − µ2 signifikant (α = 0, 05) von null verschieden ist. Aufgabe 4 Ein Automobilhersteller führt eine Studie zur Qualitätssicherung durch. Dafür wird bei n = 150 Vertragswerkstätten überprüft, wie genau die Inspektionsvorschriften eingehalten werden. Eine Inspektion gilt als nicht ordnungsgemäß erledigt, wenn eine Punktzahl X von 50 oder weniger erreicht worden ist. Aus Voruntersuchungen ist bekannt, dass die Punktzahl pro Betrieb einer Normalverteilung folgt. Als realisiertes Stichprobenmittel ergibt sich X n = 55. Die Stichprobenvarianz lautet Sn2 = 100. a) Überprüfen Sie anhand eines geeigneten statistischen Tests, ob im Mittel ordnungsgemäße Inspektionen durchgeführt worden sind (α = 0, 05). Interpretieren Sie das Ergebnis inhaltlich. Auf eine Interpretation des Fehlerrisikos kann verzichtet werden. b) Nehmen Sie Stellung zu folgender Aussage und begründen Sie kurz. Je größer die Stichprobenvarianz ist, desto größer muss das Stichprobenmittel (bei gleicher Stichprobengröße!) sein, damit die Behauptung von ordnungsgemäßen Inspektionen unterstützt wird. c) Illustrieren Sie den unter a) durchgeführten Test in einer Grafik. Skizzieren Sie hierzu die Verteilung der Teststatistik unter Gültigkeit der Nullhypothese und zeichnen Sie den Wert der Teststatistik ein. Hinweis: Wenn Sie Aufgabenteil a) nicht lösen konnten, verwenden Sie hierfür: t = 6, 5. d) Markieren Sie den Fehler 1. Art in Ihrer Zeichnung aus Teilaufgabe c) und erläutern Sie den Begriff des Fehlers 1. Art kurz (1-2 Sätze) im Allgemeinen. e) Was versteht man unter einem Fehler 2. Art im Allgemeinen (kurz, d.h. 1-2 Sätze)? Ist dieser in der Regel quantifizierbar? Lösung zu Aufgabe 1 a) P (schwarz aus U1 ) = 0.6 P (schwarz aus U2 ) = 0.44 b) n(2 schwarze Kugeln) = 3 c) P (2. Kugel weiß|1. Kugel schwarz) = 0, 5 d) P (U1 |Kugel weiß) = e) 18 43 Hypergeometrische Verteilung P (k) = S k N −S n−k N n mit k: Anzahl schwarzer Kugeln S: Anzahl schwarzer Kugeln gesamt N : Anzahl Kugeln gesamt f) p(3) = 0, 4079 Lösung zu Aufgabe 2 a) Eine Zufallsvariable die jeden Wert innerhalb eines Zahlenintervalls annehmen kann b) – Die Dichtefunktion nimmt nur positive Werte an. – Die Fläche unter der Kurve ist 1. Pn z ˆ L = i=1 i = 2, 475 c) λM n Pn i=1 zi = E(z1 )+E(zn2 )+...E(zn ) = d) E n e) e1) 1 − F (2, 475) = 0, 3679 e2) F (5) − F (3) = 0, 1650 nλ n =λ Lösung zu Aufgabe 3 a) Skizze: 0.20 Dichtefunktion von R2 0.15 0.1995 f(x) 0.00 0.05 0.10 0.121 −5 0 5 10 x b) P (4 < X < 6) = 0, 251 c) P (R1 + R2 = 12) = 0 d) R̄1 ∼ N (5; 10 20 ) 4 R̄2 ∼ N (3; 20 ) e) E(R̄1 − R̄2 ) = 2 V ar(R̄1 − R̄2 ) = 0, 5736 f) H0 : D̄ = 0 T = 2, 03 < t1− α2 ;n−1 = 2, 093 ⇒ H0 nicht verwerfen Lösung zu Aufgabe 4 a) Mittelwerttest bei unbekannter Varianz H0 : µ ≤ 50 T = 6, 1237 > λ0,95 = 1, 6448 ⇒ H0 verwerfen Die Vermutung, dass ordnungsgemäße Inspektionen durchgeführt wurden, wird unterstützt. b) Richtig. Begründung: Je größer die Stichprobenvarianz, desto kleiner die Prüfgröße, welche dann in nicht den Ablehnungsbereich der Nullhypothese fällt. c) Skizze: 0.2 0.1 f(x) 0.3 0.4 Verteilung unter Gültigkeit der Nullhypothese 0.0 Wert der Teststatistik Fehler 1. Art −5 0 5 x d) Der Fehler 1. Art entspricht der Wahrscheinlichkeit, die Nullhypothese abzulehnen, obwohl sie in Wirklichkeit zufrifft. e) Der Fehler 2. Art entspricht der Wahrscheinlichkeit, die Nullhypothese nicht abzulehnen, obwohl sie in Wirklichkeit falsch ist. Diese Wahrscheinlichkeit kann in der Regel nicht quantifiziert werden.