Aufgabe 1 (2 + 4 + 2 + 1 Punkte) Gegeben sei folgende zweidimensionale Wahrscheinlichkeitsdichtefunktion zweier Zufallsvariablen X und Y : 2x + 23 y für − 0.5 ≤ x ≤ 0.5, 1 ≤ y ≤ 2 f (x, y) = 0 sonst. a) Berechnen Sie die Randdichte f (y). R 0.5 0.5 = 23 y f (y) = −0.5 f (x, y) dx = [x2 + 23 xy]−0.5 b) Berechnen Sie die Varianz von Y . R2 E(Y ) = 1 y 23 y dy = [ 29 y 3 ]21 = 1.56 R2 E(Y 2 ) = 1 y 2 32 y dy = [ 16 y 4 ]21 = 2.5 var(Y ) = 2.5 − 1.562 = 0.066 c) Leiten Sie die bedingte Dichtefunktion f (x|Y = y) her. f (x|Y = y) = f (x,y) f (x) = 2x+ 32 y 2 y 3 = 3 xy + 1 d) Sind X und Y stochastisch unabhängig? X und Y sind stochastisch abhänging, da die Unabhängikeitsbedingung f (x, y) = f (x) · f (y) nicht erfüllt werden kann. Aufgabe 2 (6 Punkte) Ein Unternehmen befüllt Päckchen mit Zucker. Das Gewicht X der Päckchen habe Mittelwert 2 µX und Varianz σX . Um die mittlere Füllmenge zu überprüfen, sieht die Arbeitsanweisung vor, dass regelmäßig Stichproben vom Umfang n entnommen werden und das Gewicht X gemessen wird. Hiermit sind die Mitarbeiter A und B beauftragt. • Mitarbeiter A entnimmt nach Vorschrift eine Stichprobe der Länge n, misst das Gewicht X und gibt den Mittelwert seiner Beobachtungen weiter. • Mitarbeiter B entnimmt nur die Hälfte der vorgeschriebenen Stichprobe, notiert dann allerdings jeden der gemessenen Werte zweimal, so dass seine Vorgesetzten nicht merken, dass er zu wenig Päckchen gemessen hat. Anschließend gibt er den Mittelwert seiner Beobachtungen weiter. a) Berechnen Sie die Erwartungswerte der geschätzten Mittelwerte der Mitarbeiter A und B. P P E(Â) = E( n1 ni=1 Xi = n1 ni=1 E(Xi ) = n1 n µX = µX P Pn/2 1 1 E B̂) = E( n1 n/2 i=1 2 · Xi = n i=1 2 · E(Xi ) = n 2 · n/2 µX = µX b) Berechnen Sie die Varianzen der geschätzten Mittelwerte der Mitarbeiter A und B. P var(Â) = var( n1 ni=1 Xi ) = n12 n var(X) = n1 σ 2 P Pn/2 1 4 n 2 2 var(B̂) = var( n1 n/2 i=1 2 · Xi ) = n2 i=1 var 2Xi = n2 2 var(X) = n σ c) Sind die geschätzten Mittelwerte konsistent? (Begründung!) Sowohl  als auch B̂ sind erwartungstreu. Ebenfalls geht bei beiden Schätzern die Varianz für n → ∞ gegen 0. Somit sind Sie konsistent. Aufgabe 3 (5 + 2 + 1 Punkte) Betrachten Sie die Zufallsvariable X mit folgender Dichtefunktion, c ∈ R: 1 −1 x e c x≥0 c f (x) = 0 sonst. Außerdem ist E(X) = c. Gegeben sei nun eine stochastisch unabhängig, identisch verteilte Stichprobe aus der Verteilung von X vom Umfang n. a) Zeigen Sie, dass für den Maximum-Likelihood-Schätzer von c gilt: n 1X xi ĉ = n i=1 Q 1 L = ni=1 1c e− c xi P P 1 − 1c xi ln L = ni=1 ln( ) = −n ln c − 1c ni=1 xi e Pc d ln L n = −P + c2xi = 0 dc c ⇒ c = n1 ni=1 xi b) Zeigen Sie die Erwartungstreue von ĉ. P P E(ĉ) = E( n1 ni=1 Xi ) = n1 ni=1 E(Xi ) = 1 n nc = c c) Bekanntlich sind Maximum-Likelihood-Schätzer asymptotisch erwartungstreu. Erläutern Sie kurz diese Eigenschaft. Für unendlich große Stichprobenumfänge ist der Erwartungswert des Schätzers der wahre Parameter. Aufgabe 4 (1 + 6 + 2 Punkte) Bei einem Kaufhaus werden an einem Samstag minütlich die Kunden gezählt, die das Kaufhaus betreten. Dadurch erhält man eine Stichprobe des Umfangs n. Gehen sie im Folgenden davon aus, dass n als sehr groß betrachtet werden kann. Als mittlere minütliche Kundenanzahl wird am Ende des Tages x̄ = 7 ermittelt. a) Bestimmen Sie den Stichprobenumfang n bei einer Öffnungszeit von 9 Uhr bis 20 Uhr. 11 Stunden a 60 Minuten, d.h. n = 660 b) Bestimmen Sie das Konfidenzintervall zu α = 0.1 der minütlichen Kundenanzahl unter der Annahme, dass die Kundenanzahl pro Minute poissonverteilt ist. z0.95 = 1.65, damit " √ # √ 7 7 ; 7 + 1.65 · √ = [6.83, 7.17] 7 − 1.65 · √ 660 660 c) Wie könnten Sie ein Konfidenzintervall erstellen, wenn Sie nur n = 10 Beobachtungen hätten? (Nur Idee, keine Rechnung) Berechnung des KI über Tschebycheff. Aufgabe 5 (6 + 2 + 2 Punkte) Bei einer Untersuchung wurde die Bearbeitungszeit einer Statistikaufgabe bei n = 14 Studierenden gemessen. Gehen Sie davon aus, dass die Bearbeitungszeiten stochastisch unabhängig und identisch normalverteilt sind. Es ergaben ein Mittelwert von x̄ = 42 Minuten und eine q sich P14 1 ∗ gemessene Standardabweichung von s = 13 i=1 (xi − x̄)2 = 7 Minuten. a) Bestimmen Sie das Konfidenzintervall zu α = 0.1. −1 T13 (0.95) = 1.771 und damit 7 7 I := 42 − 1.771 ∗ √ ; 42 + 1.65 ∗ √ = [38.687; 45.3132] 14 14 b) Wie ändert sich (bei ansonsten unveränderten Bedingungen) obiges Konfidenzintervall, falls 1) nur bei 10 Studierenden die Bearbeitungszeit gemessen wird? Das KI wird breiter. 2) die Standardabweichung 14 Minuten beträgt? Das KI wird breiter (doppelt so breit). (Nur Begründung, keine Rechnung) c) Entscheiden Sie anhand des in a) berechneten Konfidenzintervalls über folgende Hypothese zum Niveau α = 0.1: H0 : µ = 40 gegen H1 : µ 6= 40 Beibehaltung der Nullhypothese, da 40 ∈ I. Aufgabe 6 (4 + 4 Punkte) Ein Schraubenhersteller behauptet, dass seine Maschine Schrauben der Länge 20mm und Varianz 0.3mm2 produziert. Eine stochastisch unabhägig, identisch verteilte Stichprobe der Länge n = 9 ergab: 9 x̄ = 19.85 s 2∗ 1X (xi − x̄)2 = 0.42mm2 = 8 i=1 Gehen Sie im Folgenden davon aus, dass die Schraubenlänge normalverteilt ist. a) Testen Sie mit der Fehlerwahrscheinlichkeit α = 0.01 die folgende Hypothese: H0 : σ 2 ≤ 0.3 T = (n−1)s2 = 8·0.42 0.3 σ02 (χ2 )−1 (1 − α) n−1 gegen H1 : σ 2 > 0.3. = 11.2 k= = (χ2 )−1 8 = 20.1 Die Nullhypothese kann mit α = 0.01 nicht abgelehnt werden. b) Testen Sie mit der Fehlerwahrscheinlichkeit α = 0.01 die folgende Hypothese: H1 : µ = 20 gegen µ 6= 20. √ 19.85−20 √ 0 | = | 9 √0.42 | = | − 0.694| = 0.694 T = | n x̄−µ s −1 k = Tn−1 (1 − α/2) = T8−1 (0.995) = 3.36 Die Nullhypothese kann mit α = 0.01 nicht abgelehnt werden. Aufgabe 7 (7 Punkte) Es soll der Zusammenhang zwischen der Wahl eines Fahrzeugtyps und der Anzahl an Strafmandaten, die vom jeweiligen Fahrer innerhalb eines Jahres “eingefahren” hat, untersucht werden. Eine Stichprobe von 100 Fahrzeughaltern, die über ein Jahr lang beobachtet wurden, ergab folgende Ergebnisse: Strafmandate höchstens 1 2 oder 3 mehr als 3 Kleinwagen 30 20 10 Mittelklasse 0 10 20 Luxusklasse 0 0 10 Testen Sie mit einer Fehlerwahrscheinlichkeit α = 0.1 folgendes Hypothesenpaar: H0 : Fahrzeugtyp und Anzahl an Strafmandaten sind stochastisch unabhängig. gegen H1 : Fahrzeugtyp und Anzahl an Strafmandaten sind stochastisch abhängig. Damit die Regel np̂i· p̂·j > 5 erfüllt ist, müssen Mittel- und Luxusklasse zusammengelegt werden. Pk P 2 2 2 (nij −np̂i· p̂·j )2 2 χemp = i=1 m = (30−100·0.3·0.6) + (0−100·0.3·0.4) + . . . + (30−100·0.4·0.4) = j=1 p̂i· p̂·j 100·0.3·0.6 100·0.3·0.4 100·0.4·0.4 8 + 12 + 0.22 + 0.33 + 8.17 + 12.25 = 40.97 2 −1 k = (χ2 )−1 (k−1)(l−1) (1 − α) = (χ )(3−1)·(2−1) (0.9) = 4.6052 Die Nullhypothese kann mit α = 0.1 abgelehnt werden. Aufgabe 8 (3 + 2 + 2 + 5 + 1 Punkte) Es soll untersucht werden, ob ein linearer Zusammenhang zwischen dem Alter (X) und dem Einkommen (Y ) einer Person besteht. Hierfür stehen folgende Daten zur Verfügung: Student i Alter (xi ) Einkommen (in Tausend Euro) (yi ) 1 2 3 35 23 29 38 22 31 4 49 54 5 38 39 P 174 184 Daraus werden folgende Statistiken berechnet: 5 X x2i = 6440, i=1 5 X yi2 = 7326, i=1 5 X xi yi = 6863. i=1 Unterstellen Sie das lineare Regressionsmodell: Yi = a + bxi + Ui mit unabhängig normalverteilten Zufallsvariablen Ui mit Erwartungswert E(Ui ) = 0 und Varianz σU2 . a) Zeigen Sie, dass für obigen Datensatz gilt: â = −4.78 und b̂ = 1.195. x̄ = 34.8 x¯2 = 1288 s2x = 1288 − 34.82 = 76.96 ȳ = 36.8 y¯2 = 1465 s2y = 1465 − 36.82 = 110.76 xy ¯ = 1372.6 sxy = 1372.6 − 34.8 · 36.8 = 91.96 92.4 b̂ = ssxy2 = 76.96 = 1.1949 x â = ȳ − b̂x̄ = 36.8 − 1.195 · 34.8 = −4.78 b) Interpretieren Sie â und b̂ am Sachverhalt. Ein Alter von 0 Jahren würde ein Einkommen von -4.78. Für jedes Jahr, dass man älter wird, steigt das Einkommen um 1.195 an. c) Bestimmen Sie die geschätzte Residuenvarianz σ̂U2 . σ̂ 2 = n (s2 n−2 y − b̂sxy ) = 53 (110.76 − 1.195 · 91.496) = 1.78 d) Testen Sie mit einer Fehlerwahrscheinlichkeit von α = 0.05, ob das Alter einen signifikanten Einfluss auf das Einkommen hat. Hypothesen: H0 : b = 0 σ̂ 2 1.78 σ̂b2 = ns 2 = 5·76.96 = 0.00463 gegen H1 : b 6= 0 x 0 Teststatistik: b̂−b = √1.195−0 = 17.57 σ̂b 0.00463 −1 Kritische Schranke k: Tn−2 (1 − α/2) = T3−1 (0.975) = 3.18 Testentscheidung: H0 kann mit α = 0.05 abgelehnt werden, da 17.57 > 3.18. e) Welches Einkommen wird nach diesem Modell eine Person erzielen, die 32 Jahre alt ist? y(32) = −4.78 + 1.195 · 32 = 33.46