Statistik 2 A 2. Klausur Sommersemester 2013 Hamburg, 25.09.2013 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vorname: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Matrikelnummer: Studienfach: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fachsemester: Art der Anmeldung: STiNE Zulassung unter Vorbehalt Sonstiges Mit Ihrer nachfolgenden Unterschrift bestätigen Sie die Klausur auf Vollständigkeit überprüft zu haben. Diese Klausur besteht aus 8 Aufgaben und aus 14 Seiten. Unterschrift der/des Studierenden: Bemerkungen: Aufgabe 1 2 3 4 5 6 7 8 Summe max. Pkt. err. Pkt. 30 20 8 7 7 9 10 9 100 Klausur Statistik 2 Hamburg, 25.09.2013 Lösungstabelle für die Aufgaben 1 und 2 Hinweise für die Aufgaben 1.1 bis 1.10: • Es ist exakt eine Antwortmöglichkeit korrekt. • Zur Punktevergabe: (a) Wird ausschließlich die korrekte Antwort angekreuzt, so erhält man die volle Punktezahl. (b) In allen Fällen – außer der in (a) beschriebenen Situation – erhält man 0 Punkte. Hinweise für die Aufgaben 2.1 bis 2.5: • Es ist mindestens eine Antwortmöglichkeit korrekt. • Zur Punktevergabe: – Werden ausschließlich alle korrekten Antwortmöglichkeiten angekreuzt, so erhält man die volle Punktezahl. – Werden unter anderem korrekte Antwortmöglichkeiten angekreuzt, jedoch nicht ausschließlich alle korrekten Antwortmöglichkeiten, so erhält man 1 Punkt. Allgemeiner Hinweis: Falls Sie Ihre bereits gewählte Antwort revidieren möchten, so kreuzen Sie alle Felder der entsprechenden Zeile an und schreiben die korrekte(n) Antwort(en) neben die entsprechende Tabellenzeile. Aufgabe 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.10 2.1 2.2 2.3 2.4 2.5 (a) (b) (c) (d) × × × × × × × × × × × × × × × × × × -2- Klausur Statistik 2 Hamburg, 25.09.2013 Aufgabe 1 (30 Punkte) Hinweise: • In den Aufgaben 1.1 bis 1.10 ist exakt eine Antwortmöglichkeit korrekt. • Markieren Sie die korrekte Antwort durch ein Kreuz in der „Lösungstabelle für die Aufgaben 1 und 2“ auf Seite 2. Aufgabe 1.1 (3 Punkte) Gegeben sei die Funktion g durch 2 g:R →R (x, y) 7→ 1 27 1 9 0 falls x ∈ {0, 1, 2} ∧ y ∈ {0, 2, 4} falls x ∈ {3, 4} ∧ y ∈ {1, 3, 5} sonst Welche der nachfolgenden Aussagen ist korrekt? (a) Die Funktion g erfüllt alle Eigenschaften einer Wahrscheinlichkeitsfunktion. (b) Die Funktion g erfüllt alle Eigenschaften einer Dichtefunktion. (c) Die Funktion g erfüllt alle Eigenschaften einer Verteilungsfunktion. (d) Die Funktion g erfüllt keine der bisher genannten Eigenschaften. Aufgabe 1.2 (3 Punkte) Gegeben sei ein dreidimensionaler Zufallsvektor X = (X1 , X2 , X3 )T . Aus welcher der nachfolgenden Angaben lässt sich die Korrelationsmatrix Corr(X) eindeutig berechnen? (a) E(X) sowie V ar(X1 ), V ar(X2 ) und V ar(X3 ). (b) Cov(X). (c) Cov(X1 , X2 ), Cov(X1 , X3 ) und Cov(X2 , X3 ). (d) Aus keiner der bisherigen Angaben lässt sich Corr(X) berechnen. Aufgabe 1.3 (3 Punkte) Welche der nachfolgenden Beziehungen bzgl. zweier stetiger Zufallsvariablen ist nicht möglich? (a) V ar(X) = V ar(Y ) und ρX,Y > 0.5 (b) V ar(X) > V ar(Y ) und Cov(X, Y ) < 0 (c) V ar(X + Y ) < V ar(X) + V ar(Y ) (d) Alle bisherigen Beziehungen sind möglich. Dateipfad: mc/aufgabe1.tex -3- Klausur Statistik 2 Hamburg, 25.09.2013 Aufgabe 1.4 (3 Punkte) Der Zufallsvektor (X, Y )T sei bivariat normalverteilt mit V ar(X) > 0 und V ar(Y ) > 0. Aus welcher der nachfolgenden Angaben lässt sich auf die stochastische Unabhängigkeit der beiden Zufallsvariablen X und Y schließen? (a) Es gilt fX (x) · fY (y) = fX,Y (x, y) für alle x, y ∈ R. (b) Es gilt Cov(X, Y ) = V ar(X) = V ar(Y ) = 1. (c) Es gilt Cov(X, Y ) = V ar(X) · V ar(Y ). (d) Aus keiner der bisherigen Angaben folgt die stochastische Unabhängigkeit. Aufgabe 1.5 (3 Punkte) Es sollen die Momentenmethode und die Maximum-Likelihood-Methode (ML-Methode) zur Parameterschätzung miteinander verglichen werden. Welche der nachfolgenden Aussagen ist korrekt? (a) Die ML-Methode ist „schwieriger“ als die Momentenmethode. (b) Momentenmethode und ML-Methode müssen nicht notwendigerweise dieselben Parameterschätzer liefern. (c) Die ML-Methode wird angewendet, wenn die Momentenmethode zu keinem Resultat führt. (d) Die Momentenmethode und die ML-Methode liefern immer unverzerrte Parameterschätzer. Aufgabe 1.6 (3 Punkte) Betrachtet wird der Annahmebereich sowie der Ablehnungsbereich beim statistischen Hypothesen testen. Welche der nachfolgenden Aussagen ist korrekt? (a) Der Ablehnungsbereich ist immer größer als der Annahmebereich. (b) Es existiert ein Element, welches sowohl im Annahmebereich als auch im Ablehnungsbereich vorkommt. Dieses Element stellt die Grenze zwischen beiden Bereichen dar. (c) Annahmebereich und Ablehnungsbereich sind immer überschneidungsfrei. (d) Annahmebereich und Ablehnungsbereich sind immer gleichgroß. Dateipfad: mc/aufgabe1.tex -4- Klausur Statistik 2 Hamburg, 25.09.2013 Aufgabe 1.7 (3 Punkte) Betrachtet wird der χ2 -Anpassungstest. Welche der nachfolgenden Aussagen ist korrekt? (a) Die Parameter der in der Nullhypothese unterstellten Verteilung müssen immer über Momentenmethode oder Maximum-Likelihood-Methode geschätzt werden. (b) Der Test kann nur für stetige Verteilungen durchgeführt werden. (c) Der Ablehnungsbereich ist immer einseitig. (d) Keine der bisherigen Aussagen ist korrekt. Aufgabe 1.8 (3 Punkte) Betrachtet wird das lineare Einfachregressionsmodell. Welche der nachfolgenden Aussagen ist korrekt? ˜ β̂˜ und σ̂ ˜ 2 niemals die (a) Für einen gegebenen Datensatz treffen die Schätzfunktionen α̂, wahren Parameter α, β und σ 2 . ˜ β̂˜ und σ̂ ˜ 2 sind unverzerrt. (b) Die Parameterschätzfunktionen α̂, ˜ 2 besitzt keine Varianz, da sie selbst ein Varianzschät(c) Die Parameterschätzfunktion σ̂ zer ist. (d) Keine der bisherigen Aussagen ist korrekt. Aufgabe 1.9 (3 Punkte) Gegeben sei nachfolgender R-Output für ein multiples lineares Regressionsmodell mit drei unabhängigen Variablen A, B und C. Coefficients: Estimate t value Pr(>|t|) (Intercept) -610.42387 -59.539 0.123248 A 65.29308 100.922 < 2e-16 B 8.35889 139.454 0.038655 C 0.77610 3.709 0.000213 Die Regressionsgleichung lautet: Yi = β0 +β1 Ai +β2 Bi +β3 Ci +˜i .Welche der nachfolgenden Aussagen ist korrekt? (a) Die Nullhypothese H0 : β0 = 0 kann auf dem 10%-Signifikanzniveau abgelehnt werden. (b) Die Nullhypothese H0 : β1 = 0 kann auf dem 10%, dem 1% und dem 0.1%Signifikanzniveau abgelehnt werden. (c) Die Nullhypothese H0 : β2 = 0 kann auf dem 1%-Signifikanzniveau abgelehnt werden. (d) Keine der bisherigen Aussagen ist korrekt. Dateipfad: mc/aufgabe1.tex -5- Klausur Statistik 2 Hamburg, 25.09.2013 Aufgabe 1.10 (3 Punkte) Betrachtet werden stochastische Zeitreihenmodelle. Welche der nachfolgenden Aussagen ist korrekt? (a) Starke Stationarität impliziert schwache Stationarität. (b) Schwache Stationarität impliziert starke Stationarität. (c) Starke und schwache Stationarität sind synonyme Begriffe. (d) Keine der bisherigen Aussagen ist korrekt. Dateipfad: mc/aufgabe1.tex -6- Klausur Statistik 2 Hamburg, 25.09.2013 Aufgabe 2 (20 Punkte) Hinweise: • In den Aufgaben 2.1 bis 2.5 ist mindestens eine Antwortmöglichkeit korrekt. • Markieren Sie die korrekte(n) Antwort(en) durch ein Kreuz bzw. mehrere Kreuze in der „Lösungstabelle für die Aufgaben 1 und 2“ auf Seite 2. Aufgabe 2.1 (4 Punkte) Welche der nachfolgenden (sich gegenseitig ausschließenden) Bedingungen führen dazu, dass die Summe der Varianzen verschiedener Zufallsvariablen X1 , . . . , Xn gleich der Varianz der Summe dieser Zufallsvariablen X1 , . . . , Xn ist? (a) Cov(Xi , Xj ) = 0 für alle i, j = 1, . . . , n. (b) Cov(Xi , Xj ) = 0 für alle i 6= j. (c) Cov(Xi , Xj ) = 0 für alle i = j. (d) Cov(Xi , Xj ) = 0 für mindestens ein (i, j)-Paar. Aufgabe 2.2 (4 Punkte) Betrachtet wird die Maximum-Likelihood-Methode (ML-Methode). Welche der nachfolgenden Aussagen sind korrekt? (a) Die Likelihoodfunktion muss differenzierbar sein um analytisch einen Schätzer für den unbekannten Parametervektor θ bestimmen zu können. (b) Die Wahrscheinlichkeits- bzw. Dichtefunktion der zugrundeliegenden Zufallsvariablen muss bekannt sein um die Likelihoodfunktion aufstellen zu können. (c) Die Likelihoodfunktion muss integrierbar sein um analytisch einen Schätzer für den unbekannten Parametervektor θ bestimmen zu können. (d) Keine der bisherigen Aussagen ist korrekt. Aufgabe 2.3 (4 Punkte) Betrachtet werden allgemeine Konfidenzintervalle. Welche der nachfolgenden Aussagen sind korrekt? (a) Die Grenzen eines Konfidenzintervalls erhält man durch die Anwendung einer Schätzfunktion auf zwei unterschiedliche Datensätze. (b) Die Wahrscheinlichkeit, dass der wahre Parameter innerhalb eines Konfidenzintervalls liegt ist größer oder gleich Eins minus Irrtumswahrscheinlichkeit. (c) Ein Konfidenzintervall liegt immer symmetrisch um den wahren Parameter. (d) Der wahre, aber unbekannte Parameter liegt immer innerhalb des Konfidenzintervalls. Dateipfad: mc/aufgabe2.tex -7- Klausur Statistik 2 Hamburg, 25.09.2013 Aufgabe 2.4 (4 Punkte) Betrachtet wird das Signifikanzniveau α0 eines Hypothesentests. Welche der nachfolgenden Aussagen sind korrekt? (a) Das Signifikanzniveau ist die Wahrscheinlichkeit, mit der ein α-Fehler eines Hypothesentests maximal auftreten kann. (b) Das Signifikanzniveau kann den Wert 0 annehmen. (c) Das Signifikanzniveau kann den Wert 1 annehmen. (d) Keine der bisherigen Aussagen ist korrekt Aufgabe 2.5 (4 Punkte) Betrachtet wird eine multiple lineare Regression mit zwei unabhängigen (bezeichnet mit X1 und X2 ) und einer abhängigen (bezeichnet mit Y ) Variablen, wie in der Vorlesung eingeführt. Welche der nachfolgenden Aussagen sind korrekt? (a) Es existieren exakt zwei Regressionskoeffizienten (β1 und β2 ) welche aus den Daten geschätzt werden müssen. (b) Das Produkt X T X ist eine Matrix mit zwei Zeilen und so vielen Spalten, wie es Beobachtungen gibt. (c) Wurden die Regressionskoeffizienten geschätzt, so ist die empirische Varianz der Residuen Null. (d) Keine der bisherigen Aussagen ist korrekt. Dateipfad: mc/aufgabe2.tex -8- Klausur Statistik 2 Hamburg, 25.09.2013 Aufgabe 3 (8 Punkte) Gegeben seien die beiden diskreten Zufallsvariablen X und Y sowie nachfolgende gemeinsame Warhscheinlichkeitstabelle. X 2 1 0.1 3 0.1 4 0.2 Y 4 0.1 0.1 0.1 6 0.1 0.1 0.1 Berechnen Sie den Korrelationskoeffizienten von X und Y . Lösung von Aufgabe 3 Es ist: E(X) = 1 · 0.3 + 3 · 0.3 + 4 · 0.4 = 2.8 E(Y ) = 2 · 0.4 + 4 · 0.3 + 6 · 0.3 = 3.8 E(X 2 ) = 12 · 0.3 + 32 · 0.3 + 42 · 0.4 = 9.4 E(Y 2 ) = 22 · 0.4 + 42 · 0.3 + 62 · 0.3 = 17.2 Damit erhält man: V ar(X) = E(X 2 ) − E 2 (X) = 9.4 − 2.82 = 1.56 V ar(Y ) = E(Y 2 ) − E 2 (Y ) = 17.2 − 3.82 = 2.76 Für die Kovarianz gilt: E(X · Y ) = 1 · 2 · 0, 1 + . . . + 4 · 6 · 0.1 = 10.4 Cov(X, Y ) = E(X · Y ) − E(X) · E(Y ) = 10.4 − 2.8 · 3.8 = −0.24 Damit erhält man für den Korrelationskoeffizienten: ρX,Y = q Cov(X, Y ) V ar(X) · V ar(Y ) Dateipfad: rechenaufg/aufgabe1.tex =√ -9- −0.24 = −0.115663 1.56 · 2.76 Klausur Statistik 2 Hamburg, 25.09.2013 Aufgabe 4 (7 Punkte) Gegeben sei eine stetige Zufallsvariable X mit nachfolgender Dichtefunktion. 1 3 fX (x) = a 0 x2 + 2 3a für x ∈ [0, a] sonst Für den Datensatz mit den Werten 1, 2, 2, 2, 2, 6 berechne man mittels Momentenmethode einen Schätzer für den unbekannten Parameter a > 0. Lösung von Aufgabe 4 Für den Erwartungswert berechnet man: E(X) = Z a 0 fX (x) · xdx = Z a 0 1 3 1 4 2 1 x + xdx = x + x2 3 3 a 3a 4a 3a a 0 a a 7a = + = 4 3 12 Damit erhält man für den Momentenschätzer: 7â = x̄ 12 ⇔ â = 12 · x̄ 7 Dateipfad: rechenaufg/aufgabe2.tex ⇔ -10- â = 12 · 15 30 6 = = 4.285714 7 7 Klausur Statistik 2 Hamburg, 25.09.2013 Aufgabe 5 (7 Punkte) Aus einer normalverteilten Grundgesamtheit wird eine uneingeschränkte Zufallsstichprobe vom Umfang n = 30 gezogen. Dabei resultierten nachfolgende Ergebnisse: 30 X 30 X xi = 315 i=1 x2i = 439056 i=1 Berechnen Sie ein 95%-Konfidenzintervall für die Varianz der Grundgesamtheit. Lösung von Aufgabe 5 Für das arith. Mittel sowie die erwartungstreue Varianzschätzung erhält man: 315 = 10.5 30 30 1 X 1 30 n 2 š = x̄2 = · 439056 − · 10.52 ≈ 15025.81 x2i − n − 1 i=1 n−1 29 29 x̄ = Mit χ20.025 (29) = 16.047 und χ20.975 (29) = 45.722 erhält man als 95%-Konfidenzintervall: 29 · 15025.81 29 · 15025.81 ; ≈ [9530.39 ; 27154.51] 45.722 16.047 Dateipfad: rechenaufg/aufgabe3.tex -11- Klausur Statistik 2 Hamburg, 25.09.2013 Aufgabe 6 (9 Punkte) Für zwei gemeinsam normalverteilte Zufallsvariablen (X, Y ) soll der Korrelationstest betrachtet werden. Welcher Stichprobenumfang ist mindestens nötig, damit bei einem empirischen Korrelationskoeffizienten von rx,y = 0.557 die Nullhypothese H0 : ρ = 0.5 gegen die Alternativhypothese H1 : ρ 6= 0.5 auf dem 5%-Signifikanzniveau abgelehnt wird? Lösung von Aufgabe 6 Prüfgröße nach n auflösen liefert: " Gρ0 6=0 1 + RX,Y 1 ln = 2 1 − RX,Y ! 1 + ρ0 − ln 1 − ρ0 !# √ n−3 2 G i n = 1 h 1+RX,Y +3 1+ρ0 ln 1−RX,Y − ln 1−ρ0 2 ⇔ Einsetzen ergibt (z0.975 = 1.96): 2 1.96 i + 3 = 615.9473 n = 1 h 1+0.557 1+0.5 ln − ln 2 1−0.557 1−0.5 Ab einer Stichprobengröße von n = 616 wird obige Nullhypothese auf dem 5%-Signifikanzniveau abgelehnt. Dateipfad: rechenaufg/aufgabe4.tex -12- Klausur Statistik 2 Hamburg, 25.09.2013 Aufgabe 7 (10 Punkte) Es soll untersucht werden, ob eine bestimmte Grundgesamtheit als geometrisch verteilt angesehen werden kann. Eine Stichprobe vom Umfang n = 80 lieferte: xi ni 1 20 2 22 3 20 4 5 14 4 Führen Sie einen χ2 -Anpassungstest auf einem 5%-Signifikanzniveau durch und begründen Sie Ihr Vorgehen. Hinweis: Eine geometrisch verteilte Zufallsvariable X besitzt die Wahrscheinlichkeitsfunktion (p ∈ (0, 1)) P (X = x) = p(1 − p)x−1 für x = 1, 2, 3, . . . sowie nachfolgenden Erwartungswert und Varianz: E(X) = 1 p V ar(X) = 1−p p2 Lösung von Aufgabe 7 Es muss zuerst der Parameter p geschätzt werden (Momentenmethode): p̂ = n 80 80 1 = P80 = = = 0.4 x̄ 20 + 44 + 60 + 56 + 20 200 i=1 xi Nun werden die theoretischen Häufigkeiten ermittelt. N1 N2 N3 N4 N5 = 0.4(1 − 0.4)1−1 · = 0.4(1 − 0.4)2−1 · = 0.4(1 − 0.4)3−1 · = 0.4(1 − 0.4)4−1 · = 0.4(1 − 0.4)5−1 · 80 = 32 80 = 19.2 80 = 11.52 80 = 6.912 80 = 4.1472 Damit sind die Voraussetzungen für die Anwendung des χ2 -Anpassungstests erfüllt. Für die Prüfgröße erhält man: g= (20 − 32)2 (4 − 4.1472)2 + ... + = 18.4243 32 4.1472 Da χ20.95 (5 − 1 − 1) = χ20.95 (3) = 7.815 < 18.4243 = g gilt, folgt, dass H0 auf dem 5%-Signifikanzniveau abgelehnt werden kann. Dateipfad: rechenaufg/aufgabe5.tex -13- Klausur Statistik 2 Hamburg, 25.09.2013 Aufgabe 8 (9 Punkte) Für einen bivariaten Datensatz, bestehend aus n = 30 Wertepaaren, seien nachfolgende Größen gegeben: x̄ = 12 š2x = 100 30 X ȳ = 36 š2y = 256 xi yi = 1200 i=1 Es wird ein lineares Einfachregressionsmodell (siehe Vorlesung) zwischen X (unabhängige Variable) und Y (abhängige Variable) unterstellt. (a) Berechnen Sie die Ausgleichsgerade. (b) Geben Sie ein 95%-Konfidenzintervall für den Parameter α an. Hierbei sei die geschätzte Varianz der Residuen durch σ̂ 2 = 88 gegeben. Lösung von Aufgabe 8 (a) Man berechnet: P30 i=1 (xi − x̄)2 = 29 · 100 = 2900. Damit erhält man: 1200 − 30 · 12 · 36 = −4.055172 2900 α̂ = 36 − (−4.055172) · 12 = 84.66206 β̂ = Damit lautet die Ausgleichsgerade: ŷ = 84.66206 − 4.055172 · x (b) Man berechnet: P30 i=1 x2i = 2900 + n · x̄2 = 2900 + 30 · 122 = 7220. Damit erhält man: σ̂α̂2˜ = 88 · 7220 = 7.302989 30 · 2900 Für das Konfidenzintervall ergibt sich somit (t0.975 (28) = 2.048): h i √ 84.66206 − 7.302989 · 2.048 ; 84.66206 + . . . = [79.12754 ; 90.19658] Dateipfad: rechenaufg/aufgabe6.tex -14-