Statistik 1 A 1. Klausur Wintersemester 2012/2013 Hamburg, 12.02.2013 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN! Nachname: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vorname: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Matrikelnummer: Studienfach: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fachsemester: Art der Anmeldung: STiNE Zulassung unter Vorbehalt Sonstiges Mit Ihrer nachfolgenden Unterschrift bestätigen Sie die Klausur auf Vollständigkeit überprüft zu haben. Diese Klausur besteht aus 8 Aufgaben und aus 15 Seiten. Unterschrift der/des Studierenden: Bemerkungen: Aufgabe 1 2 3 4 5 6 7 8 Summe max. Pkt. err. Pkt. 30 20 8 8 10 7 9 8 100 Klausur Statistik 1 Hamburg, 12.02.2013 Lösungstabelle für die Aufgaben 1 und 2 Hinweise für die Aufgaben 1.1 bis 1.10: • Es ist exakt eine Antwortmöglichkeit korrekt. • Zur Punktevergabe: (a) Wird ausschließlich die korrekte Antwort angekreuzt, so erhält man die volle Punktezahl. (b) In allen Fällen – außer der in (a) beschriebenen Situation – erhält man 0 Punkte. Hinweise für die Aufgaben 2.1 bis 2.5: • Es ist mindestens eine Antwortmöglichkeit korrekt. • Zur Punktevergabe: – Werden ausschließlich alle korrekten Antwortmöglichkeiten angekreuzt, so erhält man die volle Punktezahl. – Werden unter anderem korrekte Antwortmöglichkeiten angekreuzt, jedoch nicht ausschließlich alle korrekten Antwortmöglichkeiten, so erhält man 1 Punkt. Allgemeiner Hinweis: Falls Sie Ihre bereits gewählte Antwort revidieren möchten, so kreuzen Sie alle Felder der entsprechenden Zeile an und schreiben die korrekte(n) Antwort(en) neben die entsprechende Tabellenzeile. Aufgabe 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.10 2.1 2.2 2.3 2.4 2.5 (a) (b) (c) (d) × × × × × × × × × × × × × × × × × × × -2- Klausur Statistik 1 Hamburg, 12.02.2013 Aufgabe 1 (30 Punkte) Hinweise: • In den Aufgaben 1.1 bis 1.10 ist exakt eine Antwortmöglichkeit korrekt. • Markieren Sie die korrekte Antwort durch ein Kreuz in der „Lösungstabelle für die Aufgaben 1 und 2“ auf Seite 2. Aufgabe 1.1 (3 Punkte) Welche der nachfolgenden Aussagen ein Kreisdiagramm betreffend ist korrekt? (a) Multipliziert man die absoluten Häufigkeiten eines Merkmals mit 360◦ , so erhält man die zugehörigen Winkel für das Kreisdiagramm. (b) Der Winkel eines „Kuchenstücks“ im Kreisdiagramm ist äquivalent zur relativen Häufigkeit. (c) Die Fläche eines „Kuchenstücks“ im Kreisdiagramm ist die relative Häufigkeit. (d) Die Summe aller Fläche im Kreisdiagramm ist gleich Eins. Aufgabe 1.2 (3 Punkte) Welche der nachfolgenden Aussagen die Transformationsregel betreffend ist korrekt? (a) Die Transformationsregel gilt nur für Datensätze ohne negative Merkmalsausprägungen. (b) Die Transformationsregel gilt nur für Datensätze mit einem arithmetischen Mittel ungleich Null (x̄ 6= 0). (c) Die Transformationsregel gilt nur für Datensätze mit einer Varianz kleiner als Null (s2x < 0). (d) Keine der bisherigen Aussagen ist korrekt. Aufgabe 1.3 (3 Punkte) Welche der nachfolgenden Aussagen die Kleinste-Quadrate-Schätzung (KQ-Regressionsgerade) betreffend ist zutreffend? (a) Die KQ-Regressionsgerade minimiert die Summe der horizontalen Abstände zwischen ihr und den bivariaten Daten. (b) Die KQ-Regressionsgerade minimiert die Summe der vertikalen Abstände zwischen ihr und den bivariaten Daten. (c) Die KQ-Regressionsgerade minimiert die Summe der quadrierten horizontalen Abstände zwischen ihr und den bivariaten Daten. (d) Keine der bisherigen Aussagen ist korrekt. Dateipfad: mc/aufgabe1.tex -3- Klausur Statistik 1 Hamburg, 12.02.2013 Aufgabe 1.4 (3 Punkte) Gegeben sei ein – nicht notwendigerweise fairer – Würfel, d.h. Ω = {1, 2, 3, 4, 5, 6}. Welche der nachfolgenden Aussagen ist korrekt? (a) Die Wahrscheinlichkeit eine gerade Zahl zu würfeln ist immer so groß wie die Wahrscheinlichkeit eine ungerade Zahl zu würfeln. (b) Die Wahrscheinlichkeit eine gerade Zahl zu würfeln muss sich mit der Wahrscheinlichkeit eine ungerade Zahl zu würfeln nicht immer zu Eins addieren. (c) Die Wahrscheinlichkeit eine Zahl kleiner oder gleich Vier zu würfeln ist immer größer als die Wahrscheinlichkeit eine Zahl echt größer als Vier zu würfeln. (d) Keine der bisherigen Aussagen ist korrekt. Aufgabe 1.5 (3 Punkte) Der Ausdruck P (A) = n X P (A | Bi ) · P (Bi ) i=1 beschreibt den Satz von der totalen Wahrscheinlichkeit. Welche der nachfolgenden Aussagen diesbezüglich ist korrekt? (a) Der Satz gilt nur, falls das Ereignis A von den Ereignissen Bi (i = 1, . . . , n) stochastisch unabhängig ist. (b) Der Satz gilt nur, falls für mindestens eine (i, j)-Kombination mit i 6= j gilt, dass der Schnitt aus Bi und Bj nicht leer ist. (c) Der Satz gilt nur, falls Pn i=1 P (A ∩ Bi ) = 1 Gültigkeit besitzt. (d) Keine der bisherigen Aussagen ist korrekt. Aufgabe 1.6 (3 Punkte) Betrachtet wird die Zufallsvariable X ∼ χ2 (n). Welche der nachfolgenden Aussagen ist korrekt? (a) Der Erwartungswert der Zufallsvariablen X ist für alle n ∈ N kleiner als die Varianz der Zufallsvariablen X. (b) Ist die Anzahl der Freiheitsgrade sehr groß, so kann die Verteilungsfunktion Werte größer als Eins annehmen. (c) Die Dichtefunktion der Zufallsvariablen X ist symmetrisch zur ersten Winkelhalbierenden. (d) Keine der bisherigen Aussagen ist korrekt. Dateipfad: mc/aufgabe1.tex -4- Klausur Statistik 1 Hamburg, 12.02.2013 Aufgabe 1.7 (3 Punkte) Sie möchten einen Spezialfall der Ungleichung von Markow anwenden, nämlich P (X ≥ ) ≤ E(X) für eine nichtnegative Zufallsvariable X auf einem Wahrscheinlichkeitsraum (Ω, A , P ) mit > 0. Für welche der nachfolgenden Aussagen erhalten Sie für obige Ungleichung eine triviale Information? (a) Für E(X) < V ar(X). (b) Für 0 ≤ ≤ 1. (c) Für E(X) ≥ . (d) Keine der bisherigen Aussagen liefert eine triviale Information. Aufgabe 1.8 (3 Punkte) Welche der nachfolgenden Aussagen bzgl. des 50%-Quantils z0.5 ist korrekt? (a) Das 50%-Quantil teilt einen gegebenen Datensatz niemals so auf, dass gleich viele Merkmalsausprägungen kleiner bzw. größer als das 50%-Quantil sind. (b) Das 50%-Quantil teilt einen gegebenen Datensatz immer so auf, dass gleich viele Merkmalsausprägungen kleiner bzw. größer als das 50%-Quantil sind. (c) Das 50%-Quantil kann einen gegebenen Datensatz nicht aufteilen. (d) Keine der bisherigen Aussagen ist korrekt. Aufgabe 1.9 (3 Punkte) Gegeben sei die Menge Ω := {3, 7, 8}. Welche der nachfolgende gegebenen Mengen A ⊆ P(Ω) ist keine σ-Algebra? (a) A := {∅, {3}, {7, 8}, Ω}. (b) A := {∅, {3}, {7}, {8}, {3, 7}, {3, 8}, {7, 8}, Ω}. (c) A := {∅, Ω}. (d) Alle obigen Mengen erfüllen die Eigenschaften einer σ-Algebra. Dateipfad: mc/aufgabe1.tex -5- Klausur Statistik 1 Hamburg, 12.02.2013 Aufgabe 1.10 (3 Punkte) Gegeben sei nachfolgende Funktion: 0 für x < −1 g(x) := −x + 1 für − 1 ≤ x ≤ 0 1 für x > 0 2 Welche der nachfolgenden Aussagen ist korrekt? (a) Die Funktion g ist eine Wahrscheinlichkeitsfunktion. (b) Die Funktion g ist eine Dichtefunktion. (c) Die Funktion g ist eine Verteilungsfunktion. (d) Keine der bisherigen Aussagen ist korrekt. Dateipfad: mc/aufgabe1.tex -6- Klausur Statistik 1 Hamburg, 12.02.2013 Aufgabe 2 (20 Punkte) Hinweise: • In den Aufgaben 2.1 bis 2.5 ist mindestens eine Antwortmöglichkeit korrekt. • Markieren Sie die korrekte(n) Antwort(en) durch ein Kreuz bzw. mehrere Kreuze in der „Lösungstabelle für die Aufgaben 1 und 2“ auf Seite 2. Aufgabe 2.1 (4 Punkte) Welche der nachfolgenden Antworten die Schiefe γ1,M bzw. die Wölbung γ2 betreffend sind korrekt? (a) Ist die Wölbung gegeben, so lässt sich daraus die Schiefe bestimmen. (b) Ist die Schiefe gegeben, so lässt sich daraus die Wölbung bestimmen. (c) Die Schiefe kann negative Werte annehmen, die Wölbung nicht. (d) Die Wölbung kann negative Werte annehmen, die Schiefe nicht. Aufgabe 2.2 (4 Punkte) Welche der nachfolgenden Aussagen bzgl. des Gini-Koeffizienten G und normiertem GiniKoeffizient G∗ sind korrekt. (a) Für einen gegebenen Datensatz gilt immer: G∗ < G. (b) Für einen gegebenen Datensatz gilt immer: G∗ > G. (c) Sind zwei Datensätze (xi )ni=1 und (yj )m j=1 gegeben, so ist es möglich, dass Gx < Gy und G∗x > G∗y gilt. (d) Sind zwei Datensätze (xi )ni=1 und (yj )m j=1 gegeben, so ist es möglich, dass Gx < Gy und G∗x < G∗y gilt. Aufgabe 2.3 (4 Punkte) Gegeben sei ein Wahrscheinlichkeitsraum (Ω, A , P ) sowie drei Ereignisse A, B, C ∈ A . Weiterhin sei bekannt, dass: P (A) = 0.6 P (A | B) = 0.6 P (B) = 0.4 Welche der jeweils nachfolgend gemachten zusätzlichen Angaben führt zur paarweisen Unabhängigkeit der drei Ereignisse A, B und C? (a) P (C) = 0.2, P (A ∩ C) = 0.5, P (B ∩ C) = 0.5. (b) P (C) = 0.6, P (A | C) = 0.6, P (B ∩ C) = 0.4. (c) P (C) = 0.5, P (C | A) = 0.5, P (C | B) = 0.5. (d) P (C) = 0.5, P (C | A) = 0.5, P (B | C) = 0.4. Dateipfad: mc/aufgabe2.tex -7- Klausur Statistik 1 Hamburg, 12.02.2013 Aufgabe 2.4 (4 Punkte) Gegeben sei die Funktion g mit: g : R → {0, 1} 1 x 7→ für „Bedingung A“ 0 für „Bedingung B“ Welche der nachfolgenden Aussagen sind korrekt? (a) Aus „Bedingung A“: x ∈ [−1, 0] „Bedingung B“: sonst folgt, dass g eine Dichtefunktion ist. (b) Aus „Bedingung A“: x ∈ {0, 1} „Bedingung B“: sonst folgt, dass g eine Wahrscheinlichkeitsfunktion ist. (c) Aus „Bedingung A“: x ≥ 5 „Bedingung B“: sonst folgt, dass g eine Verteilungsfunktion ist. (d) Aus „Bedingung A“: x = 0 „Bedingung B“: x ∈ R\{0} folgt, dass g eine Wahrscheinlichkeitsfunktion ist. Aufgabe 2.5 (4 Punkte) Betrachtet werden momenterzeugende Funktionen beliebiger Zufallsvariablen. Welche der nachfolgenden Aussagen sind korrekt? (a) Es gibt keine Zufallsvariable X, für die die momenterzeugende Funktion MX nicht existiert. (b) Die momenterzeugende Funktion MX einer Zufallsvariablen X existiert immer. (c) Die momenterzeugende Funktion MX der Zufallsvariablen X erhält man, sofern sie existiert, indem man den Erwartungswert der transformierten Zufallsvariablen etX bestimmt. (d) Die momenterzeugende Funktion MX der Zufallsvariablen X ist, sofern sie existiert, eine Linearkombination aus E(X), E(X 2 ) und E(X 3 ). Dateipfad: mc/aufgabe2.tex -8- Klausur Statistik 1 Hamburg, 12.02.2013 Aufgabe 3 (8 Punkte) Für n = 115 Merkmalsausprägungen wurden Klassengrenzen x∗k , absolute Häufigkeiten nk sowie Varianzen der jeweiligen Klasse s2k gemäß nachfolgender Tabelle ermittelt. k x∗k nk s2k 0 −100 1 50 15 900 2 150 30 1000 3 200 50 1200 4 300 20 1600 Man ermittle eine Schätzung für das gesamte arithmetische Mittel sowie eine Schätzung für die Gesamtvarianz (Hinweis: Man verwende die Klassenmitten als Schätzung für die arithmetischen Mittel der Klassen). Lösung von Aufgabe 3 Man verwendet nachfolgende Arbeitstabelle: k x∗k nk s2k 1 (x∗k + x∗k−1 ) 2 0 −100 1 2 50 150 15 30 900 1000 −25 100 3 200 50 1200 175 4 300 20 1600 250 Man berechnet: K 1 1X nk · x̄k = (15 · (−25) + 30 · 100 + 50 · 175 + 20 · 250) = 142.3913043 x̄ ≈ n k=1 115 K K 2 1X 1X nk · s2k + nk 12 (x∗k + x∗k−1 ) − x̄ n k=1 n k=1 1 · (15 · 900 + 30 · 1000 + 50 · 1200 + 20 · 1600) = 115 1 + · 15 · (−25 − 142.39)2 + . . . + 20 · (250 − 142.39)2 115 = 7777.977316 s2 ≈ Dateipfad: rechenaufg/aufgabe1.tex -9- Klausur Statistik 1 Hamburg, 12.02.2013 Aufgabe 4 (8 Punkte) In einem Gebiet mit 100 Einwohnern beträgt das Gesamteinkommen 1000 GE (Geldeinheiten). 50% der Einwohner hat ein Gesamteinkommen von 400 GE. Weitere 20 Einwohner haben ein Gesamteinkommen von 300 GE. Geben Sie eine Tabelle an, aus der die Abszissenwerte sowie die Ordinatenwerte der zugehörigen Lorenzkurve hervorgehen (Lorenzkurve muss nicht gezeichnet werden). Berechnen Sie den Gini-Koeffizienten sowie den normierten Gini-Koeffizienten. Hinweis: Es sollen die Gini-Koeffizienten aller Einwohner unter der Annahme berechnet werden, dass das Einkommen in der jeweiligen Bevölkerungsgruppe gleichmäßig verteilt ist. Lösung von Aufgabe 4 Man geht von nachfolgender Arbeitstabelle aus: j 0 1 2 3 P Bev. Eink. Anteil Bev. 50 30 20 100 400 300 300 1000 Anteil Eink. Eink./Bev. 0.4 0.3 0.3 1 8 10 15 0.5 0.3 0.2 1 uj 0 0.5 0.8 1 vj Steigung 0 0.4 0.8 0.7 1 1 1.5 Damit erhält man nachfolgende Lorenzkurve: 1 0.7 0.4 0 0 0.5 0.8 1 Für den Gini-Koeffizienten erhält man: G=1− n X (vj + vj−1 )(uj − uj−1 ) j=1 = 1 − [(0.4 + 0)(0.5 − 0) + (0.7 + 0.4)(0.8 − 0.5) + (1 + 0.7)(1 − 0.8)] = 1 − 0.87 = 0.13 Dateipfad: rechenaufg/aufgabe2.tex -10- Klausur Statistik 1 Hamburg, 12.02.2013 Für den normierten Gini-Koeffizienten erhält man damit: G∗ = 100 n ·G= · 0.13 = 0.13 n−1 99 Dateipfad: rechenaufg/aufgabe2.tex -11- Klausur Statistik 1 Hamburg, 12.02.2013 Aufgabe 5 (10 Punkte) Gegeben sei nachfolgende unvollständige Kontingenztabelle: nk,l y1 x1 10 P y3 10 40 x2 P y2 20 120 160 Tragen Sie die fehlenden Werte in die Tabelle ein und berechnen Sie daraus den χ2 Koeffizienten, sowie den Kontingenzkoeffizienten C und den normierten Kontingenzkoeffizienten C ∗ . Lösung von Aufgabe 5 Ausgefüllte Tabelle und „Unabhängigkeitstabelle“ sind: nk,l x1 x2 P y1 10 10 20 y2 80 40 120 P y3 10 100 10 60 20 160 ñk,l x1 x2 P y1 12.5 7.5 20 y2 y3 75 12.5 45 7.5 120 20 P 100 60 160 Damit erhält man für den χ2 -Koeffizienten: χ2 = 2 X 3 X k=1 l=1 (nk,l − ñk,l )2 (10 − 12.5)2 (10 − 7.5)2 = + ... + = 3.5 ≈ 3.5556 ñk,l 12.5 7.5 Für den Kontingenzkoeffizienten C bzw. den normierten Kontingenzkoeffizienten C ∗ erhält man: s C= C∗ = r χ2 = χ2 + n C min{K,L}−1 min{K,L} Dateipfad: rechenaufg/aufgabe3.tex s 3.5556 = 0.1474 3.5556 + 160 0.1474 = q = 0.2085 2−1 2 -12- Klausur Statistik 1 Hamburg, 12.02.2013 Aufgabe 6 (7 Punkte) Gegeben sei nachfolgende Dichtefunktion der Zufallsvariablen X: 4x3 fX (x) := 0 für 0 ≤ x ≤ 1 sonst Berechnen Sie die ersten beiden nicht-zentrierten Momente (E(X) und E(X 2 )) der Zufallsvariablen X, sowie die Varianz von X (V ar(X)). Lösung von Aufgabe 6 E(X) = Z 1 x · 4x3 dx = 0 2 E(X ) = Z 1 x2 · 4x3 dx = 0 V ar(X) = E(X 2 ) − E 2 (X) = Dateipfad: rechenaufg/aufgabe4.tex -13- h h i1 4 5 x 5 0 i1 4 6 x 6 0 = h = i1 2 6 x 3 0 2 2 4 − 3 5 4 5 = = 2 3 2 16 2 − = 3 25 75 Klausur Statistik 1 Hamburg, 12.02.2013 Aufgabe 7 (9 Punkte) Es sei V ∼ N (7, 16), W ∼ χ2 (5), X ∼ t(6) und Y ∼ F (13, 4). Geben Sie folgende Größen an: (a) P (V ≥ 6) (b) P (W ≤ 1.61) (c) P (−2.447 < X ≤ 3.707) (d) P (8.71 > Y > 0.25) (e) 2.5%-Quantil der Zufallsvariablen V . (f) 2.5%-Quantil der Zufallsvariablen Y . Lösung von Aufgabe 7 Es ist (mit Z ∼ N (0, 1) und U ∼ F (4, 13)): (a) P (V ≥ 6) = 1 − P (V < 6) = 1 − FV (6) = 1 − FZ 1 − (1 − FZ (0.25)) = FZ (0.25) = 0.5987 6−7 4 = 1 − FZ (−0.25) = (b) P (W ≤ 1.61) = 0.1 (c) P (−2.447 < X ≤ 3.707) = FX (3.707)−FX (−2.447) = FX (3.707)−(1−FX (2.447)) = 0.995 + 0.975 − 1 = 0.97 (d) P (8.71 > Y > 0.25) = P (0.25 < Y < 8.71) = FY (8.71) − FY (0.25) = FY (8.71) − (1 − FU (4)) = 0.975 − (1 − 0.975) = 0.95 (0,1) (e) z0.025 = −1.96 (13,4) (f) F0.025 = 1 (4,13) F0.975 ⇒ = 1 4.00 (7,16) z0.025 = −1.96 · 4 + 7 = −0.84 = 0.25 Dateipfad: rechenaufg/aufgabe5.tex -14- Klausur Statistik 1 Hamburg, 12.02.2013 Aufgabe 8 (8 Punkte) Für eine stetige Zufallsvariable X sei für t ∈ R die momenterzeugende Funktion MX gegeben durch: 2 MX (t) = exp(t2 + t) = et +t Berechnen Sie für die Zufallsvariable Y := 2X + 3 den Erwartungswert und die Varianz. Lösung von Aufgabe 8 Es werden zwei Möglichkeiten aufgezeigt: (a) Aus der momenterzeugenden Funktion MX erkennt man, dass es sich bei der Zufallsvariablen X um eine normalverteilte Zufallsvariable mit Parametern µX = 1 2 und σX = 2 handelt. Daraus erhält man sofort, dass Y ebenfalls normalverteilt mit Parametern µY = 2 · 1 + 3 = 5 und σY2 = 22 · 2 = 8. Damit ergibt sich: E(Y ) = 5 und V ar(Y ) = 8. (b) Für die momenterzeugende Funktion von Y gilt: 2 +2t MY (t) = e3t e(2t) 2 +2t = e3t e4t 2 +5t = e4t Für die ersten beiden Ableitungen erhält man: 2 +5t MY0 (t) = (8t + 5)e4t 2 +5t MY00 (t) = 8e4t 2 +5t + (8t + 5)2 e4t 2 +5t = e4t 8 + (8t + 5)2 Damit erhält man für die ersten beiden Momente: E(Y ) = MY0 (0) = 5 E(Y 2 ) = MY00 (0) = 8 + 52 = 33 Die Varianz ist damit: V ar(Y ) = E(Y 2 ) − E 2 (Y ) = 33 − 52 = 8 Dateipfad: rechenaufg/aufgabe6.tex -15-