Universität Stuttgart PD Dr. J. Dippon Dipl.-Math. A. Madlener Fachbereich Mathematik Klausur Statistik für Wirtschaftswissenschaftler WS 2010/11 26. Februar 2011 VORNAME: NAME: MATRIKELNUMMER: STUDIENGANG: Aufgabe maximale Punktzahl erreichte Punktzahl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 P 8 4 6 4 4 4 5 5 10 4 6 10 6 4 6 4 6 4 100 • Für die Bearbeitung der Aufgaben haben Sie 180 Minuten Zeit. • Schreiben Sie die Lösungen der Aufgaben in die dafür vorgesehenen Kästchen. • Alle Lösungen sind ausreichend zu begründen! • Es sind keinerlei Hilfsmittel erlaubt! • Maximal erreichbare Punktzahl: 100 Punkte. • Zum Erreichen der Bestnote werden 90 Punkte benötigt. • Viel Erfolg! 1 Aufgabe 1 (8 Punkte). An einer Universität werden in der letzten Vorlesung über Statistik 50 Studierende zu den folgenden Punkten befragt: • Lerngruppengröße (Anzahl der Personen in einer Lerngruppe) • geplante Lernzeit für die Prüfung • Titel des zum Lernen bevorzugten Buches • Übliche wöchentliche Nacharbeitszeit der Vorlesung • eigene Einschätzung des Lernzuwachses durch die Vorlesung mit 1 = sehr gut, . . . , 5 = sehr schlecht a) Geben Sie die Grundgesamtheit und die Untersuchungseinheiten an. b) Welche Ausprägungen besitzen die erhobenen Merkmale, und welches Skalenniveau liegt ihnen zugrunde? c) Welcher Studientyp liegt vor? d) Geben Sie ein Beispiel für eine Längsschnittstudie. Aufgabe 2 (4 Punkte). Es seien folgende Häufigkeiten xi gegeben: x1 x2 x3 x4 x5 6 4 9 11 10 a) Berechnen Sie das arithmetische Mittel x̄. b) Bestimmen Sie die Summe der absoluten Abweichungen vom arithmetischen Mittel der Daten, also 5 X i=1 2 |xi − x̄|. c) Zeigen Sie allgemein, dass für die empirische Varianz gilt n 1X (xi − x̄)2 = n i=1 1 n n X ! x2i − nx̄2 . i=1 Aufgabe 3 (6 Punkte). i i a) In einer Firma mit 25 Mitarbeitern verdienen 25 · 100% aller Mitarbeiter 25 · 100% des Gesamteinkommens aller Mitarbeiter (i ∈ {0, 1, . . . , 25}). Zeichnen Sie die Lorenz-Kurve und bestimmen Sie den Gini- und den Herfindahl-Index. b) In einer anderen Firma verdient der Chef doppelt soviel wie seine beiden Mitarbeiter. Zeichnen Sie die Lorenz-Kurve und bestimmen Sie den Gini- und den Herfindahl-Index. 3 Aufgabe 4 (4 Punkte). In n aufeinanderfolgenden Jahren betrugen die Jahresrenditen der Aktie eines Sportartikelherstellers r1 , . . . , rn (in %). a) Schreiben Sie ein R-Programm zum Einlesen und Berechnen der mittleren jährlichen Rendite. b) Zum Testen des Programms nehmen wir die Jahresrenditen r1 = 6%, r2 = 9% und r3 = 4% an. Welches Ergebnis (in %) muss Ihr Programm liefern? Aufgabe 5 (4 Punkte). In R liegen jährliche Umsatzzahlen in Form einer Zeitreihe Umsatz vor. a) Stellen Sie Umsatz mit einem geeigneten Grafik-Befehl dar. b) Da die grafische Analyse einen linearen Trend nahelegt, soll die Zeitreihe mit geeigneten Befehlen trendbereinigt und in einer Grafik dargestellt werden. Aufgabe 6 (4 Punkte). Die im Folgenden gegebene Kontingenztafel mit relativen Häufigkeiten ist unvollständig. Vervollständigen Sie unter der Annahme der Unabhängigkeit der beiden Merkmale die Tabelle. b1 b2 b3 a1 0.02 0.2 a2 0.16 0.2 4 Aufgabe 7 (5 Punkte). Ein Student möchte gerne wissen, wie gut seine Chancen stehen, die anstehende Prüfung zu bestehen. Es wurden im Laufe des Jahres fünf Themen behandelt, von denen nur ein einziges in der Prüfung ausführlich abgefragt wird. Welches der Themen tatsächlich in der Prüfung erscheint wird rein zufällig ausgelost. Der Student schätzt seine Chancen zu bestehen bei Thema 1 mit 0.8, bei Thema 2 mit 0.7, bei Thema 3 mit 0.4, bei Thema 4 mit 0.5 und bei Thema 5 nur mit 0.2 ein. Mit welcher Wahrscheinlichkeit besteht der Student die Prüfung? Aufgabe 8 (5 Punkte). Welche Verteilungen besitzen die folgenden Zufallsvariablen: a) Die Anzahl der roten Kugeln in einer Stichprobe von 10 Kugeln, die auf einen Schlag aus einer Urne mit 95 schwarzen und 5 roten Kugeln entnommen werden. 5 b) Die Stückzahl eines selten gebrauchten Produkts, das bei einer Firma an einem Tag nachgefragt wird. c) Die Anzahl der erfolglosen Versuche bis man beim Lotto 6 aus 49 fünf Richtige hat. d) Die Kaffeemenge in einem kleinen Kaffee aus dem Automaten (mit realistischen Daten für die Parameter). Hinweis: Geben Sie nur den Typ der Verteilung und die sie bestimmenden Parameter an. Aufgabe 9 (10 Punkte). Es sei folgende Funktion gegeben: cx + 1, f (x) = −cx + 1, 0, falls − 1 ≤ x ≤ 0 falls 0 ≤ x ≤ 1 sonst. a) Bestimmen Sie den Parameter c so, dass f (x) die Dichtefunktion einer reellen Zufallsvariable X ist. b) Bestimmen Sie die Verteilungsfunktion der Zufallsvariablen X. c) Berechnen Sie die Wahrscheinlichkeiten P (−0.8 < X) und P (−0.8 < X < 0.8). d) Berechnen Sie den Median xmed . e) Berechnen Sie P (−2 ≤ X ≤ 2|X ≤ 0.1). 6 Aufgabe 10 (4 Punkte). Eine echte Münze mit Wappen und Zahl als möglichen Ausgängen eines Wurfs wird 10000 mal in unabhängiger Folge geworfen. Die Zufallsvariable Z sei die Anzahl der dabei erzielten Wappen. Welche approximative Verteilung besitzt Z? Geben Sie damit eine Approximation der Wahrscheinlichkeit P (4900 ≤ Z ≤ 5100) an. Hinweis: Φ(2) = 0.9772 und Φ(−2) = 1 − Φ(2). 7 Aufgabe 11 (6 Punkte). a) Seien X und Y zwei Zufallsvariablen und a, b ganze Zahlen. Wie lässt sich V ar(aX + bY ) aus V ar(X), V ar(Y ) und Cov(X, Y ) berechnen? b) Von den beiden Zufallsvariablen X und Y ist V ar(X) = 4, V ar(Y ) = 1 sowie der Korrelationskoeffizient ρ(X, Y ) = 1 bekannt. Wie groß ist dann die Varianz V ar(4X + 5Y )? Aufgabe 12 (10 Punkte). Eine Exp(λ)-verteilte Zufallsvariable X mit Intensitätsrate λ > 0 besitzt die Dichte ( λ exp(−λx), falls x > 0 f (x) = 0, sonst. a) Berechnen Sie den Erwartungswert E(X). b) Berechnen Sie die Verteilungsfunktion F (x) von X. c) Zeichnen Sie die Graphen der Dichte- und Verteilungsfunktion von X für λ = 2. d) Berechnen Sie den Median von X. e) Zeigen Sie, dass X eine gedächtnislose Verteilung besitzt, d.h. dass P (X > t+s|X > s) = P (X > t) für alle t, s > 0. 8 Aufgabe 13 (6 Punkte). a) In einer Bernoulli-Kette mit unbekannter Trefferwahrscheinlichkeit p ∈ (0, 1) sei der erste Treffer im k-ten Versuch aufgetreten. Stellen Sie die Likelihoodfunktion zu dieser Beobachtung auf und zeigen Sie, dass der Maximum-Likelihood-Schätzwert für p durch 1/k gegeben ist. b) Eine Grundgesamtheit besitze den Mittelwert µ und die Varianz σ 2 . Die Stichprobenvariablen X1 , X2 , X3 seien unabhängige Ziehungen aus dieser Grundgesamtheit. Betrachten Sie die folgenden Schätzfunktionen: 1 (X1 + X2 + X3 ) 3 = X1 + X2 + X3 T1 = T2 i) Welche der Schätzfunktionen ist erwartungstreu? ii) Welche Schätzfunktion ist die wirksamere? Aufgabe 14 (4 Punkte). Beim 30-maligen Wurf einer Münze ergibt sich 18 mal der Ausgang Wappen und nur 12 mal der Ausgang Zahl. Spricht dieses Ergebnis signifikant“ gegen die Hypothese einer fairen ” Münze? Wie groß ist der p-Wert hier? Was sagt der p-Wert allgemein aus? 9 Hierbei ist die Wahrscheinlichkeit P1/2 (S30 ≤ 17) bei gleichwahrscheinlichen Ausgängen in 30 Würfen höchstens 17 mal Wappen zu erzielen gegeben durch P1/2 (S30 ≤ 17) = 0.8192. Aufgabe 15 (6 Punkte). Die Kreditabteilung einer Bank stellt sich die Frage, ob es einen Zusammenhang zwischen Tilgungsverzug und Familienstand gibt. Eine Auswertung der Kundendatei ergab, dass 50 Kredite an ledige Personen gingen, 75 an verheiratete. Bei 20 Krediten an ledige Personen gab es Verzögerungen, in der Gruppe der Verheirateten gab es bei 25 Krediten Verzögerungen. Verwenden Sie hierzu einen geeigneten Test, um einen möglichen Zusammenhang nachzuweisen. Zur Erinnerung:“ Beim χ2 -Test auf Unabhängigkeit zweier dichothomer Zufallsgrößen wird die Teststatis” Ni· N·j 2 Nij − n P P N22 −N12 N21 )2 tik 2i=1 2j=1 = n (N11 mit den Quantilen der χ21 -Verteilung verglichen. Hierzu Ni· N·j N1· N2· N·1 N·2 n seien die folgenden Quantile gegeben: χ21;0,9 = 2, 7055, χ21;0,0,95 = 3, 8415, χ21;0,99 = 6, 6349. Aufgabe 16 (4 Punkte). Eine Abfüllmaschine für Milchflaschen ist so konstruiert, dass die zufällige Abfüllmenge X, gemessen in ml, angenähert als normalverteilt mit den Parametern µ und σ 2 angenommen werden kann. Der Produzent möchte mit Hilfe einer Stichprobe vom Umfang n überprüfen, ob die Maschine im Mittel einen Liter abfüllt oder gar zu viel. 10 a) Von der Maschine sei bekannt, dass σ = 2 gilt . Formulieren Sie das Testproblem und geben Sie ein geeignetes Testverfahren an. b) Sei nun die Varianz nicht bekannt. Als Schätzung der Standardabweichungen erhält man s = 3. Welches Testverfahren sollte nun angewandt werden? Aufgabe 17 (6 Punkte). Im Rahmen einer Studie soll die Frage untersucht werden, ob der Kaufpreis y eines LCD-Fernsehers näherungsweise linear von der Bildschirmdiagonalen x abhängt. Als Gütemaß für die Anpassung der Regressionsgeraden an die Daten (x1 , y1 ), . . . , (xn , yn ) soll das Bestimmtheitsmaß R2 verwendet werden. Die Kleinste-Quadrate-Koeffizienten â für den y-Achsenabschnitt und b̂ für die Steigung seien bereits berechnet. ŷi sei der durch die Regressionsgerade vorhergesagte Preis für einen Fernseher mit Diagonale xi . a) Wie lautet die Zerlegung der Gesamtstreuung Residualstreuung? Pn i=1 (yi − ȳ)2 in die erklärte Streuung und die b) Wie ist R2 definiert? c) Welche Werte kann R2 annehmen? d) Welche Werte von R2 sprechen für eine gute Anpassung, welche für eine schlechte Anpassung? Aufgabe 18 (4 Punkte). Die folgende Abbildung zeigt die Entwicklung der Fluggastzahlen (in Tausenden) zwischen 1949 und 1960. 11 500 300 100 AirPassengers 1950 1952 1954 1956 1958 1960 Time a) Geben Sie für diese Zeitreihe ein geeignetes Modell an und skizzieren Sie das weitere Vorgehen zur Analyse der Zeitreihe. b) Wie können die einzelnen Komponenten dieser Zeitreihe sinnvollerweise geschätzt werden? 12