Klausur WS 2011 - Universität Stuttgart

Werbung
Universität Stuttgart
PD Dr. J. Dippon
Dipl.-Math. A. Madlener
Fachbereich Mathematik
Klausur Statistik für Wirtschaftswissenschaftler WS 2010/11
26. Februar 2011
VORNAME:
NAME:
MATRIKELNUMMER:
STUDIENGANG:
Aufgabe
maximale
Punktzahl
erreichte
Punktzahl
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
P
8
4
6
4
4
4
5
5
10
4
6
10
6
4
6
4
6
4
100
• Für die Bearbeitung der Aufgaben haben Sie 180 Minuten Zeit.
• Schreiben Sie die Lösungen der Aufgaben in die dafür vorgesehenen Kästchen.
• Alle Lösungen sind ausreichend zu begründen!
• Es sind keinerlei Hilfsmittel erlaubt!
• Maximal erreichbare Punktzahl: 100 Punkte.
• Zum Erreichen der Bestnote werden 90 Punkte benötigt.
• Viel Erfolg!
1
Aufgabe 1 (8 Punkte). An einer Universität werden in der letzten Vorlesung über Statistik 50 Studierende zu den folgenden Punkten befragt:
• Lerngruppengröße (Anzahl der Personen in einer Lerngruppe)
• geplante Lernzeit für die Prüfung
• Titel des zum Lernen bevorzugten Buches
• Übliche wöchentliche Nacharbeitszeit der Vorlesung
• eigene Einschätzung des Lernzuwachses durch die Vorlesung mit 1 = sehr gut, . . . , 5 = sehr schlecht
a) Geben Sie die Grundgesamtheit und die Untersuchungseinheiten an.
b) Welche Ausprägungen besitzen die erhobenen Merkmale, und welches Skalenniveau liegt ihnen
zugrunde?
c) Welcher Studientyp liegt vor?
d) Geben Sie ein Beispiel für eine Längsschnittstudie.
Aufgabe 2 (4 Punkte). Es seien folgende Häufigkeiten xi gegeben:
x1 x2 x3 x4 x5
6 4 9 11 10
a) Berechnen Sie das arithmetische Mittel x̄.
b) Bestimmen Sie die Summe der absoluten Abweichungen vom arithmetischen Mittel der Daten, also
5
X
i=1
2
|xi − x̄|.
c) Zeigen Sie allgemein, dass für die empirische Varianz gilt
n
1X
(xi − x̄)2 =
n
i=1
1
n
n
X
!
x2i − nx̄2
.
i=1
Aufgabe 3 (6 Punkte).
i
i
a) In einer Firma mit 25 Mitarbeitern verdienen 25
· 100% aller Mitarbeiter 25
· 100% des Gesamteinkommens aller Mitarbeiter (i ∈ {0, 1, . . . , 25}). Zeichnen Sie die Lorenz-Kurve und bestimmen Sie
den Gini- und den Herfindahl-Index.
b) In einer anderen Firma verdient der Chef doppelt soviel wie seine beiden Mitarbeiter. Zeichnen Sie
die Lorenz-Kurve und bestimmen Sie den Gini- und den Herfindahl-Index.
3
Aufgabe 4 (4 Punkte). In n aufeinanderfolgenden Jahren betrugen die Jahresrenditen der Aktie eines
Sportartikelherstellers r1 , . . . , rn (in %).
a) Schreiben Sie ein R-Programm zum Einlesen und Berechnen der mittleren jährlichen Rendite.
b) Zum Testen des Programms nehmen wir die Jahresrenditen r1 = 6%, r2 = 9% und r3 = 4% an.
Welches Ergebnis (in %) muss Ihr Programm liefern?
Aufgabe 5 (4 Punkte). In R liegen jährliche Umsatzzahlen in Form einer Zeitreihe Umsatz vor.
a) Stellen Sie Umsatz mit einem geeigneten Grafik-Befehl dar.
b) Da die grafische Analyse einen linearen Trend nahelegt, soll die Zeitreihe mit geeigneten Befehlen
trendbereinigt und in einer Grafik dargestellt werden.
Aufgabe 6 (4 Punkte). Die im Folgenden gegebene Kontingenztafel mit relativen Häufigkeiten ist
unvollständig. Vervollständigen Sie unter der Annahme der Unabhängigkeit der beiden Merkmale die
Tabelle.
b1
b2
b3
a1 0.02
0.2
a2
0.16
0.2
4
Aufgabe 7 (5 Punkte). Ein Student möchte gerne wissen, wie gut seine Chancen stehen, die anstehende
Prüfung zu bestehen. Es wurden im Laufe des Jahres fünf Themen behandelt, von denen nur ein einziges
in der Prüfung ausführlich abgefragt wird. Welches der Themen tatsächlich in der Prüfung erscheint wird
rein zufällig ausgelost. Der Student schätzt seine Chancen zu bestehen bei Thema 1 mit 0.8, bei Thema
2 mit 0.7, bei Thema 3 mit 0.4, bei Thema 4 mit 0.5 und bei Thema 5 nur mit 0.2 ein. Mit welcher
Wahrscheinlichkeit besteht der Student die Prüfung?
Aufgabe 8 (5 Punkte). Welche Verteilungen besitzen die folgenden Zufallsvariablen:
a) Die Anzahl der roten Kugeln in einer Stichprobe von 10 Kugeln, die auf einen Schlag aus einer Urne
mit 95 schwarzen und 5 roten Kugeln entnommen werden.
5
b) Die Stückzahl eines selten gebrauchten Produkts, das bei einer Firma an einem Tag nachgefragt
wird.
c) Die Anzahl der erfolglosen Versuche bis man beim Lotto 6 aus 49 fünf Richtige hat.
d) Die Kaffeemenge in einem kleinen Kaffee aus dem Automaten (mit realistischen Daten für die
Parameter).
Hinweis: Geben Sie nur den Typ der Verteilung und die sie bestimmenden Parameter an.
Aufgabe 9 (10 Punkte). Es sei folgende Funktion gegeben:


cx + 1,
f (x) = −cx + 1,


0,
falls − 1 ≤ x ≤ 0
falls 0 ≤ x ≤ 1
sonst.
a) Bestimmen Sie den Parameter c so, dass f (x) die Dichtefunktion einer reellen Zufallsvariable X ist.
b) Bestimmen Sie die Verteilungsfunktion der Zufallsvariablen X.
c) Berechnen Sie die Wahrscheinlichkeiten P (−0.8 < X) und P (−0.8 < X < 0.8).
d) Berechnen Sie den Median xmed .
e) Berechnen Sie P (−2 ≤ X ≤ 2|X ≤ 0.1).
6
Aufgabe 10 (4 Punkte). Eine echte Münze mit Wappen und Zahl als möglichen Ausgängen eines
Wurfs wird 10000 mal in unabhängiger Folge geworfen. Die Zufallsvariable Z sei die Anzahl der dabei
erzielten Wappen. Welche approximative Verteilung besitzt Z? Geben Sie damit eine Approximation der
Wahrscheinlichkeit P (4900 ≤ Z ≤ 5100) an.
Hinweis: Φ(2) = 0.9772 und Φ(−2) = 1 − Φ(2).
7
Aufgabe 11 (6 Punkte).
a) Seien X und Y zwei Zufallsvariablen und a, b ganze Zahlen. Wie lässt sich V ar(aX + bY ) aus
V ar(X), V ar(Y ) und Cov(X, Y ) berechnen?
b) Von den beiden Zufallsvariablen X und Y ist V ar(X) = 4, V ar(Y ) = 1 sowie der Korrelationskoeffizient ρ(X, Y ) = 1 bekannt. Wie groß ist dann die Varianz V ar(4X + 5Y )?
Aufgabe 12 (10 Punkte). Eine Exp(λ)-verteilte Zufallsvariable X mit Intensitätsrate λ > 0 besitzt
die Dichte
(
λ exp(−λx), falls x > 0
f (x) =
0,
sonst.
a) Berechnen Sie den Erwartungswert E(X).
b) Berechnen Sie die Verteilungsfunktion F (x) von X.
c) Zeichnen Sie die Graphen der Dichte- und Verteilungsfunktion von X für λ = 2.
d) Berechnen Sie den Median von X.
e) Zeigen Sie, dass X eine gedächtnislose Verteilung besitzt, d.h. dass P (X > t+s|X > s) = P (X > t)
für alle t, s > 0.
8
Aufgabe 13 (6 Punkte).
a) In einer Bernoulli-Kette mit unbekannter Trefferwahrscheinlichkeit p ∈ (0, 1) sei der erste Treffer
im k-ten Versuch aufgetreten. Stellen Sie die Likelihoodfunktion zu dieser Beobachtung auf und
zeigen Sie, dass der Maximum-Likelihood-Schätzwert für p durch 1/k gegeben ist.
b) Eine Grundgesamtheit besitze den Mittelwert µ und die Varianz σ 2 . Die Stichprobenvariablen
X1 , X2 , X3 seien unabhängige Ziehungen aus dieser Grundgesamtheit. Betrachten Sie die folgenden
Schätzfunktionen:
1
(X1 + X2 + X3 )
3
= X1 + X2 + X3
T1 =
T2
i) Welche der Schätzfunktionen ist erwartungstreu?
ii) Welche Schätzfunktion ist die wirksamere?
Aufgabe 14 (4 Punkte). Beim 30-maligen Wurf einer Münze ergibt sich 18 mal der Ausgang Wappen
und nur 12 mal der Ausgang Zahl. Spricht dieses Ergebnis signifikant“ gegen die Hypothese einer fairen
”
Münze? Wie groß ist der p-Wert hier? Was sagt der p-Wert allgemein aus?
9
Hierbei ist die Wahrscheinlichkeit P1/2 (S30 ≤ 17) bei gleichwahrscheinlichen Ausgängen in 30 Würfen
höchstens 17 mal Wappen zu erzielen gegeben durch P1/2 (S30 ≤ 17) = 0.8192.
Aufgabe 15 (6 Punkte). Die Kreditabteilung einer Bank stellt sich die Frage, ob es einen Zusammenhang zwischen Tilgungsverzug und Familienstand gibt. Eine Auswertung der Kundendatei ergab, dass
50 Kredite an ledige Personen gingen, 75 an verheiratete. Bei 20 Krediten an ledige Personen gab es
Verzögerungen, in der Gruppe der Verheirateten gab es bei 25 Krediten Verzögerungen. Verwenden Sie
hierzu einen geeigneten Test, um einen möglichen Zusammenhang nachzuweisen.
Zur Erinnerung:“ Beim χ2 -Test
auf Unabhängigkeit zweier dichothomer Zufallsgrößen wird die Teststatis”
Ni· N·j 2
Nij − n
P P
N22 −N12 N21 )2
tik 2i=1 2j=1
= n (N11
mit den Quantilen der χ21 -Verteilung verglichen. Hierzu
Ni· N·j
N1· N2· N·1 N·2
n
seien die folgenden Quantile gegeben: χ21;0,9 = 2, 7055, χ21;0,0,95 = 3, 8415, χ21;0,99 = 6, 6349.
Aufgabe 16 (4 Punkte). Eine Abfüllmaschine für Milchflaschen ist so konstruiert, dass die zufällige
Abfüllmenge X, gemessen in ml, angenähert als normalverteilt mit den Parametern µ und σ 2 angenommen werden kann. Der Produzent möchte mit Hilfe einer Stichprobe vom Umfang n überprüfen, ob die
Maschine im Mittel einen Liter abfüllt oder gar zu viel.
10
a) Von der Maschine sei bekannt, dass σ = 2 gilt . Formulieren Sie das Testproblem und geben Sie ein
geeignetes Testverfahren an.
b) Sei nun die Varianz nicht bekannt. Als Schätzung der Standardabweichungen erhält man s = 3.
Welches Testverfahren sollte nun angewandt werden?
Aufgabe 17 (6 Punkte). Im Rahmen einer Studie soll die Frage untersucht werden, ob der Kaufpreis y
eines LCD-Fernsehers näherungsweise linear von der Bildschirmdiagonalen x abhängt. Als Gütemaß für
die Anpassung der Regressionsgeraden an die Daten (x1 , y1 ), . . . , (xn , yn ) soll das Bestimmtheitsmaß
R2 verwendet werden. Die Kleinste-Quadrate-Koeffizienten â für den y-Achsenabschnitt und b̂ für die
Steigung seien bereits berechnet. ŷi sei der durch die Regressionsgerade vorhergesagte Preis für einen
Fernseher mit Diagonale xi .
a) Wie lautet die Zerlegung der Gesamtstreuung
Residualstreuung?
Pn
i=1 (yi
− ȳ)2 in die erklärte Streuung und die
b) Wie ist R2 definiert?
c) Welche Werte kann R2 annehmen?
d) Welche Werte von R2 sprechen für eine gute Anpassung, welche für eine schlechte Anpassung?
Aufgabe 18 (4 Punkte). Die folgende Abbildung zeigt die Entwicklung der Fluggastzahlen (in Tausenden) zwischen 1949 und 1960.
11
500
300
100
AirPassengers
1950
1952
1954
1956
1958
1960
Time
a) Geben Sie für diese Zeitreihe ein geeignetes Modell an und skizzieren Sie das weitere Vorgehen zur
Analyse der Zeitreihe.
b) Wie können die einzelnen Komponenten dieser Zeitreihe sinnvollerweise geschätzt werden?
12
Herunterladen