Statistik II für Wirtschaftswissenschaftler Klausur am 29.07.2005

Werbung
–1–
Statistik II für Wirtschaftswissenschaftler
Klausur am 29.07.2005, 09.00–11.00.
Bitte unbedingt beachten:
a) Gewertet werden alle 8 gestellten Aufgaben.
b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses allein gilt nicht als Lösung.
Da keine Taschenrechner zugelassen sind, brauchen Zahlenrechnungen, für die man normalerweise einen Taschenrechner benutzen würde, nicht durchgeführt zu werden.
Ausnahme: Zwischenergebnis, für das der Zahlenwert für die weitere Behandlung der
Aufgabe unbedingt nötig ist. Dieser Zahlenwert kann aber dann durch Kopfrechnung ermittelt werden.
Ein Endergebnis ist vollständig, wenn zur Ermittlung des Zahlenwertes höchstens die
Ausführung der elementaren Rechenoperationen (Addition, Subtraktion, Multiplikation,
Division) und die Anwendung elementarer Funktionen (exp x(≡ ex ), ln x, log x, sin x,
√
cos x, tan x, arcsin x, arccos x, arctan x, ax , x) nötig wäre. Die Bildung von m! und des
Binomialkoeffizienten z.B. gehören nicht zu den elementaren Rechenoperationen.
c) Zugelassene Hilfsmittel: Werden für die künftigen Klausuren neu festgelegt.
Weitere Hinweise:
a) Wer mindestens 30 Punkte erreicht hat, hat bestanden.
b) Weitere Infos finden Sie im Internet in dem file “allginfo.ps” oder “allginfo.pdf” im Verzeichnis
“http://www.mathematik.uni-stuttgart.de/studium/infomat/WiS − Kolbe− 05/”.
–2–
Aufgabe 1
11 Punkte
a) Es sei Y eine diskrete Zufallsvariable, die die Werte (−1) und (+1) jeweils mit Wahrscheinlichkeit 0.3 und den Wert 0 mit Wahrscheinlichkeit 0.4 annimmt. Bestimmen Sie
die Wahrscheinlichkeiten P (Y ≤ 0) und P (Y < 1).
b) Bestimmen Sie die positive Konstante c so, dass
(
c · (12 − 3x2 )
f (x) :=
0
für |x| ≤ 2
sonst
die Wahrscheinlichkeitsdichte einer stetigen Zufallsvariablen X ist, und bestimmen Sie
den Erwartungswert und die Standardabweichung von X.
Lösungsvorschlag zu Aufg. 1: a)
(
∓1
Y =
0
jeweils mit Wahrscheinlichkeit
0.3
jeweils mit Wahrscheinlichkeit
0.4
P (Y 6 0) = P (Y = −1) + P (Y = 0) = 0.3 + 0.4 = 0.7
P (Y < 1) = P (Y = −1) + P (Y = 0) = 0.7
b)
Z
∞
−∞
f (x)dx =
Z
2
−2
!
c · (12 − 3x2 )dx = c[12x − x3 ]2−2 = 32c = 1
⇔ c=
1
32
(c > 0 ∧ (12 − 3x2 ) > 0 für alle |x| 6 2 ∧ f (x) = 0 für alle |x| > 2) ⇒ f (x) > 0 für alle x,
f (x) ist also Verteilungsdichte.
1
E(X) :=
x · f (x)dx =
32
−∞
Z
∞
Z
2
−2
(12x − 3x3 )dx = 0,
da eine ungerade Funktion über ein symmetrisches Intervall integriert wird.
Z 2
1
32 · 5 − 3 · 32
1
2
2
(12x2 − 3x4 )dx − 0 =
· [4x3 − 3x5 /5]2−2 =
V (X) = E(X ) − (E(X)) =
32 −2
32
16 · 5
r
32 · 5 − 3 · 32
σ(X) =
16 · 5
Aufgabe 2
8 Punkte
a) Die Zahl der in einer Minute bei einer Telefonzentrale ankommenden Anrufe sei Poisson–
verteilt mit dem Erwartungswert 4. Wie groß ist Wahrscheinlichkeit, dass zwischen 1 und
3 Anrufe (beide Grenzen eingeschlossen) in einer Minute ankommen?
–3–
b) Bei einem zentral gelegenen Großbetrieb mit 30 000 Mitarbeitern kommen 10 000 mit
dem Auto und 20 000 mit öffentlichen Verkehrsmitteln zur Arbeit. Es werden zufällig 450
Mitarbeiter ausgewählt und befragt, wobei kein Mitarbeiter mehr als einmal ausgewählt
wird. Bestimmen Sie näherungsweise (also nicht exakt) die Wahrscheinlichkeit, dass davon
zwischen 148 und 170 mit dem Auto kommen.
Lösungsvorschlag zu Aufg. 2: a) P (X = k) =
k
e−4 4k! ,
P (1 ≤ X ≤ 3) = e
b) Es liegt eine hypergeometrische Verteilung vor. Da aber
450
30000
−4
·
4
1
+
42
1·2
+
43
1·2·3
≤ 0.1 (korrigiert) und
30000 ≥ 1000 (korrigiert) gelten, kann näherungsweise Binomialverteilung angenommen werden mit n = 450, p =
10000
30000
=
1
3
und q := 1 − p = 32 , die wiederum wegen n = 450 ≥ 50,
n · p = 150 ≥ 5 und n · q = 3000 ≥ 5 durch die Standardnormalverteilung angenähert werden
kann. Wir erhalten also für die gesuchte
Wahrscheinlichkeit:
√
√
P (148 ≤ X ≤ 170) ≈ Φ 170+0.5−450·1/3
− Φ 148−0.5−150
=Φ
100
150·2/3
= Φ(2.05) − 1 + Φ(0.25) = 0.9798 − 1 + 0.5987
20.5
10
−Φ
−2.5
10
Aufgabe 3
4 Punkte
In einem Büroschrank liegen 8 Farbbandkassetten, von denen 3 bereits das Verwendbarkeitsdatum überschritten haben. Wie groß ist die Wahrscheinlichkeit, dass von 5 gleichzeitig und
zufällig ausgewählten Farbbandkassetten genau 2 das Verwendbarkeitsdatum überschritten haben?
Lösungsvorschlag zu Aufg. 3: Es liegt eine hypergeometrische Verteilung vor, und damit ist die
gesuchte Wahrscheinlichkeit:
Aufgabe 4
3
2
·
8
5
5
3
=
5·4·3
1·2·3
8·7·6·5·4
1·2·3·4·5
3·
6 Punkte
Die gemeinsame Verteilung zweier ZV X und Y sei in der folgenden Tabelle teilweise vorgegeben:
↓ X| Y →
-2
0
0
0.10
2
∗
0.20 0.20
3
∗
∗
Außerdem sei bekannt, dass X und Y unabhängig sind. Bestimmen Sie die noch fehlenden
Wahrscheinlichkeiten der gemeinsamen Verteilung und der Randverteilungen.
Lösungsvorschlag zu Aufg. 4: Es ist P (X = 2) = 0.20 + 0.20 = 0.40, und damit erhalten wir
wegen der Unabhängigkeit
–4–
P (Y = −2) = P (Y = −2 ∧ X = 2)/P (X = 2) = 0.20/0.40 = 0.50. Daraus ergibt sich
P (X = 0) = P (Y = −2 ∧ X = 0)/P (Y = −2) = 0.10/0.50 = 0.20, und wir erhalten:
↓X Y →
-2
0
0
0.10
0.20
2
0.20 0.20
0.40
0.50
1.00
3
Für die übrigen Wahrscheinlichkeiten erhalten wir dann: P (Y = 0) = 1.00 − 0.50 = 0.50,
P (Y = 0 ∧ X = 0) = 0.20 − 0.10 = 0.10,
P (X = 3) = 1.00 − 0.40 − 0.20 = 0.40,
P (Y = −2 ∧ X = 3) = 0.50 − 0.20 − 0.10 = 0.20,
und damit
↓X Y →
-2
P (Y = 0 ∧ X = 3) = 0.40 − 0.20 = 0.20.
0
0
0.10 0.10
0.20
2
0.20 0.20
0.40
3
0.20 0.20
0.40
0.50 0.50
Aufgabe 5
5 Punkte
Die gemeinsame Verteilung zweier ZV X und Y sei in der folgenden Tabelle vorgegeben:
↓ X| Y →
-4
0
0
0.05 0.50
2
0.20 0.05
3
0.05 0.15
Welchen Wert hat die Kovarianz von X und Y ?
Lösungsvorschlag zu Aufg. 5:
↓X Y →
-4
0
0
0.05 0.50
0.55
2
0.20 0.05
0.25
3
0.05 0.15
0.20
0.30 0.70
1.00
E(X) = 0.25 · 2 + 0.20 · 3 = 0.50 + 0.60 = 1.10
E(Y ) = 0.30 · (−4) = −1.20
Cov(X, Y ) = E(X · Y ) − E(X) · E(Y ) = 0.20 · (−4) · 2 + 0.05 · (−4) · 3 + 1.20 · 1.10
–5–
Aufgabe 6
8 Punkte
Eine Beobachtungsgröße sei N (µ, σ)–verteilt, wobei µ und σ unbekannt seien. Bestimmen Sie
ein 90%–Konfidenzintervall für µ. Dazu stehen Ihnen folgende Ergebnisse der Auswertung einer
Stichprobe vom Umfang n = 9 zur Verfügung:
9
x = 11,
1X
(xi − x)2 = 81.
8 i=1
Lösungsvorschlag zu Aufg. 6: Da σ unbekannt ist, ist die t−Verteilung anzuwenden. Wir gehen
also aus von der Formel


√



 (X − µ) 9  = 2Ft (ε) − 1 =! 0.90,

≤
ε
P  s

9

 1 P
2
8 i=1(Xi − X) wobei Ft die Verteilungsfunktion einer t−verteilten ZV mit 9 − 1 = 8 Freiheitsgraden ist. Mit
Hilfe der Tabelle gewinnen wir aus Ft (ε) = 1.90/2 = 0.95 den Wert ε = 1.860. Damit erhalten
wir aus
|x − µ| = |11 − µ| ≤
√
1.860· 81
3
= 1.860 · 3
das gesuchte Konfidenzintervall:
11 − 3 · 1.860 ≤ µ ≤ 11 + 3 · 1.860
Aufgabe 7
8 Punkte
Bei den 20 000 Studenten einer Universität soll durch eine Umfrage festgestellt werden, wie
viele Studenten mehr als 10 km vom Studienort entfernt wohnen. Bestimmen Sie dazu ein
95%–Konfidenzintervall für den unbekannten Anteil p dieser Studenten, wenn bei einer Stichprobe von 400 Studenten, die “ohne Zurücklegen” zufällig ausgewählt wird, 180 Studenten
davon mehr als 10 km vom Studienort entfernt wohnen.
Begründen Sie, weshalb die angewandte(n) Näherung(en) gerechtfertigt ist (sind). Bei zwei zur
Verfügung stehenden Näherungsformeln, genügt es, die einfachere (und gröbere) zu verwenden.
Lösungsvorschlag zu Aufg. 7: Die ZV X, deren Realisierung die angegebene Zahl 180 ist, ist
hypergeometrisch verteilt, aber eine Näherung durch Binomialverteilung ist erlaubt, da N =
20000 ≥ 1000 und
n
N
≤
400
20000
=
2
100
≤ 0.1 gelten. Zur Bestimmung des Konfidenzintervalls für
das unbekannte p benutzen wir eine Näherung durch die Normalverteilung, wobei die Bedingung
n = 400 ≥ 50 offensichtlich erfüllt ist und die anderen beiden Bedingungen nachträglich geprüft
werden müssen. Wir gehen also von der Annahme aus, dass Y :=
verteilt ist:
X−np
√
npq
näherungsweise N (0, 1)-
–6–
!
P (|Y | ≤ ε) ≈ 2Φ(ε) − 1 = 0.95, Φ(ε) = 1.95/2 = 0.975.
Daraus gewinnen wir aus der t−Verteilungstabelle (Zahl der Freiheitsgrade= ∞):
ε = 1.960 und damit
p1,2 =
180 ∓ 1.960 · 10
.
400
Wegen n · p1 = 180 − 19.60 ≥ 5 und n · (1 − p2 ) = 400 − 180 − 19.60 ≥ 5 sind auch die noch
fehlenden Näherungsbedingungen erfüllt und
180 − 1.960 · 10 180 + 1.960 · 10
,
400
400
ist näherungsweise das gesuchte Konfidenzintervall.
Aufgabe 8
10 Punkte
Eine Messgröße sei N (µ, σ0 )–verteilt, wobei σ0 = 10 bekannt sei. Es soll die Hypothese
H0 : µ ≤ 60 gegen die Hypothese H1 : µ > 60 getestet werden, wobei eine irrtümliche Ablehnung
von H0 nur mit einer Wahrscheinlichkeit von α = 0.05 und eine irrtümliche Ablehnung von H1
nur mit einer Wahrscheinlichkeit von β = 0.10 erfolgen soll. Zu welchem Testergebnis kommen
Sie, wenn die Auswertung einer Stichprobe vom Umfang 25 einen Durchschnittswert
a) x = 64,
b) x = 58
ergibt?
Lösungsvorschlag zu Aufg. 8: Es ist hier ein einseitiger Test für µ mit bekanntem σ = σ0 = 10
durchzuführen. Aus der Zeile mit r = ∞ der t−Verteilungstabelle gewinnen wir
Φ(ε0 ) = 1 − α = 0.95, ε0 = 1.645 und
Φ(ε1 ) = 1 − β = 0.90, ε1 = 1.282
Daraus ermitteln wir die kritischen Testgrößen:
d0 =
1.645·10
5
= 3.290 und d1 =
1.282·10
5
= 2.564.
Mit µ0 = 60 können wir nun den Test durchführen:
a) x = 64 ≥ µ0 + d0 = 60 + 3.290 und damit ist H0 abzulehnen.
b) x = 58 > µ0 − d1 = 60 − 2.564 und x = 58 < µ0 + d0 = 60 + 3.290 und damit kann keine
Entscheidung mit ausreichender Sicherheit getroffen werden.
Herunterladen