–1– Statistik II für Wirtschaftswissenschaftler Klausur am 29.07.2005, 09.00–11.00. Bitte unbedingt beachten: a) Gewertet werden alle 8 gestellten Aufgaben. b) Lösungswege sind anzugeben. Die Angabe des Endergebnisses allein gilt nicht als Lösung. Da keine Taschenrechner zugelassen sind, brauchen Zahlenrechnungen, für die man normalerweise einen Taschenrechner benutzen würde, nicht durchgeführt zu werden. Ausnahme: Zwischenergebnis, für das der Zahlenwert für die weitere Behandlung der Aufgabe unbedingt nötig ist. Dieser Zahlenwert kann aber dann durch Kopfrechnung ermittelt werden. Ein Endergebnis ist vollständig, wenn zur Ermittlung des Zahlenwertes höchstens die Ausführung der elementaren Rechenoperationen (Addition, Subtraktion, Multiplikation, Division) und die Anwendung elementarer Funktionen (exp x(≡ ex ), ln x, log x, sin x, √ cos x, tan x, arcsin x, arccos x, arctan x, ax , x) nötig wäre. Die Bildung von m! und des Binomialkoeffizienten z.B. gehören nicht zu den elementaren Rechenoperationen. c) Zugelassene Hilfsmittel: Werden für die künftigen Klausuren neu festgelegt. Weitere Hinweise: a) Wer mindestens 30 Punkte erreicht hat, hat bestanden. b) Weitere Infos finden Sie im Internet in dem file “allginfo.ps” oder “allginfo.pdf” im Verzeichnis “http://www.mathematik.uni-stuttgart.de/studium/infomat/WiS − Kolbe− 05/”. –2– Aufgabe 1 11 Punkte a) Es sei Y eine diskrete Zufallsvariable, die die Werte (−1) und (+1) jeweils mit Wahrscheinlichkeit 0.3 und den Wert 0 mit Wahrscheinlichkeit 0.4 annimmt. Bestimmen Sie die Wahrscheinlichkeiten P (Y ≤ 0) und P (Y < 1). b) Bestimmen Sie die positive Konstante c so, dass ( c · (12 − 3x2 ) f (x) := 0 für |x| ≤ 2 sonst die Wahrscheinlichkeitsdichte einer stetigen Zufallsvariablen X ist, und bestimmen Sie den Erwartungswert und die Standardabweichung von X. Lösungsvorschlag zu Aufg. 1: a) ( ∓1 Y = 0 jeweils mit Wahrscheinlichkeit 0.3 jeweils mit Wahrscheinlichkeit 0.4 P (Y 6 0) = P (Y = −1) + P (Y = 0) = 0.3 + 0.4 = 0.7 P (Y < 1) = P (Y = −1) + P (Y = 0) = 0.7 b) Z ∞ −∞ f (x)dx = Z 2 −2 ! c · (12 − 3x2 )dx = c[12x − x3 ]2−2 = 32c = 1 ⇔ c= 1 32 (c > 0 ∧ (12 − 3x2 ) > 0 für alle |x| 6 2 ∧ f (x) = 0 für alle |x| > 2) ⇒ f (x) > 0 für alle x, f (x) ist also Verteilungsdichte. 1 E(X) := x · f (x)dx = 32 −∞ Z ∞ Z 2 −2 (12x − 3x3 )dx = 0, da eine ungerade Funktion über ein symmetrisches Intervall integriert wird. Z 2 1 32 · 5 − 3 · 32 1 2 2 (12x2 − 3x4 )dx − 0 = · [4x3 − 3x5 /5]2−2 = V (X) = E(X ) − (E(X)) = 32 −2 32 16 · 5 r 32 · 5 − 3 · 32 σ(X) = 16 · 5 Aufgabe 2 8 Punkte a) Die Zahl der in einer Minute bei einer Telefonzentrale ankommenden Anrufe sei Poisson– verteilt mit dem Erwartungswert 4. Wie groß ist Wahrscheinlichkeit, dass zwischen 1 und 3 Anrufe (beide Grenzen eingeschlossen) in einer Minute ankommen? –3– b) Bei einem zentral gelegenen Großbetrieb mit 30 000 Mitarbeitern kommen 10 000 mit dem Auto und 20 000 mit öffentlichen Verkehrsmitteln zur Arbeit. Es werden zufällig 450 Mitarbeiter ausgewählt und befragt, wobei kein Mitarbeiter mehr als einmal ausgewählt wird. Bestimmen Sie näherungsweise (also nicht exakt) die Wahrscheinlichkeit, dass davon zwischen 148 und 170 mit dem Auto kommen. Lösungsvorschlag zu Aufg. 2: a) P (X = k) = k e−4 4k! , P (1 ≤ X ≤ 3) = e b) Es liegt eine hypergeometrische Verteilung vor. Da aber 450 30000 −4 · 4 1 + 42 1·2 + 43 1·2·3 ≤ 0.1 (korrigiert) und 30000 ≥ 1000 (korrigiert) gelten, kann näherungsweise Binomialverteilung angenommen werden mit n = 450, p = 10000 30000 = 1 3 und q := 1 − p = 32 , die wiederum wegen n = 450 ≥ 50, n · p = 150 ≥ 5 und n · q = 3000 ≥ 5 durch die Standardnormalverteilung angenähert werden kann. Wir erhalten also für die gesuchte Wahrscheinlichkeit: √ √ P (148 ≤ X ≤ 170) ≈ Φ 170+0.5−450·1/3 − Φ 148−0.5−150 =Φ 100 150·2/3 = Φ(2.05) − 1 + Φ(0.25) = 0.9798 − 1 + 0.5987 20.5 10 −Φ −2.5 10 Aufgabe 3 4 Punkte In einem Büroschrank liegen 8 Farbbandkassetten, von denen 3 bereits das Verwendbarkeitsdatum überschritten haben. Wie groß ist die Wahrscheinlichkeit, dass von 5 gleichzeitig und zufällig ausgewählten Farbbandkassetten genau 2 das Verwendbarkeitsdatum überschritten haben? Lösungsvorschlag zu Aufg. 3: Es liegt eine hypergeometrische Verteilung vor, und damit ist die gesuchte Wahrscheinlichkeit: Aufgabe 4 3 2 · 8 5 5 3 = 5·4·3 1·2·3 8·7·6·5·4 1·2·3·4·5 3· 6 Punkte Die gemeinsame Verteilung zweier ZV X und Y sei in der folgenden Tabelle teilweise vorgegeben: ↓ X| Y → -2 0 0 0.10 2 ∗ 0.20 0.20 3 ∗ ∗ Außerdem sei bekannt, dass X und Y unabhängig sind. Bestimmen Sie die noch fehlenden Wahrscheinlichkeiten der gemeinsamen Verteilung und der Randverteilungen. Lösungsvorschlag zu Aufg. 4: Es ist P (X = 2) = 0.20 + 0.20 = 0.40, und damit erhalten wir wegen der Unabhängigkeit –4– P (Y = −2) = P (Y = −2 ∧ X = 2)/P (X = 2) = 0.20/0.40 = 0.50. Daraus ergibt sich P (X = 0) = P (Y = −2 ∧ X = 0)/P (Y = −2) = 0.10/0.50 = 0.20, und wir erhalten: ↓X Y → -2 0 0 0.10 0.20 2 0.20 0.20 0.40 0.50 1.00 3 Für die übrigen Wahrscheinlichkeiten erhalten wir dann: P (Y = 0) = 1.00 − 0.50 = 0.50, P (Y = 0 ∧ X = 0) = 0.20 − 0.10 = 0.10, P (X = 3) = 1.00 − 0.40 − 0.20 = 0.40, P (Y = −2 ∧ X = 3) = 0.50 − 0.20 − 0.10 = 0.20, und damit ↓X Y → -2 P (Y = 0 ∧ X = 3) = 0.40 − 0.20 = 0.20. 0 0 0.10 0.10 0.20 2 0.20 0.20 0.40 3 0.20 0.20 0.40 0.50 0.50 Aufgabe 5 5 Punkte Die gemeinsame Verteilung zweier ZV X und Y sei in der folgenden Tabelle vorgegeben: ↓ X| Y → -4 0 0 0.05 0.50 2 0.20 0.05 3 0.05 0.15 Welchen Wert hat die Kovarianz von X und Y ? Lösungsvorschlag zu Aufg. 5: ↓X Y → -4 0 0 0.05 0.50 0.55 2 0.20 0.05 0.25 3 0.05 0.15 0.20 0.30 0.70 1.00 E(X) = 0.25 · 2 + 0.20 · 3 = 0.50 + 0.60 = 1.10 E(Y ) = 0.30 · (−4) = −1.20 Cov(X, Y ) = E(X · Y ) − E(X) · E(Y ) = 0.20 · (−4) · 2 + 0.05 · (−4) · 3 + 1.20 · 1.10 –5– Aufgabe 6 8 Punkte Eine Beobachtungsgröße sei N (µ, σ)–verteilt, wobei µ und σ unbekannt seien. Bestimmen Sie ein 90%–Konfidenzintervall für µ. Dazu stehen Ihnen folgende Ergebnisse der Auswertung einer Stichprobe vom Umfang n = 9 zur Verfügung: 9 x = 11, 1X (xi − x)2 = 81. 8 i=1 Lösungsvorschlag zu Aufg. 6: Da σ unbekannt ist, ist die t−Verteilung anzuwenden. Wir gehen also aus von der Formel √ (X − µ) 9 = 2Ft (ε) − 1 =! 0.90, ≤ ε P s 9 1 P 2 8 i=1(Xi − X) wobei Ft die Verteilungsfunktion einer t−verteilten ZV mit 9 − 1 = 8 Freiheitsgraden ist. Mit Hilfe der Tabelle gewinnen wir aus Ft (ε) = 1.90/2 = 0.95 den Wert ε = 1.860. Damit erhalten wir aus |x − µ| = |11 − µ| ≤ √ 1.860· 81 3 = 1.860 · 3 das gesuchte Konfidenzintervall: 11 − 3 · 1.860 ≤ µ ≤ 11 + 3 · 1.860 Aufgabe 7 8 Punkte Bei den 20 000 Studenten einer Universität soll durch eine Umfrage festgestellt werden, wie viele Studenten mehr als 10 km vom Studienort entfernt wohnen. Bestimmen Sie dazu ein 95%–Konfidenzintervall für den unbekannten Anteil p dieser Studenten, wenn bei einer Stichprobe von 400 Studenten, die “ohne Zurücklegen” zufällig ausgewählt wird, 180 Studenten davon mehr als 10 km vom Studienort entfernt wohnen. Begründen Sie, weshalb die angewandte(n) Näherung(en) gerechtfertigt ist (sind). Bei zwei zur Verfügung stehenden Näherungsformeln, genügt es, die einfachere (und gröbere) zu verwenden. Lösungsvorschlag zu Aufg. 7: Die ZV X, deren Realisierung die angegebene Zahl 180 ist, ist hypergeometrisch verteilt, aber eine Näherung durch Binomialverteilung ist erlaubt, da N = 20000 ≥ 1000 und n N ≤ 400 20000 = 2 100 ≤ 0.1 gelten. Zur Bestimmung des Konfidenzintervalls für das unbekannte p benutzen wir eine Näherung durch die Normalverteilung, wobei die Bedingung n = 400 ≥ 50 offensichtlich erfüllt ist und die anderen beiden Bedingungen nachträglich geprüft werden müssen. Wir gehen also von der Annahme aus, dass Y := verteilt ist: X−np √ npq näherungsweise N (0, 1)- –6– ! P (|Y | ≤ ε) ≈ 2Φ(ε) − 1 = 0.95, Φ(ε) = 1.95/2 = 0.975. Daraus gewinnen wir aus der t−Verteilungstabelle (Zahl der Freiheitsgrade= ∞): ε = 1.960 und damit p1,2 = 180 ∓ 1.960 · 10 . 400 Wegen n · p1 = 180 − 19.60 ≥ 5 und n · (1 − p2 ) = 400 − 180 − 19.60 ≥ 5 sind auch die noch fehlenden Näherungsbedingungen erfüllt und 180 − 1.960 · 10 180 + 1.960 · 10 , 400 400 ist näherungsweise das gesuchte Konfidenzintervall. Aufgabe 8 10 Punkte Eine Messgröße sei N (µ, σ0 )–verteilt, wobei σ0 = 10 bekannt sei. Es soll die Hypothese H0 : µ ≤ 60 gegen die Hypothese H1 : µ > 60 getestet werden, wobei eine irrtümliche Ablehnung von H0 nur mit einer Wahrscheinlichkeit von α = 0.05 und eine irrtümliche Ablehnung von H1 nur mit einer Wahrscheinlichkeit von β = 0.10 erfolgen soll. Zu welchem Testergebnis kommen Sie, wenn die Auswertung einer Stichprobe vom Umfang 25 einen Durchschnittswert a) x = 64, b) x = 58 ergibt? Lösungsvorschlag zu Aufg. 8: Es ist hier ein einseitiger Test für µ mit bekanntem σ = σ0 = 10 durchzuführen. Aus der Zeile mit r = ∞ der t−Verteilungstabelle gewinnen wir Φ(ε0 ) = 1 − α = 0.95, ε0 = 1.645 und Φ(ε1 ) = 1 − β = 0.90, ε1 = 1.282 Daraus ermitteln wir die kritischen Testgrößen: d0 = 1.645·10 5 = 3.290 und d1 = 1.282·10 5 = 2.564. Mit µ0 = 60 können wir nun den Test durchführen: a) x = 64 ≥ µ0 + d0 = 60 + 3.290 und damit ist H0 abzulehnen. b) x = 58 > µ0 − d1 = 60 − 2.564 und x = 58 < µ0 + d0 = 60 + 3.290 und damit kann keine Entscheidung mit ausreichender Sicherheit getroffen werden.