Statistik I Juli 2004 Aufgabe 1 11 Punkte In Alksburg, dem Austragungsort des Brückenfestes“, werden sieben verschiedene (nicht rezeptpflichtige) ” Präparate gegen Kopfschmerz angeboten. Jedes Präparat basiert auf genau einem der drei alternativen Wirkstoffe A, B oder C, wobei bekannt ist, dass die Substanz C wirksamer ist als die Substanz A und diese wiederum wirksamer als die Substanz B. Auf Grund der großen Nachfrage nach Kopfschmerzmitteln werden in Alksburg derartige Präparate grundsätzlich nur in Packungen zu 50 Tabletten (entspricht Packungsgröße N3) verkauft. Die nachfolgende Tabelle fasst für jedes Präparat den enthaltenen Wirkstoff, den Verkaufspreis pro Packung sowie die im Jahr 2003 in Alksburg abgesetzte Anzahl Packungen zusammen: Präparat Wirkstoff Preis (in € pro Packung) Absatz (in Anzahl Packungen) 1 2 3 4 5 6 7 A C C B C A B 8 12 10 9 20 6 5 22 000 18 500 22 000 9 500 9 000 6 000 500 a) Geben Sie die Skalierung der drei Merkmale Wirksamkeit des Wirkstoffes, Preis und Absatz an. b) Ermitteln Sie für jedes der drei Merkmale aus a) die folgenden Lageparameter, soweit diese auf Grund des jeweiligen Skalenniveaus sinnvollerweise berechnet werden können: • Modus • Median • Arithmetisches Mittel c) Welches Maß ist geeignet zur Quantifizierung des Zusammenhangs zwischen den Merkmalen Preis und Absatz? (Keine Berechnung erforderlich!) d) Auf Grund der Vermutung, dass hohe Absatzwerte vorwiegend bei niedrigen Preisen auftreten (und umgekehrt), könnte man eine negative Korrelation dieser beiden Merkmale erwarten. Dennoch hat die Berechnung eines geeigneten, auf [−1; 1] normierten Zusammenhangsmaßes den positiven Wert 0,186 ergeben. Erläutern Sie auf Grund obiger Daten (ohne Rechnung!) das Zustandekommen dieses vermeintlichen Widerspruchs. e) Bestimmen Sie den Wert des normierten Gini-Koeffizienten für den Umsatz im Jahr 2003. 1 Aufgabe 2 9 Punkte Herr B. hat in fünf aufeinanderfolgenden Jahren jeweils im ersten Drittel (d.h. Januar bis April), im zweiten Drittel (Mai bis August) bzw. im dritten Drittel (September bis Dezember) des Jahres folgende Strecken (gemessen in 1000 km) mit dem Fahrrad zurückgelegt: Jahr Drittel Strecke 1 1 2 3 1,3 3,8 1,2 1 2 2 3 0,7 4,4 1,2 1 3 2 3 1,0 3,8 1,5 1 4 2 3 1,3 3,5 1,5 1 5 2 3 1,9 3,5 0,9 a) Unterstellen Sie das additive Zeitreihenmodell mit konstanter Saisonfigur und berechnen Sie die zugehörige saisonbereinigte Zeitreihe. b) Berechnen Sie für das erste Drittel des Jahres 3 den gleitenden Durchschnitt der Ordnung 6. c) Im Folgenden wird mit zi die von Herrn B. insgesamt im Jahr i mit dem Fahrrad zurückgelegte Strecke bezeichnet, i = 1, ..., 5. Wie lautet die Regressionsgerade, wenn die zi als Werte der abhängigen und die i als Werte der unabhängigen Variablen angesetzt werden? Aufgabe 3 10 Punkte Student Eddy Einsam ist seit einer Woche mit einer Kommilitonin liiert. Zum Einwöchigen möchte er sie überraschen und mit einem Geschenk seine Liebe unter Beweis stellen. Auf die Frage, über welches Präsent sie sich besonders freuen würde, antwortet sie mit Du musst mir doch nichts schenken, mein Schatz!“. Seine ” Mutter gibt ihm jedoch den Rat, dieser Aussage nicht zu glauben und ihr Blumen zu schenken. Da Eddy Einsam bisher kaum Erfahrung im zwischenmenschlichen Bereich sammeln konnte, zieht er seinen Freund Anton Amore zurate. Anton schätzt, dass die Mutter von Eddy mit 85 % Wahrscheinlichkeit Recht mit der Aussage hat, dass die Freundin von Eddy ein Geschenk erwartet. In diesem Fall ist die Wahrscheinlichkeit 90 %, dass die Dame sauer wird, wenn sie kein Geschenk erhält. Sollte die Mutter mit ihrer Meinung jedoch im Unrecht sein, so wäre die Freundin von Eddy mit 60 % Wahrscheinlichkeit sauer über den Erhalt eines Geschenkes, da er ihre Antwort nicht ernst genommen hat. Nicht sauer wird sie, wenn sie sich ein Geschenk wünscht und ein Geschenk erhält bzw. sich kein Geschenk wünscht und nichts erhält. Bitte verwenden Sie die angegebenen Bezeichnungen für folgende Ereignisse: E = Die Freundin erwartet ein Geschenk“ ” N = Eddy schenkt der Freundin nichts“ ” S = Die Freundin ist sauer“ ” I. Eddy ist mit der Situation überfordert und beschließt, eine faire Münze zu werfen. Bei Kopf“ schenkt ” er seiner Freundin Blumen, bei Zahl“ nichts. ” a. Mit welcher Wahrscheinlichkeit ist die Freundin am Abend des Einwöchigen sauer (P(S))? (Anmerkung: Es empfiehlt sich die Visualisierung des Sachverhaltes anhand einer Baumdarstellung.) b. Eddys Freundin ist am Abend des Einwöchigen sauer. Mit welcher Wahrscheinlichkeit hatte sie ein Geschenk erwartet (P(E|S))? II. Eigentlich hatte Eddy vor, seiner Freundin zum Einwöchigen eine Jahreskarte für den FCA zu schenken. Nehmen Sie deshalb nun (statt der in I. beschriebenen Vorgehensweise) an, dass Eddy beschließt, die Münze zweimal zu werfen und je nach dabei eintretender Münzkombination der Freundin Blumen, die Jahreskarte bzw. nichts zu schenken. Bekannt sei, dass er bei der Kombination zweimal Kopf“ ” 2 Blumen schenkt. Die übrigen Festlegungen kennt außer Eddy nur Anton Amore, und dieser hat daraus für das Ereignis, dass die Freundin ein Geschenk erwartet, nichts bekommt und sauer wird, den Wert 19,125 % errechnet (P(E ∩ N ∩ S) = 0, 19125). Bei welcher Münzkombination schenkt Eddy die FCAJahreskarte, wenn als mögliche Kombinationen die Fälle zweimal Kopf“, einmal Kopf, einmal Zahl“ ” ” und zweimal Zahl“ angesehen werden? ” Aufgabe 4 10 Punkte Bei der Fußballweltmeisterschaft 2006 gelangen die Mannschaften aus der Schweiz und aus Jamaika in das Endspiel. Da nach der regulären Spielzeit und der Verlängerung noch kein Tor gefallen ist, soll das Spiel durch Elfmeterschießen entschieden werden. Die Schweizer Spieler erzielen mit der Wahrscheinlichkeit von 0,8 pro Schuss einen Treffer, die Jamaikaner haben Elfmeterschießen nicht geübt und schießen die Bälle gleichverteilt auf eine Fläche von 14 mal 5 Meter, in der am unteren Rand mittig sich das Tor befindet, welches die Größe 7 mal 2,50 Meter hat. Um den Jamaikanern überhaupt eine Chance zu geben, verzichtet die Schweizer Mannschaft auf einen Torwart. Jede Mannschaft hat zunächst fünf Schüsse, dann soll ein Sieger feststehen. Die Schützen treffen unabhängig voneinander. a) Wie groß ist die Wahrscheinlichkeit, dass die Schweiz genau 2mal trifft? Wie groß ist die Wahrscheinlichkeit für 3 oder mehr Treffer? b) Wie groß ist die Wahrscheinlichkeit, dass Jamaika genau 2mal trifft? Wie groß ist die Wahrscheinlichkeit für 3 oder mehr Treffer? Nach 4 Runden steht es 4:4. c) Wie groß ist die Wahrscheinlichkeit, dass nach der nächsten Runde Jamaika die WM gewonnen hat? Da nach fünf Schüssen Gleichstand herrscht, wird das Elfmeterschießen fortgesetzt. Beim Stand von 27:27 schätzt der Schiedsrichter, dass die Zeit in Minuten von jetzt bis zum Ende des Spieles eine N(40;10)-verteilte Zufallsvariable ist. Wie groß ist dann die Wahrscheinlichkeit, dass d) das Spiel nach spätestens einer weiteren Stunde beendet ist? e) die weitere Spielzeit in dem Intervall [30; 40] liegt? Aufgabe 5 10 Punkte Von einer zweidimensionalen Zufallsvariablen (X ,Y ) ist Folgendes bekannt: • X hat den Wertebereich {−2; 0; 2} . • Y hat den Wertebereich {0; 1} . • Es gilt P(X = −2) = P(X = 0) = 0,3 , P(X = −2,Y = 0) = 0,3 und P(X = 2,Y = 0) = 0,1. Außerdem sei P(Y = 0) = 0,6. Berechnen Sie a) die fehlenden gemeinsamen Wahrscheinlichkeiten und Randwahrscheinlichkeiten zu (X ,Y ), b) sowohl von X als auch von Y den Erwartungswert und die Varianz, c) den Erwartungswert der Zufallsvariablen X ·Y, d) die Kovarianz Cov(X ,Y ). e) Sind X ,Y unabhängig? (Kurze Begründung!) f) Bestimmen Sie die Varianz der Zufallsvariablen 3X −Y . 3 Lösung zu Aufgabe 1 a) Wirksamkeit: ordinal; b) Wirkstoff: Preis: Absatz: Preis: kardinal; xMod = C; xMod : jeder Preis; xMod = 22 000; Absatz: kardinal xMed = A xMed = 9; xMed = 9 500; x̄ = 10 x̄ = 12 500 c) Sinnvoll: Bravais-Pearson-Korrelationskoeffizient d) Es liegt eine Scheinkorrelation vor. Die intervenierende Variable Wirkstoff bewirkt, dass Preis und Absatz positiv korreliert sind: Ein wirksameres Medikament wird trotz des höheren Preises stärker nachgefragt als ein weniger wirksames Medikament. e) Zuerst wird für jedes Präparat der Umsatz (in T€) ermittelt und die Umsatzzahlen aufsteigend sortiert: Preis Absatz Umsatz (= xi ) 8 12 10 9 20 6 5 22 000 18 500 22 000 9 500 9 000 6 000 500 176 222 220 85,5 180 36 2,5 ∑ 922 i 4 7 6 3 5 2 1 Einsetzen in (17) i.V.m. (16) liefert: G∗ = 2 · (2,5 + 2 · 36 + · · · + 7 · 222) − (7 + 1) · 922 = 0,405 (7 − 1) · 922 Lösung zu Aufgabe 2 a) Zu verwenden sind gleitende Durchschnitte der Ordnung 3. Dann: yt 1,3 yt∗ − yt − yt∗ − yi j − Ŝ j 2,2 wobei: b) 1 6 3,8 1,2 0,7 2,1 1,9 2,1 1,7 −0,7 −1,4 2,1 2,0 1,6 S̃1 = 0,9; S̃2 = 1,7; 4,4 1,2 1,0 2,1 2,2 2,0 2,3 −1,0 −1,0 2,7 2,0 1,9 S̃3 = −0,8; 1 3 3,8 1,5 1,3 2,1 2,2 2,1 1,7 −0,7 −0,8 2,1 2,3 2,2 3 ∑ S̃ j = 0 ⇒ Ŝ j = S̃ j , 3,5 1,5 1,9 2,1 2,3 2,3 1,4 −0,8 −0,4 1,8 2,3 2,8 3,5 0,9 2,1 − 1,4 − 1,8 1,7 j = 1, 2, 3 j=1 · ( 21 · 0,7 + 4,4 + 1,2 + 1,0 + 3,8 + 1,5 + 21 · 1,3) = 2,15 c) Wegen z1 = z2 = · · · = z5 = 6,3 = const. ist die Regressionsgerade: z = 6,3 4 (d.h. â = 6,3; b̂ = 0). Lösung zu Aufgabe 3 I. a) P(S) = 0,85 · 0,5 · 0,9 + 0,15 · 0,5 · 0,6 = 0,4275 b) P(E|S) = 0,85·0,5·0,9 0,4275 = 0,8947 II. P(E ∩ N ∩ S) = 0,19125 ⇒ 0,85 · P(N) · 0,9 = 0,19125 ⇒ P(N) = 0,25 entspricht zweimal Zahl“⇒ FCA-Jahreskarte bei einmal Kopf, einmal Zahl“ ” ” Lösung zu Aufgabe 4 a) Anzahl Treffer: X ∼ B(5; 0,8) bzw. Anzahl Fehlversuche: Y ∼ B(5; 0,2) P(X = 2) = P(Y = 3) = F(3) − F(2) = 0,9933 − 0,9421 = 0,0512 P(X ≥ 3) = P(Y ≤ 2) = F(2) = 0,9421 b) Das Tor nimmt 25 % der Fläche ein, auf die die Jamaikaner schießen. Wegen der Gleichverteilung auf dieser Fläche gilt: P(Treffer) = 0,25 ⇒ Anzahl Treffer: X ∼ B(5; 0,25) P(X = 2) = F(2) − F(1) = 0,8965 − 0,6328 = 0,2637 P(X ≥ 3) = 1 − F(2) = 1 − 0,8965 = 0,1035 c) Jamaika gewinnt, wenn Jamaika trifft und die Schweiz daneben schießt: 0,25 · (1 − 0,8) = 0,05 = Φ(2) = 0,9772 d) F(60) = Φ 60−40 10 − Φ 30−40 = Φ(0) − Φ(−1) = Φ(0) − [1 − Φ(1)] = 0,5 − (1 − 0,8413) = e) F(40) − F(30) = Φ 40−40 10 10 0,3413 Lösung zu Aufgabe 5 a) P(X = 0, Y = 0) = 0,2; P(X = −2, Y = 1) = 0; P(X = 2) = 0,4; P(Y = 1) = 0,4 P(X = 0, Y = 1) = 0,1; P(X = 2, Y = 1) = 0,3; b) E(X ) = −2 · 0,3 + 2 · 0,4 = 0,2; Var(X ) = (−2 − 0,2)2 · 0,3 + (0 − 0,2)2 · 0,3 + (2 − 0,2)2 · 0,4 = 2,76; E(Y ) = 0,4; Var(Y ) = (0 − 0,4)2 · 0,6 + (1 − 0,4)2 · 0,4 = 0,24 c) E(X ·Y ) = 2 · 1 · 0,3 = 0,6 d) Cov(X ,Y ) = E(X ·Y ) − E(X ) · E(Y ) = 0,6 − 0,2 · 0,4 = 0,52 e) Nein, da P(X = 0) · P(Y = 0) = 0,3 · 0,6 = 0,18 6= 0,2 = P(X = 0, Y = 0) f) Var(3X −Y ) = 32 · Var(X ) + Var(Y ) − 2 · 3 · Cov(X ,Y ) = 9 · 2,76 + 0,24 − 6 · 0,52 = 21,96 5