PROBEKLAUSUR zur Veranstaltung „Einführung in die Statistik“ WS 2004/2005 BEACHTE: * Ja/Nein Antworten müssen begründet werden. * Falls bei den Tests unten kein Signifikanzniveau angegeben ist, ist alpha = 0.05 (bzw. kleiner gleich). 1. Ein Kneipenwirt A will herausfinden, wie viel Bier sein Konkurrent, der Nachbarwirt B, verkauft. Er befragt fünf Stammgäste der B-Kneipe, wie viele Bier sie in der vergangenen Woche dort getrunken haben. Die Antworten lauten: 31, 27, 5, 19, 23. a) Berechnen Sie ein 95%-Konfidenzintervall für den mittleren wöchentlichen Bierkonsum eines Stammkunden der B-Kneipe. Unterstellen Sie dabei Normalverteilung des Bierkonsums. b) Angenommen, die Populationsvarianz für den Bierkonsum aller Stammkunden der BKneipe wäre bekannt. Wäre ein so berechnetes Konfidenzintervall breiter, schmaler oder gleich breit wie das unter a) berechnete? Warum? c) In seiner eigenen Kneipe hat Wirt A gezählt, dass seine fünf treusten Gäste in der vergangenen Woche zusammen 132 Bier bestellt haben. Er behauptet optimistisch, dass seine eigene Kundschaft trinkfreudiger sei (Ha). Überprüfen Sie diese Hypothese und gehen sie dabei von einer Populationsvarianz von 100 für die Kunden beider Kneipen aus. 2. Für 51 Datenpaare soll die Regressionsgerade berechnet werden. Gegeben seien die Mittelwerte für x (m(x)=20) und y (m(y)=10). Zudem die Var(x)=600, Var(y)=300 und Cov(x,y)= 150. a) b) c) d) e) f) g) h) i) j) Wie groß sind F(OHNE x): und F(MIT x): Wert des Determinationskoeffizienten 2. Art: Konstruiere ein Konfidenzintervall für beta: Wird die H0: alpha=0 (Alternative: nicht 0) verworfen? Wert der Teststatistik: und Kritischer Bereich: Welche Annahmen über die Residuen müssen für diesen Test erfüllt sein? Welchen Wert würden Sie für x = 9 prädizieren? Wie groß ist der Produkt-Moment-Korrelationskoeffizient r? Bestimmen Sie ein 95%-Konfidenzintervall für rho: Ist der Schätzer für z(rho) erwartungstreu? Warum? 3. Bei Lehrern verschiedener Fächer (=x) wurde erhoben, wieviel Zeit (=y) sie für die Vorbereitung des Unterrichts in einem Monat benötigen (Normalverteilungs- und Homoskedastizitätsannahme seien ok). Die Daten: y-Mittelwert y-Standardabweichung Anzahl Befragte Mathematik 15 5 25 Deutsch 30 10 30 Englisch 25 8 20 Untersuche zur Prädiktion die Mittelwertsregel! a) Berechne das geeignete PRE-Maß: wie heißt es? b) Charakterisieren Sie genau die Prädiktionsregel(OHNE Fach): und die Prädiktionsregel(MIT Fach): c) Wie groß sind Fehler(OHNE Fach) und Fehler(MIT Fach): 1 PROBEKLAUSUR zur Veranstaltung „Einführung in die Statistik“ WS 2004/2005 Teste die Hypothese, dass die Populationsmittelwerte gleich seien: d) Wert der Teststatistik: e) Kritischer Bereich: Freiheitsgrade: f) Wird die Hypothese abgelehnt? 4. In einer Klausur seien folgende Ergebnisse erzielt worden (bestanden hat man mit 50 und mehr Punkten): Bewertung Punkte Anzahl Schüler ungenügend 0 – 30 14 mangelhaft 31 – 49 18 a) Berechnen Sie den Median: b) Berechnen Sie das 1. Quartil ausreichend 50 – 69 28 gut 70 – 84 25 Sehr gut 85 – 100 15 und das 85. Perzentil: Überprüfen Sie die Behauptung (Hypothese), dass das 1. Terzil zwischen 49 und 50 Punkten liegt und das 2. Terzil zwischen 69 und 70 Punkten liegt ( = 0.01). c) Name der Teststatistik? d) Kritischer Bereich? e) Wird die H0 verworfen? Wert der Teststatistik? Freiheitsgrade? Warum? 5. Eine Kunden-Initiative beschwert sich bei der Geschäftsleitung eines BekleidungsKonzerns, dass in der Filiale in ihrer Heimatstadt K. nur 40% der Pullover in jeder der drei Kleider-Größen S, M und L vorhanden seien (andere Größen bitte außer Acht lassen). Der Filialleiter behauptet darauf aber alternativ, dass er 75% der Pullover in allen genannten Größen anbiete. Daraufhin besucht ein Abgesandter der Geschäftsleitung inkognito die Filiale und überprüft 50 der angebotenen Pullover-Modelle. Als Teststatistik diene die Anzahl der Pullover-Modelle, die in den Größen S, M und L verfügbar sind. a) Welche Verteilung hat die Teststatistik? b) Berechnen sie den Fehler 1. Art und den Fehler 2. Art. c) Kann der Behauptung des Filialleiters Glauben geschenkt werden, wenn bei 22 der überprüften Modelle mindestens eine Kleidergröße fehlt? Der Abgesandte der Geschäftsleitung hat nebenbei festgestellt, dass bei 80% der überprüften Modelle die Größe L am häufigsten vorrätig ist, bei den restlichen Modellen dominieren die beiden anderen Größen zu gleichen Teilen. Der Filialleiter meint aber, dass es bezogen auf die im Laden angebotenen Kleider insgesamt in der Häufigkeit der drei Kleidergrößen keinen Unterschied gäbe. d) Überprüfen Sie die Behauptung des Filialleiters mit einem geeigneten Test. Wählen Sie dazu eine Teststatistik, berechnen Sie den Testwert und bestimmen Sie den kritischen Bereich. Hat der Filialleiter diesmal Recht? 6. In der Kölner Innenstadt werden am Rosenmontag (15 Uhr) 6 zufällig ausgewählte Passanten danach befragt, wie viele alkoholische Getränke sie heute schon getrunken haben. Die Umfrage ergab folgende Daten: 0, 9, 1, 0, 2, 5 Berechnen Sie für diese Daten: a) den Median b) 1. Quartil: und 1. Terzil: c) die beiden Hinges d) die Entropie 2 PROBEKLAUSUR zur Veranstaltung „Einführung in die Statistik“ WS 2004/2005 e) und die qualitative Varianz Warum ist der Stichprobenmittelwert der sechs Passanten ein erwartungstreuer Schätzer für den Mittelwert der Population ? f) Aus diesen Werten werden nun 20 Stichproben der Größe 6 (mit Zurücklegen) gezogen. Für jede der Stichproben wurde die Varianz berechnet. Folgende Werte wurden dabei ermittelt: 7,8 8,9 5,1 7,1 2,3 5,0 6,4 2,7 1,9 4,0 2,0 3,1 3,0 8,2 1,8 8,1 0,2 2,0 1,3 3,0 Berechnen Sie für diese Daten das 80%-Bootstrap-Konfidenzintervall: 7. Ein idealer Würfel sei folgendermaßen beschriftet: Auf vier der sechs Seiten steht eine „1“, auf den restlichen beiden Seiten steht eine „0“. Die Zufallsvariable X beschreibe die bei einem Wurf gewürfelte Zahl. Berechnen Sie für X folgende Maßzahlen: a) Arithmetisches Mittel: b) die Verteilung (Werte und Anteile): und Varianz: Jetzt würfeln Sie dreimal. Berechnen Sie für die Zufallsvariable Y = arithmetisches Mittel der beiden Zahlen: gewürfelten c) die Verteilung (Werte und Wahrscheinlichkeiten): d) den Erwartungswert: und die Varianz: 3