Prof. Dr. E. Mammen Prof. Dr. H. Stenger SEMINAR FÜR STATISTIK UNIVERSITÄT MANNHEIM 1 Von den Ereignissen U und V eines Zufallsexperiments kennt man die Eigenschaften (1) bis (3) : Vierstündige Klausur in statistischer Methodenlehre 29. Juli 2003; 8:30 - 12:30 (1) W(U) + W(V) = 1,4 ; (2) W( U V ) = 1 ; (3) W(U) W(V) = 0,48. Zulässige Hilfsmittel: keine, insbesondere keine Taschenrechner und PDAs. Die Ihnen vorliegende Klausur besteht aus - Welche der folgenden Aussagen über die Ereignisse U und V ist richtig? diesem Deckblatt, 32 Aufgaben, der Formelsammlung mit Tabellen, 5 Blatt Konzeptpapier der Lösungsliste. A: B: C: D: E: Reißen Sie das letzte Blatt - die Lösungsliste - ab und tragen Sie (zum Zweck der Klausurauswertung) die erbetenen Angaben ein. Überprüfen Sie, ob die persönlichen Angaben auf der Lösungsliste korrekt sind. Die Klausur enthält 32 Aufgaben, davon Aufgaben Nr. 1 - 12 zur Wahrscheinlichkeitsrechnung Aufgaben Nr. 13 - 24 zur Induktiven Statistik Aufgaben Nr. 25 - 32 zur Deskriptiven Statistik Überprüfen Sie, ob Ihr Klausurexemplar vollständig ist. Beachten Sie, dass bei den Aufgaben mehr als eine Alternative richtig sein kann. Eine Aufgabe gilt nur dann als gelöst, wenn alle richtigen Alternativen, und nur diese, in die Lösungsliste eingetragen sind. Ist keine der angegebenen Alternativen richtig, dann tragen Sie in die Lösungsliste eine „0“ oder das Zeichen „ “ ein. (Aus der Formulierung der Frage ist nicht abzuleiten, daß keine, eine oder mehrere Alternativen richtig sind!). Unterschreiben Sie die ausgefüllte Lösungsliste. (Nicht unterschriebene Lösungslisten sind ungültig!) Geben Sie nur die Lösungsliste ab! (Für die Bewertung ist nur die abgegebene Lösungsliste ausschlaggebend.) Die Klausur ist bestanden, wenn Sie in der Lösungsliste bei mindestens 11 Aufgaben die richtige Lösung angegeben haben. 2 W( U V ) = 0,4 W( U V ) = 0 U und V sind unvereinbare Ereignisse. U und V sind abhängige Ereignisse. U und V bilden eine Zerlegung der Ergebnismenge. In einer Stadt erscheinen zwei Zeitungen. Von den Haushalten der Stadt abonnieren x 80% mindestens eine Zeitung. x 55% genau eine Zeitung. Ein Haushalt wird zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit, dass er keine Zeitung abonniert? A: 5% B: 10% C: 15% D: 20% E: 25% F: 30% Wie groß ist die Wahrscheinlichkeit, dass er beide Zeitungen abonniert? G: 5% H: 10% I: 15% K: 20% L: 25% M: 30% 3 In einem Gremium mit 64 Mitgliedern gilt ein Antrag als angenommen, wenn höchstens 16 aller Mitglieder gegen den Antrag stimmen. Bei einer konkreten Abstimmung rechnet man damit, dass die Mitglieder jeweils mit Wahrscheinlichkeit 20% gegen den Antrag stimmen werden. Wie groß ist dann die Wahrscheinlichkeit für Annahme des Antrages? A: 0,7734 E: 0,9599 I: 0,9970 B: 0,8413 F: 0,9772 K: 0,9987 C: 0,8944 G: 0,9878 D: 0,9332 H: 0,9938 4 7 Eine Impfung hat mit Wahrscheinlichkeit 0,88 keine 0,10 eine leichte 0,02 eine schwere Komplikation zur Folge. x W( X = x ) Zwei Personen sollen geimpft werden. Wie groß ist die Wahrscheinlichkeit dafür, dass eine der beiden Personen eine leichte Komplikation, die andere eine schwere Komplikation erleidet? A: 0,0008 E: 0,0024 I: 0,0600 B: 0,0012 F: 0,0032 K: 0,0800 Die Zufallsvariable X besitze folgende Wahrscheinlichkeitstabelle: C: 0,0016 G: 0,0036 L: 0,1000 1 1/2 2 1/4 4 1/4 Welchen Wert besitzt E(1/X) ? A: 1/4 G: 4/9 N: 2 D: 0,0020 H: 0,0040 M: 0,1200 B: 1/3 H: 1/2 P: 12/5 C: 5/13 I: 9/16 R: 5/2 D: 2/5 K: 3/5 S: 7/2 E: 5/12 L: 2/3 F: 7/16 M: 11/16 8 Die beiden Zufallsvariablen X und Y besitzen die nachstehende gemeinsame Wahrscheinlichkeitstabelle: 5 Für eine normalverteilte Zufallsvariable sei EX = P und var X = V2 > 0 mit P = 2,1 V . Welchen Wert besitzt W ( X < 0 )? A: 0,0082 E: 0,9821 B: 0,0107 F: 0,9861 xi C: 0,0139 G: 0,9983 D: 0,0179 H: 0,9918 1 0 +1 1 0 0 0,2 yj 0 0 0,6 0 +1 0,2 0 0 Welche der folgenden Aussagen ist richtig? 6 Die Kuhherde eines Großbauern besteht aus 100 Milchkühen der gleichen Rasse. Die täglichen Milchmengen der einzelnen Kühe sind unabhängig identisch verteilte Zufallsvariablen mit Erwartungswert 13 kg und Standardabweichung 1 kg. Mit welcher Wahrscheinlichkeit übersteigt die tägliche Milchmenge der Herde den Wert 1330 kg? A: 0,0013 E: 0,9332 B: 0,0062 F: 0,9772 C: 0,0228 G: 0,9938 D: 0,0668 H: 0,9987 A: B: C: D: E: F: G: H: X und Y sind identisch verteilt. X und Y sind unabhängige Zufallsvariablen. W(X+Y=0)=1 E(X+Y) = 0 E(XxY) = 0 var ( X + Y ) = 0 var ( X + Y ) = 0,8 var ( X + Y ) = 1,6 9 Der Tagespreis P für einen bestimmten Artikel ist eine Zufallsvariable mit Erwartungswert PP = 25 und Standardabweichung VP = 5. Die Tagespreise verschiedener Tage sind unabhängige Zufallsvariablen. Kunde 1 möchte an einem Tag 4 Stück von diesem Artikel kaufen. Wie groß ist der Erwartungswert der Ausgaben des Kunden 1 ? A: 100 B: 120 C: 180 D: 225 Wie groß ist die Standardabweichung der Ausgaben des Kunden 1 ? E: 10 F: 12 G: 15 H: 20 I: 24 K: 36 L: 45 11 Von den 16 Tankstellen einer Stadt sollen an einem Stichtag 6 Tankstellen durch Ziehen ohne Zurücklegen ausgewählt und nach den jeweiligen Dieselpreisen pro Liter befragt werden. Aus den ermittelten Dieselpreisen soll dann das Stichprobenmittel bestimmt werden. Alternativ dazu wird überlegt, die Auswahl durch Ziehen mit Zurücklegen vorzunehmen und zwar so, dass dabei die Varianz des Stichprobenmittels den gleichen Wert besitzt wie beim Ziehen ohne Zurücklegen. Welcher Stichprobenumfang wäre dann für das Ziehen mit Zurücklegen vorzugeben? A: 5 E: 9 B: 6 F: 10 C: 7 G: 11 D: 8 H: 12 Kunde 2 möchte an 4 verschiedenen Tagen je 1 Stück von diesem Artikel kaufen. Wie groß ist der Erwartungswert der Ausgaben des Kunden 2 ? M: 100 N: 120 P: 180 R: 225 Wie groß ist die Standardabweichung der Ausgaben des Kunden 2 ? S: 10 T: 12 U: 15 V: 20 W: 24 X: 36 Y: 45 10 Die Lostrommel bei einer Tombola enthält 10 Lose, die von 1 bis 10 nummeriert sind. Los Nr. 1 ist ein Gewinnlos, alle anderen Lose sind Nieten. Der erste Teilnehmer an der Tombola entnimmt 2 Lose. Dabei bezeichne die Zufallsvariable X2 die „Anzahl der Gewinnlose bei der 2. Ziehung“. Welche der folgenden Mengen A bis G ist eine Darstellung des Ereignisses { X2 = 1 } ? A: B: C: D: E: F: G: {1} {0;1} {(0;1)} {(1;1)} {(0;1),(1;1)} { ( 1 ; 1 ) , ( 2 ; 1 ) , ... , ( 10 ; 1 ) } { ( 2 ; 1 ) , ( 3 ; 1 ) , ... , ( 10 ; 1) } 12 Beim Abfüllen einer Ware ist das in Gramm gemessene Füllgewicht F normalverteilt mit Erwartungswert PF und Standardabweichung VF . Das Verpackungsgewicht V ist normalverteilt mit Erwartungswert PV = 70 g und Standardabweichung VV = 7 g . Verpackungsgewicht und Füllgewicht sind unabhängige Zufallsvariablen. Für das Gesamtgewicht G = F + V gilt: Erwartungswert PG = 1118 g und Standardabweichung VG = 25 g. Mit welcher Wahrscheinlichkeit unterschreitet das Füllgewicht 1000 g? A: 0,0062 E: 0,0668 I: 0,3085 B: 0,0122 F: 0,1056 K: 0,4013 C: 0,0228 G: 0,1587 L: 0,5987 D: 0,0401 H: 0,2266 M: 0,6915 13 Eine Zufallsvariable X hat den Erwartungswert 0. Mit Hilfe einer Stichprobe (X1,X2,X3) aus der Verteilung von X soll die unbekannte Varianz von X geschätzt werden. X bezeichne das Stichprobenmittel. Welche der folgenden Schätzfunktionen für die Varianz von X ist erwartungstreu? 1 A: X12 E: ( X12 X 22 X32 ) 2 1 2 B: X1 X 2 F: ( X1 X 22 X32 ) 3 1 3 2 2 C: X1 X 2 G: ¦ ( Xi X)2 2i 1 1 1 3 D: ( X12 X 22 ) H: ¦ ( Xi X)2 2 3i 1 14 X sei normalverteilt mit Erwartungswert P. Mit Hilfe einer Stichprobe aus der Verteilung von X soll zum Sicherheitsgrad 0,95 ein Konfidenzintervall für P berechnet werden. Die Stichprobe vom Umfang 4 ergab die Werte: 21; 29; 21; 33. In welcher der folgenden Alternativen ist das Konfidenzintervall richtig angegeben? 16 Bei der Produktion von Festplatten für Computer entsteht mit Wahrscheinlichkeit T eine fehlerhafte. Die Festplatten werden unabhängig voneinander in Serien des Umfangs n produziert. Für eine Serie nehme die Zufallsvariable Xi , i=1,...,n, den Wert 1 an, falls die i-te produzierte Festplatte 1 n der Serie fehlerhaft ist, ansonsten den Wert 0. T soll durch X ¦ X ni 1 i geschätzt werden. Welche der folgenden Aussagen ist richtig ? A: CX ist eine unverzerrte Schätzfunktion für T . B: CX ist eine lineare Schätzfunktion für T . C: CX ist die beste lineare Schätzfunktion für T . D: CX ist die beste unverzerrte Schätzfunktion für T . E: varCX = T(1-T). F: varCX = T(1-T)/n. G: varCX = nT(1-T). A: >6,908 ; 45,092@ I: >14,882 ; 43,118@ S: >19,454 ; 38,546@ B: >7,908 ; 46,092@ J: >15,240 ; 38,760@ T: >19,941 ; 34,059@ 17 In der DIN-Mineralölnorm ist gefordert, dass die durchschnittliche Oktanzahl P von Superbenzin mindestens 96 Oktan beträgt. Um einer Tankstellenkette eine Verletzung dieser Vorschrift nachzuweisen, führt eine Verbraucherorganisation an Hand von 100 zufällig und unabhängig voneinander entnommenen Superbenzinproben den Parametertest der Nullhypothese Ho: P t 96 zum Signifikanzniveau 0,05 durch. C: >8,908 ; 47,092@ K: >16,240 ; 39,760@ U: >20,120 ; 31,880@ Welche der folgenden Aussagen ist richtig? D: >9,908 ; 48,092@ L: >16,454 ; 35,546@ V: >20,941 ; 35,059@ E: >11,882 ; 40,118@ M: >17,240 ; 40,760@ W: >21,120 ; 32,880@ F: >12,882 ; 41,118@ N: >17,454 ; 36,546@ X: >21,941 ; 36,059@ G: >13,882 ; 42,118@ P: >18,454 ; 37,546@ Y: >22,120 ; 33,880@ H: >14,240 ; 37,760@ R: >18,941 ; 33,059@ Z: >23,120 ; 34,880@ 15 Für eine Zufallsvariable X mit Erwartungswert P und Varianz 144 prüft man H0: P t 100 mit Hilfe einer Stichprobe vom Umfang 64. H0 wird abgelehnt, wenn das Stichprobenmittel kleiner ist als 97,6. Wie groß ist das Signifikanzniveau des Tests? A: 0,0082 D: 0,0228 G: 0,0359 B: 0,0139 E: 0,0250 H: 0,0456 C: 0,0164 F: 0,0278 I: 0,0500 K: 0,0548 L: 0,0718 M: 0,1096 Angenommen, das Superbenzin der Tankstellenkette hat im Durchschnitt 96,3 Oktan und der Test führt zur Entscheidung: “Ho wird nicht abgelehnt“. Dann ist das A: ein Fehler 1. Art. B: ein Fehler 2. Art. C: eine korrekte Entscheidung. Angenommen, das Superbenzin der Tankstellenkette hat im Durchschnitt 95,8 Oktan und der Test führt zur Entscheidung: “H0 wird nicht abgelehnt“. Dann ist das D: ein Fehler 1. Art. E: ein Fehler 2. Art. F: eine korrekte Entscheidung. 18 Für den Anteil der Haushalte, die ein Fernsehgerät besitzen, ergab eine Stichprobe vom Umfang n zum Sicherheitsgrad 0,9544 das Konfidenzintervall [0,7 ; 0,9]. Wie groß war n ? A: 2 B: 4 C: 8 D: 12 E: 16 F: 36 G: 64 H: 84 I: 96 K: 100 L: 144 M: 225 19 Ein Automobilhersteller bezieht von einem Zulieferer täglich eine Lieferung von 2.000 Batterien. T bezeichne den Anteil fehlerhafter Batterien in einer Lieferung. Für jede Lieferung überprüft der Automobilhersteller mit Hilfe einer Stichprobe von Umfang 100 zum Signifikanzniveau 0,0082 die Nullhypothese H0: T d 0,1. Wenn H0 abgelehnt wird, schickt der Automobilhersteller die Lieferung an den Zulieferer zurück. Für 7 Lieferungen A,B,C,D,E,F,G hat man folgende Ergebnisse: Lieferung Anzahl fehlerhafter Batterien in der Stichprobe A 20 B 17 C 15 D 16 E 19 F 18 G 14 Welche dieser Lieferungen werden an den Zulieferer zurück geschickt? 20 Man vermutet, dass sich der Anteil der Wahlberechtigten in Deutschland, welche im Juli 2003 Partei A wählen würden, gegenüber Januar 2003 verändert hat. Auf Stichprobenbasis soll untersucht werden, ob der geeignete Test diese Vermutung beim Signifikanzniveau 3% bestätigt. Im Januar 2003 gaben 10 von 100 zufällig ausgewählten Wahlberechtigten an, sie würden Partei A wählen. Unabhängig davon wurden im Juli 2003 wieder 100 Wahlberechtigte zufällig ausgewählt; von ihnen wollten 20 Partei A wählen. Welche der folgenden Aussagen ist richtig? Der Absolutwert der normierten Prüfgröße des geeigneten Tests beträgt A: 0,5 B: 1,0 C: 1,5 D: 2,0 E: 2,5 21 In einer Jobbörse bieten sechs verschiedene Firmen vergleichbare Stellen für BWL-AbsolventInnen an. Durch einen Test zum Signifikanz-niveau 5% soll nachgewiesen werden, dass das Interesse der BWL-AbsolventInnen für die einzelnen Firmen unterschiedlich ist. Die Auswertung von 600 zufällig ausgewählten Bewerbungen ergab: Firma Anzahl der Bewerbungen 1 105 2 95 3 120 4 80 5 115 6 85 Die Prüfgröße des durchzuführenden Tests besitzt den Wert A: 10 B: 11 C: 12 D: 13 E: 14 F: 15 Der Ablehnungsbereich für die Prüfgröße ist (D = 5%) G: (9,236; f) H: (10,645; f) I: (11,070; f) K: (12,592; f) L: (13,388; f) M: (15,033; f) Die Behauptung, das Interesse der BWL-AbsolventInnen für die einzelnen Firmen sei unterschiedlich, ist durch den Test (D = 5%) N: widerlegt P: bestätigt R: nicht bestätigt 22 Gegeben sei das einfache lineare Regressionsmodell Yi = E0 + E1xi + Ui, i = 1,2. Die Testentscheidung lautet (zum Signifikanzniveau 3%): Die Anteile der Wahlberechtigten in Deutschland (in der Grundgesamtheit), welche im Juli bzw. Januar 2003 Partei A wählen würden, sind F: verschieden. G: gleich. Dabei seien die Störgrößen Ui unabhängig identisch verteilt mit E Ui = 0 und var Ui = V2 > 0. Für die beiden Beobachtungspaare (x1, y1) und (x2, y2) gelte: x1 < x2, y1 < y2. Die geschätzte Regressionsgerade sei y = b0 + b1x. Die Anteile der Wahlberechtigten in Deutschland (in der Grundgesamtheit), welche im Juli bzw. Januar 2003 Partei A wählen würden, sind H: signifikant verschieden. I: nicht signifikant verschieden. Welche der folgenden Aussagen ist richtig? Die Stichprobenanteile der Wahlberechtigten, welche im Juli bzw. Januar 2003 Partei A wählen würden, sind K: signifikant verschieden. L: nicht signifikant verschieden. A: D: G: b1 = 0 y1 = b0 + b1x1 y2 = b0 + b1x2 B: E: H: b1 < 0 y1 < b0 + b1x1 y2 < b0 + b1x2 C: F: I: b1 > 0 y1 > b0 + b1x1 y2 > b0 + b1x2 23 Für ein Unternehmen, das aus den Betrieben A und B besteht, soll die Vermutung geprüft werden, dass Betriebszugehörigkeit und Arbeitsplatzzufriedenheit unabhängig sind. Die Befragung von 200 zufällig ausgewählten Mitarbeitern ergab: Betrieb A B Gesamt Zufriedene 80 40 120 nicht Zufriedene 20 60 80 Gesamt 100 100 200 Die Prüfgröße des durchzuführenden Tests besitzt den Wert A: 10/3 B: 20/3 C: 40/3 D: 60/3 E: 80/3 F: 100/3 Der Ablehnungsbereich für die Prüfgröße ist (D = 2%) G: (5,412; f) H: (6,635; f) I: (7,824; f) K: (9,210; f) L: (11,668; f) M: (13,277; f) Die Vermutung, dass Unabhängigkeit zwischen der Betriebszugehörig-keit und Arbeitsplatzzufriedenheit besteht, ist durch den Test (D=2%) N: widerlegt P: bestätigt R: nicht bestätigt 24 Zur Untersuchung des Zusammenhangs zwischen der Anzahl der MitarbeiterInnen (x) und den Ausgaben für Fortbildung (Y [in Tausend Euro]) in Betrieben unterstellt man das einfache lineare Regressions-modell Yi = E0 + E1xi + Ui. Für 20 zufällig ausgewählte Betriebe erhält man: x = 150 6 (xi - x )2 = 12.500 y = 200 6 (yi - y )2 = 50.000 6 (xi - x ) (yi - y ) = 16.250 Die geschätzte Regressionsgerade sei y = b0 + b1x. Welche der folgenden Aussagen ist richtig? A: D: G: K: b0 = 1,3 b0 = 5 b1 = 1,3 b1 = 5 B: E: H: L: b0 = 1,4 b0 = 10 b1 = 1,4 b1 = 10 C: F: I: M: b0 = 1,5 b0 = 15 b1 = 1,5 b1 = 15 LÖSUNGSLISTE Zum wievielten Male nehmen Sie an der Statistik-Klausur teil? 1. Versuch Aufgabe Nr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Lösung ABD DL B H D A M ACDF AHMS G E C ADFG L K ABF CE G AEF DL Mannheim, 29.7.03 2. Versuch bitte frei lassen Aufgabe Nr. 21 22 23 24 25 26 27 28 29 30 31 32 3. Versuch Lösung DIP CDG FGN DG I A A I G ACDE CDI I bitte frei lassen