Prof. Dr. P. von der Lippe Induktive Statistik HK WS 01/02 Seite 1 Aufgabe 1 a) Das größte Ziel von Radprofi U besteht in einem Sieg bei der Tour de France. Zur Erreichung dieses Ziels nimmt er sich jedes Jahr vor lange und hart zu trainieren. Allerdings besteht für ihn immer die Gefahr, dass sein Training entweder durch eine Grippe (Ereignis G) oder ein zu üppiges Weihnachtsessen und somit einer ungeplanten Gewichtszunahme (Ereignis Z) gestört wird. Er selber gibt die Wahrscheinlichkeiten für diese Ereignisse wie folgt an: P(G) = 0,4 , P(Z ) = 0,7 und P(G Ç Z ) = 0,2 i) Welcher Wahrscheinlichkeitsbegriff wird hier zugrunde gelegt? ii) Wie groß ist die Wahrscheinlichkeit, dass (1 Punkt) 1) keines 2) mindestens eines 3) genau eines 4) höchstens eines der beiden Ereignisse G und Z eintritt? (4 x 2 Punkte) iii) Stellen Sie die folgenden Ereignisse in je einem Venn-Diagramm graphisch dar 1) U schafft es ohne Grippe und Gewichtszunahme sein Training zu absolvieren. 2) U wird entweder von einer Grippe oder einer Gewichtszunahme befallen, schafft es aber zu vermeiden, dass beides eintritt. (2 x 2 Punkte) iv) Zeigen Sie, dass die Ereignisse G und Z abhängig sind. (1 Punkt) b) U ist der Meinung, dass er die Tour mit einer Wahrscheinlichkeit von 0,9 gewinnt (Ereignis T), wenn er die 12. Etappe gewinnt (Ereignis E). Gewinnt er diese Etappe nicht, beziffert er die Wahrscheinlichkeit auf einen Gesamtsieg nur mit 0,3. Die Wahrscheinlichkeit, dass er die 12. Etappe gewinnt, liegt für U bei 0,6. Wie groß ist die Wahrscheinlichkeit, dass i) U die Tour gewinnt (3 Punkte) ii) U die 12. Etappe gewonnen hat, wenn es mit dem Gesamtsieg (mal wieder) nicht geklappt hat? (3 Punkte) Aufgabe 2 a) In einem Becher sind zwei 1 Cent-, drei 2 Cent und ein 5 Cent-Stück. Geben Sie die Stichprobenverteilung für die Geldsumme bei einer Stichprobe im Umfang n = 2 i) beim Ziehen mit Zurücklegen ii) beim Ziehen ohne Zurücklegen an. (2 x 3 Punkte) Prof. Dr. P. von der Lippe Induktive Statistik HK WS 01/02 Seite 2 b) Das folgende Diagramm gibt die relativen Häufigkeiten der Zahl „sechs“ beim Würfeln mit einem Würfel bei n = 50,..., 1000 Versuchen wieder. Es ist zu erkennen, dass · die relative Häufigkeit um die Wahrscheinlichkeit von p = 1 / 6 schwankt · die relative Häufigkeit bei n = 150 in eine vorher definierte Epsilon-Umgebung um p eintritt · die relative Häufigkeit diese Epsilon-Umgebung bei n = 600 wieder verlässt und bei n = 750 erneut eintritt. 0,24 0,22 0,2 0,18 0,16 0,14 0,12 0,1 50 150 250 350 450 550 650 750 850 950 Kreuzen Sie bitte an: Dieser Verlauf widerspricht dem schwachen Gesetz der großen Zahl und ist daher unmöglich. Dieser Verlauf widerspricht dem schwachen Gesetz der großen Zahl nicht und ist daher durchaus denkbar. (1 Punkt) Begründen Sie Ihre Antwort. (3 Punkte) c) Ein Paketdienst möchte seinen Fuhrpark erneuern. Um die notwendige Größe der zu bestellenden Fahrzeuge zu ermitteln, möchte das Unternehmen das durchschnittliche Gewicht der von ihnen gelieferten Pakete ermitteln. Der Paketdienst unterscheidet vier Paketgrößen: Mini, Normal, Maxi und Jumbo. Es ist bekannt, dass der Dienst zu je einem Drittel Normal und Maxi-Pakete ausliefert und sich der Rest gleichmäßig auf Mini- und Jumbo-Pakete aufteilt. Außerdem sind die folgenden Varianzen des Gewichts der Pakete bekannt: 2 2 2 sMini = sNormal = 16 ; sMaxi = s 2Jumbo = 25 Insgesamt soll eine Stichprobe im Umfang n = 60 gezogen werden. Wie muss diese Stichprobe auf die verschiedenen Paketgrößen aufgeteilt werden, wenn die Aufteilung i) proportional ii) optimal erfolgen soll. (3 + 3 Punkte) Prof. Dr. P. von der Lippe iii) Induktive Statistik HK WS 01/02 Seite 3 Warum heißt die optimale Aufteilung „optimal“? Nennen Sie die Optimierungsvorschrift einschließlich Nebenbedingung. (4 Punkte) Aufgabe 3 a) Ein Getränkehersteller bekommt eine Lieferung Flaschen auf zehn verschiedenen Paletten. Mit dem Lieferanten ist vereinbart, dass eine Lieferung zurückgeschickt wird, wenn mehr als 5% der Flaschen Ausschuss sind. Der Qualitätskontrolleur entschließt sich eine Stichprobe im Umfang n = 50 zu ziehen und zwar die Stichprobenelemente n1 = 1,..., 20 von der ersten Palette und den Rest (n2 = 21,...,50) von der zweiten Palette. Zur Schätzung des Ausschussanteils in der Gesamtlieferung überlegt er sich folgende Funktionen: i) pˆ 1 = 1 æ x1 x 2 ö ç + ÷ 2 çè n1 n2 ÷ø ii) pˆ 2 = x1 + x 2 n1 + n2 mit xi = Auschussstücke auf Palette i ni = Umfang der Stichprobe von Palette i Beurteilen Sie die beiden Schätzfunktionen bezüglich Erwartungstreue und Konsistenz. (2 x 4 Punkte) b) Eine diskrete Zufallsvariable sei gleichverteilt mit ì1 ï für x = 1,2,..., N f (x ) = í N ïî 0 sonst Eine Stichprobe vom Umfang n = 2 ergibt das Ergebnis x1 = 3 und x 2 = 4 . Geben Sie eine Maximum-Likelihood-Schätzung für N ab. (5 Punkte) c) Ein Dominostein ist in zwei Hälften unterteilt, die jeweils eine Augenzahl von 0 bis 6 enthalten. Ein Dominospiel besteht aus allen möglichen Paaren dieser Augenzahlen. Wie viele Dominosteine gibt es? Wie groß ist die Wahrscheinlichkeit bei zufälligem Ziehen einen Dominostein zu erwischen, dessen Augensumme größer als acht ist? (4 + 3 Punkte) Aufgabe 4 Der Gebrauchtwagenverkäufer G aus H ist der Ansicht, dass es ihm gelingt, jedes Auto an den Mann bzw. an die Frau zu bringen. Es stellt sich heraus, dass ihm das tatsächlich mit einer Wahrscheinlichkeit von 70% gelingt. Am heutigen Tag rechnet G damit, dass 10 potenzielle Käufer seinen Laden besuchen. Es sei X die Anzahl verkaufter Gebrauchtwagen an diesem Tag. a) Wie ist X verteilt? (2 Punkte) b) Mit welcher Wahrscheinlichkeit verkauft G i) mehr als drei Fahrzeuge? ii) genau fünf Fahrzeuge? (2+2 Punkte) Prof. Dr. P. von der Lippe Induktive Statistik HK WS 01/02 Seite 4 c) Wie wahrscheinlich ist es, daß er im Verlauf des Tages i) 4 Fahrzeuge nicht verkauft bekommt, bevor er im 5. Versuch dann erstmals einem Kunden ein Fahrzeug verkauft? (2 Punkte) ii) mindestens 3 Fahrzeuge nicht verkauft, bevor das erste Auto verkaufen kann? (2 Punkte) d) Mit wievielen nichtverkauften Fahrzeugen vor dem ersten Vertragsabschluss kann G im Mittel rechen? (2 Punkte) e) Vor ca. 12 Jahren -zu Zeiten der Wiedervereinigung- kamen im Schnitt 100 Personen pro Tag um einen gebrauchten Wagen zu erwerben. f) i) Wie war die Anzahl der verkauften Fahrzeuge damals verteilt? (2 Punkte) ii) Mit welcher Wahrscheinlichkeit verkaufte er damals mindestens 60 aber höchstens 80 Fahrzeuge? (2 Punkte) Aufgrund der im Jahr 2002 geänderten Gewährleistungsansprüche ist für G die Wahrscheinlichkeit ein Fahrzeug zu verkaufen deutlich gesunken. Gleichzeit hat er seinen Werbeaufwand stark erhöht, so dass eine große Zahl potenzieller Käufer zu erwarten ist. Er rechnet damit, dass er pro Tag nun lediglich 2 Fahrzeuge verkaufen wird. i) Wie ist X nun verteilt? ii) (2 Punkte) Wie wahrscheinlich ist es, daß G an einem Tag so viele Autos verkauft, wie er vor der Gesetzesänderung im Durchschnitt verkauft hat? (2 Punkte) Aufgabe 5: a) Der Bildungsminister eines Landes möchte gerne nähere Kenntnis über die durchschnittliche Studiendauer der BWL-Studenten haben. Er beauftragt drei unabhängige Wissenschaftler, welche ihm darüber Auskunft geben sollen. Diese drei Wissenschaftler gehen mit sehr unterschiedlichen Vorstellungen an ihre Aufgabe heran: i) Wissenschaftler 1 befragt die 10 ehemaligen Studenten in seinem Institut. Er geht dabei davon aus, daß die Studiendauer in der Grundgesamtheit den Erwartungswert E(X) = 13 und die Varianz V(X) = 4 besitzt. ii) Der zweite Wissenschaftler liess ebenfalls 10 Studenten befragen. Er geht von einem Erwartungswert von E(X) = 12 und einer Varianz von V(X) = 16 aus. Er vermutet weiter, dass die Studiendauer normalverteilt sei. iii) Der Dritte im Bunde vermutet einen Erwartungswert E(X) = 13. Er liess 50 Studenten befragen und erhielt eine geschätzte Standardabweichung von 5 Semestern. Wie groß ist bei diesen drei Vorgehensweisen jeweils die Wahrscheinlichkeit, dass die durchschnittliche Studiendauer zwischen 11 und 15 Semestern liegt? (3 + 3 + 3 Punkte) b) Der Minister beauftragt seinen Mitarbeiter, die Ergebnisse des zweiten und dritten Wissenschaftlers nochmals genauer zu "durchleuchten", da er nämlich nicht glaubt, dass sich die beiden Ergebnisse tatsächlich unterscheiden. Der zweite Wissenschaftler erzielte bei seiner Umfrage einen Mittelwert von x 2 = 12 Prof. Dr. P. von der Lippe Induktive Statistik HK WS 01/02 Seite 5 Semestern ( σˆ 2 = 16 ) und der dritte Wissenschaftler ermittelte durchschnittliche Studiendauer von x 3 = 13 Semestern in der Stichprobe. eine Testen Sie zum Niveau a=0,05 ob der Unterschied in den beiden Stichprobenergebnissen signifikant ist. (4 Punkte) c) Die Automobilmarke XYZ führt Crashtests durch um die als normalverteilt angenommenen Reparaturkosten bei einem Frontalaufprall mit 15km/h zu schätzen. Bei 10 Crashtests erhiel man die folgenden Reparaturkosten: 300, 800, 1440, 1000, 1860, 150, 400, 720, 500, 930 i) Ermitteln Sie ein 95%-Konfidenzintervall für den Wert µ in der Grundgesamtheit. Benutzen Sie für die Berechnung der Stichprobenvarianz folgende Formel: 1 n sˆ = ( x i - x )2 å n - 1 i =1 2 ii) (5 Punkte) Wie lautet das Ergebnis, wenn bekannt ist, daß die Schadenssumme normalverteilt ist mit einer Standardabweichung von σ = 500 ? (2 Punkte) Aufgabe 6: a) Gegeben sei die zweidimensionale Funktion ì3 2 ï x y für 0 £ x £ 1 und 0 £ y £ 2 . f ( xy ) = í 2 ïî 0 sonst i) Man zeige, dass f(xy) tatsächlich eine Dichte ist. (2 Punkte) ii) Wie wahrscheinlich ist es, dass X größer als 0,5 ist? (2 Punkte) iii) Sind die Zufallsvariablen X und Y stochastisch unabhängig? (2 Punkte) b) In einer Stichprobe von n=125 Colatrinkern gaben 68 an, dass sie Coca Cola gegenüber Pepsi Cola bevorzugen. i) Weist dieses Ergebnis darauf hin, dass eine Mehrheit in der Bevölkerung Coca Cola bevorzugt? Das Signifikanzniveau soll dabei auf 5% festgelegt werden. (4 Punkte) ii) Wie groß müsste der Stichprobenumfang gewählt werden, damit das obige Ergebnis signifikant zum Niveau 2,5% wäre? (2 Punkte) iii) Wie groß ist die Wahrscheinlichkeit b für den Fehler 2. Art für H1: p=0,544? (3 Punkte) c) Die Zufallsvariablen X1 und X2 sind identisch verteilt mit E(X) = m = E(X1) = E(X2) = 20 und V(X) = s2 = V(X1) = V(X2) = 30. Ermitteln Sie die Varianz der Zufallsvariablen - Z1 = X1 + X2 - Z2 = 2X Was fällt Ihnen auf? Was ist der Unterschied zwischen Z1 und Z2? (5 Punkte)