Beispiel für metrische Daten Alter der 44 US-Präsidenten bei Amtsantritt Stem-and-Leaf-Plot Einzeldaten 57 57 49 52 50 42 54 55 64 61 61 64 56 47 51 51 56 46 57 54 50 46 55 56 60 61 54 58 68 58 54 55 55 62 52 47 58 51 65 49 54 51 43 69 The decimal point is 1 digit(s) to the right of the | 4 4 5 5 6 6 | | | | | | 23 667799 0011112244444 5555666777888 0111244 589 Boxplot 45 50 55 60 65 70 0.0 0.2 0.4 Fn(x) 0.6 0.8 1.0 Empirische Verteilungsfunktion 40 45 50 55 60 Alter 1 65 70 Gruppierte Daten (39.5,44.5] (44.5,49.5] (49.5,54.5] (54.5,59.5] (59.5,64.5] (64.5,69.5] absolut relativ kumuliert 2 0.045 0.045 6 0.136 0.182 13 0.295 0.477 13 0.295 0.773 7 0.159 0.932 3 0.068 1.000 8 6 0 2 4 Frequency 10 12 Histogramm − konstante Breiten 40 45 50 55 60 65 70 alter 0.04 0.02 0.00 Density 0.06 Histogramm − variable Breiten 40 45 50 55 60 65 70 alter 2 1 Deskriptive Statistik 1. Die Aktienkurse jeweils zu Quartalsbeginn eines Jahres lauten: 130 175 151 184 (a) Wie hoch sind die Kursanstiege in den Quartalen? (b) Wie hoch ist der durchschnittliche Kursanstieg? (c) Wenn der Kurs der Aktie im letzten Quartil um 12% fällt, wie hoch ist der Kurs am Jahresende? 2. Die Altersverteilung der Mitarbeiter eines Betriebes ist in der folgenden Tabelle gegeben: Alter 15-19 20-29 30-39 40-49 50-59 60-65 Anzahl Mitarbeiter 16 13 28 41 29 17 (a) In welchen Klassen liegen die Quartile? (b) Bestimmen Sie den Median! (c) Berechnen Sie den Quartilsabstand! (d) Erstellen Sie ein Histogramm und diskutieren Sie dieses! 3. Die Verteilung der Jahresgehälter (in 1000 Euro) in einem Betrieb ist in der folgenden Tabelle gegeben: Gehalt 10-13 13-16 16-20 20-25 25-30 30-37 37-45 45-70 Prozent an Mitarbeitern 11 15 21 26 13 8 4 2 (a) In welchen Klassen liegen die Quartile? (b) Bestimmen Sie den Median! (c) Berechnen Sie den Quartilsabstand! (d) Erstellen Sie ein Histogramm und diskutieren Sie dieses! 4. Die Dauer (in Minuten), die 50 Schüler (im Alter zwischen 12 und 15 Jahren) wöchentlich mit Computerspielen verbringen, ist in folgender Tabelle zusammen gefasst: Spielzeit Häufigkeit 0-60 5 60-120 8 120-240 9 240-360 13 360-540 7 540-900 8 (a) Erstellen Sie ein Histogramm mit Fläche 1! (b) Bestimmen Sie Median und 3.Quartil! (c) Wieviel der Schüler haben mehr als 6 Stunden in der Woche gespielt? 3 5. Gegeben sind die Beobachtungen 24 25 27 28 30 31 31 32 32 33 37 39 12 15 19 22 (a) Erstellen Sie einen Boxplot! (b) Wie groß ist der Quartilsabstand? 6. Welche Aussagen zum Histogramm aus Abbildung 1 sind richtig? 0 50 100 150 Histogramm 0 2 4 6 8 10 Abbildung 1: Histogramm (a) Der Median ist kleiner als der Mittelwert. (b) Die Verteilung ist schief. (c) Mehr als die Hälfte der Werte ist über 6. 7. Welche Aussagen zum Boxplot aus Abbildung 2 sind richtig? (a) Der Median ist kleiner als der Mittelwert. (b) Die Verteilung ist schief. (c) Mehr als die Hälfte der Werte ist über 6. (d) Der Quartilsabstand ist kleiner als 4. 8. Ordnen Sie in Abbildung 3 Histogramme und Boxplots richtig zu. 9. In folgendem Stem&Leaf-Plot sind 18 Nitratwerte von Badeseen zusammen gefasst. 3 3 4 4 5 5 | | | | | | 2 034 689 12334 556789 (a) Bestimmen Sie alle Quartile! (b) Ist die Verteilung der Daten eher schief oder symmetrisch? 4 0 2 4 6 8 Boxplot Abbildung 2: Boxplot Hist 2 Hist 3 0 2 4 6 8 10 200 0 0 0 50 50 50 100 100 150 100 150 250 200 150 300 250 350 Hist 1 0 4 6 8 10 0 Box 2 8 8 8 0 0 0 2 2 2 4 4 4 6 6 6 Abbildung 3: Histogramm-Boxplot 5 2 4 6 Box 3 10 10 Box 1 2 8 10 20 15 10 5 0 A B Abbildung 4: Boxplots 10. Von 2 Datensätzen (A und B) sind in Abbildung 4 die Boxplots gegeben. (a) Geben Sie die Quartile von A an. (b) Geben Sie den Quartilsabstand von B an. (c) In welchem Datensatz ist die Streuung größer? (d) Welcher Datensatz ist eher symmetrisch verteilt? 11. Die Ausgaben (in Euro pro Woche), die 200 Touristen in ihrem Haupturlaub getätigt haben, sind in der folgenden Tabelle zusammengefasst: Ausgaben [400 − 600) [600 − 800) [800 − 1000) [1000 − 1300) [1300 − 1600) Häufigkeit 22 28 64 44 42 (a) Berechnen Sie Mittelwert und Median! (b) Berechnen Sie die Quartile und den Quartilsabstand! (c) Wie hoch ist in einem Histogramm mit Fläche 1 der Balken der ersten Klasse? 12. Die Ergebnisse (benötigte Schläge für alle vier Runden) des traditionellen US-Masters in Augusta aus dem Jahr 2009 sind im Plot der empirischen Verteilungsfunktion (Abbildung 5) dargestellt. (a) Weiviel Schläge benötigte der Sieger? (b) Wieviel Schläge benötigten die meisten Teilnehmer? (c) War nach vier Runden das Turnier schon entschieden oder war ein Stechen notwendig? 13. Abbildung 6 enthält drei empirische Verteilungsfunktionen und drei Histogramme. Was gehört zu wem? 14. ev. histo besprechen 6 0.0 0.2 0.4 Fn(x) 0.6 0.8 1.0 US−Masters Augusta 2009 275 280 285 290 295 300 Gesamt Abbildung 5: Empirische Verteilungsfunktion Hist 2 Hist 3 −2 −1 0 1 2 0 0 0 2 5 4 5 6 10 8 10 15 10 12 20 15 14 Hist 1 −2 −1 0 2 0 0 1 2 1 2 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.8 0.4 0.2 0.0 −1 −1 EVfn 3 0.6 0.8 0.6 0.4 0.2 0.0 −2 −2 EVfn 2 1.0 EVfn 1 1 −2 −1 0 1 2 −2 −1 0 Abbildung 6: Empirische Verteilungsfunktionen und Histogramme 7 1 2 2 Wahrscheinlichkeitsrechnung 1. Zwei kleine Vereine fusionieren. Ein Verein hat 12 Mitglieder, der andere 17. Ein neuer Vorstand aus vier Personen soll gebildet werden. (a) Wieviel überhaupt denkbare Vorstände gibt es? (b) Bei der Fusion wird vereinbart, dass im Vorstand aus jedem früheren Verein mindestens eine Person im Vorstand vertreten sein soll. Wieviel Vorstände sind denkbar, wenn das berücksichtigt werden soll? 2. Drei Spieler beteiligen sich an folgendem Spiel mit einem Würfel: Spieler 1 würfelt; hat er eine Augenzahl ≥ 5, so hat er gewonnen. Ansonsten kommt Spieler 2 zum Würfeln; erzielt er eine Augenzahl ≥ 4, so gewinnt er. Kommt Spieler 3 zum Zug, so gewinnt dieser, falls er eine Augenzahl ≥ 3 würfelt. (a) Berechnen Sie die Gewinnwahrscheinlichkeiten für alle drei Spieler mit Hilfe eines Wahrscheinlichkeitsbaumes. (b) Warum ist die Summe der Gewinnwahrscheinlichkeiten <1? 3. Auch Ärzte irren. Bei einem bestimmten Hautausschlag verordnet ein praktischer Arzt in 50% der Fälle die richtige, in 20% die falsche Therapie und bei 30% delegiert er an eine Spitalsambulanz. Die dort tätigen Turnusärzte behandeln zu 60% richtig, zu 15% falsch und zu 25% ziehen sie den verantwortlichen Oberarzt bei. Dieser entscheidet zu 85% richtig, zu 15% falsch. Wie groß ist die Gefahr, nicht richtig behandelt zu werden, wenn man sich mit dem bestimmten Hautausschlag in die medizinische Mühle begibt? 4. Geburtstage (a) Wie groß ist die Wahrscheinlichkeit, dass in einer Gruppe von 5 Personen alle an verschiedenen Tagen Geburtstag haben? (b) Wie groß ist diese Wahrscheinlichkeit bei 20 Personen? (c) Ab wieviel Personen ist diese Wahrscheinlichkeit < 0.5? 5. In einer Ortschaft wurden alle arbeitenden und arbeitsuchenden Personen erhoben und eine Aufteilung bezüglich Geschlecht ergab folgende Tabelle: Beschäftigt Arbeitslos Weiblich 553 45 Männlich 857 36 Die Ereignisse A, B, W, M seien für zufällig ausgewählte Personen wie folgt definiert: A B W M ... ... ... ... die die die die Person Person Person Person ist ist ist ist arbeitslos beschäftigt weiblich männlich (a) Berechnen Sie die Wahrscheinlichkeiten für das Eintreten der jeweiligen Ereignisse. (b) Berechnen Sie p(A|W ) und p(W |A) . Sind A und W unabhängig? (c) Geben Sie die Frauenarbeitslosigkeit als bedingte Wahrscheinlichkeit an. (d) In Ö1 wurde in einem Journal-Panorama über die Region Braunau der folgende Satz geäußert: ’Die Arbeitslosenrate liegt bei 8% und ist bei Frauen und Männern in etwa gleich, nämlich ca. 4%’. Was ist an dieser Aussage vom statistischen Standpunkt aus ein Schwachsinn? 6. In einem Unternehmen wird ein Produkt an drei unterschiedlich alten Maschinen gefertigt; die alte Maschine I wird nur mehr bei Produktionsengpässen eingesetzt, die zweitälteste Maschine (II) wird noch regelmäßig eingesetzt, die neueste Maschine (III) ist aber schneller und verlässlicher. Dies kommt in der folgenden Übersicht zum Vorschein. 8 Maschine I II III Produktionsanteil (in %) 10 40 50 Ausschussrate (in %) 5 2 1 (a) Man bestimme die Ausschussrate der Produktion. (b) Mit welcher Wahrscheinlichkeit wurde ein defektes Stück an der alten Maschine produziert? 7. In einer Bevölkerung beträgt die Wahrscheinlichkeit, älter als 70 Jahre zu werden, 0.6 und die Wahrscheinlichkeit, älter als 80 zu werden, 0.2. Wie groß ist die Wahrscheinlichkeit, dass eine Person, die soeben 70 Jahre alt wurde, ihren 80. Geburtstag noch erlebt? 8. Eine Zeitschrift hat in Altersgruppen unterschiedliche Leseranteile, die in folgender Tabelle enthalten sind. Altersgruppe Bevölkerungsanteil (in %) Leseranteil (in %) 15 - 29 25 8 35 7 30 - 49 50 + 40 4 (a) Wie hoch ist der Leseranteil in der Gesamtbevölkerung? (b) Mit welcher Wahrscheinlichkeit stammt ein Leser der Zeitschrift aus der jüngsten Altersgruppe? 9. Eine Elektrohandelskette mit 3 Filialen in einer Stadt ist immer wieder mit Reklamationen konfrontiert. Die Umsatzanteile und die Reklamationshäufigkeit (in%) sind folgender Tabelle zu entnehmen: Filiale Umsatz Reklamationen Innenstadt 25 4 Shopping Mall 45 10 Peripherie 30 3 (a) Wie hoch ist die durchschnittliche Reklamationsrate? (b) In einer Konsumentenzeitung erscheint ein Bericht über einen Reklamationsfall dieser Elektrohandelskette. Mit welcher Wahrscheinlichkeit handelt es sich um die Filiale in der Shopping Mall? 10. In einer Stadt werden Diebstähle von Fahrzeugen untersucht. In Abhängigkeit vom Fahrzeugtyp sind Daten zu Diebstahl und Aufklärungsrate in folgender Tabelle enthalten. Fahrzeug Auto (incl. LKW) Motorrad, Mofa Fahrrad Anteil an Diebstählen (in %) 25 10 65 Aufklärungsrate (in %) 18 27 9 (a) Wie hoch ist die Aufklärungsrate insgesamt bei Fahrzeugdiebstählen? (b) Eine Polizeistreife ertappt einen Dieb direkt beim Diebstahl eines Fahrzeugs. Mit welcher Wahrscheinlichkeit wollte der Dieb ein Auto stehlen? 9 3 Zufallsvariable und Verteilungen 1. In einem neu eröffneten Einkaufszentrum wird als Attraktion folgendes Glücksspiel veranstaltet: Zu jeder vollen Stunde (täglich von 11 bis 18 Uhr, also 8-mal) wird am zentralen Platz des Einkaufszentrums eine Person zufällig ausgewählt, die ein Glücksrad (mit den Zahlen 1 bis 10) drehen kann. Jede Zahl gewinnt einen Sachpreis, die 10 gewinnt zusätzlich 500 Euro. (a) Sei X die Anzahl Spieler, die an einem Tag den Geldpreis gewinnen. Berechnen Sie Erwartungswert und Varianz von X! (b) Wie groß ist die Wahrscheinlichkeit, dass an einem Tag mindestens 2 Spieler einen Geldpreis gewinnen? (c) Sei Y die Summe Geldes, die an einem Tag von den Teilnehmern an diesem Spiel gewonnen wird. Berechnen Sie Erwartungswert und Varianz von Y ! 2. In England und Amerika wurde auf Jahrmärkten das folgende Glücksspiel (Chuck a luck) gerne gespielt: Ein Spieler wählt eine Zahl zwischen 1 und 6 und wirft dann drei Würfel. Zeigen alle drei Würfel die angesagte Zahl, erhält er drei Pfund (bzw. Dollar); zeigen zwei Würfel diese Zahl, erhält er zwei Pfund (Dollar); zeigt ein Würfel diese Zahl, erhält er ein Pfund (Dollar). Nur wenn kein Würfel diese Zahl anzeigt, muss der Spieler ein Pfund zahlen. (a) Der Gewinn des Spielers ist eine Zufallsvariable G. Geben Sie die Wahrscheinlichkeits- und Verteilungsfunktion von G an. (b) Berechnen Sie den erwarteten Gewinn des Spielers. 3. In einem neu eröffneten Einkaufszentrum wird als Attraktion folgendes Glücksspiel veranstaltet: ein Kind, das Geburtstag hat, und seine Begleitperson drehen jeweils ein Glücksrad (mit den Zahlen 1 bis 6). Das Maximum X der beiden Zahlen wird bestimmt. (a) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X! (b) Berechnen Sie Erwartungswert und Varianz von X! (c) Für jeden Punkt von X erhält die Begleitperson Einkaufsgutscheine im Wert von 150 Euro. Bestimmen Sie Erwartungswert und Varianz des Gesamtwerts der Einkaufsgutscheine! 4. Ein Reiseveranstalter führt wöchentliche Kreuzfahrten auf einem Segelschiff mit Platz für 14 Gäste durch. Da aus Erfahrung ca. 20% der Buchungen storniert werden, nimmt der Veranstalter 16 Buchungen für die 14 Plätze entgegen. Mit welcher Wahrscheinlichkeit wollen mehr Leute die Kreuzfahrt antreten als Plätze vorhanden sind? 5. Aus einem gut gemischten Kartenspiel von 52 Karten (4 Farben von jeweils 13 Werten) werden 8 Karten zufällig gezogen. (a) Wie ist die Anzahl gezogener Caro-Karten verteilt (Name der Verteilung, Werte der Parameter)? (b) Wie groß ist die Wahrscheinlichkeit, dass mindestens 1 Caro unter den gezogenen Karten ist? (c) Wie ist die Anzahl gezogener Asse verteilt (Name der Verteilung, Werte der Parameter)? (d) Wie groß ist die Wahrscheinlichkeit, dass genau 1 As unter den gezogenen Karten ist? 6. Die Warenübernahme eines Kaufhauses übernimmt eine Lieferung von 50 Sonnenbrillen nur dann, wenn die Lieferung höchstens 2 defekte Brillen enthält. Wenn die ausgehende Ware der Brillenfirma genau 2% defekte Brillen enthält, mit welcher Wahrscheinlichkeit wird die Lieferung nicht akzeptiert? Vergleichen Sie die Ergebnisse der Binomialverteilung mit der Poissonverteilung! 10 7. Geben Sie für folgenden Beispiele an, welcher Verteilung die Zufallsvariable folgt. Geben Sie auch die entsprechenden Parameterwerte an. (a) Im öffentlichen Straßenbahnnetz einer Stadt blockieren durchschnittlich vier falsch (oder schlecht) geparkte Autos oder LKWs pro Tag die Weiterfahrt der Straßenbahnen. Wie ist die Anzahl solch blockierender Fahrzeuge an einem Tag verteilt? (b) Die Meldungen über solch blockierende Fahrzeuge gehen in der Leitzentrale des Verkehrsunternehmens ein, dort wird dann die Beseitigung der Blockade eingeleitet. Wie ist die Zeit zwischen zwei Blockademeldungen verteilt? (c) In einem Ausflugsgasthof wird ein Bus mit 50 Besuchern erwartet, denen zwei Mittagsmenüs zur Auswahl angeboten werden. Aus Erfahrung ist bekannt, dass 60% das Menü mit Wiener Schnitzel auswählen. Wie ist die Anzahl derer verteilt, die das Menü mit Wiener Schnitzel auswählen? 8. Die wöchentliche Nachfrage nach einem Produkt ist normalverteilt mit µ = 300 und σ = 20. Im Lager befinden sich 330 Stück. (a) Mit welcher Wahrscheinlichkeit kann die Nachfrage nicht gedeckt werden? (b) Wie hoch müsste der Lagerbestand sein, damit nur mit einer Wahrscheinlichkeit von 1% die Nachfrage nicht gedeckt werden kann? (c) Wie hoch ist die Wahrscheinlichkeit, dass die durchschnittliche Nachfrage von 5 Wochen über 305 Stück liegt? 9. In einer Bevölkerungsgruppe sei der Intelligenzquotient IQ normalverteilt mit IQ ∼ N (105, 100). (a) Mit welcher Wahrscheinlichkeit hat eine zufällig ausgewählte Person einen IQ über 110? (b) Mit welcher Wahrscheinlichkeit ist der durchschnittliche IQ von 4 zufällig ausgewählten Personen über 110? (c) Mit welcher Wahrscheinlichkeit ist der durchschnittliche IQ von 25 zufällig ausgewählten Personen über 110? 10. Eine Fluggesellschaft nimmt für einen bestimmen Flug mit 180 Plätzen 205 Buchungen entgegen, weil von diesem Flug bekannt ist, dass durchschnittlich 15% der Buchungen storniert werden. Mit welcher Wahrscheinlichkeit kommt die Fluggesellschaft durch die Überbuchung in Schwierigkeiten? 11. Eine Kulturzeitschrift verzeichnet pro Woche 4 neue AbonnentInnen. (a) Unter der Annahme der Poissonverteilung für die Anzahl von Neuabos berechne man die Wahrscheinlichkeit, dass in einer Woche mehr als zwei Neuabos erfolgen. (b) Angenommen es wurde gerade eine neue Abonenntin gewonnen. Wie groß ist die Wahrscheinlichkeit, dass mindestens eine Woche bis zum Abschluss eines neuen Abos vergeht? 12. Für eine Lehrveranstaltung werden 120 Anmeldungen angenommen, obwohl im Hörsaal nur Platz für 100 Studierende ist, weil durchschnittlich 15 Prozent der angemeldeten Studierenden im Lauf eines Semesters ausfallen. Mit welcher Wahrscheinlichkeit, gibt es bei der Prüfung nicht ausreichend Platz, weil mehr als 100 Studierende den Endtest absolvieren wollen? 13. An einem Flughafen ereignen sich durchschnittlich 3 kritische Landungen pro Monat, bei denen aufgrund Technikausfällen im Flugzeug vorsichtshalber Feuerwehr und Ambulanz alarmiert werden müssen. 11 (a) Wie groß ist die Wahrscheinlichkeit, dass in einem Monat höchstens 2 kritische Landungen passieren? (b) Soeben ist eine kritische Landung erfolgt. Wie groß ist die Wahrscheinlichkeit, dass bis zur nächsten kritischen Landung mehr als ein halber Monat vergeht? 14. In einem neu eröffneten Einkaufszentrum wird als Attraktion folgendes Glücksspiel veranstaltet: eine Person zieht aus einer Urne mit 4 roten und 3 weißen Kugeln ohne Zurücklegen solange eine Kugel, bis eine rote Kugel gezogen wird. Sei X die Zahl von Ziehungen, bis eine rote Kugel gezogen wird. (a) Bestimmen Sie die Wahrscheinlichkeitsfunktion von X! (b) Berechnen Sie Erwartungswert und Varianz von X! (c) Wird schon nach einer gezogenen Kugel eine rote Kugel erwischt, gibt es einen Einkaufsgutschein von 300 Euro. Mit jeder weiter gezogenen Kugel erhöht sich der Wert des Gutscheines um 100 Euro. Bestimmen Sie Erwartungswert und Varianz des Gesamtwerts der Einkaufsgutscheine! 15. Eine Autohandelsfirma hat von einem bestimmten Automodell 47 Stück im letzten Jahr verkauft. Der Hersteller meldet, dass bei 15 dieser verkauften Autos die Lackierung schadhaft ist und beim nächsten Service erneuert werden muss. (a) Für die nächste Woche sind 6 Autos dieses Modells zum Service angemeldet. Wie ist die Anzahl an Autos mit einer schadhaften Lackierung verteilt (Name der Verteilung, Werte der Parameter)? (b) Mit welcher Wahrscheinlichkeit muss bei höchstens einem dieser Autos die Lackierung ausgebessert werden? (c) Die Ausbesserung der Lackierung bei einem Auto verursacht Kosten von 1200 Euro. Wie hoch sind Erwartungswert und Varianz der Gesamtkosten durch schadhafte Lackierung für diese Woche? 16. In der Kantine eines Produktionsbetriebs werden jeden Tag drei Menüs angeboten. Aus langer Erfahrung kennt man die Auswahlwahrscheinlichkeiten für die drei Menüs und bereitet etwas mehr als die erwartete Anzahl vor. Für einen bestimmten Freitag sind die drei Menüs, die langjährigen Auswahlwahrscheinlichkeiten und die vorbereiteten Portionen für jedes Menü in der folgenden Liste gegeben: Menü Lachs Ravioli Gemüselasagne Auswahlwahrscheinlichkeit 0.5 0.3 0.2 vorbereitete Portionen 170 100 65 An diesem Freitag suchen 300 Personen die Kantine auf. (a) Welcher Verteilung folgen die ausgewählten Menüs mit Lachs? (b) Mit welcher Wahrscheinlichkeit reichen die vorbereiteten Portionen für das Menü mit Lachs nicht aus? (c) Mit welcher Wahrscheinlichkeit werden genau 150 Menüs mit Lachs bestellt? 17. Ein Speditionsunternehmen weiß, dass die Fahrtdauer (in Minuten) zwischen zwei Städten normalverteilt mit µ = 230 und σ = 15 ist. (a) Wie groß ist die Wahrscheinlichkeit, dass eine Fahrt länger als 4 Stunden dauert? (b) Wöchentlich gibt es 5 Fahrten zwischen diesen Städten. Wie ist die durchschnittliche Fahrtdauer verteilt? (c) Wie groß ist die Wahrscheinlichkeit, dass die durchschnittliche Fahrtdauer über 4 Stunden liegt? 12 18. In der deutschen Fußball-Bundesliga fallen pro Spiel durchschnittlich drei Tore. (a) Man berechne für k = 0, 1, 2, 3, 4, 5 die Wahrscheinlichkeiten dafür, dass genau k Tore fallen. (b) Wie groß ist die Wahrscheinlichkeit für ein Spiel mit mindestens 5 Toren? (c) Wie groß ist der Erwartungswert der gefallenen Tore pro Spiel? (d) Welcher Verteilung folgen die erzielten Tore pro Halbzeit? (e) In der Halbzeit steht es in einem Spiel 0:0. Wie groß ist die Wahrscheinlichkeit, dass das Spiel torlos endet? 13 4 Schätzen und Testen 1. Eine Sportwissenschaftlerin untersucht die Laufwege von Fußballspielern. Bei sechs Außenverteidigern beobachtete sie in sechs Spielen der nationalen Meisterschft folgende Laufstrecken (in km): 13 12 14 10 11 12 (a) Bestimmen Sie Mittelwert und Standardabweichung in der Stichprobe! (b) Ermitteln Sie ein 95%-Konfidenzintervall für den Erwartungswert der Laufstrecke! (c) Kann man aufgrund des Konfidenzintervalls schließen, dass die Spieler auf Laufstrecken von 13km kommen? 2. In der Marketingabteilung eines Betriebs wird an der Markteinführung eines neuen Produktes gearbeitet. Welche Schätzverfahren sind für die folgenden Fragestellungen angebracht? (a) Nach einer einmonatigen Werbekampagne soll erhoben werden, welchen Bekanntheitsgrad das neue Produkt schon erreicht hat. (b) Nach zwei Monaten soll der Wochenumsatz geschätzt werden. (c) Nach einem halben Jahr soll erhoben werden, wieviel Prozent der Konsumenten schon das Produkt gekauft haben. 3. Aus einer Stichprobe von 16 Beobachtungen wurde ein Mittelwert von 85 und eine Stichprobenvarianz von 9 berechnet. (a) Bestimmen Sie ein 95%-Konfidenzintervall für den Erwartungswert! (b) Wenn Kenntnis vorliegt, dass die der Varianz in der Grundgesamtheit den Wert 9 hat, welchen Effekt hätte das auf das Konfidenzintervall? 4. Ein Paketzustelldienst stellt in Stoßzeiten angelernte Kräfte zur Paketsortierung ein. Nach einer eintägigen Einschulung arbeiten sie selbstständig in der Paketsortierung. Natürlich sind diese Aushilfskräfte nicht so schnell wie dauernd angestelltes Personal (diese sortieren durchschnittlich 480 Pakete in der Stunde). Die Managerin der Paketsortierung hofft aber, dass 90% von deren Leistung auch die Anlernkräfte erbringen können. Bei einer Stichprobe von 6 Anlernkräften wurden folgende Sortierleistungen festgestellt: 410 430 440 450 420 430 (a) Bestimmen Sie Mittelwert und Standardabweichung der Stichprobe! (b) Ermitteln Sie ein 95%-Konfidenzintervall für den Erwartungswert der Sortierleistung der Anlernkräfte! (c) Kann man aufgrund des Konfidenzintervalls schließen, dass die Alernkräfte auf 90% der Leistung des dauernd angestellten Personals kommen? 5. 65 Personen gaben ihr Urteil über zwei Verpackungen (A und B) eines Produktes ab. Die Präferenzen der Personen sind hier angegeben. B A A A B B A B B B B A A B B B A A B B A B B B A B A A A B B B B B A A B A A B B B A B B A A A B A B A A B B B A A B A B B A B B (a) Geben Sie ein Konfidenzintervall für den Anteil derer an, die Verpackung B bevorzugen! (b) Wie verhält sich dazu das Konfidenzintervall für den Anteil der Befürworter von A? 6. Bei der sog. Sonntagsfrage sind bei 500 Befragten für vier Parteien die Prozentsätze 40%, 30%, 20% und 10% ermittelt worden. 14 (a) Unterscheiden sich die Längen der Konfidenzintervalle? (b) Um wieviel würden sich die Längen bei 2000 Befragten unterscheiden (bei denselben Prozentsätzen für die Parteien)? 7. In der Marketingabteilung eines Betriebs wird an der Markteinführung eines neuen Produktes gearbeitet worden. Welche statistischen Tests sind für die folgenden Fragestellungen einsetzbar? (a) Nach einer einmonatigen Werbekampagne soll überprüft werden, ob das neue Produkt schon einen Bekanntheitsgrad von 10% erreicht hat. (b) Nach zwei Monaten soll über 10 Wochen getestet werden, ob der Wochenumsatz über 15.000.- Euro liegt. (c) Nach zwei Monaten soll über 10 Wochen getestet werden, ob die Umsätze in Supermärkten über jenen in Spezialmärkten liegen. (d) Nach einem halben Jahr soll überprüft werden, ob schon 5% der Konsumenten das Produkt gekauft haben. 8. Ein neues Medikament wurde intensiv bei ÄrztInnen beworben. Ziel war es, das Medikament bei mehr als einem Drittel der Ärzte so bekannt zu machen, dass Sie es ihren PatientInnen verschreiben. Einen Monat nach der Werbekampagne ergab eine Umfrage unter 170 ÄrtzInnen, dass 74 das Medikament schon verwendet (verschrieben) hatten. Kann man daraus schließen, dass das Ziel der Werbekampagne erreicht wurde? 9. In einem Tourimusort werden die täglichen Ausgaben von Gästen untersucht. Der Vergleich der beiden Hauptherkunftsländer (A und B) liefert folgendes Resultat: Stichprobenumfang Mittelwert Standardabweichung n x̄ s Land A B 30 40 140 150 20 20 Geben Gäste aus B signifikant mehr aus? 10. 65 Personen gaben ihr Urteil über zwei Verpackungen (A und B) eines Produktes ab. Die Präferenzen der Personen sind hier angegeben. B A A A B B A B B B B A A B B B A A B B A B B B A B A A A B B B B B A A B A A B B B A B B A A A B A B A A B B B A A B A B B A B B Kann man aufgrund der Stichprobe aussagen, dass eine Verpackung klar bevorzugt wird? 11. In einem Unternehmen soll bei Spesen gespart werden, durchschnittlich sollen nicht mehr als 80 Euro anfallen. Aus einer Stichprobe von 16 Spesenabrechnungen wurde ein Mittelwert von 83 Euro und eine Standardabweichung von 6.5 berechnet. (a) Kann daraus abgeleitet werden, dass der Mittelwert nicht 80 Euro beträgt? (b) Kann geschlossen werden, dass die Spesen über 80 Euro liegen? (c) Kann geschlossen werden, dass die Spesen unter 80 Euro liegen? 12. Nach der Katastrophe von Fukushima gaben 295 von 350 Befragten an, gegen jede Nutzung der Atomkraft zur Energiegewinnung zu sein. Ist der Anteil der Atom-Gegner nach Fukushima gestiegen (er lag vorher bei 70%)? 13. Die Morde in New Jersey im Jahr 2003 nach Wochentagen aufgegeliedert, gibt die folgende Tabelle wieder: So Mo Di Mi Do Fr Sa 53 42 51 45 36 37 65 Man führe einen Test durch, ob für Morde jeder Wochentag gleich wahrscheinlich ist. 15 14. Notenverteilung An einem Department werden Prüfungsmodalitäten geändert. Die Vertretung der Studierenden befürchtet eine Verschärfung der Prüfungen und damit einhergehend eine Verschlechterung der Noten. Noten 1 2-4 5 frühere Anteile (in %) 15 60 25 Stichprobe (absolut) 4 31 5 (a) Hat sich durch diese Änderung überhaupt eine Veränderung in der Notenverteilung ergeben? (b) Hat sich der Anteil an negativen Benotungen verringert? 15. Die Bearbeitungszeit von Versicherungsschadensmeldungen werden erhoben und gegen einen Sollwert getestet. One Sample t-test data: zeit t = 2.99, df = 49, p-value = 0.004359 alternative hypothesis: true mean is not equal to 27 95 percent confidence interval: 27.40 29.03 sample estimates: mean of x 28.21 (a) Welche Hypothesen liegen dem Test zugrunde? (b) Wie groß war die Stichprobe? Welchen Wert hat die Teststatistik? (c) Wie lautet die Entscheidung nach dem Test? 16. Die Behandlungskosten bei einer bestimmten Diagnose werden zwischen zwei Spitälern verglichen. Two Sample t-test data: Kosten by Spital t = -1.171, df = 33, p-value = 0.25 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -20.15 5.43 sample estimates: mean in group Spital A mean in group Spital B 462.7 470.0 (a) Welche Hypothesen liegen dem Test zugrunde? (b) Wie groß war die Stichprobe? Welchen Wert hat die Teststatistik? (c) Wie lautet die Entscheidung nach dem Test? 16 5 Lösungen • Deskriptive Statistik Gehalt der Mitarbeiter 0.03 0.02 Density 0.015 0.00 0.000 0.005 0.01 0.010 Density 0.020 0.04 0.025 0.05 Alter der Mitarbeiter 20 30 40 50 60 10 20 30 Alter Abbildung 7: Histogramme für zwei Aufgaben 1. (a) 34.6% (b) 12.28% (c) 161.92 − 13.72% 21.85% 2. Klassengrenzen als 19.5, 20.5 etc. wählen! (a) (b) (c) (d) Q1 in 30-39, Q2 in 40-49, Q3 in 50-59. Q2 = 43.2 QD = 53.15 − 32.32 = 20.83 Siehe Abbildung 7 links 3. (a) (b) (c) (d) Q1 in 13-16, Q2 in 20-25, Q3 in 25-30. Q2 = 20.6 QD = 25.8 − 15.8 = 10 Siehe Abbildung 7 rechts 30 25 0.0015 20 0.0010 15 0.0005 0.0000 Density 0.0020 35 0.0025 40 Computerspiele 0 200 400 40 Gehalt 600 800 Dauer Abbildung 8: Grafiken für zwei Aufgaben 4. (a) Siehe Abbildung 8 links (b) Q2 = 267.7, Q3 = 424.3 (c) 15, das sind 30%. 17 50 60 70 5. (a) Siehe Abbildung 8 rechts (b) QD = 9 6. (a) Der Median ist kleiner als der Mittelwert (falsch). (b) Die Verteilung ist schief (richtig). (c) Mehr als die Hälfte der Werte ist über 6 (richtig). 7. (a) (b) (c) (d) Der Median ist kleiner als der Mittelwert (richtig). Die Verteilung ist schief (richtig). Mehr als die Hälfte der Werte ist über 6 (faslch). Der Quartilsabstand ist kleiner als 4 (falsch). 8. Hist1-Box2, Hist2-Box3, Hist3-Box1 9. (a) Q1 = 46, Q2 = 52.5, Q3 = 55. (b) schief. 10. Ungefähres Ablesen der Werte. (a) (b) (c) (d) Q1 = 7, Q2 = 11, Q3 = 14. QD = 10 B A 11. (a) x̄ = 998.5 x̃ = 956.25 (b) Q1 = 800 Q3 = 1245.45 (c) f1 ⋆ = 0.00055 IQR = Q3 − Q1 = 445.45 12. (a) 276 (b) 286 (c) Stechen notwendig 13. Hist1 - EVfn2, Hist2 - EVfn1, Hist3 - EVfn3, • Wahrscheinlichkeitsrechnung 1. (a) 570024 (b) 501024 2. (a) p(Spieler1) = 1/3, p(Spieler2) = 1/3, p(Spieler3) = 2/9. (b) Es kann auch kein Spieler gewinnen. 3. p = 0.2563. 4. (a) p = 0.9729 (b) p = 0.5886 (c) n = 23 5. (a) p(W ) = 0.4011, p(M ) = 0.5989, p(A) = 0.0543, p(B) = 0.9457 (b) p(A|W ) = 0.0752, p(W |A) = 0.5556 (c) p(A|W ) 6. (a) p(A) = 0.018. (b) p(M I|A) = 0.278 7. p = 1/3. 8. (a) p(L) = 0.0605 (b) p(15 − 29|L) = 0.3306 9. (a) p(R) = 0.064 (b) p(ShM |R) = 0.703 10. (a) p(A) = 0.1305 (b) p(Auto|A) = 0.345 18 • Zufallsvariable und Verteilungen 1. (a) E(X) = 0.8, V ar(X) = 0.72 (b) 0.187 (c) E(Y ) = 0.400, V ar(Y ) = 180000 -1 1 x f (x) 0.5787 0.3452 F (x) 0.5787 0.9259 (b) E(X) = −0.0789 2. (a) 2 0.0694 0.9953 3 0.0046 1.0000 1 2 3 4 x f (x) 1/36 3/36 5/36 7/36 (b) E(X) = 4.4722, V ar(X) = 1.97 (c) E(G) = 670.8, V ar(G) = 44325 5 9/36 3. (a) 4. p = 0.141 5. (a) (b) (c) (d) H(N = 52, M = 13, n = 8) p = 0.918 H(N = 52, M = 4, n = 8) p = 0.392 6. Binomialverteilung (B(50, 0.02)): p = 0.078 Poissonverteilung (P (1)): p = 0.080 7. (a) P (4) (b) Exp(4) (c) B(50, 0.6) 8. (a) p = 0.067 (b) xL = 346.5 (c) p = 0.288 9. (a) p=0.3085 (b) p=0.1587 (c) p=0.0062 10. p = 0.11 11. (a) p = 0.7616 (b) p = 0.0183 12. X ∼ B(120, 0.15) ≈ N (18, 15.3), p = 0.648. 13. (a) p = 0.4232 (b) p = 0.223 1 2 3 x f (x) 0.5714 0.2857 0.1143 (b) E(X) = 1.6, V ar(X) = 0.64 (c) E(G) = 360, V ar(G) = 64000 14. (a) 4 0.0286 15. (a) X ∼ H(N = 47, M = 15, n = 6) (b) p(X ≤ 1) = 0.0844 + 0.2813 = 0.3657 (c) E(X) = 1.915, V ar(X) = 1.162 16. (a) X ∼ B(300, 0.5) ≈ N (150, 75) (b) p = 0.009 (c) p = 0.046 17. (a) X > 240) = 0.252 (b) X̄5 ∼ N (230, 45) 19 6 11/36 (c) p = 0.068 18. (a) (b) (c) (d) (e) 0 1 2 3 k f (k) 0.0498 0.1494 0.2240 0.2240 p(X ≥ 5) = 0.1847 E(X) = 3 X ∼ P (3) X2.H ∼ P (1.5), p(X2.H = 0) = 0.2231 4 0.1680 5 0.1008 • Schätzen und Testen 1. (a) x̄ = 12 s = 1.4142 (b) (10.516; 13.484) (c) Ja. 2. (a) KI für Anteilswert (b) KI für Erwartungswert (c) KI für Anteilswert 3. (a) 85 ± 4.795 (b) 85 ± 4.41 4. (a) x̄ = 430, s = 14.14 (b) 430 ± 14.84 (c) 432 (=90% von 480) ist im KI, daher ja. 5. (a) 0.5692 ± 0.1204 (b) 0.4308 ± 0.1204 6. (a) Ja (0.4 ± 0.0429, 0.3 ± 0.0402, 0.2 ± 0.0351, 0.1 ± 0.0263). (b) Jeweils halb so breit. 7. (a) (b) (c) (d) Test Test Test Test für für für für Anteilswert Erwartungswert Differenz zwischen Erwartungswerten Anteilswert 8. H1 : p > 1/3, T = 2.82, Entscheidung für H1 . 9. H1 : µA < µB , T = −2.07, Entscheidung für H1 . 10. H1 : p > 1/2, T = 1.11, Entscheidung für H0 . 11. (a) Nein (b) Ja (c) Nein 12. H1 : p > 0.7, T = 5.83, Entscheidung für H1 . (χ2 ) 13. T = 13.3, Q6 (0.95) = 12.59, Entscheidung für H1 . (χ2 ) 14. (a) T = 5.29, Q2 (b) T = 3.33, (0.95) = 5.99, Entscheidung für H0 (χ2 ) Q1 (0.95) = 3.84, Entscheidung für H0 15. H1 : µ 6= 27, n = 50, T = 2.99, Entscheidung für H1 . (t) 16. H1 : µA 6= µB , T = −1.171, Q33 (0.95) = 2.034, Entscheidung für H1 . 20