Repetitorium der Mathematik — Teil 2 Repetitorium Mathematik – Teil 2 Wahrscheinlichkeitsrechnung und Statistik Markus Baur 1 Repetitorium der Mathematik — Teil 2 Inhaltsverzeichnis 1 Die Wahrscheinlichkeit 3 2 Wahrscheinlichkeit mit Abzählverfahren 1 Die Produktregel . . . . . . . . . . . . . . . . 2 Geordnete Stichproben mit Zurücklegen . . . 3 Die geordnete Stichprobe ohne Zurücklegen . . 4 Die ungeordnete Stichprobe ohne Zurücklegen 3 3 4 5 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Aufgaben zu Wahrscheinlichkeit mit Kombinatorik 7 4 Verknüpfte Ereignisse– Der Additionssatz 1 Zur Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Lösung der Aufgabenstellung . . . . . . . . . . . . . . . . . . . . . . . . 3 Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 9 9 10 5 Die bedingte Wahrscheinlichkeit 10 1 Ein Beispiel zur Einführung . . . . . . . . . . . . . . . . . . . . . . . . . 10 6 Unabhängigkeit von Ereignissen 12 1 Lösung der Arbeitsaufträge . . . . . . . . . . . . . . . . . . . . . . . . . 12 2 Der spezielle Multiplikationssatz für unabhängige Ereignisse . . . . . . . 13 3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 7 Zufallsgrößen 1 Einführung . . . . . . . . . . . . . . . . . . . . . . 2 Die Verteilungsfunktion . . . . . . . . . . . . . . . . 3 Erwartungswert einer Zufallsgröße . . . . . . . . . . 4 Varianz und Streuung einer Zufallsgröße . . . . . . 5 Musteraufgabe zum Themenkomplex Zufallsgrößen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 16 17 18 19 19 8 Das Bernoulli- Experiment und die Binomialverteilung 21 1 Erwartungswert beim Bernuolli- Experiment . . . . . . . . . . . . . . . . 23 2 Die Länge einer Bernoulli- Kette . . . . . . . . . . . . . . . . . . . . . . . 24 9 Testen von Hypothesen 1 Der einseitige Signifikanztest . . . . . . . . . . . . . . 2 Theoretischer Hintergrund . . . . . . . . . . . . . . . 3 Bestimmung einer Entscheidungsregel . . . . . . . . . 4 Zusammenfassung über den einseitigen Signifikanztest 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 25 25 26 28 Repetitorium der Mathematik — Teil 2 1 Die Wahrscheinlichkeit In einem Zufallsexperiment wird zwei Mal eine Münze nacheinander geworfen. Es soll die Wahrscheinlichkeit des Ereignisses bestimmt werden, dass einmal Kopf und einmal Zahl geworfen wird. Nach dem französischen Mathematiker Laplace ist die Wahrscheinlichkeit definiert als: P (Ereignis) = Anzahl aller Ergebnisse, bei denen das Ereignis eintritt Anzahl aller Ergebnisse des Zufallsexperiments Nach dieser Definition gelangen wir zu: 2 1 2·1 = = 2·2 4 2 Der russische Mathematiker Kolmorgorow legt die Wahrscheinlichkeit durch drei Axiome fest, durch die die Eigenschaften der Wahrscheinlichkeit beschrieben werden: P (E) = Komolgorow- Axiome 1. Die Wahrscheinlichkeit eines Ereignisses A ist immer positiv: P (A) > 0 2. Die Wahrscheinlichkeit eines Ereignisses, desseb mögliche Ergebnisse identisch mit allen Ergebnissen des Ergebnisraums ist, hat den Wert 1: P (Ω) = 1 3. Haben zwei Ereignisse keine gemeinsamen Ergebnisse, dann sind sie disjunkt. Die Wahrscheinlichkeit zweier disjunkter Ergebnisse wird berechnet durch die Summe der Wahrscheinlichkeit der Einzelereignisse. 2 Wahrscheinlichkeit mit Abzählverfahren 1 Die Produktregel Aus der Zulassungsverordnung für Kraftfahrzeuge des Landkreises Garmisch- Partenkirchens vom 12.12.1976: Die Kennzahl eines privaten Personenkraftfahrzeugs ist maximal dreistellig. Die Nummer ist so zu wählen, dass sich keine Ziffer wiederholt Berechne, wie viele Möglichkeiten die KfZ- Zulassungsstelle hat, mit dieser Verordnung Nummern zu vergeben. Die Lösung ist sehr einfach: Man denkt sich die dreistellige Zahl in drei Blöcke aufgeteilt, für die jeweils eine bestimmte Anzahl von Ziffern zur Verfügung steht: n = 10 · 9 · 8 = 720 Aus diesem Beispiel kann man die folgende Abzählregel ableiten: 3 Repetitorium der Mathematik — Teil 2 Aus k nichtleeren Mengen M1 ,...,Mk mit n1 ,...,nk Elementen kann man n1 · ... · nk verschiedene k- Tupel (x1 , ..., xk ) bilden, wobei x1 M1 ,...,xk Mk . Beispiel Bei einem dreimaligen Würfeln betrachtet man das Ereignis A: Genau zwei Augenzahlen sind gleich. Im ersten Schritt ermittelt man mit der Produktregel die Mächtigkeit des Ergebnisraums: |Ω| = 6 · 6 · 6 = 216 Im zweiten Schritt errechnet man mit der Produktregel die Anzahl aller günstigen Möglichkeiten für A: |A| = 6 · 1 · 5 = 30 Mit Hilfe der Wahrscheinlichkeitsdefinition kann man nun die Wahrscheinlichkeit für das Ereignis A berechnen: 30 |A| = ≈ 0,42 P (A) = |Ω| 216 2 Geordnete Stichproben mit Zurücklegen Jede der drei Urnen aus der Abbildung enthält Kugeln mit den Ziffern 1,3,5 und 7. Zieht man aus jeder der Urnen der Reihe nach eine Kugel, so erhält man ein Tripel, bzw. eine dreistellige Zahl. Man notiert diese dreistellige Zahl und legt dann die gezogene Kugel in die jeweilige Urne zurück. Mit Hilfe der Produktregel kann man nun die Anzahl der verschiedenen Möglichkeiten bei diesem Zufallsexperiment berechnen: |Ω| = 4 · 4 · 4 = 43 Diese Anzahl erhält man auch, wenn man aus einer Urne zieht und die Kugel nach dem Zug immer wieder zurücklegt. Aus diesem Beispiel lässt sich die folgende Kombinatorikregel ableiten: Bei einer Gesamtheit von n verschiedenen Elementen kann man insgesamt nk geordnete Stichproben mit Zurücklegen entnehmen. 4 Repetitorium der Mathematik — Teil 2 Beispiel Bei einem Eishockey- Lottospiel sagt man den Ausgang von 11 Spielen voraus. Das Ankreuzen von 1 bedeutet: Spiel wird gewonnen, 0 steht für Unentschieden und 2 sagt aus, dass das Spiel verloren wird. Man gewinnt im 1. Rang, wenn alle Tipps stimmen. Die Lösung besteht in der Rückführung auf das Urnenmodell. Nimmt man an, dass die Tipps durch reines Raten zustande Kommen, bedeutet das Lotto das hintereinander Ziehen aus 11 Urnen mit den drei Kugeln 0,1,2. Somit ergibt sich mit der eben genannten Kombinatorikregel die folgende Anzahl an verschiedenen Möglichkeiten: |Ω| = 311 = 177147 Somit ergibt sich die Wahrscheinlichkeit mit |A| = 1 die Wahrscheinlichkeit des Gewinns im ersten Rang zu: 1 |A| = ≈ 0,0006% P (A) = |Ω| 177147 3 Die geordnete Stichprobe ohne Zurücklegen Ein großer Automobilhersteller unterzieht nach der Abschlusskontrolle nochmals einem strengen Qualitätstest. In der Garge stehen dreißig mit den Nummern 1-30 versehene Fahrzeuge. Aus diesen Fahrzeugen werden nun von einem Kontrolleur zufällig 5 Fahrzeuge ausgewählt. Jedes der gewählten Fahrzeuge wird in einem unterschiedlichen Qualitätsmerkmal getestet. Ermittle wie viele unterschiedliche Testmöglichkeiten der Kontrolleur besitzt. • Man kann dieses Testverfahren wiederum mit dem Urnenmodell erklären: In einer Urne befinden sich 30 nummerierte Kugeln, aus welchen nun 5 verschiedene Kugeln gewählt werden. Da jedes der gewählten Autos einem unterschiedlichem Testverfahren unterzogen wird, muss die Reihenfolge in der Ziehung berücksichtigt werden. • Mit dem Multiplikationssatz kann man nun zunächst von Hand die Möglichkeiten ermitteln: |Ω| = 30 · 29 · 28 · 27 · 26 = 1710072 • Man kann dieses Ergebnis aber auch mit Hilfe von Fakultäten berechnen: |Ω| = 30 · 29 · 28 · 27 · ... · 2 · 1 30! = = 30 · 29 · 28 · 27 · 26 (30 − 5)! 25 · 24 · 23 · ... · 2 · 1 5 Repetitorium der Mathematik — Teil 2 Damit ermittelt man die Mächtigkeit des Ergebnisraums einer geordneten Stichprobe, bei der aus n Kugeln k Kugeln unter Berücksichtigung der Reihenfolge ausgewählt werden zu |Ω| = n! (n − k)! 4 Die ungeordnete Stichprobe ohne Zurücklegen Aus einem 6 Personen starken Vereinsvorstand sollen 4 Delegierte für die Verbandssitzung per Losentscheid bestimmt werden. Im Gegensatz zu den bisher betrachteten Problemen spielt hier die Reihenfolge keine Rolle. Ins Urnenmodell übersetzt bedeutet dies: Man zieht aus der Urne 4 Kugeln gleichzeitig, also mit einem Griff. In einem ersten Schritt kann man mit der Produktregel die Anzahl aller Dubletts bestimmen: |Ω1 | = 6 · 5 · 4 · 3 = 360 Allerdings ist bei dieser Berechnungsart die Reihenfolge mit gezählt. Zieht man mit einem Griff 4 Kugeln, dann kann man aus diesen 4 Kugeln jeweils 4 · 3 · 2 · 1 = 4! verschiedene Reihenfolgen bilden. Das bedeutet |Ω| = 360 |Ω1 | = = 15 4! 24 Allgemein lässt sich hieraus die folgende Abzählregel bestimmen: Es gibt die nachstehenden Möglichkeiten für eine ungeordnete Stichproben: n k ! = n · (n − 1) · ... · (n − k + 1) n! = 1 · 2 · ... · k k!(n − k)! Diese Regel heisst k über n. 6 Repetitorium der Mathematik — Teil 2 3 Aufgaben zu Wahrscheinlichkeit mit Kombinatorik 1. Vor einer Werkstatt stehen 10 verschiedene Personenkraftwagen, die alle reperaturbedürftig sind. Dabei haben 6 Wagen einen Kupplungsschaden. Für den Arbeitstag wählt der Werkstattmeister 5 Kraftwagen für die Reperatur zufällig aus. a) Bestimme wie viele unterschiedliche Möglichkeiten sich für den Meister ergeben. b) Bestimme die Wahrscheinlichkeit dafür, dass der Meister an diesem Tag genau zwei Fahrzeuge mit defekter Kupplung instandsetzten lässt. c) Berechne die Wahrscheinlichkeit dafür, dass an diesem Tag höchstens 4 defekte Kupplungen durch die Werkstatt ausgetauscht werden. d) Bestimme durch Berechnung die Wahrscheinlichkeit dafür, dass mindestens 3 defekte Kupplungen durch die Werkstatt in Ordnung gebracht werden. 2. Bei einem Jugenskirennen starten die Nationen Frankreich, Österreich, Schweiz, Italien und die Bundesrepublik Deutschland. Insgesamt gehen 30 Rennläufer an den Start. Die Bundesrepublik Deutschland stellt davon 6 Rennläufer, die Schweiz, Frankreich und Österreich je 5 Sportler und Italien 4 Skifahrer. a) Berechne, wie viele unterschiedliche Möglichkeiten es bei der Startnummernvergabe geben kann. b) Bestimme, wie viele verschiedene Möglichkeiten das deutsche Team hat. c) Bestimme die Wahrscheinlichkeit dafür, dass das Rennen von der Schweiz eröffnet wird und auch die zwei folgenden Starter aus der Schweiz sind. 3. Bei dem beliebten bayerische Kartenspiel Schafkopf wird mit 32 Karten gespielt, wobei jeder Spieler 8 Karten erhält. Die höchsten vier Trumpfkarten sind dabei der Eichel- Ober, der Gras- Ober, der Herz- Ober und der Schell- Ober. a) Bestimme die Wahrscheinlichkeit, dass ein Spieler genau zwei Ober erhält. b) Errechne, mit welcher Wahrscheinlichkeit der Spieler höchstens drei Ober in seinem Blatt besitzt. c) Berechne, mit welcher Wahrscheinlichkeit der Spieler mindestens einen Ober in seinem Blatt findet. 4. Bei einem Glücksspiel befinden sich in einer Lostrommel 9 von 1 bis 9 durchnummerierte Kugeln. Es werden nacheinander 3 Kugeln gezogen, die Zahl notiert und die Kugel wieder in die Trommel geworfen. Dadurch ergibt sich nach drei Zügen eine dreistellige Zahl, wobei der erste Zug die Einerziffer, der zweite Zug die Zehnerziffer und der dritte Zug die Hunderterziffer festlegt. 7 Repetitorium der Mathematik — Teil 2 a) Bestimme die Wahrscheinlichkeit dafür, dass die Hunderterziffer größer als 7 ist. b) Bestimme die Wahrscheinlichkeit dafür, dass die Zehnerziffer gerade ist. c) Berechne die Wahrscheinlichkeit dafür, dass die Einerziffer ungerade ist. 8 Repetitorium der Mathematik — Teil 2 4 Verknüpfte Ereignisse– Der Additionssatz 1 Zur Einführung In der Leichtatletikmannschaft des Weisheitsgymnasiums sind 60% Läufer. 30% der Gesamtmannschaft nehmen an dem Wettbewerb in Kurzstreckenlaufen teil, 40% nehmen an dem Langstreckenwettbewerb teil. Ermittle die Wahrscheinlichkeit dafür, dass ein Läufer an beiden Wettbewerben teilnimmt. 2 Lösung der Aufgabenstellung Die Gruppe der Läufer besteht sowohl aus Langstrecken als auch aus den Sprintern. Die Läufer sind also die Vereinigung aus den Sprintern und den Langstreckenläufern. Wir bezeichnen die Langstreckenläufer L und die Kurzstreckenläufer S. Es entsteht dabei folgendes Mengenbild: Mit Hilfe dieses Mengenbildes ergibt sich die Berechnung der Wahrscheinlichkeit für das Ereignis Läufer auf die folgende Art und Weise: P (Laeufer) = P (Sprinter) + P (beides) + P (Langstreckenlaeufer) 9 Repetitorium der Mathematik — Teil 2 Mit Hilfe des oben gezeichneten Mengendiagramms kann man nun diese Wahrscheinlichkeiten wie folgt ausdrücken: P (L) = P (S \ (S ∩ L)) + P (S ∩ L) + P (L \ (S ∩ L)) Die erste und die letzte Wahrscheinlichkeit lässt sich ausdrücken, indem man die Wahrscheinlichkeit der Schnittmenge jeweils von der Teilmenge abzieht, also P (L) = P (S) − P (S ∩ L) + P (S ∩ L) + P (L) − P (S ∩ L) Zusammengefasst ergibt sich nun: P (L) = P (S) + P (L) − P (S ∩ L) Mit den Angaben aus dem Eingangsbeispiel ist P (S ∩L) die gesuchte Wahrscheinlichkeit, die man mit x bezeichnet. Gemäß der eben gefundenen Regel ergibt sich die folgende Gleichung zu lösen: 60% = 40% + 30% − x 0,60 = 0,40 + 0,30 − x −0,10 = −x x = 0,10 Die Wahrscheinlichkeit für einen Allroundläufer des Vereins liegt bei 10%. 3 Zusammenfassung Will man die Wahrscheinlichkeit der Vereinigung von zwei beliebigen Ereignissen A und B bestimmen, dann gilt der im folgenden genannte Additionssatz: P (A ∪ B) = P (A) + P (B) − P (A ∩ B) 5 Die bedingte Wahrscheinlichkeit 1 Ein Beispiel zur Einführung Eine Klasse des Weisheitsgymnasiums besteht aus 20 Jungen und 15 Mädchen. Von den Jungen sind 8, von den Mädchen sind 3 Fahrschüler. Mit welcher Wahrscheinlichkeit ist ein Mitglied 1. Ein Junge 2. ein Junge der Fahrschüler 10 Repetitorium der Mathematik — Teil 2 Lösung der Aufgabe Die Lösung gelingt über eine Vierfeldertafel aus den Ereignissen J und J bzw. F und F P (F ) P (F ) Summe P (J) P (J) Summe 8 35 12 35 20 35 3 35 12 35 15 35 11 35 24 35 1 Zur Bestimmung der gewünschten Wahrscheinlichkeiten hat man nun zwei Möglichkeiten: • Möglichkeit: Bestimmung der Wahrscheinlichkeit zu Fuß: P (J) = 20 35 Die Wahrscheinlichkeit für einen Jungen unter den Fahrschülern: PF (J) = 8 11 • Bestimmung der zweiten Wahrscheinlichkeit durch die in der Vierfeldertafel angegebenen Teilwahrscheinlichkeiten: PF (J) = 8 35 11 35 = 8 11 Diese letzte Berechnungsmöglichkeit lässt sich allgemein als Formel an schreiben: PF (J) = P (J ∩ F ) P (F ) Dies führt zur allgemeinen Definition einer bedingten Wahrscheinlichkeit : Sind A und B zwei beliebige Ereignisse und P (A) 6= 0, so bezeichet man PA (B) die bedinigte Wahrscheinlichkeit von B, die nachstehend definiert ist: P (A ∩ B) PA (B) = P (A) 11 Repetitorium der Mathematik — Teil 2 6 Unabhängigkeit von Ereignissen Beispiel zur Einführung Das Weisheitsgymnasiums hat 1194 Schüler und Schülerinnen. 837 Schüler sind Jungen, 477 Schüler sind Fahrschüler von auswärts. Unter den Fahrschülern sind 335 Jungen. 1. Zeige, dass die Wahrscheinlichkeit für einen Jungen unter den Schülern genauso hoch ist wie die Wahrscheinlichkeit für einen Jungen unter den Fahrschülern. 2. Überlege, was diese Feststellung aussagt. 1 Lösung der Arbeitsaufträge Wir berechnen die geforderten Wahrscheinlichkeiten mit Hilfe der allgemeinen Definition der Wahrscheinlichkeit: 837 = 0,70% P (Junge) = 1194 335 P (Junge)F ahrs = = 0,70% 477 In praktischen Untersuchungen tritt häufig die Frage auf, ob sich durch Eintreten des Ereignisses A die Wahrscheinlichkeit des Ereignisses B ändert. In unserem Beispiel haben wir gesehen, dass das Ereignis Fahrschüler offensichtlich keine Auswirkungen auf das Ereignis der Schüler ist ein Junge hat. In diesem Fall haben wir erkannt, dass die Wahrscheinlichkeit des Ereignisses Junge gleich der bedingten Wahrscheinlichkeit Junge unter der Bedingung Fahrschüler ist, als Gleichung formuliert: P (Junge)F ahrs = P (Junge) Diese Eigenschaft hat einen neuen Namen: Definition Gilt für zwei Ereignisse über dem gleichen Ergebnisraum Ω PB (A) = P (A) so sind die Ereignisse A und B über Ω stochastisch unabhängig. 12 Repetitorium der Mathematik — Teil 2 2 Der spezielle Multiplikationssatz für unabhängige Ereignisse Beispiel zur Einführung In einem Verarbeitungsbetrieb für Metall sind 60 Männer und 40 Frauen angestellt. 18 Männer nutzen jeden Morgen den Werksbus, von den Frauen benützen ihn x. Aus dem Betrieb wird zufällig eine Person ausgewählt. Überprüfe, unter welcher Bedingung die Ereignisse Mann und Werksbus stochastisch unabhängige Ereignisse sind. Lösung mit der Vierfeldertafel Man löst diese Aufgabe mit einer Vierfeldertafel: W W Summe M 18 42 60 M Summe x 18 + x 40 − x 82 − x 40 100 Aus der Vierfelder- Tafel kann man nun die Wahrscheinlichkeit für das Ereignis Mann ermitteln: 60 P (M ) = = 0,60 100 Im nächsten Schritt ist nun die bedingte Wahrscheinlichkeit zu ermitteln, dass eine Person männlich ist und den Werksbus benützt. Nach unserer Definition aus dem letzten Abschnitt ist diese zu berechnen über: T P (M W ) PW (M ) = P (W ) Mit Hilfe der Vierfeldertafel ergibt sich: PW (M ) = 18 100 18+x 100 = 18 18 + x Wenn die beiden Ereignisse stochstisch unabhängig sind, dann muss gelten: PW (M ) = P (M ) 18 = 0,60 18 + x Löst man nun diese Bestimmungsgleichung nach x auf, dann erhält man für x x = 12 Im Fall der stochstischen Unabhängigkeit der Ereignisse gilt also: 13 Repetitorium der Mathematik — Teil 2 M 18 42 60 W W Summe M 12 28 40 Summe 30 70 100 Arbeitsauftrag Berechne P (M ) · P (W ) und vergleiche das Ergebnis mit P (M W ). Wie kannst du mit Hilfe dieses Ergebnisses die stochastische Unabhängigkeit noch ausdrücken: T Lösung des Arbeitsauftrags Aus der Viefeldertafel lassen sich nun die gewünschten Wahrscheinlichkeiten berechnen: 60 = 0,60 P (M ) = 100 30 P (W ) = = 0,30 100 Somit erhält man als Ergebnis für die Produktwahrscheinlichkeit: P (M ) · P (W ) = 0,60 · 0,30 = 0,18 Mit Hilfe der Vierfeldertafel gilt desweiteren: P (M \ W) = 18 = 0,18 100 Für die beiden stochastisch unabhängige Ereignisse gilt offensichtlich: P (M \ W ) = P (M ) · P (W ) Damit kann man die stochstische Unabhängigkeit mit Hilfe der Produktwahrscheinlichkeit folgendermaßen beschreiben: Definition Zwei Ereignisse A und B sind über dem gleichen Ergebnisraum Ω stochastisch unabhängig, wenn gilt P (A \ B) = P (A) · P (B) Diesen Zusammenhang nennt man speziellen Multiplikationssatz. 14 Repetitorium der Mathematik — Teil 2 3 Aufgaben 1. Bei einer Verkehrskontrolle wird von der Polizeistreife Loisach 12 insgesamt an der Loisachbrücke das Fahrverhalten von 50 Fahrzeuglenkern überprüft. Dabei werden fahren und die Fahrzeughalter die Fahrzeughalter ermittelt, die schneller als 50 km h angehalten, welche die Ampel bei rot passiert haben. Ganz regelkonform haben sich dabei 42 Fahrzeuglenker verhalten. Zwei Fahrzeuglenker hatten unter Einhaltung der Höchstgeschwindigkeit die rote Ampel übersehen. Insgasamt hielten 47 von allen untersuchten Kraftfahrzeuglenkern an der roten Ampel. a) Stelle das Ergebnis der Verkehrsüberwachung anhand einer Vier- Felder- Tafel dar. b) Ermittle die Wahrscheinlichkeit dafür, dass ein vor der roten Ampel haltendes Fahrzeug zu schnell unterwegs war. c) Untersuche, ob die beiden von der Polizei untersuchten Ereignisse voneinander stochastisch unabhängig sind. 15 Repetitorium der Mathematik — Teil 2 7 Zufallsgrößen 1 Einführung Bei einem Glücksspiel wird nacheinander dreimal eine Münze geworfen. Vor dem Spiel muss ein Spieler einen Einsatz von 10 ct leisten. Wird dreimal Kopf gewürfelt, bekommt der Spieler 20 ct ausbezahlt, wird zweimal Zahl gezogen, dann erhält der Spieler 15 ct. In allen anderen Fällen wird dem Spieler nichts ausgezahlt. Ziel ist es nun herauszufinden, mit welcher Wahrscheinlichkeit ein Spieler einen Gewinn oder einen Verlust erzielt. Bei diesem Spiel ergeben sich folgende Gewinne bzw. Verlust: • Verlust: −10 ct. • Gewinn: 5 ct • Gewinn: 10 ct Der Ergebnisraum des zugehörigen Zufallsexperiment lautet: Ω = {(k|k|k); (z|k|k); (k|z|k); (k|k|z); (z|z|k); (z|k|z); (k|z|z); (z|z|z)} Für den Verlust ergibt sich folgende günstige Ergebnisse: V = {(z|z|z); (z|k|k); (k|z|k); (k|k|z)} Für den ersten Gewinn ergeben sich folgende günstige Ergebnisse: A = {(z|z|k); (z|k|z); (k|z|z)} Für den zweiten Gewinn ergibt sich dann nachstehende günstige Ergebnisse: B = {(k|k|k)} Damit ergeben sich die folgenden Wahrscheinlichkeiten: P (V ) = 1 2 3 8 1 P (B) = 8 Damit man die eingangs gestellte Aufgabe auch formal beschreiben kann, führt man die folgenden Begriffe ein: P (A) = Unter einer Zufallsgröße versteht man eine Zuordnung, die jedem Ergebnis aus dem Ergebnisraum Ω eine ganzzahlige Zahl zuordnet. 16 Repetitorium der Mathematik — Teil 2 In unserem Beispiel ordnet die Zufallsgröße Gewinn jedem Ergebnis aus dem Ergebnisraum die Zahlen −10, 5 und 10 zu. Jeder dieser Zahlen wird nun eine Wahrscheinlichkeit zugeordnet, die wir oben berechnet haben: Diese Zuordnung erhält ebenfalls einen Namen: Die Wahrscheinlichkeitsverteilung ordnet jeder Zahl einer Zufallsgröße eine Wahrscheinlichkeit zu. Die Wahrscheinlichkeitsverteilung kann man entweder in einer Tabelle darstellen: X -10 P (X = xi ) 12 5 10 3 8 1 8 Man kann diese Tabelle in einem sogenannten Hiostogramm ebenfalls veranschaulichen: Dabei wird jeweils die bei den entsprechenden Zufallszahlen die Wahrscheinlichkeit als senkrechte Linie dargestellt. 2 Die Verteilungsfunktion Kehrt man zu dem vorigen Beispiel zurück, dann kann man sich die Frage stellen, mit welcher Wahrscheinlichkeit man höchstens 5 ct erzielt. P (X < 5 ct) = 1 3 7 + = 2 8 8 Die oben genannte Fragestellung beinhaltet ebenfalls eine Zuordnung einer Wahrscheinlichkeit. Der Fragestellung entsprechend wird jeder Zufallszahl die Summe der Einzelwahrscheinlichkeiten zugeordnet. Exakt wird dies durch folgende Definition wiedergegeben: 17 Repetitorium der Mathematik — Teil 2 Unter der Verteilungsfunktion F (x) versteht man die eindeutige Zuordnung, die jedem Wert der Zufallgröße die Wahrscheinlichkeit P (X < x) zuordnet. Dabei gilt: P (X < x) = X P (X = xi ) xi <x Die Verteilungsfunktion kann man analog zur Wahrscheinlichkeitsverteilung als Tabelle oder in einem Diagramm darstellen: X -10 P (X < x) 12 5 7 8 10 1 Das zugehörige Diagramm hat dann das folgende Aussehen: 3 Erwartungswert einer Zufallsgröße Der Erwartungswert einer Zufallsgröße ist definiert durch: E(X) = n X xi · P (X = xi ) i=0 Der Erwartungswert gibt den zu erwartetenden Mittelwert an. 18 Repetitorium der Mathematik — Teil 2 4 Varianz und Streuung einer Zufallsgröße In diesem Abschnitt steht die Frage im Vordergrund, in welchen Wert die meisten Werte einer Zufallsgröße liegen. Aufgrund der Definition des Erwartungswertes liegt es nahe, dass dieser Bereich symmetrisch zu dem Erwartungswert ist: Man kann die untere Grenze und die obere Grenze dieses Bereichs durch eine Differenz zum Erwartungswert der Zufallsgröße ermitteln. Um das Vorzeichen dieser Differenz zu eleminieren, wird diese Differenz quadriert. Die Wahl des Quadrat dieses Abstandes hat noch zudem den Vorteil, dass es größere Abweichungen stärker gewichtet. Damit dem Expandieren des Streuungsmaßes bei großen n vorgebeugt werden kann, wird es durch die Anzahl n der Werte der Zufallsgröße dividiert. Das so konstruierte Maß heißt Varianz der Zufallsgröße und wird exakt wie folgt definieriert: Mit X sei eine Zufallsgröße gegeben, die einen Wertebereich x1 , x2 bis xn hat. Dann ist die Varianz dieser Zufallsgröße gegeben durch: V AR(X) = n X (xi − E(X))2 · P (X = xi ) i=0 Die Wurzel aus der Varianz wird mit der Standardabweichung σ bezeichnet: q σ = V AR(X) 5 Musteraufgabe zum Themenkomplex Zufallsgrößen • Bei einem Stadtfest stellt ein sozial- caritativer Ortsverein eine Lostrommel auf. Dabei darf für ein Entgeld von 1,00 Eur ein Teilnehmer aus der Lostrommel ein Los ziehen. Die Lose sind mit 1 bis 5 durchnummeriert und geben die Preiskategorie an: – Kategorie 1: Der Spieler gewinnt 8,00 Eur – Kategorie 2: Der Spieler gewinnt 6,00 Eur – Kategorie 3: Der Spieler gewinnt einen gesponserten Preis, der dem Verein nichts kostet. – Kategorie 4: Der Spieler gewinnt einen gesponserten Preis, der dem Verein 1,00 Eur einbringt. – Kategorie 5: Der Spieler zieht eine Niete und geht leer aus. In der Lostrommel befinden sich 2 Lose mit der 5,je ein Los mit 3 und 2,fünf Lose mit der 4 und ein Los mit der 1. Die Zufallsgröße X bezeichnet den Gewinn des Vereins bei dem Lostrommelstand. 19 Repetitorium der Mathematik — Teil 2 1. Bestimme den durchschnittlich zu erwartetenden Gewinn pro Spiel des Vereins. 2. Ermittle, in welchem Intervall um diesen durchschnittlichen Gewinn die meistens Ergebnisse liegen. • Lösung: 1. Stelle zunächst die Wahrscheinlichkeitsverteilung der Zufallsgröße auf: Kategorie Gewinn des Vereins in Euro P (X = xi ) 1 -7 2 -5 3 1 4 2 1 10 1 10 3 10 5 10 5 Der durchschnittlich erwartete Gewinn ist eine andere Formulierung für das Ermitteln des Erwartungswertes der Zufallsgröße: E(X) = −7 · 1 3 5 1 + (−5) · +1· +2· 10 10 10 10 E(X) = 0,10 Eur 2. Die zweite Frage wird durch die Ermittlung der Standardabweichung beantwortet: V AR(X) = (−7 − 0,1)2 · 1 1 3 5 + (−5 − 0,1)2 · + (1 − 0,1)2 · + (2 − 0,1)2 · 10 10 10 10 V AR(X) = 9,69 σ= q V AR(X) = q 9,69 = 3,11 Damit lässt sich das Intervall angeben zu [0,10 − 3,11; 0,10 + 3,11] [−3,01 Eur; 3,41 Eur] 20 Repetitorium der Mathematik — Teil 2 8 Das Bernoulli- Experiment und die Binomialverteilung 1. Bei einer Fertigung von Energiesparlampen ist die Wahrscheinlichkeit einer defekten Sparlampe 0,05. Jeder Fertigungsserie werden nun die ersten 5 Energiesparlampen entnommen. a) Stelle einen geeigneten Ergebnisraum auf b) Stelle den Ereignisraum auf für das Ereignis, dass unter den 5 genau 2 defekte Glübirnen sind. c) Bestimme die Wahrscheinlichkeit, dass unter den ersten 5 Glühbirnen 2 defekte Werkstücke sich befinden. Lösung der Arbeitsaufträge a) Das Zufallsexperiment hat grundsätzlich nur zwei Ergebnisse: Die Glühbirne ist defekt. Oder die Glübirne leuchtet und ist in Ordnung. Damit ist ein tauglicher Ergebnisraum Ω = {0; 1} Definition Ein Zufallsexperiment heißt Bernoulli- Experiment, wenn es nur zwei Ergebnisse besitzt. Dabei hat das Ergebnis 1 den Namen treffer und 0 wird mit Niete bezeichnet. Die Trefferwahrscheinlichkeit wird mit p bezeichnet, die Nietenwahrscheinlichkeit mit q. Zwischen den beiden besteht die Beziehung: q =1−p Ein Zufallsexperiment, dass aus n stochastisch unabhängig durchgeführten Bernoulliexperiment besteht, heißt Bernoullikette . b) Bestimmung eines Ereignisraums für das Ereignis genau zwei defekte Birnen. Es handelt sich nach obenstehender Definition um eine Bernoulli- Kette. 21 Repetitorium der Mathematik — Teil 2 1 1 0 0 0 1 0 0 1 0 1 2 1 1 0 0 0 1 0 0 1 0 2 0 1 1 0 1 0 1 0 0 0 4 0 0 1 1 0 1 0 1 0 0 5 0 0 0 1 0 0 1 0 1 1 Aus der Tabelle erkennt man, dass es für das Ergebnis insgesamt 10 = 5 2 ! verschiedene Kombinationen gibt. c) Da die einzelnen Durchführungen des Bernoulli- Experiments stochastisch unabhängig sind gilt für das Eintreten der ersten Möglichkeit die folgende Wahrscheinlichkeit: P (11000) = 0,05 · 0,05 · 0,95 · 0,95 · 0,95 = 0,052 · 0,953 Die Wahrscheinlichkeit der weiteren Möglichkeiten ist – wie man sich leicht überzeugt– gleich groß. Damit aber gilt insgesamt: 2 3 P (Zwei defekt) = 10 · 0,05 · 0,95 = 5 2 ! · 0,052 · 0,953 Sucht man nun in einer Bernuollikette der Länge n k Treffer, dann erhält man für dieses Ereignis die folgende Wahrscheinlichkeit: Satz 1 Ein Bernoulli- Experiment wird n- Mal durchgeführt. Die Durchführungen sind unabhängig. Dann erhält man als Wahrscheinlichkeit für k Treffer den folgenden Term P (k) = n k 22 ! · pk · (1 − p)n−k Repetitorium der Mathematik — Teil 2 1 Erwartungswert beim Bernuolli- Experiment Zur Einführung Eine Zahnarztpraxis behandelt 5 Patienten mit einem Antiseptikum. Dem Arzt ist bekannt, dass 16 Patienten unerwünschte Nebenwirkungen aufweisen, die eine Nachbehandlung erforderlich machen. 1. Mit wie vielen Nachbehandlungen muss der Zahnarzt rechnen. 2. Berechne das Produkt n · p und vergleiche es mit dem Ergebnis von der vorangegangenen Teilaufgabe. Was fällt dir dabei auf? Lösung Um die durchschnittliche Anzahl von Patienten, bestimmen wir mit Hilfe der stochastischen Tabellen die Wahrscheinlichkeit für 0 bis 10 Treffer: k 5 4 3 2 1 0 P(k) 0,0001 0,0032 0,0322 0,1608 0,4019 0,4019 Das arithmetische Mittel ist dies Summe der einzelnen Treffer multipliziert mit der Wahrscheinlichkeit der einzelnen Treffer. k = 5 · 0,001 + 4 · 0,0032 + 3 · 0,0322 + 2 · 0,1608 + 1 · 0,4019 + 0 · 0,4019 Das Ergebnis ausgewertet er gibt für unseren Fall: k = 0,83 Vergleichen wir das Produkt 5 · 61 : 5· 1 5 = = 0,83 6 6 Man erkennt, dass bis auf die Rundungsfehler die durch die stochastischen Tabellen gemacht wurde, eine Übereinstimmung besteht. Der Erwartungswert der Bernoullikette ist die Summe der Produkte aus Trefferanzahl und Wahrscheinlichkeit für die Trefferanzahl. Er wird mit dem griechischen µ bezeichnet. Der Erwartungswert der Bernoullikette hängt folgendermaßen mit Kettenlänge und der Trefferwahrscheinlichkeit zusammen: µ=n·p 23 Repetitorium der Mathematik — Teil 2 2 Die Länge einer Bernoulli- Kette Beispiel zur Einführung Eine Firma kauft Massenartikel ein. Der Hersteller gibt den Ausschussanteil mit einer höchsten 0,5% an. Der Einkäufer will nun die Glaubhaftigkeit des Herstellers überprüfen. Er greift aus der Produktion zufällig eine gewisse Anzahl des gewünschten Artikel heraus. Ist ein Werkstück defekt, verweigert er die Annahme der Lieferung. Berechne wie viele Artikle der Einkäufer mindestens prüfen muss, damit er mit eine Mindestwahrscheinlichkeit von 98% die richtige Entscheidung trifft. Lösung Es handelt sich um eine Bernoullikette mit folgenden Vereinbarungen: • Der Treffer ist ein defektes Werkstück • Trefferwahrscheinlichkeit ist 0,5% Zur Lösung des Problems ist folgendes zu bemerken: • Der Kontrolleur erzielt keinen Treffer: k = 0 • Die Wahrscheinlichkeit dafür soll 98% betragen. Mit Hilfe der Bernoulli- Formel ergibt sich deshalb der nachstehende Ansatz: 0,98 = n 0 ! · 0,0050 · 0,995n Dies vereinfacht sich nach Anwendung der Fakultätsregeln und den Potenzgesetzen zu 0,98 = 0,995n Zieht man nun auf beiden Seiten den Logarithmus ln auf beiden Seiten, dann erhält man ln(0,98) = n · ln(0,995) n= ln(0,98) ln(0,995) Als Zahlenwert ergibt sich nach Ausziehen des Logarithmuses: n = 4,03 Damit muss der Einkäufer mindestens 5 Werkstücke prüfen. 24 Repetitorium der Mathematik — Teil 2 9 Testen von Hypothesen 1 Der einseitige Signifikanztest Zur Einführung Die Brüder Fritzi und Egon haben unterschiedliche Meinungen über die Anzahl der Kunden einer benachbarten Tankstelle, die bleifreies Superbenzin tanken. Fritzi behauptet, dass dies 20% tun, Egon hingen meint, dass die Schätzung seines Bruders zu gering ist. Sie beschließen die nächsten 100 Kunden zu beobachten. Falls höchstens 27 Kunden Super tanken soll entscheiden sie sich für die Annahme von Fritzis Hypothese. 1. Bestimme wie hoch die Wahrscheinlichkeit ist, dass Fritzi recht hat, obwohl das Testergebnis für die Ablehnung von Fritzis Hypothese spricht. 2. In Wahrheit liegt die Wahrscheinlichkeit für das Tanken von Superbenzin bei 35%. Bestimme, wie hoch die Wahrscheinlichkeit ist, dass das Testergebnis trotzdem für Fritzis Annahme spricht. 2 Theoretischer Hintergrund Es handelt sich bei der vorangestellten Aufgabe um einen statistischen Test. Ein statistischer Test ist ein Entscheidungsverfahren darüber, ob die Daten einer Stichprobe einer vorgegebenen Hypothese über die unbekannte Grundgesamtheit entsprechen oder widersprechen. Fällt die Entscheidung zwischen Annahme oder Ablehnung einer Hypothese , so heißt der Test einseitiger Signifikanztest. An unserem Beispiel kann man erkennen, was bei einem Signifikanztest alles beachtet werden muss: • Man beobachtet 100 Fahrzeuge, d.h. die Länge n der Stichprobe wird festgelegt. • Man muss die Hypothese formulieren: – H0 : Es tanken 20% Superbenzin • Man muss eine Entscheidungsregel angeben: H0 gilt, wenn höchtsens 27 Autos Super tanken. Durch die Entscheidungsregel wird ein Annahmebereich A festgelegt, in welchem H0 zutrifft. Im Ablehnebreich A trifft dann H0 nicht zu. Die mit der Entscheidungsregel verknüpften möglichen Fehlentscheidungen können dann gemäß der folgenden Prozedur bestimmt werden. 25 Repetitorium der Mathematik — Teil 2 • H0 trifft zu. 1. Das Testergebnis liegt im Annahmebereich A. Es handelt sich um die richtige Entscheidung, die den Fachnamen Sicherheit des Urteils erhält. 2. Das Testergebnis liegt im Ablehnebereich A. Es handelt sich dann um den Fehler erster Art . Man kann den Fehler erster Art für unser Beispiel nun unmittelbar berechnen: P1 (x A) ist gesucht: P1 (x A) = 100 X B (100; 0,20; k) = 1 − k=28 27 X B (100; 0,20; k) k=0 P1 (x A) = 1 − 0,96585 = 0,03415 = 3,42% • H0 trifft nicht zu. Auch hier sind nun wieder zwei Szenarien vorstellbar: 1. Das Testergebnis liegt in A. Auch hier handelt es sich dann um die richtige Entscheidung. 2. Das Testergebnis liegt im Annahmebereich A. Hier handelt es sich um die zweite Fehlentscheidung, die man mit Fehler zweiter Art bezeichet. Auch diese kann leicht berechnet werden: Gesucht wird hier P2 (x A). Mit Hilfe der Bernoullikette kann man nun rechnen: P2 (x A) = 27 X B (100; 0,35; k) = 0,05581 = 5,81% k=0 Kurze Veranschaulichung in Form einer Tafel x A x A H0 statistische Sicherheit Fehler erster Art H0 Fehler zweiter Art richtige Entscheidung Der Fehler erster Art wird auch als Signifikanzniveau bezeichnet. 3 Bestimmung einer Entscheidungsregel Beispiel Ein großer Automobilhersteller will überprüfen, wie weit sich die Bevölkerung mit Elektroautomobilen angefreundet hat. Die Konzernleitung geht davon aus, dass sich heute höchstens 20% der Bevölkerung den Erwerb eines Elektromobils als Alternative zum konventionell betriebenen Fahrzeug vorstellen können. Um das Kundenklima in dieser Frage zu testen, führt der Konzern eine Befragung von 100 Personen durch. Wie muss die Entscheidungsregel lauten, wenn das Signifikanzniveau des Test 5,0% betragen soll? 26 Repetitorium der Mathematik — Teil 2 Lösung 1. Allgemeine Formulierung des Annahme und Ablehnebereichs. Weil die Konzernleitung von höchstens 20% Akzeptanz ausgeht, ist A = {0, 1, 2, ..., k} A = {k + 1, k + 2, ..., 100} 2. Mit Hilfe des Siginfikanzniveaus ist bekannt, dass der Fehler erste Art maximal 5,0% beträgt. Damit kann man mit der Definition des Fehlers erster Art einen Ansatz aufstellen, mit dessen Hilfe und dem Tabellenwerk der Parameter k bestimmt werden kann: P (x A) < 0,05 Mit Hilfe der Binomialverteilung kann man die linke Seite der Ungleichung ersetzen durch: 100 100 (100) − F0,20 (k) < 0,05 F0,20 100 1 − F0,20 (k) < 0,05 100 F0,20 (k) > 0,95 ⇒ k = 27 3. Wörtliche Formulierung der Entscheidungsregel: Wenn höchstens 27 Personen ein Elektromobil erwerben möchten, dann wird die Hypothese der Konzernleitung als wahr angenommen. 4. Angabe des Annahme- und Ablehnebereichs: A = {0, 1, 2, 3, ..., 27} A = {28, 29, 30, ..., 100} 5. Hinweis: Mit der Summenschreibweise sieht der Ansatz unter 2. wie folgt aus: 100 X B(100, 0,20, i) < 0,05 i=k+1 1− k X B(100, 0,20, i) < 0,05 i=0 Dann wiederum bei analogen Entwicklung ergibt sich k = 27 27 Repetitorium der Mathematik — Teil 2 4 Zusammenfassung über den einseitigen Signifikanztest Bei einem einseitigen Signifikanztest müssen die folgenden Schritte bedacht werden: • Bestimme die Länge n für die Stichprobe. • Formuliere die Nullhypothese H0 . • Lege einen Annahmebereich A und einen Ablehnebereich A fest. • Bestimme den Fehler erster Art α = P1 (A). • Bestimme den Fehler zweiter Art β = P2 (A). • Die statitische Sicherheit für H0 ist 1 − α • Bei bekannten Signifikanzniveau ist die Entscheidungsregel zu bestimmen. 28