Einführung in die Wahrscheinlichkeitsrechnung 1 Wahrscheinlichkeitsrechnung (Stochastik) 1. Grundbegriffe der Wahrscheinlichkeitsrechnung Die Mathematiker Pascal (1623-1662) und Fermat (1601- 1665) gelten als die Begründer der Wahrscheinlichkeitsrechnung. Damals war das Hauptanliegen, die Erfolgschancen beim Glücksspiel vorauszusagen. Die Wahrscheinlichkeitsrechung gehört zu denjenigen Gebieten der Mathematik, an denen die Verbindung von realer Welt und ihrer mathematischen Beschreibung besonders deutlich wird. Jedoch gehört gerade dieses Gebiet der Mathematik zu jenen, in denen logisches Denken so gefragt ist, wie in kaum einem anderen: Überall lauern Fallstricke und Trugschlüsse, denen manchmal selbst versierten Mathematiker unterliegen. Dies soll uns aber trotzdem nicht abhalten, uns mit dem Gedankengebäude der Wahrscheinlichkeitstheorie auseinander zusetzen; denn da es uns lediglich um die praktische Anwendung wahrscheinlichkeitstheoretischer Verfahren geht, genügt es, ein Grundverständnis der Wahrscheinlichkeitsrechnung mitzubringen. Dazu dienen zunächst die folgenden grundlegenden Vereinbarungen: (1) Die Wahrscheinlichkeitsrechnung beschäftigt sich mit Zufallsexperimenten. (2) Ein Experiment, bei dessen Durchführung mehrere Ergebnisse möglich sind und dessen Ausgang (Ergebnis) vor der Versuchsdurchführung nicht sicher vorausgesagt werden kann, heißt Zufallsexperiment. (3) Wir fordern von einem Zufallsexperiment, dass es beliebig oft unter den gleichen Bedingungen wiederholbar ist: Ein n-stufiges Zufallsexperiment entsteht dadurch, dass n Zufallsexperimente nacheinander oder gleichzeitig durchgeführt werden. Beispiel: Das Zufallsexperiment „Werfen eines Würfels“ wird fünfmal ausgeführt. (4) Ein einzelnes Ergebnis eines Zufallsexperiments bezeichnen wir mit chen Versuchsergebnisse als Ergebnismenge ω ; die Menge aller mögli- Ω . Manchmal wird Ω auch als Ereignismenge oder Ereignisraum eingeführt. Dies begründet sich durch folgenden Sachverhalt: Jede Teilmenge A von Ω heißt - zufälliges - Ereignis. Das Ereignis A wird also durch eine Menge von Ergebnissen aus Ω beschrieben A = {ω1; ω 2 ; ω3 ; ... ; ω n }. Wir sagen: Das Ereignis A ist eingetreten, wenn das Ergebnis ω des Zufallsexperiments Element von A ist. Falls das Ergebnis nicht Element von A ist, sagen wir: Das Ereignis A ist nicht eingetreten. ω Einführung in die Wahrscheinlichkeitsrechnung 2 Beispiele: (a) Beim Würfeln interessiert die Augenzahl. Daher betrachten wir den Ergebnisraum Ω = {1; 2; 3; 4; 5; 6 }. Jede einzelne Augenzahl wäre demnach ein mögliches Ergebnis dieses Zufallsexperimentes. Ein mögliches Ereignis A wäre zum Beispiel das Ereignis „Würfeln einer geraden Augenzahl“. Hier gilt: A = { 2; 4; 6 }. (b) Beim Ziehen einer Karte aus einem Stapel mit 32 Skatkarten ist der Ergebnisraum Ω ={Karo 7, Herz 7, Pik 7, Kreuz 7,..., Pik As, Kreuz As}. Jede einzelne Karte wäre demnach ein mögliches Ergebnis dieses Zufallsexperimentes. Ein mögliches Ereignis A wäre zum Beispiel das Ereignis „Ziehen einer Herzkarte“. Hier gilt: A = { Herz 7, Herz 8, Herz 9, … ,Herz König, Herz As}. (5) Wir kennen in der Wahrscheinlichkeitsrechnung spezielle Ereignisse, die wir hier kurz auflisten wollen: Einelementige Ereignisse heißen Elementarereignisse. Das Elementarereignis genau dann ein, wenn ω das Ergebnis des Zufallsexperimentes ist. Das Ereignis da es alle möglichen Versuchsergebnisse enthält. Aus diesem Grunde heißt E = {ω } tritt Ω tritt immer ein, Ω das sichere Ereig- nis. Es erweist sich in diesem Zusammenhang als sinnvoll, noch das unmögliche Ereignis Ο / einzuführen. Es entspricht der leeren Menge und kann nie eintreten, da es kein mögliches Versuchsergebnis enthält. Umgangssprachlich werden Ereignisse mit einer Wahrscheinlichkeit nahe Null als unwahrscheinlich, Ereignisse mit einer Wahrscheinlichkeit nahe Eins als wahrscheinlich bezeichnet. Die Wahrscheinlichkeitsrechnung dient dazu, aufgrund bestimmter Annahmen und Erkenntnisse den Ausgang von Untersuchungen (Experimenten) vorauszusagen. In der Theorie der „beurteilenden Statistik“ (auch Inferenzstatistik oder schließende Statistik genannt) werden die Ergebnisse der Wahrscheinlichkeitsrechung angewendet, um entscheiden zu können, ob die Kennwerte empirisch erfasster Daten sich unterscheiden oder nicht. Hier geht es beispielsweise um Fragen der Lernpsychologie („Ist die Lernmethoden A besser als Methode B?), der Wirksamkeit von Medikamenten („Hat das Medikament A weniger Nebenwirkungen als Medikament B?“), der Risikobereitschaft („Sind Jungen risikofreudiger als Mädchen?“), der Vererbung von Intelligenz („Ist Intelligenz angeboren oder nicht?“), der Mobilität usw. Die kurze Aufzählung soll eines zeigen: Die Modelle der Mathematik sind aus der modernen Wissenschaft nicht mehr wegzudenken. Einführung in die Wahrscheinlichkeitsrechnung 3 2. Definition der Wahrscheinlichkeit Bei der Untersuchung von Zufallsexperimenten spielen die Häufigkeiten von Ereignissen eine wichtige Rolle. Ereignissen, die oft eintreten, werden wir intuitiv große Wahrscheinlichkeiten zuordnen, während die Wahrscheinlichkeiten von selten eintretenden Ereignissen klein sind. Wir übertragen die bisherigen Definitionen der absoluten und relativen Häufigkeiten auf die Durchführung von Zufallsexperimenten: Ein Zufallsexperiment werde n-mal durchgeführt. Dann heißt die Anzahl derjenigen Versuche, bei denen das Ereignis A eintritt, die absolute Häufigkeit H n (A) des Ereignisses A. Der Index n gibt dabei den Versuchsumfang bzw. die Anzahl der Versuche an. Ist H n (A) in einer Versuchsreihe vom Umfang n die absolute Häufigkeit des Ereignisses A, dann heißt der Quotient hn (A ) = H n (A ) n relative Häufigkeit des Ereignisses A. Bei fast allen Versuchsreihen stabilisieren sich für große Versuchsumfänge n die relativen Häufigkeiten hn (A ) eines Ereignisses A um einen festen Zahlenwert p, wenn die einzelnen Versuche unabhängig voneinander durchgeführt werden. Den Zahlenwert p, um den sich bei großen Versuchsreihen in der Regel die relative Häufigkeit eines Ereignisses stabilisieren, bezeichnen wir in der Mathematik naiv als Wahrscheinlichkeit dieses Ereignisses. Wir haben somit eine erste anschauliche Definition der Wahrscheinlichkeit gefunden. Merksatz 1 Wahrscheinlichkeit und relative Häufigkeit sind grundsätzlich verschiedene Begriffe. Wahrscheinlichkeiten dienen der Prognose; sie geben Auskunft über Chancen in bevorstehenden Zufallsversuchen. Dagegen machen absolute und relative Häufigkeiten immer Aussagen über bereits durchgeführte Zufallsversuche. Beispiel: Bei 200 Würfen mit einem Würfel wurde 35-mal eine „6“ gewürfelt, die relative Häufigkeit der „6“ beträgt demnach 35/200 = 0,175 (oder 17,5 %), wobei sich die Wahrscheinlichkeit, eine „6“ zu würfeln, mit Hilfe von Laplace errechnen lässt als: p = 1 ≈ 0,167 . 6 Einführung in die Wahrscheinlichkeitsrechnung 4 Merksatz 2 Die Erfahrung zeigt, dass mit steigender Versuchsanzahl der Wert der relativen Häufigkeit immer mehr einem „Endwert“ näher kommt, er pendelt sich ein. Diesen „Endwert“ nennen wir (statistische) Wahrscheinlichkeit. Wir sprechen in der Mathematik auch vom „empirischen Gesetz der großen Zahlen“. Es besagt, dass bei genügend langen Versuchsserien, also bei häufiger Wiederholung eines Zufallsversuchs, die relativen Häufigkeiten eines Ergebnisses in der Nähe der Wahrscheinlichkeit des Ergebnisses liegen. Das Empirische Gesetz der Großen Zahlen erlaubt Voraussagen über die absolute Häufigkeit H, mit der ein Ergebnis auftreten wird. Wir interpretieren dabei die Wahrscheinlichkeit p eines Ergebnisses als den Anteil, den dieses Ergebnis an allen Versuchsergebnissen voraussichtlich haben wird, und berechnen daraus die absolute Häufigkeit H bei n Versuchen als: H = n ⋅ p . Beispiel 2: Falls ein Ereignis die Wahrscheinlichkeit p = 0,25 besitzt, würden wir erwarten, dass es bei 200 Versuchen 50-mal auftritt: H = 200 ⋅ 0,25 = 50 . Ziel der Wahrscheinlichkeitsrechnung und der Statistik ist es, einen Wahrscheinlichkeitsbe-griff einzuführen, der ohne vorheriges Experimentieren zu kalkulieren ist und bei wiederholten Durchführungen derselben mit den relativen Häufigkeiten eines Ereignisses in einem gewissen Zusammenhang steht. Allgemein benötigen wir in der Mathematik Modellannahmen (MA), um einen Begriff sinnvoll einführen zu können. Daher fordern wir zunächst: MA1: Es gibt nur endlich viele verschiedene Versuchsergebnisse, d.h. die Ergebnismenge Ω ist endlich. MA2: Bei der Durchführung des Zufallsexperiments darf kein Ergebnis bevorzugt werden, das heißt: jedes Ergebnis tritt mit der gleichen Wahrscheinlichkeit auf. Der französische Mathematiker Pierre Simon Laplace (1749-1827) hat unter Berücksichtigung der Modellannahmen MA1 und MA2 ein Modell zur Berechnung von Wahrscheinlichkeiten ermittelt. Daher trägt jedes Experiment, das diese beiden Modellannahmen erfüllt, seinen Namen: Laplace- Experiment. Einführung in die Wahrscheinlichkeitsrechnung 5 Die Ergebnismenge Ω bestehe aus m verschiedenen Ergebnissen. Ferner seien die Modellannahmen MA1 und MA2 erfüllt. Dann besitzt jedes Ereignis A die klassische Wahrscheinlichkeit bzw. Laplace-Wahrscheinlichkeit: p(A ) = A Anzahl der Elemente von A = Ω Anzahl der Elemente von Ω . Aus der Formel zur Berechung der klassische Wahrscheinlichkeit lässt sich unmittelbar die folgenden Eigenschaften ableiten: Tabelle 1: Eigenschaften der klassischen Wahrscheinlichkeit Eigenschaft der klassischen Wahrscheinlichkeit Zusatz/ Erläuterung 0 ≤ pn (A) ≤ 1 für jedes Ereignis A pn (Ο / )=0 für das unmögliche Ereignis pn (Ω ) = 1 Normierung pn (A ∪ B ) = pn (A) + pn (B ) für pn (A ∪ B ) = pn (A ) + pn (B ) − pn (A ∩ B ) für beliebige Ereignisse ( ) p A = 1 − p (A ) Ο/ A∩B = Ο / (Additivität) für das Gegenereignis A von A Aufgaben 1. Paula hat acht Münzen in ihrer Geldbörse. Es sind zwei kupferfarbige, vier goldfarbig und zwei goldsilberfarbige. Sie nimmt ohne Hineinzusehen eine Münze heraus. Bestimmen Sie die Wahrscheinlichkeit, dass sie (a) eine goldfarbige, (b) keine goldfarbige, (c) eine kupferfarbige zieht. 2. In einer Tüte sind elf Mandel- und 22 Schokokekse. Peter nimmt den ersten heraus, es ist ein Mandelkeks, er wird gegessen. Danach fasst Paula in die Tüte. Mit welcher Wahrscheinlichkeit ist auch das ein Mandelkeks? 3. In einer Straße wohnen 2 Familien ohne Kinder, 10 Familien mit einem Kind, 15 Familien mit zwei Kindern und 3 Familien mit mehr als zwei Kindern. Berechnen Sie die Wahrscheinlichkeit, dass man eine Familie mit einem Kind (mit mehr als zwei Kindern) trifft, wenn man an einer beliebigen Tür klingelt. 4. Eine Familie hat vier Kinder. Ermitteln Sie die Wahrscheinlichkeit, dass die Kinder in der Reihenfolge Junge-Mädchen-Mädchen-Junge geboren wurden. Einführung in die Wahrscheinlichkeitsrechnung 6 5. Beurteilen Sie die folgende Argumentation: Wenn man drei Münzen wirft, liegen immer zwei gleichartige oben. Die dritte Münze zeigt entweder Zahl oder Wappen, so dass das Auftreten von drei gleichen Merkmalsausprägungen zu 50% zu erwarten ist (entweder kommt die dritte passende oder sie kommt nicht). 6. Ein Würfel wird viermal geworfen: Ereignis A1 = {1, 2, 3, 4 } in der angegebenen Reihenfolge und Ereignis A2 = {2, 2,2 , 2 } . Geben Sie an, mit welcher Wahrscheinlichkeit A1 bzw. A2 auftreten. Geben Sie für die folgenden Aufgaben jeweils die Ergebnismenge Ω , das Ergebnis E und die Wahrscheinlichkeit p( E ) an. 7. Ein Würfel wird einmal geworfen. Wie groß ist die Wahrscheinlichkeit für: E1: Werfen einer ungeraden Augenzahl E2: Augenzahl mindestens 5 E3: Augenzahl weniger als 3 8. Peter und Paula haben für das Schulfest eine Lotterie vorbereitet. In Peters Lotterie gibt es Lose mit den Nummern 1 bis 50 und es gewinnt jedes Los mit einem Vielfachen von 7 oder 9. Paula hat 60 Lose mit den Nummern 1 bis 60 und es gewinnen alle Primzahlen. Welche Lotterie ist günstiger für einen Loskäufer? 9. Aus einem Skatspiel wird eine Karte gezogen. Wie ist die Wahrscheinlichkeit für: E4: Ziehen einer Dame E5: Ziehen einer „Personenkarte“ E6: Ziehen einer Karo-Karte E7: Ziehen einer roten Karte E8: Ziehen einer roten oder schwarzen Karte 10. Ein Lehrer bietet seiner Klasse an, durch einen Zufallsversuch zu entscheiden, ob morgen ein Wandertag oder Studientag stattfindet. Dabei stellt er zwei Möglichkeiten zur Wahl: (1) Wenn beim Werfen eines Würfels eine „6“ fällt ist Studientag, andernfalls wird gewandert. (2) Wenn beim Ziehen aus einem Skatspiel eine Kreuzkarte, jedoch keine Personenkarte, gezogen wird ist Studientag, andernfalls wird gewandert. Welche Methode sollten die Schüler wählen, wenn sie lieber wandern würden? Einführung in die Wahrscheinlichkeitsrechnung 7 3. Nicht-Laplace-Versuche Beim Würfel machen wir aufgrund seiner Symmetrie die Annahme, daß für jede Augenzahl die Wahrscheinlichkeit 1 6 ist. Eine entsprechende Betrachtung lässt sich nicht für beliebige Zufallsversuche (Zufallsgeräte) anstellen, auch wenn das Gerät Symmetrieeigenschaften besitzt. Aufgabe Reißnägel gibt es in unterschiedlichen Ausführungen: mit längerem oder kürzerem Dorn, mit flachem oder verstärktem Kopf. Wirft man einen bestimmten Reißnagel auf eine harte Unterlage, dann bleibt er in der Lage ⊥ (Lage Kopf) oder in der Lage (Lage Seite) liegen. a) Begründen Sie: Im Allgemeinen liegt hier kein LAPLACE-Versuch vor. b) Was lässt sich aufgrund der nachstehenden Versuchsserie über die Wahrscheinlichkeit für die Lage Kopf sagen? c) Schätzen Sie, wie oft die Lage Kopf nach 2000 Versuchen aufgetreten sein wird. Anzahl der Würfe n mit Lage Lage Kopf Seite 100 45 55 200 84 116 N (Kopf) h(n) 300 132 168 100 0,45 400 182 218 200 0,42 500 217 283 300 0,44 600 249 351 400 0,455 500 0,434 700 294 406 600 0,415 800 335 465 700 0,42 900 377 523 800 0,419 1000 424 576 900 0,419 1100 471 629 1000 0,424 1200 512 688 1300 561 739 1400 608 792 1500 649 851 Einführung in die Wahrscheinlichkeitsrechnung 8 Wahrscheinlichkeiten bei Nicht-LAPLACE-Versuchen Bei vielen Zufallsversuchen kann man nicht von vornherein aufgrund von Symmetrien Wahrscheinlichkeiten angeben. Jedoch gehen wir davon aus, dass auch solchen Nicht-LAPLACE-Versuchen Wahrscheinlichkeiten zugrunde liegen. Da wir diese aber nicht kennen, müssen wir diese Wahrscheinlichkeit aufgrund der relativen Häufigkeiten nach langen Versuchsreihen schätzen. (Empirisches Gesetz der Großen Zahlen) Bei Nicht-Laplace-Versuchen wird den Ergebnissen (Ereignissen) also „einfach“ eine Wahrscheinlichkeit zugewiesen (zugeordnet), die auf Erfahrungswerten bzw. langen Versuchsreihen basiert. Mit diesen Wahrscheinlichkeiten kann dann gerechnet werden, wie mit denen bei Laplace-Versuchen. Aufgaben zu Nicht-Laplace-Versuchen: 1. Auf einem Glücksrad sind 5 Felder mit den Zahlen 1 bis 6, die verschieden groß sind. Bei 2000 Drehungen ergibt sich die folgende Verteilung: Zahl 1 2 3 4 5 Anzahl 150 750 50 400 650 a) Ordnen Sie den verschiedenen Zahlen geeignete Wahrscheinlichkeiten zu. b) Wie oft würden Sie bei 3600 Drehungen die „1“ erwarten? 2. In einer Fabrik wird eine „neue“ Serie von Fernsehern produziert. Nach einer Woche stellt man fest, dass von den 3840 produzierten Fernsehern bei 24 die Bildröhre defekt ist. a) Berechnen Sie mit diesen Angaben die Wahrscheinlichkeit für eine defekte Bildröhre. b) Wie viele defekte Bildröhren sind zu erwarten, wenn im ersten Monat 16000 Fernseher produziert werden? 3. In einer Pralinenfabrik werden bei „Sichtkontrollen“ erfahrungsgemäß 1 7 der nicht ordnungs- gemäßen Pralinen übersehen. Wie oft müsste man die Sichtkontrollen durchführen, damit der Anteil der unentdeckten schadhaften Pralinen kleiner als 0,05 % wird? Einführung in die Wahrscheinlichkeitsrechnung 9 4. Zur Theorie mehrstufiger Zufallsexperimente Glücksspiele, Ziehen einer Stichprobe aus einer Grundgesamtheit u.ä. lassen sich durch Ziehen aus einer geeigneten Urne simulieren. Haben wir uns erst einmal auf eine Wahrscheinlichkeit geeinigt, so lässt sich fast jedes Zufallsexperiment durch eine Urnensimulation modellieren. Es genügt also im Folgenden, mehrstufige Zufallsexperimente bei Urnen zu betrachten. Urnenexperimente lassen sich in Form von Baumdiagrammen darstellen: Zu jedem der möglichen Ergebnisse des Zufallsversuch gehört ein so genannter Pfad im Baumdiagramm. Er beginnt an der Wurzel des Baumes, verläuft über die verschiedenen Verzweigungen und endet mit der letzten Stufe. Beispiel 3: Eine Münze wird geworfen. Es interessiert, ob die Zahl Z oder das Wappen W oben liegt. Die Erfahrung zeigt, dass für die Wahrscheinlichkeiten gilt: p( Z ) = p( W ) = 0,5 . Das Baumdiagramm für das dreistufige Experiment: „Wie hoch ist die Wahrscheinlichkeit, dass bei dreimaligem Wurf einer Münze zweimal Wappen und einmal Zahl erscheint“ hat das folgende Aussehen: 1. Wurf 2. Wurf 3. Wurf 1 2 Ergebnis W-keit p ⋅ 12 ⋅ 12 = 1 8 Z Z/Z/Z 1 2 W Z/Z/W 1 2 ⋅ 12 ⋅ 12 = 1 8 Z Z/W/Z 1 2 ⋅ 12 ⋅ 12 = 1 8 W Z/W/W 1 2 ⋅ 12 ⋅ 12 = 1 8 Z W/Z/Z 1 2 ⋅ 12 ⋅ 12 = 1 8 W W/Z/W 1 2 ⋅ 12 ⋅ 12 = 1 8 Z W/W/Z 1 2 ⋅ 12 ⋅ 12 = 1 8 W W/W/W 1 2 ⋅ 12 ⋅ 12 = 1 8 Z 1 2 1 2 Z 1 2 1 2 1 2 W 1 2 S 1 2 1 2 Z 1 2 1 2 W 1 2 1 2 W Abb.1: Dreifacher Münzwurf 1 2 Gelb eingefärbt wurden drei Pfade: Diese Wege müssen wir einschlagen, wenn wir die Wahrscheinlichkeit für „zweimal Wappen und einmal Zahl“ beim dreimaligen Werfen berechnen wollen. Einführung in die Wahrscheinlichkeitsrechnung 10 Längs der Pfade gilt die Produktregel: p( Z/W/W ) = p( W/Z/W ) = p( W/W/Z ) = 1⋅1⋅1 2 2 2 = 1 8 . Da wir hier drei Pfade, die für uns günstig sind, müssen wir diese addieren. Hier gilt für das Ereignis E: „zweimal Wappen und einmal Zahl“: E = { (Z/W/W), (W/Z/W), (W/W/Z)} und p( E ) = 1 8 + 1 8 + 1 8 = 3 8 . Beispiel 4: Beim „Mensch-ärgere-Dich-nicht“ dürfen wir bei einer „6“ starten. Dazu haben wir maximal drei Versuche. Wie groß ist die Wahrscheinlichkeit, dass der Start gelingt? Die Wahrscheinlichkeit beim ersten Wurf eine „6“ zu werfen beträgt 1/6. D.h. in 5/6 aller Fälle sind wir noch nicht fertig. In 1/6 der Würfe von diesen 5/6 schaffen wir es im zweiten Wurf eine „6“ zu werfen. 5 . Also können wir in 5/36 aller Fälle im zweiten Versuch starten, in 5/6 von 1/6 von 5/6 sind 61 ⋅ 56 = 36 den 5/6 die im ersten Versuch keine „6“ ergeben haben fällt auch im zweiten Versuch keine „6“, d.h. in 5⋅5 6 6 25 aller Fälle müssen wir es noch ein drittes Mal versuchen. Dabei gelingt es wahrscheinlich in = 36 1/6 dieser Fälle endlich eine „6“ zu werfen. 25 ⋅ 1 = 5 ⋅ 5 ⋅ 1 = 25 . Die Wahrscheinlichkeit im Dritten Versuch eine 6 zu werfen ist also: 36 6 6 6 6 216 Man beschreibt diesen Zufallsversuch ebenfalls durch ein dreistufiges Baumdiagramm (Abb.2). Die Wahrscheinlichkeit, dass wir überhaupt starten können, ist dann die Summe der Wahrscheinlichkeiten der drei Möglichkeiten eine „6“ zu werfen – also: 1 6 + 5 36 + 25 216 = 125 216 ≈ 0,42 ( = 42 %) . Einführung in die Wahrscheinlichkeitsrechnung 11 Merksatz Pfadaddition: Setzt sich bei einem mehrstufigen Zufallsversuch ein Ereignis aus den Ergebnissen verschiedener Pfade im Baumdiagramm zusammen, dann erhält man die Wahrscheinlichkeit des Ereignisses durch die Addition der Wahrscheinlichkeiten aller Pfade die zu dem Ereignis gehören. Pfadmultiplikation: Bei einem mehrstufigen Zufallsversuch ist die Wahrscheinlichkeit eines Ergebnisses (d.h. eines Pfades im Baumdiagramm) gleich dem Produkt der Wahrscheinlichkeiten entlang des zugehörigen Pfades im Baumdiagramm. Rechenkontrolle: Die Summe der Wahrscheinlichkeiten aller Pfade ist gleich 1! Allgemein verlangt man, dass das Ziehen von Kugeln aus einer Urne ein Laplace-Experiment ist. Bei jedem Zug muss also jede sich in der Urne befindende Kugel die gleiche Chance haben, gezogen zu werden. Der zugehörige Wahrscheinlichkeitsraum heißt dann Laplacescher Wahrscheinlichkeitsraum oder kurz: Laplace-Raum. Anmerkung: Bei vielen Glücksspielen stellt man geradezu die Forderung, dass alle möglichen Ergebnisse gleichwahrscheinlich sind. Durch strenge Bestimmungen wird z. B. beim Zahlenlotto die Gleichwahrscheinlichkeit aller Kugeln gefordert. Aufgaben 1. Ein „Glücksrad“ hat vier gleichgroße Felder. Eines davon ist das Gewinnfeld. Wie groß ist die Wahrscheinlichkeit, dass beim dreimaligen mindestens einmal ein Gewinn gedreht wird. 2. Peter trifft erfahrungsgemäß bei 85 % seiner Torschüsse vom Elfmeterpunkt. Wie groß ist die Wahrscheinlichkeit, dass er bei drei Versuchen mindestens einmal daneben schießt? 3. In einer Lostrommel sind 10 Gewinnlose und 30 Nieten. Wie groß ist die Wahrscheinlichkeit, dass man bei dreimaligem Ziehen mindestens ein Gewinnlos zieht? (nur Nieten zieht?) 4. Petra muss auf ihrem Weg zur Schule eine Bahnlinie überqueren und eine Ampel passieren. Erfahrungsgemäß ist an 25 % der Tage die Schranke geschlossen und an 40 % der Tage die Ampel rot. Wie groß ist die Wahrscheinlichkeit, dass sie an einem beliebigen Tag an keinem der beiden Hindernisse halten muss? Einführung in die Wahrscheinlichkeitsrechnung 12 5. Baumdiagramme und Vierfeldertafel In diesem Abschnitt geht es um den Zusammenhang zwischen der sogenannten Vierfeldertafel und den in der Wahrscheinlichkeitsrechnung eingeführten Baumdiagrammen. In Vierfeldertafeln wird die gemeinsame Häufigkeitsverteilung zweier Merkmale tabellarisch dargestellt wird. Betrachtet man zwei Merkmale oder Eigenschaften, mit jeweils nur zwei Kategorien (Merkmalsausprägungen), so kann man nicht nur die Häufigkeitstabelle für jede Variable einzeln erstellen, sondern auch eine gemeinsame Häufigkeitstabelle, in der die Häufigkeiten aller Kombinationen der Merkmalsausprägungen der beiden Variablen eingetragen werden. Dabei sind in den inneren vier Feldern jeweils die Häufigkeiten aller möglichen Merkmalskombinationen erfasst, das heißt die Häufigkeiten für das gleichzeitige Auftreten der beiden Kategorien (Merkmalsausprägungen) am Rand. Die Häufigkeiten können als absolute, aber auch als relative Häufigkeiten dargestellt werden. Zusätzlich zu den Häufigkeiten der Merkmalskombinationen werden am rechten und am unteren Rand der Vierfeldertafel die sog. Randsummen oder Randhäufigkeiten eingetragen, die den Häufigkeitstabellen der einzelnen Merkmalsausprägungen entsprechen. Für die Randsummen werden die vorher in den beiden Zellen der Zeile bzw. Spalte auftretenden Häufigkeiten addiert. Die Summe der Randsummen wiederum muss bei absoluten Häufigkeiten die Gesamtzahl der Beobachtungen n ergeben, bei relativen Häufigkeiten den Wert 1 bzw. 100 %. Merkmal B A H (A ∩ B ) nicht A (nA) Summe nicht B nicht B Summe Merkmal B H (A ∩ nB ) H (A ) A h (A ∩ B ) h (A ∩ nB ) h (A ) H (nA ∩ B ) H (nA ∩ nB ) H (nA ) nicht A h (nA ∩ B ) h (nA ∩ nB ) h (nA ) H (B ) H (nB ) n Summe h (B ) h (nB ) 1 (nB) (nA) (nB) Summe Einführung in die Wahrscheinlichkeitsrechnung 13 Beispiel: Ein Dönerladen verkauft an 200 Gäste Döner und Pizza. Betrachtet man auch das Geschlecht der Käufer als weiteres Merkmal, so ergibt sich folgende Verteilung: Merkmal Döner Pizza Summe Merkmal Döner Pizza Summe Frau 10 80 90 Frau 0,05 0,4 0,45 Mann 70 40 110 Mann 0,35 0,2 0,55 Summe 80 120 200 Summe 0,4 0,6 1 Nimmt man diese Verteilung als Erfahrungswert und damit als Grundlage für die Berechnung von Wahrscheinlichkeiten, so kann man erkennen, dass die Wahrscheinlichkeit dafür, dass ein zufälliger Käufer eine Frau ist, die eine Pizza kauft, genau 0,4 (also 40 %) beträgt. Die Wahrscheinlichkeit dafür, dass ein zufälliger Käufer ein Mann ist beträgt insgesamt 0,55 (d.h. 55 %). Bei der Vierfeldertafel werden bekanntlich alle Merkmalskombinationen gleichzeitig dargestellt. Betrachtet man nun in einer ersten Stufe zum Beispiel zunächst nur das Geschlecht des Käufers und dann in einer zweiten Stufe das gekaufte Produkt, so kann man den Sachverhalt in einem Baumdiagramm darstellen. Dazu kann man der Vierfeldertafel unmittelbar die Wahrscheinlichkeiten für das Geschlecht entnehmen. Die Wahrscheinlichkeiten für die Pfadenden (gleichzeitig Frau und Döner, gleichzeitig Frau und Pizza, …) können ebenfalls der Vierfeldertafel entnommen werden. Die Wahrscheinlichkeiten der zweiten Stufe fehlen. Sie können jedoch unter Berücksichtigung der Pfadmultiplikation bestimmt werden. So gilt zum Beispiel: P (Frau ∩ Döner ) = 0,45 ⋅ x = 0,05 ⇒ x = 0,05 1 = 0,45 9 . Die anderen fehlenden Wahrscheinlichkeiten können entsprechend ermittelt werden. Man erhält schließlich folgendes Baumdiagramm: Einführung in die Wahrscheinlichkeitsrechnung 14 Aufgaben 1. Erstellen Sie anhand der folgenden Vierfeldertafel das zugehörige Baumdiagramm. 2. Im dargestellten Baumdiagramm sind Informationen über Raucher/innen und Nichtraucher/innen enthalten. Rekonstruieren Sie die zum Baumdiagramm gehörende Vierfeldertafel. 3. 52,4% der 244600 Jugendlichen, die am Ende des Schuljahr 2000/2001 ihre Schule mit der allgemeinen Hochschulreife verließen, waren Frauen. In den neuen Bundesländern und Berlin lag dabei der Frauenanteil mit 59,1% deutlich höher als in den sogenannten alten Bundesländern (50,8%). Dies ergab folgendes Baumdiagramm: Aus der Grundgesamtheit aller Abiturientinnen und Abiturienten des betrachteten Jahrgangs werde eine Person zufällig ausgewählt. (1) Mit welcher Wahrscheinlichkeit stammt die diese Person aus Ostdeutschland? (2) Mit welcher Wahrscheinlichkeit ist die ausgewählte Person eine Frau? (3) Falls diese Person aus Ostdeutschland kommt: Mit welcher Wahrscheinlichkeit ist dies ein Mann? (4) Falls diese Person eine Frau ist: Mit welcher Wahrscheinlichkeit stammt sie aus Westdeutschland? Einführung in die Wahrscheinlichkeitsrechnung 15 6. Der Begriff der Bedingten Wahrscheinlichkeit Die bisher betrachtete Wahrscheinlichkeit p(E) darf nur dann als Maß für die Chance des Eintretens eines Ereignisses genutzt werden, wenn das Zufallsexperiment noch nicht begonnen hat oder über das laufende oder schon beendete Zufallsexperiment keine Information vorliegt. Sind jedoch Teilinformationen über den Ausgang des Zufallsexperimentes bekannt, so wissen wir, dass ein bestimmtes Ereignis eingetreten ist. Damit verändern sich aber die mögliche Ergebnismenge und eventuell manche Wahrscheinlichkeiten. Derartige vom Informationsstand abhängige Wahrscheinlichkeiten bezeichnen wir als bedingte Wahrscheinlichkeiten. Zur Illustration betrachten wir folgende Beispiele: Wenn wir wissen, dass ein Kunde eine Frau ist, mit welcher Wahrscheinlichkeit bestellt sie dann einen Döner? Wenn wir wissen, dass ein Döner bestellt wird, mit welcher Wahrscheinlichkeit hat die Dönerbude dann einen Mann als Kunden? Diese Fragestellungen sind nicht unmittelbar an den vier Feldern der Vierfeldertafel abzulesen, denn dort werden die Wahrscheinlichkeiten für das Gleichzeitige Auftreten von zwei Kategorien erfasst. Hier geht es jedoch darum, dass eine bestimmte (Vor-)Bedingung bereits bekannt ist und die Wahrscheinlichkeit unter eben dieser Bedingung gesucht ist. Dies sind nur zwei Beispiele von vielen. Solche Überlegungen und Zusammenhänge sind zum Beispiel in der Sozialforschung von Bedeutung. Es geht um die Wahrscheinlichkeit eines Ereignisses unter einer bestimmten Zusatzbedingung, d.h. oft hängt die Wahrscheinlichkeit für das Eintreten eines bestimmten Ereignisses vom Eintreten eines anderen ab. Zur Berechnung von bedingten Wahrscheinlichkeiten werden bekannte Teilinformationen über den Versuchsausgang berücksichtigt. Unser Interesse gilt dabei insbesondere der Berechnung von Wahrscheinlichkeiten bei mehrstufigen Zufallsexperimenten. Stellt man diese zum Beispiel in einem Baumdiagramm dar, so wird jeweils das Eintreten der Ergebnisse der vorherigen Ebenen als Bedingung vorausgesetzt. Betrachtet man das Baumdiagramm aus dem vorherigen Kapitel, in dem die Verkaufssituation in der Dönerbude dargestellt wird, so können dort die Wahrscheinlichkeiten unter der Bedingung „Geschlecht“ abgelesen werden. Wenn wir wissen, dass ein Kunde eine Frau ist, so ist demnach die Wahrscheinlichkeit, dass sie dann einen Döner bestellt gleich 1 . (siehe unten) 9 Einführung in die Wahrscheinlichkeitsrechnung 16 Die Wahrscheinlichkeit dafür, dass ein Kunde einen Döner bestellt, wenn man weiß, dass er ein Mann ist, beträgt demnach 7 . 11 Wenn man nun aber weiß, dass zum Beispiel eine Pizza bestellt wurde und fragt nach der Wahrscheinlichkeit dafür, dass der betreffende Kunde ein Mann ist, so muss das Baumdiagramm anders aufgebaut werden. Dem obigen Baumdiagramm oder der zugehörigen Vierfeldertafel kann man entnehmen, dass insgesamt 40 % der Kunden Döner bestellen und entsprechend 60 % eine Pizza. Die Wahrscheinlichkeiten für das Gleichzeitige Auftreten (d.h. die Ergebnisse der einzelnen Pfade) bleiben natürlich erhalten. Die Wahrscheinlichkeit dafür, dass der Kunde ein Mann ist, unter der Bedingung, dass eine Pizza bestellt wurde, kann dann ermittelt werden indem man – entsprechend dem Rechengesetz der Pfadmultiplikation – die Wahrscheinlichkeit für das gleichzeitige Auftreten (s.o.) teilt durch die Wahrscheinlichkeit für die Bedingung „bestellt Pizza“ (s.o.). Somit ergibt sich hier folgende Wahrscheinlichkeit: 0,2 = 1 . 0,6 3 Mit diesen Überlegungen kann man folgendes Baumdiagramm erstellen: Einführung in die Wahrscheinlichkeitsrechnung 17 Die obigen Überlegungen werden zur Definition der bedingten Wahrscheinlichkeit genutzt. Sind A, B Ereignisse und ist p(B ) > 0 , so heißt der Quotient p B (A ) : = p(A ∩ B ) p(B ) die Wahrscheinlichkeit von A unter der Bedingung B. Aus der Definitionsgleichung für die bedingte Wahrscheinlichkeit ergibt sich die Wahrscheinlichkeit des Durchschnitts von A und B: p(A ∩ B ) = pB (A ) ⋅ p(B ). Diese einfache Umformung erhält ihre Bedeutung durch die Anwendung. In vielen Fällen ist pB (A ) gegeben bzw. leicht zu ermitteln und die Wahrscheinlichkeit des Durchschnitts gefragt. Andererseits interpretiert man in vielen Anwendungssituationen Beobachtungen und Messresultate als Ergebnisse von Zufallsexperimenten. Es geht dabei oft nicht darum, die Wahrscheinlichkeit eines Versuchsausgangs für ein gegebenes Zufallsexperiment anzugeben, sondern von einem Versuchsausgang auf die Natur des Zufallsexperiments rückzuschließen. Denken Sie etwa an zwei Krankheiten, die mit verschiedenen Wahrscheinlichkeiten zum gleichen Symptom führen. Man möchte natürlich wissen, auf welche der beiden Krankheiten das jeweilige Symptom zurückgeht! Oft kann man nicht mit Sicherheit sagen, welche Krankheit zugrunde lag. Können wir aber eine begründete Wahrscheinlichkeitsaussage darüber machen? Interessanterweise können wir mit dem uns zur Verfügung stehenden Wissen nicht einmal eine Wahrscheinlichkeitsaussage treffen, denn es fehlt uns noch ein Stück Information: die Wahrscheinlichkeiten zum Beispiel, mit denen die beiden Krankheiten in einer bestimmten Bevölkerungsgruppe auftreten. Kennt man diese Wahrscheinlichkeit, so ist zumindest eine begründete Wahrscheinlichkeitsaussage möglich. Man nennt solche Wahrscheinlichkeiten die Apriori-Wahrscheinlichkeiten. Ganz allgemein werden mit diesem Begriff Wahrscheinlichkeiten bezeichnet, aufgrund derer eines von mehreren Zufallsexperimenten bzw. ein bestimmtes Ergebnis eines Zufallsexperiment ausgewählt wird. Einführung in die Wahrscheinlichkeitsrechnung 18 7. Unabhängige Ereignisse In praktischen Beispielen tritt oft die Frage auf, ob sich durch das Eintreten eines Ereignisses B die Wahrscheinlichkeit für ein anderes Ereignis A ändert. Wenn dies nicht der Fall ist, wenn also durch das Eintreten von B die Wahrscheinlichkeit des Eintretens von A nicht beeinflusst wird, so sagt man, B ist von A unabhängig, andernfalls heißt B abhängig von A. Anschaulich kann man sagen: A ist von B unabhängig, wenn die bedingte Wahrscheinlichkeit pB (A ) gar nicht von der Bedingung abhängt. Zum Beispiel geht man davon aus, dass zwei Würfe eines Würfels voneinander unabhängig sind, da (in der Regel) das Ergebnis des zweiten Wurfs nicht vom Ergebnis des ersten Wurfs abhängt. Betrachtet man die bekannten „Urnenmodelle“ bei denen man unterscheidet zwischen „Ziehen mit Zurücklegen“ und „Ziehen ohne Zurücklegen“, so erhält man beim ersten Modell unabhängige Wahrscheinlichkeiten und beim zweiten Modell abhängige. Zieht man zum Beispiel aus einem Topf mit roten und grünen Kugeln und legt jede gezogene Kugel wieder zurück, so ist anschaulich sofort klar, dass hier bei jedem Zug die gleich Wahrscheinlichkeit auftritt. Wird die Kugel jedoch nicht zurückgelegt, so ergibt sich nach jedem Zug eine neue (andere) Wahrscheinlichkeit für das Ziehen einer bestimmten Farbe. Die Bedingungen für das Vorliegen von „stochastisch“ unabhängigen Ereignissen ergeben sich unmittelbar aus der Definition der bedingten Wahrscheinlichkeit. Zwei Ereignisse A und B – mit P(B) > 0 – heißen stochastisch unabhängig, wenn gilt: pB (A ) = p(A ) bzw. pA (B ) = p(B ) . Bemerkung: Man kann die Abhängigkeit von zwei Ereignissen nicht nur in einer Richtung betrachten, das heißt es gilt stets pB (A ) = p(A ) ⇔ pA (B ) = p(B ) . Die Umformung der Definitionsgleichung für die bedingte Wahrscheinlichkeit ergibt eine weitere Möglichkeit die Unabhängigkeit von Ereignissen zu Überprüfen. Zwei Ereignisse A und B – mit P(B) > 0 – heißen stochastisch unabhängig, wenn gilt: p(A ∩ B ) = p(A ) ⋅ p(B ). Einführung in die Wahrscheinlichkeitsrechnung 19 Hinweis 1: Die bedingte Wahrscheinlichkeit pB (A ) wird leicht mit der Wahrscheinlichkeit pB (A ∩ B ) des Durchschnitts verwechselt. Das kann u.a. daher kommen, dass man in A ∩ B das Ereignis „A unter der Bedingung B“ gefunden zu haben glaubt und davon die Wahrscheinlichkeit berechnet. Die Wahrscheinlichkeit p( A ∩ B ) gibt aber an, dass das Ereignis A und zugleich das Ereignis B eintritt. pB ( A ) hingegen ist die Wahrscheinlichkeit, dass das Ereignis A unter der (Vor-)Bedingung B eintritt. Hinweis 2: Die Unabhängigkeit ist nicht zu verwechseln mit der Unvereinbarkeit von Ereignissen! Während bei Unabhängigkeit von Ereignissen eine Produktregel für den Durchschnitt der Ereignisse A und B gilt p(A ∩ B ) = p(A ) ⋅ p(B ) , gilt bei der Unvereinbarkeit von zwei Ereignissen – d.h. p (A ∩ B ) = Ο / – eine Summenregel für die Vereinigung von A und B, nämlich p(A ∪ B ) = p(A ) + p(B ) . Dies zeigt, dass die stochastische Unabhängigkeit nicht als völlige Beziehungslosigkeit der beiden Ereignisse gedeutet werden darf. Es handelt sich lediglich um eine Unabhängigkeit im statistischen Sinn. Auch wenn man von Unabhängigkeit der Ereignisse spricht, so ist die Unabhängigkeit genau genommen keine Eigenschaft der Ereignisse, sondern eher eine Eigenschaft ihrer Wahrscheinlichkeiten. Einführung in die Wahrscheinlichkeitsrechnung 20 Aufgaben 1. Für einen Betriebsausflug an die Mosel soll ein Mitglied der Belegschaft als Organisator ausgelost werden. Die folgende Vierfeldertafel gibt Auskunft über die Weinkennerschaft der Mitarbeiterinnen und Mitarbeiter. Frauen Männer Gesamt Weinkenner 15 20 35 kein Weinkenner 16 29 45 Gesamt 31 49 80 a) Wie groß ist die Wahrscheinlichkeit, dass der Organisator der Fahrt ein Weinkenner ist? b) Wie große ist die Wahrscheinlichkeit, dass der Organisator Weinkenner ist, wenn bekannt ist, dass eine Frau ausgelost worden ist? 2. Paula würfelt mit Hilfe eines Knobelbechers gleichzeitig mit zwei Würfeln. Danach hebt sie den Becher so an, dass andere das Resultat nicht erkennen können, und teilt mit, dass (mindestens) ein Würfel die Augenzahl „4“ zeigt. Wie groß ist unter dieser Bedingung die Wahrscheinlichkeit, dass die Augensumme größer als neun ist? 3. Aus einer Urne mit zehn schwarzen und fünf weißen Kugeln werden zwei Kugeln ohne Zurücklegen gezogen. Wie groß ist die Wahrscheinlichkeit, eine weiße und eine schwarze Kugel zu ziehen? (Löse die Aufgabe auf zweierlei Arten: einmal mit der Formel zur Bestimmung der bedingten Wahrscheinlichkeit und einmal mit Hilfe eines Baumdiagramms.)