Grundlagen der Wahrscheinlichkeitsrechnung I. Wahrscheinlichkeit und relative Häufigkeit Beispiel: Ein herkömmlicher Würfel wird 10, 20, 30, 100 mal geworfen und die Augenzahl wird nach jedem Wurf notiert. So ergibt sich für jedes der 4 Experimente ein Datensatz der Länge 10, 20, 30 bzw. 100. Dieser Datensatz beinhaltet für jede mögliche Augenzahl die Information darüber, wie oft diese Zahl tatsächlich geworfen wurde. Für das erste Experiment könnte der Datensatz z.B. lauten: Wurf Zahl 1 3 2 1 3 6 4 6 5 4 6 1 7 3 8 3 9 2 10 2 Es lassen sich also die absoluten Häufigkeiten des Auftretens ablesen: H(1)=2, H(2)=2, H(3)=3, H(4)=1, H(5)=0, H(6)=2. Allgemein wird die absolute Häufigkeit, dass ein Ereignis E eintritt bzw. eingetreten ist mit H(E) bezeichnet. Aus den absoluten Häufigkeiten lassen sich die zugehörigen relativen Häufigkeiten ablesen, die eine prozentuale Angabe hinsichtlich des Auftretens bezogen auf die Grundgesamtheit (hier 10,20, 30 bzw. 100) ermöglichen: h(1)=2/10, h(2)=2/10, h(3)=3/10, h(4)=1/10, h(5)=0/10 und h(6)=2/10. Allgemein wird die relative Häufigkeit des Auftretens eines Ereignisses E mit h(E) bezeichnet. So lässt sich in unserem Versuch h(1)=2/10 ablesen und deuten als: in 2 von 10 Fällen wurde die Zahl 1 geworfen. Fragen: (1) (2) (3) (4) Ist das in der Tabelle aufgeführte Endergebnis universell ? Wovon hängt ein solches Ergebnis ab ? Wie lassen sich die relativen Häufigkeiten deuten ? Vor allem: Was ist zu h(5) zu sagen ? Lassen die relativen Häufigkeiten Aussagen für ein später erneut durchzuführendes Experiment zu ? (1) Jeder kennt es aus dem Alltag: Ein Würfel lässt sich nicht beherrschen, d.h. die Augenzahl lässt sich scheinbar nicht beeinflussen. Damit ist auch das 10malige Werfen eines solchen Würfels dem Zufall überlassen. (2) Im Prinzip scheint alles Zufall zu sein, aber eigentlich kennen wir es aus eigener Erfahrung, dass im Mittel (also im Durchschnitt) jede Augenzahl in etwa gleich oft vorkommt, wenn man nur ausreichend viele Würfe tätigt. Demnach hängt das Ergebnis eines solchen Zufallexperiments hauptsächlich vom Zufallsobjekt (hier Würfel) ab. (3) Die relativen Häufigkeiten geben eine Verteilung wieder. Die möglichen Ausgänge eines Zufallexperiments sind auf die gesamte Durchführung verteilt. Allerdings wissen wir selbst, dass beim Würfel in etwa eine Gleichverteilung herauskommen sollte (siehe (2)), also wundert uns das Ergebnis h(5)=0. (4) Wenn man davon ausgehen könnte, dass die relativen Häufigkeiten auf der Grundlage einer hohen Grundgesamtheit (etwa N=100 Würfe) berechnet worden sind, so geben sie einen mehr als deutlichen Hinweis auf das Ergebnis weiterer 100 Würfe, dass nämlich eine Wiederkehr dieser relativen Häufigkeiten zu erwarten sein wird. Konsequenz: Wenn die relativen Häufigkeiten bei einer großen Grundgesamtheit N die dem Zufallsexperiment entsprechende Verteilung der Versuchsausgänge stabil wiedergibt, kann man die relative Häufigkeit benutzen, um Aussagen für die Zukunft zu machen. Damit gerät der Zahlenwert in ein völlig neues Licht. Ist etwa h(2)=0,2, so heißt das eigentlich zunächst nur, dass im vergangenen Experiment in 20% aller Fälle die Zahl 2 vorgekommen ist. Ist diese Angabe allerdings auf einer großen Gesamtheit N begründet, so können wir davon ausgehen, dass in Zukunft auch in 20% aller Fälle eine 2 geworfen wird, selbst wenn wir nicht erneut 100 mal werfen. Wir deuten diese relative Häufigkeit als eine Wahrscheinlichkeit und sagen im konkreten Beispiel, dass die Wahrscheinlichkeit, in Zukunft bei einem Wurf die Zahl 2 zu werfen p=0,2 beträgt. Das p stammt aus dem Englischen: propability (Wahrscheinlichkeit). 1 Was bedeutet das aber konkret für einen Wurf in der Zukunft ? Es kann doch bei einem Wurf nur eine Zahl herauskommen ! Man müsste also 5 mal werfen, damit einmal die Zahl 2 geworfen wird. Hier erkennen wir spätestens, dass die Zahlenwerte aus der obigen Tabelle unmöglich stabil sein können. Die Grundgesamtheit ist viel zu klein. Eine relative Häufigkeit kann erst dann zur Wahrscheinlichkeit erhoben werden, wenn die Grundgesamtheit N sehr groß ist. Man spricht vom Gesetz der großen Zahlen: für sehr große N gilt h(E)=p(E). Fragen: (1) Wie kann man p(E) bestimmen, ohne 100 Versuche zu machen ? (2) Wie kann mit p(E) eine Vorhersage machen ? (3) Wie groß kann p(E) maximal sein ? (1) Mit dem Gesetz der großen Zahlen ermittelt man künstlich eine relative Häufigkeit, indem man sagt: Wie viele Ausgänge kann das Zufallsexperiment überhaupt haben (mögliche Fälle), in unserem Würfelbeispiel sind das sechs (es gibt 6 verschiedene Augenzahlen). Anschließend fragt man sich, wie viele Fälle es gibt, die zum Ereignis E gehören. Wenn man als E ansieht, dass die Zahl 2 geworfen werden soll, ist diese Anzahl der günstigen Fälle eins. Die Wahrscheinlichkeit, dass das Ereignis E (Wurf der Zahl 2) eintritt, ist dann der Quotient 1/6, also allgemein: E = Ereignis Æ Anzahl der günstigen Fälle p(E) = Anzahl der möglichen Fälle Definition: Ein Zufallsexperiment, bei dem für alle möglichen Wahrscheinlichkeiten der gleiche Zahlenwert gilt, nennt man Laplace-Experiment. (2) Wenn die Wahrscheinlichkeit p(E) berechnet ist und man vor hat, N mal das Zufallsexperiment durchzuführen, so wird gemäß der Bedeutung von p(E) als relative Häufigkeit (Æ Gesetz der großen Zahlen) die Anzahl der günstig im Sinne des Ereignisses E ausgehenden Versuche p(E)⋅ N sein. (3) Als relative Häufigkeit gibt p(E) immer einen Anteil von etwas an und kann daher nicht über 100% liegen, also ist maximal p(E)=1 möglich. Aufgaben: Die folgenden Beispiele ermöglichen einen tieferen Einblick in die neuen Begriffe: a) Als Würfel benutzt man eine vierseitige regelmäßige Pyramide, die mit den Augenzahlen 1,2,3 und 4 beschriftet ist (alle Flächen der Pyramide sind gleich groß). Die Flächen unter der 1 und 3 sind grün, die Fläche unter der 2 ist rot und die vierte Fläche ist wieder grün. • • • • Mit welcher Wahrscheinlichkeit werden die Zahlen 1,2,3 und 4 geworfen ? Mit welcher Wahrscheinlichkeit wird eine grüne, rote bzw. blaue Fläche geworfen ? Mit welcher Wahrscheinlichkeit wird eine grüne Fläche mit einer geraden Zahl geworfen ? Mit welcher Wahrscheinlichkeit wird eine gerade Zahl geworfen ? b) Ein Reißnagel wird geworfen. Nach dem Fall zu Boden kann er entweder auf der Seite liegen oder mit der Spitze nach oben. Handelt es sich bei diesem Zufallsexperiment um ein Laplace-Experiment ? Begründe ! c) Zwei herkömmliche Würfel mit 6 Augenzahlen werden gleichzeitig geworfen. • • Wie viele mögliche Fälle gibt es ? Welche Wahrscheinlichkeiten ergeben sich für die folgenden Ereignisse E ? o E1: 2 gerade Zahlen o E2: Pasch o E3: Summe ist gerade 2 II. Rechnen mit Wahrscheinlichkeiten Frage: Wie lautet die Wahrscheinlichkeit, bei einem ganz normalen Würfelwurf mit einem herkömmlichen Würfel eine gerade Zahl zu werfen ? Nach der bekannten Regel ist dies 3/6=1/2. Man kann dieses Ereignis aber auch in mehrere Teilereignisse zerlegen mit den jeweiligen Einzelwahrscheinlichkeiten p(2)=1/6, p(4)=1/6 und p(6)=1/6 . Aus diesen Einzelwahrscheinlichkeiten ergibt sich die eigentliche Wahrscheinlichkeit offensichtlich als Summe. Regel: 1) Für disjunkte Ereignisse (sich nicht überschneidende) gilt p( E1 ) + p( E 2 ) = p( E ) , wenn E aus E1 und E2 zusammengesetzt ist. 2) Wenn sich die Ereignisse E1 und E2 überschneiden, so gilt: p( E1 ) + p( E 2 ) − p( E1 und E 2 ) = p( E ) . 3) ganz klar ist das Gesetz zur komplementären Wahrscheinlichkeit: Wahrscheinlichkeit, dass E nicht eintritt: 1- p(E) 4) Gibt es insgesamt die disjunkten Ereignisse E1 bis Ek, so gilt p(E1) + ... + p(Ek) = 1. Beispiel: Zu 2): Aus dem Beispiel a) auf Seite 2 ergibt sich die Frage nach der Wahrscheinlichkeit, dass eine gerade Zahl oder eine grüne Fläche geworfen wird. Æ Æ Æ p(E1)=2/4 p(E2)=3/4 p(E1 und E2)=1/4 E1: E2: E1 und E2: Zahl ist gerade Fläche ist grün gerade Zahl auf grüner Fläche E1 oder E2: p(E) = p(E1) + p(E2) – p(E1 und E2) = 2/4 + 3/4 – 1/4 = 1 Regel: Die Zusammensetzung eines Ereignisses kann verbal als „oder“-Verknüpfung angesehen werden: E = E1 oder E2 und daher gelten für ODER-Ereignisse die obigen Regeln je nachdem, ob die Ereignisse disjunkt sind oder nicht. Aufgaben: In den beiden Aufgaben muss hauptsächlich über die Zusammensetzung des Ereignisses nachgedacht werden: a) In einem Gefäß befinden sich 100 gleichartige Kugeln, von 1 bis 100 nummeriert. Es wird jeweils eine Kugel gezogen. Bestimme die Wahrscheinlichkeit für die folgenden Ereignisse: I. die Zahl ist durch 8 oder durch 3 teilbar II. die Zahl ist durch 11 oder 4 teilbar III. die Zahl ist weder durch 8 noch durch 3 teilbar (Æ komplementär denken !) b) Ein herkömmlicher Würfel wird zweimal geworfen. Bestimme die Wahrscheinlichkeit für : Augensumme größer als 20 oder kleiner als 10 3 Problem: In der letzten Aufgabe ist ein mehrstufiges Experiment vorgekommen: erst wird der Würfel geworfen und dann noch einmal geworfen Æ zeitliche Reihenfolge. Beispiel: Darstellung eines solchen mehrstufigen Experiments durch einen Ereignisbaum, der im Beispiel des Werfens zweier Münzen (K(opf), Z(ahl)), von denen eine rot und die andere blau ist, so aussieht. Die rote wird zuerst geworfen. Die Zahlen an den Verbindungsstrecken sind die Wahrscheinlichkeiten des Auftretens des Ereignisses, zu dem die Verbindung führt. K 0,5 K 0,5 0,5 Z Beginn K 0,5 0,5 Z 0,5 Z Es gibt für dieses 2-stufige Experiment also 4 Ausgänge (KK, KZ, ZK, ZZ). Die erste Angabe (K oder Z) bezieht sich auf die rote Münze. Damit sind diese 4 Ausgänge alle voneinander zu unterscheiden und daher alle verschieden. Für jedes der vier Ereignisse ergibt sich die Wahrscheinlichkeit ¼, was sich auch durch die Multiplikation der einzelnen Wahrscheinlichkeiten für jede Stufe ergibt: ¼ = ½ ⋅ ½ . Regel: Pfadmultiplikationsregel Bei der Hintereinanderfolge mehrstufiger Ereignisse spricht man von einem Pfad. Im obigen Beispiel gibt es vier Pfade. Auf jedem Pfad sind die Ereignisse durch ein UND verknüpft: Es passiert zuerst das Eine UND dann das Andere. Für einen solchen Pfad mit den Ereignissen E1, E2, E3, ... ergibt sich die Gesamtwahrscheinlichkeit p(E1 und E2 und E3 ...) = p(E1)⋅ p(E2) ⋅ p(E3) … Pfadadditionsregel Die verschiedenen Pfade gelten als voneinander zu unterscheidende Gesamtereignisse, die durch das logische ODER verknüpft sind, so dass sich die Wahrscheinlichkeiten für die verschiedenen Pfade addieren (s. oben): p(Pfad1 oder Pfad2) = p(Pfad1) + p(Pfad2) Aufgabe: In einem Gefäß befinden sich 50 gleichartige Kugeln, davon 20 rote und 30 blaue. Es werden drei Kugeln gezogen. Bestimme die Wahrscheinlichkeit für das genannte Ereignis. Zeichne vorher das relevante Baumdiagramm. 3 Ziehungen mit Zurücklegen 3 Ziehungen ohne Zurücklegen a) Alle Kugeln sind blau b) Eine Kugel ist blau, zwei sind rot c) Alle Kugeln sind blau d) Eine Kugel ist blau, zwei sind rot 4 III. Ermitteln von Wahrscheinlichkeiten mit Hilfe von Zählstrategien Problem: Wenn die Grundgesamtheit zu groß ist oder wenn man nicht alle möglichen oder günstigen Fälle überblicken kann, braucht man klare Strategien, diese trotzdem zählen zu können, um die relevanten Möglichkeiten zu ermitteln. Man spricht hierbei von einem Problem der Kombinatorik. Die Notwendigkeit einer Zählstrategie ergibt sich vor allem bei mehrstufigen Experimenten. So ergibt sich etwa die Frage nach allen möglichen Ergebnissen, wenn man 6 aus 49 Zahlen zieht (Lotto). Dabei könnte man die gezogene Zahl wieder zurücklegen oder nicht. Beispiel: Lotto: Es werden nacheinander 6 Zahlen aus 49 verschiedenen ohne Zurücklegen gezogen: Bei der ersten Zahl hat man 49 Möglichkeiten, dann 48, usw. Es gibt also bei diesem 6-stufigen Experiment insgesamt 49⋅ 48⋅ 47⋅ 46⋅ 45⋅ 44 = 10068347000 Ergebnismöglichkeiten. Dabei ist es natürlich für den Gewinn egal, in welcher Reihenfolge die 6 Zahlen gezogen werden. Also überlegt man sich, in wie viele Reihenfolgen sich 6 Zahlen bringen lassen und dividiert anschließend durch diese Zahl. Diese Frage kommt der Frage gleich, auf wie viele verschiedene Möglichkeiten man die 6 Zahlen auf 6 Plätze verteilen kann: Der erste Platz kann mit 6 Zahlen besetzt werden, der zweite nur noch mit 5, usw.. Es gibt also für die Verteilung 6⋅ 5⋅ 4⋅ 3⋅ 2⋅ 1=720 Möglichkeiten. Zur Abkürzung schreibt man hierfür 6! (gelesen 6 Fakultät). Übersicht: Wie kann man eine Ziehung durchführen ? Gegeben ist ein Gefäß mit n beschrifteten Kugeln (1... n) und es werden nun k<n Kugeln gezogen. Es handelt sich also um ein k-stufiges Experiment. (1) Ziehen mit Zurücklegen Das k-stufige Experiment weist auf jeder Stufe die gleiche Wahrscheinlichkeit 1/n für das Ziehen einer bestimmten Kugel auf (dabei gilt diese Elementarwahrscheinlichkeit für jede der gleichartigen Kugeln). Es gibt also insgesamt nk Ziehungsergebnisse. (2) Ziehen ohne Zurücklegen mit Beachtung der Reihenfolge Das k-stufige Experiment verändert in jeder Stufe die Elementarwahrscheinlichkeit für das Ziehen einer bestimmten Kugel, denn die Kugelgesamtheit reduziert sich bei jeder Stufe um eine Kugel. Es gibt also insgesamt n⋅ (n-1)⋅ (n-2)⋅ ⋅⋅⋅ ⋅ (n-k+1) Ziehungsergebnisse. Mit der abkürzenden Schreibweise der Fakultät lässt sich dieser Ausdruck schreiben als: n! . (n − k )! (3) Ziehen ohne Zurücklegen ohne Beachtung der Reihenfolge Dieses k-stufige Experiment beinhaltet alles von (2) und zusätzlich ein Sortieren der gezogenen k Kugeln gemäß ihrer Aufschrift. Die gezogenen Kugeln können k! verschiedene Reihenfolgen aufweisen, die nun unbeachtet bleiben sollen. Es zählt lediglich die Nummer auf der Kugel. Es wird also eine Reihenfolge (nämlich die entsprechend der Nummer) festgelegt. Es gibt also dabei insgesamt n ⋅ (n − 1) ⋅ (n − 2) ⋅ ⋅ ⋅ ⋅ (n − k + 1) n! . Ziehungsergeb= k! k!⋅(n − k )! nisse. Dieser Ausdruck wird als Binomialkoeffizient bezeichnet und abgekürzt als ⎛n⎞ n! ⎜⎜ ⎟⎟ = geschrieben (gelesen: n über k). Die damit gemeinte Zahl gibt an, wie viele ⎝ k ⎠ k!⋅(n − k )! Endergebnisse möglich sind, wenn man k bis auf die Beschriftung gleiche Elemente aus n zieht und die Reihenfolge außer Acht lässt. 5 IV. Bedingte Wahrscheinlichkeit – Satz von Bayes Beispiel: Es werden 1 000 000 Personen einem medizinischen Test unterzogen, der auf eine bestimmte Krankheit ausgerichtet ist. Aus anderer Quelle ist bekannt, dass 1/1000 der Bevölkerung unter der Krankheit leidet. Vom Test ist bekannt, dass er in 96% aller Fälle richtig erkennt, dass eine Krankheit vorliegt und dass er in 98% aller Fälle richtig erkennt, dass die Person nicht erkrankt ist. Was kann passieren ? Der Test wird bei einigen Personen die Krankheit feststellen (positives Testergebnis) und damit Recht haben, es wird aber auch vorkommen, dass der Test positiv ist, obwohl die Krankheit gar nicht vorliegt. Ereignisbaum, bei dem die zweite Stufe abhängig von der ersten erfolgt (das war bisher nicht so): 1 000 000 (krank) 1/1000 999 /1000 (gesund) 1000 (pos.) 999000 96 4 /100 960 /100 (neg.) 2 (pos.) /100 98 /100 (neg.) 40 19980 979020 krank krank gesund gesund & pos. & neg. & pos. & neg. Wir führen folgende Bezeichnungen ein : Hypothesen: H1 = Person ist krank Testergebnis: D = positiv H2 = Person ist gesund D’ = negativ Mit diesen Bezeichnungen ergeben sich die vier Ereignisse mit den zugehörigen Wahrscheinlichkeiten: p(H1 und D) = p(H1 und D’)= p(H2 und D) = p(H2 und D’)= /1000 ⋅ /1000 ⋅ 999 /1000 ⋅ 999 /1000 ⋅ 1 96 1 4 /100 /100 /100 98 /100 2 = 0,00096 = 0,00004 = 0,01998 = 0,97902 Diese Wahrscheinlichkeiten sind bedingte Wahrscheinlichkeiten, denn sie geben Informationen über das Eintreten eines Ereignisses unter einer gewissen Bedingung, die man am besten im Baumdiagramm ablesen kann: z.B. 98/100 ist die Wahrscheinlichkeit, dass der Test negativ ist unter der Bedingung, dass die Person gesund ist, geschrieben : p(D’ | H2) = 98/100 Allgemein: p( A | B) ist die Wahrscheinlichkeit für das Eintreten von Ereignis A unter der Bedingung (Voraussetzung), dass das Ereignis B eintritt. Nach der Pfadmultiplikationsregel ergibt sich in unserem Beispiel : p(H1 und D) = p(H1) ⋅ p(D | H1) = 0,00096 p(H1 und D’) = p(H1) ⋅ p(D’ | H1) = 0,00004 p(H2 und D) = p(H2) ⋅ p(D | H2) = 0,01998 p(H2 und D’) = p(H2) ⋅ p(D’ | H2) = 0,97902 6 Bayes-Regel: Im Fall des obigen Beispiels (Test auf Krankheit) ist eigentlich eine bedingte Wahrscheinlichkeit vom Typ p(H1 | D) interessant, da sie eine Aussage darüber macht, inwiefern man davon ausgehen kann, dass der Test bei einem Kranken auch tatsächlich positiv ist. Man denke an eine eventuelle Fehldiagnostik und deren Folgen in der Behandlung mit Medikamenten. Wenn man die hier auftretende bedingte Wahrscheinlichkeit mit den bedingten Wahrscheinlichkeiten vergleicht, die direkt im Ereignisbaum auftreten, so erkennt man, dass die Reihenfolge vertauscht ist. Dies beinhaltet ein Problem: Die im Ereignisbaum auftretenden Wahrscheinlichkeiten ergeben sich direkt aus dem Sachverhalt und dessen Zusammenhang, aber die gewünschte bedingte Wahrscheinlichkeit nicht. Dafür gibt es die Bayes-Regel für bedingte Wahrscheinlichkeiten: Wir halten uns zur Herleitung dieser Regel an das Beispiel p(H1 | D). Aus den Zahlen des Baumes erkennen wir mittels der Grundregel zur Ermittlung von Wahrscheinlichkeiten: p ( H 1 | D) = p ( H 1 und D) günstig 960 = = möglich 960 + 19980 p( H 1 und D) + p( H 2 und D) Wenn man nun noch die Ergebnisse vom Ende der vorigen Seite benutzt, ergibt sich die Regel: p ( H 1 | D) = allgemein: p( H 1 und D) p( H 1 ) ⋅ p( D | H 1 ) = p( H 1 und D) + p( H 2 und D) p( H 1 ) ⋅ p( D | H 1 ) + p( H 2 ) ⋅ p( D | H 2 ) p( A | B) = p( A und B) p ( A) ⋅ p ( B | A) oder p ( A | B) = p( B) p( B) Diese Regel ist kürzer als die darüber stehende Formel. Das liegt daran, dass darüber ein Beispiel gerechnet wurde. Die Wahrscheinlichkiet p(B) im Nenner beinhaltet alle möglichen Fälle des Auftretens des Ereignisses B, die gemäß der Pfadadditionsregel zueinander addiert werden müssen. Aufgaben: Mit der Bayes-Regel lassen sich „verstrickte“ Wahrscheinlichkeitsprobleme berechnen, bei denen die Ereignisse nicht unabhängig voneinander auftreten. a) Ein Gerät ist in 8,8% aller Fälle unbrauchbar. Um diese unbrauchbaren Geräte auszusortieren, wird eine Maschine zur Überprüfung eingesetzt. Diese arbeitet mit 96% Sicherheit, d.h. sie findet in 96% aller Fälle das richtige (intakt oder defekt) heraus. i. Mit welcher Wahrscheinlichkeit wird ein Gerät ausgesondert ? ii. Mit welcher Wahrscheinlichkeit ist ein ausgesondertes Gerät unbrauchbar ? b) Von den Mitgliedern einer Krankenkasse wohnen im Schnitt 70% auf dem Land. Im Kalenderjahr 1998 nahmen 46% die Kasse in Anspruch, darunter waren 28% Landbewohner. i. Zeichne ein Baumdiagramm und beschrifte es so weit wie möglich. ii. Mit welcher Wahrscheinlichkeit ist ein Krankenkassenmitglied, das die Kasse in Anspruch nimmt, Landbewohner ? iii. Mit welcher Wahrscheinlichkeit wird die Kasse von einem „Städter“ in Anspruch genommen ? 7 V. Zufallsgrößen, Verteilungen, Erwartungswert Beispiel: Zwei Würfel werden gleichzeitig geworfen. Die Augenzahlen werden zusammengezählt und die Summe notiert. Mit welcher Wahrscheinlichkeit tritt eine der Summen 2,3 4, ... 12 auf ? Augensumme 2 3 4 5 6 7 8 9 10 11 12 Ereignis p (1,1) (1,2) ; (2,1) (1,3) ; (2,2) ; (3,1) (1,4) ; (2,3) ; (3,2) ; (4,1) (1,5) ; (2,4) ; (3,3) ; (4,2) ; (5,1) (1,6) ; (2,5) ; (3,4) ; (4,3) ; (5,2) ; (6,1) (2,6) ; (3,5) ; (4,4) ; (5,3) ; (6,2) (3,6) ; (4,5) ; (5,4) ; (6,3) (4,6) ; (5,5) ; (6,4) (5,6) ; (6,5) (6,6) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 Für die verschiedenen Ausgänge des Spiels gibt es also verschiedene Wahrscheinlichkeiten, d.h. dieses Experiment ist nicht gleich verteilt. Um genau zu sagen, was hier nicht gleich verteilt oder was hier überhaupt verteilt wird, muss man eine Zufallsgröße einführen: Definition: Jedem Ausgang in einem Zufallsexperiment wird eine Zufallsgröße X zugeordnet. Im Beispiel ist X die Augensumme. Jedem Wert X ist damit insbesondere eine Wahrscheinlichkeit p(X) zugeordnet. Im obigen Beispiel ist z.B. p(X=5)=4/36. Unter einer Verteilung versteht man dann eine Wahrscheinlichkeitsverteilung, d.h. die Zuordnung XÆp(X). Eine Zufallsgröße ist gleichverteilt, wenn für alle X die Wahrscheinlichkeit gleich ist. Im allgemeinen ist sie nicht gleichverteilt. Frage: Was kann man mit einer bekannten Verteilung für eine Zufallsgröße X machen ? Welche Aussagen kann man aus dieser Verteilung ableiten ? Um diese Fragen zu klären, erweitern wir das obige Beispiel zu einem Glücksspiel mit Gewinn. Bei jeder geraden Augensumme wird 1 € ausgezahlt, sonst müssen 50 Cent in die Spielkasse eingezahlt werden. Welchen Gewinn wird der Spieler voraussichtlich erzielen ? Das führt auf den Begriff des Erwartungswertes einer Zufallsgröße. Die hierbei relevante Zufallsgröße X ist jetzt der Gewinn (kann auch ein negativer Gewinn sein = Verlust). Im Fall des Beispiels wird der Spieler sicherlich so überlegen: Da die einzelnen Wahrscheinlichkeiten bekannt sind, erwartet man das Eintreten der verschiedenen Fälle gemäß dieser Wahrscheinlichkeiten. Mit welcher Wahrscheinlichkeit wird man also 1 € gewinnen ? + 1 €: - 50 Cent: 1/36 + 3/36 + 5/36 + 5/36 + 3/36 + 1/36 = 18/36 = ½ 2/36 + 4/36 + 6/36 + 4/36 + 2/36 = ½ Der Spieler wird in der Hälfte der Fälle 1 € gewinnen und in der anderen Hälfte der Fälle 50 Cent verlieren also wird er einen Gewinn von 50 Cent zu erwarten haben: Definition: Aus dem Beispiel können wir ein Gesetz zur Bestimmung des Erwartungswertes ableiten. Gegeben ist dabei die Zufallsgröße X mit ihrer Wahrscheinlichkeitsverteilung p(X). Die Zufallsgröße habe dabei die möglichen Werte X=a1 ... X=an. Die Einzelwahrscheinlichkeiten p(X=ai) sind bekannt. Unter dem Erwartungswert E(X) versteht man dann (E(X) wird auch oft als µ bezeichnet): E(X) = a1 ⋅ p(X=a1) + a2 ⋅ p(X=a2) + … + an ⋅ p(X= an) 8 Aufgaben: zu Erwartungswerten: a) Bei einem Klassenfest muss jeder der 25 Teilnehmer ein Los kaufen. Der erste Preis hat einen Wert von 15 €, der zweite von 10 € und der dritte von 4 €. Außerdem gibt es für alle anderen Trostpreise im Wert von je 50 Cent. Was müsste ein Los kosten, damit Einnahmen und Ausgaben einander ausgleichen ? b) In einer Lostrommel befinden sich 20% Gewinne und 80% Nieten. Jemand will so lange ein Los kaufen, bis er gewinnt, aber höchstens 5 mal. Mit welcher Ausgabe muss er rechnen, wenn ein Los 2€ kostet ? VI. Bernoulli-Experiment, Binomial- Verteilung Beispiel: In diesem Abschnitt wird die Wahrscheinlichkeitsverteilung eines mehrstufigen Experiments mit jeweils 2 möglichen Ausgängen in jeder Stufe untersucht, bei denen sich die Elementarwahrscheinlichkeiten von Stufe zu Stufe nicht ändern (mehrstufiges Bernoulliexperiment). Eine gezinkte Münze wird 3 mal hintereinander geworfen. Kopf gilt als Erfolg und die Erfolgswahrscheinlichkeit ist p=2/3 . Die Misserfolgswahrscheinlichkeit ist also q=1/3. Als Zufallsgröße X wählen wir die Anzahl der Erfolge beim 3-maligen Wurf (3-stufiges Experiment). Von Seite 5 wissen wir, dass man die Anzahl aller Möglichkeiten, bei denen k Erfolge auftreten ⎛ 3⎞ mit ⎜⎜ ⎟⎟ berechnen können. Jeder dieser Möglichkeit entspricht ein Pfad im Ereignisbaum. Nach k ⎝ ⎠ der Pfadmultiplikationsregel ergibt sich für jeden dieser Pfade die Gesamtwahrscheinlichkeit ⎛ 3⎞ pkq3-k und für alle möglichen Fälle ergibt sich nach der Pfadadditionsregel p(X=k)= ⎜⎜ ⎟⎟ ⋅ pkq3-k. k ⎝ ⎠ Definition: Bei einem n-stufigen Bernoulliexperiment, bei dem es auf jeder Stufe nur zwei möglich Ausgänge gibt, von denen einer zum Erfolg erhoben wird, und bei dem es zu k Erfolgen kommen soll, gilt für diesen Fall (k Erfolge) die Binomialverteilung für die zugehörige Wahrscheinlichkeit p(X=k): ⎛n⎞ ⎛n⎞ p ( X = k ) = ⎜⎜ ⎟⎟ p k q n − k = ⎜⎜ ⎟⎟ p k (1 − p ) n − k ⎝k ⎠ ⎝k ⎠ Aufgaben: Benutze die Binomialverteilung: a) Bei einem Mensch-ärgere-dich-nicht-Spiel nehmen 4 Personen teil. Mit welcher Wahrscheinlichkeit hat keiner von ihnen in der 1. Runde Erfolg (d.h. keiner würfelt eine 6) ? b) Fünf Münzen werden gleichzeitig geworfen. Interpretiere den Versuch als Bernoulli-Versuch. Mit welcher Wahrscheinlichkeit fällt 3 mal Wappen ? c) Eine Münze wird 5 mal geworfen. Die Zufallsgröße X ist Anzahl der Wappen. Mit welcher Wahrscheinlichkeit wirft man i. höchstens 3 mal Wappen ? ii. mindestens 1 mal Wappen ? 9