Statistik mit Excel für Praktiker: Statistiken aufbereiten und präsentieren HORST-DIETER RADKE KAPITEL 3 Grundlagen der Wahrscheinlichkeitsrechnung Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Wahrscheinlichkeitsrechnung und Excel Vielleicht irritiert es Sie mehrfach, dass das Thema Wahrscheinlichkeitsrechnung in diesem Buch behandelt wird. Einmal hört sich der Begriff schon so an, als hätte er nichts mit der exakten Wissenschaft der Statistik zu tun. Dann erscheint es auch fragwürdig, ob mit Wahrscheinlichkeiten überhaupt (im Sinne der Mathematik) gerechnet werden kann. Und was Excel damit zu tun hat, ist sowieso unklar (wenn man einmal von der Fragestellung „Hoffentlich stürzt mir Excel nicht wieder mitten in der Arbeit ab“ absieht. Tatsächlich ist die Wahrscheinlichkeitsrechnung kein unwesentlicher Bereich der Statistik. Da oftmals nicht mit kompletten Grundgesamtheiten, sondern mit Auszügen daraus (so genannten Stichproben) gearbeitet wird, ist die Frage nach der Wahrscheinlichkeit der erlangten Aussagen unbedingt zu stellen. In der Mathematik ist der Bereich der Wahrscheinlichkeitsrechnung unter dem Begriff Stochastik eingeordnet, also eine über die Statistik hinausgehende Sache. In diesem Kapitel beschäftigen wir uns mit den Grundlagen der Wahrscheinlichkeitsrechnung, und zwar in dem Maße, in dem diese mit Excel dargestellt werden kann. Das Kapitel fällt also knapper aus, als Sie es in manchen anderen Statistiklehrbüchern finden. Das folgende Kapitel handelt von der Normalverteilung und hat damit auch etwas mit der Wahrscheinlichkeitsrechnung zu tun – doch damit greife ich vor. Beschäftigen wir uns zuvor lieber etwas damit, was Wahrscheinlichkeiten sind. Wie wahrscheinlich ein Ereignis ist hängt davon ab, mit welcher Sicherheit dieses zu erwarten ist. Ausgedrückt wird das (in der Wahrscheinlichkeitsrechnung) immer durch eine Zahl oder einen Prozentwert. Je stärker die Zahl gegen 1 oder 100% geht, umso wahrscheinlicher ist es, dass das Ereignis eintritt und je stärker es gegen 0 oder 0% geht, umso unwahrscheinlicher ist das Eintreten des Ereignisses. Die Berechnung einer Wahrscheinlichkeit geht eigentlich auf eine reine Addition zurück (lassen Sie sich nicht irritieren, nur weil die Formeln komplizierter aussehen!). Die Summe aller Wahrscheinlichkeiten sämtlicher möglicher Ereignisse gibt immer 1 oder 100%. 118 Kombinieren und Wiederholen Kombinieren und Wiederholen Die Kombinatorik als Teilgebiet der Mathematik wird auch der Statistik zugerechnet. Zumindest deren Methoden werden auch in der Wahrscheinlichkeitsrechnung immer wieder eingesetzt. Deshalb vorweg einiges zu diesem Thema. Kombinatorische Fragestellungen Kombinatorik beschäftigt sich mit der Anordnung verschiedener Dinge. Das können Buchstaben, aber auch Gegenstände oder Experimente sein. Typische Fragestellungen sind: Wie viele Möglichkeiten gibt es, Paare (2) aus einer Gruppe von Personen (z.B. 8) zusammenzustellen? Wie viele Möglichkeiten gibt es, aus einer Gruppe von 49 Zahlen 6 Zahlen auszuwählen? Die Kombination an einem Banksafe besteht aus vier Zahlenscheiben mit jeweils den Ziffern 0–9. Wie viel Möglichkeiten muss ein Bankräuber durchprobieren, wenn er den Safe ohne Gewalt öffnen will. Viele Probleme aus der Kombinatorik können auf zwei grundsätzliche Fragen zurückgeführt werden: 1. Auf wie viele Arten lassen sich die Elemente einer Menge (M) hinsichtlich einer vorgegebenen Eigenschaft anordnen. 2. Wie viele verschiedene Teilmengen (Auswahlen von k Elementen) aus einer Grundmenge M gibt es? Permutationen Jede Zusammenstellung einer endlichen Anzahl von Elementen in irgendeiner Anordnung, in der sämtliche Elemente verwendet werden, heißt Permutation der gegebenen Elemente. Eigentlich haben wir mit so etws im täglichen Leben ständig zu tun. 119 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Permutationen ohne Wiederholung Beispiel: Bei einem Schwimmwettbewerb werden die 6 Bahnen unter den 6 Teilnehmern des Wettkampfes ausgelost. Dazu werden aus einer Urne die Namenszettel gezogen. Dabei ergeben sich folgende Möglichkeiten für die einzelnen Bahnen: 1. Bahn: Jeder Schwimmer ist noch an der Ziehung beteiligt -> 6 Möglichkeiten. 2. Bahn: Nur noch 5 Schwimmer sind an der Ziehung beteiligt -> 5 Möglichkeiten. 3. Bahn: 4 Schwimmer -> 4 Möglichkeiten. 4. Bahn: 3 Schwimmer -> 3 Möglichkeiten. 5. Bahn: 2 Schwimmer -> 2 Möglichkeiten. 6. Bahn: 1 Schwimmer -> 1 Möglichkeit. Jede Möglichkeit kann mit einer anderen kombiniert werden. So ergeben sich 6 * 5 * 4 * 3 * 2 * 1 = 720 Zuordnungsmöglichkeiten. Jede dieser einzelnen Möglichkeiten bezeichnet man als Permutation oder auch als 6-Tupel. Als Formel ausgedrückt sieht das so aus: P (n ) = n ! = n * (n −1) * (n − 2) 3 * 2 * 1 Jede dieser Permutationen unterscheidet sich in der Reihenfolge ihrer Elemente von den anderen Permutationen (bzw. n-Tupel). Sicher ist Ihnen schon das n mit dem Ausrufezeichen (!) aufgefallen. Man bezeichnet diese Kombination in der Mathematik als Fakultät. Dabei werden alle Elemente der Liste miteinander multipliziert. Das ist also genau das, was wir zuvor im Beispiel beschrieben haben (und was die Formel ausdrückt). 120 Kombinieren und Wiederholen Excel und die Fakultät Excel hat in der Sammlung der statistischen Funktionen auch einige zur so genannten Wahrscheinlichkeitsrechnung. Zur Berechnung von Permutationen wird die Funktion FAKULTÄT eingesetzt: =FAKULTÄT(Zahl) Abbildung 3.1: Fakultät berechnet Excel über eine spezielle mathematische Funktion. Sie finden diese Funktion allerdings nicht bei den statistischen, sondern bei den mathematischen Funktionen, wo sie auch korrekt eingeordnet ist. Achtung Anwender der Version Microsoft office:mac 2004 finden die Funktion womöglich gar nicht. Microsoft hat bei der Übersetzung geschlampt und die englische Bezeichnung FACT belassen. Sie funktioniert aber ansonsten wie in diesem Kapitel beschrieben. 121 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Abbildung 3.2: Da wurde nicht ganz sauber gearbeitet: FACT ist FAKULTÄT In den Windows-Versionen zeigt der Funktions-Assistent die Funktion FAKULTÄT korrekt an. Abbildung 3.3: So sollte es sein 122 Kombinieren und Wiederholen Prüfen Sie die Funktion FAKULTÄT anhand einer einfachen Reihe; die ist schnell eingegeben und die Funktion mit dem Assistenten schnell hinzugefügt. Über die Funktion AutoAusfüllen haben Sie die Reihe mit der Funktion schnell ergänzt. Abbildung 3.4: FACT funktioniert also wie FAKULTÄT Sie sehen an der obigen Beispieltabelle auch, dass die Fakultät zu null (0!) mit 1 gesetzt wird. Auch andere Fragestellungen lassen sich leicht aus solch einer Tabelle beantworten. Wie viel Kombinationen der Buchstaben aus dem Wort WALD gibt es? Richtig! 24. Muss ja nur aus der Tabelle abgelesen werden. Etwas schwieriger ist es schon, diese Kombinationen alle aufzuschreiben. In diesem Beispiel kommt kein Buchstabe mehrfach vor. Permutationen mit Wiederholung Verändern wir das Wort WALD zu WALL, so ergibt sich das Problem, dass wir einen Buchstaben zweimal haben – das L. Zunächst einmal scheint es so, als ergäben sich ebenfalls 24 Kombinationsmöglichkeiten. Wenn Sie aber diese Permutationen beginnen aufzuschreiben, werden Sie schnell feststellen, dass einige Worte doppelt vorkommen. Wenn Sie die beiden letzten Buchstaben vertauschen (L mit L), so ergibt sich zwar eine erkennbare neue Kombination, wenn Sie die gleichen Buchstaben indizieren (WAL1L2) – aber ohne diese Indizierung ist kein Unterschied erkennbar. 123 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Da zwei Elemente gerade zwei Anordnungen bilden können, sind jeweils zwei Buchstabenkombinationen identisch. Somit erhält man lediglich 12 verschiedene Wortkombinationen. Für eine Grundmenge M mit n Elementen, unter denen einige mehrfach vorkommen (z.B. a gleich der 1. Sorte, b gleich der 2. Sorte), ist die Gesamtanzahl der verschiedenen Permutationen mit Wiederholung: P (n / a , b ) = n! a !* b ! Auf das Beispiel bezogen bedeutet dies: 4! = 12 2! Variationen In der Musik sind sie bis heute beliebt, die Variationen über ein bestimmtes Thema. Die Freiheit, die der Komponist und/oder der Interpret dabei genießen, haben Mathematiker und Statistiker nicht. Variationen ohne Wiederholung In unserem eingangs aufgeführten Beispiel für den Schwimmwettbewerb wurde zunächst nur überlegt, wie viel Möglichkeiten es für die Belegung der einzelnen Bahnen gibt. Nun ist aber auch die Überlegung angebracht, wie viel Möglichkeiten es für die Belegung der ersten drei Plätze gibt. Inzwischen sind Sie schon gewieft im kombinatorischen Denken und rechnen schnell: Für die Vergabe des ersten Platzes gibt es genau 6 Möglichkeiten. Für die Vergabe des zweiten Platzes gibt es nur noch 5 Möglichkeiten (einer der Teilnehmer belegt ja schon Platz 1 und steht für den 2. Platz nicht mehr zur Verfügung). Für die Vergabe des dritten Platzes gibt es jetzt nur noch 4 Möglichkeiten. Die Teilnehmer, die Platz 1 und 2 belegen, dürfen ja nicht mehr mitgerechnet werden. 124 Kombinieren und Wiederholen So ergeben sich also 6 * 5 * 4 = 120 mögliche Gruppierungen. Die Fragestellung ist also: Wie viele Möglichkeiten gibt es, aus einer Menge (M) mit n Elementen Teilmengen mit je k Elementen unter Berücksichtigung der Anordnung zu ziehen? Jede gefundene Auswahl ist eine Variation zur Klasse k (bzw. k-ter Ordnung). Die Anzahl der Variationen von n Elementen zur Klasse k beträgt also: V (n, k ) = n * (n −1) * (n − 2)…(n − k +1) Auf das Beispiel bezogen gilt n = 6, k = 3: V (6,3) = 6 * 5 * 4 = 120 n=6 (n-1) = (6-1) = 5 (n-k+1) = (6-3+1) = 4 Variationen mit Excel Excel kennt eine Funktion VARIATIONEN (in der Funktionskategorie Statistik), die Sie für die Berechnung von Variationen ohne Wiederholung verwenden können. Verwechseln Sie diese aber nicht mit der Funktion VARIATION, die zur Trendberechnung eingesetzt wird. Abbildung 3.5: Nicht verwechseln mit VARIATION! 125 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Die Funktion VARIATIONEN verlangt die Eingabe zweier Parameter: N für die Anzahl aller Elemente und K für die Anzahl der Elemente, aus denen die Variationsmöglichkeit bestehen soll. Dabei ist Folgendes zu berücksichtigen: N und K müssen numerische Ausdrücke sein, sonst wird der Fehlerwert #WERT! zurückgegeben. Ist N £ 0 oder K < 0 oder N < K, so wird der Fehlerwert #ZAHL! zurückgegeben. Abbildung 3.6: VARIATIONEN ermittelt zuverlässig das Ergebnis Tipp Sie müssen noch nicht einmal die Funktion in die Tabelle schreiben. Sie öffnen über Einfügen/Funktionen einfach den Funktions-Assistenten, wählen die Funktion VARIATIONEN und geben in den Dialog die Werte für die beiden Parameter ein. Das Ergebnis können Sie sofort im Dialog ablesen. Die Gleichung, mit der Excel diese Funktion berechnet, lautet allerdings: Pk ,n = n! (n − k )! und unterscheidet sich damit von der zuerst in diesem Kapitelabschnitt aufgestellten Funktion zumindest optisch. Dass Microsoft P schreibt (und damit wahrscheinlich Permutation meint), soll uns nicht weiter stören. Die Gleichung selbst kann mit 126 Kombinieren und Wiederholen etwas Mühe in die zuvor aufgeführte Gleichung ein paar Abschnitte zuvor umgewandelt werden. Aber wozu die Mühe? Sie finden beide Gleichungen in diversen Lehrbüchern und Excel rechnet korrekt. Wenden Sie sich lieber der Anwendung zu. Die Zocker unter den Lesern werden sicher schon spekuliert haben, was mit dieser Funktion noch alles angestellt werden kann. Gehen Sie einmal zurück zu den kombinatorischen Fragestellungen, dann werden Sie es wissen. Genau, Sie geben für N die 49 und für K die 6 ein und erhalten die Möglichkeiten der Kombinationen, die Sie auf einem Lottoschein ankreuzen können. Es sind über 10 Milliarden! Wenn Sie jetzt jede mögliche Kombination ankreuzen und alle Scheine zu Ihrer Lottoannahmestelle tragen (na, tragen wird wohl nicht gehen, einen Sattelschlepper werden Sie wohl benötigen!), dann zahlen Sie für den Einsatz ein Vielfaches dessen, was Sie gewinnen werden, selbst wenn es einen Jackpot zu knacken gibt. Wenn Sie als mathematisch und statistisch vorbelasteter Leser jetzt die Augenbrauen zusammenziehen und zum Widerspruch ansetzen, so nehmen Sie diesen bitte noch einen Augenblick zurück und lesen einfach noch ein paar Absätze weiter. Abbildung 3.7: Lotterie ist selbstverständlich etwas für große Zahlen 127 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Damit wissen Sie auch, warum sich Lotto für die Lotteriebetreiber immer, für die Spieler aber nur sehr selten lohnt. Variationen mit Wiederholung Vergessen wir nicht das kombinatorische Beispiel, auf das der mitlesende Bankräuber schon sehnsüchtig wartet: vier Zählscheiben am Safe und jede mit 0 bis 9 einzustellen. Da alle vier Scheiben unabhängig voneinander eingestellt werden können, besitzt auch jede zehn Einstellmöglichkeiten und Nummern können durchaus doppelt auftreten. Die Formel zur Berechnung lautet: V * (n, k ) = n * n * n …nk Auf das Safe-Beispiel angewendet: 10 * 10 * 10 * 10 = 10 000 Möglichkeiten Der Bankräuber hat weniger Möglichkeiten, etwas anderes zu lernen – aber damit ist die Möglichkeit größer, sein Leben in Freiheit zu verbringen, als durch das Austesten der vielen Möglichkeiten am Safe. Kombinationen Während man bei den Variationen die Anordnung berücksichtigt, wird sie in Kombinationen außer Betracht gelassen. Das kann Auswirkungen haben … Kombinationen ohne Wiederholung Kommen wir noch einmal zurück zum Lottospiel. Bei der Berechnung der Möglichkeiten über die Funktion Variationen sind wir von der Überlegung ausgegangen, dass es sich bei der Ziehung um eine Variation ohne Wiederholung handelt, was zumindest teilweise richtig ist. Nicht bedacht wurde aber, dass die Reihenfolge der Ziehung (Variation ohne Wiederholung) schnurzpiepegal ist. Wer das nicht glaubt, braucht sich solch eine Ziehung bloß einmal im Fernsehen anzusehen. 128 Kombinieren und Wiederholen Da die Reihenfolge nun keine Rolle spielt, fallen jeweils P(6) = 6! Möglichkeiten zusammen, d.h., man muss insgesamt nur K (49,6) = 49 * 48 * 47 * 46 * 45 * 44 = 13.983.816 1* 2 * 3 * 4 * 5 * 6 Lottoreihen auf den Tippscheinen ausfüllen, um sicher einen Sechsertreffer zu haben. Das ist schon viel besser. Statt eines Sattelschleppers reicht jetzt ein VW-Bus, um zur Lottoannahmestelle zu fahren, und mit ganz viel Glück und wenn's ein Jackpot war, bleibt noch so viel vom Gewinn übrig, um den VW-Bus zu bezahlen. Selbstverständlich können Sie das mit Excel viel einfacher berechnen, denn es gibt ja die Funktion KOMBINATIONEN (wieder in der Funktionskategorie Math. & Trigonom.). Abbildung 3.8: Kombiniere Mathematik! Die Funktion KOMBINATIONEN liefert die Anzahl der Kombinationen ohne Wiederholung von k Elementen aus einer Menge von n Elementen. Die Gleichung, die Excel dabei verwendet, ist: ⎛n ⎞ Pk ,n n! = ⎜ ⎟= k ! (n − k )! ⎝k ⎠ k ! mit: Pk ,n = n! (n − k )! 129 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Die von uns zuvor benutzte Berechnungsmethode kann aber auch anders in eine Formel gefasst werden: K (n ,k ) = n * (n −1) * (n − 2)…(n − k +1) ⎛n ⎞ =⎜ ⎟ 1* 2 * 3…k ⎝k ⎠ Wobei wir in der Zusammenfassung wieder beim Ausgangspunkt der Gleichung für Excel sind. Man liest das übrigens: n über k. Diese Terme nennt man Binomialkoeffizienten, da sie bei der Berechnung binomischer Ausdrücke vorkommen. Abbildung 3.9: So ist das also nun wirklich mit dem Lottospiel – alles halb so schlimm 130 Kombinieren und Wiederholen Ein abschließendes Beispiel (um auch die zufrieden zu stellen, die keine passionierten Lottospieler sind): Der Bürgermeister und sein Stellvertreter werden gewählt. Zwei Kandidaten sind aus einer Gruppe von 6 Personen zu wählen. Das Auszählen der Stimmen wird bis zum Morgengrauen dauern. In der Zeitung auf dem Frühstückstisch sollen aber schon die lachenden Sieger zu sehen sein. Was tun? Alle möglichen Kombinationen fotografieren. Wie viel das sind, haben Sie jetzt schnell ausgerechnet: K (6,2) = 6*5 = 15 1* 2 15 Fotos im Voraus zu machen, von denen dann tatsächlich nur eines benötigt wird, ist wirklich keine große Sache, zumal im Zeitalter der Digitalfotografie keine Mehrkosten für die vielen Fotos mehr entstehen. Lediglich das Risiko, in der Hektik der Nacht in der Redaktion dann doch noch das falsche Foto zu erwischen, besteht. Wie hoch die Wahrscheinlichkeit ist, nicht das richtige Foto zu erwischen, können Sie ja demnächst ausrechnen. Sie brauchen aber eigentlich nur den Funktions-Assistenten aufzurufen und die beiden Zahlen einzugeben, die für die Funktion benötigt werden: 6 für n und 2 für k. Abbildung 3.10: Der eingebaute Kombinationsrechner in Excel Kombinationen mit Wiederholungen Greifen wir zu den Würfeln – und damit dem nächsten Kapitelabschnitt einmal vor. Die Frage ist nach den verschiedenen Kombinationen, die mit zwei gleichen Würfeln möglich sind. Benutzt man Würfel, die sich unterscheiden (etwa durch Farbgebung), so ist die Berechnung einfach. Es sind 6 * 6 = 36 131 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Würfe möglich. Verzichtet man aber auf eine Unterscheidung der Würfel, so kommen alle Würfe mit verschiedenen Zahlen doppelt vor (in der folgenden Tabelle, siehe Abbildung 3.10, markiert). Abbildung 3.11: Wie oft muss nun wirklich gewürfelt werden? Durch die Markierung ist deutlich zu sehen, dass eine Halbierung der Würfe nicht möglich ist. Die korrekte Anzahl ergibt sich aus folgender Gleichung: ⎛n + k −1⎞ K * (n ,k ) =⎜ ⎟ ⎝ k ⎠ Man sagt auch: Eine Kombination zur Klasse k mit Wiederholung ist jede Auswahl von k zum Teil gleichen Elementen aus einer Menge M mit n beliebig oft wiederholbaren Elementen, wobei die Reihenfolge keine Rolle spielt. Angewendet auf unser Beispiel: ⎛6 + 2 −1⎞ 7 * 6 = 21 K * (6,2) =⎜ ⎟= ⎝ 2 ⎠ 1* 2 Im folgenden Kapitelabschnitt geht es nun mit Münzwurf, Würfeln und Kartenspiel weiter. 132 Für Zocker und Spieler Für Zocker und Spieler Dass die Wahrscheinlichkeitsrechnung ein ernst zu nehmender Bereich der Statistik ist, wurde eingangs schon erwähnt; es wird auch im Verlauf dieses Kapitels hoffentlich noch deutlich. Zunächst scheint dieser Bereich aber etwas für Spielernaturen zu sein. Tatsächlich gehen die Anfänge der Wahrscheinlichkeitsrechnung auch auf das Glücksspiel zurück. Blaise Pascal (1623–1662) und Pierre Fermat (1601–1665) gehörten zu den Ersten, die mathematische Lösungen zu Problemen des Glücksspiels versuchten. Erst im 19. Jh. machte der Aufschwung der Naturwissenschaften eine Erweiterung der Wahrscheinlichkeitsrechnung über das Glücksspiel hinaus notwendig. Die Wahrscheinlichkeitsrechnung wurde so zu einem Zweig der Mathematik, der sich mit der Aufdeckung der Gesetzmäßigkeiten von zufälligen Ereignissen befasst. Dazu ist das Studium von Massenerscheinungen nötig – und damit haben wir auch den Bogen zur Statistik gespannt. Kopf oder Zahl? Klassisches Beispiel für die Demonstration von Wahrscheinlichkeiten ist der Münzwurf: Wie hoch ist die Wahrscheinlichkeit, dass bei einem Münzwurf die Zahl oben zu liegen kommt? Das wird am einfachsten durch einen Bruch ausgedrückt: Eine Münze hat zwei Seiten (Kopf und Zahl). Dieser Wert (2) kommt unter den Bruchstrich. Es soll ein bestimmtes Ergebnis erzielt werden: Zahl soll oben liegen. Dieser Wert (1) kommt über den Bruchstrich: Über dem Bruchstrich stehen die Anforderungen. Unter dem Bruchstrich stehen die Möglichkeiten. In diesem Beispiel wäre also die Wahrscheinlichkeit: 1 = 0,5 oder 50% 2 Die Wahrscheinlichkeit, dass bei einem Wurf die Zahlenseite der Münze oben zu liegen kommt, beträgt also 50%. Wie sieht es denn nun aus, wenn die Fragestellung erweitert wird? Wie hoch ist die Wahrscheinlichkeit, dass bei zwei Münzwürfen die Zahlseite nach oben zu liegen kommt? 133 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung 1 1 1 * = = 0,25 oder 25% 2 2 4 Die Wahrscheinlichkeit beträgt also nur noch 25%. Erweitern wir das auf drei Münzwürfe, sieht die Rechnung so aus: 1 1 1 1 * * = = 0,1666 oder 16,66% 2 2 2 6 Es ist deutlich: Die Wahrscheinlichkeit, das gewünschte Ergebnis zu erzielen, sinkt mit der steigenden Zahl von Möglichkeiten. Wie der Würfel fällt Beschäftigen wir uns mit dem Würfel, so beginnen wir dort, wo wir gerade beim Münzwurf aufgehört haben. Ein Würfel hat 6 Seiten (und damit 6 Möglichkeiten) mit 6 verschiedenen Zahlen (1, 2, 3, 4, 5, 6). Um die Wahrscheinlichkeit zu ermitteln, mit der bei einem Wurf (1 Anforderung) eine 6 erzielt werden kann, nehmen Sie folgende Berechnung vor: 1 = 0,1666 oder 16,66% 6 Legen Sie zwei Anforderungen fest, die alternativ mit zwei Würfen erzielt werden können (entweder die 6 oder die 1), so steigt die Wahrscheinlichkeit: 1 1 2 1 + = = = 0,3333 oder 33,33% 6 6 6 3 Bestimmen Sie aber zwei Anforderungen, die beide erzielt werden sollen (z.B. die 6 und die 1), so sinkt die Wahrscheinlichkeit rapide: 1 1 1 = 0,277 oder 2,77% * = 6 6 36 Die Wahrscheinlichkeit ist nun nicht mehr sehr hoch. 134 Für Zocker und Spieler Kartenspiele Altgediente Pokerprofis werden diese Methode nun schnell auf Spielkarten übertragen können. Die Wahrscheinlichkeit, aus einem kompletten Kartenspiel (32 Karten) das Pik-Ass hervorzuziehen, ist: 1 = 0,03125 oder 3,125% 32 Wie hoch ist aber nun die Wahrscheinlichkeit, alle 4 Asse aus dem Stapel zu nehmen? Dazu müssen Sie nur ein wenig nachdenken, um die Formel – und damit die Wahrscheinlichkeit – ermitteln zu können. Nehmen Sie das erste Ass heraus, so stehen nur noch 31 Karten zur Verfügung, nach der Herausnahme des zweiten Asses nur noch 30 und so weiter. Unsere Berechnung sieht also folgendermaßen aus: 1 1 1 1 1 = 0,00000115869484612532 = 0,000116% * * * = 32 31 30 29 863.040 Abbildung 3.12: Das, was man gerne hätte, ist wie immer im Leben, am unwahrscheinlichsten Nun etwas für weit Fortgeschrittene: Es sollen aus dem Kartenstapel Karo-Bube, Karo-Dame, Karo-König und das Karo-Ass gezogen werden. Nehmen wir mal an, die erste Vorgabe hieße auch: in exakt dieser aufgeführten Reihenfolge. Dann lautete die Berechnung: 1 1 1 1 1 = 0,00000115869484612532 = 0,000116% * * * = 32 31 30 29 863040 135 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Das hatten wir ja schon. Durch andere Karten verändert sich (entgegen landläufiger Meinung) die Wahrscheinlichkeit nicht. Ist aber die Reihenfolge, in der die Karten gezogen werden dürfen, beliebig, dann sieht die Berechnung etwas anders aus: 4 3 2 1 * * * = 0,0000115869484612532 = 0,00116% 32 31 30 29 Abbildung 3.13: Beliebige Reihenfolge erhöht die Wahrscheinlichkeit Das Komma ist um eine Stelle nach rechts gerückt. Die beliebige Reihenfolge hat die Wahrscheinlichkeit zwar deutlich erhöht, sie ist aber nach wie vor gering. Wenn Ihnen diese Berechnung nicht verständlich ist, hilft Ihnen vielleicht folgender Hinweis: Für die erste Karte gibt es 32 Möglichkeiten (= 32 Karten) und genau 4 Anforderungen (denn 4 verschiedene Karten sollen ja gezogen werden). Danach gibt es nur noch 31 Möglichkeiten (eine Karte ist ja weg), und da nur noch drei Karten zu ziehen sind, auch nur noch 3 Anforderungen. Wenn Sie dieses Beispiel einmal testweise für alle Karten durchrechnen (alle 32 Karten dürfen in beliebiger Reihenfolge gezogen werden), so kommen Sie auf die Wahrscheinlichkeit 1 oder 100%. Spätestens jetzt dürfte Ihnen deutlich geworden sein, dass man die Wahrscheinlichkeit, mit der ein Ereignis eintreffen könnte, auch berechnen kann. Etwas Theorie Zum Abschluss einige theoretische Grundlagen der Wahrscheinlichkeitsrechnung. Jedes mögliche Ergebnis eines Zufallsexperiments nennt man ein Elementarereignis E (oder einen Ausfall). Die Menge aller Elementarereignisse E1, E 2 , E 3 …E n 136 Für Zocker und Spieler bildet den Ereignisraum S = {E1, E 2 , E 3 …E N } . Zwei Ereignisse E und E heißen Gegenereignisse, wenn Folgendes gilt: E und E bestehen aus verschiedenen Elementarereignissen und E und E ergänzen sich zum Ereignisraum S. Zufall und Experiment Kommen wir wieder auf unser Würfel-Beispiel zurück. Die möglichen Würfe mit zwei Würfeln haben wir ja schon einmal theoretisch überschaut und in einer Matrix dargestellt. Jetzt betrachten wir dieses Beispiel aus einem neuen Blickwinkel. Zunächst interessiert uns, welche Ergebnisse überhaupt erzielt werden können. Die kleinste Kombination, die bei einem Wurf mit beiden Würfeln erzielt werden kann, ist die 2 (2 * 1), die höchste die 12 (2 * 6). Die 1 kommt nicht vor, weil ein Würfel keine 0 als Wert hat. Es sind somit 11 Ergebnisse möglich. Abbildung 3.14: Welche Möglichkeiten gibt es bei zwei Würfeln? Teilen sich zwei Spieler die möglichen Ereignisse folgendermaßen auf: 1. Spieler: die ersten und letzten drei möglichen Ereignisse (2,3,4 und 10,11,12) 2. Spieler: die mittleren 5 möglichen Ereignisse (5,6,7,8,9) 137 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung so scheint zunächst der Spieler im Vorteil, auf den mehr mögliche Ereignisse zutreffen (1. Spieler 6 Ereignisse, 2. Spieler 5 Ereignisse). Tatsächlich verhält es sich aber anders. Untersuchen Sie dazu einmal die Tabelle näher. Sie werden feststellen, dass die 2 und die 12 nur jeweils einmal auftauchen (sie können ja auch nur aus der Kombination 1 + 1 und 6 + 6 erzielt werden), die 7 dagegen 6-mal (verschiedene Kombinationen sind möglich: 6 + 1, 5 + 2, 4 + 3, 3 + 4, 2 + 5 und 1 + 6). So treffen: auf den 1. Spieler nur 12 Ereignisse, auf den 2. Spieler aber 14 Ereignisse zu. Abbildung 3.15: Wie oft kann welches Ergebnis vorkommen? Mit diesen Ergebnissen können wir jetzt die Wahrscheinlichkeit errechnen: w (A ) = h(A ) n wobei h(A) die Anzahl der für A günstigen Ereignisse und n die Anzahl aller Ereignisse sind. 138 Für Zocker und Spieler Die Gewinnchancen für den ersten Spieler betragen: w (1) = 12 1 = 36 3 w (2) = 24 2 = 36 3 und für den zweiten Spieler: Die Auszählung der Ergebnisse habe ich in der Excel-Tabelle (siehe Abbildung 3.14) übrigens mit der Funktion ZÄHLENWENN durchgeführt. Diese Funktion benötigt zwei Parameter: den Bereich, den die Funktion auswerten soll (im Beispiel: Q2:V7) den Wert, nach dem gesucht werden soll (im Beispiel das Ergebnis aus dem Würfelwurf) Der Bereich wird als absoluter Bereich angegeben. Somit kann die Formel dann in die darunter liegenden Zellen kopiert werden. Experimente dieser Art (sämtliche Ausfälle haben die gleiche Chance) nennt man nach dem Mathematiker Pierre-Simon de Laplace (1749–1827), der diese Untersuchung zuerst geführt hat, Laplace-Experiment, die zugehörigen Wahrscheinlichkeiten Laplace-Wahrscheinlichkeiten. Gut für den Spieler, der sich ein wenig mit der Wahrscheinlichkeitsrechnung auskennt! Untersucht werden kann jetzt auch die Wahrscheinlichkeit für das Auftreten jeder Würfelsumme beim Werfen mit zwei Würfeln. Die 2 kommt nur einmal vor, also ist die Wahrscheinlichkeit: w (1) = 1 36 Die 7 kommt insgesamt sechsmal vor, also ist die Wahrscheinlichkeit: w (7) = 6 36 139 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Die Summen aller Wahrscheinlichkeiten aus der Untersuchung „Würfeln mit zwei Würfeln“ ergeben den Wert 1. Dies bedeutet: Eines der Ereignisse aus diesem Experiment (eine Summe zwischen 2 und 12) tritt mit Sicherheit ein. Abbildung 3.16: Die Summe aller Wahrscheinlichkeiten aus diesem Experiment ist 1 Relative Häufigkeit Erinnern Sie sich an das Münz-Beispiel? Wir haben errechnet, dass die Wahrscheinlichkeit, dass bei einem Wurf die Zahl oben zu liegen kommt, 50% beträgt. Damit ist auch die Chance, dass Kopf oben zu liegen kommt, ebenfalls 50% hoch – die Chancen sind also gleich. Um diese errechnete Wahrscheinlichkeit zu überprüfen, führen wir ein Experiment durch. Wir angeln den letzten Cent aus der Geldbörse und führen einige Würfe durch, die wir exakt protokollieren. Zwanzig Versuche zeigen, dass das Ergebnis gar nicht so weit von der errechneten Wahrscheinlichkeit entfernt liegt. Allerdings haben wir es hier nur mit einer Stichprobe zu tun, da ja nur ein kleiner Ausschnitt der möglichen Würfe durchgeführt wurde. Die Anzahl des Auftretens der beiden Münzseiten nennt man auch absolute Häufigkeiten; h(z) für Zahl und h(k) für Kopf. 140 Für Zocker und Spieler Abbildung 3.17: Eine Stichprobe auf die Glaubwürdigkeit der Wahrscheinlichkeitsrechnung Was sind zwanzig Münzwürfe? Und was sagen schon absolute Häufigkeiten aus? Erhöhen wir die Versuche – wir haben ja sowieso gerade nichts Besseres vor; was kann man mit einem Cent schon groß unternehmen? – und versuchen dann die relative Häufigkeit des Experiments zu ermitteln. Je größer die Zahl der Experimente, umso größer wird die Differenz zwischen den beiden Varianten. Sie sehen, dass die Aussagekraft der absoluten Häufigkeiten nicht sehr groß ist. Sie müssen die Anzahl der Experimente mit ins Spiel bringen, um eine davon unabhängige Aussagekraft zu erreichen. Die relative Häufigkeit für die Variante „Zahl“ errechnen Sie folgendermaßen: r(w ) = h(z ) n wobei h(z) die Anzahl der Würfe mit der Zahlseite und n die Anzahl der Würfe des gesamten Experiments sind. Für h(k) gilt es entsprechend. 141 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Abbildung 3.18: Relative Häufigkeiten sagen mehr aus als absolute Sie sehen, dass sich bei Zunahme der Wurfhäufigkeit die relative Häufigkeit immer mehr der errechneten Wahrscheinlichkeit annähert. Folgende Aussagen können deshalb getroffen werden: Bei einer kleinen Anzahl von Versuchen gibt die relative Häufigkeit einen Schätzwert für die Wahrscheinlichkeit an. Bei einer großen Anzahl von Versuchen sind relative Häufigkeit und Wahrscheinlichkeit kaum zu unterscheiden. Übrigens, falls Sie gerade darüber nachdenken, ob ich meine letzte Centmünze 10.000-mal geworfen habe: Ich habe es nur 100-mal geschafft. Dann habe ich Freunde gebeten, ebenfalls hundertmal ihren letzten Cent zu werfen. Die Ergebnisse konnte ich für die Reihen 500 und 1.000 verwerten. Für die beiden Reihen 5.000 und 10.000 habe ich auf Ergebnisse zurückgegriffen, die in der Literatur zu finden waren. Das ist zwar nicht ganz sauber (zumal die Durchführung der Experimente nicht überwacht und die «abgeschriebenen Ergebnisse» nicht auf Glaubwürdigkeit überprüft werden konnten), zur Demonstration der Errechnung relativer Häufigkeiten mag es an dieser Stelle aber genügen. 142 Für Zocker und Spieler Wahrscheinlichkeiten von zufälligen Ereignissen Setzen wir noch einmal an, wo wir vorhin aufgehört haben. Durch Würfe mit einer Centmünze und deren Auswertung haben wir versucht, uns über die relativen Häufigkeiten an die Wahrscheinlichkeit anzunähern. Zunächst aber noch etwas Theorie, genauer Begriffsdefinition: Wir sprachen schon von Ereignissen; diese können aber noch etwas differenziert werden. Es gibt sichere Ereignisse unmögliche Ereignisse zufällige Ereignisse Mit einem Würfel eine der Zahlen 1, 2, 3, 4, 5 oder 6 zu würfeln ist ein sicheres Ereignis. Mit einem Würfel eine 0 zu würfeln dagegen ein unmögliches Ereignis. Wird aber nur die 6 als Ergebnis des Würfelwurfs gewünscht, so ist es ein zufälliges Ereignis, wenn die 6 oben zu liegen kommt, denn genauso gut könnte da jetzt auch eine 1, 2, 3, 4 oder 5 stehen. Um aus einer Serie von zufälligen Ereignissen eine gewisse Wahrscheinlichkeit festlegen zu können, haben wir die Berechnung der relativen Häufigkeit benutzt. Dabei haben wir festgestellt, dass bei einer ausreichend großen Anzahl n von Versuchen, in denen das Ereignis E m-mal eingetreten ist, die relative Häufigkeit m/n als Zahlenwert für die Wahrscheinlichkeit gewählt werden kann. Diesen Zahlenwert nennt man auch die statistische Wahrscheinlichkeit des Ereignisses E und bezeichnet sie mit: ⎛m ⎞ P(E ) =⎜ ⎟ ⎝n ⎠ Multipliziert mit 100 ergibt sich ein Prozentwert für die Wahrscheinlichkeit, wie wir schon festgestellt haben. Es ergibt sich bei dieser Berechnung der Wahrscheinlichkeit immer eine Zahl zwischen 0 und 1, da immer gilt: 0 ≤m ≤n und damit auch: E : 0 ≤ P(E ) ≤ 1 143 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Dazu ein kleines Beispiel aus der Praxis: Bei der Produktion von Schrauben wird der Ausschuss gezählt. Die Produktionschargen-Menge beträgt 5.000 Stück. 58 Schrauben werden bei der Qualitätskontrolle aussortiert. Die statistische Wahrscheinlichkeit beträgt damit 0,0116 oder anders gesagt: P(E ) = 58 = 0,0116 = 1,16% 5000 Abbildung 3.19: Die statistische Wahrscheinlichkeit ist schnell errechnet Das Additionsgesetz Die Griechen haben die Demokratie erfunden. Aus einer Urne wurden Tonscherben mit dem Stimmvermerken der stimmberechtigten Bürger gegeben. Später sollen in Athen sogar so etwas wie Wahlautomaten eingesetzt worden sein. Von statistischen Auswertungen der Ergebnisse ist allerdings auch von den mathematisch begabten Griechen nichts bekannt. Diese Urne hilft uns aber, die Ereignisse noch etwas weiter zu definieren. Liegen in einer solchen Urne genau zwei Würfel, ein weißer und ein blauer, so kann entweder der weiße oder der blaue Würfel aus der Urne gezogen werden, unter der Vorgabe, dass immer nur ein Würfel gezogen werden darf. So kann immer nur der eine oder der andere Würfel aus der Urne kommen. Bei der Benutzung des Würfels kann ebenfalls immer nur eine Zahl oben liegen. Man spricht in solchen Fällen von einander ausschließenden Ereignissen. 144 Für Zocker und Spieler Bei einem Würfel ist es ganz besonders deutlich, da im Idealfall für alle Zahlen (Seiten des Würfels) durch gleiche Bedingungen (gleiche Kantenlängen) gleiche Chancen herrschen. Wird die 6 gezeigt, so ist die 1 ausgeschlossen (u. a.). Wird die 1 gezeigt, kann es die 6 nicht sein. Da es 6 Flächen gibt, ist die Wahrscheinlichkeit, dass die 6 gezeigt wird: 1 P(E ) = 6 6 Für die 1 (E1) gilt das aber ganz genauso. Die Wahrscheinlichkeit, eine 1 oder eine 6 zu würfeln, ist demnach doppelt so groß: 1 1 2 P(E oderE ) = + = 1 6 6 6 6 Man nennt dies auch das Additionsgesetz der Wahrscheinlichkeitsrechnung. Hinweis Mann nennt Wahrscheinlichkeiten, die unter festen Bedingungen berechnet werden, unbedingte Wahrscheinlichkeiten. Das Multiplikationsgesetz Bei dem Urnen-Beispiel aus dem vorangegangenen Abschnitt wurde stillschweigend davon ausgegangen, dass der gezogene Würfel außerhalb der Urne bleibt. Wird aber der Würfel in die Urne zurückgelegt, so ist es möglich, bei der nächsten Ziehung den gleichen Würfel wieder in die Hand zu bekommen. Man spricht in diesem Fall von einem bedingten Ereignis. Die Wahrscheinlichkeit für das gleichzeitige Auftreten von zwei Ereignissen E und F ist gleich dem Produkt der Wahrscheinlichkeit des ersten Ereignisses F mit der bedingten Wahrscheinlichkeit des Ereignisses E, die unter der Voraussetzung berechnet wurde, dass das Ereignis F schon eingetreten war. Daraus ergibt sich das Multiplikationsgesetz, das folgendermaßen dargestellt werden kann: P(E und F ) = P(F ) * P⎛ E ⎞ ⎜ ⎟ ⎝F ⎠ 145 Kapitel 3 – Grundlagen der Wahrscheinlichkeitsrechnung Da jedes der beiden Ereignisse E und F als das erste angesehen werden kann, gilt aber auch: P(E und F ) = P(E ) * P⎛ F ⎞ ⎜ ⎟ ⎝E ⎠ 1 . 6 Die Wahrscheinlichkeit, beim zweiten Wurf ebenfalls eine 6 zu würfeln, ist genauso groß. Wie sieht es aber mit der Wahrscheinlichkeit aus, eine 6 zu würfeln, nachdem mit dem ersten Wurf bereits eine 6 erzielt wurde? Der erste Wurf ist vom zweiten unabhängig und umgekehrt. Man spricht in diesem Fall von unabhängigen Ereignissen. Um beim Würfeln zu bleiben: Die Wahrscheinlichkeit, eine 6 zu würfeln, ist Das Multiplikationsgesetz für unabhängige Wahrscheinlichkeiten definiert sich so: Die Wahrscheinlichkeit P(E und F) für das gleichzeitige Eintreten der voneinander unabhängigen Ereignisse E und F ist gleich dem Produkt der Wahrscheinlichkeit P(E) für das Eintreten des Ereignisses F. Als Formel sieht das folgendermaßen aus: P(E und F ) = P(E ) * P(F ) Umgesetzt auf die zuvor gestellte Frage nach der Wahrscheinlichkeit, dass die gleiche Zahl wie beim ersten Wurf wieder auftritt: 1 1 1 P(E und F ) = * = 6 6 36 Die Wahrscheinlichkeit, dass der zweite dem ersten Wurf gleicht, ist also ungleich niedriger. 146