Einführung in die Wahrscheinlichkeitsrechnung anhand realer Fälle

Werbung
Beschreibende Statistik anhand realer Situationen
Paula Lagares Barreiro∗
Frederico Perea Rojas-Marcos∗
Justo Puerto Albandoz∗
MaMaEuSch†
Management Mathematics for European Schools
94342 - CP - 1 - 2001 - 1 - DE - COMENIUS - C21
∗
Universität Sevilla
MaMaEuSch wurde unterstützt durch die EU mittels einer teilweisen Förderung im Rahmen des Socrates Programmes und einer teilweisen Förderung durch das Land Rheinland-Pfalz. Der Inhalt des Projektes
reflektiert nicht notwendigerweise den Standpunkt der EU, noch unterliegt es irgendeiner Verantwortung
seitens der EU.
†
Inhaltsverzeichnis
1 Zufall und Wahrscheinlichkeit
2
1.1 Ziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.2 Das
Spiel
”Mus”
3
1.3 Zufällige Experimente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.4 Zufällige Ereignisse und Ereignisfelder . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.4.1 Ergebnisse und zufällige Ereignisse . . . . . . . . . . . . . . . . . . . . . . . .
5
1.4.2 Konsistente und inkonsistente Ereignisse . . . . . . . . . . . . . . . . . . . . .
5
1.4.3 Das sichere Ereignis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.4.4 Das unmögliche Ereignis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
1.4.5 Das Komplement eines Ereignisses . . . . . . . . . . . . . . . . . . . . . . . .
7
1.5 Operationen an zufälligen Ereignissen . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.5.1 Vereinigung: ein Ereignis oder das andere . . . . . . . . . . . . . . . . . . . .
7
1.5.2 Durschnitt von Ereignissen: ein Ereignis und ein anderes . . . . . . . . . . . .
8
1.5.3 Differenz von Ereignissen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
1.5.4 Eigenschaften der Operationen mit Ereignissen . . . . . . . . . . . . . . . . .
9
2 Wahrscheinlichkeit
10
2.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.1 Definition der Wahrscheinlichkeit über relative Häufigkeiten: empirische Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.2 Laplace’sche Regel: theoretische Wahrscheinlichkeit . . . . . . . . . . . . . . . 12
2.2 Ziehen mit Zurücklegen und Ziehen ohne Zurücklegen. Baum Diagramme . . . . . . 13
2.2.1 Ziehen mit Zurücklegen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2.2 Ziehen ohne Zurücklegen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3 Axiomatische Definition der Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . 15
2.4 Berechnung der Wahrscheinlichkeit in komplexeren Fällen . . . . . . . . . . . . . . . 17
2.4.1 Die bedingte Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.2 Unabhängigkeit von zufälligen Ereignissen . . . . . . . . . . . . . . . . . . . . 18
2.4.3 Totale Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4.4 Bayes’sche Regel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.5 Antwort auf die anfängliche Frage . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1
3 Eindimensionale Wahrscheinlichkeitsverteilungen
3.1 Zielsetzungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Einleitung. Diskrete Zufallsvariablen und Wahrscheinlichkeitsverteilungen
3.4 Häufigkeits Cumulative Wahrscheinlichkeitsfunktionen . . . . . . . . . . .
3.5 Der Modus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6 Der Erwartungswert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7 Die Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.8 Resümee der anfänglichen Frage . . . . . . . . . . . . . . . . . . . . . . .
4 Ein
4.1
4.2
4.3
Beispiel einer diskreten Zufallsvariablen:
Ziele . . . . . . . . . . . . . . . . . . . . . . .
Beispiel . . . . . . . . . . . . . . . . . . . . .
Einleitung . . . . . . . . . . . . . . . . . . . .
4.3.1 Der Erwartungswert . . . . . . . . . .
4.3.2 Die Varianz . . . . . . . . . . . . . . .
5 Kontinuierliche
5.1 Ziele . . . .
5.2 Beispiel . .
5.3 Einleitung .
die Binomialverteilung
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
28
28
28
29
31
33
34
34
37
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
38
38
38
39
43
44
Verteilungen: Normalverteilung
46
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2
Kapitel 1
Zufall und Wahrscheinlichkeit
Lassen Sie uns das ”Mus” Spiel spielen. Die Karten sind ausgeteilt und es ist Zeit sich auf eine
Wette einzulassen. Wir müssen bedenken, dass wir nicht alleine spielen sondern gegen andere Spieler
antreten. Nervös betrachten wir die neuen Karten, die wir jedesmal bekommen. Welche Karte wird
es sein? Sind meine Karten besser als die der anderen?
Bevor wir beginnen werden wir uns die Spielregeln und das Ziel des ”Mus” Spiels genauer
ansehen.
1.1
Ziele
• Verständnis über das Konzept des zufälligen Experiments und dessen Unterscheidung von
dem deterministischen.
• Erkennen eines zufälligen Ereignisses nach einem Experiment und Kenntnis über den Unterschied zwischen dem Ereignis und dem Ergebnis.
• Finden von speziellen Ereignissen: das unmögliche und das sichere Ereignis.
• Arbeiten mit dem zufälligen Ereignis und Interpretieren der Ergebnisse nach Betrachten von
Vereinigung, Durchschnitt und Differenzen.
• Zuordnen eines einfachen zufälligen Ereignisses auf zwei Arten: von der relativen Häufigkeit
und von der Laplace’schen Formel.
• Verständnis über die bedingte Wahrscheilichkeit und deren Anwendung.
• Verständnis über die Unabhängigkeit von zufälligen Ereignissen und den WahrscheinlichkeitsRechenregeln.
• Arbeiten mit der totalen Wahrscheinlichkeit und der Baye’schen Formel; deren Unterschiede
und Anwendung der Rechenregeln.
3
1.2
Das Spiel ”Mus”
In dieser Klasse spielen wir ein einfaches Kartenspiel. Es spielen jeweils zwei pro Team gegen ein
anderes Team. Auch wird in diesem Spiel nicht um Geld gespielt. Viel wichtiger ist der Spass. Bevor
wir nun mit dem Spiel starten brauchen wir zunächst 40 Karten:
• Acht Asse
• Vier Vierer
• Vier Fünfer
• Vier Sechser
• Vier Siebener
• Vier Buben
• Vier Damen
• Vier Könige
Die Karten werden gemischt und jeder Spieler bekommt zufällig 4 Karten. Folgende Optionen stehen
zur Verfügung:
• Wenn man zwei gleiche Karten hat und die restlichen zwei sind unterschiedlich und unterscheiden sich von den ersten beiden, dann hat man ein Paar. Zum Beispiel ist dies ein Damenpaar:
(Fünf, Dame, Dame, As).
• Wenn man drei gleiche Karten hat und sich nur die vierte unterscheidet, dann hat man ein
Trio. Zum Beispiel: (Sechs, König, König, König)ist ein Königsdreier.
• Weisen die vier Karten zwei Paare auf dann hat man ein Doppel. Diese können verschieden oder gleich sein. Zum Beispiel sind: (As, König, König, As) und (As, As, As, As) zwei
verschiedene Doppel.
In diesem Spiel ist ein Doppel mehr wert als ein Trio und ein Trio ist wiederum besser als ein Paar.
Sollte ein Spieler zwei Paare, zwei Trio oder zwei Doppel haben dann ist jener Spieler der Gewinner,
der die höchsten Karten im Paar, im Trio oder im Paar aufweist.
Die Karten werden wie folgt von unten nach oben beginnend bewertet: As, Vier, Fünf, Sechs,
Sieben, Bube, Dame, König.
Zum Beispiel gewinnt jener Spieler mit einem Doppel von Königen und Assen gegen jenen Spieler
mit einem Doppel von Buben und Damen weil das höchste Paar vom ersten Spieler (Königs-Paar)
mehr wert ist als das höchste Paar des zweiten Spielers (Damen-Paar). Deswegen ist auch ein Paar
von Buben höher bewertet als ein Paar von Sechsen.
Sollten zwei Spieler dasselbe Doppel, denselben Trio, dasselbe Paar von gleichen Karten haben,
dann gewinnt jener Spieler dessen restliche Karte bzw. restliche Karten höherwertig sind. Haben
zwei Spieler identische vier Karten, dann gewinnt jener Speiler, der die Karten als erster bekommen
hat, d.h. der Spieler, der rechts vom Kartengeber sitzt.
4
Nehmen wir an vier Freunde spielen sehr oft dieses Spiel und haben bemerkt, dass ein Paar von
Königen, ein Trio von Königen oder Assen und irgendwelche Doppel zu einer bestimten Zeit immer
wieder vorkommen. Sie diskutieren nun welche Schritte für sie selbst am günstigsten wären. Was
denken Sie darüber?
Beantworten Sie die Frage jetzt noch nicht, sie wird in diesem Kapitel behandelt.
1.3
Zufällige Experimente
Beispiel 1.3.1 Stellen Sie sich folgende Situation vor: Die Karten des Spiels sind ausgeteilt. Wissen wir bereits vorher welche Karten wir bekommen haben?
Wie Sie sehen können wir nicht mit Sicherheit sagen welche Karten wir bekommen haben, da wir sie
nicht sehen. Wir können drei Könige und ein As oder vier Buben bekommen. Beide Möglichkeiten,
und natürlich viele mehr, können auftreten. Die Tatsache, dass wir vorher nicht wissen können
welche Karten wir bekommen heisst Zufälligkeit.
In unserem Fall haben wir ein Experiment: Nehmen Sie vier Karten von dem Stapel. Es können
dabei unterschiedlichste Kartenzusammenstellungen auftreten. Wir bezeichnen dieses Ereignis als
zufälliges Ereignis.
Wenn wir das Ergebnis eines Versuchs bereits im Voraus wissen, dann wird dies als bestimmtes
Ereignis bezeichnet. Zum Beispiel: Lassen wir einen Stein in unserer Hand plötzlich los, dann wird
er zu Boden fallen. Hier gibt es nur eine Möglichkeit, nämlich dass der Stein zu Boden fällt.
Zusammenfassend können wir also sagen, dass bei einem zufälligen Ereignis verschiedene Ergebnisse auftreten können, beim bestimmten Ereignis hingegen gibt es nur ein Endergebnis.
Übung 1.3.1 Beschreiben Sie zwei zufällige und zwei bestimmte Ereignisse.
Definition 1.3.1 (Zufälliges Ereignis) Ein zufälliges Ereignis ist ein Vorgang, der im Voraus
nicht bekannt ist.
1.4
Zufällige Ereignisse und Ereignisfelder
Haben wir das Konzept des zufälligen Experiments verstanden, dann werden wir uns sicherlich
fragen welche Resultate möglich sind.
Nachdem die Karten ausgeteilt wurden stehen eine Menge von möglichen Kartenkombinationen
zur Verfügung. So können wir zum Beispiel folgende vier Karten bekommen (As, König, As, Bube)
oder (Vier, König, Fünf, Sieben). Jede dieser Kombinationen wird als zufälliges Ereignis betrachtet.
Wie vorhin als zufälliges Ereignis definiert beschreibt z.B. (As, Sieben, Bube, Sechs) ein zufälliges
Ereignis.
Die Summe aller zufälligen Ereignisse wird als Ereignisfeld bezeichnet und wir kürzen es mit E
ab. In unserem Beispiel besteht das Ereignisfeld aus allen möglichen Ereignissen.
Übung 1.4.1 Lassen Sie uns folgendes zufälliges Ereignis genauer betrachten: Nehmen Sie eine
Karte zufällig von dem Kartenstapel.
Beschreiben Sie nun das Ereignisfeld dieses Experiments durch Auflisten aller möglichen zufälligen
Ereignisse.
5
Definition 1.4.1 (Ereignisfeld) Alle Ereignisse eines zufälligen Experiments werden im Ereignisfeld E zusammengefaßt.
Jede Teilmenge eines Ereignisfeldes ergibt ein Ereignis.
1.4.1
Ergebnisse und zufällige Ereignisse
Wir unterscheiden die verschiedenen Ergebnisse in zwei Gruppen: Ergebnisse und zufällige Ereignisse.
Stellen Sie sich vor, Sie betrachten die erste Karte ihrer vier Karten und es ist eine As. Stellen
sie sich folgende Ergebnisse vor:
• die erste Karte ist eine As
• die erste Karte ist weniger wert als die Sieben
Sie werden sicherlich bemerken, dass zwischen diesen zwei möglichen Ereignissen ein gravierender
Unterschied besteht. Im ersten Fall legen wir eine bestimmte Karte fest, während wir im zweiten
Fall nur einschränken, d.h. die Karte könnte eine As, eine Vier, eine Fünf oder eine Sechs sein.
Der zweite Fall (eine Karte weniger wert als Sieben zu ziehen) beschreibt also einen Versuch bei
dem mehrere zufällige Ereignisse möglich sind.
Zusammenfassend lässt sich aussagen, dass im ersten Fall ein einziges Ergebnis auftritt, während
im zweiten Fall ein zufälliges Ereignis beschrieben wird. Im ersten Fall sprechen wir von einen
Ergebnis und im zweiten Fall von einem zufälligen Ereignis.
Definition 1.4.2 Wir sagen, dass das Ergebnis eines zufälligen Ereignisses ein Ergebnis ist, wenn
es aus nur einem einzigen Element des Ereignisfeldes besteht. Ansonsten bezeichnen wir dies als
ein zufälliges Ereignis.
Beispiel 1.4.1 Überlegen Sie sich folgendes zufällige Experiment: Nehmen Sie von einem Kartenstapel zufällig eine Karte heraus. Das Ereignisfeld ist wie folgt: ”Karo As”, ”Karo Zweier”,..., ”Herz
König”
Das Ziehen des Herz Königs ist ein Ergebnis. Aber wenn wir nun das Ziehen des Königs betrachten, dann ist dies ein zufälliges Ereignis, weil es vier Möglichkeiten gibt: Ziehen des ”Herz Königs”,
”Ziehen des Karo Königs”, ”Ziehen des Schell Königs” und ”Ziehen des Pik Königs”.
1.4.2
Konsistente und inkonsistente Ereignisse
Lassen Sie uns zurückkehren zu unserem Kartenspiel. Jeder Spieler bekommt wiederum vier
Karten. Wir wollen nun zwei zufällige Ereignisse betrachten:
• Ereignis A=”Zwei von den vier Karten sind Könige”
• Ereignis B=”Zwei von den vier Karten sind Asse”
Ist es möglich, dass das Ereignis A und das Ereignis B zugleich eintreten? Ist es also möglich
zwei Könige und gleichzeitig zwei Asse zu ziehen? Ja es ist möglich ein Doppel von Königen und
Assen zu ziehen.
Da nun das Ereignis A und das Ereignis B zur gleichen Zeit auftreten können bezeichnen wir
sie als konsistente Ereignisse. Jedoch ist die Situation nicht immer so klar. Es gibt einen Anzahl an
Ereignissen, die niemals gleichzeitig auftreten können. Stellen Sie sich folgende zwei Ereignisse vor:
6
• Ereignis C = ”Drei von vier Karten sind Könige”
• Ereignis D = ”Zwei von vier Karten sind Asse”
Und wir fragen uns wiederum: Ist es möglich, dass das Ereignis C und das Ereignis D gleichzeitig
eintreten können? Ist es also möglich drei Könige und zwei Asse zu ziehen? Es ist unmöglich, da
wir ja nur vier Karten ziehen!
Das Ereignis C und das Ereignis D können also nicht im selben zufälligen Experiment vorkommen. Wir bezeichnen sie als inkonzistente Ereignisse.
Übung 1.4.2 Finden Sie ein Paar von konsistenten und ein Paar von inkonsistenten Ereignissen;
diese müssen von den gegebenen Beispielen unterschiedlich sein, sollen aber demselben zufälligen
Ereignis angehören.
Definition 1.4.3 Haben wir zwei zufällige Ereignisse in einem zufälligen Experiment, dann bezeichnen wir sie als konstistent, wenn sie gleichzeitig vorkommen können und als inkonsistent wenn
sie niemals zur gleichen Zeit eintreten können.
1.4.3
Das sichere Ereignis
Wir nehmen nun unseren Kartenstapel und teilen ihn in zwei Teile. In dem einen Teil befinden
sich die Asse (acht Karten) und im anderen Teil die restlichen 32 Karten. Wir betrachten nun den
Teil mit den Assen und ziehen willkürlich eine Karte. Können wir wissen welche Karte es sein wird?
Ja wir können. Wir können annehmen, dass die Karte eine As ist. Dises Beispiel beschreibt ein
sicheres Ereignis, ein Ereignis, dass mit Sicherheit eintritt.
Übung 1.4.3 Finden Sie nun in dem ”Mus” Spiel ein sicheres Ereignis mit ihren vier Karten.
Definition 1.4.4 Ein sicheres Ereignis ist ein zufälliges Ereignis eines zufälligen Experiments, das
immer eintritt.
Jedes Ereignisfeld besteht aus dem sicheren Ereignis.
1.4.4
Das unmögliche Ereignis
Jedoch können wir in demselben zufälligen Ereignis sicher sein, dass wir keine Sechs ziehen
werden, weil der Kartenstapel ja nur aus Assen besteht. Das zufällige Ereignis eine Sechs zu ziehen
ist daher ein unmögliches Ereignis.
Übung 1.4.4 Beschreiben Sie nun ein unmögliches Ereignis basierend auf dem ”Mus” Spiel, mit
vier Karten.
Definition 1.4.5 Wir sagen, ein zufälliges Ereignis ist ein unmögliches Ereignis, wenn es niemals
vorkommt.
7
1.4.5
Das Komplement eines Ereignisses
Nehmen wir wieder an, die Karten werden in zwei Stapel geteilt: im ersten Stapel befinden sich
alle Könige und alle Asse (16 Karten) und im zweiten der Rest der Karten (24 Karten). Wir ziehen
nun eine Karte vom ersten Stapel. Betrachten wir die Ereignisse:
• A=”Die gezogene Karte ist eine As”
• B=”Die gezogene Karte ist ein König”
Die spezielle Eigenschaft dieser Ereignisse ist, dass das Ereignis A niemals eintreten kann wenn
das Ereignis B eintritt, und umgekehrt kann auch das Ereignis B nicht eintreten wenn bereits A
vorkommt. Eines der beiden Ereignisse kommt immer vor. Beide sind inkonsistente Ereignisse, d.h.
sie können niemals gleichzeitig eintreten.
Das eine Ereignis ist jeweils das Komplement des anderen Ereignisses.
Übung 1.4.5 Beschreiben Sie komlementäre Ereignisse nachdem Sie willkürlich eine Karte des
”Mus” Spiels ziehen.
Definition 1.4.6 Zwei Ereignisse werden als Komplement bezeichnet, wenn sie inkonsistent sind
(Sie können niemals gleichzeitig eintreten) und eines immer vorkommt. Wenn wir das Ereignis mit
A bezeichnen dann wird das Komplement mit A oder Ac bezeichnet.
1.5
Operationen an zufälligen Ereignissen
Auf die selbe Weise wie wir mit Zahlen operieren (addieren, subtrahieren, multiplizieren,...) so
operieren wir auch mit zufälligen Ereignissen. Die Operationen unterscheiden sich dadurch, dass
bei zufälligen Ereignissen von Vereinigung, Durchschnitt und Differenz gesprochen wird.
1.5.1
Vereinigung: ein Ereignis oder das andere
Wir wollen nun wieder an das ”Mus” Speil denken, wo jeder Spieler 4 Karten bekommt. Das
zufällige Ereignis ist also das willkürliche Ziehen von vier Karten aus dem Kartenstapel. Lassen Sie
uns zwei mögliche Ereignisse dieses zufälligen Ereignisses beschreiben:
• A=”Besitzen von zwei Königen”
• B=”Besitzen einer As”
Nehmen wir nun an, dass unsere Karten (As, Bube, Sieben, Sieben) sind. Ist nun das Ereignis
A eingetreten? Nein, denn wir haben nicht zwei Könige unter unseren vier Karten. Ist das Ereignis
B eingetreten? Ja, denn wir haben eine As unter unseren vier Karten. In diesem Fall sagen wir,
dass das Ereignis A oder das Ereignis B eintritt und schreiben A ∪ B.
Haben wir nun zwei zufällige Ereignisse und eines der beiden oder sogar beide treten ein dann
sprechen wir vonA ∪ B.
8
Übung 1.5.1 Wiederum haben wir das Mus Spiel im Hinterkopf und spielen mit vier Karten.
Stellen sie sich folgende Ereignisse vor:
A=”Wir ziehen drei Könige”
B=”Wir ziehen drei Asse”
Beschreiben Sie nun ausgehend von dieser Angabe das Ereignis A ∪ B.
Definition 1.5.1 Gegeben sei ein Ereignis A und ein Ereignis B. Wir definieren das Ereignis A
oder B( und schreiben dafür A ∪ B) so, dass ein Ereignis der beiden oder sogar beide eintreten.
Bemerkung: Sind beide Ereignisse gegeben, dann ist auch A ∪ B gegeben.
1.5.2
Durschnitt von Ereignissen: ein Ereignis und ein anderes
Lassen Sie uns nun zwei neue zufällige Ereignisse betrachten, indem wir wieder vier Karten des
”Mus” Spielstaplels ziehen.
• A=”Ziehen von zwei Assen”
• B=”Ziehen von einer Sieben”
Stellen Sie sich vor wir erhalten folgende vier Karten: (As, König, Sieben, As). Ist nun das Ereignis
A eingetreten? Ja, denn wir haben zwei Asse unter unseren Karten. Wie sieht es mit dem Ereignis
B aus? Dieses ist auch eingetreten, da unsere dritte Karte eine Sieben ist. Beide Ereignisse A und
B sind eingetreten. Wir bezeichnen diese Ereignis mit A ∩ B.
Übung 1.5.2 Denken Sie über folgende zufällige Ereignisse, nach dem Ziehen von vier Karten,
nach:
• A=”Ziehen von zwei Königen”
• B=”Ziehen von zwei Assen”
Beschreiben Sie nun ein Ereignis in welchem das Ereignis A ∩ B eintritt und ein anderes Ereignis
in welchem A ∩ B eintritt.
Definition 1.5.2 Gegeben sei ein Ereignis A und ein Ereignis B. Das Ereignis A UND B ist
definiert als ein zufälliges Ereignis, in welchem sowohl A als auch B eintritt. Wir schreiben A ∩ B.
Beachten Sie: wenn der Durchschnitt zweier zufälliger Ereignisse das unmögliche Ereignis (∅)ist
dann sind die Ereignisse inkonstistent (siehe Definition der inkonstistenten Ereignisse). Wenn der
Durchschnitt nicht das unmögliche Ereignis ist, dann sind die beiden Ereignisse konstistent.
1.5.3
Differenz von Ereignissen
Wieder betrachten wir zwei neue Ereignisse:
• A= ”Ziehen von drei Buben”
• B= ”Ziehen eines Königs”
9
Nach dem Austeilen der Karten haben wir (Bube, As, Bube, Bube).
Ist das Ereignis A eingetreten? Natürlich, wir haben ja drei Buben unter unseren vier Karten.
Ist das Ereignis B auch eingetreten? Nein, denn in keiner unserer vier Karten läßt sich ein König
finden. Wir sagen nun, dass das Ereignis A minus B eingetreten ist und schreiben A \ B.
Immer wenn also ein Ereignis eintritt und ein anderes nicht dann sprechen wir von der Differenz
von zwei Ereignissen.
Übung 1.5.3 Sehen wir uns nun folgendes Experiment genauer an:
A= ”Wir habe zwei Asse”
B= ”Wir haben zwei Buben”
Versuchen Sie nun ein passendes Ereignis A \ B und ein passendes Ereignis B \ A zu beschreiben.
Definition 1.5.3 Gegeben sei ein Ereignis A und ein Ereignis B. Das Ereignis A \ B ist definiert
als das Eintreten des Ereignisses A und das Nicht- Eintreten des Ereignisses B.
1.5.4
Eigenschaften der Operationen mit Ereignissen
Die folgenden Eigenschaften sind von Bedeutung. Zuvor definieren wir das sichere Ereignis mit
E und das unmögliche Ereignis mit ∅. Das Ereignis A, B und C sind beliebige zufällige Ereignisse,
Teilmengen des Ereignisfeldes und Ac bezeichnet das Komplement des Ereignisses A.
Vereinigung:
A ∪ B = B ∪ A, A ∪ E = E, A ∪ ∅ = A, A ∪ Ac = E
Durchschnitt:
A ∩ B = B ∩ A,
A ∩ E = A,
A ∩ ∅ = ∅,
A ∩ Ac = ∅
Differenz:
A \ B = A ∩ Bc
De Morgan’sche Regel:
(A ∪ B)c = Ac ∩ B c ,
(A ∩ B)c = Ac ∪ B c
Zusätzliche Eigenschaften:
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C),
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
10
Kapitel 2
Wahrscheinlichkeit
2.1
Einleitung
Im vorigen Kapitel haben wir das zufällige Ereignis genauer betrachtet und sind zum Schluss
gekommen, dass wir hierbei keine Sicherheit über ein Ergebnis erhalten. In anderen Worten haben wir es mit einer Unsicherheit zu tun, die wir messen werden. Diese Zahl werden wir dann
Wahrscheinlichkeit benennen.
Nehmen wir zum Beispiel zufällig eine Karte vom Kartenstapel. Wir können im Voraus nicht
vorhersagen welche Karte es sein wird. Jedoch wissen wir, dass im Stapel mehr Asse als Siebener
sind und so wäre es naheliegend zu denken, dass die Wahrscheinlichkeit höher ist eine As als einen
Siebener zu ziehen. So hat die As eine höhere Wahrscheinlichkeit gezogen zu werden als die Sieben.
In diesem Kapitl möchten wir uns näher mit den verschiedenen Techniken der Häufigkeit des
Auftretens eines Ereignisses beschäftigen.
Übung 2.1.1 Schreiben Sie zwei Ereignisse, basierend auf den ”Mus” Spiel, zusammen von welchen
Sie denken, dass sie unterschiedlich oft eintreten (verschiedene Wahrscheinlichkeiten haben) und
erklären Sie warum.
2.1.1
Definition der Wahrscheinlichkeit über relative Häufigkeiten: empirische Wahrscheinlichkeit
Im obigen Teil definierten wir die Wahrscheinlichkeit als eine Zahl, die wir jedem Ereignis zuordnen. Mit dieser Zahl wollen wir auch die Häufigkeit des Eintretens eines zufälligen Ereignisses
beschreiben.
Ein direkter Weg die Wahrscheinlichkeit eines zufälligen Ereignisses zu bestimmen ist es eine Tabelle, in der die relativen Häufigkeiten des Ereignisses zu finden sind, anzusehen. Die Wahrscheinlichkeit
wird als empirische Wahrscheinlichkeit bezeichnet da sie nach dem Experiment erst aufgestellt werden kann. Wenn also ein Experiment n mal durchgeführt wurde und wir sehen, dass in k Fällen das
Ereignis eingetreten ist, dann bezeichnen wir dies mit A. Die Wahrscheinlichkeit des Auftretens des
11
Ereignisses A ist also
k
n,
und wir schreiben dafür P (A). D.h. also:
k
n
Beispiel 2.1.1 Nehmen wir an wir ziehen wiederum Karten vom Kartenstapel, eine nach der anderen. Nachdem wir die Karte gesehen haben legen wir sie wieder zurück bevor wir die nächste
ziehen. Schlussendlich erhalten wir folgende Häufigkeitstabelle:
P (A) =
Karte
As
Vier
Fünf
Sechs
Sieben
Bube
Dame
König
Relative Häufigkeit
38
200
17
200
21
200
24
200
21
200
23
200
18
200
38
200
Von dieser Tabelle können wir folgende Wahrscheinlichkeiten anlesen:
38
P(”Die Karte ist eine As”)= 200
= 00 19
17
P(”Die Karte ist eine Vier”)= 200 = 00 085
21
P(”Die Karte ist eine Fünf”)= 200
= 00 105
24
P(”Die Karte ist eine Sechs”)= 200 = 00 12
21 0
P(”Die Karte ist eine Sieben”)= 200
0 105
23
P(”Die Karte ist ein Bube”)= 200 = 00 115
18
P(”Die Karte ist eine Dame”)= 200
= 00 09
38
P(”Die Karte ist ein König”)= 200 = 00 19
Nehmen Sie an wir machen dies 1000 mal, dann erhalten wir folgende relative Häufigkeiten:
Karte Relative Häufigkeit
192
As
1000
111
Vier
1000
109
Fünf
1000
85
Sechs
200
87
Sieben
1000
116
Bube
1000
91
Dame
1000
209
König
1000
Ausgehend von dieser Tabelle können wir auf folgende neue Wahrscheinlichkeiten schließen:
192
P(”Die Karte ist eine As”)= 1000
= 00 192
111
P(”Die Karte ist eine Vier”)= 1000 = 00 111
109
= 00 109
P(”Die Karte ist eine Fünf”)= 1000
85
P(”Die Karte ist eine Sechs”)= 1000 = 00 085
87
P(”Die Karte ist eine Sieben”)= 1000
= 00 087
116
P(”Die Karte ist ein Bube”)= 1000 = 00 116
91
P(”Die Karte ist eine Dame”)= 1000
= 00 091
209
P(”Die Karte ist ein König”)= 1000 = 00 209
12
Wenn wir verstanden haben, dass die Wahrscheinlichkeit einen Zahl ist, die jedem zufälligen
Ereignis zugeschrieben wird, dann können wir sagen, dass das Ereignis ”die gezogene Karte ist
ein König” häufiger auftritt, bzw. eine höhere Wahrscheinlichkeit ausweist, als das Ereignis ”die
gezogene Karte ist eine Sieben”, da ja P(König) > P(Sieben).
Das Ereignis ”die gezogene Karte ist ein Bube” ist wahrscheinlicher als das Ereignis ”die gezogene Karte ist eine Dame ”,...
Bemerkung 2.1.1 Diese Möglichkeit der Wahrscheinlichkeitsbestimmung basiert auf dem Gesetz
der großen Zahlen für relative Häufigkeiten. Jedem Ereignis wird eine Zahl zugeordnet (die Wahrscheinlichkeit) sodass bei mehrfachen Wiederholen des zufälligen Experiments die relativen Häufigkeiten
des Ereignisses immer besser mit der Wahrscheinlichkeit des Ereignisses übereinstimmen. Je mehr
zufällige Experimente durchgeführt werden, desto besser stimmt die relative Häufigkeit mit der speziellen Zahl (Wahrscheinlichkeit) überein.
Nehmen wir etwa 100 Karten wie im vorigen Beispiel, dann ist die Zuverlässlichkeit der Wahrscheinlichkeit nicht so hoch als wie wenn man 200 Karten gezogen hätte. Und zieht man 10000 Karten
anstatt 1000 Karten, dann ist die Wahrscheinlichkeit näher an der wirklichen Wahrscheinlichkeit
als bei 1000 Karten.
In jedem Fall ist die Tabelle die man nach 1000 Durchführungen des Experiments erhält verlässlicher
als jene nach 200 Durchführungen.
Übung 2.1.2 Führen Sie folgendes Experiment durch: Teilen sie 20 mal die Karten des ”Mus”
Spiels aus und nehmen Sie vier Karten ohne sie zuzückzulegen und notieren sie sich ob in jeder
Austeilung: ein Paar, ein Trio, ein Doppel oder nichts davon aufgetreten ist.
Machen Sie nun eine Tabelle wo Sie die relative Häufigkeiten des Experiments eintragen und
bestimmen Sie dann die Wahrscheinlichkeit der zufälligen Ereignisse (Paar, Trio, Doppel, nichts).
Denken Sie, dass diese Wahrscheinlichkeiten zuverlässig sind? Warum?
Der nächste Abschnitt beschäftigt sich mit einem anderen Zugang zur Wahrscheinlichkeit. Hier
müssen wir nicht ein Experiment durchführen um auf die Wahrscheinlichkeiten zu kommen deshalb
ist dieser Zugang oft einfacher als jener den wir zuvor besprochen haben (relative Häufigkeiten).
2.1.2
Laplace’sche Regel: theoretische Wahrscheinlichkeit
Wie Sie gesehen haben ist die Wahrscheinlichkeit, über die relativen Häufigkeit definiert, oft zu
langwierig. Ein Experiment muss öfters wiederholt werden um ein vernünfiges Ergebnis zu erzielen.
Und selbst dann können wir nicht sicher sein die genaue Wahrscheinlichkeit zu erhalten.
Aus diesem Grund ist es nötig eine alternative, besser anwendbare Methode zur Berechnung der
Wahrscheinlichkeit einzuführen.
Stellen wir uns folgendes Beispiel vor: Wir haben den Stapel mit Karten des ”Mus” Spiels vor
uns liegen und ziehen nun eine Karte. Wir wollen nun die verschiedenen Wahrscheinlichkeiten aller
möglichen Ereignisse wissen.
Nun gut, logisch denken wir, dass der Kartenstapel ordentlich zusammengestellt ist und dass
wir eine Karte mit der selben Wahrscheinlichkeit ziehen wie alle anderen Karten. Es sind also keine
Karten fehlerhaft und so können wir irgendeine von den 40 Karten mit gleicher Wahrscheinlichkeit
13
ziehen. In diesem Fall sagen wir die Karten sind gleichwahrscheinlich. Ein anderes gleichwahrscheinliches Ergebnis wäre eine gewürfelte Nummer d.h. die Eins, Zwei,..., Sechs werden mit gleicher
Wahrscheinlichkeit gewürfelt. Ein anderes Beispiel ist das Münzenwerfen: Hier haben wir auch mit
gleicher Wahrscheinlichkeit entweder Kopf oder Zahl, natürlich unter der Voraussetzung dass die
Münze bzw. der Würfel nicht präpariert sind.
Kehren wir nun zu unserem Ausgangsbeispiel dem ”Mus” Spiel zurück. Wir haben 40 Karten,
alle mit gleichem Gewicht, Form,... Unter den 40 Karten befinden sich 8 Asse und so schließen wir
daraus, dass 40 Durchgängen die As 8 mal gezogen wurde. Dies ist jedoch sehr theoretisch und Sie
werden bemerken, dass Sie nicht immer 8 Asse nach 40 Durchgängen erhalten (Sie können auch
3 oder 12 Asse ziehen, je nach Zufall). Die Tatsache aber, dass sich 8 Asse in dem Kartenstapel
befinden gibt uns eine Idee, wie wahrscheinlich es sein kann eine As zu ziehen.
8
. Dies ist eine theoretische WahrWir sagen die Wahrscheinlichkeit eine As zu ziehen ist 40
scheinlichkeit und wir müssen die Durchgänge wiederholen. In der Praxis erhalten wir natürlich
nicht immer 8 Asse nach 40 Durchgängen. In diesem Fall, da wir gesamt 40 Karten haben kommen
wir zu dem Schluss, dass hier 40 mögliche Ergebnisse auftreten können (wir können 40 verschiedene
Karten vom Kartenstapel ziehen) und 8 Ergebnisse die wir anaysieren können, z.B. das Ziehen einer
As, da sie 8 Möglichkeiten hat aufzutreten.
Da wir nun die Konzepte eingeführt haben können wir zur Laplace’schen Definition der Berechnung der Wahrscheinlichkeit übergehen:
Definition 2.1.1 Wenn alle Ergebnisse eines zufälligen Experiments gleich wahrscheinlich sind
dann beschäftigen wir uns mit dem zufälligen Ereignis dieses zufälligen Experiments genannt A. Es
gilt:
Anzahl der Ergebnisse in A
P (A) =
Anzahl aller Ergebnisse
Die Anzahl der Ereignisse in A ist die Wahrscheinlichkeit des Auftretens des Ereignisses A.
Diese Definition war die erste formale Definition in der Geschichte und geht zurück auf Pierre
Simon de Laplace am Beginn des 19. Jahrhunderts.
Nach dieser Erklärung können Sie folgende Übung bewältigen:
Übung 2.1.3 Berechnen Sie, unter Verwendung der Laplace’ schen Regel, die Wahrscheinlichkeit
des Erhaltens jeder Karte nach zufälligem Ziehen einer Karte vom ”Mus” Spielkartenstapel.
2.2
Ziehen mit Zurücklegen und Ziehen ohne Zurücklegen.
Baum Diagramme
In diesem Abschnitt möchten wir gerne einige neue und kompliziertere zufällige Experimente
einführen. Anstatt immer nur eine Karte nach der anderen zu ziehen, ziehen wir nun mehrere
Karten. Nach Studieren dieses Unterkapitels werden Sie im Stande sein alle verschiedenen Schritte
im ”Mus” Spiel zu analysieren.
14
2.2.1
Ziehen mit Zurücklegen
Lassen Sie uns mit einer einfachen Situation beginnen. Wir ziehen zwei Karten vom ”Mus” Spiel
Kartenstapel, eine nach der anderen und mit Zurücklegen der Karte nachdem wir sie angesehen
haben. Dieser Vorgang wird als SZiehen mit Zurücklegen”bezeichnet.
Bezeichnen wir A1 mit dem Ereignis ”Die erste Karte ist ein König” und A2 mit dem Ereignis
”Die zweite Karte ist ein Bube”. Wir können uns nun fragen wie hoch die Wahrscheinlichkeit des
Eintretens beider Ereignisse zur selben Zeit ist; also die erste gezogene Karte ist ein König und die
zweite gezogene Karte ist ein Bube.
Um die Wahrscheinlichkeit des Ereignisses zu berechnen skizzieren wir folgendes Diagramm,
welches als Baum Diagramm bezeichnet wird:
Die Wahrscheinlichkeit, dass die erste Karte ein König und die zweite Karte ein Bube ist setzt
sich zusammen als Multiplikation des Pfades welcher zum gewünschten Ergebnis führt (Produktre8
4
1
gel): 40
= 50
· 40
Wenn wir uns nur für beide Karten (König und Bube) interessieren und uns die Reihenfolge
ihres Auftretens egal ist, dann haben wir entweder (König, Bube) oder (Bube, König).
Sei B1 das Ereignis ”Die erste Karte ist ein Bube” und B2 das Ereignis ”Die zweite Karte ist
ein König”. Für das Eintreten der Kombination (Bube, König) ist das Ereignis B1 ∩ B2 nötig.
Aus demselben Grund wie vorhin, unter Verwendung eines ähnlichen Baumdiagramms, erhalten
4
8
1
· 40
= 50
.
wir als Wahrscheinlichkeit für das Ziehen von (Bube, König) 40
Um nun die Wahrscheinlichkeit für das Erhalten von Bube und König, ohne Rücksicht auf
die Reihenfolge, zu berechnen müssen wir die Wahrscheinlichkeiten von vorhin addieren: ”(König,
1
1
1
+ 50
= 25
.
Bube) + (Bube, König )” (Additionsregel) Und wir erhalten 50
Übung 2.2.1 In dem zufälligen Experiment von vorhin berechnen Sie nun die Wahrscheinlichkeit,
dass beide Karten Asse sind. Zeichnen Sie auch ein passendes Baum Diagramm.
Im folgenden Abschnitt befassen wir uns nun mit dem Fall, dass die Karten nach dem Ziehen
und Ansehen nicht zurückgelegt werden.
15
2.2.2
Ziehen ohne Zurücklegen
In dem zufälligen Experiment von vorhin haben wir die Karten nach dem Ansehen wieder
zurückgelegt. Was passiert wenn wir die Karten nicht zurücklegen? Nun gut, die Sache ändert
sich, aber die Begründung ist ähnlich. Das einzige was sich ändert ist die zweite Wahrscheinlichkeit,
jene Wahrscheinlickeit beim zweiten Ziehen. Dies ist logisch den die Ausgangssituation ist in beiden
Fällen die gleiche. Am Anfang ziehen wir immer aus 40 Karten. Beim zweiten Ziehen stehen uns in
diesem Fall aber nur mehr 39 Karten zur Verfügung, da die erst Karte ja nicht zurückgelegt wird.
Wenn wir wie oben zuerst einen König und dann einen Buben ziehen möchten dann ist das
Baum Diagramm dasselbe. Die Wahrscheinlichkeit der zweiten Ziehung ändert sich jedoch.
Lassen Sie uns nun auch für diesen Fall die Wahrscheinlichkeit einen König und einen Buben
zu ziehen berechnen unter der Voraussetzung, dass wir die Karten nicht wieder zurücklegen. Dieses
Vorgehen wird als Ziehen ohne zurücklegen bezeichnet. Das Baum Diagramm dieses Experiments
sieht ähnlich aus wie das vorige:
8
4
In diesem Fall haben wir die Wahrscheinlichkeit des Ziehens von (König, Bube) 40
· 39
.
4
Beachten Sie, dass in diesem Fall der zweite Faktor 39 lautet, da wir beim zweiten Mal ja nur
mehr 39 Karten zur Verfügung in denen 4 Buben zu finden sind.
Auf einen vergleichbare Weise können wir auch die Wahrscheinlichkeit der Kombination (Bube,
4
8
König) berechnen. Sie ist: 40
· 39
.
Und wiederum müssen wir nur die einzelen Wahrscheinlichkeiten miteinander addieren (Additionsregel) wenn wir die Wahrscheinlichkeit des Ziehens eines Königs und eines Bubens, ohne
4
8
4
8
4
8
Rücksicht auf die Reihenfolge, berechnen möchten. Wir erhalten: 40
· 39
+ 40
· 39
= 2 40
· 39
Übung 2.2.2 Bearbeiten Sie dieselbe Übung wie zuvor nur unter der Voraussetzung dass ein SZiehen ohne zurücklegen”vorliegt.
2.3
Axiomatische Definition der Wahrscheinlichkeit
Wir wollen nun eine abstraktere Definition der Wahrscheinlichkeit einführen. Die folgenden
Grundprinzipien nehmen wir als wahr an und nennen sie Axiome. Die Axiome lauten:
16
1. Für jedes Ereignis A ist dessen Wahrscheinlichkeit eine Zahl zwischen 0 und 1. Es gilt:
0 ≤ P (A) ≤ 1
2. P (E) = 1, wobei E das sichere Ereignis bezeichnet.
3. Sind A und B zwei inkonsistente Ereignisse dann gilt:
P (A ∪ B) = P (A) + P (B)
Von diesen Axiomen ausgehend können wir eine beträchtliche Anzahl an Eigenschaften der
Wahrscheinlichkeit ableiten:
1. Bezeichnen wir Ac als Komplement des Ereignisses A, dann gilt:
P (Ac ) = 1 − P (A)
Übung 2.3.1 Beweisen Sie diese Eigenschaft mit Hilfe der Axiome.
2. Haben wir eine Reihe von Ereignissen A1 , A2 , ..., An , und sind diese paarweise inkonsistent
(Ai ∩ Aj = ∅ ∀i 6= j), dann gilt:
P(
n
[
Ai ) =
i=1
n
X
P (Ai )
i=1
Sn
Als Spezialfall betrachten wir den Fall wenn die Reihe der Ereignisse A1 , A2 , ..., An i=1 Ai =
E erfüllt, wobei E das sichere Ereignis ist. In diesem Fall sagen wir, dass die Reihe
Pnder Ereignisse A1 , A2 , ..., An eine vollständige Reihe von Ereignissen darstellt, und es gilt: i=1 P (Ai ) = 1
3. Kann das Ereignisfeld in n Ergebnisse oder einzelne Ereignisse zerfallen, E = {x1 , ..., xn },
dann gilt:
P (x1 ) + P (x2 ) + ... + P (xn ) =
n
X
P (xi ) = 1
i=1
Spezialfall: Ist die Wahrscheinlichkeit in jedem einzelen Ereignis oder Ergebnis dasselbe,
P (xi ) = 1/n, und das Ereignis A besteht aus k Ergebnissen, dann gilt: P (A) = k/n, welches die Laplace’sche Regel darstellt.
4. Sind A und B zwei zufällige Ereignisse dann gilt:
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
Diese Eigenschaft trifft auch im Falle von drei Ereignissen zu, und wir erhalten:
P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C)
17
Beispiel 2.3.1 Gehen Sie von folgenden Experiment aus: Wir ziehen vier Karten vom ”Mus”
Kartenstapel ohne diese wieder zurückzulegen. Zusätzlich notieren wir uns ob die gezogene Karte
eine höhere Karte (Bube, Dame, König) ist oder nicht. Am Ende zählen wir die aufgetretenen
höheren Karten zusammen.
Denken Sie sich folgendes Ereignisfeld die Anzahl der höheren Karten, die wir gezogen haben
(0,1,2,3 ó 4).
a)Beschreiben Sie das Ergebnis und berechnen Sie deren Wahrscheinlichkeiten.
Die Ergebnisse lauten
Ai = ”wir haben i ... Karten, i = 0, 1, 2, 3, 4”
Da ja 16 höhere Karten im gesamten Kartenstapel existieren, wenden wir nun die Laplas’sche
Regel an. Die Wahrscheinlichkeit zufällig eine Karte vom ”Mus” Spielkartenstapel zu ziehen ist
2
24
3
16
40 = 5 und die Wahrscheinlichkeit dass die Karte keine höhere Karte ist 40 = 5 . Von diesen
Berechnungen und der vorigen Erklärungen sehen wir, dass die Wahrscheinlichkeit dieser Ereignisse
folgend berechnet wird:
3
2 3
2 3
2 3
2
P (A0 ) = ( )4 , P (A1 ) = 4 ( )3 , P (A2 ) = 6( )2 ( )2 , P (A3 ) = 4( )3 , P (A4 ) = ( )4
5
5 5
5 5
5 5
5
b)Wenn B = ”Wir haben eine höhere Karte gezogen ”, berechnen Sie P (B).
Es gilt dass B = Ac0 ,also, P (B) = P (Ac0 ) = 1 − P (A0 ) = 1 − ( 53 )4 =
c) C = ”Wir haben drei oder mehr höhere Karten gezogen ”
C = A3 ∪ A4 , also A3 ∩ A4 = ∅. Es gilt P (C) = P (A3 ∪ A4 ) = P (A3 ) + P (A4 ) = 4( 25 )3 35 + ( 25 )4 =
2.4
2.4.1
Berechnung der Wahrscheinlichkeit in komplexeren Fällen
Die bedingte Wahrscheinlichkeit
Wir teilen die Karten erneut. Es wird eine nach der anderen Karte ausgeteilt und wir erhalten
unsere Karten nach der 4. Runde, der letzten Runde. Der erste Spieler hat einen König, der zweite
Spieler hat eine As und der dritte Spieler hat einen Buben bekommen. Wie hoch ist die Wahrscheinlichkeit, dass wir eine As erhalten? Wenden wir die Laplac’sche Regel an dann beträgt die
7
, da ja bereits drei Karten ausgeteilt wurden und 37 Karten
Wahrscheinlichkeit eine As zu haben 37
übrigbleiben und eine As ist bereits an den zweiten Spieler gegangen. Folglich befinden sich noch 7
Asse im Kartenstapel. Stellen Sie sich nun vor kein Spieler hätte eine As erhalten. Was hoch wäre
dann die Wahrscheinlichkeit? In diesem Fall wären 8 Asse im Kartenstapel, folglich wäre die Wahr8
scheinlichkeit: 37
. Stellen Sie sich diesmal vor zwei Spieler hätten eine As bekommen. Wie hoch ist
6
in diesem Fall die Wahrscheinlichkeit eine As zu erhalten? Sie wäre 37
. Wie Sie sehen ändert sich
der Wert der Wahrscheinlichkeit eine As zu erhalten ständig und hängt auch von den Karten, die
unsere Rivalen erhalten haben ab. Also hängt die Wahrscheinlichkeit eines Ereignises auch davon
ab wieviel Infomationen wir vor dem Experiment erhalten. In diesem Fall ist die Information, die
wir zuvor erhalten, die Spielkarten unserer Gegner, d.h. wir wissen welche Karten nicht im Stapel
sein werden wenn wir an der Reihe sind.
In diesen Fällen ist es sehr einfach die Wahrscheinlichkeiten zu berechnen. Jedoch benötigen wir
für schwierigere Fälle eine Formel zur Berechnung der Wahrscheinlichkeiten.
Lassen Sie uns nun zum vorhin erklärten Beispiel zurückkehren. Bezeichnen wir das Ereignis
A mit ”Meine Karte ist eine As” A und das Ereignis B mit ”Die ersten drei Spieler haben: einen
18
König, eine As bzw. einen Buben erhalten”, dann müssen wir P (A) berechnen, wobei wir die
Karten der anderen Spieler wissen, d.h. wir wissen, dass das Ereignis B eingetreten ist. Wir wollen
die Wahrscheinlichkeit des Ereignisses A unter Voraussetzung des Ereignisses B berechnen und
schreiben A/B. Für die Berechnung wenden wir die Formel für die bedingte Wahrscheinlichkeit an,
die lautet:
P (A/B) =
P (A ∩ B)
P (B)
Wir müssen also P (A ∩ B) und P (B) berechnen. Zur Berechnung von P (B) wenden wir das
bereits kennengelernte Konzept ”Ziehen ohne zurücklegen” an und erhalten:
P (B) =
8 8 4
·
·
40 39 38
während es für das Eintreten von A ∩ B nötig ist dass die vier Spieler einen König, eine As, einen
Buben und eine As erhalten. Die Wahrscheinlichkeit von A ∩ B ist
P (A ∩ B) =
8 8 4 7
·
·
·
40 39 38 37
Nun wenden wir die Formel der bedingten Wahrscheinlichkeit an:
P (A/B) =
P (A ∩ B)
=
P (B)
8
40
·
8
40
8
39
·
·
8
39
4
38
·
·
4
38
7
37
=
7
37
In diesem Fall hätten wir auch ohne bedingte Wahrscheinlichkeit auskommen können, aber in
anderen Fällen ist sie unumgänglich.
Definition 2.4.1 Wir schreiben das Eintreten des Ereignisses A unter der Bedingung von B als
A/B. Es gilt:
P (A ∩ B)
P (A/B) =
P (B)
2.4.2
Unabhängigkeit von zufälligen Ereignissen
Lassen Sie uns nochmals die Erklärungen von vorhin und das Beispiel im Unterkapitel über die
Baum Diagramme betrachten.
Wenn Sie sich erinnern haben wir einige Operationen durchführen müssen um die Wahrscheinlichkeit zu berechnen, nur es handelte sich eher um einen einfachen Fall. Überlegen Sie sich anstelle
der zwei möglichen Ergebnisse (König oder nicht König im ersten Durchgang und Bube oder nicht
Bube im zweiten Durchgang) drei Ergebnisse. Es wären dann neun Wahrscheinlichkeiten im Gesamten, wenn wir vier mögliche Ergebnisse nach jedem Durchgang hätten dann hätten wir 16
Wahrscheinlichkeiten nach dem zweiten Durchgang. Allgemein: Wenn wir n Ergebnisse in jedem
Durchgang haben dann haben wir nach zwei Durchgängen n2 Fälle zu untersuchen. Das ist sehr
viel. Und das nur bei zwei Durchgängen. Wenn die Anzahl der Durchgänge 3 beträgt dann hätten
wir n3 mögliche Ergebnisse. Bei 4 hätten wir n4 ,... Die Baum Diagramm Technik kommt hier nicht
mehr zum Tragen denn bei grösseren Zahlen ist es fast unmöglich einen Baum zu zeichnen.
19
Es gibt einen einfacheren Weg die Wahrscheinlichkeit von diesen Ereignissen zu berechnen. Es
bedarf jedoch zuvor noch einer Einführung eines neuen Konzepts: der Unabhängigkeit von zufälligen
Ereignissen.
Definition 2.4.2 Gegeben sei ein zufälliges Experiment und zwei Ereignisse dieses Experiments,
bezeichnet mit A und B. Wir erklären die beiden Ereignisse für unabhängig, wenn es für das Eintreten des einen Ereignisses nicht nötig ist, dass das andere Ereignis eintritt.
In anderen Worten: Zwei Ereignisse A und B sind unabhängig wenn die Wahrscheinlichkeit von A
gleich der bedingten Wahrscheinlichkeit A unter der Bedingung von B und umgekehrt ist.
P (A/B) = P (A)
and
P (B/A) = P (B)
Zwei Ereignisse A und B werden als unabhängig bezeichnet wenn die Wahrscheinlichkeit von A und
B gleich dem Produnkt der Wahrscheinlichkeit von A und B ist.
P (A ∩ B) = P (A) · P (B)
Dieses Erkenntnis wird häufig bei der Berechnung von Wahrscheinlichkeiten in der Wiederholung
von zufälligen Experimenten angewendet. Also wenn wir ein zufälliges Ereignis n mal wiederholen
und wir wissen, dass das Resultat nach einigen Malen unabhängig von den vorigen ist und wir
zusätzlich die Wahrscheinlichkeit des Eintretens von Ai in jeder Wiederholung, ∀ i = 1, ..., n, berechnen dann erhalten wir die Wahrscheinlichkeit für alle Ereignisse. Es ist dies der Durchschnitt
aller Ereignisse: A1 ∩ A2 ∩ ... ∩ An ,
P (A1 ∩ A2 ∩ ... ∩ An ) = P (A1 ) · P (A2 ) · ... · P (An )
Beispiel 2.4.1 Ziehen wir zufällig zwei Karten von dem ”Mus” Spiel mit zurücklegen. Wie hoch ist
die Wahrscheinlichkeit, dass beide Karten höhere Karten sind? Wie hoch ist die Wahrscheinlichkeit
dass keine Karte eine höhere Karte ist? Wie hoch ist die Wahrscheinlichkeit dass eine der beiden
Karten eine höhere Karte ist und die andere nicht?
Bezeichnen wir das Ereignis ”Die erste Karte ist eine höhere Karte” mit A und das Ereignis
”Die zweite Karte ist eine höhere Karte”mit B, dann erhalten wir das Ereignis ”Beide Karten sind
höhere Karten” mit A ∩ B. Natürlich sind dies alles unabhängige Ereignisse, da wir ja Ziehen mit
zurücklegen und sich daher auch die Ausgangsbedingungen bei jedem Durchgang nicht unterscheiden.
Es gilt:
16 16
P (A ∩ B) = P (A) · P (B) =
·
40 40
Das Ereignis ”Keine der beiden Karten ist eine höhere Karte” wird auf folgende Weise durch
die Ereignisse A und B repräsentiert: Ac ∩ B c . Es sind auch dies zufällig Ereignisse daher wird die
Wahrscheinlichkeit dieser Ereignisse so berechnet:
P (Ac ∩ B c ) = P (Ac ) · P (B c ) = (1 − P (A)) · (1 − P (B)) =
24 24
·
40 40
Das Ereignis ”Eine Karte ist eine höhere Karte, die andere nicht” wird auf folgende Weise durch
die Ereignisse A und B repräsentiert: Ac ∩ B und A ∩ B c . Es kann möglich sein, dass die erste
Karte eine höhere Karte ist und die zweite nicht und umgekehrt. Das Ereignis das wir untersuchen
20
möchten ist die Vereinigung beider Ereignisse (Ac ∩ B) ∪ (A ∩ B c ). Da sie unabhängige Ereignisse
sind, Zerlegung wegen (Ac ∩ B) ∩ (A ∩ B c ) ⊂ A ∩ Ac = ∅ ⇒ (Ac ∩ B) ∩ (A ∩ B c ) = ∅), kann die
Wahrscheinlichkeit dieses Ereignisses folgend berechnet werden:
(P (Ac ∩B)∪(A∩B c )) = P ((Ac ∩B))+P ((A∩B c )) = P (Ac )·P (B)+P (A)·P (B c ) =
24 16 16 24
· + ·
40 40 40 40
Sie können nun erkennen welches der drei Ereignisse eher eintritt.
Übung 2.4.1 Überlegen Sie sich folgendes Experiment: Ziehen Sie willkürlich zwei Karten vom
Kartenstapel mit zurücklegen. Sie legen die Karte also nachdem sie sie gesehen haben wieder zurück
bevor Sie die nächste ziehen. Addieren Sie Werte der Karten im ”Mus” Spiel. Beantworten Sie
folgende Fragen:
a) Beschreiben Sie das Ereignisfeld, das sichere und das unmögliche Ereignis des Experiments.
b)Berechnen Sie die Wahrscheinlichkeit der Summe der Karten mit Wert 20.
c) Berechnen Sie die Wahrscheinlichkeit der Summe der Karten mit Wert sechs oder weniger
als sechs.
Übung 2.4.2 Wiederholen Sie die Übung aber diesmal mit dem Konzept des Ziehens ohne zurücklegen,
d.h. sie legen die Karte nicht wieder auf den Stapel zurück.
2.4.3
Totale Wahrscheinlichkeit
Stellen Sie sich vor wir ziehen zwei Karten von Kartenstapel ohne diese zurückzulegen. Wir
betrachten zunächst die erste und dann die zweite Karte. Wir groß ist die Wahrscheinlichkeit, dass
die zweite Karte ein König ist? Mit dem Wissen das wir bereits haben, können wir sagen, dass wenn
die erste Karte ein König war die Wahrscheinlichkeit für die zweite Karte ein König zu sein gleich
7
39 ist.
Ist jedoch die erste Karte kein König, dann ist die Wahrscheinlichkeit für die zweite Karte ein
8
. Hier wird deutlich, dass es von der ersten Karte abhängt mit welcher
König zu sein gleich 39
Wahrscheinlichkeit eine bestimmte Karte als zweite Karte gezogen wird. Im Teilkapitel über die
bedingte Wahrscheinlichkeit haben wir vorteilhaft begonnen. Wir kannten nämlich die erste Karte.
Nun wissen wir dies nicht mehr. Wie können wir dieses Problem nun lösen? Wir müssen in diesem
Fall beide Wahrscheinlichkeiten berücksichtigen. Die erste Karte kann also ein König oder irgendeine
andere Karte sein. Lösung des Problems:
Überlegen Sie sich folgende zufällige Ereignisse:
1. A1 = ”Die erste Karte ist ein König”
2. A2 = ”Die zweite Karte ist ein König”
Wir wollen P (A2 ) berechnen. WAlso werden wir sehen, ob das Ereignis A1 eintritt oder nicht. Wie
können wir das machen? Nunja wir werden einfach P (A2 ) in verschiedene Wahrscheinlichkeiten aufteilen, die ein Rechnen erleichtern. Dazu werden wir auf die Operationen, die wir bei den zufälligen
Ereignissen angewendet hatten, zurückgreifen.
Wir nehmen an A1 sei das Komplement des Ereignisses A1 , dann erhalten wir:
A1 ∪ A1 = E,
A1 ∩ A1 = ∅
21
Weiters gilt:
A2 = A2 ∩ E =⇒ A2 = (A2 ∩ A1 ) ∪ (A2 ∩ A1 )
und:
(A2 ∩ A1 ) ∩ (A2 ∩ A1 ) = ∅
es gilt:
P (A2 ) = P (A2 ∩ A1 ) + P (A2 ∩ A1 )
Wenden wir nun die Formel der bedingten Wahrscheinlichkeit an, dann erhalten wir:
P (A2 ∩ A1 ) = P (A2 /A1 )P (A1 )
und
P (A2 ∩ A1 ) = P (A2 /A1 )P (A1 )
Jetzt können wir die zwei Wahrscheinlichkeiten leicht berechnen. Die Laplace’sche Regel und
die Techniken, die wir bei den Ziehungen ohne zurücklegen behandelt haben, ermöglichen uns ein
Lösen und es ergibt sich:
P (A2 /A1 )P (A1 ) =
7 8
·
39 40
und
8 32
= ... = 00 2
·
39 40
Wie Sie an diesem Beispiel gesehen haben wurde die Wahrscheinlichkeit in zwei Summanden
aufgeteilt. Im ersten Summanden setzen wir voraus, dass die erste Karte ein König ist, A1 , und im
zweiten nehmen wir an die erste Karte ist kein König, A1 .
Die Ereignisse A1 und A1 haben zwei wichtige Eigenschaften
P (A2 /A1 )P (A1 ) =
A1 ∩ A1 = ∅ y A1 ∪ A1 = E
Diese Technik kann als allgemeingültige Regel benutzt werden:
Haben wir eine Reihe inkonsistenter Ereignisse A1 , A2 , ..., An in Paaren (Ai ∩ Aj = ∅ ∀i 6= j),
und gilt dass A1 ∪ A2 ∪ ... ∪ An = E, (stimmen sie mit diesen Bedingungen übererein so ist
diese Reihe eine komplette Reihe der Ereignisse), dann ist die Wahrscheinlichkeit eines Ereignisses
S ⊂ E gleich mit
P (S) = P (A1 ) · P (S/A1 ) + P (A2 ) · P (S/A2 ) + ... + P (An ) · P (S/An )
und diese Formel wird als Formel der Totalen Wahrscheinlichkeit bezeichnet.
Der schwierigste Teil des Anwendens der Formel über die Totale Wahrscheinlichkeit ist es eine
geeignete Reihe von Ereignissen zu wählen. Eine schlecht gewählte Reihe von Ereignissen bringt
noch größere Schwierigkeiten mit sich. Also ist es nötig geeignete Ereignisse herauszufinden, denn
eine schlechte Wahl von Ereignissen einer kompletten Reihe von Ereignissen hilft nicht das Problem
zu lösen.
22
Übung 2.4.3 Finden Sie die Wahrscheinlichkeit, in demselben Experiment wie am Anfgang dieses
Kapitels, sodass die zweite Karte keine höhere Karte ist.
Übung 2.4.4 Lassen Sie uns mit folgender Übung fortfahren: Wir teilen drei Karten im Zuge des
”Mus” Spiels aus. Berechnen Sie zuvor eine komplette Reihe von Ereignissen und wenden Sie die
Formel der Totalen Wahrscheinlichkeit darauf an, sodass die dritte Karte eine As ist. Wie hoch ist
die Wahrscheinlichkeit, dass die dritte Karte keine As ist?
Vorschlag: Wählen Sie als komplette Reihe von Ereignissen die Anzahl der gezogenen Assen als die
zwei ersten Karten.
2.4.4
Bayes’sche Regel
Lassen Sie uns zurückgehen auf das vorige Beispiel und dessen Situation. Wir haben zwei Karten
ohne zurücklegen gezogen. Es stellt sich nun eine neue Frage: Wie hoch ist die Wahrscheinlichkeit,
dass die erste Karte ein König ist wobei wir bereits wissen, dass die zweite Karte ein König ist.
Diese Frage klingt wie eine Fragen, die wir im vorigen Kapitel bereits behandeln hätten können.
Es besteht aber ein bedeutender Unterschied: In diesem Fall haben wir ein Experiment bereits
durchgeführt (wir haben die zweite Karte schon gesehen)und fragen uns nun welche Karte die erste
war. Nennen wir die Eeignisse A1 und A2 wie zuvor, dann berechnen wir:
P (A1 /A2 )
Wenden nun die Formel der bedingten Wahrscheinlichkeit an und erhalten:
P (A1 /A2 ) =
P (A1 ∩ A2 )
P (A2 )
Ändern wir nun den Nenner entsprechend der Formel für die Totale Wahrscheinlichkeit und
wenden die Formel der bedingten Wahrscheinlichkeit im Zähler an, dann sehen wir:
P (A1 /A2 ) =
P (A2 /A1 )P (A1 )
P (A2 /A1 )P (A1 ) + P (A2 /A1 )P (A1 ))
Diese Berechnung ist nun einfacher als jene im vorigen Kapitel. Es ergibt sich:
P (A1 /A2 ) =
7 8
39 40
1
5
=
7
39
Im Allgemeinen wird die Bayes’sche Formel wie folgt angewandt:
Gegeben sei eine vollständige Reihe von Ereignissen A1 , A2 , ..., An und ein Ereignis S. Wir
möchten die Wahrscheinlichkeit des Auftretens des Ereignisses Ai berechnen wobei wir wissen,
dass nachdem wir das Experiment durchgeführt haben das Ereignis S eintritt, d.h. wir werden
P (Ai /S) berechnen. Wegen vorhin gilt:
P (Ai /S) =
P (Ai ∩ S)
P (S/Ai ) · P (Ai )
= Pn
P (S)
i=i P (S/Ai ) · P (Ai )
23
wobei P (Ai ) die Wahrscheinlichkeit a priori des Ereignisses Ai ist (sie ist bereits im Vorhinein
bekannt) und P (Ai /S) die Wahrscheinlichkeit a posteriori, da sie erst berechnet wird wenn das
Experiment durchgeführt wurde.
Wie auch schon im Kapitel über die bedingte Wahrscheinlichkeit hervorgegangen ist, ist es
auch hier bei der Anwendung der Bayes’schen Formel nötig eine geeignete Reihe von vollständigen
Ereignissen zu wählen (CSE), welches den schwierigsten Teil darstellt.
Übung 2.4.5 Sie spielen wieder das ”Mus” Spiel und ziehen diesmal zwei Karten. Berechnen Sie
die Wahrscheinlichkeit eine Sieben beim ersten Ziehen zu erhalten wobei die wissen, dass die zweite
gezogene Karte ein Bube ist.
Übung 2.4.6 Nun ziehen wir zufällig vier Karten vom Kartenstapel. Wir wissen, dass die erste
Karte eine As ist. Wie hoch ist die Wahrscheinlichkeit, dass auch die erste Karte eine As ist? Wie
hoch ist die Wahrscheinlichkeit, dass die erste Karte ein Bube ist?
Hinweis: Für die zwei Fragen müssen Sie zwei verschiedene vollstängige Reihen von Ereignissen
wählen.
2.5
Antwort auf die anfängliche Frage
Am Beginn dieser Arbeit stellten wir folgendes Beispiel vor: Vier Freunde spielten das ”Mus
Spiel”. Sie erhielten acht Paare von Königen, sechs Trios von Assen oder Königen und fünf Doppel.
Die Freunde unterhielten sich welche dieser Kombinationen am ehesten eintritt und kamen zu keiner
Einigung. Also halfen wir ihnen. Die folgenden Ereignisse benennen wir:
• RR = ”Erhalten eines Paares von Königen”
• M = ”Erhalten eines Trios von Assen oder Königen ”
• D = ”Erhalten irgendeines Doppels”
Wir werden nun die Wahrscheinlichkeit berechnen ein Paar von Königen zu erhalten, also P (RR).
Um dieses Paar zu erhalten müssen wir (offensichtlich) zwei Könige und zwei andere Karten ausser
Königen haben. Dise können auch nicht gleich sein, da wir sonst ein Doppel von Königen und
anderen zwei Karten hätten.
Nun werden wir zwei Fälle unterscheiden. Im ersten Fall haben wir eine As und im zweiten Fall
nicht, da die Anzahl der Asse im Kartenstapel unterschiedlich der anderen Karten ist.
Ereignis B sei nun ”Erhalten einer As”. Nach Anwendung der Regel für die Totale Wahrscheinlichkeit ergibt sich:
P (RR) = P (RR/B)P (B) + P (RR/B)P (B) = P (RR ∩ B) + P (RR ∩ B)
Wir bezeichnen das Ereignis A mit dem Erhalten einer As und C und C 0 als Erhalten von
unterschiedlichen Karten ausser Königen oder Assen und wiederum unterschiedlich dann könnte
ein Paar von Königen folgend aussehen:
(R, R, A, C)
24
Haben wir eine As oder
(R, R, C, C‘)
, haben wir keine As und die Karten (R, R, A, C) mit allen möglichen Variationen in der Anordnung
ergibt das Ereignis RR∩B. Die anderen Karten (R, R, C, C 0 ) mit allen möglichen Anornungen ergibt
das Ereignis RR ∩ B.
Lassen Sie uns zunächst die Wahrscheinlichkeit berechnen, dass nach dem Austeilen folgende Karten in dieser Ordnung erhalten wurden (R, R, A, C). Dann werden wir berechnen wieviele
mögliche Variationen es gibt und da ja alle die gleiche Wahrscheinlichkeit aufweisen brauchen wir
nurmehr die Wahrscheinlichkeiten zu multiplizieren. Lassen Sie uns P (R, R, A, C) berechnen. Die
8
, die Wahrscheinlichkeit dass die zweite
Wahrscheinlichkeit dass die erste Karte ein König ist ist 40
7
Karte auch ein König ist ist 39 . Die Wahrscheinlichkeit der dritten Karte eine As zu sein beträgt
8
38 , während die Wahrscheinlichkeit der vierten Karte eine andere Karte als ein König oder eine As
24
zu sein gleich 37
ist. Es gilt:
8 7 8 24
P (R, R, A, C) =
40 39 38 37
Lassen Sie uns die Wahrscheinlichkeit nun in einem anderen Auftreten der Karten berechnen
um zu sehen, dass die Wahrscheinlichkeit dieselbe ist. Zum Beispiel:
P (A, R, C, R) =
8 8 24 7
8 7 8 24
=
= P (R, R, A, C)
40 39 38 37
40 39 38 37
Dies könnte man nun auch für die anderen Variationen durchrechnen. Es müsste aber nun einsichtig
sein dass sie alle gleich sind.
Wenn einmal die Wahrscheinlichkeit eines dieser gefunden wurde, dann kann man die Anzahl
der möglichen Variationen der Karten leicht berechnen.
Wir haben eine Variation von vier Karten in welcher zwei Karten doppelt auftreten. Die allgemeine Formel für Variation mit Wiederholung von n Elementen wo n1 Elemente von derselben Art
sind, n2 Elemente einer anderen Art,... und nk wieder einer anderen Art
Vnn1 ...nk =
n!
n1 ! · n2 ! · ... · nk !
In unserem Fall also
P (R, R, A, C) =
4!
24
=
= 12
2!1!1!
2
Wir erhalten:
P (RR ∩ B) = 12
8 7 8 24
40 39 38 37
Um P (RR∩B) zu erhalten müssen wir mit einem ähnlichen Prozess fortfahren. Als erstes werden
wir P (R, R, C, C 0 ) berechnen. Nun folgt das Anwenden der Laplace’schen Regel Karte für Karte.
Dies ergibt:
8 7 24 20
P (R, R, C, C 0 ) =
40 39 38 37
Wiederum sind alle Variationen gleich. Es existieren 12 mögliche Anordnungen, die durch Variation mit Wiederholung von 4 Elementen entstehen, wobei zwei Elemente wiederholt werden. Dies
25
ergibt 12 mögliche Anordnungen. Sie sind alle gleich wahrscheinlich und die Wahrscheinlichkeit ein
Paar von Königen und keiner As ist
P (RR ∩ B) = 12
8 7 24 20
40 39 38 37
Nach der Formel für die Totale Wahrscheinlichkeit ergibt sich:
P (RR) = P (RR ∩ B) + P (RR ∩ B) = 12
8 7 8 24
8 7 24 20
+ 12
= 00 255
40 39 38 37
40 39 38 37
Nun wollen wir P (M ) berechnen. Das Trio kann aus Königen oder Assen bestehen. Also kann
die erste Karte ein König oder eine As sein. Die zweite Karte muss ein König sein wenn die erste
Karte einer war, und muss eine As sein wenn die erste Karte eine As war. Mit der dritten Karte ist
es dasselbe. Die vierte Karte darf nicht dieselbe sein wie die drei Karten zuvor denn sonst hätten
wir ein Doppel und kein Trio. Die Wahrscheinlichkeit ein Trio von Assen oder Königen zu erhalten
ist also:
8 7 6 32
8 7 6 32
16 7 6 32
+
=
40 39 38 37 40 39 38 37
40 39 38 37
und alle sind gleich wahrscheinlich. Nehmen wir an der erste Summand sein die Wahrscheinlichkeit ein Trio von Königen zu erhaltenund, die zweite die Wahrscheinlichkeit ein Trio von Assen
zu erhalten. Dies sind inkonstistente Ereignisse und daher brauchen nur die Wahrscheinlichkeiten
addiert zu werden um auf das Ergebnis zu kommen.
Um die Anzahl der möglichen Anordungen zu berechnen ziehen wir die Formel für die Variation
mit Wiederholung zu Hilfe. In diesem Fall haben wir vier Elemente in welchen drei gleich sind und
4!
4
eines unterschiedlich. Also haben wir V3,1
= 3!
= 4 mögliche Anordnungen derselben Karten.
Da sie gleich wahrscheinlich sind müssen wir nur die Wahrscheinlichkeiten einer Anordnung mit
der Anzahl der möglichen Anordnungen multiplizieren. Es ergibt sich:
P (M ) = 4
16 7 6 32
= 00 039
40 39 38 37
Schießlich möchten wir noch die Wahrscheinlichkeit berechnen ein Doppel im ”Mus” Spiel zu
erhalten. Dazu werden wir das Ereignis des Erhaltens irgendeines Doppels aufspalten in die verschiedenen Doppel die wir erhalten können, abhängig davon ob wir Könige, Asse oder beide haben.
Wir können folgende Doppel erhalten:
8 7 8 7
1. Könige-Asse (R, R, A, A). P (R, R, A, A) = 40
39 38 37 Hier liegt eine Variation von vier Ele4!
4
menten vor die in Paaren dieselben sind, also gibt es V2,2
= 2!2!
= 6 mögliche Anordnungen.
Die Wahrscheinlichkeit des Erhaltenes eines Doppels von Königen und Assen ist daher
6
8 7 8 7
40 39 38 37
26
2. Ein Doppel von Königen und einer anderen Karte, die keine As oder ein König ist, ist
8 7 24 3
(R, R, C, C). P (R, R, C, C) = 40
39 38 37
4
Auch in diesem Fall haben wir V2,2
=
Erhaltens eines Doppels dieser Art
4!
2!2!
6
= 6 Variationen, also ist die Wahrscheinlichkeit des
8 7 24 3
40 39 38 37
3. Ein Doppel von Assen und einer anderen Karte ausser König und As ist (A, A, C, C). P (A, A, C, C) =
8 7 24 3
4!
4
40 39 38 37 Wieder haben wir V2,2 = 2!2! = 6 Variationen, Also ist die Wahrscheinlichkeit des
Erhaltens dieses Doppels
8 7 24 3
6
40 39 38 37
8 7 6 5
4. Könige-Könige (R,R,R,R). Es gilt dass P (R, R, R, R) = 40
39 38 37 und da alle Karten gleich
sind haben wir nur eine einzige Anordnung und folglich ist die Wahrscheinlichkeit des Erhaltens diese Doppels
8 7 6 5
40 39 38 37
8 7 6 5
5. Asse-Asse (A,A,A,A). Es gilt dass P (A, A, A, A) = 40
39 38 37 und es ist wiederum jede Karte
gleich also gibt es nur eine Anordnung. Die Wahrscheinlichkeit des Erhaltens des Doppels
Asse-Asse ist
8 7 6 5
40 39 38 37
6. Das Ereignis ”Erhalten eines Doppels ausgenommen von Königen und Asse und die Karten des
Doppels unterscheiden sich” kann wie folgt bezeichnet werden (C,C,C’,C’), y P (C, C, C 0 , C 0 ) =
4!
24 3 20 3
4
40 39 38 37 . Für die möglichen Anordnungen haben wir wieder V2,2 = 2!2! = 6. Die Wahrscheinlichkeit des Erhaltens dieses Doppels ist daher
6
24 3 20 3
40 39 38 37
7. Das letzte möglich Doppel ist jenes in welchem alle vier Karten gleich sind, wobei die Karten
keine Könige und Asse sind. Das ergibt folgende Kombination (C, C, C, C).
3 2 1
Die Wahrscheinlichkeit des Eintretens ist 24
40 3 38 37 und da jede Karte dieselbe ist haben wir
auch nur eine mögliche Anordnung. Die Wahrscheinlichkeit des Erhaltens dieses Doppels ist
daher
24 3 2 1
40 3 38 37
Diese Doppel die wir soeben nummeriert haben sind alle disjunkt (inkonsistent) und ihre Vereinigung
ergibt das Ereignis D = ”Erhalten irgendeines Doppels”. Die Wahrscheinlichkeit P (D) ist gleich der
Summe der Wahrscheinlichkeiten von den vorigen Doppeln. Nach der exakten Berechnung ergibt
sich
P (D) = 00 035
27
Kurz gilt
P (RR) = 00 255
P (M ) = 00 039
P (D) = 00 035
Das Ereignis des Paars von Königen ist unter den dreien am wahrscheinlichsten. Während die
Ereignisse ”Ziehen eines Trios von Königen oder Assen” und ”Ziehen von irgendeinen Doppel” sehr
ähnliche Wahrscheinlichkeiten liefern.
Mit diesen Berechnungen sind wir nun in der Lage Auskunft über die Frage, die sich die Freunde
gestellt haben, zu geben. Obwohl es wahrscheinlicher ist ein Paar von Königen als ein Doppel zu
erhalten muss dies nicht in Realität so sein. Wenn wir also sagen, dass ein Ereignis wahrscheinlicher
ist als ein anderes heisst das nicht, dass dieses Ereignis immer und immer häufiger als ein anderes
Ereignis eintritt. Theoretisch hat es eine höhere Wahrscheinlichkeit einzutreten als die anderen. Bei
der Wahrscheinlichkeitsrechnung sehen Sie den Unterschied zwischen Theorie und Praxis sehr gut.
28
Kapitel 3
Eindimensionale
Wahrscheinlichkeitsverteilungen
3.1
Zielsetzungen
• Verständnis des Konzept der Wahrscheinlichkeitsveteilung und Begründungen.
• Berechnen der Dichte- Wahrscheinlichkeitsfunktion (DP F ) und der Cumulative Wahrscheinlichkeitsfunktion (CP F ) einer Wahrscheinlichkeitsverteilung.
• Verständnis des Konzepts des Modalwertes, des Medians oder Erwartungswertes, der Varianz
einer diskreten Wahrscheinlichkeitsverteilung und deren Berechnung von der DP F oder von
der CP F .
3.2
Beispiel
Ein Börsenanleger hat 1000000 Euro zum Investieren an der Börse zur Verfügung. Er überlegt
sich zwei Möglichkeiten:
• Anlegen des Geldes bei der Bank und Vergewisserung eines 16%igen Gewinns.
• Investitionsvorhaben.
Eine Marktuntersuchung, durchgeführt von einem Börsen Analytiker besagt dass das Investitionsvorhaben von vorhin folgende Gewinne mit den eigenen Wahrscheinlichkeiten erzielt:
29
Gewinn (%)
30
25
20
15
10
5
0
Wahrscheinlichkeit
0’15
0’2
0’25
0’15
0’1
0’1
0’05
Der Anleger muss nun eine Entscheidung treffen wie er sein Geld am besten anlegt. Zwei Fragen
können gestellt werden:
Der Anleger vertraut dem Konzept des erwarteten Gewinns (das Geld das er durchschnittlich
gewinnen würde wenn er mehrmals anlegt). Wie werden wir uns entscheiden? Ziehen wir den erwarteten Gewinn des Investmentvorhabens, um mehr zu gewinnen, vor?
Eine andere Möglichkeit wäre: Der Anleger will nicht viel riskieren und will zumindest 16%
Gewinn mit 70%iger Wahrscheinlichkeit. Was machen wir in diesem Fall?
Wir werden diese Problem lösen, indem wir die Wahrscheinlichkeitsverteilung zu Hilfe ziehen, ein
Konzept das noch genauer erklärt wird.
3.3
Einleitung. Diskrete Zufallsvariablen und Wahrscheinlichkeitsverteilungen
Zuvor haben wir gelernt wie man die Wahrscheinlichkeiten von verschiedenen zufälligen Ereignissen bestimmt. Jede auf eine andere Weise. Dieses Kapitel beschäftigt sich nun mit allgemeinen
Techniken, die explizit erklärt werden.
Im vorigen Beispiel ist eine Tabelle mit den Wahrscheinlichkeiten des Erhaltens von verschiedenen Gewinnen nach dem Investitionsplan. Mit Hilfe dieser Tabelle werden wir entscheiden wie wir
das Geld anlegen werden. Bevor wir nun fortfahren sei nochmals erwähnt, dass die Schlüsse die wir
ziehen werden theoretischer Natur sind. Es ist also möglich dass wir uns für eine Variante entscheiden und wegen der Zufälligkeit der Ereignisse diese Variante falsch ist und unsere Berechnungen
verwift. Weiters gibt uns die Wahrscheinlichkeit nur eine grobe Idee von der Höhe des Profits.
Lassen Sie uns nun mit der Analyse des Problems beginnen.
Wir wollen nun das Konzept der zufälligen Variablen genauer betrachten.
Bei unserem Problem haben wir ein zufälliges Experiment vorausgesetzt, nämlich den Gewinn
den wir nach dem Investmentplan machen. Nach dem zufälligen Experiment können wir in den
verschiedenen Fällen unterschiedliche Gewinne erzielen. Und diese möglichen Gewinne sind nun die
Resultate unseres zufälligen Experiments.
Wir benennen
X = ”Gewinn nach Befolgung des Investitionsplans ”
30
und sagen X ist eine diskrete zufällige Variable und die möglichen Werte die diese Variable annehmen kann sind die Ergebnisse.
In diesem Fall kann die zufällige Variable X sieben Ergebnisse oder Werte liefern (alle verschiedenen Gewinne) die wir mit x und einen Index für jeden einzelen Fall bezeichnen. Die diskrete
zufällige Variable X kann die Werte x1 , x2 , x3 , x4 , x5 , x6 , x7 annehmen, wobei
1. x1 = 0 =⇒ P (X = x1 ) = 00 05
2. x2 = 5 =⇒ P (X = x2 ) = 00 1
3. x3 = 10 =⇒ P (X = x3 ) = 00 1
4. x4 = 15 =⇒ P (X = x2 ) = 00 15
5. x5 = 20 =⇒ P (X = x5 ) = 00 25
6. x6 = 25 =⇒ P (X = x6 ) = 00 2
7. x7 = 30 =⇒ P (X = x7 ) = 00 15
Die Reihe von Werten die eine diskrete Zufallsvariable annehmen kann und die ihre Wahrscheinlichkeit wird als diskrete Wahrscheinlichkeitsverteilung bezeichnet.
P (X = x1 ) = 00 05,
P (X = x2 ) = 00 1,
P (X = x5 ) = 00 2,
P (X = x3 ) = 00 1,
P (X = x6 ) = 00 25,
P (X = x4 ) = 00 15,
P (X = x7 ) = 00 15,
Logischerweise ist die Summe aller dieser Wahrscheilichkeiten gleich 1. Dies kommt von der
Tatsache, dass wenn eine diskrete Zufallsvariable ihre Werte in der Reihe {x1 , ..., xn } annimmt, d.h.
P (X ∈ {x1 , ..., xn }) = 1
weil in jedem Fall die Zufallsvariable einen dieser Werte annehmen wird und dies ist was wir
mit dem sicheren Ereignis bezeichnen. Da sie auch disjunkte (inkonsistente) Ereignisse sind kann
die Zufallsvariable X auch nicht zwei verschiedene Werte zur selben Zeit annehmen. Es gilt:
P (X = x1 ) + ... + P (X = xn ) = P (X = x1 ∪ ... ∪ X = xn ) = P (X ∈ {x1 , ..., xn }) = 1
Wir definieren eine diskrete Zufallsvariable und ihre Wahrscheinlichkeitsverteilung wie folgt:
Definition 3.3.1 Eine zufällige Variable ist ein numerisches Ergebnis eines zufälligen Experiments.
Wir sagen X ist eine diskrete Zufllsvariable wenn sie ihre Werte innerhalb eines Reihe annimmt x1 , x2 , ..., xn , ... und wenn wir sie abzählen können (endlich oder unendlich) mit eigner
Wahrscheinlichkeit
P [X = x1 ], P [X = x2 ], ..., P [X = xn ], ... und es gilt 0 ≤ P [X = xn ] ≤ 1, ∀n
P∞
und i=1 P [X = xi ] = 1. Die vorigen Wahrscheinlichkeiten bilden eine Wahrscheinlichkeitsverteilung für die Variable X, d.h., die Wahrscheinlichkeitsverteilung einer Zufallsvariablen X ist die
Funktion die jedem möglichen Werte die Wahrscheinlichkeit des Wertes zuordnet.
31
In unserer Studie über diskrete Zufallsvariablen werden wir speziell jene Variablen betrachten die
einen Wert innerhalb einer endlichen Reihe annehmen. Als Beispiel dafür dient die Situation die
anfangs beschrieben wurde. Hier sind nur sieben Möglichkeiten vorhanden.
Als Wiederholung dieses Abschnitts wollen wir uns an die Zufallsvariable und die Wahrscheinlichkeitsverteilung erinnern.
Die Zufallsvariable ist X = ”Gewinn nach Befolgung des Investitionsplans” und deren Wahrscheinlichkeitsverteilung ist
P (X = x1 ) = 00 05,
P (X = x2 ) = 00 1,
P (X = x5 ) = 00 2,
P (X = x3 ) = 00 1,
P (X = x6 ) = 00 25,
P (X = x4 ) = 00 15,
P (X = x7 ) = 00 15,
wobei x1 = 0, x2 = 5, x3 = 10, x4 = 15, x5 = 20, x6 = 25 und x7 = 30.
3.4
Häufigkeits Cumulative Wahrscheinlichkeitsfunktionen
Wie Sie bereits bemerkt haben, haben wir zuvor die Ereignisse x1 , ..., x7 mit den unterschiedlichen
Gewinnen in aufsteigender Reihenfolge benannt. Wir haben x1 mit dem niedrigsten Gewinn, der 0,
x2 mit dem Gewinn 5,... und x7 mit dem größten Gewinn, der 30, gleichgesetzt.
Dies haben wir keinesfalls zufällig und ohne Grund so zugeordnet. Es dient zur Definition einer
neuen Funktion, die die Zufallsvariable X benötigt. Die Funktion charakterisiert X eindeutig, die
Cumulative Wahrscheinlichkeitsfunktion, die wir später genauer behandeln werden.
Zuvor werden wir die zweite Frage des Problems beantworten. Der Anleger möchte mit einer
Wahrscheinlichkeit, höher als 0’7, mindestens 16% Gewinns beim Investitionsplan erzielen. Wenn
dies nicht zu seinem Willen geschieht dann werde er sein Geld bei einer Bank anlegen, die ihm die
16% Gewinn gewährt.
Basierend auf den Zufallsvariablen möchte er, dass P (X > 16) ≥ 00 7. Wie berechnet man dies?
Es ist ziemlich einfach. Man nimmt die möglichen Werte die die diskrete Zufallsvariable X annehmen
kann und addiert ihre Wahrscheinlichkeiten. Man erhält in diesem konkreten Beispiel:
P (X > 16) = P (X = 20) + P (X = 25) + P (X = 30) =
= P (X = x5 ) + P (X = x6 ) + P (X = x7 ) = 00 25 + 00 2 + 00 15 = 00 6
So ergibt sich, dass die Wahrscheinlichkeit einen Gewinn von mehr als 16% zu machen bei nur
0’6 liegt und nicht bei 0’7, sowie es der Anleger versichert haben wollte. Der Anlegeer steigt also in
diesem Fall mit einem Anlegern bei einer Bank, die ihm den 16%igen Gewinn gewährt, besser aus.
Nun wollen wir aber die Funktion definieren welche wir vorhin erwähnten und welche die Zufallsvariable eindeutig charakterisiert. Mit Hilfe diese Funktion, der Cumulative Wahrscheinlichkeitsfunktion (CPF), wird es uns auch möglich sein die vorhin gestellte Frage zu beantworten. Wir
definieren:
32
Definition 3.4.1 Hat man die möglichen Werte, die eine diskrete Zufallsvariable X annehmen
kann in aufsteigender Reihenfolge x1 , ..., xn , dann definieren wir die Funktion
F : R −→ [0, 1]
wie folgt
F (x) = P (X ≤ x)
∀x ∈ R
Für die möglichen Werte von X, xi , ergibt sich P (X ≤ xi ) = P (X = x1 ) + P (X = x2 ) +...+ P (X =
xi ), für alle x von R. Wir erhalten dass P (X ≤ x) die Summe der Wahrscheinlichkeiten aller xi
weniger als x oder gleich wie x ist. Es folgt
X
P (X ≤ x) =
P (X = xi )
xi ≤x
Betrachten wir nun wieder das vorige Beispiel über den Investitiosplan dann ist F :
• Wenn x < 0,
F (x) = 0 weil es kein xi < 0 gibt.
• Wenn x ∈ [0, 5) F (x) = P (X = x1 ) = 00 05.
• Wenn x ∈ [5, 10) F (x) = P (X = x1 ) + P (X = x2 ) = 00 05 + 00 1 = 00 15.
• Wenn x ∈ [10, 15) F (x) = P (X = x1 ) + P (X = x2 ) + P (X = x3 ) = 00 05+00 1+00 1 = 00 25.
• Wenn x ∈ [15, 20) F (x) = P (X = x1 ) + P (X = x2 ) + P (X = x3 ) + P (X = x4 ) =
00 05 + 00 1 + 00 1 + 00 15 = 00 4.
• Wenn x ∈ [20, 25) F (x) = P (X = x1 ) + P (X = x2 ) + P (X = x3 ) + P (X = x4 ) + P (X =
x5 ) = 00 05 + 00 1 + 00 1 + 00 15 + 00 2 = 00 6.
• Wenn x ∈ [25, 30) F (x) = P (X = x1 ) + P (X = x2 ) + P (X = x3 ) + P (X = x4 ) + P (X =
x5 ) + P (X = x6 ) = 00 05 + 00 1 + 00 1 + 00 15 + 00 2 + 00 25 = 00 85.
• Wenn x ≥ 30 F (x) = P (X = x1 ) + P (X = x2 ) + P (X = x3 ) + P (X = x4 ) + P (X =
x5 ) + P (X = x6 ) + P (X = x7 ) = 00 05 + 00 1 + 00 1 + 00 15 + 00 2 + 00 25 + 00 15 = 1.
Kurz können wir die Funktion F wie folgt angeben:

0
wenn x < 0




00 05
wenn 0 ≤ x < 5




wenn 5 ≤ x < 10
 00 15

 0
0 25
wenn 10 ≤ x < 15
F (x) =
wenn 15 ≤ x < 20
 00 4



wenn 20 ≤ x < 25
 00 65



wenn 25 ≤ x < 30
 00 85


1
wenn x ≥ 30
Die Cumulative Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariable kann in Teilen definiert werden. Diejenigen Stellen an denen die Funktion nicht kontinuierlich verläuft geben an wo
die Wahrscheinlichkeit streng positiv ist.
33
Die Funktion F hilft uns bei der Berechnung der Wahrscheinlichkeit der Zufallsvariablen, indem
wir Werte kleiner oder gleich dem gegebenen Wert angeben. So können wir die gefragte Wahrscheinlichkeit mit Hilfe dieser Funktion berechnen. Ziehen wir nun auch die Eigenschaften der
Wahrscheinlichkeit und Gegenwahrscheinlichkeit heran so ergibt sich:
P (X > 16) = 1 − P (X ≤ 16) = 1 − F (16) = 1 − 00 4 = 00 6
was exakt der Berechnung von vorhin entspricht.
Beachten Sie, dass wir mit dem Komlement des Ereignisses X > 16 was X ≤ 16 ergibt gerechnet
haben.
Die Cumulative Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariablen hat einige spezielle
Eigenschaften die wir im folgenden Abschnitt behandeln werden:
1. lim F (x) = 0
x→0
2.
lim F (x) = 0
x→+∞
3. F ist eine monoton steigende Funktion für jede Stelle R.
4. F ist über R kontinuierlich, d.h.
lim F (x) − F (x0 ) = 0
x→x0
∀x0 ∈ R
Die Stellen an denen die Funktion nicht links kontinuierlich ist, sind jene Stellen wo die diskrete
Zufallsvariable verbunden mit dieser Funktion deren Werte annimmt.
Betrachtet man nun die Cumulative Wahrscheinlichkeitsfunktion die wir gefunden haben dann
ergibt sich für die Stellen 0, 5, 10, 15, 20, 25 y 30, dass hier die diskrete Zufallsvariable X genau die
Werte annimmt. Logisch betrachtet ist es eine theoretische Bestätigung, weil ja der Investitionsplan
andere Werte haben kann als die Werte von oben. Die Werte geben uns daher nur eine ungefähre
Ahnung wie hoch der Gewinn sein könnte.
Wenn wir auf der anderen Seite eine Funktion haben, die die obigen Bedingungen erfüllt, dann
haben wir eine Cumulative Wahrscheinlichkeitsfunktion verbunden mit einer diskreten Zufallsvariablen vorliegen.
Und erfüllt sie keine der vier oben spezifizierten Bedingungen dann handelt es sich nicht um
eine Cumulative Wahrscheinlichkeitsfunktion.
3.5
Der Modus
Der Modus einer Zufallsvariablen ist jener Wert, der am häufigsten eingenommen wird. Ein realitätsnahes Beispiel wäre: Angenommen ein bestimmtes Kleidungsstück liegt gerade voll im Trend,
dann gibt es auch bestimmt viele Leute die dieses Kleidungsstück tragen. Entscheiden wir uns nun
zufällig für einen modebewußten Menschen dann trägt er dieses bestimmte Keidungsstück mit einer
höheren Wahrscheinlichkeit als ein anderes. Gleichermaßen wenn eine Zufallsvariable ihre Werte innerhalb einer Reihe {x1 , x2 , ..., xn } annimmt, dann ist der Modus jenes xi das das Maximum der
Cumulative Wahrscheinlichkeitsfunktion angibt.
In dem Beispiel mit dem Anleger ist der Gewinn mit der höheren Wahrscheinlichkeit 20% des
Gewinns. Dieser Wert der Zufallsvariablen ist dann der Modus der Verteilung.
34
3.6
Der Erwartungswert
Nun wollen wir uns mit der ersten Frage unseres Problems beschäftigen. Der Anleger möchte
den zu erwartenden Gewinn des Investitionsplans wissen, um sein Geld bestmöglich anzulegen. Die
Bank gewährt ihm mit Sicherheit einen Gewinn von 16%. Im Investitionsplan hingegen hat er nicht
diese Sicherheit. Hier wird nur von Erwartungen, Erwartungswert, erwarteter Gewinn, Mittelwert,...
gesprochen.
Der Erwartungswert oder Mittelwert ist ein Maß, das uns eine Annäherung des zu Erwartenden
innerhalb eines zufälligen Experiments nach öfteren Wiederholungen, angibt. In einem Spiel sind
die Erwartungen derart, dass man ”hofft” zu gewinnen (oder zu verlieren) nach einer Wette.
Dies ist ein theoretisches Mittel zur Messung des durchschnittlichen Wertes, den wir erhalten
wenn wir ein Experiment öfters durchführen.
In der Häufigkeitsfunktion definieren wir den arithmetischen Mittelwert als
x=
n
X
xi fi
i=1
wobei die xi diejenigen Werte sind die die Zufallsvariable einnehmen kann und die fi sind
die eigenen relativen Häufigkeiten. In einer Wahrscheinlichkeitsverteilung ersetzt man die relativen
Häufigkeiten jedes Wertes mit dessen Wahrscheinlichkeit.
Definition 3.6.1 Der Mittelwert oder Erwartungswert einer Zufallsvariablen X die ihre Werte
innerhalb einer Reihe {x1 , ..., xn } annimmt, mit den eigenen Wahrscheinlichkeiten {p1 , ..., pn }, (das
ist P [X = xi ] = pi , ∀i ∈ {1, 2, ..., n}), und wir nennen es µ oder EX, wird berechnet durch den
Ausdruck
n
X
EX = µ =
xi pi
i=n
So ergibt sich für unser konkretes Beispiel ein Gewinn mit dem Investitionsplan von
µ=
7
X
xi P (X = xi ) =
i=1
= 0 · 00 05 + 5 · 00 1 + 10 · 00 1 + 15 · 00 15 + 20 · 00 25 + 25 · 00 2 + 30 · 00 15 = 180 25
Der zu erwartende Profit des Investitionsplans ist 18’25%, also höher als die 16% die die Bank
bietet.
Auf der einen Seite riskiert der Anleger sein Geld wenn er dem Erwartungswert des Investitionsplans vertraut, auf der anderen Seite kann er aber einen noch höheren Gewinn erzielen, was bei
der Bank unmöglich wäre.
3.7
Die Varianz
Der Anleger möchte nun ein geeignetes Intervall wissen in welchem der Gewinn des Investierungsplans am höchsten ist. Wie kann man nun solche Intervalle berechnen? In diesem Kapitel werden
35
Mittel vorgestellt um ein solches Intervall zu konstruieren. Wie aber bereits erwähnt, ist dieses Intervall sehr einfach und daher auch nicht besonders vertrauenswürdig. Um ein vertrauenswürdigeres
Intervall zu konstruieren ist es nötig statistische Schlüsse zu ziehen was ein anderes Kapitel darstellt.
Oft sind die möglichen Werte einer diskreten Zufallsvariablen sehr unterschiedlich und weit entfernt vom Mittelwert. Wenn die Werte der Zufallsvariablen mehr oder weniger nahe beim Mittelwert
liegen dann ist der Großteil der Werte in einer reduzierten Reihe der erwarteten Werte. Dank dieses neuen Messwertes, der Varianz, ist es möglich ein Intervall zu finden indem der Gewinn des
Investitionsplans mit Sicherheit eintritt.
Um die Konzentrationsrate der Werte einer Zufallsvariablen um den Mittelwert zu messen ist
die Varianz nötig. Die Varianz zeigt, wie weit die Werte vom Mittelwert entfernt sind. Es werden
Ausdrücke (xi − µ)2 benützt, da diese die Distanz zwischen den möglichen Werten xi und dem
Mittelwert der Verteilung µ anzeigen. Summiert man alle Abweichungen auf, dann erhält man ein
Maß für die totale Abweichung der Werte der Variablen.
Wir müssen bedenken dass die Varianz eines Wertes zu jeder Distanz proportional ist zu der
Wahrscheinlichkeit der Variablen die diesen Wert annimmt. Um Klarheit zu schaffen lassen Sie uns
die Definition der Varianz betrachten:
Definition 3.7.1 Eine diskrete Zufallsvariable nimmt ihre Werte innerhalb einer Reihe x1 , ..., xn
an, mit den Wahrscheinlichkeiten p1 , ..., pn . Die Varianz einer diskreten Zufallsvariablen ist definiert
durch X, und wird bezeichnet als σ 2 , und
σ2 =
n
X
(xi − µ)2 pi
i=1
Multiplizieren wir nun jedes der Quadrate der Wahrscheinlichkeiten pi dann ergibt sich eine
bessere Annäherung.
Dies ist eine andere Art die Varianz einer Wahrscheinlichkeitsfunktion zu berechnen. Wir wollen
nun die Formel von der Definition anwenden:
σ2 =
n
X
(xi − µ)2 pi
i=1
basierend auf der vorigen Definition dann ergibt sich nach dem Entwickeln des Quadrats innerhalb
der Summation, dass:
n
X
(x2i + µ2 − 2xi µ)pi =
n
X
1=1
x2i pi +
i=1
n
X
µ2 pi −
i=1
n
X
2xi µpi
i=1
Teilen wir die Summation in drei unterschiedliche Teile dann erhalten wir:
n
X
i=1
x2i pi +
n
X
µpi −
i=1
n
X
2xi µpi
i=1
Rechnen wir in der zweiten Summierung und in der dritten dann können wir das µ herausnehmen
da es konstant ist. Es ergibt sich:
n
X
i=1
x2i pi + µ2
n
X
pi − 2µ
i=1
36
n
X
i=1
xi pi
Pn
X ist die Zufallsvariable und die pi sind die Wahrscheinlichkeiten.
Man erhält i=1 pi = 1 und aus
Pn
der Definition der Erwartung wissen wir dass i=1 xi pi = µ. Setzt man dies nun in den vorigen
Ausdruck ein, dann ist
n
n
X
X
x2i pi + µ2 − 2µµ =
x2i pi − µ2
i=1
i=1
welches die einfachste Formel für die händische Berechnung darstellt.
Es gilt:
n
X
σ2 =
x2i pi − µ2
i=1
Neben den anderen wichtigen Eigenschaften der Varianz sei erwähnt, dass diese eine positive
Maßzahl darstellt. Folglich gilt σ 2 ≥ 0.
Eine Übung zur Berechnung der Varianz einer Wahrscheinlichkeitsverteilung wird später erfolgen, wenn wir das Geld des Anlegers in den Investitionsplan investieren.
Unsere Wahrscheinlichkeitsverteilung war:
P (X = x1 ) = 00 05,
P (X = x2 ) = 00 1,
P (X = x5 ) = 00 2,
P (X = x3 ) = 00 1,
P (X = x6 ) = 00 25,
P (X = x4 ) = 00 15,
P (X = x7 ) = 00 15,
wobei x1 = 0, x2 = 5, x3 = 10, x4 = 15, x5 = 20, x6 = 25 und x7 = 30.
Aus der Formel der Varianz ergibt sich, dass
σ2 =
7
X
x2i pi −µ2 = 0·00 05+25·00 1+100·00 1+225·00 15+400·00 25+625·00 2+900·00 15−3330 625 = 730 1775
i=1
Dieser Wert ist uns aber nicht von Nutzen wenn wir das Intervall, welches wir vorhin besprochen
haben, berechnen wollen. Es ist nur eine Maßzahl die die Einheiten des Mittelwertes oder die Erwartungen der Quadrate ausdrückt. Um diesen Prblem zu lösen muss eine neue Maßzahl eingeführt
werden, die sich als die positive Wurzel der Varianz ergibt und Standard Abweichung genannt wird.
√
σ = + σ2
In unserem Beispiel ist σ = 80 55.
Man kann also sagen dass mit einer sicheren Wahrscheinlichkeit, mehr oder weniger von der
Situation abhängend, die Werte die eine Zufallsvariable X einnehmen kann in einem Intervall (µ −
σ, µ + σ) liegen.
In unserem Beispiel ist das Intervall (90 7, 260 8). Es liegt hier ein ziemlich großes Intervall vor
und ist deshalb nicht sehr nützlich.
Dieses Intervall ist nur eine Annäherung zu den Konfidenzintervallen, welche viel komplexer
aber dafür auch vertrauenswürdiger und exakter sind.
Wichtig ist noch zu erwähnen, dass wie bei den statistischen Variablen, die Varianz von zwei
Zufallsvariablen nicht verglichen werden kann, da die Werte die beide Variablen annehmen nicht in
denselben Einheiten ausgedrückt werden müssen. Ein einfacher Weg beide Variablen√zu vergleichen
stellt die Koeffizientenvariation dar, die definiert ist als CV = σµ , wobei σ = + σ 2 (die Standardabweichung) und µ ist er Mittelwert der Zufallsvariablen. Diese kann mit zwei verschiedenen
Zufallsvariablen verglichen werden da sie nicht-dimensional ist.
37
3.8
Resümee der anfänglichen Frage
Wir wollen nun die Ergebnisse betrachten. Nach diesem Kapitel erhalten wir:
• Im Fall des Investmentplans wäre es besser das Geld in den Investmentplan zu investieren als
auf die Bank zu legen.
• Wollen wir einen höheren Gewinn als 16% mit einer Sicherheit von 70% in einem Investitionsplan, dann ist es in diesem Fall besser das Geld auf die Banz zu legen.
• Das Intervall in welchem sich der Gewinn mit Sicherheit bewegt wurde nur sehr wage und
einfach eingeführt. Es stellt jedoch eine Hilfestellung für eine weitere Einführung von vertrauenswürdigeren Intervallen dar.
38
Kapitel 4
Ein Beispiel einer diskreten
Zufallsvariablen: die
Binomialverteilung
4.1
Ziele
• Kenntnis des zufälligen Experiments mit nur zwei möglichen Ergebnissen: Bernoulli Experiment
• Berechnung der Dichte- Wahrscheinlichkeitsfunktion, der Verteilungsfunktion, des Mittelwertes und der Varianz der Bernoulli Zufallsvariablen.
• Umgehen mit der Binomial Zufallsvariablen und Berechnung ihrer Dichte- Wahrscheinlichkeitsfunktion, Verteilungsfunktion, Mittelwertes und Varianz.
• Unterscheiden zwischen zufälligen Phenomänen gekennzeichnet von einer Binomial Zufallsvariablen und theoretische Umformungen.
4.2
Beispiel
Bei den meisten Menschen ist die rechte Hand besser entwickelt als die linke um Aktivitäten
auszuführen die diese spezielle Kenntnis benötigen: essen, schreiben,... . Diese Leute werden auch
als Rechtshänder bezeichnet. Es gibt jedoch viele Leute die für die vorhin erwähnten Tätigkeiten die
linke Hand benutzen, die sogenannten Linkshänder. Wie bei den Händen benutzen die Linkshänder
auch bevorzugt das linke Bein um bestimmte Aktivitäten durchzuführen wie z.B. Fussballspielen.
Trotz der Tatsache, dass es Millionen von Menschen auf der Erde gibt die Linkshänder sind,
haben diese immer noch Schwierigkeiten bestimmte Geräte, die für Rechtshänder entwickelt wurden
39
zu bedienen, wie z.B. Dosenöffner, Schere oder einige Schreibgeräte. Ein zusätzliches Problem für
linkshändige Schüler stellen die Schultische und Sessel dar, die in vielen High- Schools präsent sind.
Also hat sich der Direktor für die linshändigen Schüler eingesetzt und möchte spezielle Tische
und Sessel für diese bestellen. Es stellt sich nun die Frage wieviele solcher Schulmöbel er bestellen
sollte. Man muss sich folgende Fragen überlegen:
1. Wieviele Sessel sind mindestens nötig in einer Klasse von 50 Schülern, sodass die erwartende
Anzahl an linkshändigen und rechtshändigen Schülern einen passenden Sessel haben?
2. Wieviele Sessel sind mindestens nötig um mit einer Wahrscheinlichkeit von 0’9 sicherzustellen,
dass kein linkhändiger Schüler ohne passenden Sessel existiert. D.h. in 90% der Fälle gibt es
keinen linkshändigen Schüler ohne passenden Sessel.
3. Wie hoch ist der Prozentsatz an Klassenzimmern von 50 Schülern wo mindestens 10 Linkshänder
vertreten sind?
Dies Fragen werden wir am Ende dieses Kapitels beantworten können.
4.3
Einleitung
Wir nehmen an 10% der Bevölkerung seien Linkshänder.
Um die Fragen von vorhin zu beantworten werden wir Schritt für Schritt vorgehen. Zunächst
interessiert uns die Frage: Wie hoch ist die Wahrscheinlichkeit bei einem Schüler, der zufällig gewählt
wurde, dass dieser Linkshänder ist? Die Antwort liegt auf der Hand, da wir eben angenommen haben
dass 10% der Bevölkerung Linkshänder sind, beträgt diese Wahrscheinlichkeit 0’1.
Nehmen wir das folgende zufällige Ereignis”zufälliges Wählen eines High- School Schülers und
Betrachen ob dieser Linkhänder ist oder nicht”, dann können wir das Experiment genauer untersuchen, da Experimente gleicher Art bereits genauer studiert wurden.
Nach Durchführung dieses Experiment gibt es nur zwei Möglichkeiten, entweder ist der Schüler
Linkshänder oder nicht.
Allgemein nennt man diese möglichen Resultate Erfolg (E) und Mißerfolg (F ). In unserem
Beispiel ist der Erfolg wenn der Schüler Linkshänder ist und der Mißerfolg wenn der Schüler
Rechtshänder ist. D.h.:
• E = ”Der Schüler ist Linkshänder”
• F = ”Der Schüler ist nicht Linkshänder”
Nach der allgemeinen Regel schreiben wir p = P (E) und q = P (F ). Offenbar gilt p + q = 1, sodass
q auch als 1 − p geschrieben werden kann.
Diese Versuchsart mit nur zwei möglichen Resultaten, Erfolg und Mißerfolg, wird als Bernoulli
Experiment bezeichnet und ist mit der Wahrscheinlichkeit des Erfolgs p bestimmt. Ein Bernoulli
Zufallsexperiment P (E) = p wird als Be(p) bezeichnet.
Das Experiment einen Schüler zufällig auszuwählen und zu sehen ob dieser Linkshänder ist oder
nicht ist ein Versuch Be(00 1). Diese Versuchsart hilft uns nicht weiter in der Antwortsuche auf die
Frage unseres Beispiels hingegen die Wiederholung des Versuchs sehrwohl. Haben wir nun ein Klassenzimmer mit 50 Schülern und wollen wissen wieviele Schüler Linkshänder sind dann brauchen wir
40
nur das Bernoulli Experiment 50mal wiederholen. Wir betrachten also jeden einzelnen Schüler der
Reihe nach und sehen so wieviele unter ihnen Linkshänder sind. Am Ende der Versuchsreihe haben
wir genau die Anzah der Linkshänder. Die Zufallsvariable die die Anzahl der Linkshänder widerspiegelt wird binominal genannt. Wir wollen nun das Problem genauer erläutern um schlussendlich
die anfänglichen Fragen zu beantworten.
Was versteht man im Allgemeinen unter einer Binomialverteilung? Es liegt folgende Situation
vor:
1. n Wiederholungen desselben Experiments werden unter gleichen Bedingungen durchgeführt
und in jeder Wiederholung gibt es nur zwei mögliche Resultate Erfolg (bezeichnet mit E)
und Mißerfolg (bezeichnet mit F ). Diese beiden Ereignisse sind zueinander komplementär,
d.h. P (E ∪ F ) = 1 und P (E ∩ F ) = 0 (eines dieser tritt immer ein und beide können nie
gemeinsam eintreten)
2. Die Wahrscheinlichkeit des Erfolgs P (E) ist in allen Tests gleich; wir wollen dies mit q bezeichnen. In jeder Wiederholung des Experiments gilt:
P (E) = p ,
P (F ) = 1 − P (E) = 1 − p = q
3. Wenn wir X = ”Anzahl der Erfolge in n Versuchen” gleichsetzen dann kann X die Werte
1, ..., n annehmen und X ist bestimmt durch eine Binomialverteilung.
Die Wahrscheinlichkeitsverteilung die diesen Bedingungen entspricht wird Binomialverteilung der
Parameter p(= P (E)) mit n Wiederholungen genannt und geschrieben als B(n, p).
Wenn also gefragt ist wieviele linkshändige Schüler sich in einer 50 Schüler großen Klasse befinden dann sieht die Zufallsvariable wie folgt aus:
X = ”Anzahl der Linkshänder in einer Klasse mit 50 Schülern”
ist binomialverteilt mit den Parametern p = 00 1 und n = 50, d.h. X ∼ B(50, 00 1)
Wahrscheinlichkeit von k Erfolgen
Intuitiv kann die Frage aufkommen : Wie hoch ist die Wahrscheinlichkeit, dass es zwei Linkshänder
in einer Klasse von 50 Schülern gibt. Es ist also nötig zwei Linkshänder und 48 Rechtshänder
in einer Klasse zu haben. Anders ausgedrückt könnte man sagen, dass der erste und der zweite
Schüler Linkshänder sind und der dritte, vierte,.... fünfzigste Rechtshänder. Wir bezeichen Z als
linkshändige Schüler und D als Rechtshänder und können folgend schreiben:
Z Z D D ...D D
|
{z
}
48times
Die Wahrscheinlichkeit, dass ein Schüler Linkshänder ist liegt bei 0’1 und dass er Rechtshänder
ist bei 0’9 (dies bleibt bei jedem Versuch gleich). Setzt man nun die Wahrscheinlichkeiten ein dann
erhält man:
00 1 00 1 00 9 00 9 ...00 9 00 9 = (00 1)2 (00 9)48
|
{z
}
48times
41
Die Anordnung der Schüler kann sich jedoch unterscheiden, d.h. der linkshändige Schüler kann
auch an 30., 43. 12., 17.,...Stelle stehen. Deshalb muss man die Wahrscheinlichkeit, die wir vorhin
berechnet haben, mit der totalen Anzahl von möglichen
Anordnungen multiplizieren. Wieviele An
50!
ordnungen gibt es? Im Gesamten existieren 50
=
2
2!(50−2)! = 1225 Anordnungen. Diese Zahl wird
Binomialzahl genannt. Allgemein, möchten wir eine Reihe n Elementen
in welchen k von derselben
Art sind und n − k von einer andren Art dann können wir dies in nk verschiedenen Arten machen.
Die Wahrscheinlichkeit zwei Linkshänder in einer Klasse von 50 Schülern zu haben ist gleichzusetzen mit der Aussage, dass zwei Erfolge innerhalb des Experiments B(50, 00 1) vorliegen:
50
P [X = 2] =
· (00 1)2 (00 9)48 = 00 08
2
Wie man sieht ist die Wahrscheinlichkeit sehr gering. Überlegt man logisch dann wird es offensichtlicher, dass eher selten genau zwei Linkshänder in einer Klasse mit 50 Schülern sitzen.
Wir wollen nun allgemein die Wahrscheinlichkeit des Erhaltens von k Erfolgen nach n Wiederholungen des Bernoulli Experiments mit dem Parameter p in B(n, p).
Wenn X einer Binomialverteilung gehorcht B(n, p), dann ergibt sich die Wahrscheinlichkeit k
Erfolge nach n Versuchen zu erzielen:
n k n−k
P [X = k] =
p q
, ∀ k = 0, 1, 2, ..., n
k
wobei
n
n!
,
=
k!(n − k)!
k
p = P (E) ,
q = P (F ),
p+q =1
Diesen Ausdruck erhält man auf dieselbe Art wie bei dem vorigen Ereignis wo man zwei Erfolge
für die Binomialvariable X erzielt.
Betrachten wir nun die Spezialfälle welche 0 und n Erfolge ergeben. Wie hoch ist die Wahrscheinlichkeit 0 Erfolge zu erzielen, also n Mißerfolge?
n 0 n−0
n! n
P [X = 0] =
p q
=
q = qn
0
0!n!
(Erinnern Sie sich 0! = 1), während die Wahrscheinlichkeit des Erhaltens von n Erfolgen gleich
n n n−n
n! n 0
P [X = n] =
p q
=
p q = pn
n
n!0!
ist.
Dichte Wahrscheinlichkeitsfunktion
Die Dichte Wahrscheinlichkeitsfunktion ist wie folgt gegeben:
n k n−k
f (k) =
p q
, ∀ k = 0, 1, 2, ..., n und 0 für den Rest
k
42
was auch ausgedrückt werden kann als:
n k n−k
k p q
f (k) =
0
wenn k ∈ {0, 1, 2, ..., n}
sonst
In unserem Beispiel ergibt sich, dass
50 0 k 0 50−k
k (0 1) (0 9)
f (k) =
0
wenn k ∈ {0, 1, 2, ..., 50}
sonst
Verteilungsfunktion
In der zweiten Frage war nach der Berechnung der nötigen Anzahl an Linkshänderstühlen gefragt,
um sicherzustellen dass es keinen Linkshänder ohne passenden Sessel gibt. Wir suchen also nach
dem ersten k ∈ Z, sodass P [X ≤ k] ≥ 00 9. Wie können wir dieses k bestimmen? Mit Hilfe der
Verteilungsfunktion dieser Zufallsvariablen, welche wir anschließend berechnen werden, da P [X ≤
k] = F (k) wobei F die CPF der Zufallsvariablen X ist.
Für eine diskrete Zufallsvariable X, ergibt sich durch die Definition von CPF und F (x) = P [X ≤
x], sodass wir im Fall X ∼ B(n, p)
F (x) =
x X
n
k=0
k
pk q n−k =
n 0 n
n
n x n−x
p q +
pq n−1 + ... +
p q
,
0
1
x
∀x = 0, 1, 2, ...n
erhalten. Als eine Spezialfall wird
F (0) =
0 X
n
k=0
k
pk q n−k = f (0) = q n
angesehen und nach Anwendung der Newton’schen Formel läßt sich fortfahren
n X
n k n−k
n n
n
n n
F (n) =
p q
=
q +
pq n−1 + ... +
p = (p + q)n = 1n = 1
k
0
1
n
k=0
Dies ist logisch, denn in n Wiederholungen gibt es eine Anzahl von Erfolgen weniger oder gleich n.
In unserem Beispiel erhalten wir für die Verteilungsfunktion
x X
50
(00 1)k (00 9)50−k , ∀x ∈ {0, 1, ..., 50}
F (x) =
k
k=0
Um nun die zweite Frage zu beantworten suchen wir nach dem ersten k, sodass F (k) ≥ 00 9. Dies
wird durch Probieren von k durchgeführt; die Berechnung ist eher langschweifig.
Wir halten fest:
x X
50
F (k) =
(00 1)i (00 9)50−i
i
i=0
43
Wir versuchen zunächst mit k = 10:
F (10) =
10 X
50
i=0
i
(00 1)i (00 9)50−i = 00 99
Diese Wahrscheinlichkeit ist größer als 0’9, deshalb wollen wir mit einem niedrigeren Wert, z.B.
k = 7 fortfahren:
7 X
50
(00 1)i (00 9)50−i = 00 88
F (7) =
i
i=0
Wir nähern uns allmählich und wählen nun k = 8:
F (8) =
8 X
50
i=0
i
(00 1)i (00 9)50−i = 00 94
Da F (7) < 00 9, F (8) > 00 9 und F monoton steigend ist, erhalten wir für das gesuchte k, k = 8,
das erste k, sodass F (k) ≥ 00 9.
Um mit einer Vergewissheit von 90% sicherzugehen, dass keine Linkshänder ohne Sessel im
Klassenzimmer sind, müssen 8 Sessel für die Linkshänder reserviert werden.
Wieviele Sessel für Rechtshänder sind nötig um mit einer 90%igen Vergewissheit auszusagen,
dass es keinen Rechtshänder ohne passenden Sessel gibt?
In diesem Fall suchen wir nach dem ersten k in aufsteigender Reihenfolge, sodass P [50 − X ≤
k] ≥ 00 9, weil die Anzahl der Rechtshänder durch die Zufallsvariable 50 − X beschrieben wird. Wie
berechnet man nun dieses k:
P [50 − X ≤ k] ≥ 00 9 ⇔ P [X ≥ 50 − k] ≥ 00 9 ⇔ 1 − P [X < 50 − k] ≥ 00 9 ⇔
⇔ P [X < 50 − k] ≤ 00 1 ⇔ P [X ≤ 49 − k] ≤ 00 1 ⇔ F (49 − k) = 00 1
Wir wollen versuchen:
• k = 48
F (49 − k) = F (1) = 00 03 00 1
• k = 47
F (49 − k) = F (2) = 00 11 ≤ 00 1
Das gesuchte k ist also 47. Mit einer Wahrscheinlichkeit von 0’9 oder höher ist kein Rechtshänder
ohne passenden Sessel. Es ist nötig mindestens 47 Sessel für Rechtshänder bereitzustellen.
4.3.1
Der Erwartungswert
In diesem Teilabschnitt wollen wir dieselbe Frage beantworten basierend auf dem Erwartungswert.
Wir werden bestimmen wieviele unterschiedliche Sessel nötig sind, um die zu erwartende Anzahl
an Rechts- und Linkshänder mit einem passenden Stuhl auszustatten.
Zur Wiederholung: Der Erwartungswert oder Mittelwert einer Zufallsvariablen war der durchschnittliche Wert den diese Variable angenommen hatte nach mehrmaligen Wiederholungen.
44
Wie wir vorhin gesehen haben, ist der Erwartungswert einer Zufallsvariablen X die ihre Werte
innerhalb einer Reihe {x1 , ..., xn } annimmt mit den Wahrscheinlichkeiten {p1 , ..., pn }, (d.h. P [X =
xi ] = pi , ∀i ∈ {1, 2, ..., n}), und wird µ genannt. Es wird berechnet durch den Ausdruck
µ=
n
X
xi pi
i=n
Wenn also X ∼ B(n, p), dann erhalten wir für den Erwartungswert
n
n X
X
n i n−i
µ=
ip[X = i] =
i
pq
i
i=1
i=0
und nach mathematischer Berechnung halten wir fest
µ = np
Der Mittelwert unserer Zufallsvariablen X = ”Anzahl der linkshändigen Schüler im Klassenzimmer” ist
E[X] = µ = np = 50 · 00 1 = 5
Entsprechend den erwarteten Werten der Zufallsvariablen X haben wir 5 Linkshänder und 45
Rechtshänder. Es wäre sehr riskant genau 5 Linkshänder Stühle und 45 Rechtshänder Stühle bereitzustellen, da es eher unwahrscheinlich ist, dass dieses Ereignis exakt eintritt. Die Wahrscheinlichkeit
für das Eintreten des Ereignisses ist
50
P [X = 5] =
(00 1)5 (00 9)45 = 00 18
5
Obwohl dies ein Ereignis mit hoher Wahrscheinlichkeit ist, verglichen mit dem Rest der Werte die
die Zufallsvariable X einnehmen kann, gibt es uns dennoch keine Garantie. Der Erwartungswert
gibt uns zwar eine Annäherung an, es ist aber immer besser ein Intervall anzugeben in dem der
Wert von X mit Sicherheit eintritt. Damit beschäftigt sich das nächste Kapitel.
4.3.2
Die Varianz
Die Angabe eines Intervalls in welchem die Anzahl der Linkshänder durch eine bestimmte sichere
Wahrscheinlichkeit gegeben ist ist Ziel dieses Abschnitts. Das Intervall wird mit Hilfe des Mittelwertes und der Varianz bestimmt. Dazu sehen wir uns die Varianz einer Binomialverteilung genauer
an:
Die Formel für die Varianz einer Zufallsvariablen ist:
σ2 =
n
X
x2i pi − µ2
i=1
Sodass wenn X ∼ B(n, p) gilt dass
n
X
2 n
σ =
i
pi q n−i − µ2
i
i=0
2
45
und nach Lösung der Summe erhält man
σ 2 = npq
In unserem Beispiel ergibt sich
σ 2 = 50 · 00 1 · 00 9 = 40 5
Deshalb
σ=
√
+ σ 2 = 20 12
Dann können wir mit großer Wahrscheinlichkeit sagen, dass sich die Anzahl der linkshändigen
Schüler innerhalb eines Intervalls
(µ − σ, µ + σ) = (20 9, 70 1)
befindet und da X die diskrete Zufallsvariable ist können wir mit Sicherheit sagen, dass X ∈
{3, 4, 5, 6, 7}, da dies die möglichen Werte sind die sich innerhalb des Intervalls befinden. Exakt
ergibt sich:
7
X
P [X = i] = ... = 00 77
i=3
d.h. in 77% der Fälle werden 3, 4, 5, 6 oder 7 linkshändige Schüler im Klassenzimmer sein.
Als Abschluss dieses Teilkapitels möchten wir die vierte Frage noch beantworten. Wie hoch ist
der Prozentsatz von Klassenzimmern mit 50 Schülern in welchen 10 oder mehr Linkshänder sitzen?
Wir müssen
5
X
P [X ≥ 10] =
0P [X = i] = ... = 00 025
i=10
berechnen. Dies bedeutet, dass wir in 2’5% der Klassenzimmer mit 50 Schülern 10 oder mehr haben
die Linkshänder sind.
Natürlich können noch viel mehr Fragen innerhalb dieses Modells aufkommen. Diese können mit
Hilfe des Computers und geeigneter Software behandelt werden, da Berechnungen wie P [X ≤ k] und
P [X ≥ k] sehr schwierig händisch gelöst werden können. Auch wenn die Anzahl der Wiederholungen
n in einem Bernoulli Experiment sehr hoch sind, ist es ratsam technische Rechenmittel zu Rate zu
ziehen. Das folgende Kapitel stellt eine Technik vor die diese Berechnungen erleichtert. Um dies
aber zu verstehen ist es von Nutzen die Normal Verteilung zu behandeln.
46
Kapitel 5
Kontinuierliche Verteilungen:
Normalverteilung
5.1
Ziele
• Verständnis des Konzepts der kontinuierlichen Zufallsvariablen und ihren Unterschied zu den
diskreten Zufallsvariablen.
• Erkennen einer kontinuierlichen Dichte Wahrscheinlichkeitsfunktion und Kenntnis über die
Berechnung der entspechenden kontinuierlichen Verteilungsfunktion.
• Kenntnis über die Berechnung der Wahrscheinlichkeit einer kontinuierlichen Verteilung in
einem Intervall unter Verwendung der Dichte Wahrscheinlichkeitsfunktion, graphisch oder
mit anderen Berechnungsmitteln.
• Berechnung der Wahrscheinlichkeit unter Verwendung der Verteilungsfunktion.
• Verständnis der Bedeutung der Normalverteilung, Kenntnis ihre Dichte Wahrscheinlichkeitsfunktion und Fähigkeit zur Interpretation der Parameter (µ und σ).
• Fähigkeit Daten einer Normalverteilung zu unterziehen und zu überprüfen ob die Normalverteilung hier geeignet ist oder nicht.
• Standardisieren der Normalverteilung mit einem Mittelwert µ und einer Standardabweichung
σ.
• Arbeiten mit der Tabelle für die Normalverteilung.
• Annähern einer Binomialverteilung durch eine Normalverteilung.
47
5.2
Beispiel
Es ist bekannt, dass sich die durchschnittliche Grösse der Bevölkerung ständig ändert. So sind in
manchen High- Schools die Sessel und Tische für die größten Schüler zu klein, da diese für kleinere
Schüler gebaut wurden. Für Schüler die kleiner als 160 cm sind wären Tische und Sessel des Typs
A geeignet. Für Schüler zwischen 160 und 180 cm Sessel und Tische des Typs B und für Schüler
die größer als 180 cm sind wären Schulmöbel vom Typ C passend. Der Direktor einer High- School
möchte nun wissen wieviele Sessel und Tische für jedes Klassenzimmer gebraucht werden, um jedem
Schüler geeignete Möbel zur Verfügung zu stellen.
Dies ist ein bereits viel studiertes Phenomän von dem bekannt ist, dass die Höhe der Bevölkerung
bestimmt wird durch eine kontinuierliche Zufallsvariable, der Normalverteilung, deren Mittelwert
mit der durchschnittlichen Anzahl der Bevölkerung zusammenfällt und deren Standardabweichung
gleich der Standardabweichung der Stichprobe ist. Bei der Normalverteilung, ist die standardisierte
Normalverteilung besser studiert. Ihr Mittelwert liegt genau bei 0 und ihre Standardabeichung
beträgt 1. Es existieren Tabellen die Wahrscheinlichkeit dieser speziellen Verteilung anzeigen.
Wir werden nun alle vorhin erwähnten Konzepte einführen und die folgenden Fragen beantworten:
• Berechnen Sie den Mittelwert und die Varianz der Größe Ihrer Klasse.
• Wieviele Tische und Sessel werden durchschnittlich in jeder Klasse gebraucht?
• Finden Sie diese Schätzung gut? Warum?
• Betreffend dem Fall mit den Linkshändern, den wir mit Hilfe der Binomialverteilung behandelt
haben, versuchen Sie die gestellten Fragen zu beantworten, indem Sie die Binomialverteilung
an die Normalverteilung annähern.
5.3
Einleitung
Wir werden nun die Anzahl der Studenten (unterschiedlicher Grösse) in unserer Klaase messen.
Haben wir eine Messlatte eingeteilt in dm dann ergeben sich folgende Daten:
1’7, 1’7, 1’6, 1’5, 1’7, 1’4, 1’5, 1’8,...
Haben wir eine in cm eingeteilte Messlatte dann ergibt sich:
1’71, 1’75, 1’66, 1’54, 1’69, 1’48, 1’55,...
Hat man schlußendlich eine mm genaue Messlatte, dann sind die unterschiedlichen Größen so
ausgedrückt:
1’712, 1’748, 1’663, 1’541, 1’689, 1’484, 1’552,...
Eine Genauigkeit von 5 Dezimalstellen wäre in unserem Fall übertrieben, da es unsinnig wäre
die Größe eines Schülers 1’56053 m so geanu anzugeben. Wichtig hingegen ist es, ob jemand grösser
als 155’5 cm oder kleiner als 156’5 ist. Nach dem Runden erhält man schließlich, dass der Schüler
156 cm or 1’56 m groß ist.
Abhängig von der Genauigkeit der Messlatte macht es vielleicht keinen Sinn diese Daten in eine
diskrete Wahrscheinlichkeitsverteilung zu packen. Die Reihe der möglichen Werte wäre zwar endlich
doch sehr groß, zu groß um einfache Berechnungen anzustellen.
48
Wie vorher mehrmals erwähnt, ist die Wahrscheinlichkeitsverteilung ein mathematisches Modell, das uns hilft ein reales Phenomän zu erklären und eine Vorhersage dessen anzustellen. Im
Teilkapitel über diskrete Verteilungen wurde klar, dass diese immer mit einer Zufallsvariablen, die
Werte innerhalb einer Reihe annimmt, verbunden, bestimmt werden. Nimmt die Variable hingegen
irgendwelche Werte innerhalb eines Intervalls von R an, dann handelt es sich um eine kontinuierliche
Variable.
In dem Beispiel über die Größe der Bevölkerung handelte es sich um eine kontinuierliche Zufallsvariable. In diesem Beispiel ist es auch einfacher die kontinuierliche Zufallsvariable zu benutzen
anstatt der diskreten Variablen.
Das folgende Beispiel soll das Konzept der kontinuierlichen Zufallsvariablen verdeutlichen:
Angenommen wir hätten die Daten über die Größe der Schüler in der High- School und teilen
diese nun in Gruppen von 10 cm, dann erhalten wir diese Tabelle von relativen Häufigkeiten:
Intervall der Größen
[140,150)
[150,160)
[160,170)
[170,180)
[180,190)
[190,200)
Das Histogramm dazu sieht folgend aus:
49
Relative Häufigkeit
0.05
0.2
0.4
0.2
0.13
0.02
Wir wollen nun die Größe der Gruppen in 5 cm angeben, d.h. wir glätten die Division. Man
erhält dann diese Tabelle:
Intervall der Größen
[140,145)
[145,150)
[150,155)
[155,160)
[160,165)
[165,170)
[170,175)
[175,180)
[180,185)
[185,190)
[190,195)
[195,200)
Daraus ergibt sich folgendes Histogramm:
50
Relative Häufigkeit
0.01
0.04
0.06
0.14
0.25
0.15
0.11
0.09
0.08
0.05
0.01
0.01
Der Unterschied zum vorigen Histogramm (mit 10 cm) ist eindeutig.
Nun wollen wir es genauer darstellen und ziehen die Größe der Schüler in cm heran:
51
Größe
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
Relative Häufigkeit
0.003
0.004
0.003
0.005
0.008
0.008
0.009
0.01
0.01
0.011
0.012
0.013
0.014
0.015
0.02
0.03
0.035
0.04
0.045
0.055
0.06
0.05
0.04
0.035
0.033
0.031
0.026
Größe
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
192
194
195
196
198
Relative Häufigkeit
0.025
0.025
0.024
0.022
0.02
0.019
0.019
0.019
0.018
0.017
0.017
0.02
0.015
0.01
0.02
0.015
0.015
0.011
0.009
0.01
0.005
0.005
0.003
0.002
0.003
0.005
0.002
Mit folgendem Histogramm: Man kann auch Histogramme mit noch kleineren Klasseneinteilungen betrachten bis man schließlich in der Idealisierung der Kontinuität landet. Der Graph einer
kontinuierlichen Funktion wird mit f bezeichnet. Um die Kontinuität einer Dichte Wahrscheinlichkeitsfunktion zu erreichen sind Stichproben in großem Ausmaß nötig, viel größere als die Anzahl
der Schüler in der High- School.
52
53
Nach sehr vielen Beobachtungen erhalten wir den Graphen der Funktion f folgendermaßen:
Führen wir nun alle nötigen Annäherungen durch um die Funktion zu erhalten, dann können
wir die Wahrscheinlichkeit der Größe eines zufällig gewählten Schülers, z.B. zwischen 159 cm und
165 cm, nur innerhalb eines Bereiches der eingeschlossenen Fläche zwischen der Funktion f und der
Achse OX zwischen den Werten von x 159 und 165 bestimmen.
Die Zufallsvariable X ist kontinuierlich wenn gilt:
• Sie hat eine Wahrscheinlichkeitsverteilung die kontinuierlich ist und definiert ist durch eine
Funktion f (x). Mit Hilfe dieser Funktion können die Wahrscheinlichkeiten P [x1 ≤ X ≤ x2 ],
mit xi , x2 ∈ R, x1 ≤ x2 berechnet werden.
• Diese Wahrscheinlichkeit wird berechnet indem man den eingeschlossenen Bereich zwischen
dem Graphen der Funktion f (x) und der Abszisse zwischen den Punkten x1 und x2 betrachtet.
• In einer kontinuierlichen Wahrscheinlichkeitsverteilung macht es nur Sinn über Wahrscheinlichkeiten von Intervallen zu sprechen, (über Wahrscheinlichkeiten in einzelen Punkten zu sprechen ergäbe keinen Sinn) weil wenn X eine kontinuierliche Zufallsvariable ist dann ist P [X =
x] = 0, ∀x ∈ R (im vorigen Beispiel macht es keinen Sinn wenn jemand 63’94738274658482736
kg wiegt).
Beispiel 5.3.1 Lassen Sie uns die Wahrscheinlichkeitsverteilung gegeben durch die Funktion f (x)
der vorigen Abbildung genauer betrachten:
54
1. Verdeutlichen Sie graphisch die Wahrscheinlichkeiten
P [60 ≤ X ≤ 72]
P [70 ≥ X]
P [X ≤ 60]
P [X = 81]
2. Geben Sie eine nummerische Annäherung der Wahrscheinlichkeiten an, indem Sie die vorige
Tabelle zu Rate ziehen.
Übung 5.3.1 Machen Sie dasselbe für
P [50 ≤ X ≤ 60]
P [61 ≥ X]
P [X ≤ 83]
P [X = 76]
Dichte- Wahrscheinlichkeitsfunktion
Die Funktion die es uns erlaubt die Wahrscheinlichkeit in einem Intervall zu berechnen wir als f
geschrieben und mit Dichte- Wahrscheinlichkeitsfunktion einer Zufallsvariablen X bezeichnet.
Mit der Dichte- Wahrscheinlichkeitsfunktion kann man alle anderen Parameter der Verteilung
berechnen. Diese Funktion ist equivalent mit der Dichte- Wahrscheinlichkeitsfunktion der diskreten
Zufallsvariablen.
Die Dichte- Wahrscheinlichkeitsfunktion f einer Zufallsvariablen X ist:
1. f (x) ≥ 0, ∀x ∈ R
2. Der gesamte Bereich zwischen dem Graphen der Funktion f und der Achse OX, dies ist gleich
1, d.h.
P [−∞ ≤ X ≤ +∞] = 1
In Integralschreibweise entspricht dies:
Z
+∞
f (x)dx = 1
−∞
Wenn X nur Werte innerhalb eines Abschnitts a und b annimmt, dann gilt
Z b
P [a ≤ X ≤ b] = S[a, b] =
f (x)dx = 1
a
wobei S[a, b] den Bereich der Fläche bezeichnet den der Graph der Kurve f (x) und der Abzissenachse zwischen den Punkten a und b einschließt.
3. Die Wahrscheinlichkeit einer kontinuierlichen Zufallsvariablen X die ihre Werte in einem Intervall begrenzt von x1 und x2 annimmt, d.h. P [x1 ≤ X ≤ x2 ], ist der Bereich zwischen
der Funktion f (x) und der OX Achse im Intervall (x1 , x2 ), d.h., S[x1 , x2 ], für beliebige
x1 ≤ x2 , x1 , x2 ∈ R. In anderen Worten,
Z x2
P [x1 ≤ X ≤ x2 ] = S[x1 , x2 ] =
f (x)dx
x1
für die Konsequenz P [X = x] = 0 ∀x ∈ X, gilt dass
P [x1 ≤ X ≤ x2 ] = P [x1 ≤ X < x2 ] = P [x1 < X ≤ x2 ] = P [x1 < X < x2 ], ∀x1 ≤ x2 , x1 , x2 ∈ R
55
Man erhält auch die inverse Wahrscheinlichkeit. Hat man eine Funktion f für die gilt f (x) ≥ 0, sowie
R +∞
der gesamte Bereich zwischen ihres Graphen und der OX Achse ist 1, −∞ f (x)dx = 1, dann kann
die kontinuierliche Zufallsvariable assoziiert mit f , nur als eine Dichte- Wahrscheinlichkeitsfunktion
in jedem Intervall des Bereichs der Fläche die zwischen f (x) und der Abzisse in diesem Intervall
liegt, interpretiert werden.
Beispiel 5.3.2 Lassen Sie uns entscheiden, ob es sich bei der folgenden Funktion um eine DichteWahrscheinlichkeitsfunktion handelt:
1
wenn 0 < x < 3
3
f (x) =
0
sonst
Für f muss gelten:
• f (x) ≥ 0 ∀ x, dies ist trivial.
R +∞
• −∞ f (x)dx = 1 ? Dies wollen wir überprüfen.
R +∞
R +∞
R0
R3
R +∞
R0
R3
f (x)dx = −∞ f (x)dx + 0 f (x)dx + 3 f (x)dx = −∞ 0dx + 0 13 dx + 3 0dx =
−∞
3
0
0 + [ x3 ]x=3
x=0 + 0 = 3 − 3 = 1 Dies wollen wir uns graphisch überlegen.
Der Bereich der färbigen Fläche entspricht dem Wert des Integrals von vorhin. Die Fläche ist
gleich der Basis eines Rechtecks mal der Höhe dieses Rechtecks; es ist
3×
1
=1
3
Es gelten beide Bedingungen, daher kann man eine kontinuierliche Zufallsvariable annehmen. Wir
wollen diese X nennen und die Dichte- Wahrscheinlichkeitsfunktion f .
Ab nun werden wir die Dichte Wahrscheinlichkeitsfunktion, ab jetzt als dpf bezeichnet, benutzen
um einige Wahrscheinlichkeiten
R +∞
R 3zu berechnen.
P [X ≥ 1] = 1 f (x)dx = 1 31 dx = [ x3 ]31 = 33 − 13 = 23
Es ist möglich über den gefärbten Bereich zu berechnen.
Dieser Bereich ist gleich Länge mal Höhe eines Rechtecks, d.h.
2×
1
2
=
3
3
56
Übung 5.3.2 Berechnen Sie folgende Wahrscheinlichkeiten, indem Sie als Variable X die Zufallsvariable verknüpft mit der dpf des vorigen Beispiels annehmen:
P [X ≥ 2], P [00 5 ≤ X < 2], P [2 < X < 4]
Verteilungsfunktion
Die Definition einer Verteilungsfunktion für eine kontinuierliche Zufallsvariable ist gleich jener
der diskreten Zufallsvariablen, d.h.
F (x) = P [X ≤ x], ∀x ∈ R
Die Funktion mißt die Wahrscheinlichkeit der Zufallsvariablen mit Werten kleiner oder gleich x. Im
diskreten Fall berechnet man diese durch endliche Summierung, im kontinuierlichen Fall durch den
Bereich der eingeschlossenen Fläche oder dem Integral.
Wir erhalten dass
Z x
f (x)dx
F (x) = S[a, x] =
a
wobei f (x) die dpf von der Variablen X ist.
Die Verteilungsfunktion (ab nun genannt CP F ) benötigt die Berechnung der Wahrscheinlichkeiten von Intervallen und so gilt dass
P [x1 ≤ X ≤ x2 ] = F (x2 ) − F (x1 )
Eine Funktion F kann als CP F bezeichnet werden wenn gilt:
1. 0 ≤ F (x) ≤ 1, ∀x ∈ R
2. Wenn x ≤ a, F (x) = 0. Wenn x ≥ b, F (x) = 1
3. F (x) ist monoton steigend, d.h. wenn x1 ≤ x2 dann gilt F (x1 ) ≤ F (x2 ).
Weiters gilt wenn F eine CP F einer Rkontinuierlichen Zufallsvariablen X ist und f ist die dpf , dann
x
ergibt sich F 0 (x) = f (x), und daher a f (t)dt = F (x).
57
Beispiel 5.3.3 Lassen Sie uns mit der dpf beginnen, die wir im vorigen Kapitel als Beispiel heranzogen
1
wenn 0 < x < 3
3
f (x) =
0
sonst
Rx
Wir wissen dass a f (t)dt = F (x). Daher folgt:
Rx
1. wenn x ≤ 0 ⇒ F (x) = −∞ 0dt = 0
2. wenn x ∈ [0, 3] ⇒ F (x) =
3. wenn x ≥ 3 ⇒ F (x) =
R0
R0
−∞
−∞
0dt +
0dt +
Rx
1
dt
0 3
R3
1
dt
0 3
+
=
Rx
3
x
3
0dt = 1
Es ergibt sich:
F (x) =

 0
wennx ≤ 0
wenn 0 < x < 3
wennx ≥ 3
x
3

1
Diese Funktion erfüllt alle Voraussetzungen um eine Verteilungsfunktion zu sein:
1. 0 ≤ F (x) ≤ 1, trivial.
2. Wenn x ≤ 0 ⇒ F (x) = 0
Wenn x ≥ 3 ⇒ F (x) = 1
3. F (x) ist monoton steigend. Wir haben zu überprüfen dass wenn x1 ≤ x2 ⇒ F (x1 ) ≤ F (x2 ).
Lassen Sie uns die unterschiedlichen Fälle betrachten:
(a) x1 < 0 und x2 < 0. F (x1 ) = 0 = F (x2 ). Gilt.
(b) x1 < 0 und x2 ∈ [0, 3]. F (x1 ) = 0 ≤
x2
3
= F (x2 ). Gilt.
(c) x1 < 0 und x2 ≥ 3. F (x1 ) = 0 ≤ 1 = F (x2 ). Gilt.
(d) x1 ∈ [0, 3] wahr x2 ∈ [0, 3]. F (x1 ) =
(e) x1 ∈ [0, 3] y x2 ≥ 3. F (x1 ) =
x1
3
x1
3
≤
x2
3
= F (x2 ). Ist wahr.
≤ 1 = F (x2 ). Gilt.
(f ) x1 ≥ 3 y x2 ≥ 3. F (x1 ) = 1 ≤ 1 = F (x2 ). Ist wahr.
Übung 5.3.3 Betrachten Sie folgende Funktion

 0
x2
F (x) =
 2
1
F definiert als:
wennx ≤ 0
wenn 0 < x < 1
wennx ≥ 1
Ist diese Funktion zulässig als CP F ? Wenn ja dann berechnen Sie dpf verknüpft mit F und die
folgenden Wahrscheinlichkeiten:
P [X ≤ 00 5]
P [X ≥ 00 8]
P [00 2 ≤ X ≤ 00 5]
P [00 3 ≤ X ≤ 10 5]
wobei X die kontinuierliche Zufallsvariable verknüpft mit F darstellt.
58
Übung 5.3.4 Überprüfen Sie ob es sich bei folgender Funktion um eine CP F handelt oder nicht:

wennx ≤ −1
 0
x2
F (x) =
wenn − 1 < x < 2
 4
1
wennx ≥ 2
Übung 5.3.5 Überlegen Sie sich folgende Funktion:
x
wenn 2 < x < 3
f (x) =
0
sonst
Kann f eine dpf sein? Warum?
Beispiel: Normalverteilung
Wegen der vielseitigen theoretischen und praktischen Anwendungen ist die Normalverteilung ohne
Zweifel die wichtigste unter den kontinuierliche Wahrscheinlichkeitsverteilungen. Die theoretischen
Anwendungen beruhen auf der Tatsache, dass in den meisten Situationen die Fälle nicht normal
sind und beinahe jede Datenreihe sich um einen zentralen Wert gruppiert.
Zum Beispiel ist die normale Situation, dass ein erwachsener Mann zwischen 170 und 180 cm
groß ist und es ist sehr selten Männer zu finden, die größer als 200 cm oder kleiner als 150 cm sind.
Aus diesem Grund und da dieses Beispiel genauestens studiert wurde, werden wir sehen, dass die
Größe der Bevölkerung normalverteilt ist.
Die Größe allgemein ist eines von vielen Beispielen die durch eine Normalverteilung bestimmt
werden. Andere sind das Gewicht, der Intellingenzquotien, Meßfehler,...
All diese Beispiele haben gemeinsam, dass sich die Daten um den Mittelwert gruppieren.
In dem Beispiel über die Größe der Schüler einer High- School nehmen wir an, dass alle Daten
durch eine Normalverteilung, mit dem Mittelwert gleich dem Mittelwert der Daten und einer Standardabweichung gleich der die sich aus der relativen Häufigkeitstabelle der Größen berechnen läßt,
bestimmt sind.
Noramle Dichte Wahrscheinlichkeitsfunktion: Eigenschaften
Die dpf f (x) einer normalen Zufallsvariablen mit Mittelwert µ und Varianz σ, lässt sich auf
Gauss zurückführen. Es handelt sich um eine Exponentialfunktion und sie ist bestimmt durch den
Ausdruck:
2
1 (x−µ)
1
f (x) = √
e− 2 σ2
σ 2π
Ihr Graph sieht folgend aus:
Ist f eine dpf ? Um zu erkennen, dass f eine dpf ist muss f (x) ≥ 0 für jedes x. Auch muss der
eingeschlossene Bereich
R +∞ zwischen dem Graphen f und der OX Achse 1 sein, in anderen Worten es
muss gelten, dass −∞ f (x)dx = 1, Ein Integral das uns nicht bekannt sein muss und nach Laplace
wirklich 1 ist.
59
Wir wollen uns nun mit der ersten Frage des Beispiels beschäftigen. Zuvor ist es jedoch nötig etwas
neues kennenzulernen. Wir wissen bereits wie man den Mittelwert und die Standardabweichung
eines Datensatzes berechnet. In unserem Fall erhalten wir, dass
X
µ=
xi fi = 1660 59
und
σ2 =
X
x2i fi − µ2 = 1180 29
Wir nehmen an die Daten der Größen der Schüler in einer High- School sind bestimmt durch
eine Normalverteilung. Die Dichte Wahrscheinlichkeitsfunktion dieser Verteilung hat spezielle Eigenschaften und der Graph von dpf stellt eine Glockenkurve dar, d.h.:
• Der Graph ist an der Stelle des Maximums der dpf und des Moduses der Zufallsvariablen
vertikal gespiegelt.
• Die Kurve hat nur ein Maximum. Für die Werte von x kleiner dem Maximum der Kurve ist
f (x) nicht monoton steigend und für Werte größer als das Maximum ist die Kurve monoton
steigend.
• Theoretisch kann es jeden Wert auf der OX Achse annehmen. Zusätzlich hat die Kurve die
OX Achse als horizontale Asymptote an beiden Seiten und die Kurve nähert sich dieser Asympotote sehr rasch an.
• Wenn die Varianz der Verteilung größer wird dann wird die Kurve die die dpf beschreibt
”flacher”, und wenn die Varianz kleiner wird dann wird auch die Kurve ”steiler”. Zusammengefaßt: wenn X eine Zufallsvariable bestimmt durch eine Normalverteilung mit Mittelwert
gleich µ und Standardabweichung gleich σ, und wir dies mit X ∼ N (µ, σ 2 ) bezeichnen,
wobei σ 2 die Varianz von X, dann gilt:
1. P [µ − σ < X < µ + σ] = 00 683
2. P [µ − 2σ < X < µ + 2σ] = 00 954
3. P [µ − 3σ < X < µ + 3σ] = 00 977
60
Diese letzten Gleichungen geben uns eine Ahnung wie verbesserunsfähig es ist Werte einer Normalverteilung weit weg vom Mittelwert zu erhalten. Basierend auf diesen Gleichungen, wenn X
eine Zufallsvariable bestimmt durch eine Normalverteilung mit Mittelwert gleich 2 und Varianz 1,
dann folgt X ∼ N (2, 1), und es ergibt sich dass 99’7% der Beobachtungen von X innerhalb eines
Intervalls (-1,5)liegen. Es sind jedoch auch Werte größer 1.000.000 möglich!
Wir werden die Daten einer Normalverteilung anpassen mit Mittelwert µ und Standardabweichung σ, die wir vorhin erhalten haben. Die Größe der Schüler einer High- School wird bestimmt
durch N (1660 59, 100 88).
Jedoch führt dies nicht zu einer einfacheren Berechnung und ein Computer muss eingesetzt werden. Um dieses Probem zu übergehen benutzt man eine spezielle Art der Normalverteilung, die Standardnormalverteilung oder N (0, 1), die sehr gut bekannt ist und man immer darauf zurückgreifen
kann.
Die N (0, 1) Verteilung
Die Normalverteilung mit Mittelwert µ = 0 und Standardabweichung σ = 1 wird Standardnormalverteilung N (0, 1), genannt.
Die Werte der Wahrscheinlichkeiten sind wohl bekannt und wie wir später sehen werden können
wir auf diese zurückgreifen um Wahrscheinlichkeiten in anderen Normalverteilungen zu bestimmen.
Wenn wir Z ∼ N (0, 1) haben, dann werden die Wahrscheinlichkeiten P [Z ≤ z], das ist F (z) wo
F eine CP F von Z, in folgender Tabelle beschreiben, für alle z ∈ [0, 3], dies reicht aus um alle zu
berechnen. Die Wahrscheinlichkeit einer Variablen die Werte größer als 3 annimmt ist sehr klein
und es wird genügen die Werte F (z) für z ≥ 0, wegen der Symmetrie der dpf , zu betrachten.
Wir nehmen an, dass Z ∼ N (0, 1) und wollen sehen wie man P [Z ≤ z] von den Daten der
vorigen Tabelle berechnet, abhängig von den Werten die z annehmen kann. Dazu werden wir die
Symmetrie der Verteilung in 0 heranziehen. .
• Wenn Z ≥ 0 ⇒ P [Z ≤ z], ist die Wahrscheinlichkeit in der Tabelle beschrieben.
• Wenn Z < 0 ⇒ P [Z ≤ z] = P [Z ≥ −z] = 1 − P [Z ≤ −z], kann von der Tabelle abgelesen
werden da −z ≥ 0.
• Wenn z1 ≤ z2 , dann erhalten wir P [z1 ≤ Z ≤ z2 ] = P [z ≤ z2 ] − P [z ≤ z1 ], was eine allgemeine
Eigenschaft aller Wahrscheinlichkeitsfunktionen ist.
Übung 5.3.6 Von diesen Eigenschaften folgern Sie dass:
1. P [−z ≤ Z ≤ z] = 2P [Z ≤ z] − 1
2. P [−Z ≤ z ≤ 0] = P [0 ≤ Z ≤ z]
Wobei Z ∼ N (0, 1) und z eine reelle Zahl größer oder gleich 0 ist.
Beispiel 5.3.4 Berechnen Sie von der Tabelle, wobei Z ∼ N (0, 1), folgende Wahrscheinlichkeiten:
1. P [Z ≤ 00 82] = 00 7939
2. P [Z ≤ −10 2] = 1 − P [Z ≤ 10 2] = 1 − 00 8849
61
62
Übung 5.3.7 Berechnen Sie von der Tabelle, wobei Z ∼ N (0, 1), folgende Wahrscheinlichkeiten:
1. P [Z ≤ 00 96]
2. P [Z ≤ −20 18]
3. P [−20 76 ≤ Z ≤ −20 18]
4. P [00 45 ≤ Z ≤ 20 31]
Standardisierung
Wie vorhin erwähnt gibt es viele zufällige Phenomäne die durch eine Normalverteilung beschrieben werden können. Das einzige Problem ist, dass bei diesen der Mittelwert nicht 0 und die Standardabweichung nicht 1 sein muss. Es mag den Anschein haben, dass die behandelten Beispiele
der Standard Normalverteilung keinen praktischen Nutzen haben, dies ist jedoch falsch. Jede Normalverteilung X, X ∼ N (µ, σ 2 ), kann an Z ∼ N (0, 1) angenähert werden durch Veränderung der
Variablen:
X −µ
Z=
σ
Diese Umformung wird als Standardisierung einer Zufallsvariablen X bezeichnet, und wir können
die vorhin benutzte Tabelle mit CP F einer N (0, 1) benutzen.
Das Resultat wird hergeleitet:
P [X ≤ k] = P [
k−µ
k−µ
X −µ
≤
] = P [Z ≤
]
σ
σ
σ
So kann der Wert P [X ≤ k] mitX einer Normalverteilung berechnet werden mit Hilfe der Tabelle
für die Standard Normalverteilung durch die Formel: P [Z ≤ k−µ
σ ].
Um diese Konzepte klar zu machen werden wir die Zahl jeder unterschiedlicher Arten von
Tischen die eine High- School mit 1.000 Schülern kaufen muss berechnen. Die Daten über die
Größen, die wir vorhin erstellt haben und die Voraussetzung, dass diese bestimmt sind durch
N (1660 59, 100 88) dienen uns für die Berechnung.
Zur Berechnung der Anzahl der Tische und Sessel des Typs A ist es nötig den Prozentsatz von
Schülern die kleiner als 160 cm sind heranzuziehen. Wir benennen X = ”Größe eines Schülers” und
berechnen
P [X ≤ 160]
Wir nehmen an dass, X ∼ N (1660 59, 100 88) und erhalten
P [X ≤ 160] = P [Z ≤
160 − 1660 59
] = P [Z ≤ −00 61]
100 88
wobei Z ∼ N (0, 1). Nach der Tabelle der Standard Normalverteilung ergibt sich P [Z ≤ −00 61] =
1 − P [Z ≤ 00 61] = 1 − 00 7291 = 00 2709.
Es müssen also 27’09% der Sessel vom Typ A sein.
63
Zur Berechnung der Anzahl der Tische des Typs B müssen wir P [160 < X < 180] berechnen,
da für die Schüler die zwischen 160 und 180 cm groß sind diese Sessel am geeignetsten erscheinen.
Nach Standardisieung der Zufallsvariablen X erhalten wir:
P [160 < X < 180] = P [
160 − 1660 59
180 − 1660 59
<Z<
] = P [−00 61 < Z < 10 23] =
0
10 88
100 88
und wir teilen diese Wahrscheinlichkeit in zwei unterschiedliche Wahrscheinlichkeiten. Es ergibt
sich:
= P [Z < 10 23] − P [Z ≤ −00 61] = 00 8907 − 00 2709 = 0.6198
d.h. die Schule wird 61’98% der Tische vom Typ B kaufen.
Und um die Anzahl der Tische und Sessel des Typs C zu berechnen geht man folgend vor:
P [X > 180] = P [Z > 10 23] = 1 − P [Z < 10 23] = 00 1093
d.h., 10’93% der Tische und Sessel wird vom Typ C sein.
Als schlußendliche Antwort ergibt sich für eine High- School mit insgesamt 1.000 Schülern, dass
man 1000 · P [X ≤ 160] = 271 Sessel und Tische des Typs A, 1000 · P [160 < X ≤ 180] = 620 des
Typs B und 1000 · P [X ≥ 160] = 109 des Typs C kaufen muss um die Schüler mit bestmöglichen
Schulmöbeln auszustatten.
Wie man sieht läßt sich die Wahrscheinlichkeit in einer Normalverteilung sehr einfach berechnen.
Man muss nur mit der Tabelle der Standard Normalverteilung umgehen können und die Variable
geeignet standardisieren.
Wie führt man andere Verteilungen in eine normale um?
Im wirklichen Leben ist nicht jede Zufallsvariable durch eine Normalverteilung bestimmt. Bevor
man also die Daten analysiert ist es nötig zu überprüfen ob die Daten einer Normalverteilung
entsprechen. Diese Überprüfung wird mit Normalitätstest beschrieben. Es existieren viele solcher
Tests die auch kompliziert sind, daher werden wir uns nur mit einem einfachen Test beschäftigen.
Dieser Normalitätstest funktioniert folgendermaßen:
1. Wir betrachten eine Stichprobe von n Elementen von der Bevölkerung und meßen die Werte
von X, diese sind x1 , x2 , ..., xn .
2. Der Mittelwert und die Standardabweichung werden von diesen Daten berechnet, x bzw. s.
3. Wir zählen wieviele dieser Werte in den Intervallen (x − s, x + s), (x − 2s, x + 2s) und in
(x − 3s, x + 3s) sind.
4. Wenn gilt, dass ungefähr
68’3% der Daten im Intervall (x − s, x + s)
95’4% der Daten im Intervall (x − 2s, x + 3s) und
99’7% der Daten im Intervall (x − 3s, x + 3s) liegen,
dann können wir annehmen, dass die Bevölkerung von der wir die Daten erhoben hatten durch
eine Normalverteilung mit Mittelwert µ = x und Varianz σ 2 = s2 dargestellt werden kann.
64
Man sagt die Anpassung ist gut wenn der erhaltene Prozentsatz nicht mehr als 1% mehr oder
weniger dem Prozentsatz von vorhin entspricht.
Nun wollen wir prüfen ob die Größe der Schüler wirklich durch eine Normalverteilung bestimmt
wird wie wir es im vorigen Kapitel angenommen haben.
Wir berechneten den Mittelwert der Daten, er war x = 1660 59 und die Standardavweichung
betrug s = 100 88. Nun zu den Intervallen die für den Nomalitätstest nötig sind:
• (x − s, x + s) = (1550 71, 177.47)
• (x − 2s, x + 2s) = (1440 83, 1880 35)
• (x − 3s, x + 3s) = (1330 95, 1990 23)
Aus den relativen Häufigkeitstabelle ergibt sich:
• P [X ∈ (x − s, x + s)] = P [X ∈ (1550 71, 177.47)] = 00 691
• P [X ∈ (x − 2s, x + 2s)] = P [X ∈ (1440 83, 1880 35)] = 00 965
• P [X ∈ (x − 3s, x + 3s)] = P [X ∈ (1330 95, 1990 23)] = 1
Daher erhält man, dass 69’1% der Beobachtungen ins Intervall (x−s, x+s) fallen, wenn es theoretisch
68’3% sein müsste. 96’5% der Daten liegen im Intervall (x − 2s, x + 2s), was 95’4% sein müsste und
100% liegen in (x − 3s, x + 3s) was theoretisch nur 99’7% sein dürften.
Obwohl die Tatsache, dass die Prozentsätze nicht weit von 1% der theoretischen Prozentsätze
liegen nicht stimmt, kann man sagen, dass es sich um eine gute Annäherung handelt, da die Summe
der Fehler in den drei Intervallen nur bei 5% liegt. Die Annäherung ist also gerechtfertigt. Die Zufallsvariable die die Größe der Bevölkerung repräsentiert ist ein wohl studiertes Phenomän und es
ist bekannt als Normalverteilung. Wenn man eine genauere Berechnung durchführen will dann ist
es nötig zusätzliche Berechnungen kennenzulernen. Aber da wir nur einen Einblick in die Anwendung dieser Rechenmittel geben wollen, ist es uns wichtiger dass alle behandelten mathematischen
Sachverhalte verstanden wurden.
Die Normalverteilung als eine Annäherung der Binomialverteilung
Als wir die Binomialverteilung studiert haben hatten wir ein Problem: die Berechnung war zu
langwierig. Händisches Berechnen von Wahrscheinlichkeiten wie P [X ≤ k] wenn X ∼ B(n, p) war
extrem schwierig und praktisch nur lösbar mit Hilfe des Computers. Um das Problem zu übergehen
werden wir nun eine Annäherung der Binomialverteilung an die Normalverteilung vorstellen.
Wenn X ∼ B(n, p) dann gilt, dass der Mittelwert µ = np und die Varianz σ 2 = npq ist. Wenn nun
entweder p oder q nahe bei 0 sind, dann kann die Binomialverteilung durch die Normalverteilung
angenähert werden N (np, npq). Dies ermöglicht ein einfacheres Berechnen wie wir gleich sehen
werden. Nehmen wir nun diese Annäherung und standardisieren diese dann erhält man
k − np
P [X ≤ k] = P [Z ≤ √
]
npq
65
wobei Z ∼ N (0, 1), und wir können dies leicht berechnen.
Die Approximation ist gut wenn np und nq beide größer als 5 sind und wird besser wenn n
größer und p nähert zu 12 wird.
Wir müssen zuvor ein anderes Problem lösen um die Approximierung zu ermöglichen. Solange X
eine diskrete Zufallsvariable ist die Integer Werte X = 0, 1, 2, ..., n annimmt, ist die Normalverteilung
kontinuierlich. the normal distribution is continuous.
Um dies zu verhindern führt man die Kontinuitäts Korrektur durch und Wahrscheinlichkeiten
wie P [X ≤ k] zu berechnen. Man berechnet P [X ≤ k + 00 5], für die Variable X die den Wert k
annimmt. Um P [X < k] zu finden berechnet man P [X ≤ k − 00 5], sodass der Punkt k nicht ins
Intervall fällt.
Diese Korrektur ist unentbehrlich um Wahrscheinlichkeiten wie P [X = k] zu berechnen und
man muss auch P [k − 00 5 ≤ X ≤ k + 00 5] berechnen.
Mit Hilfe dieser Methode können wir nun Antwort geben zu der Frage, die im Kapitel über
Binomialverteilungen aufgekommen ist.
Die erste Frage benötigt keine Approximation um leicht beantwortet zu werden, aber die zwei
letzten schon. Wir nehmen daher an, dass unsere Zufallsvariable X = ”Anzahl der Linkshänder in
einer Klasse von 50 Schüler”bestimmt wird durch N (np, npq) = N (5, 40 5).
Für die Beantwortung der ersten Frage berechnen wir das erste k, sodass P [X ≤ k + 00 5] ≥ 00 9
(für die Kontinuitäts Korrektur). In Wahrheit suchen wir die erste Integer Zahl k, sodass P [Z ≤
0
k+0
√ 5−5 ] ≥ 00 9 wobei Z ∼ N (0, 1).
40 5
0
0
5
√ 5−5 ] = P [Z ≤ k−4
P [Z ≤ k+0
20 12 ]
40 5
Das erste x ∈ R für das gilt, dass P [Z ≤ x] ≥ 00 9 ist x = 10 29. Daher müssen wir die erste
0
5
0
Integer Zahl finden dass k/ k−4
20 12 ≥ 1 29. Wir erhalten
k − 40 5
≥ 10 29 ⇔ k ≥ 70 24
20 12
Das gesuchte k war also k = 8. Dies ist dasselbe Ergebnis das wir bereits im Kapitel über
Binomialverteilungen erhalten haben. An dieser Stelle habe wir jedoch keinen Computer zur Berechnung herangezogen sondern nur die Tabelle der Standard Normalverteilung und höchstens einen
Taschenrechner.
Zur Berechnung des Prozentsatzes der Gruppen von 50 Schülern in welchen mindestens 10
Linkshänder sitzen benötigen wir P [X ≥ 90 5] und nicht P [X ≥ 9], wegen der Kontinuitäts Korrektur. Das heißt wir müssen
P [Z ≥
90 5 − 5
] = P [Z ≥ 20 12] = 1 − P [Z ≤ 20 12] = 00 0174
20 12
berechnen. Entsprechend dieser Approximierung der Binomialverteilung haben 1’75% der Klassenzimmer mit 50 Schülern 10 oder mehr Linkshänder. Diese Zahl liegt sehr nahe an dem Ergebnis
(2’25%) was wir mit Hilfe des Binomial Modells berechnet hatten.
66
Wie Sie sehen sind die Antworten sehr ähnlich. Die Approximierung war also korrekt, da auch
np = 50 · 00 1 = 5 und nq = 50 · 00 9 = 45, beide Zahlen größer oder gleich 5, so wie es eine geeignete
Annäherung vorsieht.
67
Herunterladen