Kombinatorik+WSK Vtlg - T

Werbung
Elemente der
Kombinatorik
und
Diskrete
Wahrscheinlichkeitsverteilungen
Grundlagen
und
Beispiele
Dieter Küntzel, 2014
Inhaltsverzeichnis
1. Einleitung ................................................................................................................ 3
1.1 Kombinatorik ..................................................................................................... 3
1.2 Stochastik ......................................................................................................... 4
2. Zählprobleme .......................................................................................................... 5
3 Elemente der Mengenlehre und der Lehre von Multimengen ................................. 8
4 Anordnungen und Auswahlen............................................................................... 21
4.1 Permutationen ................................................................................................ 21
4.1.1 Permutationen von unterscheidbaren Elementen ..................................... 21
4.1.2 Permutation von teilweise nicht unterscheidbaren Elementen.................. 22
4.2 Variationen ...................................................................................................... 24
4.2.1 Variationen ohne Wiederholung ............................................................... 24
4.2.2 Variationen mit Wiederholung................................................................... 24
4.3 Kombinationen ............................................................................................... 25
4.3.1 Kombinationen ohne Wiederholung.......................................................... 25
4.3.2 Kombinationen mit Wiederholung ............................................................. 25
4.4 Zusammenfassung.......................................................................................... 26
4.5 Anwendungen und Beispiele ........................................................................... 28
5. Endliche Wahrscheinlichkeitsräume ..................................................................... 35
5.1 Klassische Definition der Wahrscheinlichkeit .................................................. 35
5.2 Zufallsgrößen .................................................................................................. 40
5.3 Baumdiagramme ............................................................................................ 42
6. Diskrete Verteilungen ........................................................................................... 46
6.1 Gleich-Verteilung............................................................................................. 46
6.2 Binomial-Verteilung ......................................................................................... 48
6.3 Hypergeometrische Verteilung ........................................................................ 52
6.4 Zusammenhang zwischen Binomial- und Hypergeometrischer Verteilung .... 58
6.5 Poisson Verteilung .......................................................................................... 59
6.6 Approximation von Binomial- und Hypergeometrischer Verteilung ................. 64
7. Verallgemeinerung der Verteilungen .................................................................... 66
7.1 Polynomialverteilung ....................................................................................... 66
7.2 Multivariate hypergeometrische Verteilung ..................................................... 68
7.3 Polya Verteilung .............................................................................................. 70
8. Anwendungen ....................................................................................................... 72
9. Schlussbetrachtung .............................................................................................. 74
10. Literaturverzeichnis............................................................................................. 75
2
1. Einleitung
In dieser Arbeit werden einige Elemente der Kombinatorik dargestellt und diese dann
für die Beantwortung von einfachen Fragen der Wahrscheinlichkeitsrechnung für
endliche Ereignisräume herangezogen.
1.1 Kombinatorik
Die Kombinatorik ist ein Gebiet der Mathematik, das sich mit endlichen Strukturen
befasst. Damit ist die Kombinatorik also ein Element der Diskreten Mathematik.
Konkret geht es in der Kombinatorik darum, die Elemente einer gegebenen Menge
nach einer vorgegebenen Vorschrift anzuordnen oder aus einer gegebenen Menge
bestimmte Elemente nach einer gegebenen Bedingung auszuwählen.
Dazu ein sehr allgemeines Beispiel:
Es sind Vorschriften für vollständige Zerlegungen einer Menge in Teilmengen zu
untersuchen, und die folgenden Fragen zu beantworten:
-
gibt es mindesten eine Zerlegung, die die Vorschriften erfüllt,
wenn sie existiert, gibt es weitere und wenn ja, wie viele solcher Zerlegungen
gibt es, und dann schließlich auch,
welche Struktur / Eigenschaften hat die Menge aller Zerlegungen.
Als konkretes Beispiel sei hier das Schubfachprinzip erläutert, das eine Eigenschaft
der Verteilung von Elementen einer Menge auf andere Mengen und damit eine
Zerlegung der Menge beschreibt.
Satz:
Falls man n Elemente einer Menge M auf m andere Mengen Mi , 1 ≤ i ≤ m
verteilt, wobei n, m  und n > m ist, dann gibt es mindestens eine
Menge, die mehr als ein Elemente enthält.
Beweis: Ordnen wir nun im ersten Schritt jeder der m Mengen Mi ein Element zu, so
haben wir m Elemente zugeordnet und jede der m Mengen hat mindestens
ein Element. Nun sind aber noch n – m > 0 Elemente übrig, die noch
zuzuordnen sind. Damit gibt es mindestens eine Menge Mj , 1 ≤ j ≤ m, die
mindestens ein zweites Element enthält und das beweist den Satz.
+++
Bemerkung: Der Name kommt aus folgender Formulierung:
Verteilt man n Objekte auf m Fächer (n > m) - z. B. eines Schrankes so gibt es mindestens ein Fach, das mindestens zwei Objekte enthält.
Ein Beispiel für die Anwendung des Schubfachprinzips ist folgende, einfach und
selbstverständlich klingende Aussage:
In eine Menge von mehr als 366 Menschen gibt es mindestens 2 Menschen, die am
gleichen Tag Geburtstag haben (ein Jahr hat maximal 366 Tage).
3
Oder auch:
Unter der Annahme, dass alle Menschen weniger als eine Million Haare auf dem
Kopf haben und Wien mindestens eine Million Menschen als Einwohner hat gilt:
In Wien gibt es mindestens 2 Menschen, die die gleiche Anzahl von Haaren auf den
Kopf haben.
Immerhin interessant, eine so allgemeine Aussage zu treffen, selbst wenn man nicht
weiß, wer die beiden Menschen sind.
Zwei weitere „praktische“ Fragestellungen der Kombinatorik seien hier noch erwähnt:
1. Das Wolf – Ziege – Kohlkopf Problem
Ein Bauer möchte mit einer Ziege, einem Wolf und einem Kohlkopf in einem
Boot über einen Fluss setzen. Er kann nur eines der 3 „Objekte“ mit ins Boot
nehmen. Da, alleingelassen, der Wolf die Ziege fressen würde und die Ziege
den Kohlkopf, muss eine Übersetz-Reihenfolge gefunden werden, mit der die
oben erwähnten Kombinationen vermieden werden.
2. Ein Problem aus dem Haushalt (problème des ménages)
Das “problème des ménages“ beschreibt folgende Fragestellung: Es sind
n Ehepaare, n ≥ 3, um einen runden Tisch herum so zu setzen, dass kein
Ehepaar zusammensitzt, d. h. zwischen jedem Ehepaar sitzt mindestens ein
Mensch eines anderen Ehepaares. Wie viele Sitzordnungen dieser Art gibt
es?
Zumindest das 2. Problem ist alles andere als leicht für den allgemeinen Fall zu
lösen, Eine Lösung findet sich beispielsweise in [5]. Beide Fragestellungen werden
hier nicht weiter behandelt.
1.2 Stochastik
Die Stochastik beschreibt Ergebnisse von Zufallsexperimenten wie beispielsweise
die Ergebnisse des Werfens eines Würfels.
1. Die Analyse der Ergebnisse von konkreten Experimenten / Beobachtungen
und deren Interpretation, wie beispielsweise Prognosen, allgemeine
Verhaltensweisen usw. ist Gegenstand der Statistik.
2. Die Wahrscheinlichkeitsrechnung basiert auf der Formalisierung der
Experimente, also der Modellbildung. Aus der so erhaltenen theoretischen,
abstrakten Beschreibung des Experiments werden dann bestimmte
Ergebnisse bzw. Prognosen abgeleitet / berechnet.
In dieser Arbeit werden wir nur Elemente der Wahrscheinlichkeitsrechnung
betrachten.
4
2. Zählprobleme
In den folgenden Kapiteln werden einige Aufgaben dargestellt, deren Lösung auf
Prinzipien zum Abzählen von Elementen einer Menge, die eine bestimmte
Eigenschaft haben, beruht. Da hier häufig ein Produkt der ersten n natürlichen
Zahlen verwendet wird, definieren wir:
Definition Sei n eine natürliche Zahl einschließlich der Null, n 
definieren wir n-Fakultät, geschrieben n! induktiv , zu
0! := 1 und (n + 1)! := n! * (n + 1) .
0
. Dann
Bemerkung: für n > 0 gilt somit n! := 1 * 2 * 3 * . . . * n
Weiter werden wir auch folgende Definition benötigen:
Definition Für alle natürliche Zahlen n, k 
B:
2
0

0
0
wird die Funktion B definiert zu

n
n!
B(n,k)    :
mit 
 k  k! (n  k)!
 B(n,k)  0

für
0kn
.
für k  n
n
Die Funktion B(n,k) heißt Binomialkoeffizient von n über k und  
k 
wird gesprochen als n über k.
Bevor die allgemeinen Zählprinzipien erläutern nun einige Beispiele. aus der
Gastronomie:
1. Gegeben sei eine Menükarte mit 20 verschiedene Hauptgerichten
H1, H2, H3, … , H19, H20. Wie viele Menükarten MK1 mit unterschiedlicher
Reihenfolge der Hauptgerichte sind möglich?
Lösungsansatz:
1. Stelle:
20 Möglichkeiten ein Gericht auszuwählen
2. Stelle:
19 Möglichkeiten, da ein Hauptgerichten bereits für die
1. Stelle ausgewählt wurde
3. Stelle:
18 Möglichkeiten, da zwei Hauptgerichte bereits für die 1. und 2.
Stelle ausgewählt wurden
…
19. Stelle:
2 Möglichkeiten
20. Stelle:
1 Möglichkeit
Damit insgesamt:
MK1 = 20 * 19 * 18* . . . * 2 * 1 = 20!
= 2.432.902.008.176.640.000
≈ 2,4 1018
Um diese große Zahl etwas „fassbarer“ zu machen, nehmen wie an, dass jede
Menükarte auf eine DIN A4 Seite (210 mm × 297 mm) normalen
Schreibpapiers gedruckt wird.
5
Eine Seite hat die Höhe/Dicke von 0,1 mm = 10-4 m = 10-7 km. Alle Karten
übereinander gelegt ergeben dann einen Turm von ca. 2,4 1011 km Höhe.
Die Entfernung Erde Sonne beträgt ca. 1,5 108 km und somit entspricht der
Turm etwa dem 1.600-fachen der Entfernung Sonne - Erde, reicht also weit
aus unseren Sonnensystem (äußerer Rand ist etwa beim 1.200-fachen der
Entfernung Sonne - Erde (z. B. Objekt (87269) 2000 OO67 [4])) heraus.
Ein anderer Vergleich:
Der Flächeninhalt der Erdoberfläche ist 510 Millionen km² = 5,1 1018 cm² und
danach wäre die gesamte Erdoberfläche mit Stapeln von Menükarten mit
einer Höhe von 30 cm bedeckt.
An dieser Stelle sei noch bemerkt, dass eine Addition nicht die Lösung der
Aufgabe darstellt:
MK1* = 20 + 19 + 18 + . . . + 2 + 1 ,
da folgende Herleitung nach dem allgemeinen elementaren Zählprinzip der
Kombinatorik gilt (s. o.):
- für die 1. Stelle gibt es 20 Möglichkeiten,
- für die 2. Stelle gibt es nur noch 19 Möglichkeiten und zwar für jede der
20 ersten Möglichkeiten und damit sind das also somit insgesamt:
19 * 20 Möglichkeiten für die Auswahl der ersten beiden Stellen
- … und so weiter.
2. Gegeben sei wieder eine Menükarte mit 20 Hauptgerichten, allerdings dieses
Mal in 6 Kategorien (Süßwasser- (4) und Meeresfische (2), Schweine- (5),
Rind- (4), Lammfleisch (2), Vegetarisch(3)) aufgeteilt. Die „vereinfachte“
Menükarte enthält also folgende Elemente:
Sü1, Sü2, Sü3, Sü4, Me1, Me2, Sc1, Sc2, Sc3, Sc4, Sc5, Ri1, Ri2, Ri3, Ri4, La1,
La2, Ve1, Ve2, Ve3 .
Nun soll für jede Menükarte gelten, dass die Namen der Gerichte zwar
beliebig gereiht werden können, aber innerhalb der Kategorie in numerisch
aufsteigender Reihenfolge stehen sollen, also beispielsweise:
La1, Ve1, Sü1, Sc1, Sc2, Ri1, Sü2, Me1, Sü3, Sc3, Ri2, Ri3, La2, Ve2, Sc4, Ve3,
Me2, Sc5, Sü4, Ri4 .
Als ersten Ansatz nehmen wir die Lösung von 1., müssen aber die nicht
unterscheidbaren Elemente je Kategorie wieder „heraus“-dividieren:
Beispielsweise lässt sich die Sequenz Sü1, Sü2, Sü3, Sü4 in einer beliebigen
Folge z.B. einer 11 Zeichen langen Folge
A, B, Sü1, C, Sü2, Sü3 , D, Sü4, E, F, G
analog zu 1. Oben, auf 4 * 3 * 2 * 1 = 4! verschiedene Weisen anordnen.
6
Die nicht unterscheidbaren Vertauschungen müssen also bis auf eine wieder
herausgerechnet werden, d. h. die Gesamtanzahl der Vertauschungen ist
durch die Anzahl der nicht unterscheidbaren Vertauschungen zu dividieren.
Somit ergibt sich für das Beispiel:
20!
4! 2! 5! 4! 2! 3!
2.432.902.008.176.640.000

24 * 2 *120 * 24 * 2 * 6
MK 2 
2.432.902.008.176.640.000
1.658.880
MK 2  1.466.593.128.000

 1,5 1012
In jeder einzelnen dieser Konfigurationen können die Elemente nun in
numerischer Reihenfolge je Kategorie nummeriert werden und es wird keine
Wiederholung geben.
Führen wir die „Turm-Berechnung“ von oben weiter, so ergibt sich folgendes
Bild:
wir nehmen wieder an, dass jede Menükarte auf eine DIN A4 Seite normalen
Schreibpapiers gedruckt wird, mit der Höhe/Dicke jeder Seite von
0,1 mm = 10-4 m = 10-7 km. Alle Karten übereinandergelegt ergibt dann einen
Turm von 150.000 km Höhe und das ist gerade einmal ca. 40% des Weges
von der Erde zum Mond.
3. Wir nehmen nun an, dass 3 Personen das Restaurant besuchen. Die
Speisekarte beinhaltet 20 Hauptgerichte. Wie viele Auswahlen von 3
Gerichten gibt es, wenn alle Personen unterschiedliche Hauptgerichte
auswählen.
Nachdem der erste Gast eine aus den 20 Speisen ausgewählt hat, bleiben für
den zweiten noch 19 Speisen zur Auswahl und schließlich für den Dritten noch
18. Damit ergibt sich die Anzahl der Auswahlen A1 zu:
A1 = 20 * 19 * 18
= 3420
4. Unsere 3 Personen besuchen nochmals das Restaurant und orientieren sich
bei der Speisenauswahl aus den 20 Speisen diesmal an den oben
vorgegebenen Kategorien:
Sü1, Sü2, Sü3, Sü4, Me1, Me2, Sc1, Sc2, Sc3, Sc4, Sc5, Ri1, Ri2, Ri3, Ri4, La1,
La2, Ve1, Ve2, Ve3
Wie viele Auswahlen von 3 Gerichten gibt es, wenn alle Personen ein
7
Hauptgericht, aber alle aus unterschiedlichen Kategorien auswählen?
Betrachten wir zuerst die möglichen Kombinationen der Kategorien:
{Sü, Me, Sc}, {Sü, Me, Ri}, {Sü, Me, La}, {Sü, Me, Ve},
{Sü, Sc, Ri}, {Sü, Sc, La}, }, {Sü, Sc, Ve},
{Sü, Ri, La}, {Sü, Ri, Ve},
{Sü, La, Ve},
{Me, Sc, Ri}, {Me, Sc, La}, {Me, Sc, Ve},
{Me, Ri, La}, {Me, Ri, Ve},
{Me, La, Ve},
{Sc, Ri, La}, {Sc, Ri, Ve},
{Sc, La, Ve}
{Ri, La, Ve}
Es soll nicht zwischen den Auswahlen unterschieden, wer als erstes mit der
Auswahl beginnt usw. Damit ergibt sich die Anzahl der Auswahlen A2 zu:
A2 = 4 * 2 * (5 + 4 + 2 + 3) + 4 * 5 * (4 + 2 + 3) + 4 * 4 * ( 2 + 3) + 4 * 2 * 3 +
+ 2 * 5 * (4 + 2 + 3) + 2 * 4 * (2 + 3) + 2 * 2 * 3 +
+ 5 * 4 * (2 + 3) + 5 * 2 * 3 +
+4*2*3
= 112 + 180 + 80 + 24 +
+ 90 + 40 + 12 +
+ 100 + 30 +
+ 24
= 692
Man erkennt also deutlich, dass die Frage nach Anzahlen von Anordnungen /
Auswahlen nicht leicht beantwortet werden kann, wenn nicht klar definiert wird, was
denn mit „anordnen“ gemeint ist. Systematisch werden wir dieses und zugehörige,
effiziente Berechnungsmethoden in Kapitel 4 betrachten.
3 Elemente der Mengenlehre und der Lehre von
Multimengen
In diesem Abschnitt sollen einige Mengenoperationen auf und die Mächtigkeit von
endlichen Mengen kurz zusammengefasst werden.
Beginnen wollen wir mit der Definition einer Menge. Nach Georg Cantor (geb.
19. Februar 1845. in Sankt Petersburg, gest. 6. Januar 1918 in Halle an der Saale)
gilt:
Definition: Unter einer „Menge“ verstehen wir jede Zusammenfassung M von
bestimmten wohlunterschiedenen Objekten o unserer Anschauung oder
unseres Denkens (welche die „Elemente“ von M genannt werden) zu
einem Ganzen [6].
8
Diese Definition ist insofern nicht ausreichend, da aus ihr widersprüchliche Aussagen
abgeleitet werden können, wenn die Mengen „sehr groß“ werden, z. B. bei
Betrachtung der „Menge aller Mengen“ [8]. Für die Untersuchungen in dieser Arbeit
benötigen wir nur endliche Mengen und dafür ist die Definition ausreichend.
Mit der Definition ist klar, dass Wiederholungen von Elementen nicht zulässig sind,
denn es sollen ja „wohlunterschiedene Objekte“ zusammengefasst werden. Die
obige Definition kann erweitert werden, sodass auch solche Zusammenfassungen
behandelt werden. Darauf werden wir weiter unter zurückkommen.
Definition: 1. Die Mächtigkeit m einer Menge M ist definiert als die Anzahl der
Elemente von M, geschrieben als m  M
2. Eine Menge B heißt eine Teilmenge von A, geschrieben B  A ,
wenn für alle x  B gilt : x  B  x  A .
3. Zwei Mengen A, B heißen gleich, wenn A  B und B  A gilt.
Seien zwei Mengen A, B gegeben:
4. Die Vereinigungsmenge der Mengen A , B , geschrieben A ∪ B,
ist die Menge aller x für die gilt: x  A oder x  B .
5. Die Schnittmenge der Mengen A, B , geschrieben A ∩ B, ist die
Menge aller x für die gilt: x  A und x  B .
6. Die Differenzmenge von A und B. geschrieben A\B, gesprochen
A ohne B, ist die Menge aller x für die gilt x  A und x  B
Definition: Sei nun A eine endliche Mengen A   a1 , a2 , a3 , . . . , an  gegeben.
Die Potenzmenge  von A ist definiert als die Menge aller Teilmengen
von A:
A   B B  A 
Beispiel: Sei A   a, b, c, d, e, f gegeben. Die Mächtigkeit von A ist damit |A| = 5,
Dann ergibt sich (A) zu:
(A) 
( a, b, c, d, e)
  ,
 a, b, c, d, e,
 a, b, a, c, a, d, a, e,  b, c, b, d, b, e,
 c, d, c, e, d, e,
 a, b, c, a, b, d, a, b, e, a, c, d, a, c, e, a, d, e,
 b, c, d, b, c, e, b, d, e, c, d, e,
 a, b, c, d, a, b, c, e, a, b, d, e,, a, c, d, e, b, c, d, e,
 a, b, c, d, e, f  
9
A
 32
 25
 (1 1)5
5 5
  
 0   1
 1  5 
5 5
  
 2 3
10  10 
 5 5
   
 4 5
5  1
Beweisen wir nun, dass diese Beziehung für alle endlichen Mengen gilt.
Satz 1: Die Mächtigkeit der Potenzmenge (A) der Menge
A   a1 , a2 , a3 , . . . , an  ergibt sich zu
 A   2 A  2n .
Beweis: Der Beweis wird mit Hilfe der vollständigen Induktion geführt:
1. Induktionsbeginn:
n = 0: A = ∅ ⟹
A


   1  20  2
2. Induktionsvoraussetzung:
Für An   a1 , a2 , a3 , . . . , an  gilt:
A
2
A
A
 2n .
3. Induktionsschluss:
Sei An+1 gegeben mit
A n1   a1 , a2 , a3 , . . . , an ,an  1   a1 , a2 , a3 , . . . , an   an  1
 A n  an  1
und
 An 
  B B  An 
damit ergibt sich
 An1    C


C  A n1   C C  A n oder  C  B  an1 mit B  A n 
  C C  A n    C C  B  an1 mit B  A n 
da die obige Zerlegung von (An+1) disjunkt ist, d. h. der Schnitt der
beiden Mengen leer ist, und die Anzahl der Elemente beider Mengen
gleich groß ist - nämlich nach Induktionsvoraussetzung 2n - ergibt sich:
A   B B  A    C
 B B  A   C
n 1

2n

2 2n

2n1
n
C  B  an1 und B  A n 
n
C  B  an1 und B  A n 

2n
+++
10
Anmerkung: Man beachte, dass gilt:
zwei Mengen sind gleich, wenn sie die gleichen Elemente enthalten.
Das heißt insbesondere, dass es auf die Reihenfolge, in der die
Elemente aufgeschrieben sind, nicht ankommt. Also beispielsweise
gilt a1 , a2 , a3   a3 , a1 , a2 
Zur Betrachtung von „Aufzählungen“ ohne Berücksichtigung der
Reihenfolge sind also Mengen zu verwenden.
Konsequenterweise betrachten wir nun Aufzählungen bei denen auch die
unterschiedlichen Reihenfolgen mit gezählt werden.
Dazu ermitteln wir vorab alle möglichen Anordnungen von den Elementen der Menge
A 4  1, 2, 3, 4 , so erhalten wir gemäß der unteren Tabelle genau 24 = 4!
Anordnungen.
Zählindex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Satz 2:
Setzen der 1
auf eine von 4
freien
Positionen
1
*
*
*
*
1
*
*
*
*
1
*
*
*
*
1
Setzen der 2
auf eine von 3
freien
Positionen
1
2
*
*
1
*
2
*
1
*
*
2
2
1
*
*
*
1
2
*
*
1
*
2
2
*
1
*
*
2
1
*
*
*
1
2
2
*
*
1
*
2
*
1
*
*
2
1
Setzen der 3
auf eine von 2
freien
Positionen
1
1
1
1
1
1
2
2
3
*
3
*
2
2
3
*
3
*
2
2
3
*
3
*
2
2
3
*
3
*
1
1
1
1
1
1
3
*
2
2
*
3
3
*
2
2
*
3
3
*
2
2
*
3
3
*
2
2
*
3
1
1
1
1
1
1
*
3
*
3
2
2
*
3
*
3
2
2
*
3
*
3
2
2
*
3
*
3
2
2
1
1
1
1
1
1
Setzen der 4 auf
letzte freie
Position
1
1
1
1
1
1
2
2
3
4
3
4
2
2
3
4
3
4
2
2
3
4
3
4
2
2
3
4
3
4
1
1
1
1
1
1
3
4
2
2
4
3
3
4
2
2
4
3
3
4
2
2
4
3
3
4
2
2
4
3
1
1
1
1
1
1
4
3
4
3
2
2
4
3
4
3
2
2
4
3
4
3
2
2
4
3
4
3
2
2
1
1
1
1
1
1
Tabelle der möglichen Anordnungen von den 4 Elementen der Menge A4
Die n ≥ 1 Elemente einer Menge An  a1 , a2 , a3 , . . . , an  2 , an 1 , an


lassen sich auf n! – Weisen anordnen.
Beweis: Betrachten wir die oben angegebene Menge
An  a1 , a2 , a3 , . . . , an  2 , an 1 , an 
o
o
o
o
o
das 1. Element kann auf n verschiedener Positionen gestellt werden,
das 2. Element kann auf (n-1) verschiedener Positionen gestellt werden,
…
das n-1. Element kann auf 2 verschiedene Positionen gestellt werden,
das n. Element kann auf nur auf die letzte verbliebene also eine Position
gestellt werden.
11
Insgesamt ergeben sich also n * (n-1) * (n-2) * . . . * 1 = n!
Anordnungsmöglichkeiten.
+++
Damit lässt sich nun errechnen, wie viele Teilmengen gleicher Mächtigkeit einer
Menge existieren. Darüber gibt der nächste Satz Auskunft.
Satz 3: Die Anzahl der Teilmengen B ⊆ A, A  n 
also B 
A , 1 
mit genau k Elementen,
n
n!
B  k  n , ist gleich:   
 k  (n  k)! k!
Beweis: Der Beweisansatz ähnelt dem von Satz 2:
o
o
o
o
das 1. Element kann auf n verschiedener Weisen gewählt werden,
das 2. Element kann auf (n-1) verschiedener Weisen gewählt werden,
…
das k. Element kann auf (n-(k-1)) = (n-k+1) verschiedener Weisen
gewählt werden.
Damit haben wir n * (n-1) * (n-2) * . . . * (n – k + 1) Mengen. Nun das
„Standardargument“: per Definition sind zwei Mengen gleich, wenn sie die
gleichen Elemente, unabhängig von der Reihenfolge der Elemente,
enthalten.
Also müssen aber noch die Mengen herausgenommen werden, die sich nur
in der Reihenfolge der Elemente unterscheiden, denn für Mengen ist die
Reihenfolge der Elemente nicht relevant. Damit ist das oben ermittelte
Ergebnis gemäß des Satz 2 noch durch k! zu dividieren:
n * (n  1) * (n  2)* . . . * (n  (k 1))

k!
n * (n  1) * (n  2)* . . . * (n  (k 1)) * (n  k) * (n  (k  1)) * . . . * 2 * 1

k ! ((n  k) * (n  (k  1)) * . . . * 2 * 1)

n * (n  1) * (n  2)* . . . * 2 * 1
k! (n  k)!

n!
(n  k)! k!
+++
Anmerkung: Nach Satz 1: gilt für alle Teilmengen einer Menge:
Die Anzahl der Teilmengen von A ist gleich:
A  2 A  2n .
Nach Satz 3 gilt für die Anzahl der Teilmengen mit k Elementen
n
n!
B   A  mit 1  B  k  n :   
 k  (n  k)! k!
Summieren wir den letzten Term über alle k mit 0 ≤ k ≤ n, d. h. wir
12
summieren über alle Teilmengen B von A, so ergibt sich:


k  0 

 
n
n
n
n!
1k 1n  k 

  

k
(n

k)!
k!
k  0 
k 0

n
n
 k   2
n
 1  1
n
1  1
n

n
n!
 (n  k)! k! 1
1n  k
k
k 0
Satz 1 und Satz 3 liefern also eine Spezialform der Binomischen Formel
n
n!
n
a k b nk .
a  b  
k  0 (n  k)! k!
Im nächsten Schritt wird nun das Produkt von Mengen definiert und untersucht.
Definition: Das k-fache (kartesische) Produkt der Mengen
Ai   a1 , a2 , a3 , . . . , an  i  1, 2, ... , k ist definiert als:
i
k
A
i 1
i
 A1 x A 2 x ... x A k

 (a
1
,a2 , .... , ak ) a1  A1 ,a2  A 2 , .... , ak  A k

Die Elemente (a1 ,a2 , .... , ak ) nennt man k-Tupel,
a1 ,a2 , .... , ak heißen Komponenten.
Gilt für mindestens ein j mit 1 ≤ j ≤ n: Aj = ∅ , so wird definiert
k
A
i 1
i
 .
Kommen wir nun zu den in der Einleitung erwähnten und, wie wir gleich sehen
werden, selbstverständlich klingenden Zählprinzipien mit denen endliche (Teil-)
Mengen einfach und schnell abgezählt werden können. Dabei setzen wir auf die
Überlegungen von den Beispielen aus 2. Zählprobleme auf.
Satz 4


Seien n Mengen A i  a1 , a2 , a3 , . . . , a k i mit ki  1 und 1  i  n ,
gegeben. Dann gelten die folgenden Regeln:
Summenregel Die Mächtigkeit der Vereinigungsmenge von paarweise
disjunkten Mengen A i , also Ai  A j   für alle i ≠ j, ergibt
n
sich zu
i1
Produktregel
n
Ai   Ai ,
i 1
Die Mächtigkeit des n-fachen (kartesischen) Produkts der
Mengen Ai   ergibt sich
n
mit Vn :  A i : A1  ...  A n
i 1
13
zu
Vn 
n
A
i 1
n
i
  Ai .
i 1
Gilt für mindestens ein Ai   , so definieren wir
n
A
i 1
i
:  .
Bemerkung: in der Literatur wird für das Mengenprodukt
auch die folgende Schreibweise verwendet:

n
i 1
n
A i :  A i
i 1
Beweis: A. Beweis der Summenregel
Der Beweis der Summenregel wird in 2 Schritten, jeweils mit Hilfe der
vollständigen Induktion, geführt.
I. Vereinigung von 2 Mengen A1 , A 2 und Induktion über die Mächtigkeit von
A2  k2
1. Induktionsbeginn:
 A1  A 2  A1 
k2  0 : A2    

 A2  0

 A1  A 2  A1  A1  0  A 1  A 2
2. Induktionsvoraussetzung:
A 2  k 2 : A1  A 2  A1  A 2
3. Induktionsschluss:
A 2  k 2  1:
für ein beliebiges a  A 2 gilt A 2 \ a  k 2
und nach Voraussetzung gilt :
A1  A 2  
und somit auch : A1   A 2 \ a   
Induktionsvoraussetzung angewandt auf A1   A 2 \ a    liefert :
A1   A 2 \ a   A1  A 2 \ a  A1  k 2
und damit
A1  A 2  A1   A 2 \ a  a   A1  A 2 \ a  a
 (A1  A 2 \ a )  a
 A1  A 2 \ a  a

A
1
 k2   1
 A1  k 2  1  A1  (k 2  1)
 A1  A 2
14
II. Vereinigung von n Mengen, n ≥ 2
1. Induktionsbeginn:
n = 2: gilt nach I.
2. Induktionsvoraussetzung:

für Ai  A j   mit Ai  a1 , a2 , a3 , . . . , aki
n
i1
 für 1 ≤ i ≤ n
gilt:
n
Ai   Ai
i 1
3. Induktionsschluss
n 1
n
Ai 
i1
i1
n

i1

n

i 1

Ai  An 1
Ai  An 1
nach Induktionsbeginn
Ai  An 1
nach Induktionsvoraussetzung
n 1

i 1
Ai
B. Beweis der Produktregel
Der Beweis kann wieder mit Hilfe der vollständigen Induktion geführt
werden. Hier verwenden wir einen kombinatorischen Ansatz.
Betrachten wir die oben angegebene Mengen

A i  a1 , a2 , a3 , . . . , ani  2 , ani 1 , ani
k
A
i1
i

mit
A i  ni
  (a1 ,a2 , .... , ak ) a1  A1 ,a2  A 2 , .... , ak  A k

o das 1. Element kann aus A1 auf A1 Arten ausgewählt werden,
o das 2. Element kann aus A 2 auf A 2 Arten ausgewählt werden,
o …
o das k. Element kann aus Ak auf A k Arten ausgewählt werden,
Insgesamt ergeben sich also A1 * A 2 * . . . * A k  1 * A k
Elemente der
Produktmenge.
+++
Bemerkung: Gilt A 1  A 2  . . .  A k 1  A k  A , A  n so folgt
k
A
i 1
 Ak 
 (a
1
,a2 , .... , ak ) a1 ,a2 , .... , ak  A  
15
A
k
Es gibt also A
k
 n k - viele Anordnungen von n Elementen einer
Menge A mit 0  A  n , wobei hier auch Tupel mit gleichen
Komponenten, d. h. also Anordnungen von n Elementen mit
Wiederholungen der Elemente z. B. (a1 ,a1 , .... , a1 ) und
verschiedene Reihenfolgen der Elemente mitgezählt werden z. B.
das k-Tupel (a3 ,a1 ,ak ,ak 3 , ..., a2 ) .
Zur Erinnerung:
Die n ≥ 1 Elemente einer Menge An  a1 , a2 , a3 , . . . , an  2 , an 1 , an 
lassen sich auf n! – Weisen anordnen, da per Definition für eine Menge
Wiederholungen von Elementen nicht zugelassen sind.
Satz 5: Die Anzahl der Elemente des k-fachen (kartesischen) Produkts Vk der
Menge A mit A  n  k verschiedenen Komponenten ergibt sich zu:

Vk*  (b1 ,b2 , .... , bk ) für alle 1  i  k, bi  A und bm  b j für m  j
Vk* 

n!
.
(n  k)!
Beweis: Der Beweis erfolgt analog zu dem Beweis der Produktregel von Satz 4,:
Betrachten wir die oben angegebene Menge
A  a1 , a2 , a3 , . . . , an  2 , an 1 , an  und bilden
k
 A   (a
i 1
1
,a2 , .... , ak ) a1 ,a2 , .... , ak  A

k
Konstruieren wir nun die (b1 ,b2 , .... , bk )  Vk   A
i 1
o das 1. Objekt b1 kann aus A auf A  n Arten ausgewählt werden,
o das 2. Objekt b2 kann aus A auf  A  1  n  1 Arten ausgewählt
werden, da das erste gewählte Element nicht mehr ausgewählt werden
darf,
o …
o das (k-1)-te Objekt bk-1 kann aus A auf  A  (k  2)  n  (k  2) Arten
ausgewählt werden,
o das k-te. Objekt bk kann aus A auf  A  (k  1)  n  (k  1) Arten
ausgewählt werden.
16
Insgesamt ergeben sich also
Vk  n * (n  1) * ... * (n   k  2 )*(n  (k  1))
 n * (n  1) * ... * (n  k  2 )*(n  (k  1))

(n  k)* ... * 1
(n  k)!
n!
(n  k)!
Elemente der Produktmenge mit unterschiedlichen Objekten jedes k-Tupels
+++
Wir kommen nun, wie oben angekündigt, zu der Erweiterung des Mengenbegriffs
hinsichtlich der „Wohlunterscheidbarkeit der Objekte“ bzw. „Wiederholung von
Elementen“ bei der Zusammenfassung zurück.
Dazu definieren wir eine neue Struktur gemäß [9], die Multimengen. Zur Vorbereitung
definieren wir die charakteristische Funktion auf einer Teilmenge T einer Menge M.
Definition: Unter einer charakteristischen Funktion I einer Teilmenge T ⊆ A
1 falls x  T
verstehen wir eine Abbildung I : A   0,1 mit I(x)  
0 falls x  T
Bemerkung: Die charakteristische Funktion wird auch Indikatorfunktion genannt.
Die charakteristische Funktion gibt also für jedes Element von A an, ob es 1-mal oder
0-mal in der Menge T  A vorkommt. Dies legt nun die Verallgemeinerung der
charakteristischen Funktion nahe, die man Multimenge nennt, auch wenn es eine
Funktion ist.
Definition: Unter einer Multimenge M über einer Menge A verstehen wir eine
Abbildung M : A  0 durch die jedem Element a ∈ A durch M(a) eine
natürliche Zahl inklusive der Null zugeordnet wird.
M(a) heißt Vielfachheit von a.
Die Summe der Vielfachheiten über alle Elemente a ∈ A nennt man
Kardinalität von M, geschrieben M   M(a) .
aA
Bemerkung:
Wir können nun für jedes x ∈ A M(x) als die Anzahl der Elemente x
interpretieren und beschreiben die Multimenge als




M := a,a,...,a,b,b,....b,....,v,v,...,v  .

kb  mal
k v  mal 

 ka  mal
Die Aufzählung der Elemente wird von geschleiften Doppelklammern
eingefasst. Die Darstellung der Multimenge M ist nicht eindeutig, da es
17
auf die Reihenfolge der Elemente, analog zur Mengendarstellung,
nicht ankommt.
Betrachten wir dazu ein Beispiel:
Sei A = {a, b, c, d, e} und
a  1
b  4

M : c  2
d  0

 e  2
also
M(a) = 1, M(b) = 4, M(c) = 2, M(d) = 0, M(e) = 2
Entsprechend der oben angegebenen Interpretation schreibt man daher die
Multimenge M als:
M  M(A)  a, b, b, b, b, c, c, e, e
Es gibt aber auch andere Darstellungen von Multimengen. Eine davon soll hier
erläutert werden [10].
Sei eine Menge A gegeben mit A  n, n 
. Nehmen wir dazu eine beliebige,
aber feste Nummerierung der n Elemente a i  A , 1 ≤ i ≤ n an. Dann konstruieren
wir die Darstellung Multimenge M mit Kardinalität k 
n
 M(a )
i1
i
1.
für das erste Element a1 schreiben wir entsprechend seiner
Vielfachheit M(a1)-oft • , ggf. Null-mal
falls A  n  2 :
2.
das Trennzeichen |,
3.
für das zweite Element a2 entsprechend seiner Vielfachheit
M(a2)-oft • , ggf. Null-mal
falls A  n  3 :
4.
…
2n-3.
2*(n-1).
2*n-1.
das Trennzeichen |,
für das (n-1)-te Element an-1 entsprechend seiner Vielfachheit
M(an-1)- oft • , ggf. Null-mal
das Trennzeichen |,
schließlich für das n-te Elemente an entsprechend seiner Vielfachheit
M(an) oft • , ggf. Null-mal
Insgesamt haben wir somit k-mal • und (n – 1)-mal den Trennstrich | erhalten. Damit
ergibt sich eine Zeichenkette aus k + (n – 1) = n + k − 1 Zeichen.
Beispiel: M  M(A)  a, b, b, b, b, c, c, e, e wird dargestellt durch
• | • • • • | • • | • •.
Jeder Zeichenkette entspricht genau eine Multimenge und umgekehrt. Wir werden
18
diese Schreibweise weiter unten verwenden.
Betrachten wir noch einige Operationen auf Multimengen, die analog zu
Mengenoperationen definiert werden. Zuvor aber noch eine Definition.
Definition: Die reduzierte Grundmultimenge, supp(M), einer Multimenge M über A
ist definiert als die Menge supp(M)   x A M(x)  0  .
Die reduzierte Grundmultimenge enthält also die relevanten Elemente von M, d. h.
anschaulich nur die Elemente, die auch tatsächlich mindestens einmal vorkommen.
Im Folgenden wird vorausgesetzt, dass die Kardinalität der betrachteten
Multimengen endlich ist, denn dann existiert insbesondere das Maximum zweier
Kardinalitäten. Diese Einschränkung ist für die Betrachtungen weiter unten
ausreichend, kann aber durch entsprechende Erweiterung der Definition auch
vermieden werden, siehe z. B. [10].
Definition: Seien N, M Multimengen gegeben.
1. N heißt eine Teilmultimenge von M, geschrieben N  M wenn
- für alle x  N folgt x  M und
- für alle y  supp(N) gilt : 0  N(y)  M(y) .
2. Zwei Multimengen N, M heißen gleich, wenn N  M und M  N gilt.
3. N ∪ M heißt Vereinigungsmultimenge von N und M, wenn für alle
x  supp(N)  supp(M) gilt : (N  M)(x) : max(N(x), M(x)) .
4. N ∩ M heißt Schnittmultimenge von N und M, wenn für alle
x  supp(N)  supp(M) gilt : (N  M)(x) : min(N(x), M(x)) .
5. Sei N  M . Dann heißt M\N die (arithmetische)
Differenzmultimenge von M und N, gesprochen M ohne N,
wenn für alle
x  supp(M) gilt : (M \ N)(x)  M(x)  (M  N)(x)
 M(x)  min M(x), N(x) .
An dieser Stelle soll erwähnt werden, dass die bekannten Regeln aus der
Mengenlehre nicht analog übertragen werden können. Beispielhaft sei hier der
folgende Satz der Mengenlehre betrachtet:
Für 2 Teilmengen A, B einer Menge X gilt:
A, B  X  A \ B  B   .
Dieser Satz gilt i. a. nicht für Multimengen, denn mit den unten definierten
Multimengen X, A, B mit: X(a) = A(a) = 2 , X(b) = A(b) = 3 und B(b) = 2
oder in anderer Form
X = A = {a, a, b, b, b} und B = {b, b} folgt:
19
A \ B (a)  A(a)  (A  B)(a)  A(a)  min( A(a),B(a))  2  min( 2,0 )  2
A \ B (b)  A(b)  (A  B)(b)  A(b)  min( A(b),B(b))  3  min( 3,2 )  1
.
((A \ B)  B) (a)  min((A \ B) (a) ,B(a))  min( 2,0)  0
((A \ B)  B) (b)  min((A \ B) (b) ,B(b))  min(1, 2)  1  0
oder in anderer Form :
A \ B  B   a, a, b, b, b  \  b, b    b, b    a, a, b    b, b    b   
Weitere Details zu Mengen / Multimengen findet man z. B. in [10], [21].
Kommen wir nochmals auf die Darstellung von Multimengen zurück. Analog zur oben
angegebenen Darstellung einer Multimenge können auch die Teilmultimengen
entsprechend dargestellt werden.
Beispiel: Sei M  M(A)  a, b, b, b, b, c, c, e, e gegeben, dargestellt durch
•| • • • •|• • |• •
und die Teilmultimenge N  a, b, b, b, e  M(A) wird dargestellt durch
• | • • • || •.
Man beachte, dass die Anzahl der Trennstriche bei jeder Teilmultimenge genauso
groß ist wie die Anzahl der Trennstriche der zugrundeliegenden Multimenge.
Im folgenden Satz wollen wir nun angeben, wie viele Multimengen mit Kardinalität k
aus einer vorgegebenen Menge A mit A  n konstruiert werden können [9].
Satz 6: Sei die Menge A mit A  n gegeben. Betrachten wir nun alle
Multimengen N über A mit der Kardinalität N  k . Dann ist die Anzahl der
Multimengen N mit Kardinalität k gegeben durch:
  n    n  k  1 (n  k  1) * (n  k  2) *...* (n  1) * n
.
    : 

k
k!

 k  
Beweis: Zum Beweis nutzen wir die oben definierte Darstellung der Multimenge
durch die Zeichenkette mit | • .
Jede solche Zeichenkette hat die Länge k + n - 1 (k nicht notwendigerweise
verschiedene Elemente aus A, (n – 1) Trennzeichen) und entspricht genau
einer der gesuchten Multimengen und umgekehrt.
Die Zeichenketten sind einfach zu zählen, denn eine Zeichenkette ist
eindeutig durch die Position der k Zeichen • bestimmt. Wie viele Möglichkeiten es gibt, aus den n+k−1 Positionen k auszuwählen liefert Satz 3:
20
 k  n  1
damit ergibt sich die Anzahl aller Anordnungen zu 
 und das lässt
k


sich wie folgt umformen:
 k  n  1  n  k  1



k
k

 


(n  k  1)!
((n  k  1)  k)! k !

(n  k  1)!
(n  1)! k !
(n  k  1) * (n  k  2) *...* (n  1) * n * (n  1) *...* 2 * 1
k!
(n  1)!
(n  k  1) * (n  k  2) *...* (n  1) * n

k!

+++
4 Anordnungen und Auswahlen
4.1 Permutationen
Wir betrachten nun unterschiedliche Konfigurationen bei der Anordnung von
Elementen einer Menge. Die Anordnungen / Vertauschungen bezeichnet man als
Permutationen. Die Bezeichnung leitet sich aus dem lateinischen Wort permutare
(deutsch: vertauschen) ab.
4.1.1 Permutationen von unterscheidbaren Elementen
Definition Gegeben sei eine Menge A mit n ∈ ℕ (d.h. endlich vielen, paarweise
verschiedenen) Elementen. Eine Folge von k paarweise verschiedenen
Elementen aus A mit 1 ≤ k ≤ n heißt eine k-Permutation.
Satz 7: Sei die Menge A  a1 , a2 , a3 , . . . , an  2 , an 1 , an  mit n ≥ 1 Elementen
gegeben. Dann ist die Anzahl der k-Permutationen auf A gegeben durch
P(n,k) 
n!
 n * (n  1) * ... * (n  (k  2)) * (n  (k  1))
(n  k)!
Beweis: Nach Satz 3 gilt:
Die Anzahl der Teilmengen B 
 A  , mit genau k Elementen,
n
n!
1  B  k  n , ist gleich:   
 k  (n  k)! k!
Nach Satz 2 gilt:
21
Die k ≥ 1 Elemente einer Menge Ak  a1 , a2 , a3 , . . . , ak  2 , ak 1 , ak 
lassen sich auf k ! – Weisen anordnen.
Somit folgt für die Anzahl der k-Permutationen:
n
n!
n!
P(n,k)  Pn , k    k! 
k! 
(n  k)! k!
(n  k)!
k 
+++
Ein wichtiger Spezialfall einer k-Permutation ist k = n.
Definition
Sei die Menge A  a1 , a2 , a3 , . . . , an  2 , an 1 , an  mit n ≥ 1 Elementen
gegeben. Eine bijektive Abbildung der Menge A auf sich selbst heißt
eine Permutation der Menge A.
Bemerkung: Die Permutationen einer Menge A sind also nichts anderes als alle
möglichen Anordnungen aller n Elementen aus der Menge A (siehe
Satz 2 bzw. 7 oben) und somit die n-Permutation.
Satz 8: Sei die Menge A n  a1 , a2 , a3 , . . . , an  2 , an 1 , an  mit n ≥ 1 Elementen
gegeben. Dann ist die Anzahl der Permutationen auf An Pn  n! .
Beweis: Spezialfall von Satz 7 mit k = n und somit Pn  Pn,n  n!
Bemerkung: Satz 8 ist eine andere Formulierung von Satz 2.
4.1.2 Permutation von teilweise nicht unterscheidbaren Elementen
Betrachten wir wieder k-fache (kartesische) Produkt einer Mengen A mit n
Elementen A   a1 , a2 , a3 , . . . , an  also
n
 A  A x A x ...x A   (a
i 1
1
,a2 , .... , an ) ai  A für alle 1  i  n  .
n  Faktoren
Nehmen wir nun ein spezielles Element a   a1 , a2 , a3 , . . . , an  heraus, dann gilt:
22
Satz 9: Sei das n-Tupel a   a1 , a2 , a3 , . . . , an  mit k verschiedenen Elementen
1 ≤ k ≤ n gegeben und sei jedes der k verschiedenen Elemente aj jeweils
k
mj - mal mit 1 ≤ mj ≤ n und
m
j 1
j
 n vorhanden
Dann ist die Anzahl der Anordnungen
n


n!
Pm1, m2 , ..., mk  
 :
 m1 , m2 , ..., mk  m1 ! * m2 ! * ... *mk !
Bem. : Für k  2 mit a   a1 , a2  und n  m1  m2 ergibt sich
 n 
 n 
n!
n!

 

 :
m 1 ! * n  m 1   m 1 
m1 , m 2  m1! * m 2 !
d. i. der bekannte Binomialkoeffizien t.
Man beachte, dass die Aussage eine andere ist als die von Satz 3, denn
dort geht es um die Anzahl von k-elementigen Teilmengen einer Menge mit
n Elementen während hier n-Tupel gezählt werden deren Komponenten
genau zwei verschiedene Werte annehmen kann.
Beweis: Wir betrachten 2 Fälle:
1. k = n, d. h. alle a1 , … , an sind paarweise verschieden:
dann gibt es nach Satz 2 bzw. Satz 8 insgesamt n! verschiedene
Anordnungen der n Elemente und es gilt:
n! 
n


n!
n!
n!
n!
 n 


,
n
1
1!
1!
...1!
1,
1,
...
,1
1
1!


 
n  mal
n  mal
2. seien k Elemente ak jeweils mk – mal mit 1 < mk ≤ n vorhanden und gelte
k
m
j 1
j
 n:
dann lassen sich nach Satz 2 für jedes aj , 1 ≤ j ≤ mk , mj! Anordnungen
nicht unterscheiden und somit ist die Anzahl der verschiedenen
Anordnungen
n


n!


m1 ! * m2 ! * ... *mk !  m1 , m2 , ..., mk 
+++
23
4.2 Variationen
4.2.1 Variationen ohne Wiederholung
Definition
Sei die Menge A  a1 , a2 , a3 , . . . , an  2 , an 1 , an  mit n ≥ 1 Elementen
gegeben. Jedes (geordnete) k- Tupel aus Ak, k ≤ n mit k verschiedenen
Elementen aus A heißt eine Variation ohne Wiederholung. Die Anzahl
aller Variationen ohne Wiederholung bezeichnen wir mit VO(n,k)..
Satz 10: Seien die Menge A  a1 , a2 , a3 , . . . , an  2 , an 1 , an  gegeben und ein
k
mit k ≤ n gegeben.
Dann gilt: VO (n,k) 
n!
(n  k) !
Beweis: Aus Satz 5 ergibt sich: VO (n,k)  Vk*
Bemerkung:
Es gilt:

n!
(n  k) !
VO (n,k)  P(n,k)
4.2.2 Variationen mit Wiederholung
Definition
Sei die Menge A  a1 , a2 , a3 , . . . , an  2 , an 1 , an  mit n ≥ 1 Elementen
gegeben. Jedes (geordnete) k-Tupel aus Ak (also auch die k-Tupel in
denen nicht nur verschiedenen Elementen aus A vorkommen) heißt
eine Variation mit Wiederholung. Die Anzahl aller Variationen mit
Wiederholung bezeichnen wir mit VM(n,k).
Satz 11: Seien die Menge A  a1 , a2 , a3 , . . . , an  2 , an 1 , an  und ein k 
gegeben.
k
Dann gilt: VM (n,k)  n
Beweis: Aus Satz 4 ergibt sich: VM (n,k)  Vk  nk
24
4.3 Kombinationen
Definition Sei die Menge A  a1 , a2 , a3 , . . . , an  2 , an 1 , an  mit n ≥ 1 Elementen
gegeben. Eine Multimenge K über A
k-Kombination von A.
K  k mit 1 ≤ k ≤ n heißt eine
4.3.1 Kombinationen ohne Wiederholung
Definition Gegeben sei nun eine Menge A  a1 , a2 , a3 , . . . , an  2 , an 1 , an  mit
n ≥ 1 Elementen und K eine Teilmenge von A, K  A , K  k  n mit k
(paarweise verschiedenen) Elementen. Dann heißt K eine
k-Kombination ohne Wiederholung.
Satz 12: Sei die Menge A n  a1 , a2 , a3 , . . . , an  2 , an 1 , an  mit n ≥ 1 Elementen
gegeben. Dann ist die Anzahl der k Kombinationen ohne Wiederholung auf
n
An gleich K O (n,k)    .
k 
Beweis: Satz 3
4.3.2 Kombinationen mit Wiederholung
Definition Gegeben sei nun eine Menge A  a1 , a2 , a3 , . . . , an  2 , an 1 , an  mit
n ≥ 1 Elementen und K eine Multimenge über A mit K  k also mit
k Elementen. Dann heißt K eine k-Kombination mit Wiederholung.
Satz 13: Sei nun eine Menge A  a1 , a2 , a3 , . . . , an  2 , an 1 , an  mit n ≥ 1
Elementen und K die Multimengen über A mit K  k Elementen, k ≤ n
gegeben. Dann ist die Anzahl der k Kombination mit Wiederholung auf A n
n
 n  k  1
 .
k


gleich KM (n,k)       
k 
Beweis: Satz 6
25
4.4 Zusammenfassung
Eine grafische Übersicht über die Berechnung der Anzahl von den
unterschiedlichen Anordnungen wird unten dargestellt. Die Darstellung ist auch
ein Entscheidungsbaum zur Auswahl der geeigneten Methode für die Lösung
einfacher, kombinatorischer Aufgaben.
Übersicht von möglichen Anordnungen der Elemente von
Mengen / Teilmengen sowie Multi- / Teilmultimengen
26
Zusammenfassend hier noch einige Interpretationen der kombinatorischen Elemente
in die Mengenlehre bzw. der Lehre der Multimengen und in der Statistik:
Mengen- /
Multimengenlehre
Kombinatorik
Anzahl der Anordnung /
Reihung
von Elementen einer
Permutationen
- Menge
- ohne Wiederholung
- Multimenge
- mit Wiederholung
Statistik
Variationen
Geordnete
Stichprobe
- Anzahl der k- Tupel aus A*
mit verschiedenen Elementen
- ohne Wiederholung
- ohne Zurücklegen
- Anzahl der k-Tupel aus Ak mit
nicht notwendigerweise
verschiedenen Elementen
- mit Wiederholung
- mit Zurücklegen
Kombinationen
Ungeordnete
Stichprobe
- ohne Wiederholung
- ohne Zurücklegen
- mit Wiederholung
- mit Zurücklegen
Mengenprodukt
Anzahl von Teilmengen /
Teilmultimengen
- Teilmengen gleicher Mächtigkeit
- Teilmultimengen gleicher
Mächtigkeit
Gegenüberstellung der definierten kombinatorischen Begriffe und äquivalenter
Begriffe aus der Lehre von den Mengen/Multimengen bzw. der Statistik
27
4.5 Anwendungen und Beispiele
Klassisch sind die Beispiele in denen Kugeln aus einer Urne verdeckt gezogen
werden. Genauer gesagt betrachtet man eine Anzahl von n > 0 Kugeln, die in einer
(undurchsichtigen) Urne liegen, und aus der dann k Kugeln, 1 ≤ k ≤ n zufällig
(„verdeckt“) entnommen (Ziehungen) werden.
Die unterschiedlichen Modelle erhält man durch festlegen von Eigenschaften der
Kugeln und durch das Vorgehen beim Ziehen wie beispielsweise
-
-
Kugeln unterscheidbar / teilweise unterscheidbar / nicht unterscheidbar, z. B.
Durchnummerierung aller Kugeln, mehrere Gruppen von unterschiedlich
eingefärbten, nicht nummerierten Kugeln usw.
Anzahl der entnommenen Kugeln,
nach der Ziehung wieder in die Urne zurücklegen / nicht zurücklegen.
Hier sollen aber auch andere Beispiele „aus dem richtigen Leben“ vorgestellt werden.
1.1. Drehtür
10 Damen und 5 Herren möchten nacheinander durch eine
Drehtür gehen. Auf wie viele Arten können sie dies tun, wenn
die Damen zuerst und danach die Herren hindurch gehen?
Offensichtlich kommen hier 2 von einander unabhängige
Permutationen ohne Wiederholung vor:
- Anzahl der möglichen Reihenfolgen der Damen und
- Anzahl der möglichen Reihenfolgen der Herren.
Damit ergibt sich:
P10  10!  3.628.800
P5  5!  120
und somit ingesam t
P10 * P5  10! * 5!  435.456.000
1.2. Zahlen
-konstruktion
Wie viele verschiedene zehnstellige Zahlen gibt es, die zweimal
die 1, dreimal die 2 und einmal die 5 und viermal die 9
enthalten?
Dies ist offensichtlich ein Problem von „Permutation von
teilweise nicht unterscheidbaren Elementen“, also Permutation
mit Wiederholung und somit ergibt sich die Lösung zu
 10 
10!
3.628.800

 12.600


 2, 3, 1, 4  2! * 3! * 1! * 4! 2 * 6 * 1 * 24
2.1. Die Top 3:
Bei einem Sportfest nehmen 10 Läufer teil. Nur die ersten 3
Läufer erhalten je eine Medaille (Gold, Silber, Bronze). Auf wie
viele verschiedene Arten können sich die "Top 3"
zusammensetzen?
28
Das entspricht folgendem Urnenproblem: In einer Urne
befinden sich 10 durchnummerierte (mithin unterscheidbare)
Kugeln. Es sollen drei Kugeln ohne Zurücklegen und unter
Beachtung der Reihenfolge gezogen werden. Wie viele
Möglichkeiten gibt es?
Dies Problem ist offensichtlich eine Variation ohne
Wiederholung und somit gilt:
VO (10,3) 
10 !
10 !

 720
(10  3) !
7!
2.2. Toto –
Bei der TOTO Ergebniswette, auch 13er-Wette genannt, wird
die Fußball-Wette der Ausgang von 13 Fußballspielen getippt. Je Spielpaarung
(Verein1 : Verein2) sind drei verschiedene Ergebnisse des
Spielausgangs möglich:
1 = Sieg des erstgenannten Vereins,
0 = Unentschieden,
2 = Sieg des zweitgenannten Vereins.
Wie viele „zufällige“ Tipps sind möglich?
Das entspricht folgendem Urnenproblem:
In einer Urne befinden sich 3 verschiedenfarbige Kugeln. Es
sollen 13 Kugeln mit Zurücklegen und unter Beachtung der
Reihenfolge gezogen werden. Wie viele Möglichkeiten gibt es?
Das ist aber eine Variation mit Wiederholung und mithin
ergibt sich die Lösung zu:
VM (3,13)  313  1.594.323
2.3. Geburtstage
in einer Familie
Betrachten wir nun eine Familie mit 4 Mitgliedern.
Nehmen wir nun an, dass alle Mitglieder an verschiedenen
Tagen des Jahres – mit 365 Tagen – Geburtstag haben. Wie
viele Geburtstagskalender sind möglich?
Das entspricht dem Urnenmodell von 2.1, oben und somit liegt
eine Variation ohne Wiederholung vor und es gilt:
365 !
365 !
VO (365,4) 

 17.458.601.160
(365  4) ! 361 !
Lassen wir nun auch die Möglichkeit zu, dass Geburtstage auch
auf den gleichen Tag des Jahres fallen dürfen – wieder mit 365
Tagen. Wie viele Geburtstagskalender sind dann möglich?
Damit ist Lösung gegeben durch Variation mit Wiederholung
und mithin ergibt sich die Lösung zu:
VM (365,4)  3654  17.748.900.625
und es ergibt sich kein großer Unterschied (Faktor 0.9836…).
29
Betrachten wir aber statt 4 nun10 Familienmitglieder ergibt sich
aber schon:
VO (365,10)  3,7060803910505 * 1025 vs.
VM (365,10)  36510  4,1969002243199 * 1025
und damit ergibt sich bei 10 Familienmitgliedern ein Verhältnis
von VO (365,10) / VM(365,10)  0,88305 und schließlich für bei
einer Familie mit 23 Mitgliedern
VO (365,23)  4,2200819302092 1058 und
VM (365,23)  36523  8,565167935315 * 1058
ergibt sich ein Verhältnis von 0,4927… also ein Wert kleiner
als 0,5. Auf die Interpretation kommen wir im nächsten
Abschnitt noch zurück.
2.4 ein ungewöhn- 2 Spieler (S1, S2) würfeln: S1 mit 3, S2 mit 2 Würfeln.
liches Würfelspiel Würfelt nun S1 eine höhere maximale Augenzahl als S2, so
zahlt S2 an S1 1€, andernfalls zahlt S1 an S2 1€. Ist das ein
faires Spiel in dem Sinne, dass es genauso viele
Würfelergebnisse „S1 hat eine höhere maximale Augenzahl als
S2“ wie „S1 hat eine kleinere oder gleiche maximale
Augenzahl als S2“?
1. die Anzahl aller möglichen Ergebnisse ergibt sich aus zwei
Variationen mit Wiederholung und wird dargestellt als
A  1, 2, 3, 4, 5, 6
  A3  A2

a ,a ,a  , a ,a 
1
2
3
4
5

für alle 1  i  5 gelte 1  ai  6 
Dabei definieren wir ( a1 ,a2 ,a3 ) des Ergebnis eines Wurfes
von S1 und  a4 ,a5  des Ergebnis eines Wurfes von S2.
Die Mächtigkeit von Ω ergibt sich zu
  A3  A2  A3 * A2
 63 * 62  65  7776
2. „S1 gewinnt“ wird wie folgt beschrieben
a ,a ,a  , a ,a  max a ,a ,a   max a ,a 

  a ,a ,a  max a ,a ,a   i 
  a ,a  max  a ,a   j 
S1 
1
2
3
4
1
2
5
3
1
1
2
4
5
1 j  i  6
4
und mit
30
5
2
3
3
4
5
 a ,a ,a  max a ,a ,a
 j   a ,a  max  a ,a   j
S1  i  
1
2
S1
4
5
3
1
4
2
3
  i
5
ergibt sich
S1 
  i    j 
S1
1 j  i  6
S1
und daher ist
S1 
   i
S1
1 j  i  6
S1  j

3. Abzählen liefert für:
S1  i    a1 ,a2 ,a3  max  a1 ,a2 ,a3

  i
1. Stelle : 1... i , 2. Stelle : 1... i,
3.Stelle : i
 i2 Elemente
3.Stelle : 1... (i  1)
1. Stelle : 1... i , 2. Stelle : i,
 i*(i  1) Elemente
2. Stelle : 1... (i  1), 3.Stelle : 1... (i  1)
1. Stelle : i ,
 (i  1) Elemente
2
und somit S1  i2  i*(i  1)  (i  1)2  3 i2  3 i  1
S1  j  
 a
4

,a5  max  a 4 ,a5   j
1. Stelle : 1... j , 2. Stelle : 1
 j Elemente
1. Stelle : j , 2. Stelle : j  1
 ( j  1) Elemente
und somit S1  j  ( j  1)  2 j  1
4. Damit ergibt sich
S1 
 3 i
2
  2 j  1 
3i1
1 j  i  6
S1  3667
und somit aus
  7776
und
S2     S1
 7776  3667
 4109
Das ist doch ein eher überraschendes Ergebnis, dass der
Spieler mit 3 Würfeln weniger erfolgreich ist als der mit 2
31
Würfeln. Das liegt aber daran, dass die Bedingung aus Sicht
von S2 auch die Bedingung gleiche und maximale Augenzahl
umfasst. Ändert man die Bedingung so, dass nur gezahlt wird,
wenn einer der Spieler eine größere Zahlensumme wirft und
dass im Fall die maximal gewürfelte Zahl von beiden Spielern
gleich ist keine Zahlung erfolgt, gilt nach analoger Rechnung
#
von oben: S2
 2183  S1 .
2.5 Paradoxon
von de Méré
2 Spieler (S1, S2) würfeln und dieses Mal beide mit 3 Würfeln.
Die Augenzahlen der 3 Würfel werden addiert: Der eine Spieler
gewinnt bei Summe 11, der andere bei Summe 12. Wer
gewinnt öfter?
Der französische Schriftsteller Chevalier von de Méré (geboren
1607 in Poitou, gestorben 29. Dezember 1684) war auch ein
Spieler. Er berechnete die gleiche Gewinnwahrscheinlichkeit für
das oben beschriebene Spiel, nämlich basierend auf die
additiven Zerlegungen von 11 und 12 durch die Zahlen 1 – 6:
11 = 6 + 4 + 1 = 6 + 3 + 2
=5+5+1=5+4+2=5+3+3
=4+4+3
12 = 6 + 5 + 1 = 6 + 4 + 2 = 6 + 3 + 3
=5+5+2=5+4+3
=4+4+4
Es gibt also gleichviele additive Zerlegungen, nämlich jeweils 6.
Nun stellte er aber nach der Analyse vieler Spiele fest, dass die
Würfelsumme 11 häufiger vorkam als die Würfelsumme 12.
Daher fragte er Blaise Pascal (geboren 19. Juni 1623 in
Clermont-Ferrand, gestorben 19. August 1662 in Paris) nach
einer Erklärung und Pascal konnte dieses scheinbare
Paradoxon aufklären.
Wesentlich ist nicht nur, dass die Summe 11 bzw. 12 ergibt,
sondern auch die möglichen Reihenfolgen der Summanden,
d. h. es sind Variationen mit Wiederholung und nicht
Kombinationen mit Wiederholungen zu betrachten.
Nachzählen liefert 27 verschiedene Tripel für Summe 11,
hingegen nur 25 Tripel für Summe 12.
A  1, 2, 3, 4, 5, 6
  A3 
 a ,a
1
2

,a3  für alle 1  i  3 gelte 1  ai  6 
  63  216
mit
 a ,a ,a 
  a ,a ,a 

 12 
1 
1
2
3
a1  a2  a3  11
und
 1  27
2
1
2
3
a1  a2  a3
und
 2  25
und damit P   1  
27
25
 0,125  0,116 
 P 2 
216
216
1
somit ein Unterschied von
 0,00925 .
108
32
3.1 Lottoziehung:
Aus 49 Kugeln werden 6 + 1 Kugeln zufällig gezogen, d. i. 6 +
eine Zusatzzahl. Wie viele Tipps gibt es?
Die ersten 6 werden ohne zurücklegen gezogen und die
Reihenfolge ist beliebig, damit ist dies
eine
 49 
K O  49,6      13.983.816
6
Die Zusatzzahl muss aus den verbleibenden 43 Kugeln
 43 
gezogen werden. Also K O  43,1     43 . Zu jeder
 1
Kombination der ersten 6 Zahlen gibt es 43 mögliche
Zusatzzahlen und somit
ergeben sich
13.983.816 * 43  601.304.088 mögliche Tipps.
3.2 Urne mit
Kugeln in 2
Farben
In einer Urne seien k Kugeln mit k > 2, davon sind l weiß
und k-l schwarz, und l < k. Aus der Urne sollen nun t Kugeln,
t ≤ k, gezogen werden ohne sie wieder zurückzulegen. Wie
viele Ziehungen von t Kugeln gibt es mit genau s weißen und
l-s schwarzen Kugeln, 0 ≤ s ≤ l?
Formalisieren wir als erstes die Aufgabenstellung.
Repräsentiere die Urne die Multimenge U mit den Elementen
ws und sw, sowie die Multimenge T die Stichprobe.




A   sw, ws  , U   sw, ..... , sw, ws,....,ws  , mit U  k


kl
l






T   sw, ..... , sw, ws,....,ws  mit T  t .


ts
s


Es ist nun zu berechnen, wie viele t-Tupel existieren mit
0 < t ≤ k und genau s weißen Elementen 0 ≤ s ≤ l
Nach Satz 9 gibt es
l
l!
  
(l  s)! * s!  s 
l - Tupel mit s weißen Elementen
und analog ergibt sich
 k l 
(k  l) !
 
 (k-l) - Tupel mit (t–s)
(k  l) ! * (t  s)!  t  s 
schwarzen Elementen
33
da jedem der l-Tupel weißer Elemente alle Tupel schwarzer
Elemente zuzuordnen sind ergeben sich insgesamt damit also
 l  k l
 *
 - Ziehungen
s  t  s 
3.3. Nimm 4,
zahle 3
In einem Supermarkt werden 5 verschiedene Obstsorten
angeboten: Apfel, Birnen, Orangen, Bananen, Marillen. Das
Angebot lautet: „Nimm 4, zahle die 3 günstigsten“, wobei
beliebig d.h. alle Obstsorten auch mehrfach, ausgewählt
werden können. Wir setzen voraus, dass ausreichend viel Obst
vorhanden ist um den Bedarf abzudecken. Wie viele
verschiedene mögliche 4er Zusammenstellungen gibt es?
Damit ergibt sich die Menge A  Apf, Bir, Ora, Ban, Mar Dazu
betrachten wir die minimal erforderliche Multimenge für das
Angebot
Apf, Apf, Apf, Apf, Bir, Bir, Bir, Bir, Ora, Ora, Ora, Ora,
Ban, Ban, Ban, Ban, Mar, Mar, Mar, Mar
und dass können wir als Urne mit 20 Kugeln und 5
verschiedenen Gruppen von je 4 nicht unterscheidbaren Kugeln
interpretieren, z. B. je 4 Kugeln haben eine Farbe, die Kugeln
einer Gruppe tragen dieselbe Farbe. Es liegt also eine 4vor und somit gilt:
  5    5  4  1  8 
8!
KM (5,4)       
 70
 
4
  4  4! * 4!
 4 
Es ergeben sich mithin 70 verschiedene Kombinationen mit
Wiederholung der Obstsorten.
34
5. Endliche Wahrscheinlichkeitsräume
5.1 Klassische Definition der Wahrscheinlichkeit
Wir betrachten eine nicht leere Menge  die endlich viele Elemente hat. Dies ist
erst mal sehr allgemein und abstrakt, aber wir können die Elemente von  z. B. als
alle möglichen Versuchsausgänge eines Experiments interpretieren.
Die Teilmengen von Ω heißen Ereignisse. Die Menge aller Ereignisse  ist also die
Potenzmenge von Ω, bezeichnet als  =  ()  { A A   } . Einige Ereignisse
werden speziell benannt:
A) Elementarereignis :
B) sicheres Ereignis :
{  }   mit


C) unmögliches Ereignis : 
Da wir die Menge  = { A A   } betrachten gilt:
1)  ist ein Ereignis
2) Ist A ein Ereignis, so ist auch die Komplementär menge
A C :  \ A ein Ereignis
3) Sind A, B Ereignisse, so ist A  B ein Ereignis
Auf der Menge  wird nun eine Abbildung P definiert mit P:  → [0,1].
P heißt Wahrscheinlichkeitsmaß (W-Maß), wenn folgende Bedingungen erfüllt sind:
4) P()  0
P()  1
5) Sind A1 , A 2 disjunkte Ereignisse
d. h.
A1 , A 2 
und A1  A 2  
dann gilt: P(A1  A 2 )  P(A1 )  P(A 2 )
Als Folgerungen daraus ergeben sich:
1) Sind A, B Ereignisse, so ist auch A  B ein Ereignis
weil A  B  (A C  BC )C nach der De Morganschen Regel
und 2) und 3) gemäß der Definition oben gelten
35
2 ) P(A)  0
für alle Ereignisse A
da P per Definition eine Abbildung auf 0,1 ist
3) für ein Ereignis A gilt : P(A)  1  P(A C )
weil folgende Zusammenhänge per Definition gelten :
A  A C   , A  A C   , P()  1
und mithin P(A)  P(A C )  P(A  A C )  P( )  1 gilt
4) aus A  B folgt P(A)  P(B)
denn aus A  B folgt, dass eine Menge A * 
( ) existiert mit
A  A  B mit A  A   und somit
*
*
P(A)  P(A * )  P(B) und damit P(A)  P(B) da P(A * )  0
Betrachten wir zu dem Wahrscheinlichkeitsmaß ein einfaches Beispiel:
In einer Urne liegen 3 weiße und 2 rote Kugeln. Aus der Urne wird nun eine Kugel
gezogen.
Formalisiert heißt das:
Ω = {ω1, ω2, ω3, ω4, ω5} mit {ω1}, {ω2}, {ω3} die Elementarereignisse „ziehen der
j-ten, weißen Kugel“, j = 1, 2, 3 und {ω4}, {ω5} die Elementarereignisse „ziehen der
k-ten, roten Kugel “ k = 4, 5 sind.
Wir betrachten zwei Wahrscheinlichkeitsmaße:
1. Jede Kugel wird mit gleicher Wahrscheinlichkeit gezogen, d. i. P1({ωi}) = 1/5,
i = 1, 2, 3, 4, 5 .
Die Wahrscheinlichkeit irgendeine rote Kugel zu ziehen ist mithin:
P1({ω4}) + P1({ω5}) = 1/5 + 1/5 = 2/5 = 0,4 .
2. Jede rote Kugel wird mit einer Wahrscheinlichkeit von P 2({ωi}) = 1/4 ,
i = 4, 5 ,
jede weiße Kugel wird mit einer Wahrscheinlichkeit von P 2({ωi}) = 1/6 ,
i = 1, 2, 3 gezogen.
Die Wahrscheinlichkeit eine rote Kugel zu ziehen ist mithin:
P2({ω4}) + P2({ω5}) = 1/4 + 1/4 = 2/4 = 0,5 .
Auf einer Menge aller Ereignisse können also verschiedene Wahrscheinlichkeitsmaße definiert werden – z. B. basierend auf unterschiedlichen Modellen. Welches
Modell nun der „Realität“ entspricht muss aus den Gegebenheiten abgeleitet werden.
Im weiteren betrachten wir nur Gleichverteilungen. Die Grundidee der
Gleichverteilung ist, dass es kein „Vorzugselementarereignis“ gibt. Im oberen
Beispiel entspricht das der 1. Versuchsanordnung, d. h. dass es beim Ziehen keine
„Vorzugskugeln“ gibt.
36
Definition: Das Maß |A| jeder Teilmenge A   ist definiert als Anzahl der Elemente
von A. Bei der Gleichverteilung ist die Wahrscheinlichkeit aller
Ereignisse A   definiert durch:
P:  → [0,1] mit P(A) 
A
,

|Ω| endlich.
Bemerkung: Für jedes Elementarereignis    gilt mithin bei der Gleichverteilung
1
.
P() : P() 

Als Beispiel kommen wir nun auch noch zu dem weiter oben gegebenen Beispiel
2.3. Geburtstage in der Familie zurück.
Dort war die Fragestellung nach „Familienmitgliedern, die an verschiedenen Tagen
des Jahres – mit 365 Tagen – Geburtstag haben“. Zur Lösung formulieren wir die
Aufgabe um, hin zur Frage, wie hoch die Wahrscheinlichkeit ist, dass in einer Gruppe
von n Menschen mindestens zwei am selben Tag des Jahres Geburtstag haben –
wobei wir Schaltjahre nicht zulassen und voraussetzen, dass die Wahrscheinlichkeit
Geburtatsg zu haben für alle Tage gleich groß ist.
Nach den Überlegungen oben ergibt sich die Lösung aus der
Gegenwahrscheinlichkeit P  A   1  P  A  zum oben bereits erarbeiteten
Ergebnis:
P( A) 
A

1
A

365 !
1
VO (365,n)
(365  n) !
1
VM (365,n)
365n
1
365 !
365 * (365  n) !
1
1
1
n
365 * 364 * 363 * ... *  365  n  1 
365n
365 * 364 * 363 * ... *  365  n  1 
365 * 365 * 365 * ... *
365
n 1
k 
(365  k)
1

365
k 1
n 1

 1  365 
k 1
37
Daraus ergibt sich folgende Tabelle:
Anzahl der
Personen,
n
2
5
10
15
20
21
22
23
…
40
41
P(n)
0,00273973
0,02713557
0,11694818
0,25290132
0,41143838
0,44368834
0,47569531
0,50729723
…
0,89123181
0,90315161
…
0,98909064
0,99086158
…
…
Anzahl der Mitglieder einer Gruppe von n Menschen von denen
mindestens 2 am selben Tag des Jahres Geburtstag haben
Wahrscheinlichkeit P(n), dass von n Mitglieder einer Gruppe von Menschen
mindestens 2 am selben Tag des Jahres Geburtstag haben
Man braucht mithin nicht 183 Personen (183 ≈ 365/2) – wie man vielleicht intuitiv
denken könnte - sondern wesentlich weniger, nämlich 23 Personen. Ab 41 Personen
liegt man schon bei einer Wahrscheinlichkeit von größer als 90%, ab
sogar größer
als
.
38
Betrachten wir noch eine andere Variante des Geburtstagsproblems.
Wählen wir eine bestimmte Person aus einer Gruppe von (n+1)-Personen aus und
beantworten nun die Frage, wie groß die Wahrscheinlichkeit dafür ist , dass eine
zweite Person aus der restlichen Gruppe am gleichen Tag des Jahres Geburtstag
hat wie die ausgewählte.
Die Wahrscheinlichkeit, dass eine Person an einem der andere Tag als die
ausgewählte Geburtstag hat, also an einem der verbleibenden 364 Tagen, ist mithin:
P  b  
364 365  1
1

 1
365
365
365
Die Wahrscheinlichkeit, dass n Personen an einem anderen Tag Geburtstag haben
als die ausgewählte ergibt sich, basierend auf der Variation mit Wiederholungen, zu:
P B  
VM  364,n 
VM  365,n 
n

n
n
364n  364 
1 
 365  1 



 1 


n
365 
365
 365 
 365 

Damit berechnet sich die Wahrscheinlichkeit, dass mindestens eine weitere Person
an dem gleichen Tag wie die ausgewählte Geburtstag hat, zu:
n
n
1 
1 


P  B   1  P(B)  1  1 
 1   1 

365 
365 

i  1
Die Darstellung analog obigem Beispiel zeigt folgendes Bild:
Wahrscheinlichkeit P(n), dass von n+1 Mitglieder einer Gruppe von Menschen, nach Auswahl eines
Mitglieds, mindestens ein 2-tes am selben Tag des Jahres Geburtstag hat
39
Da die Aufgabenstellungen sehr ähnlich klingen, aber höchst unterschiedliche
Ergebnisse liefern, spricht man vom „Geburtstagsparadoxon“. Aber die scheinbar
widersprüchlichen Ergebnisse lassen sich durch der obigen Rechnungen erklären –
es sind schlichtweg höchst unterschiedliche Aufgaben, die gelöst wurden.
5.2 Zufallsgrößen
Definieren wir nun auf der Menge Ω eine Zufallsvariable  als eine Funktion1, die
jedem Elementarereignis aus der Menge aller Ereignisse eine reelle Zahl zuordnet.
Allerdings lässt sich diese erste Formulierung nicht verallgemeinern. Wir kehren
daher die Definition sozusagen um, indem wir zu jedem Ereignis das Urbild ermitteln
und verlangen, dass diese Urbildmenge selbst ein Ereignis ist:
Mit den oben definierten Methoden wollen wir nun weiter arbeiten. Schauen wir uns
das Würfeln mit zwei 6 seitigen Würfeln an und betrachten als Ergebnis eines Wurfes
die Summe der Augenzahlen.
Abstrakt gesprochen wird dabei einem Ereignis (hier die geworfenen Augenzahlen
der beiden Würfel) über eine Funktion - hier die Addition - eine reelle Zahl (der
Summenwert) zugeordnet. Im Allgemeinen interessieren wir uns nicht für ein
einzelnes Ereignis (z. B. Augenzahl) selbst, sondern für Kennzahlen (A) aller
Ereignisse A, d.h. wir betrachten die Abbildung : A  (A) = A‘ . Konkret heisst das
hier:
Ω = { (i, j) │ 1 ≤ i , j ≤ 6 }
 =  ()  { A A   } und für alle A gelte: P(A)  A

:  
((i, j)) = i + j
mit
(Ω) = Ω‘ = { 2, 3, … , 12 }

Damit wird nun auch eine Wahrscheinlichkeit P auf
A´ 
definiert:
A‘ = {10, 11, 12}

erzeugt, indem man für alle
P (A‘) = P(-1(A‘))
:
-1(A‘) = {(4,6),(5,5), (6,4), (5,6), (6,5), (6,6)}
1( )  1( ')  (i, j) 1  i, j  6
-1
P( (A‘)) =
1(A ')
1
 ( )
1

6
1

36 6
Die begriffliche Schwierigkeit hier ist, dass die Zufallsvariable als Funktion definiert wird. Die
Zufallsvariable darf nicht mit einer Variablen, also dem Argument einer Funktion, verwechselt werden.
40
Definition: Eine Zufallsvariable  ist jede Funktion von Ω auf die Menge der reellen
Zahlen, wobei das Urbild jeder messbaren Teilmenge der reellen Zahlen
A‘ ein Ereignis in Ω ist, d. h.:
:  
und für alle messbaren A ' 
1
 (A') 

gilt :
( )
Bemerkung: Eine Teilmenge der reellen Zahlen heißt messbar, wenn sie nicht zu
groß und zu stark „zersplittert“ ist. Präzise können wir das hier nicht
definieren, aber im Folgenden werden wir nur „gutmütige“ Mengen
betrachten, d.h. Mengen, die auch tatsächlich messbar sind.
Die bisherigen Betrachtungen beziehen sich auf das Wahrscheinlichkeitsmaß P
definiert als P(A) 
A

(Gleichverteilung s. o.). Diese Definition wird nun erweitert
für eine Zufallsvariable .
Definition: Ein Wahrscheinlichkeitsmaß von , P , ist definiert für alle messbaren
A' 
mit 1( A ' ) 

() als:
P (A‘) = P(-1(A‘))
Bemerkung: Folgende abkürzende Schreibweise werden wir im weiteren verwenden:
P(  A ') : P(1( A ' ))
Weitere wichtige Definitionen sind die der Verteilungsfunktion und des
Erwartungswertes.
Die Verteilungsfunktion gibt an, wie sich die Wahrscheinlichkeiten auf die möglichen
Werte einer Zufallsvariable verteilen.
Genauer wird sie wie folgt definiert:
Definition: Die Verteilungsfunktion F der Zufallsvariablen  , ist definiert durch
F :
 0,1
F (x)  P ( ( ,x) )
 P( 1( ,x) )
 P(  ()  x )
: P(  x )
41
Schließlich wird noch eine weitere Eigenschaft der Zufallsvariablen definiert:
Definition: Ist  eine Zufallsvariable, die die Werte x = r 1, … , rn mit den jeweiligen
Wahrscheinlichkeiten P( = ri) annimmt, so ist der Erwartungswert der
Zufallsvariablen  durch
n
E()   ri P(  ri )
i1
definiert, falls die Summe existiert, d.h. nicht unendlich ist.
Anschaulich gesprochen beschreibt der Erwartungswert einer Zufallsvariable die
Summe der gewichtete Mittel aller Werte der Zufallsvariablen, wobei mit der
zugehörigen Wahrscheinlichkeit des Auftretens des Ereignisses gewichtet wird.
5.3 Baumdiagramme
Wahrscheinlichkeiten von Ereignissen mit endlichen Elementarereignissen können in
vielen Fällen mit Hilfe von kombinatorischen Methoden bestimmt werden. Einfache
derartige Aufgaben, d.h. Aufgaben mit wenigen (≤ 5) Elementarereignissen, und
wenigen Schritten (≤ 5) können sogar mit Hilfe eines grafischen Verfahrens gelöst
werden. Der Vorteil dieser Methode ist, dass die Lösung sich einfach, schnell und
anschaulich ermittelt lässt und ohne längliche Berechnungen auskommt. Weiter ist
damit auch keine Kenntnis der zugrunde liegenden Verteilung notwendig. Dazu zählt
beispielsweise ziehen von Kugeln aus einer Urne mit verschiedenen Bedingungen
wie beispielsweise nummeriert - nicht nummeriert, mit mehreren Gruppen von
unterschiedlich gefärbte Kugeln, sowie unterschiedlichen Ziehungsmethoden wie
ziehen einer Kugel und dann mit / ohne zurücklegen der gezogenen Kugel in die
Urne.
Zur Ermittlung der Wahrscheinlichkeiten werden in einem Baumdiagram die
Ausgänge eines Zufallsexperiments als Linien, Pfade genannt, dargestellt und die
entsprechenden Wahrscheinlichkeiten an dem zugehörigen Pfad notiert.
Hintereinanderliegende Pfade nennen wir Zweige.
Dazu zwei Beispiele:
In einer Urne liegen 10 Kugeln, davon sind 2 weiß, 3 grün, 5 schwarz. Wie hoch ist
die Wahrscheinlichkeit nach 3 Zügen 3 verschiedenfarbige Kugeln zu ziehen. Die
Wahrscheinlichkeit gezogen zu werden ist für alle Kugeln gleich.
1. Die Kugeln werden nach dem Ziehen nicht wieder zurückgelegt,
2. Die Kugeln werden nach dem Ziehen wieder zurückgelegt.
Es ergeben sich zwei unterschiedliche Bäume, die unten schrittweise entwickelt
werden. In diesem Fall entwickeln sich die „Bäume“ nicht wie gewohnt von unten
nach oben, sondern von „links“ nach „rechts“ – trotzdem werden wir weiter von
Bäumen sprechen. Wir haben diese Darstellung gewählt, da so die Unterschiede in
den Entwicklungsschritten deutlich werden.
42
Die Kugeln werden nach dem
Ziehen nicht wieder zurückgelegt
Die Kugeln werden nach dem
Ziehen wieder zurückgelegt
43
Als Regeln sind zu beachten:
1. entlang eines Zweiges sind die Wahrscheinlichkeiten der Pfade zu
multiplizieren:
1. Kugel ws und 2. Kugel ws und 3. Kugel gr
2. vertikal können die Wahrscheinlichkeiten nur innerhalb einer Gruppe
(gehören also zu einem Ereignis) addiert werden und müssen immer 1
ergeben, wenn über alle Pfade der Gruppe addiert wird. Der Punkt in dem die
Pfade zusammenlaufen wird Knoten genannt
Nach der ws Kugel wird entweder eine sw Kugel oder eine ws Kugel oder
eine gr Kugel gezogen
Verifizieren wir die Ergebnisse mit Hilfe der oben entwickelten Methoden.
Dazu betrachten wir die beiden Fälle nacheinander:
1. Die Kugeln werden nach dem Ziehen nicht wieder zurückgelegt
Betrachten wir dazu die Grundmenge M# , die die Urne repräsentiert
M#   ws1, ws2, gr1, gr2, gr3, sw1, sw2, sw3, sw4, sw5 

A

(M# ) A  3 , da es nicht auf die Reihenfolge der gezogenen
Kugeln ankommt, also eine Kombination ohne Wiederholung (= ungeordnete
Stichprobe ohne Zurücklegen) vorliegt. Nach Satz 12 ergibt sich:
n
 10  10!
10 *9 *8
    

 120
3*2
k 
 3  3! 7!
44
Für jede Menge    definieren eine Funktion P die die Wahrscheinlichkeit
für das Eintreten von  definiert (s. o.):
P( ) 


.
Nun betrachten wir die Menge (es kommt nicht darauf an, bei welcher Ziehung
eine ws-, gr-, sw-Kugel gezogen wird)
   und B  ws, gr , sw    mit
ws  ws1, ws2, gr  gr1, gr2, gr3, sw  sw1, sw2, sw3, sw4, sw5
Damit ergibt sich
  2 * 3 * 5  30
und damit:
P() 



30
1
  0,25
120 4
2. Die Kugeln werden nach dem Ziehen wieder zurückgelegt
Betrachten wir dazu die Grundmenge M# , die die Urne repräsentiert
M#   ws1, ws2, gr1, gr2, gr3, sw1, sw2, sw3, sw4, sw5 

3

   M#  M# x M# x M#  (mi ,m j ,mk ) mi ,m j ,mk  M# , da nach dem
i1
ziehen die Kugel wieder zurückgelegt werden und somit eine Variation mit
Wiederholung (= geordnete Stichprobe mit zurücklegen) vorliegt.
und somit gilt gemäß Satz 11 für die Anzahl der Elemente von Ω:
  M# x M# x M#  M#
3
 103  1000
Betrachten wird nun eine Menge    und definieren für alle A:
P( ) 


.
Nun betrachten wir die Menge
   und

 ws, gr , sw  ,  gr , ws, sw  ,  sw , gr , ws  ,  ws, sw , gr ,
 sw , ws, gr  ,  gr , sw , ws  mit ws  ws1, ws2,
gr  gr1, gr2, gr3 , sw  sw1, sw2, sw3, sw4, sw5
45
Damit ergeben sich (2 * 3 * 5) Tupel der Form (ws, gr, sw) sowie 3!
Vertauschungen der Komponenten und somit:
  (2 * 3 * 5) * 3!
 30 * 6
 180
und damit: P() 



180
 0,18
1000
6. Diskrete Verteilungen
In diesem Kapitel definieren und untersuchen wir einige Verteilungsfunktionen F
der Zufallsvariablen  , die sich aus den oben erläuterten kombinatorischen Ansätzen
bezüglich Anordnungen und Auswahlen ergeben.
6.1 Gleich-Verteilung
Gemäß 5.1 ist ein Wahrscheinlichkeitsmaß P für alle Mengen A   , |Ω| = n endlich
definiert als
P(A) 
A

und definieren zusätzlich die Abbildung
:  
 A = A
Mit gl n(i) 
i
n

1
mit 1  i  n ergibt sich:
n
Definition: Die (konstante) Folge  gl n(1),gl n(2), ... , gl n(n) heißt Gleichverteilung.
Für die Verteilungsfunktion gilt:
F :
 0,1
F (x)  P ( ( ,x) )
 P( 1 ( ,x) )

 P  ()  x



 P  A * A *  x
46
für x  1
 0
 *
x
A
F (x)  
  

 
 1

für x mit 1  x   und  x   max k 
k  x
für x mit   x
Der Erwartungswert ergibt sich zu
E() 
n
r
i1

i
n
P(  ri )
1
i n

i1


1
n
n
1
n
n
i
i1
1

 n (n  1) 
2

1
2
Gleichverteilung für P(i) = 0,1 für 1 ≤ i ≤ 10 und zugehörige Verteilungsfunktion:
Der Erwartungswert ergibt sich zu
E() 
n
r
i1

10
i
P(  ri )
1
 i 10
i1

1
10
10
i
i1
1 1

10 (10  1) 

10  2

 5,5

Am Ergebnis erkennt man, dass der Erwartungswert nicht notwendigerweise der
Wahrscheinlichkeit eines Ereignisses entsprechen muss, bzw. es muss nicht ein
Ereignis existieren, dem genau der Erwartungswert als Wahrscheinlichkeit
zugeordnet ist.
47
Eine praktische Anwendung der Gleichverteilung ist die Wartezeit an einer Bus
Haltestelle. Nehmen wir dazu an, dass ein Bus gemäß Fahrplan im 10-min-Takt fährt
und eine Haltezeit an der Haltestelle von 30 Sekunden hat. Trifft ein Fahrgast in dem
30 Sekunden Intervall ein, kann er mitfahren. Nehmen wir nun an, dass der Fahrgast
gleichverteilt in jedem der 20 30-Sekunden-Intervall an der Haltestelle eintrifft.
Die Wahrscheinlichkeit im i-ten Intervall mit 1 ≤ i ≤ 20 einzutreffen ist damit:
P( i ) 
1
20
Für die Verteilungsfunktion gilt:
 0

 x
F (x)  
 20
1

für x  1
für 1  x  
für x mit   x
Der Erwartungswert ergibt sich zu
E() 
20
 1 
  i 20 
i1
20  1
2
 10,5
Die „mittlere Wartezeit“ ist somit (10,5 * 30) sek = 5,25 min = 5 min 15 sek.

6.2 Binomial-Verteilung
Es wird nun eine komplexere Aufgabe als bisher analysiert und gelöst. Dazu wird
eine Menge U definiert die alle Konfigurationen Ts aus s weißen und (k-s) schwarzen
Kugeln repräsentiert. Im Weiteren werden wir auch die Mechanik der Variationen mit
Wiederholung nutzen.
Seien die Mengen und Multimengen gegeben:




B   sw, ws  , U   ws,...., ws , sw, ..... , sw  , mit U  n


m
nm




Ts   ws,...., ws , sw, ..... , sw ,

s
ks






mit T  k .
Daraus wird die Menge Ω aller k Ereignisse, konstruiert :
48






   (a1 ,...,ak ) für alle 1  i  k gilt ai   ws1 ,..., wsm sw1 ,..., sw nm  



m
nm




und damit gilt nach Satz 4 bzw. Satz 11 als Variationen mit Wiederholung:
  nk :
Betrachten wir ein spezielles Ereignis A s# mit:
A s# :
 a ,...,a ,a
1
s
s 1
,...,ak  für alle 1 i  s : ai  ws1 ,..., wsm  und
für alle s  1 j  t : a j  sw1 ,...,sw nm  
und es folgt wie oben (Variationen mit Wiederholung): A s#  ls * (k  l)t  s
Nun sind aber noch die Anzahl aller k-Tupel zu berechnen bei denen nun die
Elemente nicht so strukturiert angeordnet sind – erst die weißen Kugeln, dann die
schwarzen Kugeln. Das heißt, es ist noch die Anzahl der Permutationen jeder
Anordnung zu ermitteln. Das liefert aber Satz 9 (Permutation von teilweise nicht
unterscheidbaren Elementen) , und somit ergibt sich die Wahrscheinlichkeit zu
k 
A s    ms * (n  m)k  s
s
und somit
P(A s ) 
As

k  s
k s
  m * (n  m)
s
  
nk
 k  ms * (n  m)k  s
 k  ms (n  m)k  s
 

  s
ns * nk  s
nk  s
s
s n
 k  ms (n  m)k  s
  s
nk  s
s n
k   m   n  m 
P(A s )      

s  n   n 
s
k s
Definieren wir nun noch
49
k s
k   m   n  m 
bm ,n (s,k) : P(A s )      

s  n   n 
s
k s
k   m  
m
     1  
n
s  n  
s
Und damit ergibt sich:
Definition: Die Folge bm ,n (0,k), bm ,n (1,k), bm ,n (2,k), ... , bm ,n (k ,k)  heißt
Binomialverteilung.
Die Graphen der Binomialverteilungen (und der zugehörigen Verteilungsfunktionen)
für k = 20, n = 100 und unterschiedlicher Werten von m sind weiter unten dargestellt.
Gehen wir nun nochmals zu unserer Ausgangsfrage zurück und formulieren
allgemeiner:
Ein Versuch habe 2 Versuchsausgänge A und A mit P(A) = p und P( A) = 1 - p .
Der Versuch wird k-mal wiederholt und As sei das Ereignis:
A trifft genau s - mal ein und somit
tritt A (k – s) - mal ein
Dann ergibt sich die Wahrscheinlichkeit, für As zu:
k 
k s
P(A s )    ps 1  p 
s
k 
k s
Definieren wir nun noch bp (s,k) :   ps 1  p  , so ergibt sich wie oben die
s
verallgemeinerte Definition mit der Wahrscheinlichkeit p (= m/n):
Definition*: Die Folge bp (0,k), bp (1,k), bp (2,k), ... , bp (k ,k)  heißt
Binomialverteilung.
Weiter ergibt sich analog oben die Verteilungsfunktion zu:
F :
 0,1 und A 
t
As
s0
F (x)  P ( ( ,x) )
 P(  1 ( ,x) )
 P  ()  x


 
 P   A A 


 
As  x 

s0
 
t
50
 0
für x  1
 t

   P(A s ) mit max(0,t  l  k)  s  min(t, l) für x mit 1  A  x
s  0
 1
für x mit   x

0
für s  0
k

  b(s,k) mit 0  s  k für x mit 0  A  x
s  0
1
für x mit   x

und schließlich somit
0
k
 k 
F (x)     ps (1 p)k  s mit 0  s  k
s  0  s 
1

für s  0
für x mit 0  A  x
für x mit   x
Binomialverteilung (bm,100(x,20)) und zugehörige Verteilungsfunktion
m = 20
m = 50
Der Erwartungswert E ergibt sich mit
k 
k i
P(A i )  bp (i,k) :   pi 1  p 
i
zu
51
m = 70
E() 
k
r

P(  ri )
i
i0
 
 i  i  p 1  p 
k
k
k i
i
da wegen i  0 der 1.Summand  0 ist, gilt
 
k
k 
k i
  i   pi 1  p 
i1  i 
i0
k 
k!
(k  1)! k
i i

(k  i)! i! ((k  1 i  1))! (i  1)!
i
(k  1)!
k
((k  1)  (i  1))! (i  1)!
mit
 k  1
k

 i 1 
k
k 1


  i  1  p 1  p 
k
i1
k
k 1

i0
kp
mit Indextransformation i  i  1 fo lg t


 k  1 i 1
k  (i 1)

 p 1  p 
 i 
k 1
Faktor p herausheben
 k  1 i
(k  1)  i
 p 1  p 
 i 

i0
kp
k i
i
fo lg t
Binomische Formel
p  1  p  
k 1
p
k 1
1  p
 1 k 1  1
kp
6.3 Hypergeometrische Verteilung
Zur Definition der Hypergeometrischen Verteilung betrachten wir das Beispiel
„3.2 Urne mit Kugeln in 2 Farben“ aus dem Kapitel „4.5 Anwendungen und Beispiele“
bzw. Satz 12 über k-Kombinationen.
Repräsentiere die Urne die Multimenge U mit den Elementen ws und sw, sowie die
Multimenge T die Stichprobe.


B   sw, ws  , U   ws,...., ws , sw, ..... , sw ,

m
nm



Ts   ws,...., ws , sw, ..... , sw ,

s
ks

52


 , mit U  n







mit T  k .

Sei nun
a , ..., a 
1
k
ai  U* \ a1 , a2 , ..., ai1) 


U* :  ws1,...., wsm , sw1, ..... , sw n  m ,

m
nm
 mit




und damit gilt nach Satz 12 für k-Kombination ohne Wiederholung:
n
   :
k 
Sei weiter das Ereignis bei k Ziehungen s weiße Kugeln zu ziehen



 

A s :  (ws1,...., wss ) wsi  ws j mit i  j   (sw1, ..... , sw k  s ) sw i  sw j mit i  j
 

s

ks
und es gilt:

k
As
mit
A i  A j   für i  j
s 1
Es ist nun zu berechnen, wie viele k-Tupel existieren mit 0 < k ≤ n und genau
s weißen Elementen 0 ≤ s ≤ m .
Es ergeben sich dann also s-Kombination ohne Wiederholung über einer Menge mit
m Elementen nach Satz 12 zu:
m
m!
  
(m  s)! * s!
s 
m - Tupel mit s weißen Elementen
und analog ergibt sich und (k – s)-Kombination ohne Wiederholung über einer Menge
mit (n – m) Elementen wieder nach Satz 12 zu:
n  m
(n  m) !
 

((n  m)  (k  s)) ! * (k  s)!
k s 
(n - m) - Tupel mit (k – s)
schwarzen Elementen
da jedem der m-Tupel weißer Elemente alle Tupel schwarzer Elemente zuzuordnen
und somit
m n  m
 *
 - Tupel mit s weißen und (k – s) schwarzen Elementen.
s  k  s 
53
Definieren wir nun noch
hm,,n (s,k) : P(A s ) 
As

n  m m n  m

  

m k  s   s   k  s 
hm ,n (s,k)  P(A s )    

n
 s  n
 
 
k 
k 
mit
max(0,k  m  n)  s  min(k , m)
Definition: Die Folge hm ,n (0,k), hm ,n (1,k), hm ,n (2,k), ... , hm ,n (k ,k)  heißt
hypergeometrische Verteilung.
Die Graphen der hypergeometrische Verteilung (und der zugehörigen
Verteilungsfunktionen) für k = 20, n = 1000 und unterschiedlicher Werten von m sind
weiter unten dargestellt.
Weiter ergibt sich, analog oben, die Verteilungsfunktion zu:
F :
 0,1 und A 
t
As
s0
F (x)  P ( ( ,x) )
 P(  1 ( ,x) )
 P  ()  x


 
 P   A A 


 
As  x
s0
 
t
 0
für x  1
 t

   P(A s ) mit max(0,t  l  k)  s  min(t, l) für x mit 1  A  x
s  0
 1
für x mit   x

 0
für x  1
 t

   hl,k (s,t) mit max(0,t  l  k)  s  min(t, l) für x mit 1  A  x
s  0
 1
für x mit   x

54
 0

  l  k  l
 t  s   t  s 
F (x)      
k 
s  0
 

t

 1
für x  1
mit max(0,t  l  k)  s  min(t, l) für x mit 1  A  x
für x mit   x
Hypergeometrische Verteilung (hm,1000(x,20)) und zugehörige Verteilungsfunktion
m = 150
m = 450
m = 880
Für die Berechnung des Erwartungswertes benötigen wir folgenden Äquivalenzen:
1. für m, s ≥ 1 gilt
 m  m (m  1) ... (m  s  1)
 
s!
s
m (m  1)(m  2) ... (m  (s 1))

s
(s  1)!

m
s
 m  1


 s 1 
55
2. Vandermonde´sche Identität2 [15]
n  m


k


k
n  m 
  j  k  j
j0
 

Beweis: Betrachten wir 2 disjunkte Mengen N, M, also
N  M   und N  n, M  m . Wir bilden damit nun die Potenzmenge
von N ∪ M und betrachten daraus die Teilmengen mit k Elementen, wobei
j aus N und (k – j) aus M seien:
,
k, j   P P  N  M und P  k  n  m und P  N  j  n
Per Definition gilt für die P ∈ k,j auch P  M  k  j , da N  M   .
n
Nach Satz 3 gibt es nun genau   j-elementige Teilmengen von N und
 j
 m 

 (k – j)-elementigen Teilmengen von M und somit ergibt sich
k  j
n  m 
 

 j  k  j
Weiter sind die Mengen k,0 , k,1 ,k,2 , … k,k paarweise disjunkt, da sie
unterschiedlich viele Elemente von P enthalten und es gilt:
k
k
n  m 



 

k, j
j0
j0  j   k  j
k, j
Andererseits ist die Anzahl aller Teilmengen mit k Elementen von N ∪ M
n  m
wiederum nach Satz 3: 

 k 
n  m
und damit ergibt sich: 

 k 
+++
k
n  m 
  j  k  j
j0
 

Bemerkung: Für n = m = k ergibt sich:
n
 n 
n!
n!
aus   



 j  j! (n  j) (n  j) ! (n  (n  j) )!  n  j 
und der Vandermonde´schen Identität
 2 n  n n n n  n  n n
folgt 

    
   
 n   n  j  0  j  n  j j  0  j 
2
Mit Hilfe der obigen Äquivalenzen ergibt sich nun der Erwartungswert zu:
2
Alexandre-Théophile Vandermonde, geboren 28.02.1735 in Paris, gestorben 01.01.1796 in Paris
56
E() 
k
r
i0
i
P(  ri )
n  m


 k i
n
 
k 
m
 
k
i
 i  
i0
1

n
 
k 



1
n
 
k 
da wegen i  0 der 1.Summand  0 ist, gilt
m n  m
k
i  i   k  i 

i1
k
i
i1


m  m  1  n  m 



i  i 1   k  i 
 m  1  n  m 
k
1
n
 
k 
 m  i 1   k  i 
m
n
 
k 
  i 1   k  i 

i1
k
i1
k


nach der obigen Äquivalenz 1.
nach kürzen von i
 m  1  n  m 


 m  1 

nm

m
n
 
k 
  i  1   (k  1)  (i  1) 

m
n
 
k 
 m  1

i 
i0

m
n  n  1


k  k  1

i1


k 1

 nm

 (k  1) 

mit k  i  k  1 i  1  (k  1)  (i  1)


i
Indextransformation (i  1)  i
 m  1  n  m 


i   (k  1)  i 
i0
k 1

nach der obigen Äquivalenz 1.
 (m  1)  (n  m) 
m


k 1
n  n  1 



k  k  1
 n  1
m



n  n  1  k  1


k  k  1

k
m
n
E()  k
m
n
nach der Vandermonde´schen Identität
57
6.4 Zusammenhang zwischen Binomial- und Hypergeometrischer
Verteilung
Wir zeigen nun, dass für „große“ Anzahl von Versuchen, (n → ∞) die Folge der
hypergeometrischen Verteilung gegen die die Folge der Binomialverteilung strebt.
Satz Sei m :

mit für alle n 
m(n)
 p, p   0, 1
n  n
mit: m(n)  n und lim


dann gilt lim h m n , n  s, k   bp  s, k 
n 
mit
m
 
s
hm ,n (s,k)   
n  m


k  s ,
n
 
k 
k 
k s
bp (s,k)    ps 1  p 
s
Beweis:
m n  m
 

s
k  s
hm ,n (s,k)    
n
 
k 
k ! (n  k)!
m!
(n  m)!
n!
s! (m  s)! (k  s)! (n  m  (k  s))!
k!
(n  k)!
m!
(n  m)!

s! (k  s)!
n!
(m  s)! (n  m  (k  s)) !

s Faktoren

(k  s) Faktoren
k 
m (m  1) ... (m  (s  1))
(n  m)((n  m)  1) ... (n  m)  ((k  s)  1) 
 
 s  n(n  1) ... (n  (k  2))(n  (k  1))
k Faktoren
s Faktoren
(k  s) Faktoren
k 
m (m  1) ... (m  (s  1))
nk
 
(n  m)((n  m)  1) ...  (n  m)  ((k  s)  1)  k
n
 s  n(n  1) ... (n  (k  2))(n  (k  1))
k Faktoren
k 
 
s
k 
 
s
k 
 
s
k 
 
s
m (m  1)
(m  (s  1))
...
(n  m)  ((k  s)  1)
(n  m) ((n  m)  1)
n n
n
...
n (n  1)
(n  k  2) (n  (k  1))
n
n
n
...
n n
n
n
(n  m)  ((k  s)  1)
m (m  1)
(m  (s  1)) (n  m) ((n  m)  1)
...
...
n n
n
n
n
n
n (n  1)
(n  k  2) (n  (k  1))
...
n n
n
n
m  m 1   m s  1   n m   n m  1   n m  (k  s)  1 
   ...  
     
 ...  

nn
n  n
n  n
n  n
n  n
n

n (n  1)
(n  k  2) (n  (k  1))
...
n n
n
n
m  m 1   m s  1 
m 
m  1 
m  (k  s)  1 
   ...  
 1   1 
 ...  1 

nn
n  n
n  
n 
n  
n

n (n  1)
(n  k  2) (n  (k  1))
...
n n
n
n
58
m  m 1   m s  1
  ...  
n  n
n  n
n 
m 
m  1 
m  (k  s)  1 

 1  n   1  n  ...  1 

n

 
 

k 
hm ,n (s,k)   
s
n (n  1)
(n  (s  1))
...
n n
n
n (n  1)
(n  k  2) (n  (k  1))
...
n n
n
n
s Faktoren
(k  s) Faktoren

k 

  
n  
s
m
n
1



















für j endlich, n   :
j
 0
n
m
j

n
 p  0  p
n
für i endlich ,
n  :
n i
1
n
(1  p)k  s
1k  s
ps
1s
p
m
n
 1 p

k 
 
s
p
s
ks
(1  p)
 bp  s, k 
6.5 Poisson Verteilung
Kommen wir nochmals zur Binomialverteilung zurück. Wir wollen nun untersuchen,
wie Wahrscheinlichkeiten berechnet werden können, wenn die Wahrscheinlichkeit
des Ereignisses „sehr klein“ ist und viele Experimente durchgeführt werden. In
diesen Fällen ist die Berechnung der Binomialverteilung – auch mit dem PC - recht
aufwändig. Eine einfache Methode eine Näherung zu berechnen bietet die Poisson
Verteilung.
Ein Versuch habe 2 Versuchsausgänge A und A mit P(A) = p und P( A) = 1 - p .
Der Versuch werde k-mal wiederholt und As sei das Ereignis:
A trifft genau s - mal ein und somit tritt
A (k – s) - mal ein.
Dann ergibt sich:
die Binomialverteilung ist die Folge bp (0,k), bp (1,k), bp (2,k), ... , bp (k ,k)  mit
k 
k s
bp (s,k)    ps 1  p  .
s
Ist die Anzahl der Versuche k sehr groß und die Wahrscheinlichkeit p sehr klein, so
ist die Berechnung der Binomialverteilung / der Verteilungsfunktion sehr aufwendig.
Hier wird nun eine „Näherungsverteilung“ für die Binomialverteilung für den oben
beschriebenen Fall berechnet, wenn λ := p * k beschränkt ist.
59
k 
ks
bp (s,k)    pks 1  pk 
s
k!
ks

pks 1  pk 
s! (k  s)!

k (k  1)...(k  (s  1)) s
ks
pk 1  pk 
s!
k
s
k
s
s s
k (k  1)...(k  (s  1)) k pk

s!
ks
k
k

 

 1  k pk   1  k pk 

 

s s
k (k  1)...(k  (s  1)) k pk

s!
ks
k pk  
k pk 

1 
 1 

k  
k 


k (k  1)...(k  (s  1)) k pk

s!
ks

s
k
k pk  
k pk 

1 
 1 

k  
k 

s
und mit   k pk ergibt sich
k
s
k
s
k (k  1)...(k  (s  1))  s 
 


1   1  

s
s! 
k 
k
k

k (k  1)...(k  (s  1))  s 
 

1   1  

k k ... k
s! 
k 
k
k  

1
s
s!

 k   k  
e
1
 s 
e
s!
Bevor wir nun die Verteilung definieren müssen wir noch nachrechnen, dass die
Summe über die Folgenglieder die Einheit ergibt:


s 
s

e

e
 s!
 s!  e e  1
s 0
s 0
und somit können wir definieren:
2
s


Definition: Die Folge  e ,  e ,  e , ... ,  e , ...  heißt Poisson Verteilung

1!
2!
s!
mit λ = p * k beschränkt
60

Daraus ergibt sich nun eine Möglichkeit die Poisson Verteilung schrittweise zu
berechnen:
Definieren wir dazu:
k
() :
für k  0, 1, 2, ... gilt :
k 1
k 
(n p)k 
e 
e  k (n p) ,
k!
k!
k  1
 k


e 
e 
(k  1)!
k ! (k  1)
 k 
e
k 1 k!


k
k 1

also somit
 e
0
k 1


k 1
k
Der Erwartungswert ergibt sich zu:
E() 

 i P(  i)
i0


i
i0
 e 
i 
e
i!

i
i0
e

i
i!
 i 1




i  1  (i  1)!


 i 1 
 e  

i  1  (i  1)! 
 e   e



Ein Beispiel dazu.
Nach [22] haben
- die seltene Blutgruppe AB, Rhesus negativ in
1. Österreich p = 1,0% = 0,01,
2. Argentinien p = 0,06% = 0,0006,
3. China
p = 0,3% = 0,003
61
mit k  0, 1, 2, ...
- die Blutgruppe B, Rhesus positiv in
1. Österreich p = 12% = 0,12,
2. Argentinien p = 8,6% = 0,086,
3. China
p = 27% = 0,27
der Bevölkerung.
Es werden k Personen auf Blutgruppenzugehörigkeit getestet.
1. Wie groß ist die Wahrscheinlichkeit, dass mindestens 2 von den k Personen
die Blutgruppe
a. AB b. B +
haben?
2. Wie groß muss jeweils das k gewählt werden, dass die Wahrscheinlichkeit
größer 95% ist?
3. Bestimmung der Approximation von den Ergebnissen aus 2. durch eine
Poisson Verteilung,
4. Berechne die Werte analog zu 2.
Die Wahrscheinlichkeit dass mindestens 2 von k untersuchter Personen die
entsprechende Blutgruppe haben ergibt sich:
1. auf Basis der Binomialverteilung
k 
k i
P(A i )  bp (i,k) :   pi 1  p 
i
ergibt sich die Wahrscheinlichkeit für mindestens 2 von k Personen:
P A 2  1  bp (0,k)  bp (1,k)


k 
k 
k 0
k 1
 1    po 1  p 
   p1 1  p 
0
 1
 1  1  p   k p 1  p 
k 1
k
2. a. Österreich
AB-: p = 1,0% = 0,01
B+: p = 12% = 0,12
P  A 2   1  1  p   k p 1  p 
k
P  A 2   1  1  p   k p 1  p 
k 1
k
 1  0,99k  k * 0,01 * 0,99k  1  0,95
 1  0,88k  k * 0,12 * 0,88k  1  0,95
 k  473 : P  A 2   0,9502
 k  38 : P  A 2   0,9520
k  472 : P  A 2   0,9497
k  37 : P  A 2   0,9466
62
k 1
b. Argentinien
AB-: p = 0,06% = 0,0006
B+: p = 8,6% = 0,086
P  A 2   1  1  p   k p 1  p 
k
P  A 2   1  1  p   k p 1  p 
k 1
k 1
k
 1  0,9994k  k * 0,0006 * 0,9994k  1
 0, 95
 1  0,914k  k * 0,086 * 0,914k  1
 0,95
 k  7905 : P  A 2   0,9500
 k  54 : P  A 2   0,9527
k  7904 : P  A 2   0,9499
k  53 : P  A 2   0,9490
c. China
AB-: p = 0,3% = 0,003
B+: p = 27% = 0,27
P  A 2   1  1  p   k p 1  p 
k
P  A  2   1  1  p   k p 1  p 
k 1
k
 1  0,9994k  k * 0,0006 * 0,9994k  1
 0, 95
k 1
 1  0,914k  k * 0,086 * 0,914k  1
 0,95
 k  1580 : P  A 2   0,9501
 k  16 : P  A 2   0,9550
k  1579 : P  A 2   0,9499
k  15 : P  A 2   0,9416
3. auf Basis der Poisson Verteilung
 s  (k p)s k p
P(A k )  k () :
e 
e , mit k  0, 1, 2, ...
s!
s!
Ergibt sich die Wahrscheinlichkeit für mindestens 2 von k Personen:
P A 2  1  0 (k * p)  1(k * p)


(k * p)0 k p (k * p)1 k p
1
e

e
0!
1!
 1  e k p  k p e k p
 1  (1  k p) e k p
4. a. Österreich
AB-: p = 1,0% = 0,01
B+: p = 12% = 0,12
P  A 2   1  (1  k p) e k p
P  A 2   1  (1  k p) e k p
 1  (1  k * 0,01) e k * 0,01  0,95
 1  (1  k * 0,12) e k * 0,12  0,95
 k  475 : P  A 2   0,9502
 k  40 : P  A 2   0,9523
k  474 : P  A 2   0,9498
k  39 : P  A 2   0,9472
63
b. Argentinien
AB-: p = 0,06% = 0,0006
B+: p = 8,6% = 0,086
P  A 2   1  (1  k p) e k p
P  A 2   1  (1  k p) e k p
 1  (1  k * 0,006) e k * 0,006  0, 95
 1  (1  k * 0,12) e k * 0,,086  0,95
 k  7907 : P  A 2   0,9500
 k  56 : P  A 2   0,9528
k  7906 : P  A 2   0, 9499
k  55 : P  A 2   0,9494
c. China
AB-: p = 0,3% = 0,003
B+: p = 27% = 0,27
P  A 2   1  (1  k p) e k p
P  A 2   1  (1  k p) e k p
 1  (1  k * 0,003) e k * 0,003  0, 95
 1  (1  k * 0,27) e k * 0,,27  0,95
 k  1582 : P  A 2   0,9501
 k  18 : P  A 2   0,9545
k  1581: P  A 2   0, 9499
k  17 : P  A 2   0,9432
Man erkennt, dass in allen Fällen die Werte der Poisson-Verteilung für die
entsprechenden Werte der Binomialverteilung sehr dicht beieinander liegen. Mit
Berücksichtigung der weiter unten gegebenen Parameterwerte ergibt sich eine sehr
gute Näherung für die Binomialverteilung durch die Poisson Verteilung.
6.6 Approximation von Binomial- und Hypergeometrischer
Verteilung
Kommen wir zum Abschluss nochmals auf die Näherung der Verteilungen
untereinander zurück.
In 6.4 haben wir gezeigt, dass gilt:


lim h m,n  s, k   bp  s, k  .
n 
Weiter gilt nach 6.5:

k 

lim bp (s,k) 
s 
e
s!
mit   k p .
64
Für die praktische Anwendung gilt nach [16]:
1. Approximation der Hypergeometrische Verteilung durch die Binomialverteilung
bei 0,1 
m
k
 0,9 und
 0,05 und k  10 gilt:
n
n
h m, n  s, k  wird approximiert durch bp  s, k  mit p 
m
.
n
2. Approximation der Hypergeometrische Verteilung durch die Poisson
Verteilung


 0,05 und k  30 gilt:
bei   0,1 oder 0,9   und
n
n
n


m
m
k
h m, n  s, k  wird approximiert durch
k 
m
e
mit   k
k ( ) :
k!
n
3. Approximation der Binomialverteilung durch die Poisson Verteilung
bei   k p  10 und k  1500 p gilt:
bp  s, k  wird approximiert durch
Beispiel:
k ( ) :
k 
e
k!
Für die oben gegebenen Beispiele über die Verteilung der
Blutgruppen in verschiedenen Ländern gilt:
a1. 1. λ = k p = 473 * 0,01 = 4,73 < 10
2. 1500 p = 1500 * 0,01 = 15 ≤ 473
a2. 1. λ = k p = 38 * 0,12 = 4,56 < 10
2. 1500 p = 1500 * 0,12 = 180 ≤ 473
b1. 1. λ = k p = 7905 * 0,0006 = 4,74 < 10
2. 1500 p = 1500 * 0, 0006 = 0,9 ≤ 473
b2. 1. λ = k p = 54 * 0,086 = 4,64 < 10
2. 1500 p = 1500 * 0,086 = 129 ≤ 473
c1. 1. λ = k p = 1580 * 0,003 = 4,74 < 10
2. 1500 p = 1500 * 0,003 = 4,5 ≤ 473
c2. 1. λ = k p = 16 * 0,27 = 4,32 < 10
2. 1500 p = 1500 * 0,27 = 405 ≤ 473
Damit sind alle Approximationen der Binomialverteilungen durch
die entsprechenden Poisson Verteilungen im Rahmen der oben
gegebenen Parameter sinnvoll. Dies stimmt auch mit den weiter
oben durchgeführten Rechnungen überein.
65
7. Verallgemeinerung der Verteilungen
Im Folgenden wird nun die „natürliche“ Verallgemeinerung der Binomial- und der
Hypergeometrischen Verteilung betrachtet. „Natürlich“ meint in diesem
Zusammenhang, dass wir statt 2 unterscheidbaren Klassen, wie schwarze und weiße
Kugeln etc.) nun k unterscheidbare Klassen k ≥ 2, k endlich untersuchen werden.
7.1 Polynomialverteilung
Seien die folgenden Mengen und Multimengen gegeben:
X   x1 , x2 , x3 , ..., xr  ,


U   x1,...., x1 , x 2 ,...., x 2 ,, x 3 ,...., x 3 , ... , x r ,...., xr

m1
m2
mr
m3



 , mit U 




T   x1,...., x1 , x 2 ,...., x 2 ,, x 3 ,...., x 3 , ... , x r ,...., xr

s1
s2
sr
s3



 , mit T 


r
m
i
i 1
r
s
i1
i
n
kn
Daraus wird die Menge Ω aller k-Ereignisse, konstruiert :




   (a1 ,...,ak ) für alle 1  i  k gilt ai   x1 ,1 , ...., x1 ,m 1 , ... , x r ,1 , ...., xr ,m r


m1
mr







und damit gilt wie oben nach Satz 4:   m1 1 * m2 2 * ... * mk 1 k  1 * mk k :
Anschaulich gesprochen handelt es sich also hier um „ein ziehen aus einer Urne mit
zurücklegen“.
s
s
s
s
Betrachten wir ein spezielles Ereignis A s#1 ,...,sk mit:
A s#1 ,.., sk :
 a
1,1
,...,a1,s1 , ..., ar ,1 ,...,ar ,sk



für alle 1 i  s1 : a1,i  x1,1 ,..., x1,m1 und
...
und

für alle 1 j  sk : ar , j  xr ,1 ,..., xr ,mr
und es folgt: A s#1, ...,sk  l1s1 * l2s2 * ... * lk sk
66
 
Nun sind aber noch die Anzahl aller (s1 + … + sk ) - Tupel zu berechnen bei denen
nun die Elemente nicht so strukturiert angeordnet sind – erst die x1 Elemente, dann
die analog die weiteren Elemente. Das heißt, es ist noch die Anzahl der
Permutationen jeder Anordnung zu ermitteln. Das liefert aber Satz 9. und somit ergibt
sich die Wahrscheinlichkeit zu
A s1, ...,sk 
n!
l1s1 * l2s2 * ... * lk sk
s1 ! s1 ! * ... * sk !
und somit ergibt sich
P(A s1 , ...,sk ) 

A s1 , ...,sk

n!
l1s1 * l2s2 * ... * lk sk
s1 ! s2 ! * ... * sk !
s
m1s1 * m2 s2 * ... * mk 1 k  1 * mk sk
s
l1s1 * l2s2 * ... * lk 1 k  1 * lk sk
n!

s1 ! s2 ! * ... * sk ! m1s1 * m2s2 * ... * mk 1sk  1 * mk sk
s
lk 1 k  1
l1s1
lk sk
n!

* ... *
*
s
s
s1 ! s2 ! * ... * sk ! m1s1
mk 1 k  1 mk k
n!
P(A s1 , ...,sk ) 
s1 ! s2 ! * ... * sk !
1
 lk 1 
 l1 
*
...
*




 m1 
 mk  1 
s
sk  1
 l 
* k 
 mk 
sk
Definieren wir nun noch
pi :
li
mi
mit 1  i  k , dann definieren wir
n!
s
p1s1 * ... * pk 1 k  1 * pk sk
s1 ! s2 ! * ... * sk !
pnp1 ,p2 ,..., pk ( s1 ,s2 , ... ,sk ,n) :
k
mit
 si  n und
i 1
k
p
i 1
i
1
Und damit ergibt sich:
Definition: Die Folge pnp ,p
1
2 ,...,
pk

( s1 ,s2 , ... ,sk ,n) heißt Polynomialverteilung oder
auch Multinomialverteilung genannt.
Ein Beispiel dazu:
Bei den Österreichischen Nationalratswahlen 2013 gab es gemäß
http://www.nationalratswahl.at/ergebnisse.html folgendes Ergebnis:
67
SPÖ 26,8%, ÖVP 24,0%, FPÖ 20,5%, Grüne 12,4%, Stronach 5,7%, NEOS 5,0%,
BZÖ 3,5%, KPÖ 1,0%, Piraten 0,8%, Wandl 0,07%, CPÖ 0,14.%, SLP 0,02%,
EUAUS 0,01%, Männerpartei 0,01%.
Daraus ergibt sich ein Rest von 0,05%
Betrachten wir nun größten 3 Parteien :
SPÖ 26,8%, ÖVP 24,0%, FPÖ 20,5%, Rest 28,7%
Wie groß ist nun die Wahrscheinlichkeit, dass bei 100 zufällig ausgewählten Wählern
bei einer Befragung unmittelbar nach der Wahl
27 SPÖ, 24 ÖVP, 21 FPÖ, 28 andere
angeben?
Wir nehmen nun an, dass das Kollektiv – in diesem Fall 4.692.907 gültige
Wählerstimmen (Quelle s. o.) – groß genug ist, so dass es nicht darauf ankommt, ob
„zurückgelegt“ oder nicht (siehe unten, 7.2 Multivariate hypergeometrische
Verteilung).
P(A) 
100!
0, 26827 0, 2424 0, 20521 0, 28728
27! 24! 21! 28!
 8,868 *1056 * 3, 628 * 10 16 * 1,334 * 10 15 * 3,522 * 10 15 * 6, 618 * 1016
 0,001
 0,1%
Dies ist ein Hinweis darauf, dass die Erhebung unmittelbar nach einer Wahl gründlich
vorbereitet werden muss, und das Kollektiv der Nachbefragten nicht gar zu klein sein
darf um eine hinreichend gute (wie immer das definiert wird) erste Prognose zu
bekommen.
7.2 Multivariate hypergeometrische Verteilung
Analoges Vorgehen wie bei 7.1 als Verallgemeinerung von 6.2 liefert die
Verallgemeinerung von der Hypergeometrischen Verteilung die Multivariate
hypergeometrische Verteilung zu:

mhm 1 ,m 2 , ... , m k (s1 ,s2 , ...,sk )  P A s 1 , s 2 , ...,s k

 m1   m2   mk 
    ...  
s
s
s
  1 2  k 
m
 
s
m
k
 mi , s 
i 1
Und damit ergibt sich:
68
mit
k
s
i 1
i

Definition: Die Folge mhm
1
,m 2 , ... , m k

(s1 ,s2 , ...,sk ) heißt
Multivariate hypergeometrische Verteilung oder auch
Polyhypergeometrische Verteilung genannt.
Mit Hilfe dieser Verteilung könnte man nun die oben angegebenen Wähleranalyse
genau berechnen, allerdings sind zu behandelten Zahlen sehr groß. Vereinfachen wir
daher die Aufgabe daher hinsichtlich der Größe der verwendeten Zahlen.
Betrachten wir nun wieder die größten 3 Parteien plus andere und nehmen an, dass
wir ein Kollektiv von 100 Wählern haben, von denen
27 SPÖ, 24 ÖVP, 20 FPÖ und 29 andere
Wähler sind.
Wie groß ist nun die Wahrscheinlichkeit, dass bei 10 zufällig aus den 100
ausgewählten Wählern
3 SPÖ , 2 ÖVP , 2 FPÖ , 3 andere
Wählern sind?
 27 
 
3
PA   




 24   20   29 
   
 2 2 3
 100 


 10 
2926 * 276 * 190 * 3654
1,731*1013
560.667.713.760
17.310.309.456.400
0,032389
3,2389%
Passen wir die Berechnung des Beispiels zur Polynomialverteilung an die hier
verwendeten Werte an, d. h. wir berechnen:
wie groß ist nun die Wahrscheinlichkeit, dass bei 10 zufällig ausgewählten Wählern
bei einer Befragung unmittelbar nach der Wahl
3 SPÖ, 2 ÖVP, 2 FPÖ, 3 andere angeben?
Dann erhalten wir als Ergebnis: P(A) = 0,027758 =2,7758%.
Ohne Beweis sei hier angemerkt, dass analog zur obigen Aussage:
Für eine „große“ Anzahl von Versuchen, (n → ∞) strebt die Folge der
hypergeometrischen Verteilung gegen die die Folge der Binomialverteilung
gilt:
69
Für eine „große“ Anzahl von Versuchen, (n → ∞) strebt die Folge der multivariate
hypergeometrischen Verteilung gegen die der Folge der entsprechenden
Polynomialverteilung.
Diese Tatsache wurde bereits auch schon im obigen Beispiel der
Polynomialverteilung verwendet.
7.3 Polya Verteilung
Abschließend soll hier noch eine andere Verallgemeinerung der Binomial-Verteilung
und der Hypergeometrische Verteilung entwickelt werden.
Als Standardbeispiel dafür ist die Ausbreitung zweier Virenerkrankungen (z. B. eine
Grippe Epidemie), wobei angenommen wird, das jeder Betroffene nur einmal
angesteckt werden kann und dann resistent bleibt.
Wir betrachten hier aber stattdessen zwei konkurrierende Unternehmen WS und SW,
die beide mit einem vergleichbaren Produkt an den gleichen Markt gehen.
Es werden folgende Voraussetzungen angenommen:
 jeder Kunde kauft nur von einem Unternehmen WS oder SW,
 nach einer Anlaufphase haben beide Unternehmen durch Werbung
zusammen N Kunden wobei SW M Kunden und WS (N – M) Kunden haben,
 nun kommt die Phase, in der der Kundenstamm durch Empfehlung der jeweils
eigenen Kunden erweitert wird, wobei die Empfehlung aber erst nach einem
Besuch von einem Vertriebsmitarbeiter wirkt,
 der Vertriebsmitarbeiter vertritt beide Produkte und besucht die Kunden in
zufälliger Reihenfolge,
 es kommen bei jedem Besuch jeweils R Kunden hinzu, wobei das bestellte
Produkt abhängig davon ob der besuchte Kunde das Produkt von SW oder
WS verwenden also:
o besuchter Kunde hat SW - Produkt  R neue Kunden für SWProdukt
o besuchter Kunde hat WS - Produkt  R neue Kunden für WSProdukt
 schließlich wollen wir annehmen, dass der Markt mindestens n Zyklen der
oben beschriebenen Art zulässt.
Wir wollen nun die Wahrscheinlichkeit dafür berechnen, dass nach dem n-ten
Besuch genau k-mal ein SW Kunde besucht wurde.
Als erstes ist klar, dass sich nach jedem Besuch die Kundenstruktur hinsichtlich der
Anzahl und der Zusammensetzung (Verhältnis SW- zu WS-Kunden) ändert.
Betrachten wir als erstes die Wahrscheinlichkeit des Ereignisses A #k ,n bei den ersten
k Besuchen bei SW Kunden erfolgt und in den nachfolgenden n-k Besuchen bei WS
Kunden besucht werden. Wir erhalten die Wahrscheinlichkeit zu:
70


P A #k ,n 

M * M  R  * ... * M  k  1 R   * N  M *  N  M  R  * ... *

 
N * N  R  * ... * N   n  1 R 
 N  M   n  k   1R 
M * M  R  * ... * M  k  1 R   * N  M *  N  M  R  * ... *

 
N * N  R  * ... * N  k  1 R  * N  k R  * N  k  1 R  * ...
N  M  n  k   1R 
* N  n  1 R 
Nun sind natürlich noch die Kombinationen der k Besuche innerhalb der insgesamt n
Besuchen berücksichtigen und damit ergibt sich nach Satz 12:



n
P A k ,n    P A #k ,n
k 


 n  M * M  R  * ... * M   k  1 R   * N  M *  N  M  R  * ... *
 
 k  N * N  R  * ... * N  k  1 R  * N  k R  * N  k  1 R  * ...
 N  M   n  k   1 R 
* N  n  1 R 
Definieren wir noch:
pon (k) : P A k ,n ,


dann können wir wie folgt definieren::
Definition: Die Folge pon (k) heißt Polya Verteilung.
Betrachten wir noch zwei Spezialfälle, die auf bekannte Verteilungen führt.
1. R = 0, d.i. nach dem Ziehen wird nur die gezogene aber keine weitere Kugel
zurückgelegt



n
P A k ,n    P A #k ,n
k 


 n  M * M  R  * ... * M   k  1 R   * N  M *  N  M  R  * ... *
 
 k  N * N  R  * ... * N  k  1 R  * N  k R  * N  k  1 R  * ...

 n  M * M  0  * ... * M   k  1 0   * N  M *  N  M  0  * ... *
 
 k  N * N  0  * ... * N  k  1 0  * N  k 0  * N  k  1 0  * ...
n
 
k 
 N  M   n  k   1 R 
* N  n  1 R 
 N  M   n  k   1 0 
* N  n  1 0 
M * N  Mn  k 

  
k
nk
N
N
k
k
n M
 
k
k  N
N  Mn  k
nk
N
k
nk
n  M   N  M 
   

k   N   N 
und das ist die Binomial-Verteilung (s. Kapitel 6.2)
2. R = -1, d.i. es wird nach dem Ziehen keine Kugel zurückgelegt
71



n
P A k,n    P A #k,n
k 


 n  M * M  R  * ... * M  k  1 R   * N  M  *  N  M   R  * ... *
 
 k  N * N  R  * ... * N  k  1 R  * N  k R  * N  k  1 R  * ...
 N  M   n  k   1 R 
* N  n  1 R 

 n  M * M  ( 1)  * ... * M   k  1 ( 1)   * N  M *  N  M   ( 1)  * ... *
 
 k  N * N  ( 1)  * ... * N   k  1 ( 1)  * N  k ( 1)  * N   k  1 ( 1)  * ...
 N  M   n  k   1 (1) 
* N  n  1 ( 1) 
 N  M  1 * ... *  N  M   n  k   1 
N  k  1  * ... *
N  n  1 
(M  k )! * N  M  *  N  M   1 * ... *  N  M    n  k   1   *


N  k  * N  k  1  * ... *
N  n  1  * (N  n)! (M  k)!
(M  k)! * N  M *  N  M  1 * ... *  N  M   n  k   1   *


N  k  * N  k  1  * ... *
N  n  1  * (N  n) ! (M  k ) !

 n  M * M  1 * ... * M  k  1   * N  M *
 
k
  N * N  1 * ... * N  k  1  * N  k  *
 n  M * M  1 * ... * M  k  1   *
 
N * N  1 * ... * N  k  1  *
k 
 n  M * M  1 * ... * M  k  1   *
 
N * N  1 * ... * N  k  1  *
k 
n
M!
 
 k  N ! (M  k)!
n
M!
 
 k  N! (M  k)!
 n  M! (N  M)!
 
N!
k 
N  n  ! N  M *  N  M  1 * ... *  N  M   n  k   1  *  N  M  n  k   !
  N  M   n  k   !
N  n  ! (N  M)!
  N  M   n  k   !
N  n  !
N  n  !
 n  M! (N  M)!

N!
 N  M  n  k   ! (M  k)!  k 
 N  n   M  k   ! (M  k)!
n
 
n 1  N  n  k 
 

 
k   N  M  k 
 
M
 h n,N  k ,M
N  n


M  k 
N
 
M
und das ist eine hypergeometrische Verteilung (s. Kapitel 6.3)
Abschließend sei noch vermerkt, dass natürlich auch hierfür ein Urnenmodell zu
Erläuterung betrachtet werden kann. Dazu seien in einer Urne M schwarze Kugeln
und N weiße Kugeln enthalten. Es wird nun verdeckt eine Kugel gezogen, das
Ergebnis notiert und die gezogene plus R Kugeln von der gleichen Farbe wie die
gezogene in die Urne zurückgelegt. Dabei spricht man hier von der Polya Urne.
8. Anwendungen
Im Folgenden sollen nun einige Anwendungen der behandelten Verteilungen
aufgelistet werden. Dies kann nur eine kleine Auswahl sein, weit entfernt von
Vollständigkeit, aber gibt doch einen Einblick, wie vielseitig die Anwendungen sind.
Gleichverteilung:
• beim Würfeln ist die Wahrscheinlichkeit einer Augenzahl zwischen eins und
sechs, gewürfelt zu werden, 1/6,
• beim Münzwurf ist die Wahrscheinlichkeit einer der beiden Seiten, oben zu
liegen, ½,
• Warteschlangzeiten,
• im weißen Rauschen sind die Frequenzen gleichverteilt, in diesem Fall
allerdings ist das in dieser Anwendung als stetige Verteilung,
• Generator für Pseudozufallszahlen.
72
(N  n)!
(N  n) !
Binomial-Verteilung:
• ziehen von Kugeln, aus einer Urne, jede Kugel in einer von zwei Farben
eingefärbt, nach dem Ziehen wird wieder zurückgelegt,
• mehrfaches werfen einer Münzen / einfaches werfen mehreren Münzen,
• Bestimmung der Gesamtanzahl von defekten Bauteilen aus einer Stichprobe,
• Wahrscheinlichkeit von gleichen Geburtstagen am Wochenende / gleichen
Tag im Jahr unter den Mitglieder einer Gruppe,
• statische Untersuchung der Anzahl der Ausfälle mehrerer unabhängig
voneinander arbeitender bei parallel / in Reihe / gemischt geschalteten,
Elemente mit gleicher Ausfallswahrscheinlichkeit.
Hypergeometrische Verteilung
• ziehen von Kugeln, aus einer Urne, jede Kugel in einer von zwei Farben
eingefärbt, nach dem Ziehen wird nicht wieder zurückgelegt,
• Ziehung der Zahlen beim Lotto,
• Qualitätskontrolle:
o Herstellers bei laufender Produktion: überprüfen von Sollvorgaben von
Stichproben in regelmäßigen Zeitabständen,
o Kunde: überprüfen von Erfüllung von Spezifikationen der gelieferten
Produkte/Dienstleistungen in regelmäßigen Zeitabständen.
Poisson Verteilung
• ankommen von Telefonanrufen bei einer Vermittlungsstelle,
• auftreffen von radioaktiven Partikeln auf einem Geigerzähler,
• eintreffen von Bedienwünschen an einem Server,
• Druckfehlern pro Seite in Büchern,
• auftreten von Softwarefehlern in einem Programmsystem.
Polynomialverteilung
• ziehen von Kugeln, aus einer Urne, jede Kugel in einer von mehr als zwei
Farben eingefärbt, nach dem Ziehen wird wieder zurückgelegt,
• radioaktiver Zerfall,
• Aufteilung der stellaren Materie im Weltraum.
Multivariate hypergeometrische Verteilung
• ziehen von Kugeln, aus einer Urne, jede Kugel in einer von mehr als zwei
Farben eingefärbt, nach dem Ziehen wird nicht wieder zurückgelegt.
Polya Verteilung
• Ausbreitung von Seuchen.
73
9. Schlussbetrachtung
In den letzten Klassen der Oberstufe werden Themengebiete aus der Stochastik
behandelt, die in dieser Arbeit nochmals erläutert und dann aber weiter ausgebaut
werden.
Dabei wurde auf drei Aspekte besonders Wert gelegt:
1. Vollständige Ableitung der Sätze und Fundierung u. a. durch Anwendung von
Multimengen,
2. „saubere“ und ausführliche Beweis (fast) aller Sätze – d. h. vermeiden von
Floskeln wie beispielsweise „wie man leicht sieht“, „daraus folgt nach kurzer
Rechnung“ etc.,
3. Beispiele von möglichen Anwendungen der Ergebnisse.
Da dies dazu führt, dass der Umfang doch erheblich ist, habe ich auf die Betrachtung


weiterer diskreter Verteilungen wie die negative Binomialverteilung, die
geometrische Verteilung, Bernoulli Verteilung etc., sowie
weiterer Parameter der Verteilungen wie Varianz und höherer Momente
verzichtet.
Für weitere Erläuterungen möchte ich auf im ausführlichen Literaturverzeichnis
gelistete Dokumente verweisen.
74
10. Literaturverzeichnis
1. Vorlesungsmitschrift „Wahrscheinlichkeitstheorie“, Prof. Dr. Wolfgang Sander,
TU Braunschweig, SS 1982
2. A. Renyi, Wahrscheinlichkeitsrechnung, VEB Deutscher Verlag der
Wissenschaften, Berlin 1971
3. Florian Schmidt und Benjamin Otto, Universität Jena, Fakultät für Mathematik
und Informatik: Mathematikdidaktik B, Didaktik der Sek II, Kombinatorik in der
Schule:
http://users.minet.uni-jena.de/~bezi/Materialien/OttoSchmidtKombinatorik.pdf
4. Wikipedia „(87269) 2000 OO67“ http://de.wikipedia.org/wiki/2000_OO67
5. Wikipedia „Ménage problem“:
http://en.wikipedia.org/wiki/M%C3%A9nage_problem
6. Georg Cantor: Beiträge zur Begründung der transfiniten Mengenlehre, Math.
Annalen Bd. 46, S. 481-512
http://gdz.sub.unigoettingen.de/dms/load/img/?PPN=PPN237853094&DMDID=DMDLOG_0069
&LOGID=LOG_0069&PHYSID=PHYS_0295
7. Petra Hornstein and C.v. Ossietzky University Oldenburg, Germany,
Dynamisches Verhalten eines Netzes : Tokenspiel
http://olli.informatik.uni-oldenburg.de/PetriEdiSim/tutor23.html
8. Wikipedia: Klasse (Mengenlehre)
http://de.wikipedia.org/wiki/Klasse_(Mengenlehre)
9. Prof. Dr. Ulrik Brandes, Universität Konstanz, Diskrete Strukturen, Skript zur
Vorlesung - Sommersemester 2003:
http://www.inf.uni-konstanz.de/algo/lehre/skripte/Quellen/ds.pdf
10. D. Singh, A. M. Ibrahim, Ahmadu Bello University, Nigeria, T. Yohanna Kaduna State University, Nigeria, J. N. Singhy - Barry University, Miami FL,
USA: A systematization of fundamentals of multisets, Lecturas Matematicas,
Volumen 29 (2008), paginas 33-48, ISSN 0120-1980
http://www.scm.org.co/aplicaciones/revista/Articulos/1014.pdf
11. Prof. Dr. Angelika Steger / Dr. Uli Wagner: Diskrete Mathematik (D-ITET),
Center for Algorithms, Discrete Mathematics and Optimization, ETH Zürich,
2011
http://www.cadmo.ethz.ch/education/lectures/HS11/DM/los02.pdf
12. Dr. Reimund Albers: Stochastik (BA FBW), Universität Bremen, AG Didaktik
der Mathematik, Sommersemester 2012: http://www.math.unibremen.de/didaktik/ma/ralbers/Veranstaltungen/Stochastik12/
13. Petra Oberhuemer, Franz Embacher: mathe online, für Schule,
Fachhochschule, Universität und Sebststudium - Mathematische
Hintergründe - Wahrscheinlichkeitsrechnung und Statistik 1:
http://www.mathe-online.at/mathint/wstat1/i.html#Beispiele123
14. Mathe* Leistungskurs der H2O:
http://mathe.wikidot.com/hypergeometrische-verteilung
15. Dr. D. Fleischer: „Vorlesung "Mathematische Grundlagen der Informatik II"
http://www.inf.uni-konstanz.de/algo/lehre/ss08/mg/skript/mg.pdf
16. Prof. Dr. Jochen Schwarzer: Grundlagen der Statistik, Band 2, 10. Auflage
17. Prof. Dr. Götz Kersting: Zufallsvariable und Wahrscheinlichkeiten, Eine
elementare Einführung in die Stochastik, Sommersemester 2006,
http://www.math.uni-frankfurt.de/~ismi/kersting/lecturenotes/Stochastik.pdf
75
18. Prof. Dr. Gerd Wittstock: Elementare Wahrscheinlichkeitstheorie und Statistik,
Kurzfassung: Definitionen und Sätze, Vorlesung SS 2003 für Bio-Informatiker
und Lehramtskandidaten, Version: 9. Juli 2003
http://www.math.uni-sb.de/ag/wittstock/lehre/SS03/wth/Skript/Skript07_08.pdf
19. Fakten über, Pólya-Verteilung: http://fakten-uber.de/p%C3%B3lya-verteilung
20. Die Home-Page von Beata Strycharz-Szemberg, Universtität Duisburg-Essen
Fachbereich Mathematik: https://www.uni-due.de/~bm0061/vorl9.pdf
21. Wikipedia „Multimenge“ http://de.wikipedia.org/wiki/Multimenge
22. Wikipedia „Blutgruppe” http://de.wikipedia.org/wiki/Blutgruppe
Dokument wurde erstellt mit
 MS Word,
 MS Excel,
 MS Powerpoint und
 MathType (http://www.dessci.com/en/products/mathtype/)
76
Herunterladen