Elemente der Kombinatorik und Diskrete Wahrscheinlichkeitsverteilungen Grundlagen und Beispiele Dieter Küntzel, 2014 Inhaltsverzeichnis 1. Einleitung ................................................................................................................ 3 1.1 Kombinatorik ..................................................................................................... 3 1.2 Stochastik ......................................................................................................... 4 2. Zählprobleme .......................................................................................................... 5 3 Elemente der Mengenlehre und der Lehre von Multimengen ................................. 8 4 Anordnungen und Auswahlen............................................................................... 21 4.1 Permutationen ................................................................................................ 21 4.1.1 Permutationen von unterscheidbaren Elementen ..................................... 21 4.1.2 Permutation von teilweise nicht unterscheidbaren Elementen.................. 22 4.2 Variationen ...................................................................................................... 24 4.2.1 Variationen ohne Wiederholung ............................................................... 24 4.2.2 Variationen mit Wiederholung................................................................... 24 4.3 Kombinationen ............................................................................................... 25 4.3.1 Kombinationen ohne Wiederholung.......................................................... 25 4.3.2 Kombinationen mit Wiederholung ............................................................. 25 4.4 Zusammenfassung.......................................................................................... 26 4.5 Anwendungen und Beispiele ........................................................................... 28 5. Endliche Wahrscheinlichkeitsräume ..................................................................... 35 5.1 Klassische Definition der Wahrscheinlichkeit .................................................. 35 5.2 Zufallsgrößen .................................................................................................. 40 5.3 Baumdiagramme ............................................................................................ 42 6. Diskrete Verteilungen ........................................................................................... 46 6.1 Gleich-Verteilung............................................................................................. 46 6.2 Binomial-Verteilung ......................................................................................... 48 6.3 Hypergeometrische Verteilung ........................................................................ 52 6.4 Zusammenhang zwischen Binomial- und Hypergeometrischer Verteilung .... 58 6.5 Poisson Verteilung .......................................................................................... 59 6.6 Approximation von Binomial- und Hypergeometrischer Verteilung ................. 64 7. Verallgemeinerung der Verteilungen .................................................................... 66 7.1 Polynomialverteilung ....................................................................................... 66 7.2 Multivariate hypergeometrische Verteilung ..................................................... 68 7.3 Polya Verteilung .............................................................................................. 70 8. Anwendungen ....................................................................................................... 72 9. Schlussbetrachtung .............................................................................................. 74 10. Literaturverzeichnis............................................................................................. 75 2 1. Einleitung In dieser Arbeit werden einige Elemente der Kombinatorik dargestellt und diese dann für die Beantwortung von einfachen Fragen der Wahrscheinlichkeitsrechnung für endliche Ereignisräume herangezogen. 1.1 Kombinatorik Die Kombinatorik ist ein Gebiet der Mathematik, das sich mit endlichen Strukturen befasst. Damit ist die Kombinatorik also ein Element der Diskreten Mathematik. Konkret geht es in der Kombinatorik darum, die Elemente einer gegebenen Menge nach einer vorgegebenen Vorschrift anzuordnen oder aus einer gegebenen Menge bestimmte Elemente nach einer gegebenen Bedingung auszuwählen. Dazu ein sehr allgemeines Beispiel: Es sind Vorschriften für vollständige Zerlegungen einer Menge in Teilmengen zu untersuchen, und die folgenden Fragen zu beantworten: - gibt es mindesten eine Zerlegung, die die Vorschriften erfüllt, wenn sie existiert, gibt es weitere und wenn ja, wie viele solcher Zerlegungen gibt es, und dann schließlich auch, welche Struktur / Eigenschaften hat die Menge aller Zerlegungen. Als konkretes Beispiel sei hier das Schubfachprinzip erläutert, das eine Eigenschaft der Verteilung von Elementen einer Menge auf andere Mengen und damit eine Zerlegung der Menge beschreibt. Satz: Falls man n Elemente einer Menge M auf m andere Mengen Mi , 1 ≤ i ≤ m verteilt, wobei n, m und n > m ist, dann gibt es mindestens eine Menge, die mehr als ein Elemente enthält. Beweis: Ordnen wir nun im ersten Schritt jeder der m Mengen Mi ein Element zu, so haben wir m Elemente zugeordnet und jede der m Mengen hat mindestens ein Element. Nun sind aber noch n – m > 0 Elemente übrig, die noch zuzuordnen sind. Damit gibt es mindestens eine Menge Mj , 1 ≤ j ≤ m, die mindestens ein zweites Element enthält und das beweist den Satz. +++ Bemerkung: Der Name kommt aus folgender Formulierung: Verteilt man n Objekte auf m Fächer (n > m) - z. B. eines Schrankes so gibt es mindestens ein Fach, das mindestens zwei Objekte enthält. Ein Beispiel für die Anwendung des Schubfachprinzips ist folgende, einfach und selbstverständlich klingende Aussage: In eine Menge von mehr als 366 Menschen gibt es mindestens 2 Menschen, die am gleichen Tag Geburtstag haben (ein Jahr hat maximal 366 Tage). 3 Oder auch: Unter der Annahme, dass alle Menschen weniger als eine Million Haare auf dem Kopf haben und Wien mindestens eine Million Menschen als Einwohner hat gilt: In Wien gibt es mindestens 2 Menschen, die die gleiche Anzahl von Haaren auf den Kopf haben. Immerhin interessant, eine so allgemeine Aussage zu treffen, selbst wenn man nicht weiß, wer die beiden Menschen sind. Zwei weitere „praktische“ Fragestellungen der Kombinatorik seien hier noch erwähnt: 1. Das Wolf – Ziege – Kohlkopf Problem Ein Bauer möchte mit einer Ziege, einem Wolf und einem Kohlkopf in einem Boot über einen Fluss setzen. Er kann nur eines der 3 „Objekte“ mit ins Boot nehmen. Da, alleingelassen, der Wolf die Ziege fressen würde und die Ziege den Kohlkopf, muss eine Übersetz-Reihenfolge gefunden werden, mit der die oben erwähnten Kombinationen vermieden werden. 2. Ein Problem aus dem Haushalt (problème des ménages) Das “problème des ménages“ beschreibt folgende Fragestellung: Es sind n Ehepaare, n ≥ 3, um einen runden Tisch herum so zu setzen, dass kein Ehepaar zusammensitzt, d. h. zwischen jedem Ehepaar sitzt mindestens ein Mensch eines anderen Ehepaares. Wie viele Sitzordnungen dieser Art gibt es? Zumindest das 2. Problem ist alles andere als leicht für den allgemeinen Fall zu lösen, Eine Lösung findet sich beispielsweise in [5]. Beide Fragestellungen werden hier nicht weiter behandelt. 1.2 Stochastik Die Stochastik beschreibt Ergebnisse von Zufallsexperimenten wie beispielsweise die Ergebnisse des Werfens eines Würfels. 1. Die Analyse der Ergebnisse von konkreten Experimenten / Beobachtungen und deren Interpretation, wie beispielsweise Prognosen, allgemeine Verhaltensweisen usw. ist Gegenstand der Statistik. 2. Die Wahrscheinlichkeitsrechnung basiert auf der Formalisierung der Experimente, also der Modellbildung. Aus der so erhaltenen theoretischen, abstrakten Beschreibung des Experiments werden dann bestimmte Ergebnisse bzw. Prognosen abgeleitet / berechnet. In dieser Arbeit werden wir nur Elemente der Wahrscheinlichkeitsrechnung betrachten. 4 2. Zählprobleme In den folgenden Kapiteln werden einige Aufgaben dargestellt, deren Lösung auf Prinzipien zum Abzählen von Elementen einer Menge, die eine bestimmte Eigenschaft haben, beruht. Da hier häufig ein Produkt der ersten n natürlichen Zahlen verwendet wird, definieren wir: Definition Sei n eine natürliche Zahl einschließlich der Null, n definieren wir n-Fakultät, geschrieben n! induktiv , zu 0! := 1 und (n + 1)! := n! * (n + 1) . 0 . Dann Bemerkung: für n > 0 gilt somit n! := 1 * 2 * 3 * . . . * n Weiter werden wir auch folgende Definition benötigen: Definition Für alle natürliche Zahlen n, k B: 2 0 0 0 wird die Funktion B definiert zu n n! B(n,k) : mit k k! (n k)! B(n,k) 0 für 0kn . für k n n Die Funktion B(n,k) heißt Binomialkoeffizient von n über k und k wird gesprochen als n über k. Bevor die allgemeinen Zählprinzipien erläutern nun einige Beispiele. aus der Gastronomie: 1. Gegeben sei eine Menükarte mit 20 verschiedene Hauptgerichten H1, H2, H3, … , H19, H20. Wie viele Menükarten MK1 mit unterschiedlicher Reihenfolge der Hauptgerichte sind möglich? Lösungsansatz: 1. Stelle: 20 Möglichkeiten ein Gericht auszuwählen 2. Stelle: 19 Möglichkeiten, da ein Hauptgerichten bereits für die 1. Stelle ausgewählt wurde 3. Stelle: 18 Möglichkeiten, da zwei Hauptgerichte bereits für die 1. und 2. Stelle ausgewählt wurden … 19. Stelle: 2 Möglichkeiten 20. Stelle: 1 Möglichkeit Damit insgesamt: MK1 = 20 * 19 * 18* . . . * 2 * 1 = 20! = 2.432.902.008.176.640.000 ≈ 2,4 1018 Um diese große Zahl etwas „fassbarer“ zu machen, nehmen wie an, dass jede Menükarte auf eine DIN A4 Seite (210 mm × 297 mm) normalen Schreibpapiers gedruckt wird. 5 Eine Seite hat die Höhe/Dicke von 0,1 mm = 10-4 m = 10-7 km. Alle Karten übereinander gelegt ergeben dann einen Turm von ca. 2,4 1011 km Höhe. Die Entfernung Erde Sonne beträgt ca. 1,5 108 km und somit entspricht der Turm etwa dem 1.600-fachen der Entfernung Sonne - Erde, reicht also weit aus unseren Sonnensystem (äußerer Rand ist etwa beim 1.200-fachen der Entfernung Sonne - Erde (z. B. Objekt (87269) 2000 OO67 [4])) heraus. Ein anderer Vergleich: Der Flächeninhalt der Erdoberfläche ist 510 Millionen km² = 5,1 1018 cm² und danach wäre die gesamte Erdoberfläche mit Stapeln von Menükarten mit einer Höhe von 30 cm bedeckt. An dieser Stelle sei noch bemerkt, dass eine Addition nicht die Lösung der Aufgabe darstellt: MK1* = 20 + 19 + 18 + . . . + 2 + 1 , da folgende Herleitung nach dem allgemeinen elementaren Zählprinzip der Kombinatorik gilt (s. o.): - für die 1. Stelle gibt es 20 Möglichkeiten, - für die 2. Stelle gibt es nur noch 19 Möglichkeiten und zwar für jede der 20 ersten Möglichkeiten und damit sind das also somit insgesamt: 19 * 20 Möglichkeiten für die Auswahl der ersten beiden Stellen - … und so weiter. 2. Gegeben sei wieder eine Menükarte mit 20 Hauptgerichten, allerdings dieses Mal in 6 Kategorien (Süßwasser- (4) und Meeresfische (2), Schweine- (5), Rind- (4), Lammfleisch (2), Vegetarisch(3)) aufgeteilt. Die „vereinfachte“ Menükarte enthält also folgende Elemente: Sü1, Sü2, Sü3, Sü4, Me1, Me2, Sc1, Sc2, Sc3, Sc4, Sc5, Ri1, Ri2, Ri3, Ri4, La1, La2, Ve1, Ve2, Ve3 . Nun soll für jede Menükarte gelten, dass die Namen der Gerichte zwar beliebig gereiht werden können, aber innerhalb der Kategorie in numerisch aufsteigender Reihenfolge stehen sollen, also beispielsweise: La1, Ve1, Sü1, Sc1, Sc2, Ri1, Sü2, Me1, Sü3, Sc3, Ri2, Ri3, La2, Ve2, Sc4, Ve3, Me2, Sc5, Sü4, Ri4 . Als ersten Ansatz nehmen wir die Lösung von 1., müssen aber die nicht unterscheidbaren Elemente je Kategorie wieder „heraus“-dividieren: Beispielsweise lässt sich die Sequenz Sü1, Sü2, Sü3, Sü4 in einer beliebigen Folge z.B. einer 11 Zeichen langen Folge A, B, Sü1, C, Sü2, Sü3 , D, Sü4, E, F, G analog zu 1. Oben, auf 4 * 3 * 2 * 1 = 4! verschiedene Weisen anordnen. 6 Die nicht unterscheidbaren Vertauschungen müssen also bis auf eine wieder herausgerechnet werden, d. h. die Gesamtanzahl der Vertauschungen ist durch die Anzahl der nicht unterscheidbaren Vertauschungen zu dividieren. Somit ergibt sich für das Beispiel: 20! 4! 2! 5! 4! 2! 3! 2.432.902.008.176.640.000 24 * 2 *120 * 24 * 2 * 6 MK 2 2.432.902.008.176.640.000 1.658.880 MK 2 1.466.593.128.000 1,5 1012 In jeder einzelnen dieser Konfigurationen können die Elemente nun in numerischer Reihenfolge je Kategorie nummeriert werden und es wird keine Wiederholung geben. Führen wir die „Turm-Berechnung“ von oben weiter, so ergibt sich folgendes Bild: wir nehmen wieder an, dass jede Menükarte auf eine DIN A4 Seite normalen Schreibpapiers gedruckt wird, mit der Höhe/Dicke jeder Seite von 0,1 mm = 10-4 m = 10-7 km. Alle Karten übereinandergelegt ergibt dann einen Turm von 150.000 km Höhe und das ist gerade einmal ca. 40% des Weges von der Erde zum Mond. 3. Wir nehmen nun an, dass 3 Personen das Restaurant besuchen. Die Speisekarte beinhaltet 20 Hauptgerichte. Wie viele Auswahlen von 3 Gerichten gibt es, wenn alle Personen unterschiedliche Hauptgerichte auswählen. Nachdem der erste Gast eine aus den 20 Speisen ausgewählt hat, bleiben für den zweiten noch 19 Speisen zur Auswahl und schließlich für den Dritten noch 18. Damit ergibt sich die Anzahl der Auswahlen A1 zu: A1 = 20 * 19 * 18 = 3420 4. Unsere 3 Personen besuchen nochmals das Restaurant und orientieren sich bei der Speisenauswahl aus den 20 Speisen diesmal an den oben vorgegebenen Kategorien: Sü1, Sü2, Sü3, Sü4, Me1, Me2, Sc1, Sc2, Sc3, Sc4, Sc5, Ri1, Ri2, Ri3, Ri4, La1, La2, Ve1, Ve2, Ve3 Wie viele Auswahlen von 3 Gerichten gibt es, wenn alle Personen ein 7 Hauptgericht, aber alle aus unterschiedlichen Kategorien auswählen? Betrachten wir zuerst die möglichen Kombinationen der Kategorien: {Sü, Me, Sc}, {Sü, Me, Ri}, {Sü, Me, La}, {Sü, Me, Ve}, {Sü, Sc, Ri}, {Sü, Sc, La}, }, {Sü, Sc, Ve}, {Sü, Ri, La}, {Sü, Ri, Ve}, {Sü, La, Ve}, {Me, Sc, Ri}, {Me, Sc, La}, {Me, Sc, Ve}, {Me, Ri, La}, {Me, Ri, Ve}, {Me, La, Ve}, {Sc, Ri, La}, {Sc, Ri, Ve}, {Sc, La, Ve} {Ri, La, Ve} Es soll nicht zwischen den Auswahlen unterschieden, wer als erstes mit der Auswahl beginnt usw. Damit ergibt sich die Anzahl der Auswahlen A2 zu: A2 = 4 * 2 * (5 + 4 + 2 + 3) + 4 * 5 * (4 + 2 + 3) + 4 * 4 * ( 2 + 3) + 4 * 2 * 3 + + 2 * 5 * (4 + 2 + 3) + 2 * 4 * (2 + 3) + 2 * 2 * 3 + + 5 * 4 * (2 + 3) + 5 * 2 * 3 + +4*2*3 = 112 + 180 + 80 + 24 + + 90 + 40 + 12 + + 100 + 30 + + 24 = 692 Man erkennt also deutlich, dass die Frage nach Anzahlen von Anordnungen / Auswahlen nicht leicht beantwortet werden kann, wenn nicht klar definiert wird, was denn mit „anordnen“ gemeint ist. Systematisch werden wir dieses und zugehörige, effiziente Berechnungsmethoden in Kapitel 4 betrachten. 3 Elemente der Mengenlehre und der Lehre von Multimengen In diesem Abschnitt sollen einige Mengenoperationen auf und die Mächtigkeit von endlichen Mengen kurz zusammengefasst werden. Beginnen wollen wir mit der Definition einer Menge. Nach Georg Cantor (geb. 19. Februar 1845. in Sankt Petersburg, gest. 6. Januar 1918 in Halle an der Saale) gilt: Definition: Unter einer „Menge“ verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten o unserer Anschauung oder unseres Denkens (welche die „Elemente“ von M genannt werden) zu einem Ganzen [6]. 8 Diese Definition ist insofern nicht ausreichend, da aus ihr widersprüchliche Aussagen abgeleitet werden können, wenn die Mengen „sehr groß“ werden, z. B. bei Betrachtung der „Menge aller Mengen“ [8]. Für die Untersuchungen in dieser Arbeit benötigen wir nur endliche Mengen und dafür ist die Definition ausreichend. Mit der Definition ist klar, dass Wiederholungen von Elementen nicht zulässig sind, denn es sollen ja „wohlunterschiedene Objekte“ zusammengefasst werden. Die obige Definition kann erweitert werden, sodass auch solche Zusammenfassungen behandelt werden. Darauf werden wir weiter unter zurückkommen. Definition: 1. Die Mächtigkeit m einer Menge M ist definiert als die Anzahl der Elemente von M, geschrieben als m M 2. Eine Menge B heißt eine Teilmenge von A, geschrieben B A , wenn für alle x B gilt : x B x A . 3. Zwei Mengen A, B heißen gleich, wenn A B und B A gilt. Seien zwei Mengen A, B gegeben: 4. Die Vereinigungsmenge der Mengen A , B , geschrieben A ∪ B, ist die Menge aller x für die gilt: x A oder x B . 5. Die Schnittmenge der Mengen A, B , geschrieben A ∩ B, ist die Menge aller x für die gilt: x A und x B . 6. Die Differenzmenge von A und B. geschrieben A\B, gesprochen A ohne B, ist die Menge aller x für die gilt x A und x B Definition: Sei nun A eine endliche Mengen A a1 , a2 , a3 , . . . , an gegeben. Die Potenzmenge von A ist definiert als die Menge aller Teilmengen von A: A B B A Beispiel: Sei A a, b, c, d, e, f gegeben. Die Mächtigkeit von A ist damit |A| = 5, Dann ergibt sich (A) zu: (A) ( a, b, c, d, e) , a, b, c, d, e, a, b, a, c, a, d, a, e, b, c, b, d, b, e, c, d, c, e, d, e, a, b, c, a, b, d, a, b, e, a, c, d, a, c, e, a, d, e, b, c, d, b, c, e, b, d, e, c, d, e, a, b, c, d, a, b, c, e, a, b, d, e,, a, c, d, e, b, c, d, e, a, b, c, d, e, f 9 A 32 25 (1 1)5 5 5 0 1 1 5 5 5 2 3 10 10 5 5 4 5 5 1 Beweisen wir nun, dass diese Beziehung für alle endlichen Mengen gilt. Satz 1: Die Mächtigkeit der Potenzmenge (A) der Menge A a1 , a2 , a3 , . . . , an ergibt sich zu A 2 A 2n . Beweis: Der Beweis wird mit Hilfe der vollständigen Induktion geführt: 1. Induktionsbeginn: n = 0: A = ∅ ⟹ A 1 20 2 2. Induktionsvoraussetzung: Für An a1 , a2 , a3 , . . . , an gilt: A 2 A A 2n . 3. Induktionsschluss: Sei An+1 gegeben mit A n1 a1 , a2 , a3 , . . . , an ,an 1 a1 , a2 , a3 , . . . , an an 1 A n an 1 und An B B An damit ergibt sich An1 C C A n1 C C A n oder C B an1 mit B A n C C A n C C B an1 mit B A n da die obige Zerlegung von (An+1) disjunkt ist, d. h. der Schnitt der beiden Mengen leer ist, und die Anzahl der Elemente beider Mengen gleich groß ist - nämlich nach Induktionsvoraussetzung 2n - ergibt sich: A B B A C B B A C n 1 2n 2 2n 2n1 n C B an1 und B A n n C B an1 und B A n 2n +++ 10 Anmerkung: Man beachte, dass gilt: zwei Mengen sind gleich, wenn sie die gleichen Elemente enthalten. Das heißt insbesondere, dass es auf die Reihenfolge, in der die Elemente aufgeschrieben sind, nicht ankommt. Also beispielsweise gilt a1 , a2 , a3 a3 , a1 , a2 Zur Betrachtung von „Aufzählungen“ ohne Berücksichtigung der Reihenfolge sind also Mengen zu verwenden. Konsequenterweise betrachten wir nun Aufzählungen bei denen auch die unterschiedlichen Reihenfolgen mit gezählt werden. Dazu ermitteln wir vorab alle möglichen Anordnungen von den Elementen der Menge A 4 1, 2, 3, 4 , so erhalten wir gemäß der unteren Tabelle genau 24 = 4! Anordnungen. Zählindex 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Satz 2: Setzen der 1 auf eine von 4 freien Positionen 1 * * * * 1 * * * * 1 * * * * 1 Setzen der 2 auf eine von 3 freien Positionen 1 2 * * 1 * 2 * 1 * * 2 2 1 * * * 1 2 * * 1 * 2 2 * 1 * * 2 1 * * * 1 2 2 * * 1 * 2 * 1 * * 2 1 Setzen der 3 auf eine von 2 freien Positionen 1 1 1 1 1 1 2 2 3 * 3 * 2 2 3 * 3 * 2 2 3 * 3 * 2 2 3 * 3 * 1 1 1 1 1 1 3 * 2 2 * 3 3 * 2 2 * 3 3 * 2 2 * 3 3 * 2 2 * 3 1 1 1 1 1 1 * 3 * 3 2 2 * 3 * 3 2 2 * 3 * 3 2 2 * 3 * 3 2 2 1 1 1 1 1 1 Setzen der 4 auf letzte freie Position 1 1 1 1 1 1 2 2 3 4 3 4 2 2 3 4 3 4 2 2 3 4 3 4 2 2 3 4 3 4 1 1 1 1 1 1 3 4 2 2 4 3 3 4 2 2 4 3 3 4 2 2 4 3 3 4 2 2 4 3 1 1 1 1 1 1 4 3 4 3 2 2 4 3 4 3 2 2 4 3 4 3 2 2 4 3 4 3 2 2 1 1 1 1 1 1 Tabelle der möglichen Anordnungen von den 4 Elementen der Menge A4 Die n ≥ 1 Elemente einer Menge An a1 , a2 , a3 , . . . , an 2 , an 1 , an lassen sich auf n! – Weisen anordnen. Beweis: Betrachten wir die oben angegebene Menge An a1 , a2 , a3 , . . . , an 2 , an 1 , an o o o o o das 1. Element kann auf n verschiedener Positionen gestellt werden, das 2. Element kann auf (n-1) verschiedener Positionen gestellt werden, … das n-1. Element kann auf 2 verschiedene Positionen gestellt werden, das n. Element kann auf nur auf die letzte verbliebene also eine Position gestellt werden. 11 Insgesamt ergeben sich also n * (n-1) * (n-2) * . . . * 1 = n! Anordnungsmöglichkeiten. +++ Damit lässt sich nun errechnen, wie viele Teilmengen gleicher Mächtigkeit einer Menge existieren. Darüber gibt der nächste Satz Auskunft. Satz 3: Die Anzahl der Teilmengen B ⊆ A, A n also B A , 1 mit genau k Elementen, n n! B k n , ist gleich: k (n k)! k! Beweis: Der Beweisansatz ähnelt dem von Satz 2: o o o o das 1. Element kann auf n verschiedener Weisen gewählt werden, das 2. Element kann auf (n-1) verschiedener Weisen gewählt werden, … das k. Element kann auf (n-(k-1)) = (n-k+1) verschiedener Weisen gewählt werden. Damit haben wir n * (n-1) * (n-2) * . . . * (n – k + 1) Mengen. Nun das „Standardargument“: per Definition sind zwei Mengen gleich, wenn sie die gleichen Elemente, unabhängig von der Reihenfolge der Elemente, enthalten. Also müssen aber noch die Mengen herausgenommen werden, die sich nur in der Reihenfolge der Elemente unterscheiden, denn für Mengen ist die Reihenfolge der Elemente nicht relevant. Damit ist das oben ermittelte Ergebnis gemäß des Satz 2 noch durch k! zu dividieren: n * (n 1) * (n 2)* . . . * (n (k 1)) k! n * (n 1) * (n 2)* . . . * (n (k 1)) * (n k) * (n (k 1)) * . . . * 2 * 1 k ! ((n k) * (n (k 1)) * . . . * 2 * 1) n * (n 1) * (n 2)* . . . * 2 * 1 k! (n k)! n! (n k)! k! +++ Anmerkung: Nach Satz 1: gilt für alle Teilmengen einer Menge: Die Anzahl der Teilmengen von A ist gleich: A 2 A 2n . Nach Satz 3 gilt für die Anzahl der Teilmengen mit k Elementen n n! B A mit 1 B k n : k (n k)! k! Summieren wir den letzten Term über alle k mit 0 ≤ k ≤ n, d. h. wir 12 summieren über alle Teilmengen B von A, so ergibt sich: k 0 n n n n! 1k 1n k k (n k)! k! k 0 k 0 n n k 2 n 1 1 n 1 1 n n n! (n k)! k! 1 1n k k k 0 Satz 1 und Satz 3 liefern also eine Spezialform der Binomischen Formel n n! n a k b nk . a b k 0 (n k)! k! Im nächsten Schritt wird nun das Produkt von Mengen definiert und untersucht. Definition: Das k-fache (kartesische) Produkt der Mengen Ai a1 , a2 , a3 , . . . , an i 1, 2, ... , k ist definiert als: i k A i 1 i A1 x A 2 x ... x A k (a 1 ,a2 , .... , ak ) a1 A1 ,a2 A 2 , .... , ak A k Die Elemente (a1 ,a2 , .... , ak ) nennt man k-Tupel, a1 ,a2 , .... , ak heißen Komponenten. Gilt für mindestens ein j mit 1 ≤ j ≤ n: Aj = ∅ , so wird definiert k A i 1 i . Kommen wir nun zu den in der Einleitung erwähnten und, wie wir gleich sehen werden, selbstverständlich klingenden Zählprinzipien mit denen endliche (Teil-) Mengen einfach und schnell abgezählt werden können. Dabei setzen wir auf die Überlegungen von den Beispielen aus 2. Zählprobleme auf. Satz 4 Seien n Mengen A i a1 , a2 , a3 , . . . , a k i mit ki 1 und 1 i n , gegeben. Dann gelten die folgenden Regeln: Summenregel Die Mächtigkeit der Vereinigungsmenge von paarweise disjunkten Mengen A i , also Ai A j für alle i ≠ j, ergibt n sich zu i1 Produktregel n Ai Ai , i 1 Die Mächtigkeit des n-fachen (kartesischen) Produkts der Mengen Ai ergibt sich n mit Vn : A i : A1 ... A n i 1 13 zu Vn n A i 1 n i Ai . i 1 Gilt für mindestens ein Ai , so definieren wir n A i 1 i : . Bemerkung: in der Literatur wird für das Mengenprodukt auch die folgende Schreibweise verwendet: n i 1 n A i : A i i 1 Beweis: A. Beweis der Summenregel Der Beweis der Summenregel wird in 2 Schritten, jeweils mit Hilfe der vollständigen Induktion, geführt. I. Vereinigung von 2 Mengen A1 , A 2 und Induktion über die Mächtigkeit von A2 k2 1. Induktionsbeginn: A1 A 2 A1 k2 0 : A2 A2 0 A1 A 2 A1 A1 0 A 1 A 2 2. Induktionsvoraussetzung: A 2 k 2 : A1 A 2 A1 A 2 3. Induktionsschluss: A 2 k 2 1: für ein beliebiges a A 2 gilt A 2 \ a k 2 und nach Voraussetzung gilt : A1 A 2 und somit auch : A1 A 2 \ a Induktionsvoraussetzung angewandt auf A1 A 2 \ a liefert : A1 A 2 \ a A1 A 2 \ a A1 k 2 und damit A1 A 2 A1 A 2 \ a a A1 A 2 \ a a (A1 A 2 \ a ) a A1 A 2 \ a a A 1 k2 1 A1 k 2 1 A1 (k 2 1) A1 A 2 14 II. Vereinigung von n Mengen, n ≥ 2 1. Induktionsbeginn: n = 2: gilt nach I. 2. Induktionsvoraussetzung: für Ai A j mit Ai a1 , a2 , a3 , . . . , aki n i1 für 1 ≤ i ≤ n gilt: n Ai Ai i 1 3. Induktionsschluss n 1 n Ai i1 i1 n i1 n i 1 Ai An 1 Ai An 1 nach Induktionsbeginn Ai An 1 nach Induktionsvoraussetzung n 1 i 1 Ai B. Beweis der Produktregel Der Beweis kann wieder mit Hilfe der vollständigen Induktion geführt werden. Hier verwenden wir einen kombinatorischen Ansatz. Betrachten wir die oben angegebene Mengen A i a1 , a2 , a3 , . . . , ani 2 , ani 1 , ani k A i1 i mit A i ni (a1 ,a2 , .... , ak ) a1 A1 ,a2 A 2 , .... , ak A k o das 1. Element kann aus A1 auf A1 Arten ausgewählt werden, o das 2. Element kann aus A 2 auf A 2 Arten ausgewählt werden, o … o das k. Element kann aus Ak auf A k Arten ausgewählt werden, Insgesamt ergeben sich also A1 * A 2 * . . . * A k 1 * A k Elemente der Produktmenge. +++ Bemerkung: Gilt A 1 A 2 . . . A k 1 A k A , A n so folgt k A i 1 Ak (a 1 ,a2 , .... , ak ) a1 ,a2 , .... , ak A 15 A k Es gibt also A k n k - viele Anordnungen von n Elementen einer Menge A mit 0 A n , wobei hier auch Tupel mit gleichen Komponenten, d. h. also Anordnungen von n Elementen mit Wiederholungen der Elemente z. B. (a1 ,a1 , .... , a1 ) und verschiedene Reihenfolgen der Elemente mitgezählt werden z. B. das k-Tupel (a3 ,a1 ,ak ,ak 3 , ..., a2 ) . Zur Erinnerung: Die n ≥ 1 Elemente einer Menge An a1 , a2 , a3 , . . . , an 2 , an 1 , an lassen sich auf n! – Weisen anordnen, da per Definition für eine Menge Wiederholungen von Elementen nicht zugelassen sind. Satz 5: Die Anzahl der Elemente des k-fachen (kartesischen) Produkts Vk der Menge A mit A n k verschiedenen Komponenten ergibt sich zu: Vk* (b1 ,b2 , .... , bk ) für alle 1 i k, bi A und bm b j für m j Vk* n! . (n k)! Beweis: Der Beweis erfolgt analog zu dem Beweis der Produktregel von Satz 4,: Betrachten wir die oben angegebene Menge A a1 , a2 , a3 , . . . , an 2 , an 1 , an und bilden k A (a i 1 1 ,a2 , .... , ak ) a1 ,a2 , .... , ak A k Konstruieren wir nun die (b1 ,b2 , .... , bk ) Vk A i 1 o das 1. Objekt b1 kann aus A auf A n Arten ausgewählt werden, o das 2. Objekt b2 kann aus A auf A 1 n 1 Arten ausgewählt werden, da das erste gewählte Element nicht mehr ausgewählt werden darf, o … o das (k-1)-te Objekt bk-1 kann aus A auf A (k 2) n (k 2) Arten ausgewählt werden, o das k-te. Objekt bk kann aus A auf A (k 1) n (k 1) Arten ausgewählt werden. 16 Insgesamt ergeben sich also Vk n * (n 1) * ... * (n k 2 )*(n (k 1)) n * (n 1) * ... * (n k 2 )*(n (k 1)) (n k)* ... * 1 (n k)! n! (n k)! Elemente der Produktmenge mit unterschiedlichen Objekten jedes k-Tupels +++ Wir kommen nun, wie oben angekündigt, zu der Erweiterung des Mengenbegriffs hinsichtlich der „Wohlunterscheidbarkeit der Objekte“ bzw. „Wiederholung von Elementen“ bei der Zusammenfassung zurück. Dazu definieren wir eine neue Struktur gemäß [9], die Multimengen. Zur Vorbereitung definieren wir die charakteristische Funktion auf einer Teilmenge T einer Menge M. Definition: Unter einer charakteristischen Funktion I einer Teilmenge T ⊆ A 1 falls x T verstehen wir eine Abbildung I : A 0,1 mit I(x) 0 falls x T Bemerkung: Die charakteristische Funktion wird auch Indikatorfunktion genannt. Die charakteristische Funktion gibt also für jedes Element von A an, ob es 1-mal oder 0-mal in der Menge T A vorkommt. Dies legt nun die Verallgemeinerung der charakteristischen Funktion nahe, die man Multimenge nennt, auch wenn es eine Funktion ist. Definition: Unter einer Multimenge M über einer Menge A verstehen wir eine Abbildung M : A 0 durch die jedem Element a ∈ A durch M(a) eine natürliche Zahl inklusive der Null zugeordnet wird. M(a) heißt Vielfachheit von a. Die Summe der Vielfachheiten über alle Elemente a ∈ A nennt man Kardinalität von M, geschrieben M M(a) . aA Bemerkung: Wir können nun für jedes x ∈ A M(x) als die Anzahl der Elemente x interpretieren und beschreiben die Multimenge als M := a,a,...,a,b,b,....b,....,v,v,...,v . kb mal k v mal ka mal Die Aufzählung der Elemente wird von geschleiften Doppelklammern eingefasst. Die Darstellung der Multimenge M ist nicht eindeutig, da es 17 auf die Reihenfolge der Elemente, analog zur Mengendarstellung, nicht ankommt. Betrachten wir dazu ein Beispiel: Sei A = {a, b, c, d, e} und a 1 b 4 M : c 2 d 0 e 2 also M(a) = 1, M(b) = 4, M(c) = 2, M(d) = 0, M(e) = 2 Entsprechend der oben angegebenen Interpretation schreibt man daher die Multimenge M als: M M(A) a, b, b, b, b, c, c, e, e Es gibt aber auch andere Darstellungen von Multimengen. Eine davon soll hier erläutert werden [10]. Sei eine Menge A gegeben mit A n, n . Nehmen wir dazu eine beliebige, aber feste Nummerierung der n Elemente a i A , 1 ≤ i ≤ n an. Dann konstruieren wir die Darstellung Multimenge M mit Kardinalität k n M(a ) i1 i 1. für das erste Element a1 schreiben wir entsprechend seiner Vielfachheit M(a1)-oft • , ggf. Null-mal falls A n 2 : 2. das Trennzeichen |, 3. für das zweite Element a2 entsprechend seiner Vielfachheit M(a2)-oft • , ggf. Null-mal falls A n 3 : 4. … 2n-3. 2*(n-1). 2*n-1. das Trennzeichen |, für das (n-1)-te Element an-1 entsprechend seiner Vielfachheit M(an-1)- oft • , ggf. Null-mal das Trennzeichen |, schließlich für das n-te Elemente an entsprechend seiner Vielfachheit M(an) oft • , ggf. Null-mal Insgesamt haben wir somit k-mal • und (n – 1)-mal den Trennstrich | erhalten. Damit ergibt sich eine Zeichenkette aus k + (n – 1) = n + k − 1 Zeichen. Beispiel: M M(A) a, b, b, b, b, c, c, e, e wird dargestellt durch • | • • • • | • • | • •. Jeder Zeichenkette entspricht genau eine Multimenge und umgekehrt. Wir werden 18 diese Schreibweise weiter unten verwenden. Betrachten wir noch einige Operationen auf Multimengen, die analog zu Mengenoperationen definiert werden. Zuvor aber noch eine Definition. Definition: Die reduzierte Grundmultimenge, supp(M), einer Multimenge M über A ist definiert als die Menge supp(M) x A M(x) 0 . Die reduzierte Grundmultimenge enthält also die relevanten Elemente von M, d. h. anschaulich nur die Elemente, die auch tatsächlich mindestens einmal vorkommen. Im Folgenden wird vorausgesetzt, dass die Kardinalität der betrachteten Multimengen endlich ist, denn dann existiert insbesondere das Maximum zweier Kardinalitäten. Diese Einschränkung ist für die Betrachtungen weiter unten ausreichend, kann aber durch entsprechende Erweiterung der Definition auch vermieden werden, siehe z. B. [10]. Definition: Seien N, M Multimengen gegeben. 1. N heißt eine Teilmultimenge von M, geschrieben N M wenn - für alle x N folgt x M und - für alle y supp(N) gilt : 0 N(y) M(y) . 2. Zwei Multimengen N, M heißen gleich, wenn N M und M N gilt. 3. N ∪ M heißt Vereinigungsmultimenge von N und M, wenn für alle x supp(N) supp(M) gilt : (N M)(x) : max(N(x), M(x)) . 4. N ∩ M heißt Schnittmultimenge von N und M, wenn für alle x supp(N) supp(M) gilt : (N M)(x) : min(N(x), M(x)) . 5. Sei N M . Dann heißt M\N die (arithmetische) Differenzmultimenge von M und N, gesprochen M ohne N, wenn für alle x supp(M) gilt : (M \ N)(x) M(x) (M N)(x) M(x) min M(x), N(x) . An dieser Stelle soll erwähnt werden, dass die bekannten Regeln aus der Mengenlehre nicht analog übertragen werden können. Beispielhaft sei hier der folgende Satz der Mengenlehre betrachtet: Für 2 Teilmengen A, B einer Menge X gilt: A, B X A \ B B . Dieser Satz gilt i. a. nicht für Multimengen, denn mit den unten definierten Multimengen X, A, B mit: X(a) = A(a) = 2 , X(b) = A(b) = 3 und B(b) = 2 oder in anderer Form X = A = {a, a, b, b, b} und B = {b, b} folgt: 19 A \ B (a) A(a) (A B)(a) A(a) min( A(a),B(a)) 2 min( 2,0 ) 2 A \ B (b) A(b) (A B)(b) A(b) min( A(b),B(b)) 3 min( 3,2 ) 1 . ((A \ B) B) (a) min((A \ B) (a) ,B(a)) min( 2,0) 0 ((A \ B) B) (b) min((A \ B) (b) ,B(b)) min(1, 2) 1 0 oder in anderer Form : A \ B B a, a, b, b, b \ b, b b, b a, a, b b, b b Weitere Details zu Mengen / Multimengen findet man z. B. in [10], [21]. Kommen wir nochmals auf die Darstellung von Multimengen zurück. Analog zur oben angegebenen Darstellung einer Multimenge können auch die Teilmultimengen entsprechend dargestellt werden. Beispiel: Sei M M(A) a, b, b, b, b, c, c, e, e gegeben, dargestellt durch •| • • • •|• • |• • und die Teilmultimenge N a, b, b, b, e M(A) wird dargestellt durch • | • • • || •. Man beachte, dass die Anzahl der Trennstriche bei jeder Teilmultimenge genauso groß ist wie die Anzahl der Trennstriche der zugrundeliegenden Multimenge. Im folgenden Satz wollen wir nun angeben, wie viele Multimengen mit Kardinalität k aus einer vorgegebenen Menge A mit A n konstruiert werden können [9]. Satz 6: Sei die Menge A mit A n gegeben. Betrachten wir nun alle Multimengen N über A mit der Kardinalität N k . Dann ist die Anzahl der Multimengen N mit Kardinalität k gegeben durch: n n k 1 (n k 1) * (n k 2) *...* (n 1) * n . : k k! k Beweis: Zum Beweis nutzen wir die oben definierte Darstellung der Multimenge durch die Zeichenkette mit | • . Jede solche Zeichenkette hat die Länge k + n - 1 (k nicht notwendigerweise verschiedene Elemente aus A, (n – 1) Trennzeichen) und entspricht genau einer der gesuchten Multimengen und umgekehrt. Die Zeichenketten sind einfach zu zählen, denn eine Zeichenkette ist eindeutig durch die Position der k Zeichen • bestimmt. Wie viele Möglichkeiten es gibt, aus den n+k−1 Positionen k auszuwählen liefert Satz 3: 20 k n 1 damit ergibt sich die Anzahl aller Anordnungen zu und das lässt k sich wie folgt umformen: k n 1 n k 1 k k (n k 1)! ((n k 1) k)! k ! (n k 1)! (n 1)! k ! (n k 1) * (n k 2) *...* (n 1) * n * (n 1) *...* 2 * 1 k! (n 1)! (n k 1) * (n k 2) *...* (n 1) * n k! +++ 4 Anordnungen und Auswahlen 4.1 Permutationen Wir betrachten nun unterschiedliche Konfigurationen bei der Anordnung von Elementen einer Menge. Die Anordnungen / Vertauschungen bezeichnet man als Permutationen. Die Bezeichnung leitet sich aus dem lateinischen Wort permutare (deutsch: vertauschen) ab. 4.1.1 Permutationen von unterscheidbaren Elementen Definition Gegeben sei eine Menge A mit n ∈ ℕ (d.h. endlich vielen, paarweise verschiedenen) Elementen. Eine Folge von k paarweise verschiedenen Elementen aus A mit 1 ≤ k ≤ n heißt eine k-Permutation. Satz 7: Sei die Menge A a1 , a2 , a3 , . . . , an 2 , an 1 , an mit n ≥ 1 Elementen gegeben. Dann ist die Anzahl der k-Permutationen auf A gegeben durch P(n,k) n! n * (n 1) * ... * (n (k 2)) * (n (k 1)) (n k)! Beweis: Nach Satz 3 gilt: Die Anzahl der Teilmengen B A , mit genau k Elementen, n n! 1 B k n , ist gleich: k (n k)! k! Nach Satz 2 gilt: 21 Die k ≥ 1 Elemente einer Menge Ak a1 , a2 , a3 , . . . , ak 2 , ak 1 , ak lassen sich auf k ! – Weisen anordnen. Somit folgt für die Anzahl der k-Permutationen: n n! n! P(n,k) Pn , k k! k! (n k)! k! (n k)! k +++ Ein wichtiger Spezialfall einer k-Permutation ist k = n. Definition Sei die Menge A a1 , a2 , a3 , . . . , an 2 , an 1 , an mit n ≥ 1 Elementen gegeben. Eine bijektive Abbildung der Menge A auf sich selbst heißt eine Permutation der Menge A. Bemerkung: Die Permutationen einer Menge A sind also nichts anderes als alle möglichen Anordnungen aller n Elementen aus der Menge A (siehe Satz 2 bzw. 7 oben) und somit die n-Permutation. Satz 8: Sei die Menge A n a1 , a2 , a3 , . . . , an 2 , an 1 , an mit n ≥ 1 Elementen gegeben. Dann ist die Anzahl der Permutationen auf An Pn n! . Beweis: Spezialfall von Satz 7 mit k = n und somit Pn Pn,n n! Bemerkung: Satz 8 ist eine andere Formulierung von Satz 2. 4.1.2 Permutation von teilweise nicht unterscheidbaren Elementen Betrachten wir wieder k-fache (kartesische) Produkt einer Mengen A mit n Elementen A a1 , a2 , a3 , . . . , an also n A A x A x ...x A (a i 1 1 ,a2 , .... , an ) ai A für alle 1 i n . n Faktoren Nehmen wir nun ein spezielles Element a a1 , a2 , a3 , . . . , an heraus, dann gilt: 22 Satz 9: Sei das n-Tupel a a1 , a2 , a3 , . . . , an mit k verschiedenen Elementen 1 ≤ k ≤ n gegeben und sei jedes der k verschiedenen Elemente aj jeweils k mj - mal mit 1 ≤ mj ≤ n und m j 1 j n vorhanden Dann ist die Anzahl der Anordnungen n n! Pm1, m2 , ..., mk : m1 , m2 , ..., mk m1 ! * m2 ! * ... *mk ! Bem. : Für k 2 mit a a1 , a2 und n m1 m2 ergibt sich n n n! n! : m 1 ! * n m 1 m 1 m1 , m 2 m1! * m 2 ! d. i. der bekannte Binomialkoeffizien t. Man beachte, dass die Aussage eine andere ist als die von Satz 3, denn dort geht es um die Anzahl von k-elementigen Teilmengen einer Menge mit n Elementen während hier n-Tupel gezählt werden deren Komponenten genau zwei verschiedene Werte annehmen kann. Beweis: Wir betrachten 2 Fälle: 1. k = n, d. h. alle a1 , … , an sind paarweise verschieden: dann gibt es nach Satz 2 bzw. Satz 8 insgesamt n! verschiedene Anordnungen der n Elemente und es gilt: n! n n! n! n! n! n , n 1 1! 1! ...1! 1, 1, ... ,1 1 1! n mal n mal 2. seien k Elemente ak jeweils mk – mal mit 1 < mk ≤ n vorhanden und gelte k m j 1 j n: dann lassen sich nach Satz 2 für jedes aj , 1 ≤ j ≤ mk , mj! Anordnungen nicht unterscheiden und somit ist die Anzahl der verschiedenen Anordnungen n n! m1 ! * m2 ! * ... *mk ! m1 , m2 , ..., mk +++ 23 4.2 Variationen 4.2.1 Variationen ohne Wiederholung Definition Sei die Menge A a1 , a2 , a3 , . . . , an 2 , an 1 , an mit n ≥ 1 Elementen gegeben. Jedes (geordnete) k- Tupel aus Ak, k ≤ n mit k verschiedenen Elementen aus A heißt eine Variation ohne Wiederholung. Die Anzahl aller Variationen ohne Wiederholung bezeichnen wir mit VO(n,k).. Satz 10: Seien die Menge A a1 , a2 , a3 , . . . , an 2 , an 1 , an gegeben und ein k mit k ≤ n gegeben. Dann gilt: VO (n,k) n! (n k) ! Beweis: Aus Satz 5 ergibt sich: VO (n,k) Vk* Bemerkung: Es gilt: n! (n k) ! VO (n,k) P(n,k) 4.2.2 Variationen mit Wiederholung Definition Sei die Menge A a1 , a2 , a3 , . . . , an 2 , an 1 , an mit n ≥ 1 Elementen gegeben. Jedes (geordnete) k-Tupel aus Ak (also auch die k-Tupel in denen nicht nur verschiedenen Elementen aus A vorkommen) heißt eine Variation mit Wiederholung. Die Anzahl aller Variationen mit Wiederholung bezeichnen wir mit VM(n,k). Satz 11: Seien die Menge A a1 , a2 , a3 , . . . , an 2 , an 1 , an und ein k gegeben. k Dann gilt: VM (n,k) n Beweis: Aus Satz 4 ergibt sich: VM (n,k) Vk nk 24 4.3 Kombinationen Definition Sei die Menge A a1 , a2 , a3 , . . . , an 2 , an 1 , an mit n ≥ 1 Elementen gegeben. Eine Multimenge K über A k-Kombination von A. K k mit 1 ≤ k ≤ n heißt eine 4.3.1 Kombinationen ohne Wiederholung Definition Gegeben sei nun eine Menge A a1 , a2 , a3 , . . . , an 2 , an 1 , an mit n ≥ 1 Elementen und K eine Teilmenge von A, K A , K k n mit k (paarweise verschiedenen) Elementen. Dann heißt K eine k-Kombination ohne Wiederholung. Satz 12: Sei die Menge A n a1 , a2 , a3 , . . . , an 2 , an 1 , an mit n ≥ 1 Elementen gegeben. Dann ist die Anzahl der k Kombinationen ohne Wiederholung auf n An gleich K O (n,k) . k Beweis: Satz 3 4.3.2 Kombinationen mit Wiederholung Definition Gegeben sei nun eine Menge A a1 , a2 , a3 , . . . , an 2 , an 1 , an mit n ≥ 1 Elementen und K eine Multimenge über A mit K k also mit k Elementen. Dann heißt K eine k-Kombination mit Wiederholung. Satz 13: Sei nun eine Menge A a1 , a2 , a3 , . . . , an 2 , an 1 , an mit n ≥ 1 Elementen und K die Multimengen über A mit K k Elementen, k ≤ n gegeben. Dann ist die Anzahl der k Kombination mit Wiederholung auf A n n n k 1 . k gleich KM (n,k) k Beweis: Satz 6 25 4.4 Zusammenfassung Eine grafische Übersicht über die Berechnung der Anzahl von den unterschiedlichen Anordnungen wird unten dargestellt. Die Darstellung ist auch ein Entscheidungsbaum zur Auswahl der geeigneten Methode für die Lösung einfacher, kombinatorischer Aufgaben. Übersicht von möglichen Anordnungen der Elemente von Mengen / Teilmengen sowie Multi- / Teilmultimengen 26 Zusammenfassend hier noch einige Interpretationen der kombinatorischen Elemente in die Mengenlehre bzw. der Lehre der Multimengen und in der Statistik: Mengen- / Multimengenlehre Kombinatorik Anzahl der Anordnung / Reihung von Elementen einer Permutationen - Menge - ohne Wiederholung - Multimenge - mit Wiederholung Statistik Variationen Geordnete Stichprobe - Anzahl der k- Tupel aus A* mit verschiedenen Elementen - ohne Wiederholung - ohne Zurücklegen - Anzahl der k-Tupel aus Ak mit nicht notwendigerweise verschiedenen Elementen - mit Wiederholung - mit Zurücklegen Kombinationen Ungeordnete Stichprobe - ohne Wiederholung - ohne Zurücklegen - mit Wiederholung - mit Zurücklegen Mengenprodukt Anzahl von Teilmengen / Teilmultimengen - Teilmengen gleicher Mächtigkeit - Teilmultimengen gleicher Mächtigkeit Gegenüberstellung der definierten kombinatorischen Begriffe und äquivalenter Begriffe aus der Lehre von den Mengen/Multimengen bzw. der Statistik 27 4.5 Anwendungen und Beispiele Klassisch sind die Beispiele in denen Kugeln aus einer Urne verdeckt gezogen werden. Genauer gesagt betrachtet man eine Anzahl von n > 0 Kugeln, die in einer (undurchsichtigen) Urne liegen, und aus der dann k Kugeln, 1 ≤ k ≤ n zufällig („verdeckt“) entnommen (Ziehungen) werden. Die unterschiedlichen Modelle erhält man durch festlegen von Eigenschaften der Kugeln und durch das Vorgehen beim Ziehen wie beispielsweise - - Kugeln unterscheidbar / teilweise unterscheidbar / nicht unterscheidbar, z. B. Durchnummerierung aller Kugeln, mehrere Gruppen von unterschiedlich eingefärbten, nicht nummerierten Kugeln usw. Anzahl der entnommenen Kugeln, nach der Ziehung wieder in die Urne zurücklegen / nicht zurücklegen. Hier sollen aber auch andere Beispiele „aus dem richtigen Leben“ vorgestellt werden. 1.1. Drehtür 10 Damen und 5 Herren möchten nacheinander durch eine Drehtür gehen. Auf wie viele Arten können sie dies tun, wenn die Damen zuerst und danach die Herren hindurch gehen? Offensichtlich kommen hier 2 von einander unabhängige Permutationen ohne Wiederholung vor: - Anzahl der möglichen Reihenfolgen der Damen und - Anzahl der möglichen Reihenfolgen der Herren. Damit ergibt sich: P10 10! 3.628.800 P5 5! 120 und somit ingesam t P10 * P5 10! * 5! 435.456.000 1.2. Zahlen -konstruktion Wie viele verschiedene zehnstellige Zahlen gibt es, die zweimal die 1, dreimal die 2 und einmal die 5 und viermal die 9 enthalten? Dies ist offensichtlich ein Problem von „Permutation von teilweise nicht unterscheidbaren Elementen“, also Permutation mit Wiederholung und somit ergibt sich die Lösung zu 10 10! 3.628.800 12.600 2, 3, 1, 4 2! * 3! * 1! * 4! 2 * 6 * 1 * 24 2.1. Die Top 3: Bei einem Sportfest nehmen 10 Läufer teil. Nur die ersten 3 Läufer erhalten je eine Medaille (Gold, Silber, Bronze). Auf wie viele verschiedene Arten können sich die "Top 3" zusammensetzen? 28 Das entspricht folgendem Urnenproblem: In einer Urne befinden sich 10 durchnummerierte (mithin unterscheidbare) Kugeln. Es sollen drei Kugeln ohne Zurücklegen und unter Beachtung der Reihenfolge gezogen werden. Wie viele Möglichkeiten gibt es? Dies Problem ist offensichtlich eine Variation ohne Wiederholung und somit gilt: VO (10,3) 10 ! 10 ! 720 (10 3) ! 7! 2.2. Toto – Bei der TOTO Ergebniswette, auch 13er-Wette genannt, wird die Fußball-Wette der Ausgang von 13 Fußballspielen getippt. Je Spielpaarung (Verein1 : Verein2) sind drei verschiedene Ergebnisse des Spielausgangs möglich: 1 = Sieg des erstgenannten Vereins, 0 = Unentschieden, 2 = Sieg des zweitgenannten Vereins. Wie viele „zufällige“ Tipps sind möglich? Das entspricht folgendem Urnenproblem: In einer Urne befinden sich 3 verschiedenfarbige Kugeln. Es sollen 13 Kugeln mit Zurücklegen und unter Beachtung der Reihenfolge gezogen werden. Wie viele Möglichkeiten gibt es? Das ist aber eine Variation mit Wiederholung und mithin ergibt sich die Lösung zu: VM (3,13) 313 1.594.323 2.3. Geburtstage in einer Familie Betrachten wir nun eine Familie mit 4 Mitgliedern. Nehmen wir nun an, dass alle Mitglieder an verschiedenen Tagen des Jahres – mit 365 Tagen – Geburtstag haben. Wie viele Geburtstagskalender sind möglich? Das entspricht dem Urnenmodell von 2.1, oben und somit liegt eine Variation ohne Wiederholung vor und es gilt: 365 ! 365 ! VO (365,4) 17.458.601.160 (365 4) ! 361 ! Lassen wir nun auch die Möglichkeit zu, dass Geburtstage auch auf den gleichen Tag des Jahres fallen dürfen – wieder mit 365 Tagen. Wie viele Geburtstagskalender sind dann möglich? Damit ist Lösung gegeben durch Variation mit Wiederholung und mithin ergibt sich die Lösung zu: VM (365,4) 3654 17.748.900.625 und es ergibt sich kein großer Unterschied (Faktor 0.9836…). 29 Betrachten wir aber statt 4 nun10 Familienmitglieder ergibt sich aber schon: VO (365,10) 3,7060803910505 * 1025 vs. VM (365,10) 36510 4,1969002243199 * 1025 und damit ergibt sich bei 10 Familienmitgliedern ein Verhältnis von VO (365,10) / VM(365,10) 0,88305 und schließlich für bei einer Familie mit 23 Mitgliedern VO (365,23) 4,2200819302092 1058 und VM (365,23) 36523 8,565167935315 * 1058 ergibt sich ein Verhältnis von 0,4927… also ein Wert kleiner als 0,5. Auf die Interpretation kommen wir im nächsten Abschnitt noch zurück. 2.4 ein ungewöhn- 2 Spieler (S1, S2) würfeln: S1 mit 3, S2 mit 2 Würfeln. liches Würfelspiel Würfelt nun S1 eine höhere maximale Augenzahl als S2, so zahlt S2 an S1 1€, andernfalls zahlt S1 an S2 1€. Ist das ein faires Spiel in dem Sinne, dass es genauso viele Würfelergebnisse „S1 hat eine höhere maximale Augenzahl als S2“ wie „S1 hat eine kleinere oder gleiche maximale Augenzahl als S2“? 1. die Anzahl aller möglichen Ergebnisse ergibt sich aus zwei Variationen mit Wiederholung und wird dargestellt als A 1, 2, 3, 4, 5, 6 A3 A2 a ,a ,a , a ,a 1 2 3 4 5 für alle 1 i 5 gelte 1 ai 6 Dabei definieren wir ( a1 ,a2 ,a3 ) des Ergebnis eines Wurfes von S1 und a4 ,a5 des Ergebnis eines Wurfes von S2. Die Mächtigkeit von Ω ergibt sich zu A3 A2 A3 * A2 63 * 62 65 7776 2. „S1 gewinnt“ wird wie folgt beschrieben a ,a ,a , a ,a max a ,a ,a max a ,a a ,a ,a max a ,a ,a i a ,a max a ,a j S1 1 2 3 4 1 2 5 3 1 1 2 4 5 1 j i 6 4 und mit 30 5 2 3 3 4 5 a ,a ,a max a ,a ,a j a ,a max a ,a j S1 i 1 2 S1 4 5 3 1 4 2 3 i 5 ergibt sich S1 i j S1 1 j i 6 S1 und daher ist S1 i S1 1 j i 6 S1 j 3. Abzählen liefert für: S1 i a1 ,a2 ,a3 max a1 ,a2 ,a3 i 1. Stelle : 1... i , 2. Stelle : 1... i, 3.Stelle : i i2 Elemente 3.Stelle : 1... (i 1) 1. Stelle : 1... i , 2. Stelle : i, i*(i 1) Elemente 2. Stelle : 1... (i 1), 3.Stelle : 1... (i 1) 1. Stelle : i , (i 1) Elemente 2 und somit S1 i2 i*(i 1) (i 1)2 3 i2 3 i 1 S1 j a 4 ,a5 max a 4 ,a5 j 1. Stelle : 1... j , 2. Stelle : 1 j Elemente 1. Stelle : j , 2. Stelle : j 1 ( j 1) Elemente und somit S1 j ( j 1) 2 j 1 4. Damit ergibt sich S1 3 i 2 2 j 1 3i1 1 j i 6 S1 3667 und somit aus 7776 und S2 S1 7776 3667 4109 Das ist doch ein eher überraschendes Ergebnis, dass der Spieler mit 3 Würfeln weniger erfolgreich ist als der mit 2 31 Würfeln. Das liegt aber daran, dass die Bedingung aus Sicht von S2 auch die Bedingung gleiche und maximale Augenzahl umfasst. Ändert man die Bedingung so, dass nur gezahlt wird, wenn einer der Spieler eine größere Zahlensumme wirft und dass im Fall die maximal gewürfelte Zahl von beiden Spielern gleich ist keine Zahlung erfolgt, gilt nach analoger Rechnung # von oben: S2 2183 S1 . 2.5 Paradoxon von de Méré 2 Spieler (S1, S2) würfeln und dieses Mal beide mit 3 Würfeln. Die Augenzahlen der 3 Würfel werden addiert: Der eine Spieler gewinnt bei Summe 11, der andere bei Summe 12. Wer gewinnt öfter? Der französische Schriftsteller Chevalier von de Méré (geboren 1607 in Poitou, gestorben 29. Dezember 1684) war auch ein Spieler. Er berechnete die gleiche Gewinnwahrscheinlichkeit für das oben beschriebene Spiel, nämlich basierend auf die additiven Zerlegungen von 11 und 12 durch die Zahlen 1 – 6: 11 = 6 + 4 + 1 = 6 + 3 + 2 =5+5+1=5+4+2=5+3+3 =4+4+3 12 = 6 + 5 + 1 = 6 + 4 + 2 = 6 + 3 + 3 =5+5+2=5+4+3 =4+4+4 Es gibt also gleichviele additive Zerlegungen, nämlich jeweils 6. Nun stellte er aber nach der Analyse vieler Spiele fest, dass die Würfelsumme 11 häufiger vorkam als die Würfelsumme 12. Daher fragte er Blaise Pascal (geboren 19. Juni 1623 in Clermont-Ferrand, gestorben 19. August 1662 in Paris) nach einer Erklärung und Pascal konnte dieses scheinbare Paradoxon aufklären. Wesentlich ist nicht nur, dass die Summe 11 bzw. 12 ergibt, sondern auch die möglichen Reihenfolgen der Summanden, d. h. es sind Variationen mit Wiederholung und nicht Kombinationen mit Wiederholungen zu betrachten. Nachzählen liefert 27 verschiedene Tripel für Summe 11, hingegen nur 25 Tripel für Summe 12. A 1, 2, 3, 4, 5, 6 A3 a ,a 1 2 ,a3 für alle 1 i 3 gelte 1 ai 6 63 216 mit a ,a ,a a ,a ,a 12 1 1 2 3 a1 a2 a3 11 und 1 27 2 1 2 3 a1 a2 a3 und 2 25 und damit P 1 27 25 0,125 0,116 P 2 216 216 1 somit ein Unterschied von 0,00925 . 108 32 3.1 Lottoziehung: Aus 49 Kugeln werden 6 + 1 Kugeln zufällig gezogen, d. i. 6 + eine Zusatzzahl. Wie viele Tipps gibt es? Die ersten 6 werden ohne zurücklegen gezogen und die Reihenfolge ist beliebig, damit ist dies eine 49 K O 49,6 13.983.816 6 Die Zusatzzahl muss aus den verbleibenden 43 Kugeln 43 gezogen werden. Also K O 43,1 43 . Zu jeder 1 Kombination der ersten 6 Zahlen gibt es 43 mögliche Zusatzzahlen und somit ergeben sich 13.983.816 * 43 601.304.088 mögliche Tipps. 3.2 Urne mit Kugeln in 2 Farben In einer Urne seien k Kugeln mit k > 2, davon sind l weiß und k-l schwarz, und l < k. Aus der Urne sollen nun t Kugeln, t ≤ k, gezogen werden ohne sie wieder zurückzulegen. Wie viele Ziehungen von t Kugeln gibt es mit genau s weißen und l-s schwarzen Kugeln, 0 ≤ s ≤ l? Formalisieren wir als erstes die Aufgabenstellung. Repräsentiere die Urne die Multimenge U mit den Elementen ws und sw, sowie die Multimenge T die Stichprobe. A sw, ws , U sw, ..... , sw, ws,....,ws , mit U k kl l T sw, ..... , sw, ws,....,ws mit T t . ts s Es ist nun zu berechnen, wie viele t-Tupel existieren mit 0 < t ≤ k und genau s weißen Elementen 0 ≤ s ≤ l Nach Satz 9 gibt es l l! (l s)! * s! s l - Tupel mit s weißen Elementen und analog ergibt sich k l (k l) ! (k-l) - Tupel mit (t–s) (k l) ! * (t s)! t s schwarzen Elementen 33 da jedem der l-Tupel weißer Elemente alle Tupel schwarzer Elemente zuzuordnen sind ergeben sich insgesamt damit also l k l * - Ziehungen s t s 3.3. Nimm 4, zahle 3 In einem Supermarkt werden 5 verschiedene Obstsorten angeboten: Apfel, Birnen, Orangen, Bananen, Marillen. Das Angebot lautet: „Nimm 4, zahle die 3 günstigsten“, wobei beliebig d.h. alle Obstsorten auch mehrfach, ausgewählt werden können. Wir setzen voraus, dass ausreichend viel Obst vorhanden ist um den Bedarf abzudecken. Wie viele verschiedene mögliche 4er Zusammenstellungen gibt es? Damit ergibt sich die Menge A Apf, Bir, Ora, Ban, Mar Dazu betrachten wir die minimal erforderliche Multimenge für das Angebot Apf, Apf, Apf, Apf, Bir, Bir, Bir, Bir, Ora, Ora, Ora, Ora, Ban, Ban, Ban, Ban, Mar, Mar, Mar, Mar und dass können wir als Urne mit 20 Kugeln und 5 verschiedenen Gruppen von je 4 nicht unterscheidbaren Kugeln interpretieren, z. B. je 4 Kugeln haben eine Farbe, die Kugeln einer Gruppe tragen dieselbe Farbe. Es liegt also eine 4vor und somit gilt: 5 5 4 1 8 8! KM (5,4) 70 4 4 4! * 4! 4 Es ergeben sich mithin 70 verschiedene Kombinationen mit Wiederholung der Obstsorten. 34 5. Endliche Wahrscheinlichkeitsräume 5.1 Klassische Definition der Wahrscheinlichkeit Wir betrachten eine nicht leere Menge die endlich viele Elemente hat. Dies ist erst mal sehr allgemein und abstrakt, aber wir können die Elemente von z. B. als alle möglichen Versuchsausgänge eines Experiments interpretieren. Die Teilmengen von Ω heißen Ereignisse. Die Menge aller Ereignisse ist also die Potenzmenge von Ω, bezeichnet als = () { A A } . Einige Ereignisse werden speziell benannt: A) Elementarereignis : B) sicheres Ereignis : { } mit C) unmögliches Ereignis : Da wir die Menge = { A A } betrachten gilt: 1) ist ein Ereignis 2) Ist A ein Ereignis, so ist auch die Komplementär menge A C : \ A ein Ereignis 3) Sind A, B Ereignisse, so ist A B ein Ereignis Auf der Menge wird nun eine Abbildung P definiert mit P: → [0,1]. P heißt Wahrscheinlichkeitsmaß (W-Maß), wenn folgende Bedingungen erfüllt sind: 4) P() 0 P() 1 5) Sind A1 , A 2 disjunkte Ereignisse d. h. A1 , A 2 und A1 A 2 dann gilt: P(A1 A 2 ) P(A1 ) P(A 2 ) Als Folgerungen daraus ergeben sich: 1) Sind A, B Ereignisse, so ist auch A B ein Ereignis weil A B (A C BC )C nach der De Morganschen Regel und 2) und 3) gemäß der Definition oben gelten 35 2 ) P(A) 0 für alle Ereignisse A da P per Definition eine Abbildung auf 0,1 ist 3) für ein Ereignis A gilt : P(A) 1 P(A C ) weil folgende Zusammenhänge per Definition gelten : A A C , A A C , P() 1 und mithin P(A) P(A C ) P(A A C ) P( ) 1 gilt 4) aus A B folgt P(A) P(B) denn aus A B folgt, dass eine Menge A * ( ) existiert mit A A B mit A A und somit * * P(A) P(A * ) P(B) und damit P(A) P(B) da P(A * ) 0 Betrachten wir zu dem Wahrscheinlichkeitsmaß ein einfaches Beispiel: In einer Urne liegen 3 weiße und 2 rote Kugeln. Aus der Urne wird nun eine Kugel gezogen. Formalisiert heißt das: Ω = {ω1, ω2, ω3, ω4, ω5} mit {ω1}, {ω2}, {ω3} die Elementarereignisse „ziehen der j-ten, weißen Kugel“, j = 1, 2, 3 und {ω4}, {ω5} die Elementarereignisse „ziehen der k-ten, roten Kugel “ k = 4, 5 sind. Wir betrachten zwei Wahrscheinlichkeitsmaße: 1. Jede Kugel wird mit gleicher Wahrscheinlichkeit gezogen, d. i. P1({ωi}) = 1/5, i = 1, 2, 3, 4, 5 . Die Wahrscheinlichkeit irgendeine rote Kugel zu ziehen ist mithin: P1({ω4}) + P1({ω5}) = 1/5 + 1/5 = 2/5 = 0,4 . 2. Jede rote Kugel wird mit einer Wahrscheinlichkeit von P 2({ωi}) = 1/4 , i = 4, 5 , jede weiße Kugel wird mit einer Wahrscheinlichkeit von P 2({ωi}) = 1/6 , i = 1, 2, 3 gezogen. Die Wahrscheinlichkeit eine rote Kugel zu ziehen ist mithin: P2({ω4}) + P2({ω5}) = 1/4 + 1/4 = 2/4 = 0,5 . Auf einer Menge aller Ereignisse können also verschiedene Wahrscheinlichkeitsmaße definiert werden – z. B. basierend auf unterschiedlichen Modellen. Welches Modell nun der „Realität“ entspricht muss aus den Gegebenheiten abgeleitet werden. Im weiteren betrachten wir nur Gleichverteilungen. Die Grundidee der Gleichverteilung ist, dass es kein „Vorzugselementarereignis“ gibt. Im oberen Beispiel entspricht das der 1. Versuchsanordnung, d. h. dass es beim Ziehen keine „Vorzugskugeln“ gibt. 36 Definition: Das Maß |A| jeder Teilmenge A ist definiert als Anzahl der Elemente von A. Bei der Gleichverteilung ist die Wahrscheinlichkeit aller Ereignisse A definiert durch: P: → [0,1] mit P(A) A , |Ω| endlich. Bemerkung: Für jedes Elementarereignis gilt mithin bei der Gleichverteilung 1 . P() : P() Als Beispiel kommen wir nun auch noch zu dem weiter oben gegebenen Beispiel 2.3. Geburtstage in der Familie zurück. Dort war die Fragestellung nach „Familienmitgliedern, die an verschiedenen Tagen des Jahres – mit 365 Tagen – Geburtstag haben“. Zur Lösung formulieren wir die Aufgabe um, hin zur Frage, wie hoch die Wahrscheinlichkeit ist, dass in einer Gruppe von n Menschen mindestens zwei am selben Tag des Jahres Geburtstag haben – wobei wir Schaltjahre nicht zulassen und voraussetzen, dass die Wahrscheinlichkeit Geburtatsg zu haben für alle Tage gleich groß ist. Nach den Überlegungen oben ergibt sich die Lösung aus der Gegenwahrscheinlichkeit P A 1 P A zum oben bereits erarbeiteten Ergebnis: P( A) A 1 A 365 ! 1 VO (365,n) (365 n) ! 1 VM (365,n) 365n 1 365 ! 365 * (365 n) ! 1 1 1 n 365 * 364 * 363 * ... * 365 n 1 365n 365 * 364 * 363 * ... * 365 n 1 365 * 365 * 365 * ... * 365 n 1 k (365 k) 1 365 k 1 n 1 1 365 k 1 37 Daraus ergibt sich folgende Tabelle: Anzahl der Personen, n 2 5 10 15 20 21 22 23 … 40 41 P(n) 0,00273973 0,02713557 0,11694818 0,25290132 0,41143838 0,44368834 0,47569531 0,50729723 … 0,89123181 0,90315161 … 0,98909064 0,99086158 … … Anzahl der Mitglieder einer Gruppe von n Menschen von denen mindestens 2 am selben Tag des Jahres Geburtstag haben Wahrscheinlichkeit P(n), dass von n Mitglieder einer Gruppe von Menschen mindestens 2 am selben Tag des Jahres Geburtstag haben Man braucht mithin nicht 183 Personen (183 ≈ 365/2) – wie man vielleicht intuitiv denken könnte - sondern wesentlich weniger, nämlich 23 Personen. Ab 41 Personen liegt man schon bei einer Wahrscheinlichkeit von größer als 90%, ab sogar größer als . 38 Betrachten wir noch eine andere Variante des Geburtstagsproblems. Wählen wir eine bestimmte Person aus einer Gruppe von (n+1)-Personen aus und beantworten nun die Frage, wie groß die Wahrscheinlichkeit dafür ist , dass eine zweite Person aus der restlichen Gruppe am gleichen Tag des Jahres Geburtstag hat wie die ausgewählte. Die Wahrscheinlichkeit, dass eine Person an einem der andere Tag als die ausgewählte Geburtstag hat, also an einem der verbleibenden 364 Tagen, ist mithin: P b 364 365 1 1 1 365 365 365 Die Wahrscheinlichkeit, dass n Personen an einem anderen Tag Geburtstag haben als die ausgewählte ergibt sich, basierend auf der Variation mit Wiederholungen, zu: P B VM 364,n VM 365,n n n n 364n 364 1 365 1 1 n 365 365 365 365 Damit berechnet sich die Wahrscheinlichkeit, dass mindestens eine weitere Person an dem gleichen Tag wie die ausgewählte Geburtstag hat, zu: n n 1 1 P B 1 P(B) 1 1 1 1 365 365 i 1 Die Darstellung analog obigem Beispiel zeigt folgendes Bild: Wahrscheinlichkeit P(n), dass von n+1 Mitglieder einer Gruppe von Menschen, nach Auswahl eines Mitglieds, mindestens ein 2-tes am selben Tag des Jahres Geburtstag hat 39 Da die Aufgabenstellungen sehr ähnlich klingen, aber höchst unterschiedliche Ergebnisse liefern, spricht man vom „Geburtstagsparadoxon“. Aber die scheinbar widersprüchlichen Ergebnisse lassen sich durch der obigen Rechnungen erklären – es sind schlichtweg höchst unterschiedliche Aufgaben, die gelöst wurden. 5.2 Zufallsgrößen Definieren wir nun auf der Menge Ω eine Zufallsvariable als eine Funktion1, die jedem Elementarereignis aus der Menge aller Ereignisse eine reelle Zahl zuordnet. Allerdings lässt sich diese erste Formulierung nicht verallgemeinern. Wir kehren daher die Definition sozusagen um, indem wir zu jedem Ereignis das Urbild ermitteln und verlangen, dass diese Urbildmenge selbst ein Ereignis ist: Mit den oben definierten Methoden wollen wir nun weiter arbeiten. Schauen wir uns das Würfeln mit zwei 6 seitigen Würfeln an und betrachten als Ergebnis eines Wurfes die Summe der Augenzahlen. Abstrakt gesprochen wird dabei einem Ereignis (hier die geworfenen Augenzahlen der beiden Würfel) über eine Funktion - hier die Addition - eine reelle Zahl (der Summenwert) zugeordnet. Im Allgemeinen interessieren wir uns nicht für ein einzelnes Ereignis (z. B. Augenzahl) selbst, sondern für Kennzahlen (A) aller Ereignisse A, d.h. wir betrachten die Abbildung : A (A) = A‘ . Konkret heisst das hier: Ω = { (i, j) │ 1 ≤ i , j ≤ 6 } = () { A A } und für alle A gelte: P(A) A : ((i, j)) = i + j mit (Ω) = Ω‘ = { 2, 3, … , 12 } Damit wird nun auch eine Wahrscheinlichkeit P auf A´ definiert: A‘ = {10, 11, 12} erzeugt, indem man für alle P (A‘) = P(-1(A‘)) : -1(A‘) = {(4,6),(5,5), (6,4), (5,6), (6,5), (6,6)} 1( ) 1( ') (i, j) 1 i, j 6 -1 P( (A‘)) = 1(A ') 1 ( ) 1 6 1 36 6 Die begriffliche Schwierigkeit hier ist, dass die Zufallsvariable als Funktion definiert wird. Die Zufallsvariable darf nicht mit einer Variablen, also dem Argument einer Funktion, verwechselt werden. 40 Definition: Eine Zufallsvariable ist jede Funktion von Ω auf die Menge der reellen Zahlen, wobei das Urbild jeder messbaren Teilmenge der reellen Zahlen A‘ ein Ereignis in Ω ist, d. h.: : und für alle messbaren A ' 1 (A') gilt : ( ) Bemerkung: Eine Teilmenge der reellen Zahlen heißt messbar, wenn sie nicht zu groß und zu stark „zersplittert“ ist. Präzise können wir das hier nicht definieren, aber im Folgenden werden wir nur „gutmütige“ Mengen betrachten, d.h. Mengen, die auch tatsächlich messbar sind. Die bisherigen Betrachtungen beziehen sich auf das Wahrscheinlichkeitsmaß P definiert als P(A) A (Gleichverteilung s. o.). Diese Definition wird nun erweitert für eine Zufallsvariable . Definition: Ein Wahrscheinlichkeitsmaß von , P , ist definiert für alle messbaren A' mit 1( A ' ) () als: P (A‘) = P(-1(A‘)) Bemerkung: Folgende abkürzende Schreibweise werden wir im weiteren verwenden: P( A ') : P(1( A ' )) Weitere wichtige Definitionen sind die der Verteilungsfunktion und des Erwartungswertes. Die Verteilungsfunktion gibt an, wie sich die Wahrscheinlichkeiten auf die möglichen Werte einer Zufallsvariable verteilen. Genauer wird sie wie folgt definiert: Definition: Die Verteilungsfunktion F der Zufallsvariablen , ist definiert durch F : 0,1 F (x) P ( ( ,x) ) P( 1( ,x) ) P( () x ) : P( x ) 41 Schließlich wird noch eine weitere Eigenschaft der Zufallsvariablen definiert: Definition: Ist eine Zufallsvariable, die die Werte x = r 1, … , rn mit den jeweiligen Wahrscheinlichkeiten P( = ri) annimmt, so ist der Erwartungswert der Zufallsvariablen durch n E() ri P( ri ) i1 definiert, falls die Summe existiert, d.h. nicht unendlich ist. Anschaulich gesprochen beschreibt der Erwartungswert einer Zufallsvariable die Summe der gewichtete Mittel aller Werte der Zufallsvariablen, wobei mit der zugehörigen Wahrscheinlichkeit des Auftretens des Ereignisses gewichtet wird. 5.3 Baumdiagramme Wahrscheinlichkeiten von Ereignissen mit endlichen Elementarereignissen können in vielen Fällen mit Hilfe von kombinatorischen Methoden bestimmt werden. Einfache derartige Aufgaben, d.h. Aufgaben mit wenigen (≤ 5) Elementarereignissen, und wenigen Schritten (≤ 5) können sogar mit Hilfe eines grafischen Verfahrens gelöst werden. Der Vorteil dieser Methode ist, dass die Lösung sich einfach, schnell und anschaulich ermittelt lässt und ohne längliche Berechnungen auskommt. Weiter ist damit auch keine Kenntnis der zugrunde liegenden Verteilung notwendig. Dazu zählt beispielsweise ziehen von Kugeln aus einer Urne mit verschiedenen Bedingungen wie beispielsweise nummeriert - nicht nummeriert, mit mehreren Gruppen von unterschiedlich gefärbte Kugeln, sowie unterschiedlichen Ziehungsmethoden wie ziehen einer Kugel und dann mit / ohne zurücklegen der gezogenen Kugel in die Urne. Zur Ermittlung der Wahrscheinlichkeiten werden in einem Baumdiagram die Ausgänge eines Zufallsexperiments als Linien, Pfade genannt, dargestellt und die entsprechenden Wahrscheinlichkeiten an dem zugehörigen Pfad notiert. Hintereinanderliegende Pfade nennen wir Zweige. Dazu zwei Beispiele: In einer Urne liegen 10 Kugeln, davon sind 2 weiß, 3 grün, 5 schwarz. Wie hoch ist die Wahrscheinlichkeit nach 3 Zügen 3 verschiedenfarbige Kugeln zu ziehen. Die Wahrscheinlichkeit gezogen zu werden ist für alle Kugeln gleich. 1. Die Kugeln werden nach dem Ziehen nicht wieder zurückgelegt, 2. Die Kugeln werden nach dem Ziehen wieder zurückgelegt. Es ergeben sich zwei unterschiedliche Bäume, die unten schrittweise entwickelt werden. In diesem Fall entwickeln sich die „Bäume“ nicht wie gewohnt von unten nach oben, sondern von „links“ nach „rechts“ – trotzdem werden wir weiter von Bäumen sprechen. Wir haben diese Darstellung gewählt, da so die Unterschiede in den Entwicklungsschritten deutlich werden. 42 Die Kugeln werden nach dem Ziehen nicht wieder zurückgelegt Die Kugeln werden nach dem Ziehen wieder zurückgelegt 43 Als Regeln sind zu beachten: 1. entlang eines Zweiges sind die Wahrscheinlichkeiten der Pfade zu multiplizieren: 1. Kugel ws und 2. Kugel ws und 3. Kugel gr 2. vertikal können die Wahrscheinlichkeiten nur innerhalb einer Gruppe (gehören also zu einem Ereignis) addiert werden und müssen immer 1 ergeben, wenn über alle Pfade der Gruppe addiert wird. Der Punkt in dem die Pfade zusammenlaufen wird Knoten genannt Nach der ws Kugel wird entweder eine sw Kugel oder eine ws Kugel oder eine gr Kugel gezogen Verifizieren wir die Ergebnisse mit Hilfe der oben entwickelten Methoden. Dazu betrachten wir die beiden Fälle nacheinander: 1. Die Kugeln werden nach dem Ziehen nicht wieder zurückgelegt Betrachten wir dazu die Grundmenge M# , die die Urne repräsentiert M# ws1, ws2, gr1, gr2, gr3, sw1, sw2, sw3, sw4, sw5 A (M# ) A 3 , da es nicht auf die Reihenfolge der gezogenen Kugeln ankommt, also eine Kombination ohne Wiederholung (= ungeordnete Stichprobe ohne Zurücklegen) vorliegt. Nach Satz 12 ergibt sich: n 10 10! 10 *9 *8 120 3*2 k 3 3! 7! 44 Für jede Menge definieren eine Funktion P die die Wahrscheinlichkeit für das Eintreten von definiert (s. o.): P( ) . Nun betrachten wir die Menge (es kommt nicht darauf an, bei welcher Ziehung eine ws-, gr-, sw-Kugel gezogen wird) und B ws, gr , sw mit ws ws1, ws2, gr gr1, gr2, gr3, sw sw1, sw2, sw3, sw4, sw5 Damit ergibt sich 2 * 3 * 5 30 und damit: P() 30 1 0,25 120 4 2. Die Kugeln werden nach dem Ziehen wieder zurückgelegt Betrachten wir dazu die Grundmenge M# , die die Urne repräsentiert M# ws1, ws2, gr1, gr2, gr3, sw1, sw2, sw3, sw4, sw5 3 M# M# x M# x M# (mi ,m j ,mk ) mi ,m j ,mk M# , da nach dem i1 ziehen die Kugel wieder zurückgelegt werden und somit eine Variation mit Wiederholung (= geordnete Stichprobe mit zurücklegen) vorliegt. und somit gilt gemäß Satz 11 für die Anzahl der Elemente von Ω: M# x M# x M# M# 3 103 1000 Betrachten wird nun eine Menge und definieren für alle A: P( ) . Nun betrachten wir die Menge und ws, gr , sw , gr , ws, sw , sw , gr , ws , ws, sw , gr , sw , ws, gr , gr , sw , ws mit ws ws1, ws2, gr gr1, gr2, gr3 , sw sw1, sw2, sw3, sw4, sw5 45 Damit ergeben sich (2 * 3 * 5) Tupel der Form (ws, gr, sw) sowie 3! Vertauschungen der Komponenten und somit: (2 * 3 * 5) * 3! 30 * 6 180 und damit: P() 180 0,18 1000 6. Diskrete Verteilungen In diesem Kapitel definieren und untersuchen wir einige Verteilungsfunktionen F der Zufallsvariablen , die sich aus den oben erläuterten kombinatorischen Ansätzen bezüglich Anordnungen und Auswahlen ergeben. 6.1 Gleich-Verteilung Gemäß 5.1 ist ein Wahrscheinlichkeitsmaß P für alle Mengen A , |Ω| = n endlich definiert als P(A) A und definieren zusätzlich die Abbildung : A = A Mit gl n(i) i n 1 mit 1 i n ergibt sich: n Definition: Die (konstante) Folge gl n(1),gl n(2), ... , gl n(n) heißt Gleichverteilung. Für die Verteilungsfunktion gilt: F : 0,1 F (x) P ( ( ,x) ) P( 1 ( ,x) ) P () x P A * A * x 46 für x 1 0 * x A F (x) 1 für x mit 1 x und x max k k x für x mit x Der Erwartungswert ergibt sich zu E() n r i1 i n P( ri ) 1 i n i1 1 n n 1 n n i i1 1 n (n 1) 2 1 2 Gleichverteilung für P(i) = 0,1 für 1 ≤ i ≤ 10 und zugehörige Verteilungsfunktion: Der Erwartungswert ergibt sich zu E() n r i1 10 i P( ri ) 1 i 10 i1 1 10 10 i i1 1 1 10 (10 1) 10 2 5,5 Am Ergebnis erkennt man, dass der Erwartungswert nicht notwendigerweise der Wahrscheinlichkeit eines Ereignisses entsprechen muss, bzw. es muss nicht ein Ereignis existieren, dem genau der Erwartungswert als Wahrscheinlichkeit zugeordnet ist. 47 Eine praktische Anwendung der Gleichverteilung ist die Wartezeit an einer Bus Haltestelle. Nehmen wir dazu an, dass ein Bus gemäß Fahrplan im 10-min-Takt fährt und eine Haltezeit an der Haltestelle von 30 Sekunden hat. Trifft ein Fahrgast in dem 30 Sekunden Intervall ein, kann er mitfahren. Nehmen wir nun an, dass der Fahrgast gleichverteilt in jedem der 20 30-Sekunden-Intervall an der Haltestelle eintrifft. Die Wahrscheinlichkeit im i-ten Intervall mit 1 ≤ i ≤ 20 einzutreffen ist damit: P( i ) 1 20 Für die Verteilungsfunktion gilt: 0 x F (x) 20 1 für x 1 für 1 x für x mit x Der Erwartungswert ergibt sich zu E() 20 1 i 20 i1 20 1 2 10,5 Die „mittlere Wartezeit“ ist somit (10,5 * 30) sek = 5,25 min = 5 min 15 sek. 6.2 Binomial-Verteilung Es wird nun eine komplexere Aufgabe als bisher analysiert und gelöst. Dazu wird eine Menge U definiert die alle Konfigurationen Ts aus s weißen und (k-s) schwarzen Kugeln repräsentiert. Im Weiteren werden wir auch die Mechanik der Variationen mit Wiederholung nutzen. Seien die Mengen und Multimengen gegeben: B sw, ws , U ws,...., ws , sw, ..... , sw , mit U n m nm Ts ws,...., ws , sw, ..... , sw , s ks mit T k . Daraus wird die Menge Ω aller k Ereignisse, konstruiert : 48 (a1 ,...,ak ) für alle 1 i k gilt ai ws1 ,..., wsm sw1 ,..., sw nm m nm und damit gilt nach Satz 4 bzw. Satz 11 als Variationen mit Wiederholung: nk : Betrachten wir ein spezielles Ereignis A s# mit: A s# : a ,...,a ,a 1 s s 1 ,...,ak für alle 1 i s : ai ws1 ,..., wsm und für alle s 1 j t : a j sw1 ,...,sw nm und es folgt wie oben (Variationen mit Wiederholung): A s# ls * (k l)t s Nun sind aber noch die Anzahl aller k-Tupel zu berechnen bei denen nun die Elemente nicht so strukturiert angeordnet sind – erst die weißen Kugeln, dann die schwarzen Kugeln. Das heißt, es ist noch die Anzahl der Permutationen jeder Anordnung zu ermitteln. Das liefert aber Satz 9 (Permutation von teilweise nicht unterscheidbaren Elementen) , und somit ergibt sich die Wahrscheinlichkeit zu k A s ms * (n m)k s s und somit P(A s ) As k s k s m * (n m) s nk k ms * (n m)k s k ms (n m)k s s ns * nk s nk s s s n k ms (n m)k s s nk s s n k m n m P(A s ) s n n s k s Definieren wir nun noch 49 k s k m n m bm ,n (s,k) : P(A s ) s n n s k s k m m 1 n s n s Und damit ergibt sich: Definition: Die Folge bm ,n (0,k), bm ,n (1,k), bm ,n (2,k), ... , bm ,n (k ,k) heißt Binomialverteilung. Die Graphen der Binomialverteilungen (und der zugehörigen Verteilungsfunktionen) für k = 20, n = 100 und unterschiedlicher Werten von m sind weiter unten dargestellt. Gehen wir nun nochmals zu unserer Ausgangsfrage zurück und formulieren allgemeiner: Ein Versuch habe 2 Versuchsausgänge A und A mit P(A) = p und P( A) = 1 - p . Der Versuch wird k-mal wiederholt und As sei das Ereignis: A trifft genau s - mal ein und somit tritt A (k – s) - mal ein Dann ergibt sich die Wahrscheinlichkeit, für As zu: k k s P(A s ) ps 1 p s k k s Definieren wir nun noch bp (s,k) : ps 1 p , so ergibt sich wie oben die s verallgemeinerte Definition mit der Wahrscheinlichkeit p (= m/n): Definition*: Die Folge bp (0,k), bp (1,k), bp (2,k), ... , bp (k ,k) heißt Binomialverteilung. Weiter ergibt sich analog oben die Verteilungsfunktion zu: F : 0,1 und A t As s0 F (x) P ( ( ,x) ) P( 1 ( ,x) ) P () x P A A As x s0 t 50 0 für x 1 t P(A s ) mit max(0,t l k) s min(t, l) für x mit 1 A x s 0 1 für x mit x 0 für s 0 k b(s,k) mit 0 s k für x mit 0 A x s 0 1 für x mit x und schließlich somit 0 k k F (x) ps (1 p)k s mit 0 s k s 0 s 1 für s 0 für x mit 0 A x für x mit x Binomialverteilung (bm,100(x,20)) und zugehörige Verteilungsfunktion m = 20 m = 50 Der Erwartungswert E ergibt sich mit k k i P(A i ) bp (i,k) : pi 1 p i zu 51 m = 70 E() k r P( ri ) i i0 i i p 1 p k k k i i da wegen i 0 der 1.Summand 0 ist, gilt k k k i i pi 1 p i1 i i0 k k! (k 1)! k i i (k i)! i! ((k 1 i 1))! (i 1)! i (k 1)! k ((k 1) (i 1))! (i 1)! mit k 1 k i 1 k k 1 i 1 p 1 p k i1 k k 1 i0 kp mit Indextransformation i i 1 fo lg t k 1 i 1 k (i 1) p 1 p i k 1 Faktor p herausheben k 1 i (k 1) i p 1 p i i0 kp k i i fo lg t Binomische Formel p 1 p k 1 p k 1 1 p 1 k 1 1 kp 6.3 Hypergeometrische Verteilung Zur Definition der Hypergeometrischen Verteilung betrachten wir das Beispiel „3.2 Urne mit Kugeln in 2 Farben“ aus dem Kapitel „4.5 Anwendungen und Beispiele“ bzw. Satz 12 über k-Kombinationen. Repräsentiere die Urne die Multimenge U mit den Elementen ws und sw, sowie die Multimenge T die Stichprobe. B sw, ws , U ws,...., ws , sw, ..... , sw , m nm Ts ws,...., ws , sw, ..... , sw , s ks 52 , mit U n mit T k . Sei nun a , ..., a 1 k ai U* \ a1 , a2 , ..., ai1) U* : ws1,...., wsm , sw1, ..... , sw n m , m nm mit und damit gilt nach Satz 12 für k-Kombination ohne Wiederholung: n : k Sei weiter das Ereignis bei k Ziehungen s weiße Kugeln zu ziehen A s : (ws1,...., wss ) wsi ws j mit i j (sw1, ..... , sw k s ) sw i sw j mit i j s ks und es gilt: k As mit A i A j für i j s 1 Es ist nun zu berechnen, wie viele k-Tupel existieren mit 0 < k ≤ n und genau s weißen Elementen 0 ≤ s ≤ m . Es ergeben sich dann also s-Kombination ohne Wiederholung über einer Menge mit m Elementen nach Satz 12 zu: m m! (m s)! * s! s m - Tupel mit s weißen Elementen und analog ergibt sich und (k – s)-Kombination ohne Wiederholung über einer Menge mit (n – m) Elementen wieder nach Satz 12 zu: n m (n m) ! ((n m) (k s)) ! * (k s)! k s (n - m) - Tupel mit (k – s) schwarzen Elementen da jedem der m-Tupel weißer Elemente alle Tupel schwarzer Elemente zuzuordnen und somit m n m * - Tupel mit s weißen und (k – s) schwarzen Elementen. s k s 53 Definieren wir nun noch hm,,n (s,k) : P(A s ) As n m m n m m k s s k s hm ,n (s,k) P(A s ) n s n k k mit max(0,k m n) s min(k , m) Definition: Die Folge hm ,n (0,k), hm ,n (1,k), hm ,n (2,k), ... , hm ,n (k ,k) heißt hypergeometrische Verteilung. Die Graphen der hypergeometrische Verteilung (und der zugehörigen Verteilungsfunktionen) für k = 20, n = 1000 und unterschiedlicher Werten von m sind weiter unten dargestellt. Weiter ergibt sich, analog oben, die Verteilungsfunktion zu: F : 0,1 und A t As s0 F (x) P ( ( ,x) ) P( 1 ( ,x) ) P () x P A A As x s0 t 0 für x 1 t P(A s ) mit max(0,t l k) s min(t, l) für x mit 1 A x s 0 1 für x mit x 0 für x 1 t hl,k (s,t) mit max(0,t l k) s min(t, l) für x mit 1 A x s 0 1 für x mit x 54 0 l k l t s t s F (x) k s 0 t 1 für x 1 mit max(0,t l k) s min(t, l) für x mit 1 A x für x mit x Hypergeometrische Verteilung (hm,1000(x,20)) und zugehörige Verteilungsfunktion m = 150 m = 450 m = 880 Für die Berechnung des Erwartungswertes benötigen wir folgenden Äquivalenzen: 1. für m, s ≥ 1 gilt m m (m 1) ... (m s 1) s! s m (m 1)(m 2) ... (m (s 1)) s (s 1)! m s m 1 s 1 55 2. Vandermonde´sche Identität2 [15] n m k k n m j k j j0 Beweis: Betrachten wir 2 disjunkte Mengen N, M, also N M und N n, M m . Wir bilden damit nun die Potenzmenge von N ∪ M und betrachten daraus die Teilmengen mit k Elementen, wobei j aus N und (k – j) aus M seien: , k, j P P N M und P k n m und P N j n Per Definition gilt für die P ∈ k,j auch P M k j , da N M . n Nach Satz 3 gibt es nun genau j-elementige Teilmengen von N und j m (k – j)-elementigen Teilmengen von M und somit ergibt sich k j n m j k j Weiter sind die Mengen k,0 , k,1 ,k,2 , … k,k paarweise disjunkt, da sie unterschiedlich viele Elemente von P enthalten und es gilt: k k n m k, j j0 j0 j k j k, j Andererseits ist die Anzahl aller Teilmengen mit k Elementen von N ∪ M n m wiederum nach Satz 3: k n m und damit ergibt sich: k +++ k n m j k j j0 Bemerkung: Für n = m = k ergibt sich: n n n! n! aus j j! (n j) (n j) ! (n (n j) )! n j und der Vandermonde´schen Identität 2 n n n n n n n n folgt n n j 0 j n j j 0 j 2 Mit Hilfe der obigen Äquivalenzen ergibt sich nun der Erwartungswert zu: 2 Alexandre-Théophile Vandermonde, geboren 28.02.1735 in Paris, gestorben 01.01.1796 in Paris 56 E() k r i0 i P( ri ) n m k i n k m k i i i0 1 n k 1 n k da wegen i 0 der 1.Summand 0 ist, gilt m n m k i i k i i1 k i i1 m m 1 n m i i 1 k i m 1 n m k 1 n k m i 1 k i m n k i 1 k i i1 k i1 k nach der obigen Äquivalenz 1. nach kürzen von i m 1 n m m 1 nm m n k i 1 (k 1) (i 1) m n k m 1 i i0 m n n 1 k k 1 i1 k 1 nm (k 1) mit k i k 1 i 1 (k 1) (i 1) i Indextransformation (i 1) i m 1 n m i (k 1) i i0 k 1 nach der obigen Äquivalenz 1. (m 1) (n m) m k 1 n n 1 k k 1 n 1 m n n 1 k 1 k k 1 k m n E() k m n nach der Vandermonde´schen Identität 57 6.4 Zusammenhang zwischen Binomial- und Hypergeometrischer Verteilung Wir zeigen nun, dass für „große“ Anzahl von Versuchen, (n → ∞) die Folge der hypergeometrischen Verteilung gegen die die Folge der Binomialverteilung strebt. Satz Sei m : mit für alle n m(n) p, p 0, 1 n n mit: m(n) n und lim dann gilt lim h m n , n s, k bp s, k n mit m s hm ,n (s,k) n m k s , n k k k s bp (s,k) ps 1 p s Beweis: m n m s k s hm ,n (s,k) n k k ! (n k)! m! (n m)! n! s! (m s)! (k s)! (n m (k s))! k! (n k)! m! (n m)! s! (k s)! n! (m s)! (n m (k s)) ! s Faktoren (k s) Faktoren k m (m 1) ... (m (s 1)) (n m)((n m) 1) ... (n m) ((k s) 1) s n(n 1) ... (n (k 2))(n (k 1)) k Faktoren s Faktoren (k s) Faktoren k m (m 1) ... (m (s 1)) nk (n m)((n m) 1) ... (n m) ((k s) 1) k n s n(n 1) ... (n (k 2))(n (k 1)) k Faktoren k s k s k s k s m (m 1) (m (s 1)) ... (n m) ((k s) 1) (n m) ((n m) 1) n n n ... n (n 1) (n k 2) (n (k 1)) n n n ... n n n n (n m) ((k s) 1) m (m 1) (m (s 1)) (n m) ((n m) 1) ... ... n n n n n n n (n 1) (n k 2) (n (k 1)) ... n n n n m m 1 m s 1 n m n m 1 n m (k s) 1 ... ... nn n n n n n n n n n n (n 1) (n k 2) (n (k 1)) ... n n n n m m 1 m s 1 m m 1 m (k s) 1 ... 1 1 ... 1 nn n n n n n n n (n 1) (n k 2) (n (k 1)) ... n n n n 58 m m 1 m s 1 ... n n n n n m m 1 m (k s) 1 1 n 1 n ... 1 n k hm ,n (s,k) s n (n 1) (n (s 1)) ... n n n n (n 1) (n k 2) (n (k 1)) ... n n n n s Faktoren (k s) Faktoren k n s m n 1 für j endlich, n : j 0 n m j n p 0 p n für i endlich , n : n i 1 n (1 p)k s 1k s ps 1s p m n 1 p k s p s ks (1 p) bp s, k 6.5 Poisson Verteilung Kommen wir nochmals zur Binomialverteilung zurück. Wir wollen nun untersuchen, wie Wahrscheinlichkeiten berechnet werden können, wenn die Wahrscheinlichkeit des Ereignisses „sehr klein“ ist und viele Experimente durchgeführt werden. In diesen Fällen ist die Berechnung der Binomialverteilung – auch mit dem PC - recht aufwändig. Eine einfache Methode eine Näherung zu berechnen bietet die Poisson Verteilung. Ein Versuch habe 2 Versuchsausgänge A und A mit P(A) = p und P( A) = 1 - p . Der Versuch werde k-mal wiederholt und As sei das Ereignis: A trifft genau s - mal ein und somit tritt A (k – s) - mal ein. Dann ergibt sich: die Binomialverteilung ist die Folge bp (0,k), bp (1,k), bp (2,k), ... , bp (k ,k) mit k k s bp (s,k) ps 1 p . s Ist die Anzahl der Versuche k sehr groß und die Wahrscheinlichkeit p sehr klein, so ist die Berechnung der Binomialverteilung / der Verteilungsfunktion sehr aufwendig. Hier wird nun eine „Näherungsverteilung“ für die Binomialverteilung für den oben beschriebenen Fall berechnet, wenn λ := p * k beschränkt ist. 59 k ks bp (s,k) pks 1 pk s k! ks pks 1 pk s! (k s)! k (k 1)...(k (s 1)) s ks pk 1 pk s! k s k s s s k (k 1)...(k (s 1)) k pk s! ks k k 1 k pk 1 k pk s s k (k 1)...(k (s 1)) k pk s! ks k pk k pk 1 1 k k k (k 1)...(k (s 1)) k pk s! ks s k k pk k pk 1 1 k k s und mit k pk ergibt sich k s k s k (k 1)...(k (s 1)) s 1 1 s s! k k k k (k 1)...(k (s 1)) s 1 1 k k ... k s! k k k 1 s s! k k e 1 s e s! Bevor wir nun die Verteilung definieren müssen wir noch nachrechnen, dass die Summe über die Folgenglieder die Einheit ergibt: s s e e s! s! e e 1 s 0 s 0 und somit können wir definieren: 2 s Definition: Die Folge e , e , e , ... , e , ... heißt Poisson Verteilung 1! 2! s! mit λ = p * k beschränkt 60 Daraus ergibt sich nun eine Möglichkeit die Poisson Verteilung schrittweise zu berechnen: Definieren wir dazu: k () : für k 0, 1, 2, ... gilt : k 1 k (n p)k e e k (n p) , k! k! k 1 k e e (k 1)! k ! (k 1) k e k 1 k! k k 1 also somit e 0 k 1 k 1 k Der Erwartungswert ergibt sich zu: E() i P( i) i0 i i0 e i e i! i i0 e i i! i 1 i 1 (i 1)! i 1 e i 1 (i 1)! e e Ein Beispiel dazu. Nach [22] haben - die seltene Blutgruppe AB, Rhesus negativ in 1. Österreich p = 1,0% = 0,01, 2. Argentinien p = 0,06% = 0,0006, 3. China p = 0,3% = 0,003 61 mit k 0, 1, 2, ... - die Blutgruppe B, Rhesus positiv in 1. Österreich p = 12% = 0,12, 2. Argentinien p = 8,6% = 0,086, 3. China p = 27% = 0,27 der Bevölkerung. Es werden k Personen auf Blutgruppenzugehörigkeit getestet. 1. Wie groß ist die Wahrscheinlichkeit, dass mindestens 2 von den k Personen die Blutgruppe a. AB b. B + haben? 2. Wie groß muss jeweils das k gewählt werden, dass die Wahrscheinlichkeit größer 95% ist? 3. Bestimmung der Approximation von den Ergebnissen aus 2. durch eine Poisson Verteilung, 4. Berechne die Werte analog zu 2. Die Wahrscheinlichkeit dass mindestens 2 von k untersuchter Personen die entsprechende Blutgruppe haben ergibt sich: 1. auf Basis der Binomialverteilung k k i P(A i ) bp (i,k) : pi 1 p i ergibt sich die Wahrscheinlichkeit für mindestens 2 von k Personen: P A 2 1 bp (0,k) bp (1,k) k k k 0 k 1 1 po 1 p p1 1 p 0 1 1 1 p k p 1 p k 1 k 2. a. Österreich AB-: p = 1,0% = 0,01 B+: p = 12% = 0,12 P A 2 1 1 p k p 1 p k P A 2 1 1 p k p 1 p k 1 k 1 0,99k k * 0,01 * 0,99k 1 0,95 1 0,88k k * 0,12 * 0,88k 1 0,95 k 473 : P A 2 0,9502 k 38 : P A 2 0,9520 k 472 : P A 2 0,9497 k 37 : P A 2 0,9466 62 k 1 b. Argentinien AB-: p = 0,06% = 0,0006 B+: p = 8,6% = 0,086 P A 2 1 1 p k p 1 p k P A 2 1 1 p k p 1 p k 1 k 1 k 1 0,9994k k * 0,0006 * 0,9994k 1 0, 95 1 0,914k k * 0,086 * 0,914k 1 0,95 k 7905 : P A 2 0,9500 k 54 : P A 2 0,9527 k 7904 : P A 2 0,9499 k 53 : P A 2 0,9490 c. China AB-: p = 0,3% = 0,003 B+: p = 27% = 0,27 P A 2 1 1 p k p 1 p k P A 2 1 1 p k p 1 p k 1 k 1 0,9994k k * 0,0006 * 0,9994k 1 0, 95 k 1 1 0,914k k * 0,086 * 0,914k 1 0,95 k 1580 : P A 2 0,9501 k 16 : P A 2 0,9550 k 1579 : P A 2 0,9499 k 15 : P A 2 0,9416 3. auf Basis der Poisson Verteilung s (k p)s k p P(A k ) k () : e e , mit k 0, 1, 2, ... s! s! Ergibt sich die Wahrscheinlichkeit für mindestens 2 von k Personen: P A 2 1 0 (k * p) 1(k * p) (k * p)0 k p (k * p)1 k p 1 e e 0! 1! 1 e k p k p e k p 1 (1 k p) e k p 4. a. Österreich AB-: p = 1,0% = 0,01 B+: p = 12% = 0,12 P A 2 1 (1 k p) e k p P A 2 1 (1 k p) e k p 1 (1 k * 0,01) e k * 0,01 0,95 1 (1 k * 0,12) e k * 0,12 0,95 k 475 : P A 2 0,9502 k 40 : P A 2 0,9523 k 474 : P A 2 0,9498 k 39 : P A 2 0,9472 63 b. Argentinien AB-: p = 0,06% = 0,0006 B+: p = 8,6% = 0,086 P A 2 1 (1 k p) e k p P A 2 1 (1 k p) e k p 1 (1 k * 0,006) e k * 0,006 0, 95 1 (1 k * 0,12) e k * 0,,086 0,95 k 7907 : P A 2 0,9500 k 56 : P A 2 0,9528 k 7906 : P A 2 0, 9499 k 55 : P A 2 0,9494 c. China AB-: p = 0,3% = 0,003 B+: p = 27% = 0,27 P A 2 1 (1 k p) e k p P A 2 1 (1 k p) e k p 1 (1 k * 0,003) e k * 0,003 0, 95 1 (1 k * 0,27) e k * 0,,27 0,95 k 1582 : P A 2 0,9501 k 18 : P A 2 0,9545 k 1581: P A 2 0, 9499 k 17 : P A 2 0,9432 Man erkennt, dass in allen Fällen die Werte der Poisson-Verteilung für die entsprechenden Werte der Binomialverteilung sehr dicht beieinander liegen. Mit Berücksichtigung der weiter unten gegebenen Parameterwerte ergibt sich eine sehr gute Näherung für die Binomialverteilung durch die Poisson Verteilung. 6.6 Approximation von Binomial- und Hypergeometrischer Verteilung Kommen wir zum Abschluss nochmals auf die Näherung der Verteilungen untereinander zurück. In 6.4 haben wir gezeigt, dass gilt: lim h m,n s, k bp s, k . n Weiter gilt nach 6.5: k lim bp (s,k) s e s! mit k p . 64 Für die praktische Anwendung gilt nach [16]: 1. Approximation der Hypergeometrische Verteilung durch die Binomialverteilung bei 0,1 m k 0,9 und 0,05 und k 10 gilt: n n h m, n s, k wird approximiert durch bp s, k mit p m . n 2. Approximation der Hypergeometrische Verteilung durch die Poisson Verteilung 0,05 und k 30 gilt: bei 0,1 oder 0,9 und n n n m m k h m, n s, k wird approximiert durch k m e mit k k ( ) : k! n 3. Approximation der Binomialverteilung durch die Poisson Verteilung bei k p 10 und k 1500 p gilt: bp s, k wird approximiert durch Beispiel: k ( ) : k e k! Für die oben gegebenen Beispiele über die Verteilung der Blutgruppen in verschiedenen Ländern gilt: a1. 1. λ = k p = 473 * 0,01 = 4,73 < 10 2. 1500 p = 1500 * 0,01 = 15 ≤ 473 a2. 1. λ = k p = 38 * 0,12 = 4,56 < 10 2. 1500 p = 1500 * 0,12 = 180 ≤ 473 b1. 1. λ = k p = 7905 * 0,0006 = 4,74 < 10 2. 1500 p = 1500 * 0, 0006 = 0,9 ≤ 473 b2. 1. λ = k p = 54 * 0,086 = 4,64 < 10 2. 1500 p = 1500 * 0,086 = 129 ≤ 473 c1. 1. λ = k p = 1580 * 0,003 = 4,74 < 10 2. 1500 p = 1500 * 0,003 = 4,5 ≤ 473 c2. 1. λ = k p = 16 * 0,27 = 4,32 < 10 2. 1500 p = 1500 * 0,27 = 405 ≤ 473 Damit sind alle Approximationen der Binomialverteilungen durch die entsprechenden Poisson Verteilungen im Rahmen der oben gegebenen Parameter sinnvoll. Dies stimmt auch mit den weiter oben durchgeführten Rechnungen überein. 65 7. Verallgemeinerung der Verteilungen Im Folgenden wird nun die „natürliche“ Verallgemeinerung der Binomial- und der Hypergeometrischen Verteilung betrachtet. „Natürlich“ meint in diesem Zusammenhang, dass wir statt 2 unterscheidbaren Klassen, wie schwarze und weiße Kugeln etc.) nun k unterscheidbare Klassen k ≥ 2, k endlich untersuchen werden. 7.1 Polynomialverteilung Seien die folgenden Mengen und Multimengen gegeben: X x1 , x2 , x3 , ..., xr , U x1,...., x1 , x 2 ,...., x 2 ,, x 3 ,...., x 3 , ... , x r ,...., xr m1 m2 mr m3 , mit U T x1,...., x1 , x 2 ,...., x 2 ,, x 3 ,...., x 3 , ... , x r ,...., xr s1 s2 sr s3 , mit T r m i i 1 r s i1 i n kn Daraus wird die Menge Ω aller k-Ereignisse, konstruiert : (a1 ,...,ak ) für alle 1 i k gilt ai x1 ,1 , ...., x1 ,m 1 , ... , x r ,1 , ...., xr ,m r m1 mr und damit gilt wie oben nach Satz 4: m1 1 * m2 2 * ... * mk 1 k 1 * mk k : Anschaulich gesprochen handelt es sich also hier um „ein ziehen aus einer Urne mit zurücklegen“. s s s s Betrachten wir ein spezielles Ereignis A s#1 ,...,sk mit: A s#1 ,.., sk : a 1,1 ,...,a1,s1 , ..., ar ,1 ,...,ar ,sk für alle 1 i s1 : a1,i x1,1 ,..., x1,m1 und ... und für alle 1 j sk : ar , j xr ,1 ,..., xr ,mr und es folgt: A s#1, ...,sk l1s1 * l2s2 * ... * lk sk 66 Nun sind aber noch die Anzahl aller (s1 + … + sk ) - Tupel zu berechnen bei denen nun die Elemente nicht so strukturiert angeordnet sind – erst die x1 Elemente, dann die analog die weiteren Elemente. Das heißt, es ist noch die Anzahl der Permutationen jeder Anordnung zu ermitteln. Das liefert aber Satz 9. und somit ergibt sich die Wahrscheinlichkeit zu A s1, ...,sk n! l1s1 * l2s2 * ... * lk sk s1 ! s1 ! * ... * sk ! und somit ergibt sich P(A s1 , ...,sk ) A s1 , ...,sk n! l1s1 * l2s2 * ... * lk sk s1 ! s2 ! * ... * sk ! s m1s1 * m2 s2 * ... * mk 1 k 1 * mk sk s l1s1 * l2s2 * ... * lk 1 k 1 * lk sk n! s1 ! s2 ! * ... * sk ! m1s1 * m2s2 * ... * mk 1sk 1 * mk sk s lk 1 k 1 l1s1 lk sk n! * ... * * s s s1 ! s2 ! * ... * sk ! m1s1 mk 1 k 1 mk k n! P(A s1 , ...,sk ) s1 ! s2 ! * ... * sk ! 1 lk 1 l1 * ... * m1 mk 1 s sk 1 l * k mk sk Definieren wir nun noch pi : li mi mit 1 i k , dann definieren wir n! s p1s1 * ... * pk 1 k 1 * pk sk s1 ! s2 ! * ... * sk ! pnp1 ,p2 ,..., pk ( s1 ,s2 , ... ,sk ,n) : k mit si n und i 1 k p i 1 i 1 Und damit ergibt sich: Definition: Die Folge pnp ,p 1 2 ,..., pk ( s1 ,s2 , ... ,sk ,n) heißt Polynomialverteilung oder auch Multinomialverteilung genannt. Ein Beispiel dazu: Bei den Österreichischen Nationalratswahlen 2013 gab es gemäß http://www.nationalratswahl.at/ergebnisse.html folgendes Ergebnis: 67 SPÖ 26,8%, ÖVP 24,0%, FPÖ 20,5%, Grüne 12,4%, Stronach 5,7%, NEOS 5,0%, BZÖ 3,5%, KPÖ 1,0%, Piraten 0,8%, Wandl 0,07%, CPÖ 0,14.%, SLP 0,02%, EUAUS 0,01%, Männerpartei 0,01%. Daraus ergibt sich ein Rest von 0,05% Betrachten wir nun größten 3 Parteien : SPÖ 26,8%, ÖVP 24,0%, FPÖ 20,5%, Rest 28,7% Wie groß ist nun die Wahrscheinlichkeit, dass bei 100 zufällig ausgewählten Wählern bei einer Befragung unmittelbar nach der Wahl 27 SPÖ, 24 ÖVP, 21 FPÖ, 28 andere angeben? Wir nehmen nun an, dass das Kollektiv – in diesem Fall 4.692.907 gültige Wählerstimmen (Quelle s. o.) – groß genug ist, so dass es nicht darauf ankommt, ob „zurückgelegt“ oder nicht (siehe unten, 7.2 Multivariate hypergeometrische Verteilung). P(A) 100! 0, 26827 0, 2424 0, 20521 0, 28728 27! 24! 21! 28! 8,868 *1056 * 3, 628 * 10 16 * 1,334 * 10 15 * 3,522 * 10 15 * 6, 618 * 1016 0,001 0,1% Dies ist ein Hinweis darauf, dass die Erhebung unmittelbar nach einer Wahl gründlich vorbereitet werden muss, und das Kollektiv der Nachbefragten nicht gar zu klein sein darf um eine hinreichend gute (wie immer das definiert wird) erste Prognose zu bekommen. 7.2 Multivariate hypergeometrische Verteilung Analoges Vorgehen wie bei 7.1 als Verallgemeinerung von 6.2 liefert die Verallgemeinerung von der Hypergeometrischen Verteilung die Multivariate hypergeometrische Verteilung zu: mhm 1 ,m 2 , ... , m k (s1 ,s2 , ...,sk ) P A s 1 , s 2 , ...,s k m1 m2 mk ... s s s 1 2 k m s m k mi , s i 1 Und damit ergibt sich: 68 mit k s i 1 i Definition: Die Folge mhm 1 ,m 2 , ... , m k (s1 ,s2 , ...,sk ) heißt Multivariate hypergeometrische Verteilung oder auch Polyhypergeometrische Verteilung genannt. Mit Hilfe dieser Verteilung könnte man nun die oben angegebenen Wähleranalyse genau berechnen, allerdings sind zu behandelten Zahlen sehr groß. Vereinfachen wir daher die Aufgabe daher hinsichtlich der Größe der verwendeten Zahlen. Betrachten wir nun wieder die größten 3 Parteien plus andere und nehmen an, dass wir ein Kollektiv von 100 Wählern haben, von denen 27 SPÖ, 24 ÖVP, 20 FPÖ und 29 andere Wähler sind. Wie groß ist nun die Wahrscheinlichkeit, dass bei 10 zufällig aus den 100 ausgewählten Wählern 3 SPÖ , 2 ÖVP , 2 FPÖ , 3 andere Wählern sind? 27 3 PA 24 20 29 2 2 3 100 10 2926 * 276 * 190 * 3654 1,731*1013 560.667.713.760 17.310.309.456.400 0,032389 3,2389% Passen wir die Berechnung des Beispiels zur Polynomialverteilung an die hier verwendeten Werte an, d. h. wir berechnen: wie groß ist nun die Wahrscheinlichkeit, dass bei 10 zufällig ausgewählten Wählern bei einer Befragung unmittelbar nach der Wahl 3 SPÖ, 2 ÖVP, 2 FPÖ, 3 andere angeben? Dann erhalten wir als Ergebnis: P(A) = 0,027758 =2,7758%. Ohne Beweis sei hier angemerkt, dass analog zur obigen Aussage: Für eine „große“ Anzahl von Versuchen, (n → ∞) strebt die Folge der hypergeometrischen Verteilung gegen die die Folge der Binomialverteilung gilt: 69 Für eine „große“ Anzahl von Versuchen, (n → ∞) strebt die Folge der multivariate hypergeometrischen Verteilung gegen die der Folge der entsprechenden Polynomialverteilung. Diese Tatsache wurde bereits auch schon im obigen Beispiel der Polynomialverteilung verwendet. 7.3 Polya Verteilung Abschließend soll hier noch eine andere Verallgemeinerung der Binomial-Verteilung und der Hypergeometrische Verteilung entwickelt werden. Als Standardbeispiel dafür ist die Ausbreitung zweier Virenerkrankungen (z. B. eine Grippe Epidemie), wobei angenommen wird, das jeder Betroffene nur einmal angesteckt werden kann und dann resistent bleibt. Wir betrachten hier aber stattdessen zwei konkurrierende Unternehmen WS und SW, die beide mit einem vergleichbaren Produkt an den gleichen Markt gehen. Es werden folgende Voraussetzungen angenommen: jeder Kunde kauft nur von einem Unternehmen WS oder SW, nach einer Anlaufphase haben beide Unternehmen durch Werbung zusammen N Kunden wobei SW M Kunden und WS (N – M) Kunden haben, nun kommt die Phase, in der der Kundenstamm durch Empfehlung der jeweils eigenen Kunden erweitert wird, wobei die Empfehlung aber erst nach einem Besuch von einem Vertriebsmitarbeiter wirkt, der Vertriebsmitarbeiter vertritt beide Produkte und besucht die Kunden in zufälliger Reihenfolge, es kommen bei jedem Besuch jeweils R Kunden hinzu, wobei das bestellte Produkt abhängig davon ob der besuchte Kunde das Produkt von SW oder WS verwenden also: o besuchter Kunde hat SW - Produkt R neue Kunden für SWProdukt o besuchter Kunde hat WS - Produkt R neue Kunden für WSProdukt schließlich wollen wir annehmen, dass der Markt mindestens n Zyklen der oben beschriebenen Art zulässt. Wir wollen nun die Wahrscheinlichkeit dafür berechnen, dass nach dem n-ten Besuch genau k-mal ein SW Kunde besucht wurde. Als erstes ist klar, dass sich nach jedem Besuch die Kundenstruktur hinsichtlich der Anzahl und der Zusammensetzung (Verhältnis SW- zu WS-Kunden) ändert. Betrachten wir als erstes die Wahrscheinlichkeit des Ereignisses A #k ,n bei den ersten k Besuchen bei SW Kunden erfolgt und in den nachfolgenden n-k Besuchen bei WS Kunden besucht werden. Wir erhalten die Wahrscheinlichkeit zu: 70 P A #k ,n M * M R * ... * M k 1 R * N M * N M R * ... * N * N R * ... * N n 1 R N M n k 1R M * M R * ... * M k 1 R * N M * N M R * ... * N * N R * ... * N k 1 R * N k R * N k 1 R * ... N M n k 1R * N n 1 R Nun sind natürlich noch die Kombinationen der k Besuche innerhalb der insgesamt n Besuchen berücksichtigen und damit ergibt sich nach Satz 12: n P A k ,n P A #k ,n k n M * M R * ... * M k 1 R * N M * N M R * ... * k N * N R * ... * N k 1 R * N k R * N k 1 R * ... N M n k 1 R * N n 1 R Definieren wir noch: pon (k) : P A k ,n , dann können wir wie folgt definieren:: Definition: Die Folge pon (k) heißt Polya Verteilung. Betrachten wir noch zwei Spezialfälle, die auf bekannte Verteilungen führt. 1. R = 0, d.i. nach dem Ziehen wird nur die gezogene aber keine weitere Kugel zurückgelegt n P A k ,n P A #k ,n k n M * M R * ... * M k 1 R * N M * N M R * ... * k N * N R * ... * N k 1 R * N k R * N k 1 R * ... n M * M 0 * ... * M k 1 0 * N M * N M 0 * ... * k N * N 0 * ... * N k 1 0 * N k 0 * N k 1 0 * ... n k N M n k 1 R * N n 1 R N M n k 1 0 * N n 1 0 M * N Mn k k nk N N k k n M k k N N Mn k nk N k nk n M N M k N N und das ist die Binomial-Verteilung (s. Kapitel 6.2) 2. R = -1, d.i. es wird nach dem Ziehen keine Kugel zurückgelegt 71 n P A k,n P A #k,n k n M * M R * ... * M k 1 R * N M * N M R * ... * k N * N R * ... * N k 1 R * N k R * N k 1 R * ... N M n k 1 R * N n 1 R n M * M ( 1) * ... * M k 1 ( 1) * N M * N M ( 1) * ... * k N * N ( 1) * ... * N k 1 ( 1) * N k ( 1) * N k 1 ( 1) * ... N M n k 1 (1) * N n 1 ( 1) N M 1 * ... * N M n k 1 N k 1 * ... * N n 1 (M k )! * N M * N M 1 * ... * N M n k 1 * N k * N k 1 * ... * N n 1 * (N n)! (M k)! (M k)! * N M * N M 1 * ... * N M n k 1 * N k * N k 1 * ... * N n 1 * (N n) ! (M k ) ! n M * M 1 * ... * M k 1 * N M * k N * N 1 * ... * N k 1 * N k * n M * M 1 * ... * M k 1 * N * N 1 * ... * N k 1 * k n M * M 1 * ... * M k 1 * N * N 1 * ... * N k 1 * k n M! k N ! (M k)! n M! k N! (M k)! n M! (N M)! N! k N n ! N M * N M 1 * ... * N M n k 1 * N M n k ! N M n k ! N n ! (N M)! N M n k ! N n ! N n ! n M! (N M)! N! N M n k ! (M k)! k N n M k ! (M k)! n n 1 N n k k N M k M h n,N k ,M N n M k N M und das ist eine hypergeometrische Verteilung (s. Kapitel 6.3) Abschließend sei noch vermerkt, dass natürlich auch hierfür ein Urnenmodell zu Erläuterung betrachtet werden kann. Dazu seien in einer Urne M schwarze Kugeln und N weiße Kugeln enthalten. Es wird nun verdeckt eine Kugel gezogen, das Ergebnis notiert und die gezogene plus R Kugeln von der gleichen Farbe wie die gezogene in die Urne zurückgelegt. Dabei spricht man hier von der Polya Urne. 8. Anwendungen Im Folgenden sollen nun einige Anwendungen der behandelten Verteilungen aufgelistet werden. Dies kann nur eine kleine Auswahl sein, weit entfernt von Vollständigkeit, aber gibt doch einen Einblick, wie vielseitig die Anwendungen sind. Gleichverteilung: • beim Würfeln ist die Wahrscheinlichkeit einer Augenzahl zwischen eins und sechs, gewürfelt zu werden, 1/6, • beim Münzwurf ist die Wahrscheinlichkeit einer der beiden Seiten, oben zu liegen, ½, • Warteschlangzeiten, • im weißen Rauschen sind die Frequenzen gleichverteilt, in diesem Fall allerdings ist das in dieser Anwendung als stetige Verteilung, • Generator für Pseudozufallszahlen. 72 (N n)! (N n) ! Binomial-Verteilung: • ziehen von Kugeln, aus einer Urne, jede Kugel in einer von zwei Farben eingefärbt, nach dem Ziehen wird wieder zurückgelegt, • mehrfaches werfen einer Münzen / einfaches werfen mehreren Münzen, • Bestimmung der Gesamtanzahl von defekten Bauteilen aus einer Stichprobe, • Wahrscheinlichkeit von gleichen Geburtstagen am Wochenende / gleichen Tag im Jahr unter den Mitglieder einer Gruppe, • statische Untersuchung der Anzahl der Ausfälle mehrerer unabhängig voneinander arbeitender bei parallel / in Reihe / gemischt geschalteten, Elemente mit gleicher Ausfallswahrscheinlichkeit. Hypergeometrische Verteilung • ziehen von Kugeln, aus einer Urne, jede Kugel in einer von zwei Farben eingefärbt, nach dem Ziehen wird nicht wieder zurückgelegt, • Ziehung der Zahlen beim Lotto, • Qualitätskontrolle: o Herstellers bei laufender Produktion: überprüfen von Sollvorgaben von Stichproben in regelmäßigen Zeitabständen, o Kunde: überprüfen von Erfüllung von Spezifikationen der gelieferten Produkte/Dienstleistungen in regelmäßigen Zeitabständen. Poisson Verteilung • ankommen von Telefonanrufen bei einer Vermittlungsstelle, • auftreffen von radioaktiven Partikeln auf einem Geigerzähler, • eintreffen von Bedienwünschen an einem Server, • Druckfehlern pro Seite in Büchern, • auftreten von Softwarefehlern in einem Programmsystem. Polynomialverteilung • ziehen von Kugeln, aus einer Urne, jede Kugel in einer von mehr als zwei Farben eingefärbt, nach dem Ziehen wird wieder zurückgelegt, • radioaktiver Zerfall, • Aufteilung der stellaren Materie im Weltraum. Multivariate hypergeometrische Verteilung • ziehen von Kugeln, aus einer Urne, jede Kugel in einer von mehr als zwei Farben eingefärbt, nach dem Ziehen wird nicht wieder zurückgelegt. Polya Verteilung • Ausbreitung von Seuchen. 73 9. Schlussbetrachtung In den letzten Klassen der Oberstufe werden Themengebiete aus der Stochastik behandelt, die in dieser Arbeit nochmals erläutert und dann aber weiter ausgebaut werden. Dabei wurde auf drei Aspekte besonders Wert gelegt: 1. Vollständige Ableitung der Sätze und Fundierung u. a. durch Anwendung von Multimengen, 2. „saubere“ und ausführliche Beweis (fast) aller Sätze – d. h. vermeiden von Floskeln wie beispielsweise „wie man leicht sieht“, „daraus folgt nach kurzer Rechnung“ etc., 3. Beispiele von möglichen Anwendungen der Ergebnisse. Da dies dazu führt, dass der Umfang doch erheblich ist, habe ich auf die Betrachtung weiterer diskreter Verteilungen wie die negative Binomialverteilung, die geometrische Verteilung, Bernoulli Verteilung etc., sowie weiterer Parameter der Verteilungen wie Varianz und höherer Momente verzichtet. Für weitere Erläuterungen möchte ich auf im ausführlichen Literaturverzeichnis gelistete Dokumente verweisen. 74 10. Literaturverzeichnis 1. Vorlesungsmitschrift „Wahrscheinlichkeitstheorie“, Prof. Dr. Wolfgang Sander, TU Braunschweig, SS 1982 2. A. Renyi, Wahrscheinlichkeitsrechnung, VEB Deutscher Verlag der Wissenschaften, Berlin 1971 3. Florian Schmidt und Benjamin Otto, Universität Jena, Fakultät für Mathematik und Informatik: Mathematikdidaktik B, Didaktik der Sek II, Kombinatorik in der Schule: http://users.minet.uni-jena.de/~bezi/Materialien/OttoSchmidtKombinatorik.pdf 4. Wikipedia „(87269) 2000 OO67“ http://de.wikipedia.org/wiki/2000_OO67 5. Wikipedia „Ménage problem“: http://en.wikipedia.org/wiki/M%C3%A9nage_problem 6. Georg Cantor: Beiträge zur Begründung der transfiniten Mengenlehre, Math. Annalen Bd. 46, S. 481-512 http://gdz.sub.unigoettingen.de/dms/load/img/?PPN=PPN237853094&DMDID=DMDLOG_0069 &LOGID=LOG_0069&PHYSID=PHYS_0295 7. Petra Hornstein and C.v. Ossietzky University Oldenburg, Germany, Dynamisches Verhalten eines Netzes : Tokenspiel http://olli.informatik.uni-oldenburg.de/PetriEdiSim/tutor23.html 8. Wikipedia: Klasse (Mengenlehre) http://de.wikipedia.org/wiki/Klasse_(Mengenlehre) 9. Prof. Dr. Ulrik Brandes, Universität Konstanz, Diskrete Strukturen, Skript zur Vorlesung - Sommersemester 2003: http://www.inf.uni-konstanz.de/algo/lehre/skripte/Quellen/ds.pdf 10. D. Singh, A. M. Ibrahim, Ahmadu Bello University, Nigeria, T. Yohanna Kaduna State University, Nigeria, J. N. Singhy - Barry University, Miami FL, USA: A systematization of fundamentals of multisets, Lecturas Matematicas, Volumen 29 (2008), paginas 33-48, ISSN 0120-1980 http://www.scm.org.co/aplicaciones/revista/Articulos/1014.pdf 11. Prof. Dr. Angelika Steger / Dr. Uli Wagner: Diskrete Mathematik (D-ITET), Center for Algorithms, Discrete Mathematics and Optimization, ETH Zürich, 2011 http://www.cadmo.ethz.ch/education/lectures/HS11/DM/los02.pdf 12. Dr. Reimund Albers: Stochastik (BA FBW), Universität Bremen, AG Didaktik der Mathematik, Sommersemester 2012: http://www.math.unibremen.de/didaktik/ma/ralbers/Veranstaltungen/Stochastik12/ 13. Petra Oberhuemer, Franz Embacher: mathe online, für Schule, Fachhochschule, Universität und Sebststudium - Mathematische Hintergründe - Wahrscheinlichkeitsrechnung und Statistik 1: http://www.mathe-online.at/mathint/wstat1/i.html#Beispiele123 14. Mathe* Leistungskurs der H2O: http://mathe.wikidot.com/hypergeometrische-verteilung 15. Dr. D. Fleischer: „Vorlesung "Mathematische Grundlagen der Informatik II" http://www.inf.uni-konstanz.de/algo/lehre/ss08/mg/skript/mg.pdf 16. Prof. Dr. Jochen Schwarzer: Grundlagen der Statistik, Band 2, 10. Auflage 17. Prof. Dr. Götz Kersting: Zufallsvariable und Wahrscheinlichkeiten, Eine elementare Einführung in die Stochastik, Sommersemester 2006, http://www.math.uni-frankfurt.de/~ismi/kersting/lecturenotes/Stochastik.pdf 75 18. Prof. Dr. Gerd Wittstock: Elementare Wahrscheinlichkeitstheorie und Statistik, Kurzfassung: Definitionen und Sätze, Vorlesung SS 2003 für Bio-Informatiker und Lehramtskandidaten, Version: 9. Juli 2003 http://www.math.uni-sb.de/ag/wittstock/lehre/SS03/wth/Skript/Skript07_08.pdf 19. Fakten über, Pólya-Verteilung: http://fakten-uber.de/p%C3%B3lya-verteilung 20. Die Home-Page von Beata Strycharz-Szemberg, Universtität Duisburg-Essen Fachbereich Mathematik: https://www.uni-due.de/~bm0061/vorl9.pdf 21. Wikipedia „Multimenge“ http://de.wikipedia.org/wiki/Multimenge 22. Wikipedia „Blutgruppe” http://de.wikipedia.org/wiki/Blutgruppe Dokument wurde erstellt mit MS Word, MS Excel, MS Powerpoint und MathType (http://www.dessci.com/en/products/mathtype/) 76