Fachseminar zur Stochastik Die Binomialverteilung 23.11.2015 Referenten: Carolin Labrzycki und Caroline Kemper Gliederung ● Einstieg ● Definition der Binomialverteilung ● Herleitung der Formel an einem Beispiel ● Beweis ● Beispiele ● Zeit für Übungen ● Approximation durch die Poisson-Verteilung ● Zeit für Übungen ● Ausblick 2 Einstieg – Das Galton-Brett Zur Demonstration und Veranschaulichung der Binomialverteilung entwickelte Sir Francis C. Galton (1822-1911) eine Anordnung, die man als Galton-Brett bezeichnet. Auf einem Brett sind mehrere Nägel befestigt, die wie gleichmäßige Dreiecke angeordnet sind und zusammen ein gleichseitiges Dreieck bilden. Die Anordnung entspricht einem Pascalschen Dreieck. 3 Einstieg – Das Galton-Brett ● ● Wir wollen jetzt mit euch das Galton-Brett simulieren! Bitte ladet auf euer Smartphone die App: Galton Board Simulation 4 Einstieg – Das Galton-Brett ● Simulation auf dem Smartphone ● ● ● ● ● ● Number of Trials: 100 Number of Trials: 500 Number of Trials: 1000 Welche Voraussetzungen sind bei dieser Simulation gegeben? Wie nennt man solche Experimente? Wenn man das Experiment n-mal durchführt, wie nennt man dieses dann? 5 Einstieg – Das Galton-Brett ● ● Die Werte der Wahrscheinlichkeitsverteilung ergeben sich aus den Pfadregeln: Ein Pfad mit genau k Treffern hat nach der Pfadmultiplikationsregel die Wahrscheinlichkeit pk·(1-p)n-k Zum gewünschten Ergebnis „genau k mal Treffer“ führen alle Pfade mit genau k mal Treffer und (n-k) mal Niete, dies entspricht (n über k); K Kugeln auf n Plätze zu legen 6 Einstieg – Das Galton-Brett ● ● Die Werte der Wahrscheinlichkeitsverteilung ergeben sich aus den Pfadregeln: Ein Pfad mit genau k Treffern hat nach der Pfadmultiplikationsregel die Wahrscheinlichkeit pk·(1-p)n-k Zum gewünschten Ergebnis „genau k mal Treffer“ führen alle Pfade mit genau k mal Treffer und (n-k) mal Niete, dies entspricht (n über k); K Kugeln auf n Plätze zu legen 7 Definition: Binomialverteilung ● ● Das Galton-Brett kann man also als eine Bernoulli-Kette der Länge n mit Parameter p bezeichnen Die Wahrscheinlichkeitsverteilung einer Bernoulli-Kette der Länge n heißt Binomialverteilung 8 Wiederholung: Binomialkoeffizient ● ● ● ● Der Binomialkoeffizient ist eine mathematische Funktion, mit der sich eine Grundaufgabe der Kombinatorik lösen lässt Gibt an auf wie viele verschiedene Arten man k Objekte aus einer Menge von n verschiedenen Objekten auswählen kann Ohne Zurücklegen, ohne Betrachtung der Reihenfolge „49 über 6“ ist z.B die Anzahl der möglichen Ziehungen beim Lotto (ohne Berücksichtigung der Zusatzzahl) 9 Definition: Binomialverteilung ● Satz: Die Wahrscheinlichkeit für genau k Erfolge bei n unabhängigen Versuchen mit Erfolgswahrscheinlichkeit p ist gleich ● ● ● n= Anzahl der Versuche p є [0,1] = Erfolgs- oder Trefferwahrscheinlichkeit 1-p = zu p komplementären Ausfallwahrscheinlichkeit 10 Herleitung der Formel an einem Beispiel ● Siehe Tafel 11 Beweis: Binomialverteilung 12 Zeit zum Üben 13 Lösungen ● 1) Ein Jäger trifft sein Ziel mit einer Wahrscheinlichkeit 40%. Mit welcher Wahrscheinlichkeit erzielt er bei zehn Schüssen mehr als sechs Treffer? 14 Lösungen ● 2 ) Die Wahrscheinlichkeit dafür, dass ein Bienenvolk einen harten Winter überlebt, ist 0,4. Ein Imker besitzt 6 Völker. Wie groß ist die Wahrscheinlichkeit, dass mindestens 2 einen harten Winter überleben? 15 Lösungen ● 3) Bei einem Automaten gewinnt man in 30% aller Spiele. Wie groß ist die Wahrscheinlichkeit, dass man bei 10 Spielen achtmal gewinnt? 16 Approximation durch die Poissonverteilung 17 Approximation durch die Poissonverteilung ● ● ● ● Bei der praktischen Anwendung der Binomialverteilung treten nicht selten große oder sogar sehr große Werte von n (etwa n=10000 ) auf Das Berechnen der Wahrscheinlichkeiten wäre dann sehr zeitaufwendig Deshalb versuchte man schon früh eine Näherungsformel für die Binomialverteilung zu finden Unter bestimmten Voraussetzungen ist es deshalb günstig die Binomialverteilung durch die Poissonverteilung zu approximieren 18 Approximation durch die Poissonverteilung ● ● ● ● Die Poissonverteilung ist eine einparametrige, diskrete, statistische Verteilung. Sie wird auch als „Verteilung der seltenen Ereignisse“ bezeichnet. Die Poissonverteilung ergibt sich, wenn von einer Binomialverteilung der Grenzwert für n gegen unendlich und p gegen 0 gebildet wird unter Konstanthaltung n·p (Erwartungswert λ der Poissonverteilung) Einziger Parameter der Poissonverteilung ist λ (Lambda), manchmal wird für λ auch μ eingesetzt 19 Approximation durch die Poissonverteilung ● ● Wenn wir also große Werte von n haben, also n→∞ und kleine Werte für p, also p→0, dann wird die Wahrscheinlichkeit für die Zufallsvariable X der Poisson-Verteilung durch folgende Formel berechnet: λ = ist der Erwartungswert einer binomialverteilten Zufallsgröße (wird bei der Poisson-Verteilung auch öfters mit dem kleinen griechischen Buchstaben μ geschrieben und manchmal als Intensitätsparameter bezeichnet) ● k! ist die Fakultät der natürlichen Zahl k ● e ist die Euler’sche Zahl (≈2,71...) 20 Approximation durch die Poissonverteilung ● Beispiel (Tafel): – Das Restaurant Fat’s Pizza führt Buch über die Anzahl an Gästen, die das Restaurant betreten. Laut der Aufzeichnungen ist der Erwartungswert λ = 12,1 zwischen 20:00 und 22:00 Uhr. Bestimme mit der Poisson-Verteilung, dass die Anzahl an Gästen in Fat’s Pizza zwischen 20:00 und 22:00 Uhr ● genau 8 sein werden ● höchstens 10 sein werden ● zwischen 9 und 15 sein werden (inklusive 9 und 15) 21 Zeit zum Üben 22 Lösungen ● 4) In einer technischen Anlage sind sehr viele Module eines bestimmten Typs verbaut. Durchschnittlich fallen 2,53 Module pro Tag aus. Die Verteilung der Ausfälle in der Anlage kann als poissonverteilt angenommen werden. Wie groß ist die Wahrscheinlichkeit, dass an einem Tag 3 Module ausfallen? Das Ergebnis soll auf fünf Nachkommastellen genau angegeben werden. 23 Lösungen ● ● ● 5) Man stelle sich den Eingang eines Kaufhauses vor, an dem ein Drehkreuz angebracht ist, das jedes mal, wenn eine Person das Haus betritt, einen Impuls aussendet. Langfristige Erhebungen haben gezeigt, dass durchschnittlich zwei Kunden pro Minute eintreten. (Dabei kann es natürlich auch passieren, daß in einer Minute niemand oder auch beispielsweise 15 Personen das Drehkreuz passieren.) Wie hoch ist die Wahrscheinlichkeit, dass in einer Minute maximal 5 Kunden eintreffen? Jede mögliche Anzahl an Kunden, die innerhalb einer bestimmten Minute ankommen, besitzt eine gewisse Wahrscheinlichkeit.Der Erwartungswert der Anzahl an Kunden, die pro Minute eintreffen, beträgt . Wir haben also einen Poisson-Prozeß mit der Intensität 2. Die gesuchte Wahrscheinlichkeit beträgt also 0.9834342; es werden also mit sehr hoher Wahrscheinlichkeit (in über 98 von 100 Fällen) maximal 5 Leute pro Minute ankommen. 24 Zusammenfassung ● Faustregel Binomialverteilung – Gegeben sei eine Situation, bei der 1. etwas gezählt und 2. bei der man das Ergebnis als unabhängige Überlagerung von sehr vielen BernoulliExperimenten interpretieren kann – ● dann kann man die Wahrscheinlichkeitsverteilung mit der Binomialverteilung ausrechnen! Faustregel Poissonverteilung – Gegeben sei eine Situation, bei der 1. etwas gezählt und 2. bei der man das Ergebnis als unabhängige Überlagerung von sehr vielen BernoulliExperimenten mit sehr kleiner Wahrscheinlichkeit und großen n interpretieren kann – Dann sagt das vorstehende Ergebnis, dass die fraglichen Wahrscheinlichkeiten poissonverteilt zu einem Parameter λ (Erwartungswert) sind. 25 Ausblick ● Nächste Woche werden wir uns mit dem Thema Exponentialverteilung beschäftigen! Vielen Dank für Eure Aufmerksamkeit! 26 Fachseminar zur Stochastik Die Exponentialverteilung 30.11.2015 Referenten: Carolin Labrzycki und Caroline Kemper 27 Gliederung ● Einstieg ● Gedächtnislose Wartezeiten ● Definition ● Satz ● Faustregel ● Beispiel ● Zeit zum Üben 28 Einstieg ● ● Es gibt zahlreiche Beispiele im täglichen Leben, in denen wir auf etwas warten – Auf den nächsten Regen – Auf die nächste Uni-Linie – Darauf, dass das Telefon der Freundin nicht mehr besetzt ist Doch der Charakter des Wartens kann ganz unterschiedlich sein: 29 Beispiel 1 Der zuverlässige Handwerker Er hat zugesagt, irgendwann zwischen 5 und 6 Uhr zu kommen. Um 5 Uhr erwarten wir ihn gleichverteilt innerhalb der nächsten Stunde, wir kalkulieren eine mittlere Wartezeit von 30 Minuten ein. Wenn er um 5.30 Uhr noch nicht da ist, schrumpft der Erwartungswert der Wartezeit auf 15 Minuten. Kurz: Die Zeitspanne, die wir schon gewartet haben, verändert die Erwartung für das zukünftige Warten. 30 Beispiel 2 Die besetzte Telefonleitung Sie rufen bei Ihrer Bank (oder Krankenkasse, Finanzamt, …) an, es ist besetzt. Im Mittel wird die Leitung nach drei Minuten frei sein, aber im Einzelfall kann man es nie genau wissen. Je nachdem, wie aufwändig die Beratung im Einzelfall ist, kann es auf unvorhersehbare Weise schneller oder langsamer gehen. Kurz: Auch wenn man schon eine Weile gewartet hat, verändert das die Prognose für die noch zu erwartende Wartezeit nicht. 31 ● ● Die zugehörigen Wahrscheinlichkeiten können sehr unterschiedlich sein Eine besondere Rolle spielen Wartezeiten, bei denen man nie genau weiß, wie lange es noch dauern wird 32 ● ● Jede auf irgendeinem Wahrscheinlichkeitsraum definierte Zufallsvariable T : 0, kann als Wartezeit interpretiert werden 33 Gedächtnislose Wartezeiten 34 Definition : Gedächtnislose Wartezeiten Es sei T eine Wartezeit, d.h. T : 0, Ist eine beliebige Zufallsvariable. Wir sagen, dass T gedächtnislos ist, wenn ℙ= T t ℙ ({T s t} | {T s}) für beliebiges s, t 0 gilt. 1 n ● Die Folge (a )mit an (1 ) ist konvergent. n n ● ● Aufgabe: Bildet den Grenzwert für die Folge Was fällt auf? 1 n an lim(1 ) n n Grenzwert 1 n ( 1 ) n n 1 2 2 2,25 3 2,37037… … 100 1.000 10.000 100.000 1.000.000 10.000.000 100.000.000 2,7048… 2,7169… 2,71814… 2,718268… 2,718280… 2,718281… 2,718281.. Ihr Grenzwert ist eine irrationale Zahl und heißt eulersche Zahl e. Es ist e 2,718281828459… . Satz 1 n ● Satz: Die Folge (a ) mit an (1 ) n n ist konvergent. Ihr Grenzwert ist eine irrationale Zahl und heißt eulersche Zahl e. Es ist e ≈ 2,71828... Satz: 1 n Die Folge (an ) mit an (1 n ) ist konvergent. Ihr Grenzwert ist eine irrationale Zahl und heißt eulersche Zahl e. Es ist e 2,71828… Alle Ereignisse ��∊ ℝ x n e lim (1 ) n n x Die e-Funktion ● Funktion: f ( x) e ● x f ' ( x ) e 1. Ableitung: ● Stammfunktion: F ( x) e a ● Integral: b x x b f ( x)dx e x a eb e a Satz ● Satz: – (i) Es sei T eine Wartezeit für die ℙ T exponentialverteilt zu irgendeinem Parameter λ>0 ist. Dann ist T gedächtnislos. – (ii) Sei umgekehrt T eine gedächtnislose Wartezeit. Wir setzen voraus, dass T im folgenden Sinn nichttrivial ist: Es gibt ein t0>0 mit ℙ ({T0 t0 }) 0 – T ist also nicht die Wartezeit, bei der {T=0} Wahrscheinlichkeit Eins hat – – Dann gibt es ein λ>0, so dass ℙT exponentialverteilt zum Parameter λ ist: Es ist ℙ ({a T b b}) e x dx a Faustregel zum Arbeiten mit gedächtnislosen Wartezeiten Angenommen, es geht um eine Wartezeit T, und aus irgendwelchen Gründen ist es plausibel anzunehmen, dass sie gedächtnislos ist (Beratung, besetztes Telefon usw.) Wenn dann T im Mittel der Wert µ hat, so kann T durch eine Exponentialverteilung mit Parameter 1 modelliert werden. : Faustregel zum Arbeiten mit gedächtnislosen Wartezeiten Angenommen, es geht um eine Wartezeit T, und aus irgendwelchen Gründen ist es plausibel anzunehmen, dass sie gedächtnislos ist (Beratung, besetztes Telefon usw.) Wenn dann T im Mittel der Wert µ hat, so kann T durch eine Exponentialverteilung mit Parameter 1 modelliert werden. : Beispiel Wenn Sie bei Ihrer besten Freundin / Freund anrufen, ist es oft besetzt, und im Mittel dauert es 20 Minuten, bis der Anschluss wieder frei ist. Solche Situationen, bei denen es „ungewiss lange“ dauert, können gut durch gedächtnislose Wartezeiten modelliert werden. Aufgrund der vorstehenden Faustregel kann man zur Modellierung eine Exponentialverteilung mit dem Parameter : 1 wählen. 20 Und nun können alle interessierenden Wahrscheinlichkeiten berechnet werden. Wie wahrscheinlich ist es zum Beispiel, dass die Leitung schon in 10 Minuten wieder frei ist? Die Lösung: siehe Tafel Zeit zum Üben Lösungen 1. F ( x) 1 e 1 0,2 5 x 10 x F (10) 1 e 0 , 210 0,8647 Lösungen 2. F ( x) 1 e x 1 6 x 10 F (10) 1 (1 e ● 1 10 6 )e 10 6 0,1889 Die Verteilungsfunktion der Exponentialverteilung ist hier anzuwenden. Diese gibt die Wahrscheinlichkeit an, dass eine Zeitlücke „kleiner gleich x“ auftritt. Deshalb muss über 1-F(x) die Gegenwahrscheinlichkeit gebildet werden. Die Parameter λ ist der Kehrwert des Mittelwertes. Lösungen 3. x F ( x) 1 e 1 0,1 10 x 8 F (8) 1 e 0 ,18 0,5507 Vielen Dank für Eure Aufmerksamkeit!