1 Kapitel 9 Einzelne parametrische Verteilungen Letzte Änderung 8. Mai 2001, 21 Seiten Den folgenden speziellen Verteilungen liegt immer eine Zufallsvariable X zugrunde: X: Ω →R 1 Diskrete Gleichverteilung Die einfachste Wahrscheinlichkeit, die offensichtlich alle drei Axiome der Wahrscheinlichkeit erfüllt, ist die sog. Gleichverteilung, die sog. Laplace-Zähldichte. Jedes von N Elementarereignissen hat die gleiche Wahrscheinlichkeit, d.h. für Ω = {ω1,ω2,...,ωN } 1 gilt: p k = P({ωk}) = P(X = k)= , k = 1,2, ..., N . N Dann heißt die Zufallsvariable X gleichverteilt. Mit dieser Zuordnung von P(.) ist die große Rolle der Kombinatorik einsichtig. Aus der Kombinatorik wird die Menge der Möglichkeiten bestimmt, und dann wird jedem Element die gleiche Wahrscheinlichkeit zugeteilt. Es ist eine allgemeine Konstruktionsidee für Wahrscheinlichkeiten. 1.1 Beispiel Die beliebige Gleichverteilung: Ω = {-3, 1, 6} mit 1 1 1 p 1 = P({-3}) = P(X = -3) = , p 2 = P({1}) = P(X = 1) = , p 3 = P({6}) = P(X = 6) = . 3 3 3 1.2 Beispiel Die (lückenlose) Gleichverteilung U(a,b): Eine Gleichverteilung auf den ganzen Zahlen von a bis b, (a=-3 und b=5): Ω = {-3, -2, -1, 0, 1, 2, 3, 4, 5} In diesem Sonderfall der lückenlosen Aufeinanderfolge zwischen unterer Grenze a=-3 und oberer Grenze b=5 der natürlichen Zahlen gilt offensichtlich: 1 1 p k = P({ω k}) = P(X = ω k) = = , k = 1,2,...,9. b- a + 1 9 1.3 Beispiel Eine Gleichverteilung von 1 bis 6 Ω ={1, 2, 3, 4, 5, 6} Dieser Sonderfall der diskreten Gleichverteilung, der lückenlosen Aufeinanderfolge zwischen unterer Grenze a =1 und oberer Grenze b = 6 der natürlichen Zahlen, beschreibt den Wurf eines fairen (idealen) Würfels. Offensichtlich gilt: 1 1 p k = P({ω k}) = P(X = ω k) = = , k = 1,2,3,4,5,6. b- a + 1 6 Diese Gleichverteilung wird als U(a,b) bezeichnet, hier U(1,6), der faire (ideale) Würfel, in Beispiel 2 mit U(-3, 5) 2 2 Die Bernoulli-Verteilung Wenn der Ereignisraum Ω nur genau zwei Elemente Ω = {ω1, ω2} mit P({ω1}) = p, P({ω2}) = 1-p, 0 < p < 1 enthält, dann heißt die Zufallsvariable Bernoulli-verteilt, abgekürzt X ~ B(1,p). In jedem Fall kann man die beiden möglichen Ergebnisse des Zufallsvorgangs durch die Zahlen 0 und 1 repräsentieren. 2.1 Beispiele Hierzu gibt es eine Vielzahl von Anwendungen: 1. Belegung eines Chips: 0 2, Stellung eines Schalters: an 3. Geschlecht eines Kindes: Knabe 4. Typ einer Manöverpartei: blau 5. Ergebnis eines Münzwurfs: Zahl 1 aus Mädchen rot Adler In der letzten Interpretation mit p=1/2 wird die Situation als Modell einer fairen (idealen) Münze bezeichnet. Empirische Münzen sind im Regelfall nicht fair bzw. müssen es auch nicht sein, ihre Prüfung z.B. in Automaten geschieht ohnehin anders - nach Gewicht, Leitfähigkeit u.ä.; ihre Verwendung in Glücksspielen ist meist gezielt nicht fair. 2.2 Aufgabe (Die Zähldichte der Bernoulli-Verteilung) Zeigen Sie, daß 1 x 1-x P[X=x]= p (1-p) ; x=0,1; 0 ≤ p ≤ 1 x eine Zähldichte ist. Berechnen Sie den Erwartungswert und die Varianz der zugehörigen Zufallsvariablen. Die Lösung ist eine unmittelbare Anwendung der Definitionen: P[X=0] = 1-p, P[X=1] = p; E(X)= p; var(X)= p(1-p). (Diese Aufgabe ist ein Vorgriff auf Kapitel 10) 3 3 Die Binomial-Verteilung Wird ein Bernoulli-Zufallsexperiment nicht einmal, sondern n-mal in Folge durchgeführt und zwar so, daß jeder Versuch unabhängig von den anderen Ver-suchen ist, d.h. wenn wieder Ω = {ω1, ω2} = {0, 1} gilt, und man sich nun für die Anzahl der 1 bei n-maliger Durchführung dieses Zufallsexperiments interessiert, dann erhält man die Binomial-Zähldichte n-k n k p k = P(X = k) = p (1-p) , 0 < p < 1 , k = 0,1,2,...,n . k Eine Kurzschreibweise ist X ~ B(n,p). Der Beweis, daß diese Zähldichte die drei Axiome der Wahrscheinlichkeit erfüllt, gelingt am einfachsten aus dem binomischen Lehrsatz (s.o.) mit a = p und b = 1-p. 3.1 Der Sonderfall der Bernoulli-Zähldichte Der Fall der Bernoulli-Zähldichte ist offenbar der Sonderfall für n=1. Das läßt sich auch direkt zeigen: 1-0 1 0 p0 = p (1-p) = 1-p , 0 1-1 1 1 p1 = p (1-p) = p . 1 Eine Veranschaulichung des Bildungsgesetzes für die Binomialzähldichte ist der folgende Baum. Nach links wird jeweils der Zweig für eine Eins und nach rechts jeweils der Zweig für eine Null gezeichnet. Verknüpft man dann jeweils die Kanten eines Weges nach unten multiplikativ (wegen der Unabhängigkeit der aufeinanderfolgenden Durchführungen des Zufallsexperiments), dann gibt die Folge der p und (1-p) die jeweiligen Wahrscheinlichkeiten an, um an das Ende des Baumes zu gelangen und eine bestimmte Zahl von Einsen zu bekommen. 3.2 Die Zahl der Einsen p p 1-p 1-p p 1-p p 1-p p 1-p p 1-p p 1-p 3 2 2 1 2 1 1 0 Von besonderer Bedeutung ist wieder der symmetrische (faire, ideale) Fall, d.h. p = 1/2. 4 3.3 Beispiel Eine faire Münze wird eine gerade Anzahl von Malen geworfen. Wie groß ist die Wahrscheinlichkeit, ebenso oft Zahl wie Adler zu erhalten? n 2n-n 2n 2n (2n)! 1 2n 1 1 2n 1 P(X = n) = = = n 2 2 n 2 n! n! 2 bzw. mit der Stirlingschen Annäherung: 1 P(X=n) ≈ (Dies ist eine sehr kleine Zahl für n → ∞). π⋅n Für 2n=4 etwa und mit der Bezeichnung A = Adler, Z = Zahl, X = Zahl der Adler in den 4 Würfen erhält man den Ereignisraum Ω: AAAA X=4 Hier ist: ZAAA AZAA AAZA AAAZ X=3 ZAAZ ZAZA AZAZ ZZAA AZZA AAZZ ZZZA ZZAZ ZAZZ AZZZ X=2 X=1 2 4 1 1 4-2 4 P(X =2) = = 2 2 2 2 ZZZZ X=0 1 4 4! 1 4 3 = = . 2 2! 2! 2 8 3.4 Aufgabe (Beispiel ‘Multiple Choice’) In einer Prüfung werden 5 Fragen gestellt. Jede Frage kann nur falsch oder richtig beantwortet werden, und die Richtigkeit der Antwort zu einer Frage werde nicht von der Richtigkeit der Antwort zu einer anderen Frage beeinflußt. Die Prüflinge sollen außerdem alle über die gleichen Fähigkeiten verfügen. a) Wie groß ist die Wahrscheinlichkeit, daß ein Kandidat alle Fragen richtig beantwortet? b) Wie groß ist die Wahrscheinlichkeit, daß ein Kandidat mindestens drei Fragen richtig beantwortet? c) Wie groß ist die Wahrscheinlichkeit, daß ein Kandidat genau die zweite Frage bzw. nur eine einzige beliebige Frage richtig beantwortet? d) Wie groß ist die durchschnittliche Zahl der richtig beantworteten Fragen? e) Wie groß muß die Wahrscheinlichkeit für eine richtige Antwort sein, damit im Durchschnitt 4 Fragen richtig beantwortet werden? Lösung: Voraussetzung: Alle Fragen sind gleichschwierig, und die Beantwortung ist jeweils statistisch unabhängig! Damit folgt eine Binomialverteilung. a) P[alle Fragen richtig] = p5 5 3 b) P[drei Fragen richtig und 2 Fragen falsch] = p (1-p)2 3 c) P[genau die 2. Frage richtig und alle übrigen Fragen falsch] = p (1-p)4, bzw. 5 P[genau eine einzige beliebige Frage richtig und vier Fragen falsch] = p (1-p)4 1 d) Mittelwert der Verteilung np = 5p e) np= 4, also p= 4/5 5 3.5 Aufgabe (Geburtshäufigkeiten) Die Wahrscheinlichkeit, daß ein Kind ein Knabe ist, beträgt (weltweit) etwa 1-p =0.51. Wie groß ist die Wahrscheinlichkeit, daß alle drei Kinder eines Elternpaares Mädchen sind? Wie beurteilen Sie die Behauptung eines Vaters, da die ersten drei Kinder Mädchen seien, das vierte ein Junge werden müsse? Wie groß ist die Wahrscheinlichkeit hierfür? Lösung: Bei Unabhängigkeit der Ereignisse beträgt die Wahrscheinlichkeit, daß alle drei Kinder 49 3 117 649 Mädchen sind, p3 = = ≈ 0.1 100 1 000 000 Die Wahrscheinlichkeit, daß das vierte Kind ein Junge ist, beträgt dann ebenso wie bei den ersten dreien unverändert 0.51. Für diese Aufgabe ist die Behauptung des Vaters unbegründet, da es sich um unabhängige Ereignisse handelt, also stets, in jeder Geburt: p = 0.49. Der Lösungsbaum für das Problem ist der folgende Ereignisbaum: + M M K K M K M K M K M K M K KMM KMK KKM KKK MMM MMK MKM MKK n m P(X=m) = p (1-p)n-m, n=3 (K = Knabe, k=0,1,2,3; M = Mädchen, m=0,1,2,3; k die Zahl m der Knaben bzw. m die Zahl der Mädchen) 3 3 Für n=3 und m=3 folgt p (1-p)3-3 = p3, wie oben direkt abgeleitet 3 Beachten Sie, daß individuell die Frage der Unabhängigkeit der Geburten durchaus nicht selbstverständlich ist; dazu sehe man z.B. die lange weibliche Generationenfolge im niederländischen Herrscherhaus bzw. man befrage seinen Hausarzt bzw. betrachte das abnorme Geburtsverhältnis in solchen Ländern, in denen Knaben eklatant höher als Mädchen geschätzt werden, d.h. weibliche Embryos eher als männliche abgetrieben werden, z.B. verbreitet in Indien und China. 6 3.6 Aufgabe (Zuverlässigkeit paralleler Systeme) Ein Flugzeugmotor eines bestimmten Typs fällt während des Fluges mit der Wahr-scheinlichkeit 1 - q aus. Der Ausfall eines solchen Motors erfolgt unabhängig vom Aus-fall der anderen Motoren des Flugzeugs. Wenn nicht mehr als die Hälfte der Motoren ausfällt, kann ein Flug sicher beendet werden. Für welche Werte von q ist eine viermotorige Maschine, die mit solchen Motoren ausgerüstet ist, sicherer als eine entsprechende zweimotorige Maschine? Lösungsalternative 1: Vergleich zweier Binomialverteilungen: X die Zahl der Motore, die ordnungsgemäß arbeiten: X 1~ B(4, q), X2 ~ B(2, q), P(Triebwerk funktionstüchtig) = q φ Fall 1: 4 Triebwerke: M1M2 | | + M3M4 P[Absturz] = P(X1 ≤1) = P(X1 = 0) + P(X1 = 1) = 4 4 1 (1-q)4 + q (1-q)3 = (1-q)4 + 4q(1-q)3 0 1 φ Fall 2: 2 Triebwerke: M1 | + M2 2 (1 - q)2 = (1 - q)2 0 Bei Vorteilhaftigkeit von 4 Triebwerken muß gelten: (1-q)4 + 4q(1-q)3 ≤ (1 - q)2 ⇔ (1-q)2 + 4q(1-q) ≤ 1 ⇔ 1 - 2q + q2 + 4q - 4q2 ≤ 1 2 ⇔ - 3q2 + 2q ≤ 0 ⇔ q(2 - 3q ) ≤ 0 ⇒ q ≥ 3 Alternative 2: Vergleich zweier Binomialverteilungen: X die Zahl der Motore, die nicht arbeitet X~ B(n,1-q), P(Triebwerkausfall) = 1-q; n=4,2 Fall 1: 4 Triebwerke 4 4 P[Flug] = P(X<2) = P(X=0) + P(X=1) = (1-q)4 q 0 + (1-q) 3 q1 0 1 Fall 2: 2 Triebwerke 2 P[Flug] =P(X<1) = P(X=0)= (1-q)2 q 0 = (1 - q)2 0 P[Absturz] =P(X2 = 0) = Der Vergleich beider Wahrscheinlichkeiten ist identisch mit dem der ersten Alternative. Wie die folgende Graphik zeigt, hängt die Vorteilhaftigkeit, ob vier oder zwei Triebwerke sicherer sind, davon ab, ob q unterhalb oder oberhalb eines Schwellenwertes liegt. Vier Motore sind überraschenderweise nicht durchgängig sicherer. 7 3.7 Ein Random Walk Eine besonders schöne Anwendung der binomialen Zähldichte ist das folgende Froschproblem. Sei ein Lebewesen (z.B. ein Frosch) zur Zeit 0 in der Ausgangsposition 0, wie in der Abbildung verdeutlicht. Zu diskreten Zeitpunkten, z.B. kt springt der Frosch entweder um λ Wegeinheiten mit der jeweiligen Wahrscheinlichkeit von 1/2 vorwärts oder rückwärts. c ------.----.----.----.----.----.----.----.----.----.----.----. -3λ -2λ -1λ 0 +λ +2λ +3λ Seien m und n gerade ganze Zahlen. Was ist dann die Wahrscheinlichkeit, daß der Frosch zur Zeit nt nach dem letzten Sprung an Position mλ ist? Das ist die Wahrscheinlichkeit, 1 1 daß er (m+n) Sprünge vorwärts und (n-m) Sprünge rückwärts gemacht hat, denn 2 2 1 1 (n+m) - (n-m) = m. Zeigen Sie: Die geeignete Zähldichte ist dafür die binomiale und es 2 2 gilt: P[zur Zeit nt in Position mλ] = n 1 n+m 2 2n = n 1 n-m 2 2n 8 4 Die geometrische Verteilung Der Ereignisraum der geometrischen Zähldichte ist im Gegensatz zu den beiden vorhergehenden Beispielen nicht endlich, sondern abzählbar unendlich: Ω = {ω1, ω2, ...,ωn-1, ωn, ...} = { 0, 1, ..., n-2, n-1, ...} Dann ist die Zähldichte pk = P(X=k) = p(1-p)k, 0<p<1, k= 0,1,2,.... und die Zufallsvariable heißt geometrisch verteilt. Die drei Wahrscheinlichkeitsaxiome werden offensichtlich erfüllt: Axiom (A1) folgt aus 0<p<1, Axiom (A2) aus der geometrischen Reihe, die der Zähldichte ihren Namen gibt: ∞ ∑ k=0 ∞ pk = ∑ p(1-p) k =1. k=0 Interpretation und Veranschaulichung kann wie bei der Binomialzähldichte über einen Ereignisbaum vorgeführt werden, indem man den Erfolg nach links und den Mißerfolg nach rechts abträgt. Dann ist offensichtlich, daß die geometrische Dichte pk die Wahrscheinlichkeit beschreibt, nach k Fehlschlägen einen ersten Erfolg zu haben. M.a.W. sie beschreibt das Auftreten der ersten Eins in einer Situation wie in der BinomialZähldichte, aber mit dem entscheidenden Unterschied, daß das Münzwerfen so lange fortgesetzt wird, bis eine 1 erscheint. Theoretisch kann das beliebig lange dauern. Die Verteilung läßt sich explizit bestimmen: k k k+1 1-p k+1 ∑ p i = ∑ p(1-p) = p 1-(1-p) = 1-p . i=0 i=0 Der Ereignisbaum für die geometrische Verteilung: p k 1-p p 1-p p 1-p • p • • 1-p • Eine Kurzschreibweise ist X ~ NB(1,p) = G(p). • • 9 4.1 Aufgabe zur Interpretation der geometrischen Zähldichte Ein Telefonteilnehmer wird so lange angewählt, bis eine Verbindung zustande kommt. Bei jedem Versuch kommt diese Verbindung mit der Wahrscheinlichkeit von p= 0.75 zustande. Geben Sie die Zufallsvariable X, die die Anzahl der Versuche beschreibt, vollständig an und bestimmen Sie deren Zähldichte. 4.2 Aufgabe (Schlüsselprobe) Nach einer ausgedehnten Zechtour kommt Professor U nach Hause und versucht, die Haustür aufzuschließen. Von den 10 Schlüsseln am Bund versucht er, den passenden durch Ausprobieren zu finden. Wie groß ist die Wahrscheinlichkeit, nach spätestens drei Versuchen ins Haus zu gelangen, wenn a) er sich nicht merken kann, welchen Schlüssel er schon ausprobiert hat, b) er sich merken kann, welchen Schlüssel er schon ausprobiert hat? Lösung: Teil a) ist eine geometrische Situation: pk = p(1-p)k, p =0.1. Die Zahl der Schlüssel (n=10) spielt keine Rolle. Die gesuchte Wahrscheinlichkeit ist p0 + p1 + p2 = p + p(1-p) + p(1-p)2 = 0.1 + 0.1 . 0.9 + 0.1 . 0.92 = 0.100 + 0.090 + 0.081 = 0.271 Teil b) ist eine Warte-Verteilung ähnlich der hypergeometrischen Situation. Sei pk = P({Erfolg im k-ten Versuch}), k=1,2,3 1 9 1 9 8 1 p1 = , p2 = ⋅ , p3 = ⋅ ⋅ , also p1 + p2 + p3 = 0.3. 10 10 9 10 9 8 5 Pascal-Verteilung Eine Verallgemeinerung der geometrischen Verteilung ist die Pascal-Verteilung. NB(r,p) (auch als negative Binomialverteilung bezeichnet, r=1,2,3,...). Sie gibt die Wahrscheinlichkeit dafür an, daß r (r≥1) Erfolgen k Fehlschläge vorausgehen. P({k Fehlschläge vor dem r-ten Erfolg, r≥1}) = k r+k-1 r P(X = k) = p (1-p) ; k= 0, 1, 2, ... ; r= 1, 2, ... . k Eine Kurzschreibweise ist X ~ NB(r,p). Für r=1 folgt die geometrische Zähldichte NB(1,p). 10 6 Hypergeometrische Verteilung Für natürliche Zahlen M, N, n, k mit 0≤k≤m=min{n,M}, M≤N und dem Ereignisraum Ω= {ω1, ω2, ..., ωm} ist die Zähldichte der hypergeometrischen Verteilung gegeben durch: (1) M N-M k n-k p k := P(X = k) = , k = 0,1,2,...,m. N n Eine Kurzschreibweise ist X ~ H(M,N,n). Das zugrundeliegende Urnenmodell ist eine Urne mit N Kugeln, von denen M die eine Farbe aufweisen und N-M eine andere Farbe (z.B. rot und blau). Aus der Urne werden n Kugeln (n<M) ohne Zurücklegen und ohne Berücksichtigung der Reihenfolge entnommen (vergl. das Modell des Binomialkoeffizienten). Zur Bestimmung der Zahl der Möglichkeiten für eine solche Wahl gibt es zwei äquivalente Wege: N Übersieht man die Farbe, so sind es offensichtlich Möglichkeiten. n Betrachtet man zugleich die Farbe, so gibt es n+1 unterschiedliche Wahlmöglichkeiten: rote Kugeln blaue Kugeln unterschiedliche Kombinationen 0 n-0 M N–M 0 n 1 n-1 M N–M 1 n–1 2 n-2 M N–M 2 n–2 k n-k M N–M k n–k n 0 M N–M n 0 N gleich der Summe der unterschiedlichen Kombinationen aus der rechten Spalte ist, n ist bewiesen, daß (1) eine Zähldichte ist. Denn es gilt: Da 0 ≤ pk ≤ 1 , M ∑ p k = 1. k=0 11 6.1 Beispiel (Das Lottoproblem "6 aus 49 ohne Zusatzzahl") N = 49, M = 6 (die Gewinnzahlen), n = 6 (die angekreuzten Zahlen des Tippzettels; pk bedeutet daher die Wahrscheinlichkeit, k richtige Gewinnzahlen angekreuzt zu haben. Diese Wahrscheinlichkeiten sind für k≥3 außerordentlich gering, wie die folgende Tabelle verdeutlicht. Lotto-Spielen ist daher, obwohl weltweit allgegenwärtig, irrational und beruht auf anderen menschlichen Verhaltensweisen als einem wissenschaftlich begründeten Kalkül, Millionär zu werden. Zahl der Gewinnzahlen k 0 1 2 3 4 5 6 pk p0 = 6 0 43 49 / 6 6 6 096 454 ≈ 0.435965 13 983 816 p1 = 6 1 43 49 / 5 6 5 775 588 ≈ 0.413 13 983 816 p2 = 6 2 43 49 / 4 6 1 851 150 ≈ 0.1324 13 983 816 p3 = 6 3 43 49 / 3 6 246 820 ≈ 0.01765 13 983 816 p4 = 6 4 43 49 / 2 6 13545 ≈ 0.001 13 983 816 p5 = 6 5 43 49 / 1 6 258 ≈ 0.00001845 13 983 816 p6 = 6 6 43 49 / 0 6 1 ≈ 0.000000072 13 983 816 Eine interessante Anschluß-Frage ist die folgende Aufgabe: 6.2 Aufgabe Welches der beiden folgenden Ergebnisse beim “Lotto am Sonnabend 6 aus 49” halten Sie für wahrscheinlicher? A = {(7, 24, 31, 44, 45)} oder B = {(1, 2, 3, 4, 5, 6)} Begründen Sie ihre Entscheidung! Die Lösung ist trivial, aber denoch richtig und wichtig: beide sind gleich wahrscheinlich. 12 6.3 Aufgabe (Ein hypergeometrischer Ereignisraum) Aus einem Behälter, der acht mit 1, 2, ..., 8 numerierte Kugeln enthält, wird ohne Zurücklegen eine Stichprobe vom Umfang 3 gezogen. Betrachten Sie die möglichen Elementarereignisse in der Form ω = (ω1, ω2, ω3, ..., ω8) mit ω1, ..., ω8∈{0,1} und ω1 +... + ω8 = 3, d.h. ωi = { 01 ,, falls Kugel Nr. i gezogen wird falls Kugel Nr. i nicht gezogen wird a) Wieviele Elemente hat Ω? b) Nehmen Sie an, daß die Kugeln Nr. 1 und 2 rot, die Kugeln Nr. 3, 4, 5 grün und die Kugeln Nr. 6, 7, 8 weiß sind und beschreiben Sie das Ereignis A "Zwei der gezogenen Kugeln sind rot" explizit als Teilmenge von Ω. c) Mit welcher Wahrscheinlichkeit tritt das Ereignis A aus b) ein? Lösung: a) In dem Behälter sind die Kugeln {R, R, G, G, G, W, W, W}, damit folgen (siehe auch b): 8 8! 8.7.6 = = . . = 56 Elemente 3 3! 5! 1 2 3 b) A = { (1,1,1,0,0,0,0,0), (1,1,0,1,0,0,0,0), (1,1,0,0,1,0,0,0), (1,1,0,0,0,1,0,0), (1,1,0,0,0,0,1,0), (1,1,0,0,0,0,0,1) }, |A| = 6 6 3 c) P(A) = = 56 28 6.4 Aufgabe (Ein Beispiel zum Rechnen) Eine kleine Werkstatt stellt pro Tag 10 sehr teure Haushaltsmaschinen her. Der Hersteller weiß, daß pro Tag drei defekte Maschinen darunter sind, was jedoch äußerlich nicht erkennbar ist. Die Maschinen werden deswegen genauso verkauft wie die einwandfrei funktionierenden. Nachdem dies in der Presse vermutet wurde, entschließt sich die Stiftung Warentest, eine halbe Tagesproduktion aufzukaufen und zu untersuchen. Wie groß ist die Wahrscheinlichkeit, daß dabei mindestens zwei defekte Maschinen gefunden werden? Lösung: X ist hypergeometrisch verteilt: 3 7 3 7 2 3 3 2 1 P[ X ≥2 ] = P[ X =2 ] + P[ X = 3 ] = + = 2 10 10 5 5 NB: Es empfiehlt sich kein umständliches, voreiliges Ausrechnen der Ausdrücke, sondern erst zu kürzen und damit ein einfaches Ergebnis zu bekommen. 13 6.5 Aufgabe (zur Qualitätskontrolle) In der Abnahme-Qualitäts-Kontrolle wird oft folgendermaßen verfahren: Aus einer Packung mit z.B. N = 50 Artikeln werden k = 5 zufällig entnommen und überprüft. Nach der Prüfung sind die entnommenen Stücke vernichtet (destruktive Prüfung). Sind alle 5 entnommenen Stücke einwandfrei, wird die Packung angenommen, sonst nicht. Wie groß ist die Wahrscheinlichkeit, daß eine Packung angenommen wird, obwohl sie a% = 20% Ausschuß enthält? Lösung : 20% Ausschuß heißt: es gibt 0.2. 50 = 10 = M defekte Stücke (20% Ausschuß ⇔ 10 von 50), also für ein beliebiges k (k=1,2,3,4,5) 40 10 k 5-k =P[k Stücke sind in Ordnung] = P["alle k ersten Züge sind erfolgreich"]=:Pk 50 5 P5 = 40 5 10 0 50 5 = 40! 45! 40 39 38 37 36 ⋅ ⋅ ⋅ ⋅ = = 31% 35! 50! 50 49 48 47 46 6.6 Aufgabe (zur Berücksichtigung von Bedingungen) Aus einer Sendung von Maschinenteilen, unter denen sich n einwandfreie und m minderwertige befinden mögen, wähle man zur Kontrolle willkürlich s Stück aus. Bei der Überprüfung zeige sich, daß die ersten k der s Maschinenteile einwandfrei sind. Man bestimme die Wahrscheinlichkeit dafür, daß auch das (k+1)-te Maschinenteil einwandfrei ist. n m k 0 n!(n +m –k)! Lösung: P("k einwandfreie Teile bis k < s") = = = P[B] n+m (n – k)!(n+ m)! k n –k m 1 0 n–k P("(k+1)-tes Teil einwandfrei") = = = P[A|B] n+m – k n + m –k 1 . P[A ∩ B] = P[A|B] P[B] mit den Ereignissen: A = “(k+1). Teil einwandfrei nach k einwandfreien Teilen”, B = “k einwandfrei”. Man vergleiche die (k+1) Stichprobe n m k+ 1 0 n! (k+ 1)!(n +m – k–1)! n! (n +m – k–1)! = = n+m (k+ 1)!(n –k – 1)! (n + m)! (n – k– 1)! (n+ m)! k+ 1 mit der sequentiellen Stichprobe, erst k Teile, dann noch ein weiteres Teil: n–k n!(n +m –k)! n!(n +m – k– 1)! P[A|B] P[B] = = n + m –k (n – k)!(n+ m)! (n – k–1)!(n + m)! 14 6.7 Aufgabe (Urnenproblem) In einem Los von N Stücken sind M defekte Stücke enthalten. Wie groß ist die Wahrscheinlichkeit, beim Ziehen von n Stücken ohne Zurücklegen und ohne Berücksichtigung der Reihenfolge insgesamt k defekte zu erhalten? 6.8 Verallgemeinerungen der hypergeometrischen Situation Aufgabe (zum Bestimmen von Ausschüssen aus mehr als einer Gruppe) Aus einer Gruppe von 3 Schlagzeugern, 3 Bassisten und 3 Pianisten werden zufällig drei Personen ausgewählt. a) Wie groß ist die Wahrscheinlichkeit, daß alle 3 ausgewählten Personen verschiedene Instrumente spielen? b) Wie groß ist die Wahrscheinlichkeit, daß alle 3 ausgewählten Personen das gleiche Instrument spielen? Lösung 3 3 3 3 3 1 1 1 1 3 18 9 1 a) = = , b) = 56 28 28 9 9 3 3 Aufgabe (zum Bestimmen von Ausschüssen aus mehr als einer Gruppe) Aus einem Chor von 20 Sopranisten, je 15 Altisten und Bässen und 10 Tenören werden 40 Sänger für das nächste Konzert zufällig und unabhängig voneinander ausgewählt. Es werden je Stimme jedoch 10 Sänger benötigt. Wie groß ist die Wahr-scheinlichkeit, daß das Konzert stattfindet? Lösung: Ω: Chorbesetzung bei Auswahl von 40 Sängern aus 60 möglichen Sängern A: Auswahl von 10 Sängern je Stimme 20 15 15 10 20! 15! 2 ⋅ 10 10 10 10 A 10! ⋅ 10! 10! ⋅ 5! . 184756 ⋅ 30032 P(A)= = = 1= Ω 60! 60 4.1918 ⋅ 1015 40! ⋅ 20! 40 = 0.0003975 (≈ 0.04%) 15 6.9 Beispiel (Das Schätzproblem für die Größe der Grundgesamtheit) Wie später allgemein gezeigt wird, heißt die Bestimmung eines unbekannten Parameters einer Verteilung, z.B. N in H(M, N, n) das statistische Schätzproblem für den Parameter. Für die hypergeometrische Verteilung bietet es sich an, ein solches Schätzproblem schon hier zu behandeln: In vielen Anwendungen ist zwar M bekannt, aber nicht N, z.B. in biologischen Problemen folgender Art: Für eine vom Aussterben bedrohte Vogelart soll die Größe der Population bestimmt werden. Nachdem M dieser Vögel gefangen und beringt und wieder in die Freiheit entlassen worden sind, wird nach einiger Zeit eine Prüfaktion unternommen. Es werden erneut Vögel dieser Art gefangen, diesmal n, und untersucht, wieviele das Merkmal Ring besitzen, nämlich k. Damit kann auf N zurückgeschlossen werden. Da die Zähldichte von N abhängt, pk = pk(N), eine in N unimodale Funktion ist, nimmt das Verhältnis p k(N) (N – M)(N –n) = p k(N–1) N –M –n – k für das maximale N, d.h. das N, das den größten Wert der Zähldichte für die beobachtete Stichprobe {M, n, k} erzeugt, den Wert 1 an. p k(N) p =1 p k(N–1) liefert die Bedingung: M k = , N n in Worten: sowohl in der Grundgesamtheit als auch in der Stichprobe sind die Anteile des Merkmals (Ring oder Nicht-Ring) gleichgroß, falls M⋅n N= . k Damit ist ein Schätzwert für N gewonnen, z.B. für M=100 Ringe in der ersten Stichprobe und einer zweiten Stichprobe von n=50 Vögeln und k=20 Ringen, N=250. Nach diesem Verfahren müßte man daher von 250 Vögeln dieser Spezies ausgehen. 16 6.10 Aufgabe (zur Schätzung) Vor den Augen der Zuschauer setzt ein Zauberkünstler drei weiße Häschen in seinen Hut, der bisher nur schwarze Häschen enthält. Nun läßt er einen Zuschauer in den Hut greifen und drei Häschen nacheinander herausnehmen, ohne sie wieder zurückzulegen. Er zieht 2 schwarze und 1 weißes (oder alternativ: 1 schwarzes und 2 weiße). Halten Sie es für wahrscheinlicher, daß insgesamt 7 oder 8 Häschen im Hut waren? Lösung: Dies ist eine hypergeometrische Situation, entweder ist die Grundgesamtheit 7 oder 8, d.h. es gibt zwei mögliche Fälle, Fall 1 und Fall 2: { w w w s s s s } oder { w w w s s s s s } Sei X die Anzahl der aus dem Hut gezogenen schwarzen Häschen. Die erste Interpretation der Aufgabe ist: 3 4 1 2 18 Fall i) X~H(3,7,3), P(X = 2) = = = 0.514286 35 7 3 3 5 1 2 15 Fall ii) X~H(3,8,3), P(X = 2) = = = 0.53571 28 8 3 Die zweite Interpretation der Aufgabe (in Klammern) ist die folgende: 3 4 2 1 12 Fall i) X~H(3,7,3), P(X = 2) = = = 0.34286 35 7 3 3 5 2 1 15 Fall ii) X~H(3,8,3), P(X = 2) = = = 0.26786. 56 8 3 Es sind 7 Hasen mit { w w w s s s s } zu vermuten, da hier das Auftreten (2s/1w bzw. 1s/2w) mit höherer Wahrscheinlichkeit stattfindet. 17 7 Die Poisson-Verteilung Hier enthält der Ereignisraum wieder abzählbar unendlich viele Elemente: Ω= {ω1, ω2, ...,ωn-1, ωn, ωn+1, ...} = { 0, 1, ..., n-2, n-1,n, n+1, ...} und die Zähldichte ist wie folgt definiert: λk p k = P(X =k) =e -λ , 0 < λ∈R, k= 0, 1, 2, ... . k! Auch hier ergibt sich das Zutreffen der Axiome unmittelbar aus pk >0 sowie aus direkter Betrachtung der Zähldichte: ∞ ∞ ∑ pk = ∑ k=0 k=0 λk - λ e =1 k! Eine Kurzschreibweise ist X~P(λ). Eine einfache Rekursionsformel zur tatsächlichen Berechnung ist λ pk = pk-1 , k = 1,2, ..., mit p 0 = e-λ k k p k = P(X = k) = e -λ λ , 0 < λ∈R , k = 0,1,2,... . k! Die Interpretation der Poisson-Verteilung ist die als Wahrscheinlichkeit sehr seltener Ereignisse. Historisch bedeutsam zur Entwicklung dieser Verteilung war die Wahrscheinlichkeit dafür, daß ein Kavallerist innerhalb eines Jahres am Huftritt seines Pferdes stirbt. Empirisch heute wichtiger ist die Wahrscheinlichkeit eines Unfalls auf einem bestimmten Straßenabschnitt innerhalb einer vorgegebenen Zeitperiode; das Auftreten von Telefonstörungen; aber auch Fragestellungen im R3: z.B. das Auftreten von Rosinen in einem cm 3 Topfkuchen, der insgesamt nur wenige Rosinen enthält. 18 Die folgenden Aufgaben illustrieren typische Fälle. 7.1 Aufgabe (Selbstmorde in einer Großstadt) Angenommen die tägliche Selbstmordrate in einer Großstadt sei poissonverteilt mit dem Erwartungswert 3. Berechnen Sie näherungsweise die Wahrscheinlichkeit dafür, daß während einer Periode von 20 Tagen weniger als 50 Selbstmorde begangen werden 7.2 Aufgabe (Druckfehler in einem Buch) In einem Buch mit 400 Seiten seien 200 Druckfehler zufällig verteilt. a) Welche Verteilung hat die Zufallsvariable X, die die Anzahl der Druckfehler pro Seite angibt? (e-0.5 = 0.6) b) Wie groß ist die Wahrscheinlichkeit, daß auf einer bestimmten Seite höchstens 1 Druckfehler ist? c) Wie groß ist die Wahrscheinlichkeit, daß auf einer bestimmten Seite mindestens 2 Druckfehler sind? (Hinweis: der Poisson-Parameter ist λ =0.5) 7.3 Aufgabe (Jagdtrophäen) Die Anzahl der Tiere, die bei einer Touristensafari erlegt werden, sei poissonverteilt mit Parameter λ = 4. a) Bestimmen Sie die Wahrscheinlichkeit, daß mindestens zwei Tiere erlegt werden. b) Bestimmen Sie die Wahrscheinlichkeit, daß weniger als drei Tiere erlegt werden. c) Leiten Sie den Erwartungwert der zugrundeliegenden Zufallsgröße her. Lösung a) P(X ≥ 2) = 1 - P(X < 2) = 1 - P(X = 1) - P(X = 0) = 1 - 4e-4 - e-4 = 1 - 5e-4 = 0.91 (Taschenrechnergenauigkeit) b) P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2) = e-4 + 4e-4 + 8e-4 = 13e-4 = 0.24 ∞ ∞ k k k-1 ∞ ∞ λ -λ -λ λ -λ λ -λ λ E(X) = kP(X = k) = k e = e k = e λ c) ∑ ∑ k! ∑ k! ∑ (k-1)! = λe e = λ k=0 k=0 k=0 k=1 19 7.4 Aufgabe (Unfälle) Nehmen Sie an, die Zahl der Unfälle beim Arbeiten mit Handbohrmaschinen innerhalb eines Jahres in einer bestimmten Stadt könne durch die Poisson-Verteilung mit Parameter λ = 5 beschrieben werden. Wie groß ist die Wahrscheinlichkeit, daß sich in einem bestimmten Jahr a) mehr als 5 Unfälle und b) genau 5 Unfälle ereignen? c) Geben Sie den 20%-Punkt der vorgegebenen Verteilung an. Lösung X~ P(λ) = P(5) a) P(X > 5) = 1 - [P(X = 0) + P(X = 1) + ... + P(X = 5)] P(X = 0) + P(X = 1) + ... + P(X = 5) = 50 51 52 53 54 55 = e-5 . + e-5 . + e-5 . + e-5 . + e-5 . + e-5 . = 0.616 0! 1! 2! 3! 4! 5! also P(X > 5) = 1 - 0.616 = 0.384 b) P(X = 5) = 0.1755 c) Die Werte sind entweder elementar auszurechnen oder einer Poissontafel zu entnehmen: P(X ≤ 3) = 0.2650, P(X ≤ 2) = 0.1247 ⇒ x0.20 = 3 7.5 Aufgabe (Das Auftreten schwerer Krankheiten) Die Verteilung für Herzanfälle auf der Fährverbindung von Schweden nach Finnland ist annäherungsweise durch eine Poisson-Verteilung beschrieben. Die durchschnitt-liche Zahl von Anfällen auf einer Reise (mit etwa 800 Passagieren) beträgt 2. Wie groß ist die Wahrscheinlichkeit von a) höchstens 2 Anfällen, b) mehr als 2 Anfällen, c) genau 2 Anfällen? Lösung P[X = k] = a) P[X ≤ 2] = e-2 (1 2 e-2 k k! 2 22 + + ) = 5e-2 ; b) P[X > 2] = 1 - P0 - P1 - P2 1! 2! c) P[X = 2] = P2 = e-2 22 = 2e-2 2! 20 7.6 Ein weiteres Beispiel für Poissonverteilte Beobachtungen: Die Zahl der fündigen Bohrlöcher pro Monat Zahl der Bohrlöcher Zahl der Monate Gesamt 0 123 1 67 2 27 3 10 4 0 5 1 228 7.7 Ein weiteres Beispiel für Poissonverteilte Beobachtungen: Die Zahl der Autos, die während 120 Zeiteinheiten der Länge von 30 sec an einer Zählstation vorbeifahren Zahl der Autos Zahl der 1/2 Minuten Gesamt 0 19 1 29 2 23 3 23 4 15 5 7 6 2 ≥7 2 120 21 Übersicht zu den Approximationsregeln diskreter Zufallsvariablen Hypergeometrische Zähldichte H(N,M,n) n/N≤0.05 n/(Ν−Μ)≤0.05 p=M/N Binomial-Zähldichte B(n,p) p≤0.1;n≥20;np≤10 λ=np PoissonZähldichte E(X)=var(X)=λ>9 B(n,p) np(1-p)>9 E(X)=np var(X)=np(1-p) Normaldichte Eine beliebige Verteilung mit E(X) und var(X)