Kapitel 4 Diskrete Verteilungen 4.1 Bernoulli-Verteilung Definition 4.1 Die Wahrscheinlichkeitsfunktion der Bernoulli-Verteilung ist gegeben durch 8 > < 1 für x = 0 für x = 1 PX (x) = > : 0 sonst : Die Bernoulli-Verteilung hat einen Parameter , für den gelten muss 0<<1: Wir schreiben X Ber() ; wenn eine Zufallsvariable X eine Bernoulli-Verteilung besitzt. Eine Bernoulli-verteilte Zufallsvariable X nimmt nur die zwei Werte 0 und 1 an. Dabei spricht man von einem Erfolg, wenn X = 1 ist und von einem Misserfolg, wenn X = 0 ist, wobei mit Erfolg nicht immer ein ,,positives” Ereignis im gewöhnlichen Sprachgebrauch gemeint ist. π 1−π 0 Misserfolg 1 Erfolg Abbildung 4.1: Wahrscheinlichkeitsfunktion der Bernoulli-Verteilung 60 4.2. BINOMIALVERTEILUNG 61 Satz 4.1 Es gelte Ber() : X Dann gilt für den Erwartungswert und die Varianz EX = V ar(X ) = und = (1 2 ) : In Anwendungen der Bernoulli-Verteilung ist die Erfolgswahrscheinlichkeit gleich einem Anteil in einer Grundgesamtheit (z.B. Besitzt einen Fernseher, kauft ein Produkt, ist krank, wählt ,,Ja” usw.). 4.2 Binomialverteilung Definition 4.2 Die Wahrscheinlichkeitsfunktion der Binomialverteilung ist gegeben durch ( n x x = 0; 1; 2; :::; n 0 sonst : Die Binomialverteilung hat zwei Parameter n und , für die gelten muss PX (x) = x (1 n 2 IN Wir schreiben )n und X x 0<<1: b(n; ) ; wenn die Zufallsvariable X eine Binomialverteilung besitzt. Satz 4.2 Es gelte X b(n; ) : Dann gilt für den Erwartungswert und die Varianz EX = n und V arX = n (1 ) : Die Abbildungen 4.2 - 4.4 zeigen einige Wahrscheinlichkeitsfunktionen der Binomialverteilung. Achten Sie auf die Symmetrie und die Annäherung an die Normalverteilung mit wachsendem n. 62 KAPITEL 4. DISKRETE VERTEILUNGEN b( 10 ; 0.5 ) 0.4 0.3 0.3 P(x) P(x) b( 10 ; 0.1 ) 0.4 0.2 0.2 0.1 0.1 0.0 0.0 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 x x b( 10 ; 0.9 ) 0.4 0.3 0.3 P(x) P(x) b( 10 ; 0.7 ) 0.4 0.2 0.2 0.1 0.1 0.0 0.0 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 x x Abbildung 4.2: Wahrscheinlichkeitsfunktionen der Binomialverteilung mit n 0:1; 0:5; 0:7; 0:9 b( 60 ; 0.5 ) 0.20 0.20 0.15 0.15 P(x) P(x) b( 60 ; 0.1 ) 0.10 0.10 0.05 0.05 0.0 0.0 0 10 20 30 40 50 60 0 x b( 60 ; 0.9 ) 0.20 0.15 0.15 P(x) P(x) b( 60 ; 0.7 ) 0.10 0.05 0.05 0.0 0.0 0 10 20 30 40 50 60 x 10 20 30 40 50 60 x 0.20 0.10 0 10 20 30 40 50 60 x Abbildung 4.3: Wahrscheinlichkeitsfunktionen der Binomialverteilung mit n 0:1; 0:5; 0:7; 0:9 = 10; = = 60; = 4.2. BINOMIALVERTEILUNG 63 b( 150 ; 0.1 ) b( 150 ; 0.5 ) 0.10 P(x) P(x) 0.10 0.05 0.0 0.0 0 30 60 90 120 150 0 30 60 90 120 150 x x b( 150 ; 0.7 ) b( 150 ; 0.9 ) 0.10 P(x) 0.10 P(x) 0.05 0.05 0.0 0.05 0.0 0 30 60 90 120 150 0 x 30 60 90 120 150 x Abbildung 4.4: Wahrscheinlichkeitsfunktionen der Binomialverteilung mit n 0:1; 0:5; 0:7; 0:9 = 150; = Die charakteristische Eigenschaft einer Binomialverteilung wird durch den folgenden Satz ausgedrückt: Satz 4.3 Wenn X1 ; X2 ; :::; Xn unabhängig und identisch Bernoulli-verteilt sind mit dem Parameter , dann gilt n X X= i=1 Xi b(n; ) : Typischerweise erhält man in der folgenden Situation eine Binomialverteilung: Beispiel 4.1 (Anzahl der Erfolge) Der Anteil der Erfolge in einer Grundgesamtheit sei . Die Zufallsvariable X sei die Anzahl der Erfolge in einer Stichprobe der Größe n. Dann gilt nach Satz 4.3 X b(n; ) : R-Befehle zur Binomialverteilung: dbinom(x, size, prob) berechnet die Wahrscheinlichkeitsfunktion der Binomialverteilung mit den Parametern n =size und =prob an der Stelle x. Dabei kann x ein Vektor sein. 64 KAPITEL 4. DISKRETE VERTEILUNGEN pbinom(q, size, prob) berechnet die Verteilungsfunktion der Binomialverteilung mit den Parametern n =size und =prob an der Stelle q . Dabei kann q ein Vektor sein. qbinom(p, size, prob) berechnet die Umkehrfunktion der Verteilungsfunktion der Binomialverteilung mit den Parametern n =size und =prob an der Stelle p. Dabei muss p ein Vektor von Wahrscheinlichkeiten, d.h. von Zahlen zwischen 0 und 1 sein. rbinom(n, size, prob) erzeugt n binomialverteilte Zufallszahlen mit den Parametern n =size und =prob. choose(n,k) berechnet den Binomialkoeffizienten nx . 4.3 Geometrische Verteilung Definition 4.3 Die Wahrscheinlichkeitsfunktion der geometrischen Verteilung ist gegeben durch ( PX (x) = (1 )x x = 0; 1; 2; ::: 0 sonst : Die geometrische Verteilung hat einen Parameter , für den gelten muss 0 < < 1. Wir schreiben X Ge() ; wenn die Zufallsvariable X eine geometrische Verteilung besitzt. Satz 4.4 Es gelte X Ge() : Dann gilt für den Erwartungswert und die Varianz EX = 1 und V arX = 1 2 : Beispiel 4.2 (Anzahl der Misserfolge vor dem ersten Erfolg) Unabhängige Bernoulli-Experimente werden solange durchgeführt, bis der erste Erfolg eintritt. Die Zufallsvariable X sei die Anzahl der Misserfolge vor dem ersten Erfolg bei diesen Bernoulli-Experimenten. Dann gilt X Ge() : In der anschließenden Berechnung der Wahrscheinlichkeitsfunktion werde ein Erfolg mit ,,E” und ein Misserfolg mit ,,M” bezeichnet. 4.3. GEOMETRISCHE VERTEILUNG X 65 Wahrscheinlichkeit 0 1 2 P (E ) = P (ME ) = P (M )P (E ) = (1 ) P (MME ) = P (M )P (M )P (E ) = (1 .. . .. . )(1 ) = (1 P (MM:::M | {z } E ) = P (M ) : : : P (M ) P (E ) = (1 x | x {z } x ) 2 )x Die Wahrscheinlichkeitsfunktion der geometrischen Verteilung kann also als Antwort auf die Frage Wieviele Versuche muss man abwarten, bis man Erfolg hat? aufgefasst werden. Ge( 0.5 ) 1.0 0.8 0.8 0.6 0.6 P(x) P(x) Ge( 0.1 ) 1.0 0.4 0.4 0.2 0.2 0.0 0.0 0 2 4 6 8 101214161820 0 2 4 6 8 101214161820 x x Ge( 0.9 ) 1.0 0.8 0.8 0.6 0.6 P(x) P(x) Ge( 0.7 ) 1.0 0.4 0.4 0.2 0.2 0.0 0.0 0 2 4 6 8 101214161820 0 2 4 6 8 101214161820 x x Abbildung 4.5: Wahrscheinlichkeitsfunktionen der geometrischen Verteilung mit 0:1; 0:5; 0:7; 0:9 = Die geometrische Verteilung hat eine charakteristische Eigenschaft, die analog ist zu der Charakterisierung der Exponentialverteilung in Gleichung (3.8). Dort haben wir von einer Verteilung ohne Gedächtnis gesprochen. 66 KAPITEL 4. DISKRETE VERTEILUNGEN Satz 4.5 (Markoffsche Eigenschaft) Die geometrische Verteilung ist charakterisiert durch die Eigenschaft P (fX = x + x 0 gjfX x g) = P (fX = xg) : 0 Egal, wie viele Misserfolge man beim Warten auf den ersten Erfolg schon erlebt hat, die Verteilung der noch folgenden Misserfolge vor dem ersten Erfolg ändert sich dadurch nicht. R-Befehle zur geometrischen Verteilung: dgeom(x, prob) berechnet die Wahrscheinlichkeitsfunktion der geometrischen Verteilung mit dem Parameter =prob an der Stelle x. Dabei kann x ein Vektor sein. pgeom(q, prob) berechnet die Verteilungsfunktion der geometrischen Verteilung mit dem Parameter =prob an der Stelle q . Dabei kann q ein Vektor sein. qgeom(p, prob) berechnet die Umkehrfunktion der Verteilungsfunktion der geometrischen Verteilung mit dem Parameter =prob an der Stelle p. Dabei muss p ein Vektor von Wahrscheinlichkeiten, d.h. von Zahlen zwischen 0 und 1 sein. rgeom(n, prob) erzeugt n geometrisch verteilte Zufallszahlen mit dem Parameter =prob. 4.4 Die negative Binomialverteilung Definition 4.4 Die Wahrscheinlichkeitsfunktion der negativen Binomialverteilung ist gegeben durch ( x+r 1 r x PX (x) = 0 r 1 (1 ) x = 0; 1; 2; : : : sonst : Die negative Binomialverteilung hat zwei Parameter r und , für die gelten muss r 2 IN und Wir schreiben X 0<<1: NB (r; ) ; wenn X eine negative Binomialverteilung mit den Parametern r und besitzt. Die negative Binomialverteilung tritt typischerweise in der folgenden Situation auf. 4.4. DIE NEGATIVE BINOMIALVERTEILUNG 67 NB( 5 ; 0.3 ) NB( 5 ; 0.5 ) 0.4 0.4 P(x) 0.6 P(x) 0.6 0.2 0.2 0.0 0.0 0 2 4 6 8 101214161820 0 2 4 6 8 101214161820 x x NB( 5 ; 0.7 ) NB( 5 ; 0.9 ) 0.4 0.4 P(x) 0.6 P(x) 0.6 0.2 0.2 0.0 0.0 0 2 4 6 8 101214161820 0 2 4 6 8 101214161820 x x Abbildung 4.6: Wahrscheinlichkeitsfunktionen der negativen Binomialverteilung mit r 5; = 0:9; 0:7; 0:5; 0:3 = Beispiel 4.3 (Anzahl der Misserfolge vor dem r -ten Erfolg) Unabhängige Bernoulli-Experimente werden solange durchgeführt, bis der r -te Erfolg eintritt. Die Zufallsvariable X sei die Anzahl der Misserfolge vor dem r -ten Erfolg bei diesen Bernoulli-Experimenten. Dann gilt NB (r; ) : X Wir wollen die Wahrscheinlichkeitsfunktion von X bestimmen. Die Zufallsvariable X nimmt genau dann den Wert x an, wenn es vor dem r -ten Erfolg x Misserfolge und r 1 Erfolge gibt. Nun kann man diese x Misserfolge und r 1 Erfolge auf verschiedene Weisen (Reihenfolgen) anordnen. Jede Möglichkeit hat die Wahrscheinlichkeit r (1 Die Anzahl der Möglichkeiten, r 1 )x : Erfolge und x Misserfolge auf x + r x+r r 1 Stellen anzuordnen, ist ! 1 1 : Damit gilt P (fX = xg) = = P (fr 1 Erfolge und x Misserfolge vor r-tem Erfolg)g ! x+r 1 r (1 )x x = 0; 1; 2; ::: : r 1 68 KAPITEL 4. DISKRETE VERTEILUNGEN NB( 2 ; 0.5 ) NB( 5 ; 0.5 ) 0.2 0.2 P(x) 0.3 P(x) 0.3 0.1 0.1 0.0 0.0 0 5 10 15 20 25 30 0 5 10 15 20 25 30 x x NB( 10 ; 0.5 ) NB( 15 ; 0.5 ) 0.2 0.2 P(x) 0.3 P(x) 0.3 0.1 0.1 0.0 0.0 0 5 10 15 20 25 30 0 5 10 15 20 25 30 x x Abbildung 4.7: Wahrscheinlichkeitsfunktionen der negativen Binomialverteilung mit r 2; 5; 10; 15; = 0:5 Satz 4.6 Es gelte X von X = NB (r; ). Dann gilt für den Erwartungswert und die Varianz EX = r 1 und V arX = r 1 2 : Satz 4.7 Seien X1 ; X2 ; :::; Xr unabhängig und identisch Ge( )-verteilt sind, dann gilt X + X + ::: + Xr NB (r; ) : 1 2 Beweis: Sei X X X 1 2 .. . 3 die Anzahl der Misserfolge bis zum 1. Erfolg die Anzahl der Misserfolge zwischen dem 1. und dem 2. Erfolg die Anzahl der Misserfolge zwischen dem 2. und dem 3. Erfolg 1)-ten und dem r-ten Erfolg. Die einzelnen Zufallsvariablen Xi ; i = 1; 2; : : : ; r besitzen eine Ge( )-Verteilung, da man Xr die Anzahl der Misserfolge zwischen dem (r sie jeweils als Anzahl der Misserfolge vor dem ersten Erfolg auffassen kann. Die Summe die- 4.4. DIE NEGATIVE BINOMIALVERTEILUNG 69 ser Zufallsvariablen ist die Anzahl der Misserfolge bis zum r -ten Erfolg und besitzt demnach eine NB (r ; )-Verteilung. } Beispiel 4.4 Sei r = 3. Vor dem dritten Erfolg gebe es die folgende Anordnung von Erfolgen und Misserfolgen. 000 1 0000 0 1 |{z} | {z } 1 |{z} X1 X2 X3 Dann ist die Anzahl der Misserfolge bis zum dritten Erfolg X =3+4+1=8 : Die Abbildungen 4.6 und 4.7 zeigen die Vielseitigkeit der Gestalt der negativen Binomialverteilung, die sich daher in Anwendungen gut zum Anpassen an gegebene Daten eignet (siehe Johnson, Kotz und Kemp (1992), dort werden auch Literaturangaben zu Anwendungen aus dem ökonomischen Bereich gegeben). Sie weist im Vergleich zur Poissonverteilung größere Flexibilität auf. Dabei braucht r keine ganze Zahl zu sein. Man kann die negative Binomialverteilung für beliebiges positives reelles r definieren. Dazu muss man die in der Definition der Binomialkoeffizienten auftretenden Fakultäten durch die Gammaverteilung definieren. Wenn n keine ganze Zahl ist, so definiert man aufgrund des Satzes 3.9 n! = (n + 1) : Als weitere Anwendung werden wir die negative Binomialverteilung im Zusammenhang mit Mischverteilungen (siehe Kapitel 9.3.2) und Bayes’schen Verfahren kennenlernen, denn sie ist die prädiktive Verteilung einer Poissonverteilung, deren Parameter gammaverteilt ist (siehe Satz 10.8). R-Befehle zur negativen Binomialverteilung: dnbinom(x, size, prob) berechnet die Wahrscheinlichkeitsfunktion der negativen Binomialverteilung mit den Parametern r =size und =prob an der Stelle x. Dabei kann x ein Vektor sein. pnbinom(q, size, prob) berechnet die Verteilungsfunktion der negativen Binomialverteilung mit den Parametern r =size und =prob an der Stelle q . Dabei kann q ein Vektor sein. qnbinom(p, size, prob) berechnet die Umkehrfunktion der Verteilungsfunktion der negativen Binomialverteilung mit den Parametern r =size und =prob an der Stelle p. Dabei muss p ein Vektor von Wahrscheinlichkeiten, d.h. von Zahlen zwischen 0 und 1 sein. rnbinom(n, size, prob) erzeugt n binomialverteilte Zufallszahlen mit den Parametern r =size und =prob. 70 KAPITEL 4. DISKRETE VERTEILUNGEN 4.5 Poissonverteilung Definition 4.5 Die Wahrscheinlichkeitsfunktion der Poissonverteilung ist definiert durch ( x PX (x) = e x! 0 x = 0; 1; 2; ::: sonst. Die Poissonverteilung hat einen Parameter , für den gelten muss > 0. Wir schreiben X P o() ; wenn X eine Poissonverteilung mit dem Parameter besitzt. Abbildung 4.8 zeigt einige Wahrscheinlichkeitsfunktionen der Poissonverteilung. Man beachte, dass die Poissonverteilung mit wachsendem Parameter immer mehr die Gestalt der Dichte einer Normalverteilung annimmt. Daher hat man in der Vorcomputerzeit die Poissonverteilung für große durch eine Normalverteilung approximiert. Satz 4.8 Es gelte X X P o(). Dann gilt für den Erwartungswert und die Varianz von EX = und V arX = : Der Poissonverteilung kommt in Anwendungen eine ähnliche Bedeutung unter den diskreten Verteilungen zu wie der Normalverteilung unter den stetigen Verteilungen. Sie wird gebraucht als Approximation der Binomialverteilung (siehe Satz 4.9) und anderer Verteilungen, wenn Ereignisse zufällig in der Zeit oder allgemeiner auf der reellen Zahlenachse (Poissonprozess) oder im Raum (räumliche Poissonprozesse) auftreten (siehe Beispiel 4.6), in Modellen für die Analyse von Häufigkeitstabellen, in der empirischen Analyse von Zähldaten. 4.5. POISSONVERTEILUNG 71 Po( 0.5 ) Po( 2.5 ) 0.4 0.4 P(x) 0.6 P(x) 0.6 0.2 0.2 0.0 0.0 0 4 8 12 16 20 0 4 8 x 12 16 20 16 20 x Po( 5 ) Po( 9 ) 0.4 0.4 P(x) 0.6 P(x) 0.6 0.2 0.2 0.0 0.0 0 4 8 12 16 20 0 x 4 8 12 x Abbildung 4.8: Wahrscheinlichkeitsfunktionen der Poissonverteilung mit = 0:5; 2:5; 5; 9 Satz 4.9 (Approximation der Binomialverteilung) Sei X b(n; ) : Wenn ,,klein” ist und n ,,groß” ist, so gilt asymptotisch X _ P o() mit = n . Dieser Satz wird durch Abbildung 4.9 veranschaulicht, in der die Wahrscheinlichkeitsfunktionen der P o(5)-Verteilung und einiger Binomialverteilungen, für die n = 5 mit wachsendem n und fallendem gilt, dargestellt ist. Beispiel 4.5 Ein typisches Beispiel für die Anwendung dieses Satzes findet man in der Versiche- rungswirtschaft. Die Anzahl n der Versicherten ist groß, die Wahrscheinlichkeit eines Schadenfalles ist klein. Sei X die Anzahl der Versicherten, die in einem bestimmten Zeitraum (z.B. ein Jahr) einen Schaden anmelden. Wenn man annimmt, dass die Wahrscheinlichkeit eines Schadensfalles für jeden Versicherten gleich groß ist, so gilt X b(n; ) : Als Approximation kann unter den obigen Voraussetzungen die Poissonverteilung verwendet werden: X _ P o() = n : 72 KAPITEL 4. DISKRETE VERTEILUNGEN 0.3 b( 10 ; 0.5 ) Po( 5 ) b( 50 ; 0.1 ) Po( 5 ) 0.2 P(x) P(x) 0.2 0.3 0.1 0.1 0.0 0.0 0 2 4 6 8 10 12 14 x 0 2 4 6 8 10 12 14 x 0.3 b( 100 ; 0.05 ) Po( 5 ) 0.2 b( 1000 ; 0.005 ) Po( 5 ) P(x) P(x) 0.2 0.3 0.1 0.1 0.0 0.0 0 2 4 6 8 10 12 14 x 0 2 4 6 8 10 12 14 x Abbildung 4.9: Wahrscheinlichkeitsfunktionen der Binomialverteilung und Poissonverteilung mit = n = 5 Beispiel 4.6 Auch in der Qualitätskontrolle wird die Poissonverteilung häufig als Modell verwendet, z.B. für die Anzahl der fehlerhaften Teile (die Wahrscheinlichkeit eines Fehlers sei klein) in einem großen Los. die Anzahl der Fehler pro Einheit in einem lackierten Draht, dessen Fehlstellen zufällig über die gesamte Länge verteilt seien (eindimensionaler Poissonprozess). Anzahl der Astlöcher pro Flächeneinheit in einer Holzplatte oder Anzahl der Bläschen pro Flächeneinheit in einer Glasplatte (räumlicher Poissonprozess). Wir hatten schon in Kapitel 3 einen Poissonprozess definiert (Definition 3.6). Der folgende Satz gibt eine Begründung des Namens ,,Poissonprozess” an. Satz 4.10 Sei N (t) die Anzahl der Ereignisse in dem Zeitintervall prozesses mit Intensität (Ereignisse pro Zeiteinheit), dann gilt (0; t℄ eines Poisson- N (t) P o(t) ; d.h. 8 < (t)n e t P (fN (t) = ng) = : n! 0 für n = 0; 1; ::: sonst. 4.5. POISSONVERTEILUNG 73 Beispiel 4.7 Unterbrechungen am Fließband tauchen wie ein Poissonprozess auf mit Intensität = 0:1 pro Stunde. Sei X die Anzahl der Unterbrechungen in 8 Stunden. Dann gilt: X P o((0:1) 8) = P o(0:8) Dann gilt z.B. P (fX =0 )= P (fX =1 )= P (fX =2 )= P (fX =3 )= 0 e 0:8 g (0 8) g (0 8) g (0 8) g (0 8) : 0! 1 e 0:8 : 1! 2 e 0:8 : 2! : 3 e 0:8 3! : = 0:449 = e = ::: = 0:359 ; = ::: = 0:144 ; = ::: = 0:038 : 0 8 ; R-Befehle zur Poissonverteilung: dpois(x, lambda) berechnet die Wahrscheinlichkeitsfunktion der Poissonverteilung mit dem Parameter =lambda an der Stelle x. Dabei kann x ein Vektor sein. ppois(q, lambda) berechnet die Verteilungsfunktion der Poissonverteilung mit dem Parameter =lambda an der Stelle q . Dabei kann q ein Vektor sein. qpois(p, lambda) berechnet die Umkehrfunktion der Verteilungsfunktion der Poissonverteilung mit dem Parameter =lambda an der Stelle p. Dabei muss p ein Vektor von Wahrscheinlichkeiten, d.h. von Zahlen zwischen 0 und 1 sein. rpois(n, lambda) erzeugt n poissonverteilte Zufallszahlen mit dem Parameter =lambda.