7.7 7.7.1 Spezielle diskrete Wahrscheinlichkeitsverteilungen Die Laplace-Verteilung Sei X eine gleich verteilte Zufallsvariable ΩX = {xi ∈ R : i = 1, . . . , n}, d. h. f (xi ) = 1 n mit den Werten in der Menge für alle i = 1, . . . , n. Die zugehörige Wahrscheinlichkeitsverteilung heißt die Laplace-Verteilung auf der Menge ΩX und wird im folgenden kurz als L (ΩX )-Verteilung bezeichnet. Für die Laplace verteilte Zufallsvariable gilt n 1X µ = E(X) = xi n i=1 n 1X σ = V (X) = (xi − µ)2 . n i=1 2 und Sind xi = i, i = 1, . . . , n, dann ergibt sich µ = 1 (n + 1) 2 und σ2 = 1 (n − 1) · (n + 1). 12 Anwendung: Die Gleichverteilungen spielen eine Rolle in der Signaltheorie sowie bei der Erzeugung von Pseudo-Zufallszahlen auf dem Computer. 7.7.2 Die hypergeometrische Verteilung Für natürliche Zahlen 1 ≤ K ≤ N und 0 ≤ n ≤ N ist N −K K · f (k) = k N n−k , n wobei 0 ≤ k ≤ min{K, n} und n − k ≤ N − K, eine Wahrscheinlichkeitsfunktion auf der Ergebnismenge Ω = {0, 1, . . . , n}. Dies ergibt sich aus der Tatsache, dass die Ereignisse Ank : k von n gezogenen Kugeln sind schwarz” ” (vgl. Lotto”–Bsp. 4.7) beim Ziehen ohne Zurücklegen und ohne Berücksichtigung der ” Reihenfolge aus einer Urne mit K schwarzen und N − K weißen Kugeln eine Partition bilden: An0 ∪ An1 ∪ . . . ∪ Ann = ΩN n := {{z1 , z2 , . . . , zn }, und daher n X k=0 f (k) = n X zi = 1, 2, . . . , N und zi 6= zj } , P (Ank ) = P ΩN n k=0 54 = 1. Die Wahrscheinlichkeitsverteilung mit dieser Wahrscheinlichkeitsfunktion heißt die hypergeometrische Verteilung mit Parametern N, K und n oder kurz H(N, K, n)-Verteilung. Die Einzelwahrscheinlichkeiten f (k) = P (X = k) beschreiben die Wahrscheinlichkeit aus einer Menge von N gleich verteilten Elementen, von denen K eine bestimmte Eigenschaft besitzen, bei einer Stichprobe ohne Zurücklegen vom Umfang n ≤ N genau k Elemente mit dieser Eigenschaft zu erhalten. Für die hypergeometrisch verteilte diskrete Zufallsvariable X gilt K N K N −n 2 µ = E(X) = n · 1− · . und σ = V (X) = n · N N K N −1 Beweis: Der Erwartungswert ergibt sich durch Ausklammern von n · K und Ausnutzen N 4.7) für Binomialkoeffizienten. Hierbei ist zu des Additionssatzes (im Lotto”–Beispiel ” n beachten, dass m = 0 für m > n, n, m ∈ N. Wir erhalten dann E(X) = n X k=0 k· K k n−1 K X = n· N r=0 · N −K n−k N n K−1 r · n K X = n· N k=1 N −1−(K−1) n−1−r N −1 n−1 K−1 k−1 = n· N −K n−k N −1 n−1 · r=k−1 = K . N Die Berechnungen für V (X) sind ähnlich aber etwas umfangreicher. Die hypergeometrische Verteilung spielt z.B. bei den • Qualitätskontrollen eines Herstellers bei laufender Produktion: In regelmäßigen Zeitabständen wird dabei kontrolliert, ob z. B. ein bestimmter Sollwert auch tatsächlich eingehalten wird; • Endkontrollen eines Herstellers: Sie sollen die Auslieferung einwandfreier Ware im vereinbarten Rahmen (z.B. maximal 2% Ausschußware) gewährleisten; • Abnahmekontrollen eines Kunden: Überprüfung der angelieferten Ware, ob die Vereinbarungen z. B. bezüglich eines maximalen Anteils an Ausschußware auch tatsächlich eingehalten wurden. eine große Rolle. 7.7.3 Die Binomialverteilung Sind p und q reelle Zahlen mit 0 < p < 1 und q = 1 − p, so ist n k n−k p q f (k) = k 55 eine Wahrscheinlichkeitsfunktion auf Ω = {0, 1, . . . , n}, denn nach der Binomialformel ist n X n k n−k p q = (p + q)n = 1n = 1. f (k) = k k=0 k=0 n X Die zugehörige Verteilung heißt die Binomialverteilung mit Parametern n und p oder kurz B(n, p)-Verteilung. Wie im Abschnitt 6.3 geschildert, zählt die binomialverteilte Zufallsvariable X die Erfolge bei einer Bernoulli-Versuchsreihe (d.h. bei einer n-fachen, stochastisch unabhängigen Wiederholung eines Einzelexperiments, bei dem ein bestimmtes Ereignis jeweils mit Wahrscheinlichkeit p autritt) auf. Sonderfälle: ❶ n = 0, p = 0: Ein-Punkt-Verteilung mit P (X = 0) = 1; ❷ n = 1, p ∈ (0, 1): Zwei-Punkt-Verteilung mit P (X = 0) = 1 − p und P (X = 1) = p. Für die diskrete Zufallsvariable mit der B(n, p)-Verteilung gilt E(X) = np und V (X) = npq. Beweis: Die Zufallsvariable X kann man als die Summe X = X1 + · · · + Xn von n stochastisch unabhängigen Zufallsvariablen Xi , i = 1, . . . , n, mit Zwei-Punkt-Verteilung erfassen. Für den Erwartungswert und die Varianz von allen Xi gilt E (Xi ) = 0 · (1 − p) + 1 · p = p V (Xi ) = E (Xi2 ) − (E (Xi ))2 = 02 · (1 − p) + 12 · p − p2 = p(1 − p). Der Erwartungswert von Zufallsvariable X ist dann gleich E(X) = n X E (Xi ) = np i=1 und die Varianz V (X) = n X V (Xi ) = np(1 − p) = npq, i=1 weil die Zufallsvariablen Xi unabhängig sind. Die Binomialverteilung findet überall dort Anwendung, wo alternative Entscheidungen zu treffen sind, z. B.: 56 • Statische Untersuchung der Anzahl der Ausfälle mehrerer unabhängig voneinander arbeitender Elemente mit gleicher Ausfallswahrscheinlichkeit. • Qualitätskontrolle (siehe auch hypergeometrische Verteilung) bei Lieferungen mit sehr großer Stückzahl N, N ≫ n, und mittleren Stichprobenumfang n und kleiner bekannter Lieferantenausschussquote p. Die Binomialverteilung approximiert (für großes N) die hypergeometrische Verteilung. Man erhält für K ≤ 1 und K → p für N → ∞ N N lim N →∞ K k · N −K n−k N n n k p (n − p)n−k , = k indem man im Zähler K k (N − K)n−k und im Nenner N n ausklammert. Bei der Herleitung dieser diskreten Verteilung kann man wiederum auf das anschauliche Urnenmodell zurückgreifen, das bereits bei der hypergeometrischen Verteilung nützlich war. Man muss aber merken, dass diesmal die Ziehung der Kugeln mit Zurücklegen erfolgt. 7.7.4 Die geometrische Verteilung Die Funktion f (n) = p · q n−1 mit 0 < p < 1 und q = 1 − p ist eine Wahrscheinlichkeitsfunktion auf der Menge Ω = N = {1, 2, . . .} der natürlichen Zahlen, denn ∞ X n=1 f (n) = ∞ X p·q n−1 n=1 = p ∞ X k=0 qk = p · 1 p = = 1. 1−q p P k Da diese Funktion mit der geometrischen Reihe ∞ k=0 q zusammenhängt, heißt die zugehörige Verteilung die geometrische Verteilung mit Parameter p oder bei uns kurz die G(p)-Verteilung. Eine diskrete, geometrischverteile Zufallsvariable X gibt an, bei welchem Versuch in einer Bernoulli-Versuchsreihe ein bestimmtes Ereignis zum ersten Mal eintritt. Man kann zeigen (in der Übung), dass E(X) = 1 p und V (X) = q . p2 Die geometrische Verteilung findet Anwendung bei der Analyse von Wartezeiten bis zum Eintreffen eines bestimmten Ereignisses bzw. von Lebensdauern von Geräten (d.h. der Wartezeit bis zum Ausfall). 57 7.7.5 Die Poisson-Verteilung Die Funktion λn n! auf Ω = N0 =P {0, 1, 2, . . .} mit einer positiven reellen Zahl λ ist eine Wahrscheinlichkeitsλn λ funktion, da ∞ n=0 n! = e die Taylorreihe der Exponentialfunktion und damit f (n) = e−λ ∞ X n=0 f (n) = ∞ X n=0 e−λ λn = e−λ · eλ = 1 n! ist. Die zugehörige Verteilung heißt die Poisson-Verteilung mit Parameter λ oder kurz die P(λ)-Verteilung. Eine Poisson-verteilte Zufallsvariable X hat folgende Kennwerte (in der Übung): E(X) = λ und V (X) = λ. Für große n wird das Arbeiten mit der Binomialverteilung unhändlich, weil es numerisch Probleme im Falle der exakten Berechnung von Einzelwahrscheinlichkeiten gibt. Ausserdem in Naturwissenschaften und Technik stößt man manchmal im Zusammenhang mit Bernoulli-Experimenten auf Ereignisse, die mit nur geringen Wahrscheinlichkeiten und daher sehr selten auftreten, z.B. die Anzahl der pro Sekunde zerfallenden Atomkerne ist äußerst gering im Vergleich zur Anzahl der insgesamt vorhandenen Kerne. Die statistische Untersuchungen haben auch gezeigt, dass bei einem Einzelereignis, welches in einem bestimmten Zeitraum nach oben unbegrenzt oft auftreten kann, die Zufallsvariable X, welches die Anzahl des Eintretens von dem Einzelereignis in diesem Zeitraum angibt, angenähert Poisson-verteilt ist. Mathematisch gesagt: Satz 7.14. Betrachten wir die Folge (Xn ) von binomial verteilten Zufallsvariablen mit den Parameter n und pn = nλ , λ > 0, dann konvergieren die zugehörigen Einzelwahrscheinlichkeiten P (Xn = k) für jedes k = 0, 1, 2, . . . gegen die Einzelwahrscheinlichkeit der Poisson-Verteilung mit dem Parameter λ, d. h. k n k n−k −λ λ . (pn ) (1 − pn ) = e lim n→∞ k k! Man beachte hierbei, dass die binomial verteilte Zufallsvariable nur die endlich viele Werte k = 0, 1, . . . , n und die Poisson-verteilte Zufallsvariable dagegen unendlich viele Werte k = 0, 1, 2, . . . besitzt. Ist also in einer Bernoulli-Versuchsreihe p klein (0 < p ≤ 0.1) und n groß (n ≥ 50), so approximiert die rechnerisch bequemere P(λ)-Verteilung mit λ = np die B(n, p)-Verteilung für relativ zu n kleine k. Es gilt dabei die folgende Regel: 58 Die Binomialverteilung darf näherungsweise durch die Poisson-Verteilung ersetzt werden, wenn die beiden Bedingungen n · p < 10 und n > 1500 p erfüllt sind. Durch Umbenennung von Erfolg” und Fehlschlag” ist die Poisson-Verteilung auch für ” ” 0.9 ≤ p ≤ 1 eine gute Approximation an die Binomialverteilung. Die Poisson-Verteilung findet dann Anwendung, wenn die Häufigkeit des Eintretens eines Ereignisses gezählt wird, das zu zufälligen Zeitpunkten und unabhängig von einander eintritt. Beispiele für solche Situationen sind etwa • das Eintreffen von Telefonanrufen bei einer Vermittlungsstelle, • das Auftreffen von radioaktiven Partikeln auf einem Geigerzähler, • die Ankunft eines Kunden an einem Bedienungsschalter, • das Eintreffen von Bedienwünschen an einem Server, • das Auftreten von Softwarefehlern in einem Programmsystem. 59