7.7 Spezielle diskrete Wahrscheinlichkeitsverteilungen

Werbung
7.7
7.7.1
Spezielle diskrete Wahrscheinlichkeitsverteilungen
Die Laplace-Verteilung
Sei X eine gleich verteilte Zufallsvariable
ΩX = {xi ∈ R : i = 1, . . . , n}, d. h.
f (xi ) =
1
n
mit den
Werten in
der Menge
für alle i = 1, . . . , n.
Die zugehörige Wahrscheinlichkeitsverteilung heißt die Laplace-Verteilung auf der Menge
ΩX und wird im folgenden kurz als L (ΩX )-Verteilung bezeichnet.
Für die Laplace verteilte Zufallsvariable gilt
n
1X
µ = E(X) =
xi
n i=1
n
1X
σ = V (X) =
(xi − µ)2 .
n i=1
2
und
Sind xi = i, i = 1, . . . , n, dann ergibt sich
µ =
1
(n + 1)
2
und
σ2 =
1
(n − 1) · (n + 1).
12
Anwendung: Die Gleichverteilungen spielen eine Rolle in der Signaltheorie sowie bei der
Erzeugung von Pseudo-Zufallszahlen auf dem Computer.
7.7.2
Die hypergeometrische Verteilung
Für natürliche Zahlen 1 ≤ K ≤ N und 0 ≤ n ≤ N ist
N −K K
·
f (k) = k N n−k ,
n
wobei 0 ≤ k ≤ min{K, n} und n − k ≤ N − K, eine Wahrscheinlichkeitsfunktion auf der
Ergebnismenge Ω = {0, 1, . . . , n}. Dies ergibt sich aus der Tatsache, dass die Ereignisse
Ank :
k von n gezogenen Kugeln sind schwarz”
”
(vgl. Lotto”–Bsp. 4.7) beim Ziehen ohne Zurücklegen und ohne Berücksichtigung der
”
Reihenfolge aus einer Urne mit K schwarzen und N − K weißen Kugeln eine Partition
bilden:
An0 ∪ An1 ∪ . . . ∪ Ann = ΩN
n := {{z1 , z2 , . . . , zn },
und daher
n
X
k=0
f (k) =
n
X
zi = 1, 2, . . . , N und zi 6= zj } ,
P (Ank ) = P ΩN
n
k=0
54
= 1.
Die Wahrscheinlichkeitsverteilung mit dieser Wahrscheinlichkeitsfunktion heißt die hypergeometrische Verteilung mit Parametern N, K und n oder kurz H(N, K, n)-Verteilung.
Die Einzelwahrscheinlichkeiten f (k) = P (X = k) beschreiben die Wahrscheinlichkeit aus
einer Menge von N gleich verteilten Elementen, von denen K eine bestimmte Eigenschaft
besitzen, bei einer Stichprobe ohne Zurücklegen vom Umfang n ≤ N genau k Elemente
mit dieser Eigenschaft zu erhalten.
Für die hypergeometrisch verteilte diskrete Zufallsvariable X gilt
K
N
K
N −n
2
µ = E(X) = n ·
1−
·
.
und
σ = V (X) = n ·
N
N
K
N −1
Beweis: Der Erwartungswert ergibt sich durch Ausklammern von n · K
und Ausnutzen
N
4.7)
für
Binomialkoeffizienten.
Hierbei ist zu
des Additionssatzes
(im
Lotto”–Beispiel
”
n
beachten, dass m = 0 für m > n, n, m ∈ N. Wir erhalten dann
E(X) =
n
X
k=0
k·
K
k
n−1
K X
= n·
N r=0
·
N −K
n−k
N
n
K−1
r
·
n
K X
= n·
N k=1
N −1−(K−1)
n−1−r
N −1
n−1
K−1
k−1
= n·
N −K
n−k
N −1
n−1
·
r=k−1
=
K
.
N
Die Berechnungen für V (X) sind ähnlich aber etwas umfangreicher.
Die hypergeometrische Verteilung spielt z.B. bei den
• Qualitätskontrollen eines Herstellers bei laufender Produktion: In regelmäßigen Zeitabständen wird dabei kontrolliert, ob z. B. ein bestimmter Sollwert auch tatsächlich
eingehalten wird;
• Endkontrollen eines Herstellers: Sie sollen die Auslieferung einwandfreier Ware im
vereinbarten Rahmen (z.B. maximal 2% Ausschußware) gewährleisten;
• Abnahmekontrollen eines Kunden: Überprüfung der angelieferten Ware, ob die Vereinbarungen z. B. bezüglich eines maximalen Anteils an Ausschußware auch tatsächlich eingehalten wurden.
eine große Rolle.
7.7.3
Die Binomialverteilung
Sind p und q reelle Zahlen mit 0 < p < 1 und q = 1 − p, so ist
n k n−k
p q
f (k) =
k
55
eine Wahrscheinlichkeitsfunktion auf Ω = {0, 1, . . . , n}, denn nach der Binomialformel ist
n X
n k n−k
p q
= (p + q)n = 1n = 1.
f (k) =
k
k=0
k=0
n
X
Die zugehörige Verteilung heißt die Binomialverteilung mit Parametern n und p oder kurz
B(n, p)-Verteilung.
Wie im Abschnitt 6.3 geschildert, zählt die binomialverteilte Zufallsvariable X die Erfolge bei einer Bernoulli-Versuchsreihe (d.h. bei einer n-fachen, stochastisch unabhängigen
Wiederholung eines Einzelexperiments, bei dem ein bestimmtes Ereignis jeweils mit Wahrscheinlichkeit p autritt) auf.
Sonderfälle:
❶ n = 0, p = 0:
Ein-Punkt-Verteilung mit P (X = 0) = 1;
❷ n = 1, p ∈ (0, 1):
Zwei-Punkt-Verteilung mit P (X = 0) = 1 − p und P (X = 1) = p.
Für die diskrete Zufallsvariable mit der B(n, p)-Verteilung gilt
E(X) = np
und
V (X) = npq.
Beweis: Die Zufallsvariable X kann man als die Summe X = X1 + · · · + Xn von n
stochastisch unabhängigen Zufallsvariablen Xi , i = 1, . . . , n, mit Zwei-Punkt-Verteilung
erfassen.
Für den Erwartungswert und die Varianz von allen Xi gilt
E (Xi ) = 0 · (1 − p) + 1 · p = p
V (Xi ) = E (Xi2 ) − (E (Xi ))2 = 02 · (1 − p) + 12 · p − p2 = p(1 − p).
Der Erwartungswert von Zufallsvariable X ist dann gleich
E(X) =
n
X
E (Xi ) = np
i=1
und die Varianz
V (X) =
n
X
V (Xi ) = np(1 − p) = npq,
i=1
weil die Zufallsvariablen Xi unabhängig sind.
Die Binomialverteilung findet überall dort Anwendung, wo alternative Entscheidungen zu
treffen sind, z. B.:
56
• Statische Untersuchung der Anzahl der Ausfälle mehrerer unabhängig voneinander
arbeitender Elemente mit gleicher Ausfallswahrscheinlichkeit.
• Qualitätskontrolle (siehe auch hypergeometrische Verteilung) bei Lieferungen mit
sehr großer Stückzahl N, N ≫ n, und mittleren Stichprobenumfang n und kleiner
bekannter Lieferantenausschussquote p.
Die Binomialverteilung approximiert (für großes N) die hypergeometrische Verteilung.
Man erhält für K
≤ 1 und K
→ p für N → ∞
N
N
lim
N →∞
K
k
·
N −K
n−k
N
n
n k
p (n − p)n−k ,
=
k
indem man im Zähler K k (N − K)n−k und im Nenner N n ausklammert.
Bei der Herleitung dieser diskreten Verteilung kann man wiederum auf das anschauliche
Urnenmodell zurückgreifen, das bereits bei der hypergeometrischen Verteilung nützlich
war. Man muss aber merken, dass diesmal die Ziehung der Kugeln mit Zurücklegen erfolgt.
7.7.4
Die geometrische Verteilung
Die Funktion
f (n) = p · q n−1
mit 0 < p < 1 und q = 1 − p ist eine Wahrscheinlichkeitsfunktion auf der Menge Ω = N =
{1, 2, . . .} der natürlichen Zahlen, denn
∞
X
n=1
f (n) =
∞
X
p·q
n−1
n=1
= p
∞
X
k=0
qk = p ·
1
p
=
= 1.
1−q
p
P
k
Da diese Funktion mit der geometrischen Reihe ∞
k=0 q zusammenhängt, heißt die zugehörige Verteilung die geometrische Verteilung mit Parameter p oder bei uns kurz die
G(p)-Verteilung.
Eine diskrete, geometrischverteile Zufallsvariable X gibt an, bei welchem Versuch in einer
Bernoulli-Versuchsreihe ein bestimmtes Ereignis zum ersten Mal eintritt.
Man kann zeigen (in der Übung), dass
E(X) =
1
p
und
V (X) =
q
.
p2
Die geometrische Verteilung findet Anwendung bei der Analyse von Wartezeiten bis zum
Eintreffen eines bestimmten Ereignisses bzw. von Lebensdauern von Geräten (d.h. der
Wartezeit bis zum Ausfall).
57
7.7.5
Die Poisson-Verteilung
Die Funktion
λn
n!
auf Ω = N0 =P
{0, 1, 2, . . .} mit einer positiven reellen Zahl λ ist eine Wahrscheinlichkeitsλn
λ
funktion, da ∞
n=0 n! = e die Taylorreihe der Exponentialfunktion und damit
f (n) = e−λ
∞
X
n=0
f (n) =
∞
X
n=0
e−λ
λn
= e−λ · eλ = 1
n!
ist.
Die zugehörige Verteilung heißt die Poisson-Verteilung mit Parameter λ oder kurz die
P(λ)-Verteilung.
Eine Poisson-verteilte Zufallsvariable X hat folgende Kennwerte (in der Übung):
E(X) = λ
und
V (X) = λ.
Für große n wird das Arbeiten mit der Binomialverteilung unhändlich, weil es numerisch
Probleme im Falle der exakten Berechnung von Einzelwahrscheinlichkeiten gibt. Ausserdem in Naturwissenschaften und Technik stößt man manchmal im Zusammenhang mit
Bernoulli-Experimenten auf Ereignisse, die mit nur geringen Wahrscheinlichkeiten und
daher sehr selten auftreten, z.B. die Anzahl der pro Sekunde zerfallenden Atomkerne ist
äußerst gering im Vergleich zur Anzahl der insgesamt vorhandenen Kerne.
Die statistische Untersuchungen haben auch gezeigt, dass bei einem Einzelereignis, welches
in einem bestimmten Zeitraum nach oben unbegrenzt oft auftreten kann, die Zufallsvariable X, welches die Anzahl des Eintretens von dem Einzelereignis in diesem Zeitraum
angibt, angenähert Poisson-verteilt ist. Mathematisch gesagt:
Satz 7.14. Betrachten wir die Folge (Xn ) von binomial verteilten Zufallsvariablen mit
den Parameter n und pn = nλ , λ > 0, dann konvergieren die zugehörigen Einzelwahrscheinlichkeiten P (Xn = k) für jedes k = 0, 1, 2, . . . gegen die Einzelwahrscheinlichkeit
der Poisson-Verteilung mit dem Parameter λ, d. h.
k
n
k
n−k
−λ λ
.
(pn ) (1 − pn )
= e
lim
n→∞ k
k!
Man beachte hierbei, dass die binomial verteilte Zufallsvariable nur die endlich viele Werte
k = 0, 1, . . . , n und die Poisson-verteilte Zufallsvariable dagegen unendlich viele Werte
k = 0, 1, 2, . . . besitzt.
Ist also in einer Bernoulli-Versuchsreihe p klein (0 < p ≤ 0.1) und n groß (n ≥ 50), so
approximiert die rechnerisch bequemere P(λ)-Verteilung mit λ = np die B(n, p)-Verteilung für relativ zu n kleine k. Es gilt dabei die folgende Regel:
58
Die Binomialverteilung darf näherungsweise durch die Poisson-Verteilung ersetzt werden,
wenn die beiden Bedingungen
n · p < 10
und
n > 1500 p
erfüllt sind.
Durch Umbenennung von Erfolg” und Fehlschlag” ist die Poisson-Verteilung auch für
”
”
0.9 ≤ p ≤ 1 eine gute Approximation an die Binomialverteilung.
Die Poisson-Verteilung findet dann Anwendung, wenn die Häufigkeit des Eintretens eines
Ereignisses gezählt wird, das zu zufälligen Zeitpunkten und unabhängig von einander
eintritt. Beispiele für solche Situationen sind etwa
• das Eintreffen von Telefonanrufen bei einer Vermittlungsstelle,
• das Auftreffen von radioaktiven Partikeln auf einem Geigerzähler,
• die Ankunft eines Kunden an einem Bedienungsschalter,
• das Eintreffen von Bedienwünschen an einem Server,
• das Auftreten von Softwarefehlern in einem Programmsystem.
59
Herunterladen