WAHRSCHEINLICHKEITSVERTEILUNGEN 1. ZUFAllsVARiABlEn

WAHRSCHEINLICHKEITSVERTEILUNGEN
1. Zufallsvariablen
Zur Formalisierung ist es oft zweckmäßig sich etwas von den konkreten Experimenten zu entfernen und/oder die jeweils interessanten Daten aus den Ergebnissen
zu filtern. Hierfür stehen einem Zufallsvariablen zur Verfügung.
Definition Eine Funktion X : Ω → R bezeichnet man als Zufallsvariable. Die
Werte X(ω), für ω ∈ Ω, nennt man Realisationen der Zufallsvariablen.
Es gibt verschiedene Arten von Zufallsvariablen. Man unterscheidet hierbei, ob
sie ein diskretes oder ein kontinuierliches Merkmal beschreiben.
Definition Wir nennen eine Zufallsvariable diskret, falls das Bild X(Ω) ⊂ R
endlich ist. In diesem Fall schreiben wir X(Ω) = {x1 , . . . , xN } und setzen pi :=
P (X −1 (xi )) =: P (X = xi ), wobei X −1 (xi ) = {ω ∈ Ω : X(ω) = xi } ⊂ Ω das Urbild
von xi unter X bezeichnet.
Die Funktion f : X(Ω) → R, definiert durch f (xi ) = pi nennt man dann die
Wahrscheinlichkeitsverteilung von X und es gilt
n
n
n
X
X
[
f (xi ) =
P (X −1 (xi )) = P ( X −1 (xi )) = P (Ω) = 1.
i=1
i=1
i=1
Üblicherweise erweitert man den Definitionsbereich von f auf ganz R durch f (x) =
P (X −1 (x)) = P (∅) = 0 für x ∈
/ X(Ω). Mit dieser Konvention betrachten wir
zukünftig stets f : R → R.
Bemerkung In der Literatur ist es üblich, für eine diskrete Zufallsvariable sogar
eine abzählbar unendliche Wertemenge X(Ω) zuzulassen. Da es keinen großen Unterschied macht und es bei unseren Anwendungen in der Regel nur endlich viele
mögliche Ausgänge der betrachteten Zufallsexperimente gibt, beschränken wir uns
in dieser Vorlesung jedoch auf obige Definition.
Beispiel (Binomialverteilung) Zufallsexperimente, bei denen nur zwei Ausgängen
möglich sind, werden Bernoulli-Experimente genannt. Der Ereignisraum kann dann
durch Ω = {E, E} mit P (E) = p und P (E) = 1 − p =: q für 0 ≤ p ≤ 1 beschrieben
werden.
e : Ω → R mit X(E)
e
e
Führen wir dann die Zufallsvariable X
= 1, X(E)
= 0 ein, so ist
e
X(Ω) = {0, 1} und die entsprechende Wahrscheinlichkeitsverteilung f (1) = P (E) =
p, f (0) = P (E) = q heißt die zugehörige Zweipunktverteilung mit Parameter p.
Wiederholen wir nun ein solches Experiment n-mal (unabhängig voneinander), so
erhalten wir ein sogenanntes n-stufiges Bernoulli-Experiment. Bei jeder einzelnen
Wiederholung tritt dann entweder E oder E ein und wir können uns fragen, wie
hoch die Wahrscheinlichkeit dafür ist, dass das Ereignis E genau k-mal eintritt.
Dafür betrachten wir die Zufallsvariable
X = Anzahl der Wiederholungen mit Ausgang E “
”
und überlegen uns, dass für k ∈ {0, 1, . . . , n} die zugehörige Wahrscheinlichkeitsverteilung gegeben ist durch
n k
n k n−k
f (k) = P (X = k) =
p (1 − p)n−k =
p q
.
k
k
Insbesondere gilt daher
n
1 = (p + (1 − p)) =
n X
n
k=0
k
pk (1 − p)n−k =
n
X
P (X = k).
k=0
Die Wahrscheinlichkeitsverteilung f (k) = nk pk (1 − p)n−k heißt Binomialverteilung
und wird meistens mit Bn,p (k) bezeichnet. Man schreibt dann oft kurz einfach
X ∼ Bn,p , um auszudrücken, dass die Zufallsvariable entsprechend binomialverteilt
ist.
Aber nicht alle Zufallsexperimente können durch diskrete Zufallsvariablen beschrieben werden. Bei kontinuierlichen Merkmalen benötigt man eine weitere Klasse von
Zufallsvariablen.
Definition Eine Zufallsvariable X : Ω → R nennt man stetig, falls die Menge X(Ω)
ihrer Realisationen ein echtes Intervall enthält und falls es eine Funktion f : R → R
gibt, so dass für jedes Intervall [a, b] ⊂ R
Z
P (a ≤ X ≤ b) =
b
f (x) dx
a
gilt. Ein solches f heißt dann die zu X gehörende Dichte. Es gilt dann
Z ∞
f (x) dx = P (Ω) = 1
−∞
(vgl. für diskrete Zufallsvariable X mit X(Ω) = {x1 , . . . , xN } ist
PN
i=1 P (X = xi ) = P (Ω) = 1) und es ist
Z a
P (X ≤ a) =
f (x) dx.
PN
i=1
f (xi ) =
−∞
Beispiele Eine Zufallsvariable X heißt
(i) exponentialverteilt, falls die zugehörige Dichte von der Form
(
c e−cx , x ≥ 0
f (x) =
0,
x<0
für ein c > 0 ist.
(ii) normalverteilt nach (der Normalverteilung) N (µ, σ 2 ), falls die zugehörige
Dichte durch
(x−µ)2
1
f (x) = √ e− 2σ2
σ 2π
für σ > 0 gegeben ist.
Für µ = 0 und σ = 1 erhält man die Dichte der Standardnormalverteilung
N (0, 1), die man gewöhnlicherweise mit dem griechischen Buchstaben ϕ
bezeichnet,
x2
1
ϕ(x) = √ e− 2 .
2π
Definition Ist X eine Zufallsvariable, so heißt die Funktion F : R → R, F (x) =
P (X ≤ x), die Verteilungsfunktion von X. Falls nötig, bezeichnen wir die Verteilungsfunktion von X auch mit FX , um deutlich zu machen zu welcher Zufallsvariablen die Funktion gehört.
Bemerkungen
(i) Kennt man F , so kann man P (a ≤ X ≤ b) für jedes Intervall [a, b] berechnen
(vgl. Übung).
Rx
(ii) Ist X stetig mit Dichte f , so ist F (x) = −∞ f (t) dt.
P
(iii) Ist X diskret mit X(Ω) = {x1 , . . . , xN }, so ist F (x) = {xi ≤x} f (xi ) =
P
{xi ≤x} P (X = xi ).
Direkt aus der Definition der Verteilungsfunktion erhält man mit dem Hauptsatz
der Differential- und Integralrechnung die folgende Aussage.
Satz Überall wo die Dichte f einer stetigen Zufallsvariablen X stetig ist, existiert
die Ableitung der zugehörigen Verteilungsfunktion F mit F 0 (x) = f (x).
Beispiel Es sei X ∼ N (0, 1), d.h. standardnormalverteilt mit Dichte ϕ(x) =
√1
2π
e−
x2
2
. Dann bezeichnet man die Verteilungsfunktion von X üblicherweise mit
Rx
t2
Φ und es gilt Φ(x) = P (X ≤ x) = √12π −∞ e− 2 dt, also insbesondere Φ0 (x) =
ϕ(x). Dieses Integral ist nicht elementar/geschlossen lösbar, es gibt jedoch (durch
Näherungsverfahren) sehr ausführliche Wertetabellen für Φ.
In der Vorlesung wurde gezeigt, dass (und wie) man die Verteilungsfunktionen nach
N (µ, σ 2 ) verteilter Zufallsvariablen auf die Verteilungsfunktion Φ der Standardnormalverteilung zurückführen kann. Es reicht daher die Werte der Funktion Φ zu
kennen, um die Werte der Verteilungsfunktionen beliebig normalverteilter Zufallsvariablen zu berechnen.
Satz Für eine normalverteilte Zufallsvariable X ∼ N (µ, σ 2 ) ist die sogenannte
standardisierte Variable Y = X−µ
standardnormalverteilt und es gilt
σ
x−µ
x−µ
FX (x) = P (X ≤ x) = P (Y ≤
) = Φ(
).
σ
σ