WAHRSCHEINLICHKEITSVERTEILUNGEN 1. ZUFAllsVARiABlEn

Werbung
WAHRSCHEINLICHKEITSVERTEILUNGEN
1. Zufallsvariablen
Zur Formalisierung ist es oft zweckmäßig sich etwas von den konkreten Experimenten zu entfernen und/oder die jeweils interessanten Daten aus den Ergebnissen
zu filtern. Hierfür stehen einem Zufallsvariablen zur Verfügung.
Definition Eine Funktion X : Ω → R bezeichnet man als Zufallsvariable. Die
Werte X(ω), für ω ∈ Ω, nennt man Realisationen der Zufallsvariablen.
Es gibt verschiedene Arten von Zufallsvariablen. Man unterscheidet hierbei, ob
sie ein diskretes oder ein kontinuierliches Merkmal beschreiben.
Definition Wir nennen eine Zufallsvariable diskret, falls das Bild X(Ω) ⊂ R
endlich ist. In diesem Fall schreiben wir X(Ω) = {x1 , . . . , xN } und setzen pi :=
P (X −1 (xi )) =: P (X = xi ), wobei X −1 (xi ) = {ω ∈ Ω : X(ω) = xi } ⊂ Ω das Urbild
von xi unter X bezeichnet.
Die Funktion f : X(Ω) → R, definiert durch f (xi ) = pi nennt man dann die
Wahrscheinlichkeitsverteilung von X und es gilt
n
n
n
X
X
[
f (xi ) =
P (X −1 (xi )) = P ( X −1 (xi )) = P (Ω) = 1.
i=1
i=1
i=1
Üblicherweise erweitert man den Definitionsbereich von f auf ganz R durch f (x) =
P (X −1 (x)) = P (∅) = 0 für x ∈
/ X(Ω). Mit dieser Konvention betrachten wir
zukünftig stets f : R → R.
Bemerkung In der Literatur ist es üblich, für eine diskrete Zufallsvariable sogar
eine abzählbar unendliche Wertemenge X(Ω) zuzulassen. Da es keinen großen Unterschied macht und es bei unseren Anwendungen in der Regel nur endlich viele
mögliche Ausgänge der betrachteten Zufallsexperimente gibt, beschränken wir uns
in dieser Vorlesung jedoch auf obige Definition.
Beispiel (Binomialverteilung) Zufallsexperimente, bei denen nur zwei Ausgängen
möglich sind, werden Bernoulli-Experimente genannt. Der Ereignisraum kann dann
durch Ω = {E, E} mit P (E) = p und P (E) = 1 − p =: q für 0 ≤ p ≤ 1 beschrieben
werden.
e : Ω → R mit X(E)
e
e
Führen wir dann die Zufallsvariable X
= 1, X(E)
= 0 ein, so ist
e
X(Ω) = {0, 1} und die entsprechende Wahrscheinlichkeitsverteilung f (1) = P (E) =
p, f (0) = P (E) = q heißt die zugehörige Zweipunktverteilung mit Parameter p.
Wiederholen wir nun ein solches Experiment n-mal (unabhängig voneinander), so
erhalten wir ein sogenanntes n-stufiges Bernoulli-Experiment. Bei jeder einzelnen
Wiederholung tritt dann entweder E oder E ein und wir können uns fragen, wie
hoch die Wahrscheinlichkeit dafür ist, dass das Ereignis E genau k-mal eintritt.
Dafür betrachten wir die Zufallsvariable
X = Anzahl der Wiederholungen mit Ausgang E “
”
und überlegen uns, dass für k ∈ {0, 1, . . . , n} die zugehörige Wahrscheinlichkeitsverteilung gegeben ist durch
n k
n k n−k
f (k) = P (X = k) =
p (1 − p)n−k =
p q
.
k
k
Insbesondere gilt daher
n
1 = (p + (1 − p)) =
n X
n
k=0
k
pk (1 − p)n−k =
n
X
P (X = k).
k=0
Die Wahrscheinlichkeitsverteilung f (k) = nk pk (1 − p)n−k heißt Binomialverteilung
und wird meistens mit Bn,p (k) bezeichnet. Man schreibt dann oft kurz einfach
X ∼ Bn,p , um auszudrücken, dass die Zufallsvariable entsprechend binomialverteilt
ist.
Aber nicht alle Zufallsexperimente können durch diskrete Zufallsvariablen beschrieben werden. Bei kontinuierlichen Merkmalen benötigt man eine weitere Klasse von
Zufallsvariablen.
Definition Eine Zufallsvariable X : Ω → R nennt man stetig, falls die Menge X(Ω)
ihrer Realisationen ein echtes Intervall enthält und falls es eine Funktion f : R → R
gibt, so dass für jedes Intervall [a, b] ⊂ R
Z
P (a ≤ X ≤ b) =
b
f (x) dx
a
gilt. Ein solches f heißt dann die zu X gehörende Dichte. Es gilt dann
Z ∞
f (x) dx = P (Ω) = 1
−∞
(vgl. für diskrete Zufallsvariable X mit X(Ω) = {x1 , . . . , xN } ist
PN
i=1 P (X = xi ) = P (Ω) = 1) und es ist
Z a
P (X ≤ a) =
f (x) dx.
PN
i=1
f (xi ) =
−∞
Beispiele Eine Zufallsvariable X heißt
(i) exponentialverteilt, falls die zugehörige Dichte von der Form
(
c e−cx , x ≥ 0
f (x) =
0,
x<0
für ein c > 0 ist.
(ii) normalverteilt nach (der Normalverteilung) N (µ, σ 2 ), falls die zugehörige
Dichte durch
(x−µ)2
1
f (x) = √ e− 2σ2
σ 2π
für σ > 0 gegeben ist.
Für µ = 0 und σ = 1 erhält man die Dichte der Standardnormalverteilung
N (0, 1), die man gewöhnlicherweise mit dem griechischen Buchstaben ϕ
bezeichnet,
x2
1
ϕ(x) = √ e− 2 .
2π
Definition Ist X eine Zufallsvariable, so heißt die Funktion F : R → R, F (x) =
P (X ≤ x), die Verteilungsfunktion von X. Falls nötig, bezeichnen wir die Verteilungsfunktion von X auch mit FX , um deutlich zu machen zu welcher Zufallsvariablen die Funktion gehört.
Bemerkungen
(i) Kennt man F , so kann man P (a ≤ X ≤ b) für jedes Intervall [a, b] berechnen
(vgl. Übung).
Rx
(ii) Ist X stetig mit Dichte f , so ist F (x) = −∞ f (t) dt.
P
(iii) Ist X diskret mit X(Ω) = {x1 , . . . , xN }, so ist F (x) = {xi ≤x} f (xi ) =
P
{xi ≤x} P (X = xi ).
Direkt aus der Definition der Verteilungsfunktion erhält man mit dem Hauptsatz
der Differential- und Integralrechnung die folgende Aussage.
Satz Überall wo die Dichte f einer stetigen Zufallsvariablen X stetig ist, existiert
die Ableitung der zugehörigen Verteilungsfunktion F mit F 0 (x) = f (x).
Beispiel Es sei X ∼ N (0, 1), d.h. standardnormalverteilt mit Dichte ϕ(x) =
√1
2π
e−
x2
2
. Dann bezeichnet man die Verteilungsfunktion von X üblicherweise mit
Rx
t2
Φ und es gilt Φ(x) = P (X ≤ x) = √12π −∞ e− 2 dt, also insbesondere Φ0 (x) =
ϕ(x). Dieses Integral ist nicht elementar/geschlossen lösbar, es gibt jedoch (durch
Näherungsverfahren) sehr ausführliche Wertetabellen für Φ.
In der Vorlesung wurde gezeigt, dass (und wie) man die Verteilungsfunktionen nach
N (µ, σ 2 ) verteilter Zufallsvariablen auf die Verteilungsfunktion Φ der Standardnormalverteilung zurückführen kann. Es reicht daher die Werte der Funktion Φ zu
kennen, um die Werte der Verteilungsfunktionen beliebig normalverteilter Zufallsvariablen zu berechnen.
Satz Für eine normalverteilte Zufallsvariable X ∼ N (µ, σ 2 ) ist die sogenannte
standardisierte Variable Y = X−µ
standardnormalverteilt und es gilt
σ
x−µ
x−µ
FX (x) = P (X ≤ x) = P (Y ≤
) = Φ(
).
σ
σ
Herunterladen