WAHRSCHEINLICHKEITSVERTEILUNGEN 1. ZUFAllsVARiABlEn

Werbung
WAHRSCHEINLICHKEITSVERTEILUNGEN
1. Zufallsvariablen
Definition: Eine Funktion X : Ω → R bezeichnet man als Zufallsvariable. Die
Werte X(ω) nennt man dann Realisationen der Zufallsvariablen.
Bemerkung: Zufallsvariable werden unter anderem zur Filterung “ interessanter
”
Daten verwendet. Das Bild X(Ω) = {X(ω) | ω ∈ Ω} dient hierbei als neuer, entsprechend modellierter Ereignisraum und die Wahrscheinlichkeiten der neuen Elementarereignisse ergeben sich durch die Wahrscheinlichkeiten der Urbild-Ereignisse“.
”
Definition: Man nennt eine Zufallsvariable diskret, falls das Bild X(Ω) endlich
(oder höchstens abzählbar unendlich) ist. In diesem Fall schreibt man X(Ω) =
{x1 , x2 , x3 , . . .} und interpretiert die pi = P (X = xi ) als die neuen Wahrschein”
lichkeiten“, wobei P (X = x) lediglich eine übliche Schreibweise für die Wahrscheinlichkeit P (X −1 (x)) des Urbilds
X −1 (x) = {ω ∈ Ω | X(ω) = x}
ist. Die Funktion f : R → R mit f (x) = P (X = x) und


X
X
X
[
pi =
f (xi ) =
P X −1 (xi ) = P  X −1 (xi ) = P (Ω) = 1
i≥1
i≥1
i≥1
i≥1
heißt dann Wahrscheinlichkeitsverteilung von X. Wegen P (∅) = 0 und X −1 (x) = ∅
für x ∈
/ X(Ω), gilt somit insbesondere f (x) = 0 für x ∈
/ X(Ω).
Bemerkung:
(i) Dass X(Ω) abzählbar unendlich ist, bedeutet für uns hier lediglich, dass
X(Ω) zwar unendlich viele Elemente enthält, wir aber die Elemente trotzdem abzählen bzw. durchnummerieren können. Wir werden es in der Vorlesung aber (fast) ausschließlich mit endlichen Ereignisräumen zu tun haben.
(ii) In der Literatur wird die Wahrscheinlichkeitsverteilung manchmal nur auf
der Menge der Realisationen, d.h. als Abbildung f : X(Ω) → R definiert.
Es ist für uns jedoch zweckmäßig den Definitionsbereich direkt auf ganz R
zu erweitern, um uns diese Diskussion an späterer Stelle zu ersparen.
Beispiel: (Binomialverteilung)
Ein Zufallsexperiment mit nur zwei möglichen Ausgängen wird Bernoulli-Experiment
genannt. Der Ereignisraum kann hierbei durch Ω = {E, E c } mit P (E) = p und
P (E c ) = 1 − p beschrieben werden für 0 ≤ p ≤ 1. Mithilfe der Zufallsvariablen
X : Ω → R, X(E) = 1 und X(0) = E c , erhält man Ω0 = X(Ω) = {0, 1} mit
f (1) = p, f (0) = 1 − p als Standardmodell für ein solches Experiment.
Wiederholt man ein Bernoulli-Experiment n-mal unabhängig, so erhält man ein
n-stufiges Bernoulli-Experiment. Für X = Anzahl der Ausgänge E (Erfolge)“,
”
X(Ω) = {0, 1, . . . , n}, ist dann
n k
f (k) = P (X = k) =
p (1 − p)n−k .
k
Diese Verteilung wird Binomialverteilung genannt und auch mit Bn,p (k) bezeichnet.
Man schreibt dann oft auch kurz einfach X ∼ Bn,p , um auszudrücken, dass die
Zufallsvariable X entsprechend binomialverteilt ist.
Nicht alle Zufallsexperimente können durch diskrete Zufallsvariablen beschrieben
werden. Bei kontinuierlichen Merkmalen benötigt man eine weitere Klasse von Zufallsvariablen.
Definition: Eine Zufallsvariable X : Ω → R nennt man stetig, falls die Menge
X(Ω) ein echtes Intervall enthält und falls es eine Funktion f : R → R gibt, so dass
für jedes Intervall [a, b] ⊂ R gilt
Z b
P (a ≤ X ≤ b) =
f (x)dx.
a
Eine solche Funktion f heißt dann die zu X gehörende Dichtefunktion. Will man
Verwechslungen ausschließen, schreibt man auch fX , um die Zugehörigkeit zur Zufallsvariablen zu kennzeichnen. Es gilt dann
Z ∞
Z a
f (x)dx = P (Ω) = 1 und P (X ≤ a) =
f (x)dx.
−∞
−∞
Bemerkung: Insbesondere ist für eine stetige Zufallsvariable
Z a
f (x)dx = 0
P (X = a) =
a
und die Funktion a 7→
Ra
−∞
f (x)dx stetig.
Beispiel: Eine Zufallsvariable X heißt:
(i) exponentialverteilt, falls die zugehörige Dichte von der Form
(
c · exp(−c · x), x ≥ 0
f (x) =
0,
x<0
für ein c > 0 ist.
(ii) normalverteilt nach (der Normalverteilung) N (µ, σ 2 ), falls die zugehörige
Dichte durch
1
(x − µ)2
f (x) = √ exp −
2σ 2
σ 2π
für σ > 0 gegeben ist.
Für µ = 0 und σ = 1 erhält man die Dichte der Standardnormalverteilung
N (0, 1), die man gewöhnlicherweise mit dem griechischen Buchstaben ϕ
bezeichnet,
2
1
x
ϕ(x) = √ exp −
.
2
2π
Definition: Ist X : Ω → R eine Zufallsvariable, so nennt man die Funktion
F : R → R, definiert durch F (x) = P (X ≤ x), die Verteilungsfunktion von X.
Auch hier verwendet man gelegentlich die Notation FX , um durch Kennzeichnung
der Zugehörigkeit Verwechslungen auszuschließen.
Bemerkungen:
(i) Ist X stetig mit Dichte f , so ist, wie oben bereits erwähnt,
Z x
F (x) =
f (t)dt
−∞
stetig (daher die Bezeichnung) und es gilt P (a ≤ X ≤ b) = F (b) − F (a).
(ii) Ist X diskret mit Wahrscheinlichkeitsverteilung f , so ist
X
F (x) =
f (xi ).
xi ≤x
(iii) P (X > x) = 1 − P (X ≤ x) = 1 − F (x).
(iv) Ist X stetig, so spielt es bei der Angabe von Wahrscheinlichkeiten generell
keine Rolle, ob man echte Ungleichungen verwendet oder nicht, denn es
ist z.B. P (X < x) = P (X ≤ x) und P (X > x) = P (X ≥ x), wegen
P (X = x) = 0.
Direkt aus den Definitionen (und dem Hauptsatz der Differential- und Integralrechung) folgt, dass im Falle einer stetigen Dichtefunktion, die Verteilungsfunktion
einer stetigen Zufallsvariablen eine Stammfunktion der Dichtefunktion ist. Dies ist
die Aussage des folgenden Satzes.
Satz: Überall wo die Dichte f einer stetigen Zufallsvariable X stetig ist, existiert
die Ableitung der Verteilungsfunktion F mit F 0 (x) = f (x).
Beispiel: Ist X standardnormalverteilt, d.h. besitzt die Dichte ϕ(x) =
so ist die Verteilungsfunktion gegeben durch
2
Z x
1
t
Φ(x) = P (X ≤ x) =
exp −
dt.
2π
2
−∞
1
2π
2
exp − x2 ,
Dieses Integral ist nicht geschlossen lösbar, es gibt jedoch ausführliche Wertetabellen für Φ(x) (durch Näherungsverfahren).
In der Vorlesung wurde gezeigt, dass (und wie) man die Verteilungsfunktionen
nach N (µ, σ 2 ) verteilter Zufallsvariablen auf die Verteilungsfunktion Φ der Standardnormalverteilung zurückführen kann. Es reicht daher die Werte der Funktion
Φ zu kennen, um die Werte der Verteilungsfunktionen beliebig normalverteilter
Zufallsvariablen zu berechnen.
Satz: Ist X ∼ N (µ, σ 2 ) normalverteilt, so ist die sogenannte standardisierte Va: Ω → R, ω 7→ X(ω)−µ
, standardnormalverteilt und es gilt
riable Y = X−µ
σ
σ
x−µ
x−µ
x−µ
FX (x) = P (X ≤ x) = P Y ≤
= FY
=Φ
.
σ
σ
σ
Herunterladen