Definition 2.34. Sei X eine stetige Z.V. mit Verteilungsfunktion F und

Werbung
Definition 2.34. Sei X eine stetige Z.V. mit Verteilungsfunktion F und Dichte
f . Dann heißt
Z
E(X) :=
∞
−∞
x · f (x) dx
der Erwartungswert von X, sofern dieses Integral existiert. Entsprechend wird
die Varianz V (X) definiert:
Z ∞
(x − E(X))2 · f (x) dx.
V (X) =
−∞
Die Sätze über Erwartungswerte und Varianz in Kapitel 2.3 übertragen sich auf
den stetigen Fall, insbesondere gilt auch Satz 2.16.
Wir können die Varianz auch wie folgt berechnen:
Z ∞
V (X) =
x2 · f (x) dx − [E(X)]2.
−∞
Beispiel 2.35. Erwartungswert einer N (µ, σ 2) verteilten Z.V. ist µ, die Varianz
ist σ 2. In dem Fall ist die Zufallsvariable (X − µ)/σ standardnormalverteilt. Die
Verteilungsfunktion einer N (µ, σ 2) verteilten Z.V. ist
x − µ
Φ
σ
51
und die Dichtefunktion
f (x) =
wobei
1 x − µ
ϕ
σ
σ
1 2
1
ϕ(x) = √ e− 2 x
2π
die Dichte der Standardnormalverteilung mit µ = 0 und σ = 1 ist.
2.6
Eigenschaften der Normalverteilung
Satz 2.36. Es seien X1 und X2 zwei unabhängig normalverteilte Zufallsvariablen mit Erwartungswerten µ1 und µ2 sowie Varianzen σ12 und σ22. Dann
ist auch X1 + X2 normalverteilt mit Erwartungswert µ1 + µ2 und Varianz
σ12 + σ22.
Man nennt diese Eigenschaft auch die Faltungseigenschaft der Normalverteilung:
Haben ganz allgemein zwei unabhängige Z.V. die Dichten f und g, so hat X1 +X2
die Dichte
Z ∞
f (t)g(x − t) dt
−∞
52
und das hier auftretende Integral heißt die Faltung von f und g.
Beim schwachen Gesetz der großen Zahlen (Satz 2.30) haben wir gesehen, dass
man Erwartungswert und Varianz des arithmetischen Mittels von unabhängigen
und identisch verteilten Zufallsvariablen berechnen kann. Im Fall normalverteilter
Z.V. kennt man sogar die Verteilung. Der Beweis ist im Gegensatz zu den meisten
bisher formulierten Sätze nicht trivial:
Satz 2.37 (Zentraler Grenzwertsatz). Es seien X1, . . . , Xn unabhängige und
identisch verteilte Zufallsvariablen mit Erwartungswert µ und Varianz σ 2
auf einem Wahrscheinlichkeitsraum (Ω, P ). Dann gilt für die Folge der Zufallsvariablen X̃ = n1 (X1 + . . . + Xn):
lim P (
n→∞
X̃ − µ
√ ≤ z) = Φ(z).
σ/ n
Mit anderen Worten: Das arithmetische Mittel ist asymptotisch N (µ, σ 2/n)verteilt.
Sei FB(n,p) die Verteilungsfunktion einer B(n, p) verteilten Zufallsvariable Sn.
Dann gilt
x + 12 − np FB(n,p)(x) ≈ Φ p
np(1 − p)
53
falls np undn(1 − p) beide groß sind (Faustregel: np(1 − p) ≥ 9). Man nennt die
Addition von +1/2 die Stetigkeitskorrektur. Das wird deutlich, wenn man sich
ein Beispiel anschaut, z.B. die Verteilung von B(300, 0.2) und die entsprechende
Normalverteilung ohne und mit Stetigkeitskorrektur. Im ersten Bild ohne, im
zweiten Bild mit Stetigkeitskorrektur:
54
Man nennt diese Approximation der Binomialverteilung durch die Normalverteilung
auch den zentralen Grenzwertsatz von deMoivre-Laplace. Beachten Sie, dass bei
der Berechnung der W.K. P (k ≤ Sn ≤ l) die “Stetigkeitskorrektur” an der
unteren Schranke mit einem anderen Vorzeichen erfolgt:
l + 21 − np k − 12 − np P (k ≤ Sn ≤ l) ≈ Φ p
−Φ p
np(1 − p)
np(1 − p)
Da die Poissonverteilung als Grenzverteilung der Binomialverteilung auftritt ist
es auch nicht überraschend, dass die Poissonverteilung FP (λ) zum Parameter λ
55
durch die Normalverteilung approximiert werden kann:
x + 1/2 − λ √
FP (λ)(x) ≈ Φ
λ
2.7
Gleichverteilung und Exponentialverteilung
Eine Zufallsvariable X mit Realisierungen auf einem Intervall [a, b] heißt gleichverteilt, falls für die Wahrscheinlichkeiten gilt
d−c
P (X ∈ [c, d]) =
b−a
für a ≤ c ≤ d ≤ b. Die Dichtefunktion f (x) ist dann
1
x ∈ (a, b)
f (x) = b−a
0 sonst
Man kann dann daraus leicht Erwartungswert und Varianz einer auf [a, b] gleichverteilten Zufallsvariablen X bestimmen:
b+a
E(X) =
2
(b − a)2
.
V (X) =
12
56
Definition 2.38. Eine Zufallsvariable X heißt exponentialverteilt zum Parameter λ (geschrieben X ∼ Exp(λ)), wenn die Dichte f (x) = λ · e−λx für x > 0
und 0 sonst ist.
Satz 2.39. Die Verteilungsfunktion F (x) einer Exponentialverteilung ist
F (x) = 1 − e−λx für x ≥ 0 und 0 für x < 0. Der Erwartungswert ist
1/λ und die Varianz 1/λ2.
Bemerkung 2.40. Die Exponentialverteilung ist gedächtnislos im folgenden
Sinne:
P (X ≥ t + h|X ≥ t) = P (X ≥ h)
für alle t, h > 0.
Hier sind die Bilder der Dichten von zwei Exponentialverteilungen, einmal zum
Parameter λ = 1 (rot) und einmal zum Parameter λ = 1/2 (blau).
57
2.8
Gammaverteilung
Zunächst verallgemeinern wir den Begriff der Fakultät:
Z ∞
xz−1e−x.x, z > 0
Γ(z) :=
0
Es gilt Γ(k) = (k − 1)! für k ∈ {1, 2, 3, . . .}.
Definition 2.41. Eine Zufallsvariable X heißt gammaverteilt (∼ Γ(α, λ)) mit
Parametern α > 0 und λ > 0, wenn ihre Dichte
λα α−1 −λx
f (x) =
x e
fürx > 0
Γ(α)
58
ist (und 0 für x ≤ 0).
Der Parameter λ ist nur ein “Formparameter”, denn wenn X ∼ Γ(α, 1), dann
gilt λ1 X ∼ Γ(α, λ). Der Parameter α hingegen hat wesentlichen Einflußauf die
Dichtefunktion. Im Fall α = 1 erhalten wir die Exponentialverteilung.
Satz 2.42. Sei X ∼ Γ(α, λ), dann
E(X) =
α
λ
V (X) =
α
.
λ2
Das folgende Bild zeigt die Dichte der Gammaverteilung jeweils für λ = 1 und
α = 0.5 (rot), α = 1 (blau) und α = 2 (grün):
59
3
Statistik
60
Herunterladen