Vorlesung 6b Von der Binomial

Werbung
Vorlesung 6b
Von der Binomial-zur
Normalverteilung
1
Binomialverteilungen mit großem n und großer Varianz npq
sehen “glockenförmig” aus,
wenn man sie geeignet “ins Bild holt”.
2
0.03
0.000
0.010
0.020
n = 1000, p = 0.3
0
200
400
600
800
1000
0.030
n = 1000, p = 0.3
0.000
0.010
0.020
270 ≤ k ≤ 330
270
280
290
300
310
320
330
0.000
0.004
0.008
0.012
n = 4000, p = 0.3
0
1000
2000
3000
4000
0.01
n = 4000, p = 0.3
0.000
0.005
0.010
1140 ≤ k ≤ 1260
1140
1160
1180
1200
1220
1240
1260
Bezeichne
1 −x2/2
ϕ(x) := √ e
2π
die Dichte der Standard-Normalverteilung.
Warum und in welchem Sinn lassen sich Binomialgewichte
durch die Normaldichte annähern?
7
Für n ∈ N und p ∈ (0, 1) sei
µ := np,
σ :=
√
npq.
Für die Binomialgewichte schreiben wir kurz
n k n−k
p q
.
w(k) :=
k
8
Es stellt sich heraus (eine Heuristik dafür folgt gleich):
Für großes σ
und k nicht allzu weit vom Zentrum np ist
1 k − µ
w(k) ≈ ϕ
σ
σ
Zur Erinnerung:
1 x − µ
ϕ
dx
σ
σ
ist die Dichte der Normalverteilung
mit Erwartungswert µ und Varianz σ 2.
9
1 k − µ
w(k) ≈ ϕ
σ
σ
k−µ
Mit zk :=
wird dies zu:
σ
w(k) ≈ (zk − zk−1)ϕ(zk ).
10
Daraus bekommt man für Binom(n, p)-verteiltes K
√
mit großem σ = npq:
K−µ
≤ b}
P{a ≤
σ
X
=
w(k)
k:a≤zk ≤b
≈
X
(zk − zk−1)ϕ(zk )
k:a≤zk ≤b
≈
Z b
a
ϕ(z) dz.
11
Fazit:
√
Für großes σ = npq ist die Standardisierung
einer binomialverteilten Zufallsvariablen K,
K − np
K −µ
= √
,
σ
npq
approximativ so verteilt
wie eine standardnormalverteilte Zufallsvariable Z:
K−µ
∈ [a, b] ≈ P{Z ∈ [a, b]}.
P
σ
12
Abraham de Moivre
1667-1754
13
Jetzt die versprochene Heuristik für
1 k − µ
n k n−k
p q
≈ ϕ
w(k) =
:
k
σ
σ
Idee: Betrachte die “sukzessiven Quotienten”
n−k+1 p
w(k)
=
,
w(k − 1)
k
q
aufmultipliziert beginnend vom “Zentrum”
ℓ := ⌊(n + 1)p⌋.
14
Ein paar Zeilen Rechnung (vgl. Skript Wak S. 80) ergeben für
j = 1, 2, , . . . mit j ≪ n:
w(ℓ + j) j
ln
≈ − 2.
w(ℓ + j − 1)
σ
Aufsummiert zwischen j = 1 und j = k − ℓ :
1 (k − ℓ)2
1 k − µ 2
w(k) ≈− 2
≈−
ln
w(ℓ)
σ
2
2
σ
√
1 k − µ
1 k − µ 2
= w(ℓ)σ 2π ϕ
w(k) ≈ w(ℓ) exp −
2
σ
σ
σ
15
√
1 k − µ
w(k) ≈ w(ℓ) σ 2π ϕ
σ
σ
Summation über k:
√
1 ≈ w(ℓ)σ 2π
1 k − µ
w(k) ≈ ϕ
σ
σ
So weit die Heuristik.
16
Den folgenden “lokalen Grenzwertsatz” bekommt man
mit der (erstmals von de Moivre entdeckten) Stirling-Formel
(vgl. Skript Wa S. 84-85, auf S. 82 ff findet sich dort
auch ein Beweis der Stirling-Formel).
17
Satz
Sei p ∈ (0, 1) fest, und kn eine Folge natürlicher Zahlen mit
2
|kn − np|
3
|kn − np| = o(n )
= 0).
(d.h. n→∞
lim
2
n3
Dann gilt für die Binomialgewichte b(n, p; kn) mit n → ∞
2
−np)
1
1
− (kn2npq
√
.
e
b(n, p; kn) ∼ √
npq 2π
bn ∼ an,
dass die Folge der Quotienten bn/an gegen Eins konvergiert.
Dabei bedeutet
18
Aus dem lokalen Grenzwertsatz ergibt sich durch Summieren
und Kontrollieren der Fehlerterme (vgl. Skript Wa S. 86) ein
1)
Globaler Grenzwertsatz, von de Moivre (1733, für p = 2
und Laplace (1810, für p allgemein))
Für n = 1, 2, . . . sei Kn eine binomial(n, p)-verteilte
−np
Zufallsvariable, und Kn∗ := K√nnpq
ihre Standardisierung.
Dann gilt für alle a < b ∈ R:
∗
lim
P
({K
n ∈ [a, b]}) =
n→∞
Zb
a
ϕ(z)dz,
1 − z2
mit ϕ(z) = √ e 2 .
2π
19
Man sagt dafür auch kurz:
Die Folge der Zufallsvariablen Kn∗
konvergiert in Verteilung
gegen eine standard-normalverteilte Zufallsvariable Z.
20
Herunterladen