Vorlesung 6b 1 Vorlesung 6b Von der Binomial-zur Normalverteilung Binomialverteilungen mit großem n und großer Varianz npq sehen “glockenförmig” aus, wenn man sie geeignet “ins Bild holt”. 2 Binomialverteilungen mit großem n und großer Varianz npq sehen “glockenförmig” aus, wenn man sie geeignet “ins Bild holt”. 0.03 0.000 0.010 0.020 n = 1000, p = 0.3 0 200 400 600 800 1000 0.030 n = 1000, p = 0.3 0.000 0.010 0.020 270 ≤ k ≤ 330 270 280 290 300 310 320 330 0.000 0.004 0.008 0.012 n = 4000, p = 0.3 0 1000 2000 3000 4000 0.01 n = 4000, p = 0.3 0.000 0.005 0.010 1140 ≤ k ≤ 1260 1140 1160 1180 1200 1220 1240 1260 Bezeichne 7 Bezeichne 1 −x2/2 ϕ(x) := √ e 2π Bezeichne 1 −x2/2 ϕ(x) := √ e 2π die Dichte der Standard-Normalverteilung. Bezeichne 1 −x2/2 ϕ(x) := √ e 2π die Dichte der Standard-Normalverteilung. Warum und in welchem Sinn lassen sich Binomialgewichte Bezeichne 1 −x2/2 ϕ(x) := √ e 2π die Dichte der Standard-Normalverteilung. Warum und in welchem Sinn lassen sich Binomialgewichte durch die Normaldichte annähern? Für n ∈ N und p ∈ (0, 1) sei 8 Für n ∈ N und p ∈ (0, 1) sei µ := np, σ := √ npq. Für n ∈ N und p ∈ (0, 1) sei µ := np, σ := √ npq. Für die Binomialgewichte schreiben wir kurz Für n ∈ N und p ∈ (0, 1) sei µ := np, σ := √ npq. Für die Binomialgewichte schreiben wir kurz n k n−k p q . w(k) := k Es stellt sich heraus (eine Heuristik dafür folgt gleich): 9 Es stellt sich heraus (eine Heuristik dafür folgt gleich): Für großes σ Es stellt sich heraus (eine Heuristik dafür folgt gleich): Für großes σ und k nicht allzu weit vom Zentrum np ist Es stellt sich heraus (eine Heuristik dafür folgt gleich): Für großes σ und k nicht allzu weit vom Zentrum np ist 1 k − µ w(k) ≈ ϕ σ σ Es stellt sich heraus (eine Heuristik dafür folgt gleich): Für großes σ und k nicht allzu weit vom Zentrum np ist 1 k − µ w(k) ≈ ϕ σ σ Zur Erinnerung: Es stellt sich heraus (eine Heuristik dafür folgt gleich): Für großes σ und k nicht allzu weit vom Zentrum np ist 1 k − µ w(k) ≈ ϕ σ σ Zur Erinnerung: 1 x − µ ϕ dx σ σ Es stellt sich heraus (eine Heuristik dafür folgt gleich): Für großes σ und k nicht allzu weit vom Zentrum np ist 1 k − µ w(k) ≈ ϕ σ σ Zur Erinnerung: 1 x − µ ϕ dx σ σ ist die Dichte der Normalverteilung mit Erwartungswert µ und Varianz σ 2. 1 k − µ w(k) ≈ ϕ σ σ 10 1 k − µ w(k) ≈ ϕ σ σ k−µ Mit zk := wird dies zu: σ 1 k − µ w(k) ≈ ϕ σ σ k−µ Mit zk := wird dies zu: σ w(k) ≈ (zk − zk−1)ϕ(zk ). Daraus bekommt man für Binom(n, p)-verteiltes K √ mit großem σ = npq: 11 Daraus bekommt man für Binom(n, p)-verteiltes K √ mit großem σ = npq: K−µ ≤ b} P{a ≤ σ Daraus bekommt man für Binom(n, p)-verteiltes K √ mit großem σ = npq: K−µ ≤ b} P{a ≤ σ = X k:a≤zk ≤b w(k) Daraus bekommt man für Binom(n, p)-verteiltes K √ mit großem σ = npq: K−µ ≤ b} P{a ≤ σ X = w(k) k:a≤zk ≤b ≈ X (zk − zk−1)ϕ(zk ) k:a≤zk ≤b Daraus bekommt man für Binom(n, p)-verteiltes K √ mit großem σ = npq: K−µ ≤ b} P{a ≤ σ X = w(k) k:a≤zk ≤b ≈ X (zk − zk−1)ϕ(zk ) k:a≤zk ≤b ≈ Z b a ϕ(z) dz. Fazit: 12 Fazit: √ Für großes σ = npq ist die Standardisierung einer binomialverteilten Zufallsvariablen K, Fazit: √ Für großes σ = npq ist die Standardisierung einer binomialverteilten Zufallsvariablen K, K − np K −µ = √ , σ npq Fazit: √ Für großes σ = npq ist die Standardisierung einer binomialverteilten Zufallsvariablen K, K − np K −µ = √ , σ npq approximativ so verteilt wie eine standardnormalverteilte Zufallsvariable Z: Fazit: √ Für großes σ = npq ist die Standardisierung einer binomialverteilten Zufallsvariablen K, K − np K −µ = √ , σ npq approximativ so verteilt wie eine standardnormalverteilte Zufallsvariable Z: K−µ ∈ [a, b] ≈ P{Z ∈ [a, b]}. P σ Abraham de Moivre 1667-1754 13 Jetzt die versprochene Heuristik für 14 Jetzt die versprochene Heuristik für 1 k − µ n k n−k p q ≈ ϕ w(k) = : k σ σ Jetzt die versprochene Heuristik für 1 k − µ n k n−k p q ≈ ϕ w(k) = : k σ σ Idee: Betrachte die “sukzessiven Quotienten” Jetzt die versprochene Heuristik für 1 k − µ n k n−k p q ≈ ϕ w(k) = : k σ σ Idee: Betrachte die “sukzessiven Quotienten” n−k+1 p w(k) = , w(k − 1) k q Jetzt die versprochene Heuristik für 1 k − µ n k n−k p q ≈ ϕ w(k) = : k σ σ Idee: Betrachte die “sukzessiven Quotienten” n−k+1 p w(k) = , w(k − 1) k q aufmultipliziert beginnend vom “Zentrum” Jetzt die versprochene Heuristik für 1 k − µ n k n−k p q ≈ ϕ w(k) = : k σ σ Idee: Betrachte die “sukzessiven Quotienten” n−k+1 p w(k) = , w(k − 1) k q aufmultipliziert beginnend vom “Zentrum” ℓ := ⌊(n + 1)p⌋. Ein paar Zeilen Rechnung (vgl. Skript Wak S. 80) ergeben für j = 1, 2, , . . . mit j ≪ n: 15 Ein paar Zeilen Rechnung (vgl. Skript Wak S. 80) ergeben für j = 1, 2, , . . . mit j ≪ n: j w(ℓ + j) ≈ − 2. ln w(ℓ + j − 1) σ Ein paar Zeilen Rechnung (vgl. Skript Wak S. 80) ergeben für j = 1, 2, , . . . mit j ≪ n: j w(ℓ + j) ≈ − 2. ln w(ℓ + j − 1) σ Aufsummiert zwischen j = 1 und j = k − ℓ : Ein paar Zeilen Rechnung (vgl. Skript Wak S. 80) ergeben für j = 1, 2, , . . . mit j ≪ n: j w(ℓ + j) ≈ − 2. ln w(ℓ + j − 1) σ Aufsummiert zwischen j = 1 und j = k − ℓ : 1 (k − ℓ)2 1 k − µ 2 w(k) ln ≈− 2 ≈− w(ℓ) σ 2 2 σ Ein paar Zeilen Rechnung (vgl. Skript Wak S. 80) ergeben für j = 1, 2, , . . . mit j ≪ n: w(ℓ + j) j ln ≈ − 2. w(ℓ + j − 1) σ Aufsummiert zwischen j = 1 und j = k − ℓ : 1 (k − ℓ)2 1 k − µ 2 w(k) ≈− 2 ≈− ln w(ℓ) σ 2 2 σ √ 1 k − µ 1 k − µ 2 = w(ℓ)σ 2π ϕ w(k) ≈ w(ℓ) exp − 2 σ σ σ √ 1 k − µ w(k) ≈ w(ℓ) σ 2π ϕ σ σ 16 √ 1 k − µ w(k) ≈ w(ℓ) σ 2π ϕ σ σ Summation über k: √ 1 k − µ w(k) ≈ w(ℓ) σ 2π ϕ σ σ Summation über k: √ 1 ≈ w(ℓ)σ 2π √ 1 k − µ w(k) ≈ w(ℓ) σ 2π ϕ σ σ Summation über k: √ 1 ≈ w(ℓ)σ 2π 1 k − µ w(k) ≈ ϕ σ σ √ 1 k − µ w(k) ≈ w(ℓ) σ 2π ϕ σ σ Summation über k: √ 1 ≈ w(ℓ)σ 2π 1 k − µ w(k) ≈ ϕ σ σ So weit die Heuristik. Den folgenden “lokalen Grenzwertsatz” bekommt man mit der (erstmals von de Moivre entdeckten) Stirling-Formel 17 Den folgenden “lokalen Grenzwertsatz” bekommt man mit der (erstmals von de Moivre entdeckten) Stirling-Formel (vgl. Skript Wa S. 84-85, auf S. 82 ff findet sich dort auch ein Beweis der Stirling-Formel). Satz 18 Satz Sei p ∈ (0, 1) fest, und kn eine Folge natürlicher Zahlen mit Satz Sei p ∈ (0, 1) fest, und kn eine Folge natürlicher Zahlen mit 2 |kn − np| = 0). (d.h. n→∞ lim |kn − np| = o(n 3 ) 2 n3 Satz Sei p ∈ (0, 1) fest, und kn eine Folge natürlicher Zahlen mit 2 |kn − np| = 0). (d.h. n→∞ lim |kn − np| = o(n 3 ) 2 n3 Dann gilt für die Binomialgewichte b(n, p; kn) mit n → ∞ 2 −np) 1 1 − (kn2npq √ b(n, p; kn) ∼ √ . e npq 2π Satz Sei p ∈ (0, 1) fest, und kn eine Folge natürlicher Zahlen mit 2 |kn − np| 3 |kn − np| = o(n ) = 0). (d.h. n→∞ lim 2 n3 Dann gilt für die Binomialgewichte b(n, p; kn) mit n → ∞ 2 −np) 1 1 − (kn2npq √ . e b(n, p; kn) ∼ √ npq 2π bn ∼ an, dass die Folge der Quotienten bn/an gegen Eins konvergiert. Dabei bedeutet Aus dem lokalen Grenzwertsatz ergibt sich durch Summieren und Kontrollieren der Fehlerterme (vgl. Skript Wa S. 86) ein 19 Aus dem lokalen Grenzwertsatz ergibt sich durch Summieren und Kontrollieren der Fehlerterme (vgl. Skript Wa S. 86) ein 1) Globaler Grenzwertsatz, von de Moivre (1733, für p = 2 und Laplace (1810, für p allgemein)) Aus dem lokalen Grenzwertsatz ergibt sich durch Summieren und Kontrollieren der Fehlerterme (vgl. Skript Wa S. 86) ein 1) Globaler Grenzwertsatz, von de Moivre (1733, für p = 2 und Laplace (1810, für p allgemein)) Für n = 1, 2, . . . sei Kn eine binomial(n, p)-verteilte −np ihre Standardisierung. Zufallsvariable, und Kn∗ := K√nnpq Aus dem lokalen Grenzwertsatz ergibt sich durch Summieren und Kontrollieren der Fehlerterme (vgl. Skript Wa S. 86) ein 1) Globaler Grenzwertsatz, von de Moivre (1733, für p = 2 und Laplace (1810, für p allgemein)) Für n = 1, 2, . . . sei Kn eine binomial(n, p)-verteilte −np Zufallsvariable, und Kn∗ := K√nnpq ihre Standardisierung. Dann gilt für alle a < b ∈ R: ∗ lim P ({K n ∈ [a, b]}) = n→∞ Zb a ϕ(z)dz, 1 − z2 mit ϕ(z) = √ e 2 . 2π Man sagt dafür auch kurz: 20 Man sagt dafür auch kurz: Die Folge der Zufallsvariablen Kn∗ konvergiert in Verteilung gegen eine standard-normalverteilte Zufallsvariable Z.