Wahrscheinlichkeitstheorie Kapitel XIV

Werbung
Wahrscheinlichkeitstheorie
Kapitel XIV - Grenzwertsätze
Georg Bol
[email protected]
Markus Höchstötter
[email protected]
Grenzwertsätze
Aufgabe der Wahrscheinlichkeitstheorie:
Math. Modellierung von Zufallsvorgängen
Ziel: Berechenbarkeit von Zufallsvorgängen soweit möglich.
Ansatz:
Ereignisse und ihren beobachtbaren
Wahrscheinlichkeiten zuordnen.
Kapitel XIV - Grenzwertsätze
Ergebnissen
in
sinnvoller
Weise
1
Grenzwertsätze
Vorgaben:
Wahrscheinlichkeiten entsprechen nach vielen Wiederholungen rel. Häufigkeiten.
Folgerung daraus (nach vielen Wiederholungen)
a) relative Häufigkeit des Eintretens eines Ereignisses ≈ Wahrscheinlichkeit des
Ereignisses
b) arithm. Mittel ≈ Erwartungswert;
c) empirische Verteilungsfunktion ≈ theoretische Verteilungsfunktion
Kapitel XIV - Grenzwertsätze
2
Grenzwertsätze
Zufallsvorgang modelliert durch Wahrscheinlichkeitsraum (Ω, A(Ω), P )
Wahrscheinlichkeitsraum der n- fachen unabhängigen Wiederholung:
(Ωn, An(Ω), P (n)) mit Grundgesamtheit: Ωn = {(ω1, . . . , ωn)|ωi ∈ Ω}
Für P (n) gilt:
P (n)(A1 × . . . × An) = P (A1) · . . . · P (An)
wobei (A1, . . . , An) - Ereignisse in (Ωn, An(Ω), P (n))
Kapitel XIV - Grenzwertsätze
3
Grenzwertsätze
Wahrscheinlichkeitsraum der unendlichfachen unabhängigen Wiederholung:
Grundgesamtheit:
ΩN : Menge der Folgen (ω1, ω2, . . .) = (ωi); i = 1, 2, . . .
Gesucht: Wahrscheinlichkeitsmaß P IN auf ΩIN
Für das Wahrscheinlichkeitsmaß P IN gilt:
IN
P (A1 × A2 × . . .) =
Q∞
i=1 P (Ai )
(6= 0 nur, wenn P (Ai) = 1 für fast alle i)
Kapitel XIV - Grenzwertsätze
4
Phänomen a):
Relative Häufigkeit eines Ereignisses konvergiert gegen die Wahrscheinlichkeit des
Ereignisses
(Ω, A(Ω), P )
A ∈ A(Ω)
Wahrscheinlichkeitsraum (Modell eines Zufallsprozesses)
Ereignis
(A ⊂ Ω)
Zu A gehört die Zufallsvariable: 1A : Ω → R
1 ω∈A
1A(ω) =
(“Indikatorfunktion zu A”)
0 ω∈
/A
Kapitel XIV - Grenzwertsätze
5
Phänomen a):
1A Bernoulli - verteilt
P (1A = 1) = P ({ω|1A(ω) = 1}) = P (A)
n - fache unabhängige Wiederholung von 1A:
Y1, . . . , Yn unabhängig identisch verteilt wie 1A
(Yi = 1 Ereignis A tritt bei i - ter Wiederholung ein.)
Kapitel XIV - Grenzwertsätze
6
Phänomen a):
Relative Häufigkeit des Ereignisses A bei n unabhängigen Wiederholungen:
zufällig, da abhängig vom zufälligen Verlauf.
n
P
Yi
absolute Häufigkeit des Ereignisses A
i=1
n
P
1
Yi
n
i=1
relative Häufigkeit des Ereignisses A
n
1 X n→∞
Was bedeutet
Yi =⇒ P (A) ∈ R
n i=1
| {z }
ZV
Was bedeutet in diesem Zusammenhang Konvergenz ?
Wie kann Konvergenz hier mathematisch präzisiert werden ?
Kapitel XIV - Grenzwertsätze
7
Ansatz:
n
1X
Yi − P (A) ist Zufallsvariable.
n i=1
Idee: Für wachsendes n sollte die Zufallsvariable mit hoher Wahrscheinlichkeit
Werte in einem Bereich um 0 annehmen. Bereich um 0 : (−ε, ε) für ε > 0
Falls also gilt:
lim
P
lim
P (n)
n→∞
=
(n)
n→∞
n
X
!
1
Yi − P (A) < ε
−ε <
n i=1
!
n
1 X
Y
−
P
(A)
<ε =1
i
n
i=1
für alle ε > 0
“Stochastische Konvergenz”
Kapitel XIV - Grenzwertsätze
8
Phänomen a):
Hilfssatz:Tschebyscheffsche Ungleichung
Sei X : (Ω, A(Ω), P ) → R Zufallsvariable mit existierendem Erwartungswert
E(X) und Varianz V ar(X)
Für c > 0 gilt:
V ar(X)
P (|X − E(X)| ≥ c) ≤
c2
Kapitel XIV - Grenzwertsätze
9
Beweis:
Setze zu ω ∈ Ω
Z(ω) =
c>0:
Z(ω)
c2 |X(ω) − E(X)| ≥ c
0 sonst
≤ (X(ω) − E(X))2 für alle ω
⇒ E(Z) ≤ E((X − E(X))2) = V ar(X)
E(Z) = c2P (Z = c2) + 0 · P (Z = 0) = c2P (|X − E(X)| ≥ c) ≤ V ar(X)
⇒ P (|X − E(X)| ≥ c) ≤
Kapitel XIV - Grenzwertsätze
V ar(X)
c2
10
Anwendung der Tschebyscheffschen Ungleichung
Behauptung aus der deskriptiven Statistik:
x1, . . . , xn Urliste; x arithm. Mittel; s Standardabweichung
3
4
aller Werte liegen in [x − 2s, x + 2s]
8
9
aller Werte liegen in [x − 3s, x + 3s]
Ω Grundgesamtheit (Statistische Masse) vom Umfang n : Ω = {ω1, . . . , ωn}
b : Ω → R quantitatives Merkmal
b(ωi) = xi für i = 1, . . . , n;
xi Merkmalswert beim Merkmalsträger ωi
Kapitel XIV - Grenzwertsätze
11
Anwendung der Tschebyscheffschen Ungleichung
Laplacescher Wahrscheinlichkeitsraum über Ω :
(Ω, A(Ω), P ) mit:
#A #A
1
=
für A ⊂ Ω
P (ωi) = ; b(ωi) = xi; P (A) =
n
#Ω
n
E(b)
=
n
P
i=1
1
n xi
=x
2
V ar(b) = E((b − E(b)) ) =
Kapitel XIV - Grenzwertsätze
n
P
i=1
1
n (xi
− x)2 = s2
12
Anwendung der Tschebyscheffschen Ungleichung
Tschebyscheffsche Ungleichung
V ar(b)
s2
P (|b − E(b)| < c) ≥ 1 −
=1− 2
c2
c
Kapitel XIV - Grenzwertsätze
13
Anwendung der Tschebyscheffschen Ungleichung
P (|b − E(b)| < c) = P (|b − x| < c)
=
1
n #{ω||b(ω)
=
1
n #{ω|x
=
c = 2s :
c = 3s :
− x| < c}
− c < b(ω) < x + c}
Anteil der Werte im Bereich
Anteil der Werte im Bereich
Kapitel XIV - Grenzwertsätze
2
Anteil der Werte im Bereich (x − c, x + c) ≤ 1 − sc2
(x − 2s, x + 2s) ≥ 1 −
(x − 3s, x + 3s) ≥ 1 −
s2
4s2
s2
9s2
=
=
3
4
8
9
13
Anwendung der Tschebyscheffschen Ungleichung
Aufgabe 2.42* (Bamberg, G. “Statistik-Arbeitsbuch”)
Aufgrund der technischen Gegebenheiten und der einschlägigen Vorschriften
errechnet man für eine projektierte Ski-Seilbahn eine zulässige Zuladung von
12.900[kg] pro Gondel. Für die Umsetzung in eine zulässige Personenzahl gehe
man davon aus, dass für das Personengewicht X und das Gewicht Y der
Skiausrüstung gelte:
E(X) = 75, V ar(X) = 80, E(Y ) = 15, V ar(Y ) = 4,
“Bruttogewicht” G = X + Y
Die zulässige Personenzahl n muss die Eigenschaft haben, dass die
Wahrscheinlichkeit für eine Überschreitung der zulässigen Zuladung höchstens
1% beträgt.
Kapitel XIV - Grenzwertsätze
14
Anwendung der Tschebyscheffschen Ungleichung
a) Bestimmen Sie n unter den Prämissen, das X und Y unabhängig sind und das
Gesamtgewicht der Skifahrer als normalverteilt angenommen werden kann.
b) Bestimmen Sie n unter den Prämissen, das X und Y unabhängig sind, aufgrund
der Tschebyscheffschen Ungleichung.
c) Wie ändern sich obige Ergebnisse, wenn man die Erfahrungstatsache, dass
schwerere Personen i.a. auch eine schwerere Skiausrüstung benötigen, durch
die Prämisse berücksichtigt, dass der Korrelationskoeffizient zwischen X und
Y den Wert 0,9 besitzt ?
Kapitel XIV - Grenzwertsätze
15
Anwendung der Tschebyscheffschen Ungleichung
Zulässige Zuladung pro Gondel: 12900 kg.
Aufgabe: Umsetzung in zulässige Personenzahl
X Personengewicht
Y Gewicht von Skiausrüstung
X, Y Zufallsvariable mit
E(X) = 75
E(Y ) = 15
V ar(X) = 80
V ar(Y ) = 4
G=X +Y
“Bruttogewicht”
E(G) = E(X) + E(Y ) = 90
Kapitel XIV - Grenzwertsätze
16
Anwendung der Tschebyscheffschen Ungleichung
n Skifahrer
Gi Bruttogewicht von Skifahrer(in) i
G1, . . . , Gnunabhängig, identisch verteilt wie G
n
P
(n)
Gi Gesamtgewicht
G =
i=1
Gesucht: n maximal mit
P (G(n) > 12900) ≤ 0.01
Kapitel XIV - Grenzwertsätze
17
zu a)
X, Y unabhängig, normalverteilt, G = X + Y (normalverteilt)
⇒ V ar(G)
= V ar(X) + V ar(Y ) = 84
⇒ E(G(n))
= 90n
V ar(G(n) = 84n
G(n)
normalverteilt
P (G(n) > 12900) = 1 − P (G(n) ≤ 12900)
G(n)
−90n
√
≤ 12900−90n
= 1 − P ( √84n
Forderung:
84n
√
) ≤ 0.01
= 1 − φ( 12900−90n
84n
√
φ( 12900−90n
) ≥ 0.99
84n
Kapitel XIV - Grenzwertsätze
18
Anwendung der Tschebyscheffschen Ungleichung
Aus der Tabelle von φ liest man ab:
12900−90n
√
84n
= φ−1(0.99) = 2.326 ,
so dass man zur quadratischen Gleichung (für
√
√
n)
√
−90n − 2.326 84 n + 12900 = 0
√
kommt. Die (positive) Lösung n = 11.85 liefert n = 140.42 Unter den
Prämissen von a) ist deshalb n = 140 die Höchstzahl der Personen pro Gondel.
Kapitel XIV - Grenzwertsätze
19
zu b) Anwendung der Tschebyscheffschen Ungleichung
1. Aus der Gleichungs- bzw. Ungleichungskette
P (G(n) > 12900)
= P (G(n) − 90n > 12900 − 90n) )
≤ P (|G(n) − 90n| ≥ 12900 − 90n)
84n
≤ (12900−90n)
2
≤ 0, 01
ergibt sich durch Gleichsetzen der beiden letzten Ausdrücke wiederum eine
quadratische Gleichung.
Die relevante Lösung ist n = 131, 65 und damit die Antwort n = 131.
(Die rechnerisch zu ermittelnde zweite Lösung n = 156 ist irrelevant, da 90 n
hierbei größer als 12900 ausfällt).
Kapitel XIV - Grenzwertsätze
20
zu c) Anwendung der Tschebyscheffschen Ungleichung
c) Nun ist die Varianz von G größer, nämlich: X und Y positiv korreliert mit
̺(X, Y ) = 0.9
V ar(G) = V ar(X) + V ar(Y ) + 2Cov(X, Y )
̺(X, Y ) =
Cov(X, Y )
p
V ar(X)V ar(Y )
p
p
⇒ Cov(X, Y ) = ̺(X,
√ Y )√ V ar(X) V ar(Y )
= 0.9 80 4
√
√
V ar(G) = 80 + 4 + 2 · 0.9 · 80 · 4 = 116, 2
Kapitel XIV - Grenzwertsätze
21
Anwendung der Tschebyscheffschen Ungleichung
Der Lösungsvorgang aus a) und b) bleibt im Prinzip unverändert.
Die größere Varianz führt zu folgenden modifizierten (und wie zu erwarten war,
kleineren) Lösungen
n = 139 unter Verwendung der Normalverteilung
n = 129 unter Verwendung der Tschebyscheffschen - Ungleichung.
Kapitel XIV - Grenzwertsätze
22
Anmerkung zur Normalverteilungsannahme:
In der Realität: G ≥ 0, d.h. P (G < 0) = 0
Bei Normalverteilungsannahme: P (G < 0) > 0
Annahme: G normalverteilt nicht korrekt
aber: E(G) = 90 V ar(G) = 84
G − 90 −90
√
<√
84
84
−90
= ϕ(−9, 8) < 10−16
= ϕ √
84
P (G < 0) = P
Kapitel XIV - Grenzwertsätze
23
Anwendung auf Fragestellung a)
X=
1
n
n
P
Yi = relative Häufigkeit
i=1
(yi ∈ {0, 1})
Behauptung:
n
P
1
Yi konvergiert stochastisch gegen P (A), d.h. für jedes ε > 0 gilt:
n
i=1
lim P
n→∞
⇔ lim P
n→∞
Kapitel XIV - Grenzwertsätze
!
n
1 X
Yi − P (A) ≥ ε = 0
n
i=1
!
n
1 X
Yi − P (A) < ε = 1
n
i=1
24
Anwendung auf Fragestellung a)
E(X) = E
=
1
n
1
n
n
P
n
P
i=1
Yi
E(Yi) = E(1A)
i=1
= 1P (1A = 1) + 0 · P (1A = 0)
= P (A)
Kapitel XIV - Grenzwertsätze
24
Anwendung auf Fragestellung a)
P (n)
!
n
1 X
Yi − P (A) ≥ ε
≥
n
i=1
=
⇒ relative Häufigkeit
1
n
n
P
V
ar( n1
n
P
i=1
ε2
1
n2
n
P
1
n2
Yi)
=
V ar(1A)
i=1
ε2
=
n
P
V ar(Yi)
i=1
1
nV
ε2
(Yi unnabhängig)
ar(1A) n→∞
=⇒ 0
2
ε
Yi konvergiert stochastisch gegen P (A)
i=1
“Bernoullis Gesetz der großen Zahlen”
Kapitel XIV - Grenzwertsätze
25
Anwendung auf Fragestellung a)
Bemerkung: Xk , X0 sind Funktionen:
e →R
X k , X0 : Ω
(punktweise) Konvergenz von Funktionen: lim Xk = X0 heißt:
k→∞
e gilt:
Für jedes ω
e∈Ω
lim Xk (e
ω ) = X0(e
ω)
k→∞
“punktweise Konvergenz”
Kapitel XIV - Grenzwertsätze
26
Definition: Stochastische Konvergenz
Xk , k = 1, 2, 3, . . . ,
Man sagt:
und X0 Zufallsvariable auf einem Wahrscheinlichkeitsraum
Die Folge (Xk ) konvergiert stochastisch gegen X0 wenn (für alle ε > 0)
lim P (|Xn − X0| ≥ ε) = 0
x→∞
gilt.
(Schreibweise: X0 = p lim Xk ) Man kann zeigen :
k→∞
Aus punktweiser Konvergenz folgt stochastische Konvergenz und Umkehrung gilt
nicht.
Kapitel XIV - Grenzwertsätze
27
Phänomen b):
Arithmetisches Mittel der Beobachtungen ≈ Erwartungswert
Sei X Zufallsvariable
Y1, Y2, . . . Folge von unabhängigen Wiederholungen zu X
mit:
n
P
(n)
1
Y
=n
Yi arithmetisches Mittel nach n Wiederholungen
i=1
n n
P
P
(n)
1
1
=n
Yi
E(Yi)
= E(X)
=E n
E(Y )
i=1
i=1 n n
P
P
(n)
1
1
V ar(Yi) = V ar(X)
V ar(Y ) = V ar n
= n2
Yi
n
i=1
Kapitel XIV - Grenzwertsätze
i=1
28
Phänomen b):
Tschebyscheffsche Ungleichung:
P |Y
Y
(n)
(n)
V ar Y
− E(X)| ≥ ε ≤
ε2
(n)
=
V ar(X) n→∞
→
nε2
0
konvergiert stochastisch gegen E(X)
“Schwaches Gesetz der großen Zahlen”
Schreibweise: E(X) = p lim Y
(n)
n→∞
Kapitel XIV - Grenzwertsätze
29
Aber: Stochastische Konvergenz bedeutet nicht punktweise Konvergenz
Beispiel: Wiederholtes Werfen eines Würfels
Elementarereignis: Bei unendlichfacher Wiederholung ist die Folge
∼
ω = (ω1, ω2, . . .) mit ωi ∈ {1, 2, 3, 4, 5, 6} für i = 1, 2, 3, . . .
Bernoullis “Gesetz der Großen Zahlen” bewirkt
relative Häufigkeit der Augenzahlen 1,2,3,4,5,6 nach n Versuchen
stochastisch
(P (n)(1), . . . , P (n)(6)) =⇒ ( 16 , . . . , 16 )
Aber: z.B. relative Häufigkeit von 1,2,3,4,5,6 nach n Variablen bei der speziellen
Folge (4, 4, 4, . . .) :
(P (n)(1), . . . , P (n)(6)) = (0, 0, 0, 1, 0, 0) 6= (p1, . . . , p6)
⇒ keine punktweise Konvergenz der relativen Häufigkeiten
Kapitel XIV - Grenzwertsätze
30
Bemerkung zur Konvergenz von Zufallsvariablen:
Abschwächung der punktweisen Konvergenz:
X1, X2, . . . Folge von
Zufallsvariablen auf (Ω, A(Ω), P )
X0
Zufallsvariablen auf (Ω, A(Ω), P )
n
o
Sei ω ∈ Ω lim Xn(ω) = X0(ω) ) Teilmenge in Ω eine Wahrscheinlichkeit
n→∞
derart zugeordnet:
P {ω ∈ Ω| lim Xn(ω) = X0(ω)}
n→∞
Im wahrscheinlichkeitstheoretischen Sinn ist es ausreichend, dass diese
Wahrscheinlichkeit 1 ist, da wir dann davon ausgehen, dass dieses Ereignis
sicher ist. Also nicht notwendig für alle ω ∈ Ω
Kapitel XIV - Grenzwertsätze
31
Also: (Xn) konvergiert “fast sicher” (punktweise) gegen X0, falls
P {ω ∈ Ω| lim Xn(ω) = X0(ω)} = 1
n→∞
ist.
Kapitel XIV - Grenzwertsätze
32
Konvergenz
punktweise ⇒ fast sichere ⇒ stochastische
punktweise : fast sichere : stochastische
Kapitel XIV - Grenzwertsätze
33
Phänomen c):
Erwartung: Nach vielen Versuchen
⇒ empirische Verteilungsfunktion ≈ theoretische Verteilungsfunktion
Seien X1, . . . , Xn Ergebnisse der ersten n Versuche (Realisationen von X)
Empirische Verteilungsfunktion:
F emp,n(α) = n1 #{i = 1, . . . , n : xi ≤ α}
Versuchsergebnisse zufallsbehaftet ⇒ emp. Verteilungsfunktion zufallsbehaftet
(X1, . . . Xn kann auch durch Elementarereignisse ω1, . . . , ωn beschrieben werden
mit X1 = X(ω1), . . . , Xn = X(ωn))
Kapitel XIV - Grenzwertsätze
34
Sei A das Ereignis “X ≤ t”, dann gilt
P (A) = P (X ≤ t) = FX (t).
emp,n
FX
(t) - relative Häufigkeit des Eintretens von A bei n Versuchen.
Also nach Bernoullis Gesetz der großen Zahlen :
emp,n
FX
(t) ≈ P (A) = FX (t)
Kapitel XIV - Grenzwertsätze
35
Genauer :
mit Yi((ωj )j=1,2,3...) = 1A(ωi),
1 A tritt beim i − ten Versuch ein
also Yi((ωj )j=1,2,3...) =
0 A tritt nicht ein
gilt nach Bernoullis Gesetz der großen Zahlen:
lim P (n)
n→∞
Kapitel XIV - Grenzwertsätze
!
n
1 X
Yi − P (A) < ε = 1
n
i=1
36
Dabei ist
lim P (n)
n→∞
!
n
1 X
Yi − P (A) < ε)
n
i=1
emp,n
= P IN (|FX
(t) − FX (t)| < ε)
mit P IN Wahrscheinlichkeitsmaß auf der Menge ΩIN der Folgen (ωi)i=1,2,....
Kapitel XIV - Grenzwertsätze
37
Eine Verschärfung ist der
Hauptsatz der Statistik
emp,n
(α) − F (α)| < ε
lim P (n) sup |FX
n→∞
Kapitel XIV - Grenzwertsätze
α
=1
38
Eine Anwendung des Hauptsatzes der Statistik:
Anpassungstests nach Kolmogoroff-Smirnow
Hypothese: Es liegt eine bestimmte Wahrscheinlichkeitsverteilung mit einer
Verteilungsfunktion F vor
Test: Abweichung von empirischer Verteilungsfunktion bei n Versuchen größer
als eine Testschranke
⇒ Ablehnung der Hypothese
Kapitel XIV - Grenzwertsätze
39
weiteres Phänomen
m Versuchsreihen mit jeweils n Versuchen
n Messwerte bei jeder Versuchsreihe
Auswertung jeder Versuchsreihe durch
arithmetisches Mittel
Beobachtet wird: Histogramm der arithmetischen Mittel bei vielen Versuchsreihen
(und großem n)
≈ Dichtefunktion einer Normalverteilung
Kapitel XIV - Grenzwertsätze
40
Beispiel
Sei m = n = 1000, X ∈ Rm×n aus der Stichprobe.
Berechnung der m arithmetischen Mittel Xi, i = 1, . . . , m.
Gruppierung der Xi in ca. 70 Klassen (werteabhängig).
Berechnung des Gesamtmittels:
m
1 X
Xi
X=
m i=1
und der mittleren quadratischen Abweichung
m
1 X
V =
(xi − x)2.
m i=1
Kapitel XIV - Grenzwertsätze
41
Histogramm der Stichprobenmittel Xi im Vergleich zur Dichte von N (X, V )
Kapitel XIV - Grenzwertsätze
42
Betrachtung einer Versuchsreihe
Ausgangspunkt: Xi ZV des i-ten Versuchs, i = 1, . . . , n.
Angenommen Xi normalverteilt mit µi und σi also
X1, . . . , Xn unabhängig N (µi, σi2)- verteilt
n
P
Xi
2
ist N (µ, σ )- verteilt mit µ =
n
P
i=1
i=1
n
n
P
P
Xi −
µi
i=1s
i=1
N (0, 1)-verteilt.
⇒
n
P
σ2
i=1
2
µi , σ =
n
P
i=1
σi2
i
Kapitel XIV - Grenzwertsätze
43
Die Verteilungsfunktion von
n
P
n
P
Xi −
µi
Zn = i=1 s i=1
n
P
σi2
i=1
konvergiert gegen die Verteilungsfunktion der Standardnormalverteilung.
lim FZn (t) = Φ(t) =
n→∞
Zt
−∞
Kapitel XIV - Grenzwertsätze
1 − x2
√ e 2 dx
2π
44
Dies gilt beim Grenzübergang n → ∞ auch allgemeiner:
Seien X1, . . . , Xn,. . .
unabhängig
mit existierenden Erwartungswerten µi
und Varianzen σi2
(ohne die Voraussetzung der Normalverteilung)
und erfüllen Lindeberg-Bedingung (siehe nächste Seite).
Dann gilt der zentrale Grenzwertsatz (Satz 14.9)
Kapitel XIV - Grenzwertsätze
45
Anmerkung: Lindeberg-Bedinung (speziell: n = rn)
Seien µi = E(Xi) und σi2 = V ar(Xi) < ∞, i = 1, . . . , n, Sn := x1 + . . . + xn
2
und sei σ(n)
= σ12 + . . . + σn2 dann gilt, falls
lim
n→∞
n
1 X
2
σ(n)
k=1
E((Xk − µk )2) · 1{|Xk −µk |>ǫσ(n)} = 0
für ǫ > 0 beliebig,
Sn−E[Sn]
√
Kapitel XIV - Grenzwertsätze
V (Sn)
d
−→ N (0, 1)
46
Spezialfall des Satz 14.9: Zentralen Grenzwertsatzes
Lindeberg-Bedingung ist erfüllt, wenn X1, . . . , Xn,. . . unabhängig
identischverteilt mit Erwartungswert µ0 und Varianz σ 2.
Dann ist zu gegebenem n mit µ = nµ0 , σ 2 = nσ02,
n
P
Xi − nµ0
Zn = i=1 √
=
nσ0
und
1
n
n
P
i=1
Xi − µ0
σ0
√
n
lim FZn (t) = Φ(t)
n→∞
d.h. das arithmetische Mittel ist näherungsweise normalverteilt mit µ0 und
Kapitel XIV - Grenzwertsätze
σ2
n.
47
Anwendungen:
n
P
Y =
Xi, X1, . . . , Xn
unabhängig
i=1
⇒ Y näherungsweise normalverteilt.
Begründung dafür, bei Anwendungen in der Praxis bei Beobachtungen einer
Zufallsvariable von einer normalverteilten Zufallsvariablen auszugehen:
Messwert wird beeinflusst von vielen unabhängigen Faktoren,
z.B. Messfehler,
Luftfeuchtigkeit,
Temperatur,
Erschütterungen,
Spannungsschwankungen, . . .
⇒ Abweichungen von einem mittleren Wert ist Summe vieler zufälliger
Größen
⇒ Abweichung unterliegt zumindest näherungsweise einer Normalverteilung
Kapitel XIV - Grenzwertsätze
48
Anwendungen:
1. Näherung der Binomialverteilung durch die Normalverteilung
Binomialverteilung B(n, p) mit
Erwartungswert : np
Varianz
np(1 − p)
Sei Y B(n, p)-verteilt, dann Y = X1 + . . . + Xn
mit: Xi unabhängig und Bernoulliverteilt mit Parameter p.
Zentraler Grenzwertsatz:
n groß ⇒ Y näherungsweise, N (np, np(1 − p))- verteilt.
Kapitel XIV - Grenzwertsätze
49
Gesucht:
P (Y ≤ y)
P (Y ≤ y) = P
Damit
Y − np
y − np
p
≤p
np(1 − p)
np(1 − p)
!
≈Φ
P
Y − np
Xi − np
p
=p
np · (1 − p)
np · (1 − p)
ist näherungsweise standardnormalverteilt, d.h.
P
Kapitel XIV - Grenzwertsätze
p
Y − np
np · (1 − p)
!
≤x
p
y − np
np(1 − p)
!
≈ Φ(x)
50
bzw. mit x = √ y−np
np·(1−p)
Y − np
y − np
p
≤p
⇐⇒ Y ≤ y
np(1 − p)
np(1 − p)
P (Y ≤ y) ≈ Φ
Kapitel XIV - Grenzwertsätze
p
y − np
np · (1 − p)
!
für alle y ∈ R
⊛
51
Y diskret mit Werten 0, 1, 2, 3, . . . , n
⇒ y = k mit k = 0, 1, 2, . . . , n
linke Seite von ⊛ ändert sich nur bei ganzzahligem y (= k)
Bessere Annäherung:
k
X
m=0
1
2
P (Y = m) = P (Y ≤ k) ≈ Φ
ist Stetigkeitskorrektur.
Kapitel XIV - Grenzwertsätze
1
2
k + − np
p
np · (1 − p)
!
52
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
5
10
15
20
25
30
35
P P (Y = m) kumulierte Binomialverteilung für n=30
P (Y ≤ k) =
k
m=0
Kapitel XIV - Grenzwertsätze
53
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
10
20
30
40
50
60
70
80
90
100
P P (Y = m) kumulierte Binomialverteilung für n=100
P (Y ≤ k) =
k
m=0
Kapitel XIV - Grenzwertsätze
53
Anwendungen:
2. Erzeugung von Zufallszahlen zur Normalverteilung.
Tabellen von Zufallszahlen und computererzeugte Zufallszahlen sind Zufallszahlen
zur Gleichverteilung auf [0, 1]
Erwartungswert
1
2
Varianz
1
12
Kapitel XIV - Grenzwertsätze
54
Xi
12
P
unabhängig, identisch gleichverteilt auf [0, 1]
Xi
(−6)
hat Erwartungswert 6
(0)
i=1
und Varianz 1
und ist näherungsweise normalverteilt.
Je 12 Zufallszahlen zur Gleichverteilung auf [0,1] werden addiert und von der
Summe die Zahl 6 abgezogen.
Kapitel XIV - Grenzwertsätze
55
Daraus: Zufallszahlen zur Normalverteilung mit Mittelwert µ und Varianz σ 2:
z
dann
Zufallszahl zu N (0, 1)
µ + σz
Kapitel XIV - Grenzwertsätze
Zufallszahl zu N (µ, σ 2) .
56
Herunterladen