23 Der Zentrale Grenzwertsatz von Lindeberg

Werbung
23 Der Zentrale Grenzwertsatz von Lindeberg-Feller
Der Zentrale Grenzwertsatz im i.i.d. Fall geht auf Lindeberg und Lévy zurück und besagt, dass Summenvariablen als näherungsweise normalverteilt angesehen werden können.
Die zentrale“ Bedeutung dieses Satzes liegt darin, dass dann unter entsprechenden Vor”
aussetzungen die Summanden Xk , k = 1, 2, . . . , direkt als normalverteilt angenommen
werden und damit statistische Untersuchungen sich erheblich vereinfachen (vgl. etwa die
Normalverteilungsannahmen in linearen Modellen“ ), denn
”
n
n
P
P
(Xk − a)
(Yk − a)
D
k=1
k=1
√
√
Zn :=
,
≈ Z =
nσ 2
nσ 2
wobei {Xk } i.i.d. , EX1 = a , 0 < V ar(X1 ) = σ 2 < ∞ , PZ = N (0, 1) , {Yk } i.i.d. ,
PY1 = N (0, 1) .
In Anwendungen lässt sich zwar häufig die Annahme der Unabhängigkeit , aber nicht die
einer identischen Verteilung rechtfertigen, so dass allgemeinere Versionen des Zentralen
Grenzwertsatzes wünschenswert sind. Wir betrachten im Folgenden ein (so genanntes)
Dreieckschema von zeilenweise unabhängigen, quadratintegrierbaren ZV. auf einem
W-Raum (Ω, A, P ) , etwa
Xn1 , Xn2 , . . . , Xnrn
(rn ∈ N)
mit
2
EXnk =: ank , 0 ≤ V ar(Xnk ) =: σnk
< ∞.
Wir setzen
Sn :=
rn
X
k=1
s2n
(Xnk − ank ) ,
:= V ar(Sn ) =
rn
X
2
σnk
!
(> 0).
k=1
Hinreichend für die Gültigkeit eines allgemeinen Zentralen Grenzwertsatzes ist die (so
genannte) Lindeberg-Bedingung“
”
Z
rn
1 X
(Xnk − ank )2 dP = 0 ∀ ε > 0 .
(Li)
lim Ln (ε) := lim 2
n→∞
n→∞ s
n k=1
{ | Xnk −ank | ≥ εsn }
105
Satz 23.1. Unter der Voraussetzung (Li) gilt für das obige Dreieckschema :
(ZGW S)
1
D
Sn −→ Z
sn
(n → ∞) ,
wobei
PZ = N (0, 1) .
Bemerkung 23.1.
a) Satz 23.1 verallgemeinert den Satz von Lindeberg-Lévy (Beispiel 22.3 c) . Wählt
man nämlich Xnk = Xk , k = 1, . . . , rn := n , {Xk } i.i.d. Folge, so ist die LindebergBedingung (Li) erfüllt, denn s2n = nσ 2 und
Ln (ε) =
1
nσ 2
Z
n
(X1 − a)2 dP −→ 0
√
{ | X1 −a | ≥ ε nσ 2 }
(n → ∞)
∀ ε > 0,
da E(X1 − a)2 = σ 2 < ∞ .
b) Bei Anwendungen kann oft die folgende, stärkere Lyapunov-Bedingung verifiziert
werden :
(Ly)
lim
n→∞
1
s2+δ
n
rn
X
k=1
E | Xnk − ank | 2+δ = 0
(∃ δ > 0) .
Die Bedingung (Ly) impliziert (Li) , denn für ε > 0 gilt :
rn
1 X
s2n k=1
rn
1 X
≤ 2
sn k=1
Z
| Xnk − ank | 2 dP
{ | Xnk −ank | ≥ εsn }
Z
| Xnk − ank | 2+δ
1
dP
(εsn )δ
{ | Xnk −ank | ≥ εsn }
rn
X
1
E | Xnk − ank | 2+δ .
≤ δ 2+δ
ε sn
k=1
c) Unter zusätzlichen Voraussetzungen lässt sich auch die Konvergenzgeschwindigkeit
im Zentralen Grenzwertsatz abschätzen :
Sei z.B. {Xk } eine i.i.d. Folge reeller ZV. mit EX1 = a , V ar(X1 ) = σ 2 > 0
und E | X1 | 3 < ∞ . Bezeichnet Fn die VF. der standardisierten Summe , d.h.
106
√
P
Zn = ( nk=1 Xk − na) / nσ 2 , und Φ die VF. der N (0, 1)-Verteilung , so gilt
die folgende (gleichmäßige) Berry-Esseen-Ungleichung :
X − a 3
c
1
sup | Fn (z) − Φ(z) | ≤ √ E ,
σ
n
z∈R1
1
wobei √
≤ c < 0, 8 .
2π
Bemerkung 23.2. Der Beweis von Satz 23.1 zeigt, dass aus (Li) die (so genannte)
Feller-Bedingung“ folgt :
”
σ2 nk
(F )
max
−→ 0
(n → ∞) .
k=1,...,rn
s2n
Die Feller-Bedingung wiederum impliziert die asymptotische Vernachlässigbarkeit“ der
”
Summanden Xnk , d.h.
|X − a |
nk
nk
≥ ε −→ 0
(n → ∞)
∀ε>0
(AV )
max P
k=1,...,rn
sn
[ über die Tschebychev-Ungleichung ] .
Der folgende Satz stellt die Beziehungen her zwischen der Gültigkeit des Zentralen Grenzwertsatzes (Satz 23.1) und den obigen Bedingungen :
Satz 23.2. Für das obige Dreieckschema gelten folgende Äquivalenzen :
(Li)
⇐⇒
(ZGW S) ∧ (F )
⇐⇒
(ZGW S) ∧ (AV ) .
Beispiel 23.1. Sei {Xk }k=1,2,... eine unabhängige Folge (P -) f.s. gleichmäßig beschränkter ZV., etwa | Xk | ≤ c P -f.s. ∀ k . Falls s2n = V ar(Sn ) = V ar(X1 + · · · + Xn ) → ∞
(n → ∞) , so folgt :
Pn
Sn
D
k=1 (Xk − EXk )
−→ Z (n → ∞) , wobei PZ = N (0, 1) .
=
sn
sn
107
Der Zentrale Grenzwertsatz liefert die asymptotische Normalität von standardisierten
Summenvariablen.
Eine allgemeine Möglichkeit, hieraus auf asymptotische Normalität von transformierten
(Summen-) Variablen zu schließen , bietet die (so genannte)
δ - Methode
D
Satz 23.3. Sei {Zn } n=1,2,... eine Folge reeller ZV. mit Zn ≈ N (a, σn2 ) und
0 < σn2 → 0 (n → ∞) , d.h.
Zn − a D
−→ Z
σn
(n → ∞) ,
PZ = N (0, 1) .
wobei
Falls f : (R1 , B1 ) → (R1 , B1 ) [ also messbar ] an der Stelle a differenzierbar ist mit
f ′ (a) 6= 0 , so folgt :
D
f (Zn ) ≈ N (f (a), f ′ 2 (a) σn2 ) ,
f (Zn ) − f (a) D
−→ Z
f ′ (a) σn
d.h.
(n → ∞) ,
wobei
PZ = N (0, 1) .
Beispiel 23.2. Sei {Xk }k=1,2,... eine i.i.d. Folge von Exp(λ)-verteilten Z.V. (λ > 0) .
Gesucht sei ein geeigneter Schätzwert“ für den Parameter λ auf der Basis einer
”
Stichprobe“ X1 , . . . , Xn . Da EX1 = λ1 , gilt nach dem starken Gesetz der großen
”
Zahlen :
Xn
1
Xn
n
1 X
:=
Xk
n k=1
P −f.s.
−→
λ
P −f.s.
−→
1
λ
(n → ∞) ,
folglich
(n → ∞) .
Wie gut ist diese Schätzung ? Nach dem Zentralen Grenzwertsatz gilt (unter Beachtung
von V ar(X1 ) = λ12 ) :
Pn
1
√ 1 D
k=1 Xk − n λ
q
−→ Z (n → ∞) , d.h.
= n λ Xn −
λ
1
n λ2
D
Xn ≈ N
1 λ n λ2
1
,
(n → ∞) .
108
Mit der δ - Methode
1
Xn
f (x) =
D
λ2
≈ N λ,
n
1
x
, f ′ (x) = − x12
ergibt sich :
(n → ∞) .
Das Gesetz vom iterierten Logarithmus lieferte für eine i.i.d. Folge {Xk }k=1,2,... mit
EX1 = a , 0 < V ar(X1 ) = σ 2 < ∞ , eine Konvergenzgeschwindigkeitsaussage zum
starken Gesetz der großen Zahlen , nämlich
r log log n | Xn − a | = O
P -f.s. (n → ∞) .
n
Der Zentrale Grenzwertsatz liefert entsprechend eine Konvergenzgeschwindigkeitsaussage
zum schwachen Gesetz der großen Zahlen , nämlich
1 | X n − a | = OP √
n
(n → ∞) .
Hierbei definiert man wie folgt :
Definition 23.1. ( Symbole oP , OP ) Für zwei Folgen {Xn } , {Yn } reeller ZV.
auf (Ω, A, P ) setzt man :
a)
Xn = oP (Yn )
(n → ∞)
: ⇐⇒
b)
Xn = OP (Yn )
(n → ∞)
: ⇐⇒
Xn
Yn
P
−→ 0
(n → ∞) ;
∀ ε > 0 ∃ c = c(ε) , n0 = n0 (ε) ∈ N :
X n
P ≥ c ≤ ε ∀ n ≥ n0 .
Yn
Beispiel 23.2 (Fortsetzung) {Xk } i.i.d. Folge mit PX1 = Exp(λ) (λ > 0)
1 1
Xn −
= oP (1) (n → ∞) bzw.
= OP √
λ
n
1 1
− λ = OP √
= oP (1) (n → ∞) .
n
Xn
109
=⇒
Herunterladen