2D-Normalverteilte ZG (Ergänzg.) Funktionen/Summen von ZG

Werbung
2D-Normalverteilte ZG (Ergänzg.)
Skalierung auf Standard-NV (2D):
X0 =
X −mX
Y −mY
, Y 0=
, ⇒ (X 0, Y 0) ∼ N V mit
σX
σY
0
= σy0 = 1. ρ(X 0, Y 0) = ρ
m0X = m0Y = 0, σX
fX 0 Y 0 (x, y) =
1
q
2π 1 − ρ2
·e
2
2
− x −2ρxy+y
2
2(1−ρ )
Satz: Bei normalverteilten ZG gilt:
Unabhängigkeit ⇔ Unkorreliertheit ⇔ ρ = 0
Funktionen/Summen von ZG
Gegeben: Zufallsvektor (X, Y ) ⇒ neue ZG
Z = g(X, Y ) ⇒ Frage(n): Verteilung von Z?
(i.a. schwierig zu beantworten); statistische
Parameter ( einfacher“), z.B.:
”Z
Z
E(Z) =
∞
∞
−∞ −∞
g(ξ, η)f (ξ, η) dξdη.
speziell Summen von ZG(allgemeingültig!):
E(a1 X + a2 Y ) = a1 E(X) + a2 E(Y ),
aber:
i.a. D 2(X +Y ) = D 2X +D 2 Y +2ρ(X, Y )σX σY
Für unabhängige ZG gilt jedoch:
2
2 2
E(XY ) = EXEY, D 2(a1 X+a2Y ) = a2
D
X+a
1
2D Y
Summen identisch verteilter unabhängiger ZG (wichtig für Statistik)
X1 , .., Xn identisch verteilte ZG, unabhängig
mit EXi = µ, D 2Xi = σ 2 < ∞ Zn =
Pn
i=1 Xi
E(Zn) = nEX = nµ, D 2Zn = nD 2X = nσ 2 ⇒
2
2
nσ
σ
Zn
⇒ E X̄n = µ, D 2X̄n = 2 =
X̄n =
n
n
n
Zn - Summe; X̄n - statistischer Mittelwert,
Achtung: i.a. andere Verteilung als Xi(!)
Beisp.: X(e) ∈ {0,1}, (X −1(1) = A, P (A) = p)
⇒ P (X = 0) = 1−p, P (X = 1) = p, n unabhängiP
ge Versuche ⇒ Zn = n
i=1 Xi - binomialverteilt, Parameter n, p.
Sonderfall: Xi (identisch, unabh.) normalverteilt ⇒ Summe (Mittelwert) wieder normalverteilt
σ2
2
Xi ∼ N (µ, σ ) ⇒ X̄n ∼ N (µ, )
n
Der Mittelwert von X̄n bleibt gleich, aber
σn = √σn → 0 für n → ∞. Der statistische
Mittelwert ist immer stärker um (gleichbleibenden) Erwartungswert konzentriert“ ⇒
”
Frage: gesetzmäßig? ⇒ Grenzwertsätze; Ge”
setze der großen Zahlen“
Schwaches Gesetz d. großen Zahlen
Satz: Sei X1, X2, . . . , Xn , .. eine Folge identisch verteilter unabhängiger ZG vom Typ
”
X“ (i.i.d. - englisch: identically independently distributed) mit EXi = µ, D 2Xi = σ 2,
i = 1, .., n, ... Dann gilt für alle ε > 0
lim P (|X̄n − µ| ≤ ε) = 1, (X̄n
n→∞
stoch.
−→ µ)
d.h., das statistische Mittel konvergiert im
Sinn der Wkt. (stochastisch) gegen den (einheitlichen) Erwartungswert µ aller Zufallsgrößen
der Folge.
Anwendung: Konvergenz der relativen Häufigkeit Hn(A) gegen P (A) = p für A ∈ Z
−1
−1
(0) = Ā,
(1) = A, XA
⇒ XA(e) ∈ {0, 1}, XA
⇒ P (X = 1) = p, P (X = 0) = 1−p, betrachten
n unabhängige Realisierungen Xi dieser ZG
P
Xi
⇒ EXi = p, D Xi = p(1−p), ∀i = 1(1)n, X̄n =
n
2
Anz.: A tritt ein
⇒ X̄n = Hn(A) =
(Hn (A) ist ZG!)
n (Anz. Vers.)
Schwaches Gesetz der großen Zahlen ⇒
stoch.
lim P (|Hn (A)−p| ≤ ε) = 1, d.h., Hn(A) −→ P (A)
n→∞
Frage: Wieviel Versuche sind nötig, um die
Übereinstimmung von Hn(A) mit P (A) bis
auf 2 Stellen genau mit einer Wkt. von mindestens 0.95 zu garantieren?
Antwort 1 (mit Tschebychev-Ungl.) Aussage:
D 2Hn(A) !
≥ 0.95
lim P (|Hn (A)−p| ≤ ε) ≥ 1 −
2
n→∞
ε
p(1−p)
Wegen D 2Hn(A) =
und p(1−p) ≤ 1
:
4
n
n so bestimmen, daß gilt (ε = 0.005 wg. Rundg.)
!
1
1
1−
≤ 0.05
≥ 0.95, ⇒
4nε2
4nε2
1
= 200000
⇒n ≥
2
4 · 0.05 · (0.005)
Anwendung zentraler GV-Satz (auch:
Starkes Gesetz der großen Zahlen“)
”
Wichtige Konsequenzen für Praxis“: (i) für
”
große n kann das statistische Mittel X̄n generell in guter Näherung als normalverteilt
angesehen werden - unabhängig von der (evtl.
unbekannten) Verteilung von X
(ii) bei Größen, die durch Überlagerung zahlreicher unabhängiger Einflüsse entstehen (Meßfehler!) motiviert der zentr. GV-Satz die Annahme einer Normalverteilungshypothese
Betrachten nochmals die Xi , bekannt: SumP
me ist binomialverteilt Zn = Xi ∼ B(n, p)
(EZn = np, D 2Zn = np(1 − p)) Zentr.GV-S.:
√ X̄n − p
≈ N (0, 1) - verteilt
Ȳn = n q
p(1 − p)
(für n hinreichend groß“). Rücktrafo“:
”
”
Zn − np
Ȳn = q
⇒ Zn ≈ N (np, np(1 − p))
np(1 − p)
Grenzverteilungssatz von Moivre/Laplace:
Für große n kann die Binomialverteilung durch
die Normalverteilung angenähert werden.
Faustregel: np(1 − p) ≥ 9 - gute Näherung
( noch brauchbar“ für: np(1 − p) ≥ 4)
”
Antwort 2: Abschätzung von n für Approx.
von P (A) durch Hn(A) auf 2 Stellen mit zentralem GV-Satz (Wkt. 0.95):
P (|Hn (A)−p| ≤ ε) = P (|X̄n−p| ≤ ε) = P (|Zn−np| ≤ nε)
Z −np nε
n
q
q
|Zn−np| ≤ nε ⇔ |Ȳn| = ≤
np(1−p)
np(1−p) Wegen Ȳn ≈ N (0, 1) gilt

 −nε
P (|Hn (A)−p| ≤ ε) = P q
np(1−p)

 ε
≈ Φq
√
≤ Ȳn ≤ q
√
−ε
n 

q



nε


np(1−p)
√
ε
n 

q



n 
−Φ
 = 2Φ0

p(1−p)
p(1−p)
p(1−p)
Damit ergibt sich (ε = 0.005 einsetzen)
!


n  !
 ≥ 0.475
p(1−p)
 ε
P (|Hn (A)−p| ≤ ε) ≥ 0.95 ⇔ Φ0q
≈
√
√
ε n
1.962
⇒q
≥ 1.96 ⇒ n ≥
= 38416
2
4 · (0.005)
p(1−p)
!
Weitere Anwendung für Moivre/Laplace: Es
sei Zn ∼ B(n, p) mit np(1 − p) > 9. Frage:
b X
n k
P (a ≤ Zn ≤ b) =
p (1−p)n−k =?(a, b ∈ N)
k
k=a
Wegen Zn ≈ N (np, np(1 − p)) ⇒


1 −np
1
b+ 2
≈  a− 2 −np

< Ȳn < q
(a ≤ Zn ≤ b) ⇔  q

np(1−p)

np(1−p)



1
1
 b+ 2 −np 
 a− 2 −np 
P (a ≤ Zn ≤ b) ≈ Φq
−Φq

np(1−p)
np(1−p)
1 ⇒ np(1−p) = 18.75 > 9
Beispiel: n = 100, p = 4
30 X
100 1 k 3 100−k
( ) ( )
P (15 ≤ Zn ≤ 30) =
= 0.8908
k
4
4
k=15
Andererseits gilt auch B(100, 1
4 ) ≈ N (25, 18.75) ⇒
14.5 − 25
30.5 − 25
P (15 ≤ Zn ≤ 30) ≈ P ( √
≤ Zn ≤ √
)
18.75
18.75
= Φ(1.2702) − Φ(−2.4249) = 0.8903
Herunterladen