2D-Normalverteilte ZG (Ergänzg.) Skalierung auf Standard-NV (2D): X0 = X −mX Y −mY , Y 0= , ⇒ (X 0, Y 0) ∼ N V mit σX σY 0 = σy0 = 1. ρ(X 0, Y 0) = ρ m0X = m0Y = 0, σX fX 0 Y 0 (x, y) = 1 q 2π 1 − ρ2 ·e 2 2 − x −2ρxy+y 2 2(1−ρ ) Satz: Bei normalverteilten ZG gilt: Unabhängigkeit ⇔ Unkorreliertheit ⇔ ρ = 0 Funktionen/Summen von ZG Gegeben: Zufallsvektor (X, Y ) ⇒ neue ZG Z = g(X, Y ) ⇒ Frage(n): Verteilung von Z? (i.a. schwierig zu beantworten); statistische Parameter ( einfacher“), z.B.: ”Z Z E(Z) = ∞ ∞ −∞ −∞ g(ξ, η)f (ξ, η) dξdη. speziell Summen von ZG(allgemeingültig!): E(a1 X + a2 Y ) = a1 E(X) + a2 E(Y ), aber: i.a. D 2(X +Y ) = D 2X +D 2 Y +2ρ(X, Y )σX σY Für unabhängige ZG gilt jedoch: 2 2 2 E(XY ) = EXEY, D 2(a1 X+a2Y ) = a2 D X+a 1 2D Y Summen identisch verteilter unabhängiger ZG (wichtig für Statistik) X1 , .., Xn identisch verteilte ZG, unabhängig mit EXi = µ, D 2Xi = σ 2 < ∞ Zn = Pn i=1 Xi E(Zn) = nEX = nµ, D 2Zn = nD 2X = nσ 2 ⇒ 2 2 nσ σ Zn ⇒ E X̄n = µ, D 2X̄n = 2 = X̄n = n n n Zn - Summe; X̄n - statistischer Mittelwert, Achtung: i.a. andere Verteilung als Xi(!) Beisp.: X(e) ∈ {0,1}, (X −1(1) = A, P (A) = p) ⇒ P (X = 0) = 1−p, P (X = 1) = p, n unabhängiP ge Versuche ⇒ Zn = n i=1 Xi - binomialverteilt, Parameter n, p. Sonderfall: Xi (identisch, unabh.) normalverteilt ⇒ Summe (Mittelwert) wieder normalverteilt σ2 2 Xi ∼ N (µ, σ ) ⇒ X̄n ∼ N (µ, ) n Der Mittelwert von X̄n bleibt gleich, aber σn = √σn → 0 für n → ∞. Der statistische Mittelwert ist immer stärker um (gleichbleibenden) Erwartungswert konzentriert“ ⇒ ” Frage: gesetzmäßig? ⇒ Grenzwertsätze; Ge” setze der großen Zahlen“ Schwaches Gesetz d. großen Zahlen Satz: Sei X1, X2, . . . , Xn , .. eine Folge identisch verteilter unabhängiger ZG vom Typ ” X“ (i.i.d. - englisch: identically independently distributed) mit EXi = µ, D 2Xi = σ 2, i = 1, .., n, ... Dann gilt für alle ε > 0 lim P (|X̄n − µ| ≤ ε) = 1, (X̄n n→∞ stoch. −→ µ) d.h., das statistische Mittel konvergiert im Sinn der Wkt. (stochastisch) gegen den (einheitlichen) Erwartungswert µ aller Zufallsgrößen der Folge. Anwendung: Konvergenz der relativen Häufigkeit Hn(A) gegen P (A) = p für A ∈ Z −1 −1 (0) = Ā, (1) = A, XA ⇒ XA(e) ∈ {0, 1}, XA ⇒ P (X = 1) = p, P (X = 0) = 1−p, betrachten n unabhängige Realisierungen Xi dieser ZG P Xi ⇒ EXi = p, D Xi = p(1−p), ∀i = 1(1)n, X̄n = n 2 Anz.: A tritt ein ⇒ X̄n = Hn(A) = (Hn (A) ist ZG!) n (Anz. Vers.) Schwaches Gesetz der großen Zahlen ⇒ stoch. lim P (|Hn (A)−p| ≤ ε) = 1, d.h., Hn(A) −→ P (A) n→∞ Frage: Wieviel Versuche sind nötig, um die Übereinstimmung von Hn(A) mit P (A) bis auf 2 Stellen genau mit einer Wkt. von mindestens 0.95 zu garantieren? Antwort 1 (mit Tschebychev-Ungl.) Aussage: D 2Hn(A) ! ≥ 0.95 lim P (|Hn (A)−p| ≤ ε) ≥ 1 − 2 n→∞ ε p(1−p) Wegen D 2Hn(A) = und p(1−p) ≤ 1 : 4 n n so bestimmen, daß gilt (ε = 0.005 wg. Rundg.) ! 1 1 1− ≤ 0.05 ≥ 0.95, ⇒ 4nε2 4nε2 1 = 200000 ⇒n ≥ 2 4 · 0.05 · (0.005) Anwendung zentraler GV-Satz (auch: Starkes Gesetz der großen Zahlen“) ” Wichtige Konsequenzen für Praxis“: (i) für ” große n kann das statistische Mittel X̄n generell in guter Näherung als normalverteilt angesehen werden - unabhängig von der (evtl. unbekannten) Verteilung von X (ii) bei Größen, die durch Überlagerung zahlreicher unabhängiger Einflüsse entstehen (Meßfehler!) motiviert der zentr. GV-Satz die Annahme einer Normalverteilungshypothese Betrachten nochmals die Xi , bekannt: SumP me ist binomialverteilt Zn = Xi ∼ B(n, p) (EZn = np, D 2Zn = np(1 − p)) Zentr.GV-S.: √ X̄n − p ≈ N (0, 1) - verteilt Ȳn = n q p(1 − p) (für n hinreichend groß“). Rücktrafo“: ” ” Zn − np Ȳn = q ⇒ Zn ≈ N (np, np(1 − p)) np(1 − p) Grenzverteilungssatz von Moivre/Laplace: Für große n kann die Binomialverteilung durch die Normalverteilung angenähert werden. Faustregel: np(1 − p) ≥ 9 - gute Näherung ( noch brauchbar“ für: np(1 − p) ≥ 4) ” Antwort 2: Abschätzung von n für Approx. von P (A) durch Hn(A) auf 2 Stellen mit zentralem GV-Satz (Wkt. 0.95): P (|Hn (A)−p| ≤ ε) = P (|X̄n−p| ≤ ε) = P (|Zn−np| ≤ nε) Z −np nε n q q |Zn−np| ≤ nε ⇔ |Ȳn| = ≤ np(1−p) np(1−p) Wegen Ȳn ≈ N (0, 1) gilt −nε P (|Hn (A)−p| ≤ ε) = P q np(1−p) ε ≈ Φq √ ≤ Ȳn ≤ q √ −ε n q nε np(1−p) √ ε n q n −Φ = 2Φ0 p(1−p) p(1−p) p(1−p) Damit ergibt sich (ε = 0.005 einsetzen) ! n ! ≥ 0.475 p(1−p) ε P (|Hn (A)−p| ≤ ε) ≥ 0.95 ⇔ Φ0q ≈ √ √ ε n 1.962 ⇒q ≥ 1.96 ⇒ n ≥ = 38416 2 4 · (0.005) p(1−p) ! Weitere Anwendung für Moivre/Laplace: Es sei Zn ∼ B(n, p) mit np(1 − p) > 9. Frage: b X n k P (a ≤ Zn ≤ b) = p (1−p)n−k =?(a, b ∈ N) k k=a Wegen Zn ≈ N (np, np(1 − p)) ⇒ 1 −np 1 b+ 2 ≈ a− 2 −np < Ȳn < q (a ≤ Zn ≤ b) ⇔ q np(1−p) np(1−p) 1 1 b+ 2 −np a− 2 −np P (a ≤ Zn ≤ b) ≈ Φq −Φq np(1−p) np(1−p) 1 ⇒ np(1−p) = 18.75 > 9 Beispiel: n = 100, p = 4 30 X 100 1 k 3 100−k ( ) ( ) P (15 ≤ Zn ≤ 30) = = 0.8908 k 4 4 k=15 Andererseits gilt auch B(100, 1 4 ) ≈ N (25, 18.75) ⇒ 14.5 − 25 30.5 − 25 P (15 ≤ Zn ≤ 30) ≈ P ( √ ≤ Zn ≤ √ ) 18.75 18.75 = Φ(1.2702) − Φ(−2.4249) = 0.8903