Universität Karlsruhe (TH) Institut für Statistik und Mathematische Wirtschaftstheorie Wahrscheinlichkeitstheorie Kapitel XIV - Grenzwertsätze Markus Höchstötter Lehrstuhl für Statistik, Ökonometrie und Mathematische Finanzwirtschaft, Universität Karlsruhe (TH) Karlsruhe, SS 2008 Grenzwertsätze Aufgabe der Wahrscheinlichkeitstheorie: Math. Modellierung von Zufallsvorgängen Ziel: Berechenbarkeit von Zufallsvorgängen soweit möglich. Ansatz: Ereignisse und ihren beobachtbaren Ergebnissen in sinnvoller Weise Wahrscheinlichkeiten zuordnen. Kapitel XIV - Grenzwertsätze 2 Grenzwertsätze Vorgaben: Wahrscheinlichkeiten entsprechen nach vielen Wiederholungen rel. Häufigkeiten. Folgerung daraus (nach vielen Wiederholungen) a) relative Häufigkeit des Eintretens eines Ereignisses ≈ Wahrscheinlichkeit des Ereignisses b) arithm. Mittel ≈ Erwartungswert; c) empirische Verteilungsfunktion ≈ theoretische Verteilungsfunktion Kapitel XIV - Grenzwertsätze 3 Grenzwertsätze Zufallsvorgang modelliert durch Wahrscheinlichkeitsraum (Ω, A(Ω), P) Wahrscheinlichkeitsraum der n- fachen unabhängigen Wiederholung: (Ωn , An (Ω), P (n) ) mit Grundgesamtheit: Ωn = {(ω1 , . . . , ωn )|ωi ∈ Ω} Für P (n) gilt: P (n) (A1 × . . . × An ) = P(A1 ) · . . . · P(An ) wobei (A1 , . . . , An ) - Ereignisse in (Ωn , An (Ω), P (n) ) Kapitel XIV - Grenzwertsätze 4 Grenzwertsätze Wahrscheinlichkeitsraum der unendlichfachen unabhängigen Wiederholung: Grundgesamtheit: ΩN : Menge der Folgen (ω1 , ω2 , . . .) = (ωi ); i = 1, 2, . . . Gesucht: Wahrscheinlichkeitsmaß P N auf ΩN Für das Wahrscheinlichkeitsmaß P N gilt: Q∞ P N (A1 × A2 × . . .) = i=1 P(Ai ) (6= 0 nur, wenn P(Ai ) = 1 für fast alle i) Kapitel XIV - Grenzwertsätze 5 Grenzwertsätze Relative Häufigkeit eines Ereignisses konvergiert gegen die Wahrscheinlichkeit des Ereignisses (Ω, A(Ω), P) Wahrscheinlichkeitsraum (Modell eines Zufallsprozesses) A ∈ A(Ω) Ereignis (A ⊂ Ω) Zu A gehört die Zufallsvariable: 1A : Ω → R 1 ω∈A 1A (ω) = ( „Indikatorfunktion zu A „ ) 0 ω∈ /A Kapitel XIV - Grenzwertsätze 6 Grenzwertsätze 1A Bernoulli - verteilt P(1A = 1) = P({ω|1A (ω) = 1}) = P(A) n - fache unabhängige Wiederholung von 1A : Y1 , . . . , Yn unabhängig identisch verteilt wie 1A (Yi = 1 Ereignis A tritt bei i - ter Wiederholung ein.) Kapitel XIV - Grenzwertsätze 7 Grenzwertsätze Relative Häufigkeit des Ereignisses A bei n unabhängigen Wiederholungen: zufällig, da abhängig vom zufälligen Verlauf. n P Yi absolute Häufigkeit des Ereignisses A i=1 1 n n P Yi relative Häufigkeit des Ereignisses A i=1 n 1 X n→∞ Yi =⇒ P(A) ∈ R n i=1 | {z } ZV Was bedeutet in diesem Zusammenhang Konvergenz ? Wie kann Konvergenz hier mathematisch präzisiert werden ? Was bedeutet Kapitel XIV - Grenzwertsätze 8 Grenzwertsätze Ansatz: n 1X Yi − P(A) ist Zufallsvariable. n i=1 Idee: Für wachsendes n sollte die Zufallsvariable mit hoher Wahrscheinlichkeit Werte in einem Bereich um 0 annehmen. Bereich um 0 : (−ε, ε) für ε > 0 Falls also gilt: ! n 1X (n) lim P −ε < Yi − P(A) < ε n→∞ n i=1 ! n X (n) 1 = lim P Yi − P(A) < ε = 1 für alle ε > 0 n→∞ n i=1 “Stochastische Konvergenz” Kapitel XIV - Grenzwertsätze 9 Grenzwertsätze Hilfssatz:Tschebyscheffsche Ungleichung Sei X : (Ω, A(Ω), P) → R Zufallsvariable mit existierendem Erwartungswert E(X ) und Varianz Var (X ) Für c > 0 gilt: P(|X − E(X )| ≥ c) ≤ Kapitel XIV - Grenzwertsätze Var (X ) c2 10 Grenzwertsätze Beweis: Setze zu ω ∈ Ω Z (ω) = c2 0 |X (ω) − E(X )| ≥ c sonst Z (ω) ≤ (X (ω) − E(X ))2 für alle ω ⇒ E(Z ) ≤ E((X − E(X ))2 ) = Var (X ) 2 E(Z ) = c P(Z = c 2 ) + 0 · P(Z = 0) = c 2 P(|X − E(X )| ≥ c) ≤ Var (X ) ) ⇒ P(|X − E(X )| ≥ c) ≤ Varc(X 2 c>0: Kapitel XIV - Grenzwertsätze 11 Grenzwertsätze Anwendung der Tschebyscheffschen Ungleichung Behauptung aus der deskriptiven Statistik: x1 , . . . , xn Urliste; x arithm. Mittel; s Standardabweichung 3 4 aller Werte liegen in [x − 2s, x + 2s] 8 9 aller Werte liegen in [x − 3s, x + 3s] Ω Grundgesamtheit (Statistische Masse) vom Umfang n : Ω = {ω1 , . . . , ωn } b : Ω → R quantitatives Merkmal b(ωi ) = xi für i = 1, . . . , n; xi Merkmalswert beim Merkmalsträger ωi Kapitel XIV - Grenzwertsätze 12 Grenzwertsätze Anwendung der Tschebyscheffschen Ungleichung Laplacescher Wahrscheinlichkeitsraum über Ω : (Ω, A(Ω), P) mit: P(ωi ) = E(b) 1 #A #A ; b(ωi ) = xi ; P(A) = = für A ⊂ Ω n #Ω n = n P i=1 1 n xi =x Var (b) = E((b − E(b))2 ) = n P i=1 Kapitel XIV - Grenzwertsätze 1 n (xi − x)2 = s2 13 Grenzwertsätze Anwendung der Tschebyscheffschen Ungleichung Tschebyscheffsche Ungleichung P(|b − E(b)| < c) ≥ 1 − Kapitel XIV - Grenzwertsätze Var (b) s2 = 1 − c2 c2 14 Grenzwertsätze Anwendung der Tschebyscheffschen Ungleichung P(|b − E(b)| < c) c = 2s : = = = P(|b − x| < c) 1 #{ω||b(ω) − x| < c} n 1 #{ω|x − c < b(ω) < x + c} n = Anteil der Werte im Bereich (x − c, x + c) ≥ 1 − Anteil der Werte im Bereich 2 c = 3s : s (x − 2s, x + 2s) ≥ 1 − 4s 2 = Anteil der Werte im Bereich (x − 3s, x + 3s) ≥ 1 − Kapitel XIV - Grenzwertsätze s2 9s2 = s2 c2 3 4 8 9 15 Grenzwertsätze Anwendung der Tschebyscheffschen Ungleichung Aufgabe 2.42* (Bamberg, G. “Statistik-Arbeitsbuch") Aufgrund der technischen Gegebenheiten und der einschlägigen Vorschriften errechnet man für eine projektierte Ski-Seilbahn eine zulässige Zuladung von 12.900[kg] pro Gondel. Für die Umsetzung in eine zulässige Personenzahl gehe man davon aus, dass für das Personengewicht X und das Gewicht Y der Skiausrüstung gelte: E(X ) = 75, Var (X ) = 80, E(Y ) = 15, Var (Y ) = 4, „Bruttogewicht“G = X + Y Die zulässige Personenzahl n muss die Eigenschaft haben, dass die Wahrscheinlichkeit für eine Überschreitung der zulässigen Zuladung höchstens 1% beträgt. Kapitel XIV - Grenzwertsätze 16 Grenzwertsätze Anwendung der Tschebyscheffschen Ungleichung a) Bestimmen Sie n unter den Prämissen, dass X und Y unabhängig sind und das Gesamtgewicht der Skifahrer als normalverteilt angenommen werden kann. b) Bestimmen Sie n unter den Prämissen, dass X und Y unabhängig sind, aufgrund der Tschebyscheffschen Ungleichung. c) Wie ändern sich obige Ergebnisse, wenn man die Erfahrungstatsache, dass schwerere Personen i.a. auch eine schwerere Skiausrüstung benötigen, durch die Prämisse berücksichtigt, dass der Korrelationskoeffizient zwischen X und Y den Wert 0,9 besitzt ? Kapitel XIV - Grenzwertsätze 17 Grenzwertsätze Anwendung der Tschebyscheffschen Ungleichung Zulässige Zuladung pro Gondel: 12900 kg. Aufgabe: Umsetzung in zulässige Personenzahl X Personengewicht Y Gewicht von Skiausrüstung X , Y Zufallsvariable mit E(X ) = 75 Var (X ) = 80 E(Y ) = 15 Var (Y ) = 4 G =X +Y “BruttogewichtE(G) = E(X ) + E(Y ) = 90 Kapitel XIV - Grenzwertsätze 18 Grenzwertsätze Anwendung der Tschebyscheffschen Ungleichung n Skifahrer Gi Bruttogewicht von Skifahrer(in) i G1 , . . . , Gn unabhängig, identisch verteilt wie G n P Gi Gesamtgewicht G(n) = i=1 Gesucht: n maximal mit P(G(n) > 12900) ≤ 0.01 Kapitel XIV - Grenzwertsätze 19 Grenzwertsätze zu a) X , Y unabhängig, normalverteilt, G = X + Y (normalverteilt) ⇒ Var (G) ⇒ E(G(n) ) Var (G(n) G(n) P(G(n) > 12900) = Var (X ) + Var (Y ) = 84 = 90n = 84n normalverteilt = 1 − P(G(n) ≤ 12900) (n) −90n √ = 1 − P( G √84n ≤ 12900−90n Forderung: 84n 12900−90n √ ) ≤ 0.01 = 1 − φ( 84n √ φ( 12900−90n ) ≥ 0.99 84n Kapitel XIV - Grenzwertsätze 20 Grenzwertsätze Anwendung der Tschebyscheffschen Ungleichung Aus der Tabelle von φ liest man ab: 12900−90n √ 84n = φ−1 (0.99) = 2.326 , √ so dass man zur quadratischen Gleichung (für n) √ √ −90n − 2.326 84 n + 12900 = 0 √ kommt. Die (positive) Lösung n = 11.85 liefert n = 140.42 Unter den Prämissen von a) ist deshalb n = 140 die Höchstzahl der Personen pro Gondel. Kapitel XIV - Grenzwertsätze 21 Grenzwertsätze zu b) 1 Aus der Gleichungs- bzw. Ungleichungskette P(G(n) > 12900) = P(G(n) − 90n > 12900 − 90n) ) ≤ P(|G(n) − 90n| ≥ 12900 − 90n) 84n ≤ (12900−90n) 2 ≤ 0, 01 ergibt sich durch Gleichsetzen der beiden letzten Ausdrücke wiederum eine quadratische Gleichung. Die relevante Lösung ist n = 131, 65 und damit die Antwort n = 131. (Die rechnerisch zu ermittelnde zweite Lösung n = 156 ist irrelevant, da 90 n hierbei größer als 12900 ausfällt). Kapitel XIV - Grenzwertsätze 22 Grenzwertsätze zu c) c) Nun ist die Varianz von G größer, nämlich: X und Y positiv korreliert mit %(X , Y ) = 0.9 Var (G) Var (X ) + Var (Y ) + 2Cov (X , Y ) Cov (X , Y ) %(X , Y ) = p Var (X )Var (Y ) p p ⇒ Cov (X , Y ) = %(X√ , Y )√ Var (X ) Var (Y ) = 0.9 80 4 √ √ Var (G) = 80 + 4 + 2 · 0.9 · 80 · 4 = 116, 2 Kapitel XIV - Grenzwertsätze = 23 Grenzwertsätze Anwendung der Tschebyscheffschen Ungleichung Der Lösungsvorgang aus a) und b) bleibt im Prinzip unverändert. Die größere Varianz führt zu folgenden modifizierten (und wie zu erwarten war, kleineren) Lösungen n = 139 unter Verwendung der Normalverteilung n = 129 unter Verwendung der Tschebyscheffschen Ungleichung. Kapitel XIV - Grenzwertsätze 24 Grenzwertsätze Anwendung der Tschebyscheffschen Ungleichung Anmerkung zur Normalverteilungsannahme: In der Realität: G ≥ 0, d.h. P(G < 0) = 0 Bei Normalverteilungsannahme: P(G < 0) > 0 Annahme: G normalverteilt nicht korrekt aber: E(G) = 90 Var (G) = 84 G − 90 −90 √ <√ P(G < 0) = P 84 84 −90 = ϕ √ = ϕ(−9, 8) < 10−16 84 Kapitel XIV - Grenzwertsätze 25 Grenzwertsätze Anwendung auf Fragestellung a) n P Yi = relative Häufigkeit (yi ∈ {0, 1}) X = n1 i=1 Behauptung: n P 1 Yi konvergiert stochastisch gegen P(A), d.h. für jedes n i=1 ε > 0 gilt: lim P n→∞ ⇔ lim P n→∞ Kapitel XIV - Grenzwertsätze ! n 1 X Yi − P(A) ≥ ε = 0 n i=1 ! n 1 X Yi − P(A) < ε = 1 n i=1 26 Grenzwertsätze Anwendung auf Fragestellung a) E(X ) = E = 1 n 1 n n P n P Yi i=1 E(Yi ) = E(1A ) i=1 = 1P(1A = 1) + 0 · P(1A = 0) = P(A) Kapitel XIV - Grenzwertsätze 27 Grenzwertsätze Anwendung auf Fragestellung a) P (n) ! n X 1 Yi − P(A) ≥ ε n Var ( n1 n P i=1 ε2 ≤ i=1 1 n2 Yi ) = n P Var (Yi ) i=1 ε2 (Yi unnabhängig) 1 n2 = ⇒ relative Häufigkeit 1 n n P n P Var (1A ) i=1 ε2 = 1 Var (1A ) n→∞ n =⇒ ε2 0 Yi konvergiert stochastisch gegen P(A) i=1 “Bernoullis Gesetz der großen Zahlen” Kapitel XIV - Grenzwertsätze 28 Grenzwertsätze Anwendung auf Fragestellung a) Bemerkung: Xk , X0 sind Funktionen: e→R Xk , X0 : Ω (punktweise) Konvergenz von Funktionen: lim Xk = X0 heißt: k →∞ e gilt: Für jedes ω e∈Ω lim Xk (e ω ) = X0 (e ω) k →∞ “punktweise Konvergenz" Kapitel XIV - Grenzwertsätze 29 Grenzwertsätze Definition: Stochastische Konvergenz Xk , k = 1, 2, 3, . . . , und X0 Zufallsvariable auf einem Wahrscheinlichkeitsraum Man sagt: Die Folge (Xk ) konvergiert stochastisch gegen X0 wenn (für alle ε > 0) lim P(|Xn − X0 | ≥ ε) = 0 x→∞ gilt. (Schreibweise: X0 = p lim Xk ) Man kann zeigen : k →∞ Aus punktweiser Konvergenz folgt stochastische Konvergenz und Umkehrung gilt nicht. Kapitel XIV - Grenzwertsätze 30 Grenzwertsätze Phänomen b): Arithmetisches Mittel der Beobachtungen ≈ Erwartungswert Sei X Zufallsvariable Y1 , Y2 , . . . Folge von unabhängigen Wiederholungen zu X mit: n P (n) Y = n1 Yi arithmetisches Mittel nach n Wiederholungen i=1 E(Y (n) Var (Y =E ) (n) Kapitel XIV - Grenzwertsätze ) = Var 1 n n P Yi i=1 n P 1 n i=1 = Yi = 1 n n P E(Yi ) i=1 n P 1 n2 i=1 Var (Yi ) = E(X ) = Var (X ) n 31 Grenzwertsätze Phänomen b): Tschebyscheffsche Ungleichung: P |Y Y (n) (n) − E(X )| ≥ ε ≤ (n) Var Y ε2 = Var (X ) n→∞ → nε2 0 konvergiert stochastisch gegen E(X ) “Schwaches Gesetz der großen Zahlen" Schreibweise: E(X ) = p lim Y (n) n→∞ Kapitel XIV - Grenzwertsätze 32 Grenzwertsätze Aber: Stochastische Konvergenz bedeutet nicht punktweise Konvergenz Beispiel: Wiederholtes Werfen eines Würfels Elementarereignis: Bei unendlichfacher Wiederholung ist die Folge ∼ ω= (ω1 , ω2 , . . .) mit ωi ∈ {1, 2, 3, 4, 5, 6} für i = 1, 2, 3, . . . Bernoullis “Gesetz der Großen Zahlen" bewirkt relative Häufigkeit der Augenzahlen 1,2,3,4,5,6 nach n Versuchen stochastisch (P (n) (1), . . . , P (n) (6)) =⇒ ( 16 , . . . , 61 ) Aber: z.B. relative Häufigkeit von 1,2,3,4,5,6 nach n Variablen bei der speziellen Folge (4, 4, 4, . . .) : (P (n) (1), . . . , P (n) (6)) = (0, 0, 0, 1, 0, 0) 6= (p1 , . . . , p6 ) ⇒ keine punktweise Konvergenz der relativen Häufigkeiten Kapitel XIV - Grenzwertsätze 33 Grenzwertsätze Bemerkung zur Konvergenz von Zufallsvariablen: Abschwächung der punktweisen Konvergenz: X1 , X2 , . . . Folge von Zufallsvariablen auf (Ω, A(Ω), P) X0 Zufallsvariablen auf (Ω, A(Ω), P) o n Sei ω ∈ Ω lim Xn (ω) = X0 (ω) Teilmenge in Ω eine n→∞ Wahrscheinlichkeit derart zugeordnet: P {ω ∈ Ω| lim Xn (ω) = X0 (ω)} n→∞ Im wahrscheinlichkeitstheoretischen Sinn ist es ausreichend, dass diese Wahrscheinlichkeit 1 ist, da wir dann davon ausgehen, dass dieses Ereignis sicher ist. Also nicht notwendig für alle ω ∈ Ω Kapitel XIV - Grenzwertsätze 34 Grenzwertsätze Also: (Xn ) konvergiert “fast sicher"(punktweise) gegen X0 , falls P {ω ∈ Ω| lim Xn (ω) = X0 (ω)} = 1 n→∞ ist. Kapitel XIV - Grenzwertsätze 35 Konvergenz Bemerkung zur Konvergenz von Zufallsvariablen: punktweise ⇒ fast sichere ⇒ stochastische punktweise : fast sichere : stochastische Kapitel XIV - Grenzwertsätze 36 Grenzwertsätze Phänomen c): Erwartung: Nach vielen Versuchen ⇒ empirische Verteilungsfunktion ≈ theoretische Verteilungsfunktion Seien X1 , . . . , Xn Ergebnisse der ersten n Versuche (Realisationen von X ) Empirische Verteilungsfunktion: F emp,n (α) = n1 #{i = 1, . . . , n : xi ≤ α} Versuchsergebnisse zufallsbehaftet ⇒ emp. Verteilungsfunktion zufallsbehaftet (X1 , . . . Xn kann auch durch Elementarereignisse ω1 , . . . , ωn beschrieben werden mit X1 = X (ω1 ), . . . , Xn = X (ωn )) Kapitel XIV - Grenzwertsätze 37 Grenzwertsätze Sei A das Ereignis “X ≤ t”, dann gilt P(A) = P(X ≤ t) = FX (t). FXemp,n (t) - relative Häufigkeit des Eintretens von A bei n Versuchen. Also nach Bernoullis Gesetz der großen Zahlen : FXemp,n (t) ≈ P(A) = FX (t) Kapitel XIV - Grenzwertsätze 38 Grenzwertsätze Genauer : mit Yi ((ωj )j=1,2,3... ) = 1A (ωi ), 1 A tritt beim i − ten Versuch ein also Yi ((ωj )j=1,2,3... ) = 0 A tritt nicht ein gilt nach Bernoullis Gesetz der großen Zahlen: ! n X (n) 1 lim P Yi − P(A) < ε = 1 n→∞ n i=1 Kapitel XIV - Grenzwertsätze 39 Grenzwertsätze Dabei ist lim P (n) n→∞ = PN ! n 1 X Yi − P(A) < ε n i=1 emp,n |FX (t) − FX (t)| < ε mit P N Wahrscheinlichkeitsmaß auf der Menge ΩN der Folgen (ωi )i=1,2,... . Kapitel XIV - Grenzwertsätze 40 Grenzwertsätze Eine Verschärfung ist der Hauptsatz der Statistik lim P (n) sup |FXemp,n (α) − F (α)| < ε = 1 n→∞ Kapitel XIV - Grenzwertsätze α 41 Grenzwertsätze Eine Anwendung des Hauptsatzes der Statistik: Anpassungstests nach Kolmogoroff-Smirnow Hypothese: Es liegt eine bestimmte Wahrscheinlichkeitsverteilung mit einer Verteilungsfunktion F vor Test: Abweichung von empirischer Verteilungsfunktion bei n Versuchen größer als eine Testschranke ⇒ Ablehnung der Hypothese Kapitel XIV - Grenzwertsätze 42 Grenzwertsätze weiteres Phänomen m Versuchsreihen mit jeweils n Versuchen n Messwerte bei jeder Versuchsreihe Auswertung jeder Versuchsreihe durch arithmetisches Mittel Beobachtet wird: Histogramm der arithmetischen Mittel bei vielen Versuchsreihen (und großem n) ≈ Dichtefunktion einer Normalverteilung Kapitel XIV - Grenzwertsätze 43 Grenzwertsätze Beispiel Sei m = n = 1000, X ∈ Rm×n aus der Stichprobe. Berechnung der m arithmetischen Mittel Xi , i = 1, . . . , m. Gruppierung der Xi in ca. 70 Klassen (werteabhängig). Berechnung des Gesamtmittels: m 1 X X = Xi m i=1 und der mittleren quadratischen Abweichung V = m 1 X (xi − x)2 . m i=1 Kapitel XIV - Grenzwertsätze 44 Grenzwertsätze Betrachtung einer Versuchsreihe Ausgangspunkt: Xi ZV des i-ten Versuchs, i = 1, . . . , n. Angenommen Xi normalverteilt mit µi und σi also X1 , . . . , Xn n P Xi ist N(µ, σ 2 )- verteilt mit unabhängig N(µi , σi2 )- verteilt µ= n P µi , σ 2 = i=1 n P i=1 i=1 n P Xi − µi i=1 i=1 s n P σi2 n P σi2 ⇒ N(0, 1)-verteilt. i=1 Kapitel XIV - Grenzwertsätze 45 Grenzwertsätze Die Verteilungsfunktion von n P Xi − µi Zn = i=1s i=1 n P σi2 n P i=1 konvergiert gegen die Verteilungsfunktion der Standardnormalverteilung. Zt lim FZn (t) = Φ(t) = n→∞ −∞ Kapitel XIV - Grenzwertsätze x2 1 √ e− 2 dx 2π 46 Grenzwertsätze Dies gilt beim Grenzübergang n → ∞ auch allgemeiner: Seien X1 , . . . , Xn ,. . . unabhängig mit existierenden Erwartungswerten µi und Varianzen σi2 (ohne die Voraussetzung der Normalverteilung) und erfüllen Lindeberg-Bedingung (siehe nächste Seite). Dann gilt der zentrale Grenzwertsatz (Satz 14.9) Kapitel XIV - Grenzwertsätze 47 Grenzwertsätze Anmerkung: Lindeberg-Bedinung (speziell: n = rn ) Seien µi = E(Xi ) und σi2 = Var (Xi ) < ∞, i = 1, . . . , n, Sn := x1 + . . . + xn 2 und sei σ(n) = σ12 + . . . + σn2 dann gilt, falls n 1 X E((Xk − µk )2 ) · 1{|Xk −µk |>σ(n) } = 0 n→∞ σ 2 (n) k =1 lim für > 0 beliebig, Sn −E[Sn ] √ V (Sn ) Kapitel XIV - Grenzwertsätze d −→ N(0, 1) 48 Grenzwertsätze Spezialfall des Satz 14.9: Zentralen Grenzwertsatzes Lindeberg-Bedingung ist erfüllt, wenn X1 , . . . , Xn ,. . . unabhängig identischverteilt mit Erwartungswert µ0 und Varianz σ 2 . Dann ist zu gegebenem n mit µ = nµ0 , σ 2 = nσ02 , n P Xi − nµ0 Zn = i=1 √ = nσ0 und 1 n n P Xi − µ0 i=1 σ0 √ n lim FZn (t) = Φ(t) n→∞ d.h. das arithmetische Mittel ist näherungsweise normalverteilt 2 mit µ0 und σn . Kapitel XIV - Grenzwertsätze 49 Grenzwertsätze Anwendungen: n P Xi , X1 , . . . , Xn unabhängig Y = i=1 ⇒ Y näherungsweise normalverteilt. Begründung dafür, bei Anwendungen in der Praxis bei Beobachtungen einer Zufallsvariable von einer normalverteilten Zufallsvariablen auszugehen: Messwert wird beeinflusst von vielen unabhängigen Faktoren, z.B. Messfehler, Luftfeuchtigkeit, Temperatur, Erschütterungen, Spannungsschwankungen, . . . ⇒ Abweichungen von einem mittleren Wert ist Summe vieler zufälliger Größen ⇒ Abweichung unterliegt zumindest näherungsweise einer Normalverteilung Kapitel XIV - Grenzwertsätze 50 Grenzwertsätze Anwendungen: 1. Näherung der Binomialverteilung durch die Normalverteilung Binomialverteilung B(n, p) mit Erwartungswert : np Varianz np(1 − p) Sei Y B(n, p)-verteilt, dann Y = X1 + . . . + Xn mit: Xi unabhängig und Bernoulliverteilt mit Parameter p. Zentraler Grenzwertsatz: n groß ⇒ Y näherungsweise, N (np, np(1 − p))- verteilt. Kapitel XIV - Grenzwertsätze 51 Grenzwertsätze Gesucht: P(Y ≤ y ) P(Y ≤ y ) = P Damit Y − np p np(1 − p) ≤p y − np np(1 − p) ! ≈Φ y − np ! p np(1 − p) P Xi − np p =p np · (1 − p) np · (1 − p) Y − np ist näherungsweise standardnormalverteilt, d.h. ! Y − np ≤ x ≈ Φ(x) P p np · (1 − p) Kapitel XIV - Grenzwertsätze 52 Grenzwertsätze bzw. mit x = √ y −np np·(1−p) Y − np p np(1 − p) P(Y ≤ y ) ≈ Φ Kapitel XIV - Grenzwertsätze y − np ≤p ⇐⇒ Y ≤ y np(1 − p) y − np p np · (1 − p) ! für alle y ∈ R ~ 53 Grenzwertsätze Y diskret mit Werten 0, 1, 2, 3, . . . , n ⇒ y = k mit k = 0, 1, 2, . . . , n linke Seite von ~ ändert sich nur bei ganzzahligem y (= k ) Bessere Annäherung: ! k X k + 12 − np P(Y = m) = P(Y ≤ k ) ≈ Φ p np · (1 − p) m=0 1 2 ist Stetigkeitskorrektur. Kapitel XIV - Grenzwertsätze 54 Grenzwertsätze 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 P(Y ≤ k ) = 10 k P 20 30 40 50 60 70 80 90 100 P(Y = m) kumulierte Binomialverteilung für n=100 m=0 Kapitel XIV - Grenzwertsätze 55 Grenzwertsätze Anwendungen: 2. Erzeugung von Zufallszahlen zur Normalverteilung. Tabellen von Zufallszahlen und computererzeugte Zufallszahlen sind Zufallszahlen zur Gleichverteilung auf [0, 1] Erwartungswert 12 Varianz Kapitel XIV - Grenzwertsätze 1 12 56 Grenzwertsätze Xi unabhängig, identisch gleichverteilt auf [0, 1] 12 P Xi (−6) hat Erwartungswert 6 (0) und ist i=1 und Varianz 1 näherungsweise normalverteilt. Je 12 Zufallszahlen zur Gleichverteilung auf [0,1] werden addiert und von der Summe die Zahl 6 abgezogen. Kapitel XIV - Grenzwertsätze 57 Grenzwertsätze Daraus: Zufallszahlen zur Normalverteilung mit Mittelwert µ und Varianz σ 2 : z Zufallszahl zu N (0, 1) dann µ + σz Zufallszahl zu N (µ, σ 2 ) . Kapitel XIV - Grenzwertsätze 58