Wahrscheinlichkeitstheorie Kapitel XIV - Grenzwertsätze Georg Bol [email protected] Markus Höchstötter [email protected] Grenzwertsätze Aufgabe der Wahrscheinlichkeitstheorie: Math. Modellierung von Zufallsvorgängen Ziel: Berechenbarkeit von Zufallsvorgängen soweit möglich. Ansatz: Ereignisse und ihren beobachtbaren Wahrscheinlichkeiten zuordnen. Kapitel XIV - Grenzwertsätze Ergebnissen in sinnvoller Weise 1 Grenzwertsätze Vorgaben: Wahrscheinlichkeiten entsprechen nach vielen Wiederholungen rel. Häufigkeiten. Folgerung daraus (nach vielen Wiederholungen) a) relative Häufigkeit des Eintretens eines Ereignisses ≈ Wahrscheinlichkeit des Ereignisses b) arithm. Mittel ≈ Erwartungswert; c) empirische Verteilungsfunktion ≈ theoretische Verteilungsfunktion Kapitel XIV - Grenzwertsätze 2 Grenzwertsätze Zufallsvorgang modelliert durch Wahrscheinlichkeitsraum (Ω, A(Ω), P ) Wahrscheinlichkeitsraum der n- fachen unabhängigen Wiederholung: (Ωn, An(Ω), P (n)) mit Grundgesamtheit: Ωn = {(ω1, . . . , ωn)|ωi ∈ Ω} Für P (n) gilt: P (n)(A1 × . . . × An) = P (A1) · . . . · P (An) wobei (A1, . . . , An) - Ereignisse in (Ωn, An(Ω), P (n)) Kapitel XIV - Grenzwertsätze 3 Grenzwertsätze Wahrscheinlichkeitsraum der unendlichfachen unabhängigen Wiederholung: Grundgesamtheit: ΩN : Menge der Folgen (ω1, ω2, . . .) = (ωi); i = 1, 2, . . . Gesucht: Wahrscheinlichkeitsmaß P IN auf ΩIN Für das Wahrscheinlichkeitsmaß P IN gilt: IN P (A1 × A2 × . . .) = Q∞ i=1 P (Ai ) (6= 0 nur, wenn P (Ai) = 1 für fast alle i) Kapitel XIV - Grenzwertsätze 4 Phänomen a): Relative Häufigkeit eines Ereignisses konvergiert gegen die Wahrscheinlichkeit des Ereignisses (Ω, A(Ω), P ) A ∈ A(Ω) Wahrscheinlichkeitsraum (Modell eines Zufallsprozesses) Ereignis (A ⊂ Ω) Zu A gehört die Zufallsvariable: 1A : Ω → R 1 ω∈A 1A(ω) = (“Indikatorfunktion zu A”) 0 ω∈ /A Kapitel XIV - Grenzwertsätze 5 Phänomen a): 1A Bernoulli - verteilt P (1A = 1) = P ({ω|1A(ω) = 1}) = P (A) n - fache unabhängige Wiederholung von 1A: Y1, . . . , Yn unabhängig identisch verteilt wie 1A (Yi = 1 Ereignis A tritt bei i - ter Wiederholung ein.) Kapitel XIV - Grenzwertsätze 6 Phänomen a): Relative Häufigkeit des Ereignisses A bei n unabhängigen Wiederholungen: zufällig, da abhängig vom zufälligen Verlauf. n P Yi absolute Häufigkeit des Ereignisses A i=1 n P 1 Yi n i=1 relative Häufigkeit des Ereignisses A n 1 X n→∞ Was bedeutet Yi =⇒ P (A) ∈ R n i=1 | {z } ZV Was bedeutet in diesem Zusammenhang Konvergenz ? Wie kann Konvergenz hier mathematisch präzisiert werden ? Kapitel XIV - Grenzwertsätze 7 Ansatz: n 1X Yi − P (A) ist Zufallsvariable. n i=1 Idee: Für wachsendes n sollte die Zufallsvariable mit hoher Wahrscheinlichkeit Werte in einem Bereich um 0 annehmen. Bereich um 0 : (−ε, ε) für ε > 0 Falls also gilt: lim P lim P (n) n→∞ = (n) n→∞ n X ! 1 Yi − P (A) < ε −ε < n i=1 ! n 1 X Y − P (A) <ε =1 i n i=1 für alle ε > 0 “Stochastische Konvergenz” Kapitel XIV - Grenzwertsätze 8 Phänomen a): Hilfssatz:Tschebyscheffsche Ungleichung Sei X : (Ω, A(Ω), P ) → R Zufallsvariable mit existierendem Erwartungswert E(X) und Varianz V ar(X) Für c > 0 gilt: V ar(X) P (|X − E(X)| ≥ c) ≤ c2 Kapitel XIV - Grenzwertsätze 9 Beweis: Setze zu ω ∈ Ω Z(ω) = c>0: Z(ω) c2 |X(ω) − E(X)| ≥ c 0 sonst ≤ (X(ω) − E(X))2 für alle ω ⇒ E(Z) ≤ E((X − E(X))2) = V ar(X) E(Z) = c2P (Z = c2) + 0 · P (Z = 0) = c2P (|X − E(X)| ≥ c) ≤ V ar(X) ⇒ P (|X − E(X)| ≥ c) ≤ Kapitel XIV - Grenzwertsätze V ar(X) c2 10 Anwendung der Tschebyscheffschen Ungleichung Behauptung aus der deskriptiven Statistik: x1, . . . , xn Urliste; x arithm. Mittel; s Standardabweichung 3 4 aller Werte liegen in [x − 2s, x + 2s] 8 9 aller Werte liegen in [x − 3s, x + 3s] Ω Grundgesamtheit (Statistische Masse) vom Umfang n : Ω = {ω1, . . . , ωn} b : Ω → R quantitatives Merkmal b(ωi) = xi für i = 1, . . . , n; xi Merkmalswert beim Merkmalsträger ωi Kapitel XIV - Grenzwertsätze 11 Anwendung der Tschebyscheffschen Ungleichung Laplacescher Wahrscheinlichkeitsraum über Ω : (Ω, A(Ω), P ) mit: #A #A 1 = für A ⊂ Ω P (ωi) = ; b(ωi) = xi; P (A) = n #Ω n E(b) = n P i=1 1 n xi =x 2 V ar(b) = E((b − E(b)) ) = Kapitel XIV - Grenzwertsätze n P i=1 1 n (xi − x)2 = s2 12 Anwendung der Tschebyscheffschen Ungleichung Tschebyscheffsche Ungleichung V ar(b) s2 P (|b − E(b)| < c) ≥ 1 − =1− 2 c2 c Kapitel XIV - Grenzwertsätze 13 Anwendung der Tschebyscheffschen Ungleichung P (|b − E(b)| < c) = P (|b − x| < c) = 1 n #{ω||b(ω) = 1 n #{ω|x = c = 2s : c = 3s : − x| < c} − c < b(ω) < x + c} Anteil der Werte im Bereich Anteil der Werte im Bereich Kapitel XIV - Grenzwertsätze 2 Anteil der Werte im Bereich (x − c, x + c) ≤ 1 − sc2 (x − 2s, x + 2s) ≥ 1 − (x − 3s, x + 3s) ≥ 1 − s2 4s2 s2 9s2 = = 3 4 8 9 13 Anwendung der Tschebyscheffschen Ungleichung Aufgabe 2.42* (Bamberg, G. “Statistik-Arbeitsbuch”) Aufgrund der technischen Gegebenheiten und der einschlägigen Vorschriften errechnet man für eine projektierte Ski-Seilbahn eine zulässige Zuladung von 12.900[kg] pro Gondel. Für die Umsetzung in eine zulässige Personenzahl gehe man davon aus, dass für das Personengewicht X und das Gewicht Y der Skiausrüstung gelte: E(X) = 75, V ar(X) = 80, E(Y ) = 15, V ar(Y ) = 4, “Bruttogewicht” G = X + Y Die zulässige Personenzahl n muss die Eigenschaft haben, dass die Wahrscheinlichkeit für eine Überschreitung der zulässigen Zuladung höchstens 1% beträgt. Kapitel XIV - Grenzwertsätze 14 Anwendung der Tschebyscheffschen Ungleichung a) Bestimmen Sie n unter den Prämissen, das X und Y unabhängig sind und das Gesamtgewicht der Skifahrer als normalverteilt angenommen werden kann. b) Bestimmen Sie n unter den Prämissen, das X und Y unabhängig sind, aufgrund der Tschebyscheffschen Ungleichung. c) Wie ändern sich obige Ergebnisse, wenn man die Erfahrungstatsache, dass schwerere Personen i.a. auch eine schwerere Skiausrüstung benötigen, durch die Prämisse berücksichtigt, dass der Korrelationskoeffizient zwischen X und Y den Wert 0,9 besitzt ? Kapitel XIV - Grenzwertsätze 15 Anwendung der Tschebyscheffschen Ungleichung Zulässige Zuladung pro Gondel: 12900 kg. Aufgabe: Umsetzung in zulässige Personenzahl X Personengewicht Y Gewicht von Skiausrüstung X, Y Zufallsvariable mit E(X) = 75 E(Y ) = 15 V ar(X) = 80 V ar(Y ) = 4 G=X +Y “Bruttogewicht” E(G) = E(X) + E(Y ) = 90 Kapitel XIV - Grenzwertsätze 16 Anwendung der Tschebyscheffschen Ungleichung n Skifahrer Gi Bruttogewicht von Skifahrer(in) i G1, . . . , Gnunabhängig, identisch verteilt wie G n P (n) Gi Gesamtgewicht G = i=1 Gesucht: n maximal mit P (G(n) > 12900) ≤ 0.01 Kapitel XIV - Grenzwertsätze 17 zu a) X, Y unabhängig, normalverteilt, G = X + Y (normalverteilt) ⇒ V ar(G) = V ar(X) + V ar(Y ) = 84 ⇒ E(G(n)) = 90n V ar(G(n) = 84n G(n) normalverteilt P (G(n) > 12900) = 1 − P (G(n) ≤ 12900) G(n) −90n √ ≤ 12900−90n = 1 − P ( √84n Forderung: 84n √ ) ≤ 0.01 = 1 − φ( 12900−90n 84n √ φ( 12900−90n ) ≥ 0.99 84n Kapitel XIV - Grenzwertsätze 18 Anwendung der Tschebyscheffschen Ungleichung Aus der Tabelle von φ liest man ab: 12900−90n √ 84n = φ−1(0.99) = 2.326 , so dass man zur quadratischen Gleichung (für √ √ n) √ −90n − 2.326 84 n + 12900 = 0 √ kommt. Die (positive) Lösung n = 11.85 liefert n = 140.42 Unter den Prämissen von a) ist deshalb n = 140 die Höchstzahl der Personen pro Gondel. Kapitel XIV - Grenzwertsätze 19 zu b) Anwendung der Tschebyscheffschen Ungleichung 1. Aus der Gleichungs- bzw. Ungleichungskette P (G(n) > 12900) = P (G(n) − 90n > 12900 − 90n) ) ≤ P (|G(n) − 90n| ≥ 12900 − 90n) 84n ≤ (12900−90n) 2 ≤ 0, 01 ergibt sich durch Gleichsetzen der beiden letzten Ausdrücke wiederum eine quadratische Gleichung. Die relevante Lösung ist n = 131, 65 und damit die Antwort n = 131. (Die rechnerisch zu ermittelnde zweite Lösung n = 156 ist irrelevant, da 90 n hierbei größer als 12900 ausfällt). Kapitel XIV - Grenzwertsätze 20 zu c) Anwendung der Tschebyscheffschen Ungleichung c) Nun ist die Varianz von G größer, nämlich: X und Y positiv korreliert mit ̺(X, Y ) = 0.9 V ar(G) = V ar(X) + V ar(Y ) + 2Cov(X, Y ) ̺(X, Y ) = Cov(X, Y ) p V ar(X)V ar(Y ) p p ⇒ Cov(X, Y ) = ̺(X, √ Y )√ V ar(X) V ar(Y ) = 0.9 80 4 √ √ V ar(G) = 80 + 4 + 2 · 0.9 · 80 · 4 = 116, 2 Kapitel XIV - Grenzwertsätze 21 Anwendung der Tschebyscheffschen Ungleichung Der Lösungsvorgang aus a) und b) bleibt im Prinzip unverändert. Die größere Varianz führt zu folgenden modifizierten (und wie zu erwarten war, kleineren) Lösungen n = 139 unter Verwendung der Normalverteilung n = 129 unter Verwendung der Tschebyscheffschen - Ungleichung. Kapitel XIV - Grenzwertsätze 22 Anmerkung zur Normalverteilungsannahme: In der Realität: G ≥ 0, d.h. P (G < 0) = 0 Bei Normalverteilungsannahme: P (G < 0) > 0 Annahme: G normalverteilt nicht korrekt aber: E(G) = 90 V ar(G) = 84 G − 90 −90 √ <√ 84 84 −90 = ϕ(−9, 8) < 10−16 = ϕ √ 84 P (G < 0) = P Kapitel XIV - Grenzwertsätze 23 Anwendung auf Fragestellung a) X= 1 n n P Yi = relative Häufigkeit i=1 (yi ∈ {0, 1}) Behauptung: n P 1 Yi konvergiert stochastisch gegen P (A), d.h. für jedes ε > 0 gilt: n i=1 lim P n→∞ ⇔ lim P n→∞ Kapitel XIV - Grenzwertsätze ! n 1 X Yi − P (A) ≥ ε = 0 n i=1 ! n 1 X Yi − P (A) < ε = 1 n i=1 24 Anwendung auf Fragestellung a) E(X) = E = 1 n 1 n n P n P i=1 Yi E(Yi) = E(1A) i=1 = 1P (1A = 1) + 0 · P (1A = 0) = P (A) Kapitel XIV - Grenzwertsätze 24 Anwendung auf Fragestellung a) P (n) ! n 1 X Yi − P (A) ≥ ε ≥ n i=1 = ⇒ relative Häufigkeit 1 n n P V ar( n1 n P i=1 ε2 1 n2 n P 1 n2 Yi) = V ar(1A) i=1 ε2 = n P V ar(Yi) i=1 1 nV ε2 (Yi unnabhängig) ar(1A) n→∞ =⇒ 0 2 ε Yi konvergiert stochastisch gegen P (A) i=1 “Bernoullis Gesetz der großen Zahlen” Kapitel XIV - Grenzwertsätze 25 Anwendung auf Fragestellung a) Bemerkung: Xk , X0 sind Funktionen: e →R X k , X0 : Ω (punktweise) Konvergenz von Funktionen: lim Xk = X0 heißt: k→∞ e gilt: Für jedes ω e∈Ω lim Xk (e ω ) = X0(e ω) k→∞ “punktweise Konvergenz” Kapitel XIV - Grenzwertsätze 26 Definition: Stochastische Konvergenz Xk , k = 1, 2, 3, . . . , Man sagt: und X0 Zufallsvariable auf einem Wahrscheinlichkeitsraum Die Folge (Xk ) konvergiert stochastisch gegen X0 wenn (für alle ε > 0) lim P (|Xn − X0| ≥ ε) = 0 x→∞ gilt. (Schreibweise: X0 = p lim Xk ) Man kann zeigen : k→∞ Aus punktweiser Konvergenz folgt stochastische Konvergenz und Umkehrung gilt nicht. Kapitel XIV - Grenzwertsätze 27 Phänomen b): Arithmetisches Mittel der Beobachtungen ≈ Erwartungswert Sei X Zufallsvariable Y1, Y2, . . . Folge von unabhängigen Wiederholungen zu X mit: n P (n) 1 Y =n Yi arithmetisches Mittel nach n Wiederholungen i=1 n n P P (n) 1 1 =n Yi E(Yi) = E(X) =E n E(Y ) i=1 i=1 n n P P (n) 1 1 V ar(Yi) = V ar(X) V ar(Y ) = V ar n = n2 Yi n i=1 Kapitel XIV - Grenzwertsätze i=1 28 Phänomen b): Tschebyscheffsche Ungleichung: P |Y Y (n) (n) V ar Y − E(X)| ≥ ε ≤ ε2 (n) = V ar(X) n→∞ → nε2 0 konvergiert stochastisch gegen E(X) “Schwaches Gesetz der großen Zahlen” Schreibweise: E(X) = p lim Y (n) n→∞ Kapitel XIV - Grenzwertsätze 29 Aber: Stochastische Konvergenz bedeutet nicht punktweise Konvergenz Beispiel: Wiederholtes Werfen eines Würfels Elementarereignis: Bei unendlichfacher Wiederholung ist die Folge ∼ ω = (ω1, ω2, . . .) mit ωi ∈ {1, 2, 3, 4, 5, 6} für i = 1, 2, 3, . . . Bernoullis “Gesetz der Großen Zahlen” bewirkt relative Häufigkeit der Augenzahlen 1,2,3,4,5,6 nach n Versuchen stochastisch (P (n)(1), . . . , P (n)(6)) =⇒ ( 16 , . . . , 16 ) Aber: z.B. relative Häufigkeit von 1,2,3,4,5,6 nach n Variablen bei der speziellen Folge (4, 4, 4, . . .) : (P (n)(1), . . . , P (n)(6)) = (0, 0, 0, 1, 0, 0) 6= (p1, . . . , p6) ⇒ keine punktweise Konvergenz der relativen Häufigkeiten Kapitel XIV - Grenzwertsätze 30 Bemerkung zur Konvergenz von Zufallsvariablen: Abschwächung der punktweisen Konvergenz: X1, X2, . . . Folge von Zufallsvariablen auf (Ω, A(Ω), P ) X0 Zufallsvariablen auf (Ω, A(Ω), P ) n o Sei ω ∈ Ω lim Xn(ω) = X0(ω) ) Teilmenge in Ω eine Wahrscheinlichkeit n→∞ derart zugeordnet: P {ω ∈ Ω| lim Xn(ω) = X0(ω)} n→∞ Im wahrscheinlichkeitstheoretischen Sinn ist es ausreichend, dass diese Wahrscheinlichkeit 1 ist, da wir dann davon ausgehen, dass dieses Ereignis sicher ist. Also nicht notwendig für alle ω ∈ Ω Kapitel XIV - Grenzwertsätze 31 Also: (Xn) konvergiert “fast sicher” (punktweise) gegen X0, falls P {ω ∈ Ω| lim Xn(ω) = X0(ω)} = 1 n→∞ ist. Kapitel XIV - Grenzwertsätze 32 Konvergenz punktweise ⇒ fast sichere ⇒ stochastische punktweise : fast sichere : stochastische Kapitel XIV - Grenzwertsätze 33 Phänomen c): Erwartung: Nach vielen Versuchen ⇒ empirische Verteilungsfunktion ≈ theoretische Verteilungsfunktion Seien X1, . . . , Xn Ergebnisse der ersten n Versuche (Realisationen von X) Empirische Verteilungsfunktion: F emp,n(α) = n1 #{i = 1, . . . , n : xi ≤ α} Versuchsergebnisse zufallsbehaftet ⇒ emp. Verteilungsfunktion zufallsbehaftet (X1, . . . Xn kann auch durch Elementarereignisse ω1, . . . , ωn beschrieben werden mit X1 = X(ω1), . . . , Xn = X(ωn)) Kapitel XIV - Grenzwertsätze 34 Sei A das Ereignis “X ≤ t”, dann gilt P (A) = P (X ≤ t) = FX (t). emp,n FX (t) - relative Häufigkeit des Eintretens von A bei n Versuchen. Also nach Bernoullis Gesetz der großen Zahlen : emp,n FX (t) ≈ P (A) = FX (t) Kapitel XIV - Grenzwertsätze 35 Genauer : mit Yi((ωj )j=1,2,3...) = 1A(ωi), 1 A tritt beim i − ten Versuch ein also Yi((ωj )j=1,2,3...) = 0 A tritt nicht ein gilt nach Bernoullis Gesetz der großen Zahlen: lim P (n) n→∞ Kapitel XIV - Grenzwertsätze ! n 1 X Yi − P (A) < ε = 1 n i=1 36 Dabei ist lim P (n) n→∞ ! n 1 X Yi − P (A) < ε) n i=1 emp,n = P IN (|FX (t) − FX (t)| < ε) mit P IN Wahrscheinlichkeitsmaß auf der Menge ΩIN der Folgen (ωi)i=1,2,.... Kapitel XIV - Grenzwertsätze 37 Eine Verschärfung ist der Hauptsatz der Statistik emp,n (α) − F (α)| < ε lim P (n) sup |FX n→∞ Kapitel XIV - Grenzwertsätze α =1 38 Eine Anwendung des Hauptsatzes der Statistik: Anpassungstests nach Kolmogoroff-Smirnow Hypothese: Es liegt eine bestimmte Wahrscheinlichkeitsverteilung mit einer Verteilungsfunktion F vor Test: Abweichung von empirischer Verteilungsfunktion bei n Versuchen größer als eine Testschranke ⇒ Ablehnung der Hypothese Kapitel XIV - Grenzwertsätze 39 weiteres Phänomen m Versuchsreihen mit jeweils n Versuchen n Messwerte bei jeder Versuchsreihe Auswertung jeder Versuchsreihe durch arithmetisches Mittel Beobachtet wird: Histogramm der arithmetischen Mittel bei vielen Versuchsreihen (und großem n) ≈ Dichtefunktion einer Normalverteilung Kapitel XIV - Grenzwertsätze 40 Beispiel Sei m = n = 1000, X ∈ Rm×n aus der Stichprobe. Berechnung der m arithmetischen Mittel Xi, i = 1, . . . , m. Gruppierung der Xi in ca. 70 Klassen (werteabhängig). Berechnung des Gesamtmittels: m 1 X Xi X= m i=1 und der mittleren quadratischen Abweichung m 1 X V = (xi − x)2. m i=1 Kapitel XIV - Grenzwertsätze 41 Histogramm der Stichprobenmittel Xi im Vergleich zur Dichte von N (X, V ) Kapitel XIV - Grenzwertsätze 42 Betrachtung einer Versuchsreihe Ausgangspunkt: Xi ZV des i-ten Versuchs, i = 1, . . . , n. Angenommen Xi normalverteilt mit µi und σi also X1, . . . , Xn unabhängig N (µi, σi2)- verteilt n P Xi 2 ist N (µ, σ )- verteilt mit µ = n P i=1 i=1 n n P P Xi − µi i=1s i=1 N (0, 1)-verteilt. ⇒ n P σ2 i=1 2 µi , σ = n P i=1 σi2 i Kapitel XIV - Grenzwertsätze 43 Die Verteilungsfunktion von n P n P Xi − µi Zn = i=1 s i=1 n P σi2 i=1 konvergiert gegen die Verteilungsfunktion der Standardnormalverteilung. lim FZn (t) = Φ(t) = n→∞ Zt −∞ Kapitel XIV - Grenzwertsätze 1 − x2 √ e 2 dx 2π 44 Dies gilt beim Grenzübergang n → ∞ auch allgemeiner: Seien X1, . . . , Xn,. . . unabhängig mit existierenden Erwartungswerten µi und Varianzen σi2 (ohne die Voraussetzung der Normalverteilung) und erfüllen Lindeberg-Bedingung (siehe nächste Seite). Dann gilt der zentrale Grenzwertsatz (Satz 14.9) Kapitel XIV - Grenzwertsätze 45 Anmerkung: Lindeberg-Bedinung (speziell: n = rn) Seien µi = E(Xi) und σi2 = V ar(Xi) < ∞, i = 1, . . . , n, Sn := x1 + . . . + xn 2 und sei σ(n) = σ12 + . . . + σn2 dann gilt, falls lim n→∞ n 1 X 2 σ(n) k=1 E((Xk − µk )2) · 1{|Xk −µk |>ǫσ(n)} = 0 für ǫ > 0 beliebig, Sn−E[Sn] √ Kapitel XIV - Grenzwertsätze V (Sn) d −→ N (0, 1) 46 Spezialfall des Satz 14.9: Zentralen Grenzwertsatzes Lindeberg-Bedingung ist erfüllt, wenn X1, . . . , Xn,. . . unabhängig identischverteilt mit Erwartungswert µ0 und Varianz σ 2. Dann ist zu gegebenem n mit µ = nµ0 , σ 2 = nσ02, n P Xi − nµ0 Zn = i=1 √ = nσ0 und 1 n n P i=1 Xi − µ0 σ0 √ n lim FZn (t) = Φ(t) n→∞ d.h. das arithmetische Mittel ist näherungsweise normalverteilt mit µ0 und Kapitel XIV - Grenzwertsätze σ2 n. 47 Anwendungen: n P Y = Xi, X1, . . . , Xn unabhängig i=1 ⇒ Y näherungsweise normalverteilt. Begründung dafür, bei Anwendungen in der Praxis bei Beobachtungen einer Zufallsvariable von einer normalverteilten Zufallsvariablen auszugehen: Messwert wird beeinflusst von vielen unabhängigen Faktoren, z.B. Messfehler, Luftfeuchtigkeit, Temperatur, Erschütterungen, Spannungsschwankungen, . . . ⇒ Abweichungen von einem mittleren Wert ist Summe vieler zufälliger Größen ⇒ Abweichung unterliegt zumindest näherungsweise einer Normalverteilung Kapitel XIV - Grenzwertsätze 48 Anwendungen: 1. Näherung der Binomialverteilung durch die Normalverteilung Binomialverteilung B(n, p) mit Erwartungswert : np Varianz np(1 − p) Sei Y B(n, p)-verteilt, dann Y = X1 + . . . + Xn mit: Xi unabhängig und Bernoulliverteilt mit Parameter p. Zentraler Grenzwertsatz: n groß ⇒ Y näherungsweise, N (np, np(1 − p))- verteilt. Kapitel XIV - Grenzwertsätze 49 Gesucht: P (Y ≤ y) P (Y ≤ y) = P Damit Y − np y − np p ≤p np(1 − p) np(1 − p) ! ≈Φ P Y − np Xi − np p =p np · (1 − p) np · (1 − p) ist näherungsweise standardnormalverteilt, d.h. P Kapitel XIV - Grenzwertsätze p Y − np np · (1 − p) ! ≤x p y − np np(1 − p) ! ≈ Φ(x) 50 bzw. mit x = √ y−np np·(1−p) Y − np y − np p ≤p ⇐⇒ Y ≤ y np(1 − p) np(1 − p) P (Y ≤ y) ≈ Φ Kapitel XIV - Grenzwertsätze p y − np np · (1 − p) ! für alle y ∈ R ⊛ 51 Y diskret mit Werten 0, 1, 2, 3, . . . , n ⇒ y = k mit k = 0, 1, 2, . . . , n linke Seite von ⊛ ändert sich nur bei ganzzahligem y (= k) Bessere Annäherung: k X m=0 1 2 P (Y = m) = P (Y ≤ k) ≈ Φ ist Stetigkeitskorrektur. Kapitel XIV - Grenzwertsätze 1 2 k + − np p np · (1 − p) ! 52 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 20 25 30 35 P P (Y = m) kumulierte Binomialverteilung für n=30 P (Y ≤ k) = k m=0 Kapitel XIV - Grenzwertsätze 53 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 10 20 30 40 50 60 70 80 90 100 P P (Y = m) kumulierte Binomialverteilung für n=100 P (Y ≤ k) = k m=0 Kapitel XIV - Grenzwertsätze 53 Anwendungen: 2. Erzeugung von Zufallszahlen zur Normalverteilung. Tabellen von Zufallszahlen und computererzeugte Zufallszahlen sind Zufallszahlen zur Gleichverteilung auf [0, 1] Erwartungswert 1 2 Varianz 1 12 Kapitel XIV - Grenzwertsätze 54 Xi 12 P unabhängig, identisch gleichverteilt auf [0, 1] Xi (−6) hat Erwartungswert 6 (0) i=1 und Varianz 1 und ist näherungsweise normalverteilt. Je 12 Zufallszahlen zur Gleichverteilung auf [0,1] werden addiert und von der Summe die Zahl 6 abgezogen. Kapitel XIV - Grenzwertsätze 55 Daraus: Zufallszahlen zur Normalverteilung mit Mittelwert µ und Varianz σ 2: z dann Zufallszahl zu N (0, 1) µ + σz Kapitel XIV - Grenzwertsätze Zufallszahl zu N (µ, σ 2) . 56