Verteilungen eindimensionaler stetiger Zufallsvariablen • Einführung • Stetige Verteilungen ¾Stetige Gleichverteilung ¾Exponentialverteilung ¾Normalverteilung Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 1 Zufallsvariablen IV Bibliografie: ¾ Prof. Dr. Kück Universität Rostock Statistik, Vorlesungsskript, Abschnitt 5.3 ¾ Bleymüller / Gehlert Verlag Vahlen 2003 Statistische Formeln, Tabellen und Programme ¾ Bleymüller / Gehlert / Gülicher Verlag Vahlen 2004 Statistik für Wirtschaftswissenschaftler ¾ Hartung Oldenbourg Verlag 2002 Statistik Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 2 Zufallsvariablen IV 1 Einführung Wir übertragen jetzt das Gedankengut aus den vorigen Vorlesungen auf den Fall, dass die Zufallsvariable X eine Größe ist, deren Realisierung jede reelle Zahl in einem Intervall sein kann. Beispiele: • Angabe des Alters von befragten Personen • Durchmesser der Bohrungen in Werkstücken • Zeitaufwand für den Bearbeitungsvorgang an einem Werkstück Anmerkung: Die Entscheidung, ob eine stetige oder diskrete Zufallsvariable zu wählen ist, liegt mitunter nicht in der Natur des betrachteten Merkmals, sondern hängt von der Absicht ab, wie dieses Merkmal behandelt werden soll. So kann z.B. die Verteilung von Personenmerkmalen wie Alter oder Körpergröße sowohl durch eine stetige, als auch durch eine diskrete Zufallsvariable dargestellt werden. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 3 Zufallsvariablen IV Einführung Die Verteilungsfunktion hat folgende Eigenschaften: • 0 ≤ F(x) ≤ 1 • F(x) ist eine monoton wachsende Funktion, hat also die Eigenschaft F(x2) ≥ F(x1) für x2 ≥ x1 • Der Grenzwert für x → - ∞ ist 0. • Der Grenzwert für x → ∞ ist 1. Zu einer gegebenen Verteilungsfunktion erhält man die Dichtefunktion (oder kurz: Dichte), indem man die erste Ableitung der Verteilungsfunktion bestimmt: f (x) = Prof. Kück / S. Winterfeldt Lehrstuhl Statistik dF ( x ) dx 4 Zufallsvariablen IV 2 Einführung Die Dichtefunktion einer stetigen Zufallsvariablen X entspricht der Wahrscheinlichkeitsfunktion einer diskreten Zufallsvariablen. Sie besitzt folgende Eigenschaften: +∞ f (x) ≥ 0 für alle x und ∫ f (x)dx = 1 −∞ Die Verteilungsfunktion lässt sich als Integral über die Dichte darstellen: x F(x) = W (X ≤ x) = ∫ f ( v ) dv −∞ Die Integration im stetigen Fall entspricht der Summation bei einer diskreten Zufallsvariablen. Der Wert des Integrals lässt sich als Fläche zwischen der Dichtefunktion und der Abszisse in den angegebenen Integrationsgrenzen interpretieren. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 5 Zufallsvariablen IV Einführung Interessieren wir uns für die Wahrscheinlichkeit, dass eine stetige Zufallsvariable einen Wert im Intervall [a,b] annimmt, so wird diese als Fläche unter der Dichtefunktion zwischen a und b berechnet. Im Unterschied zum diskreten Fall ist es jetzt unerheblich, ob die Intervallgrenzen zum Intervall gehören oder nicht, da die Integration über einen Punkt den Wert 0 hat. b W(a < X < b ) = W(a ≤ X ≤ b ) = ∫ f ( x )dx = F(b ) − F(a ) a Der letzte Term der Gleichung [=>F(b)-F(a)] zeigt, dass wir bei der Berechnung der Wahrscheinlichkeit ohne Integrieren auskommen, wenn uns die Verteilungsfunktion zur Verfügung steht. Für die gängigen stetigen Verteilungen liegen die Werte der Verteilungsfunktionen tabelliert vor. Auf den Gebrauch der entsprechenden Tabellen gehen wir u.a. in den Übungen ein. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 6 Zufallsvariablen IV 3 Einführung Häufig interessiert man sich auch für die Umkehrfunktion der Verteilungsfunktion, die so genannten Quantile: Es wird zu einer vorgegebenen Wahrscheinlichkeit p (0<p<1) der Wert xp gesucht, so dass W(X<xp) = F(xp) = p gilt. xp heißt dann das p-Quantil der Verteilung der Zufallsvariablen X. Die Quantile liegen (insbesondere für Prüfverteilungen) ebenfalls tabelliert vor. Die Maßzahlen (Parameter) zur näheren Bestimmung der stetigen Verteilungen ergeben sich – in Analogie zu den diskreten Verteilungen – wie folgt: +∞ Erwartungswert: E( X ) = ∫ x ⋅ f (x)dx −∞ Varianz: Var ( X ) = +∞ +∞ −∞ −∞ 2 2 2 ∫ [x − E ( X )] ⋅ f ( x )dx = ∫ x ⋅ f ( x )dx − [E ( X )] Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 7 Zufallsvariablen IV Stetige Verteilungen Wir werden uns nun mit einigen stetigen Verteilungen befassen und diese in der folgenden Reihung behandeln: • • • • • • Stetige Gleichverteilung Exponentialverteilung Normalverteilung Chi-Quadrat-Verteilung Studentverteilung F-Verteilung Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 8 Zufallsvariablen IV 4 Stetige Gleichverteilung Ausgehend von der diskreten Gleichverteilung mit n gleichwahrscheinlichen Alternativen kommt man für n → ∞ zur stetigen Gleichverteilung, d.h. für eine gleichverteilte stetige Zufallsgröße X ist jeder Wert aus einem Intervall [a,b], a<b, gleichwahrscheinlich. Dichtefunktion: ⎧1 /(a − b ) für a ≤ x ≤ b fG ( x) = ⎨ sonst ⎩ 0 0 für x<a ⎧ ⎪ Verteilungsfunktion: FG ( x ) = ⎨( x − a ) /(b − a ) für a ≤ x ≤ b ⎪ 1 für x>b ⎩ Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 9 Zufallsvariablen IV Stetige Gleichverteilung 1 Erwartungswert: E( X) = (a + b ) 2 Varianz: Var( X) = 1 (b − a ) 2 12 Beispiel: An einem Marathon nehmen 13000 Läufer teil. Platz 6000 erreicht das Ziel nach 3:54:50 h, Platz 7000 nach 4:01:30 h. Unter der Annahme, dass die Zielankünfte in der Mitte des Läuferfelds (zwischen Platz 6000 und 7000) gleichverteilt sind, gebe man Dichtefunktion, Erwartungswert und Varianz der Zielankünfte in der Gruppe der 6000er-Platzierungen an und berechne die Wahrscheinlichkeit, dass ein Läufer dieser Gruppe nach weniger als vier Stunden ins Ziel kommt. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 10 Zufallsvariablen IV 5 Stetige Gleichverteilung Lösung: b = 4:01:30 h = 14490 s und a = 3:54:50 h = 14090 s fG(x) = 1/(b-a) = 1/(14490 s-14090 s) = 1/(400 s) = 0,0025 s-1 für 3:54:50 h ≤ x ≤ 4:01:30 h; sonst 0 E(X) = (a+b)/2 = (14490 s+14090 s)/2 = 14290 s = 3:58:10 h Var(X) = (14490 s-14090 s)2/12 = (400s)2/12 = 13333,33 s2 W(3:54:50 h≤X<4:00:00 h) = 0,0025 s-1 · (14400 s-14090 s) = 0,0025 · 310 = 0,775 Interpretation: 77,5 % der Zielankünfte (Platz 6000 bis Platz 6774) in der Gruppe der 6000er-Platzierungen erfolgen unter der Annahme der Gleichverteilung nach weniger als vier Stunden. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 11 Zufallsvariablen IV Stetige Gleichverteilung Grafische Darstellungen: Dichtefunktion Verteilungsfunktion 0,0035 1,2 f(x) 0,003 F(x) 1 0,0025 0,8 0,002 0,6 0,0015 0,4 0,001 0,2 0,0005 0 14000 14200 14400 14600 14200 14400 14600 x x Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 0 14000 12 Zufallsvariablen IV 6 Stetige Gleichverteilung ⇒ Annahmen über Gleichverteilung innerhalb der Klassen von Daten, die einer Klassierung unterzogen wurden, sind mit Vorsicht zu treffen. (Wir haben im 4. Abschnitt bei der Quantilsbestimmung für klassiertes Datenmaterial bereits darauf hingewiesen.) Insbesondere für breite dünnbesetzte Klassen treffen derartige Annahmen in der Regel nicht zu. ⇒ Offene Randklassen sind niemals gleichverteilt besetzt. Sie beziehen sich auf Intervalle, die nach oben oder nach unten unbeschränkt sind, z.B. [a,∞[ oder ]-∞,b[ . Eine Unterstellung der Gleichverteilung führt hier in jedem Fall zu einer Dichtefunktion mit dem konstanten Wert 0, z.B. fG(x)=1/(∞-a)= 0. Eine Dichte von 0 ergibt keinen Sinn, u.a. weil die als Fläche zwischen Dichtefunktion und Abszisse definierte Verteilungsfunktion den Wert 1 nicht erreichen kann. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 13 Zufallsvariablen IV Exponentialverteilung Eine stetige Zufallsvariable X ist exponentialverteilt mit dem Parameter λ > 0, wenn sie folgende Dichtefunktion besitzt: ⎧ 0 f E (x) = ⎨ − λx ⎩λ ⋅ e für x < 0 für x ≥ 0 Durch Integration gelangt man zu folgender Verteilungsfunktion: ⎧ 0 FE ( x ) = ⎨ − λx ⎩1 − e für x < 0 für x ≥ 0 In Analogie zur diskreten Poissonverteilung kommt die Exponentialverteilung mit nur einem Parameter (λ) aus. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 14 Zufallsvariablen IV 7 Exponentialverteilung Erwartungswert und Varianz ergeben sich zu: E( X) = 1 λ und Var( X) = 1 λ2 Durch die Exponentialverteilung lassen sich folgende Prozesse gut beschreiben: ⇒ Dauer von Telefongesprächen ⇒ Abstand der Kundenankünfte an einem Bankschalter ⇒ Lebensdauer von Glühlampen oder Aggregaten Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 15 Zufallsvariablen IV Exponentialverteilung Aus den Anwendungsfällen für Exponentialverteilung und Poissonverteilung lässt sich erkennen, dass es zwischen beiden Verteilungen Zusammenhänge gibt. - Diese zeigen sich u.a. bei der Berechnung von Erwartungswerten: Ist die Anzahl von Telefonaten pro Zeiteinheit poissonverteilt mit einem Erwartungswert von µP=12 Anrufen pro Stunde, dann sind die Abstände zwischen zwei Anrufen exponentialverteilt mit dem Parameter λE = µP = 12h-1. Der zu erwartende Abstand zwischen zwei Anrufen ist dann EE(X) = 1/ λE = 1/(12h-1) = 0,833 h = 5 Minuten. Anmerkung: Die Exponentialverteilung ist ein Spezialfall der Gammabzw. Erlang-Verteilung und auch der Weibull-Verteilung, die Prozesse in Warteschlangenmodellen beschreiben. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 16 Zufallsvariablen IV 8 Exponentialverteilung „Gedächtnislosigkeit“ der Exponentialverteilung: Die bedingte Überlebenswahrscheinlichkeit (hier: p(x)) bezeichnet die Dichte einer Zufallsverteilung zum Zeitpunkt x = t unter der Bedingung, dass das Zufallsereignis bis zum Zeitpunkt t noch nicht eingetreten ist: p(x) = f(x)/(1-F(x)) Die Anwendung auf die Exponentialverteilung (mit x=t) führt zu: pE(t) pE(t) = fE(t)/(1-FE(t)) = λ·e-λ·t/(1-(1-e-λ·t)) = λ·e-λ·t/e-λ·t → pE(t)=λ= konstant Bleibt die bedingte Überlebenswahrscheinlichkeit über die Zeit konstant, muss auch die bedingte Lebenserwartung (der Erwartungswert) über die Zeit konstant sein: EE(X|X>t) Prof. Kück / S. Winterfeldt Lehrstuhl Statistik = 1/λ = konstant für alle t 17 Zufallsvariablen IV Exponentialverteilung „Gedächtnislosigkeit“ der Exponentialverteilung: Für verschiedene Anwendungen bedeutet das: ⇒ Wenn eine Glühbirne mit einer erwarteten Lebensdauer von drei Jahren bereits zwei Jahre funktioniert hat, beträgt die zu erwartende Restlebensdauer immer noch drei Jahre. ⇒ Ist in einer Telefonzentrale, in der durchschnittlich alle fünf Minuten ein Anruf erfolgt, seit drei Minuten kein Anruf mehr eingegangen, beträgt die zu erwartende Restzeit bis zum nächsten Anruf nach wie vor fünf Minuten. ⇒ Ist an einem Bankschalter, an dem mit einer Wahrscheinlichkeit von 0,30 in der ersten Minute nach dem Erscheinen des letzten Kunden ein weiterer Kunde auftaucht, sechs Minuten nach dem Erscheinen des letzten Kunden kein zweiter Kunde angekommen, so beträgt die bedingte Wahrscheinlichkeit für die Ankunft eines Kunden in der siebten Minute immer noch 0,30. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 18 Zufallsvariablen IV 9 Exponentialverteilung Asymmetrie der Exponentialverteilung: Bei einer symmetrischen Verteilung liegen die Werte je zur Hälfte links und rechts des Erwartungswerts: W(X<E(X)) = F(E(X)) = 0,5 = 1-F(E(X)) = W(X>E(X)) Für die Exponentialverteilung gilt: W(X<E(X)) = F(E(X)) = F(1/λ) = 1-e-λ·(1/ λ) = 1-e-1 = 0,6321 ⇒ 63,21% der Werte einer Exponentialverteilung liegen links von E(X). Sie ist eine asymmetrische Verteilung. ⇒ Da mehr als die Hälfte der Werte links des Erwartungswerts liegt, ist die Verteilung linkssteil bzw. rechtsschief. ⇒ Die Rechtsschiefe der Exponentialverteilung ist unabhängig von der Größe des Parameters λ. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 19 Zufallsvariablen IV Exponentialverteilung Beispiel: a) b) c) d) e) Die Reparaturzeit von Maschinen eines bestimmten Typs sei eine exponentialverteilte Zufallsgröße mit dem Parameter λ = 0,25 h-1. Welche der folgenden Aussagen sind zutreffend? Die zu erwartende Reparaturzeit einer zufällig ausgewählten Maschine beträgt 4 h. Die Wahrscheinlichkeit, dass die Reparaturzeit über dem Erwartungswert für die Reparaturzeit liegt, ist unabhängig vom Parameter λ. Mehr als 50 % der Reparaturen dauern länger als 3 Stunden. Nach höchstens sechs Stunden ist die Reparatur der Maschine mit 90 % Sicherheit beendet. Die Reparaturdauer von etwa 2 h ist fast dreimal so häufig wie die Reparaturdauer von etwa 6 h. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 20 Zufallsvariablen IV 10 Exponentialverteilung Lösung: a) E(X) = 1/ λ = 1/(0,25 h-1) = 4 h. => Richtig. b) W(X>E(X)) = 1-W(X ≤E(X)) = 1-FE(E(X)) = 1-FE(1/ λ) = 1-(1-e– λ•(1/ λ)) = 1-(1-e–1) = e–1 = 0,3679 => Richtig, unabhängig vom Wert λ dauert eine Reparatur in etwa 37 % aller Fälle länger als zu erwarten ist. c) W(X>3) = 1-W(X≤ 3) = 1-FE(3) = 1-(1-e–0,25•3) = e–0,75 = 0,472 => Falsch, über 3 h nehmen nur 47 % der Reparaturen in Anspruch, d.h. auch 53 % der Reparaturen sind in weniger als 3 h erledigt. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 21 Zufallsvariablen IV Exponentialverteilung Lösung (Fortsetzung): d) W(X≤x) =0,9 =1-e–0,25•x => e–0,25•x =0,1 oder: => ln(0,1) =–0,25•x => x =9,21 W(X≤6) = FE(6) = 1-e–0,25•6 = 1-e–1,5 = 1-0,223 = 0,777 => Falsch, mit 90 % Sicherheit ist einer Reparatur erst nach 9,21 h erledigt, nach 6 h sind nur 77,7 % aller Reparaturen erledigt. e) fE(2) =0,25·e–0,25•2 =0,152 fE(6) =0,25·e–0,25•6 =0,056 => Richtig, denn 0,152 < 3·0,056. (Die Dichtefunktion gibt aber nicht an, mit welcher Wahrscheinlichkeit die Reparatur genau t Stunden dauert!) Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 22 Zufallsvariablen IV 11 Exponentialverteilung Die grafischen Darstellungen zeigen u.a. die Asymmetrie (genauer: die Rechtsschiefe) der exponentialverteilten Dichtefunktion. Verteilungsfunktion (Lambda=0,25) Dichtefunktion (Lambda=0,25) f(x) 0,3 1,2 0,25 F(x) 1 0,2 0,8 0,15 0,6 0,1 0,4 0,05 0,2 0 0 0 5 10 15 0 20 5 10 15 Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 20 x x 23 Zufallsvariablen IV Normalverteilung Eine stetige Zufallsvariable X heißt normalverteilt, wenn sie folgende Dichtefunktion besitzt: − 1 fn (x) = ⋅e σ⋅ 2⋅π ( x −µ ) 2 2⋅σ 2 (σ>0) Die Dichtefunktion ist glockenförmig symmetrisch, nimmt für x=µ ihr Maximum an und hat an den Stellen x=µ-σ und x=µ+σ Wendenpunkte. Die Kurve wird mit wachsendem Parameter σ² immer flacher. Der Parameter µ hat die Rolle eines Lageparameters und σ² die Rolle eines Skalen- oder Streuungsparameters. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 24 Zufallsvariablen IV 12 Normalverteilung Die Verteilungsfunktion der Normalverteilung lautet: 2 x − 1 ⋅e Fn ( x ) = ∫ −∞ σ ⋅ 2 ⋅ π (ν − µ ) 2⋅σ 2 dν Ihr Wendepunkt liegt bei x=µ. Erwartungswert und Varianz: E( X) = µ und Var( X) = σ 2 Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 25 Zufallsvariablen IV Normalverteilung Von besonderer Bedeutung ist die Normalverteilung, weil viele Verteilungen unter gewissen Voraussetzungen durch die Normalverteilung näherungsweise beschrieben (approximiert) werden können. Da die Berechnung der Werte der Dichte- bzw. Verteilungsfunktion der Normalverteilung nicht trivial ist, spielt als Spezialfall der Normalverteilung mit µ=0 und σ²=1 die Standardnormalverteilung eine große Rolle. Die Funktionswerte der Standardnormalverteilung sind tabelliert oder werden von Computern und guten Taschenrechnern durch Näherungsformeln berechnet. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 26 Zufallsvariablen IV 13 Normalverteilung Der Zusammenhang zwischen einer normalverteilten Zufallsgröße X mit den Parametern µ und σ² und der dazugehörigen standardnormalverteilten Zufallsgröße Z ist einfach hergestellt: E(X)=µ => E(X-µ)=0 => E((X-µ)/σ)=0 und: Var(X)=σ² => Var(X-µ)=σ² => Var((X-µ)/σ)=1 Prof. Kück / S. Winterfeldt Lehrstuhl Statistik X−µ σ Z= Transformation: 27 Zufallsvariablen IV Normalverteilung Dichte und Verteilungsfunktion: fN (z) = 1 − 1 ⋅z 2 ⋅e 2 2⋅π z FN ( z ) = ∫ −∞ 1 − 1 ⋅ν 2 ⋅ e 2 dν 2⋅ π Die symmetrischen Eigenschaften der Dichte und Verteilungsfunktion ausnutzend, liegen die Werte nur für positive Argumente vor. (Bleymüller/Gehlert, Formelsammlung) Mit den Formeln fN(-z)=fN(z) und FN(-z)=1-FN(z) lassen sich die nicht tabellierten Werte einfach ermitteln. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 28 Zufallsvariablen IV 14 Normalverteilung Grafische Darstellungen: Verteilungsfunktion (µ=0 und Sigma²=1) Dichtefunktion (µ=0 und Sigma²=1) 1,2 0,45 f(x) 0,4 F(x) 1 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 0,8 0,6 0,4 0,2 0 -4 -2 0 2 4 -4 -2 x Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 0 2 4 x 29 Zufallsvariablen IV Normalverteilung Beispiel: In einer Klinik kommen in einem bestimmten Monat 80 Säuglinge zur Welt. Unter der Annahme, dass der Anteil weiblicher Geburten an allen Geburten langfristig bei 0,49 liegt, berechne man die Wahrscheinlichkeit dafür, dass sich unter den 80 Säuglingen 35 bis 40 Mädchen befinden. Lösung: Es handelt sich um eine Binomialverteilung, die wegen n·θ·(1-θ) =80·0,49·(1-0,49) =19,992 ≥9 durch eine Normalverteilung approximiert werden kann. Hierbei sind: µ=n·θ=80·0,49= 39,2 und σ²=n·θ·(1-θ)= 19,992. Wahrscheinlichkeit nach Normalverteilung: W(x1< X< x2) = Fn(x2|µ|σ²) – Fn(x1|µ|σ²) W(34,5< X<40,5) = Fn(40,5|39,2|19,992) – Fn(34,5|39,2|19,992) Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 30 Zufallsvariablen IV 15 Normalverteilung Lösung (Fortsetzung): Umrechnung in die Standardnormalverteilung: z1 = (x1–µ)/σ = (34,5–39,2)/19,9920,5 = (-4,7)/4,471 = -1,051 z2 = (x2–µ)/σ = (40,5–39,2)/19,9920,5 = (1,3)/4,471 = 0,291 Wahrscheinlichkeit nach Standardnormalverteilung: W(x1< X< x2) = FN(z2) – FN(z1) Da z1 negativ ist, formen wir um zu: W(x1< X< x2) = FN(z2) – (1–FN(-z1)) W(x1< X< x2) = FN(z2) + FN(-z1) – 1 W(x1< X< x2) = FN(0,291) + FN(1,051) – 1 W(x1< X< x2) = 0,6145 + 0,8534 – 1 = 0,4679 ⇒ Die Wahrscheinlichkeit, dass sich unter den 80 im Verlauf eines Monats geborenen Säuglingen 35 bis 40 Mädchen befinden, liegt bei ca. 47 %. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 31 Zufallsvariablen IV Normalverteilung Beispiel: Wie groß ist der Anteil der Realisierungen einer normalverteilten Zufallsgröße in den Intervallen [µ-i·σ, µ+i·σ] für i =1, 2, 3? Lösung: i=1: W(µ-σ<X<µ+σ) = W(-1<Z<1) = Fn(µ+σ)–Fn(µ-σ) = FN(1)–FN(-1) = FN(1)–(1–FN(1)) = 2·FN(1)–1 = 2·0,8413–1 = 0,6827 i=2: W(µ–2·σ<X<µ+2·σ) = W(-2<Z<2) = Fn(µ+2·σ)–Fn(µ–2·σ) = FN(2)–FN(-2) = 2·FN(2)–1 = 2·0,9772–1 = 0,9545 i=3: W(µ–3·σ<X<µ+3·σ) = W(-3<Z<3) = Fn(µ+3·σ)–Fn(µ–3·σ) = FN(3)–FN(-3) = 2·FN(3)–1 = 2·0,9987–1 = 0,9973 Im einfachen σ-Bereich um den Erwartungswert liegen mehr als 68 %, im doppelten σ-Bereich mehr als 95 % und im dreifachen σ-Bereich fast alle möglichen Realisierungen einer normalverteilten Zufallsvariablen (=> „3-σ-Regel“). Dies gilt unabhängig von den beiden Parametern der Normalverteilung. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 32 Zufallsvariablen IV 16 Normalverteilung Beispiel: Aus einer normalverteilten Grundgesamtheit mit Erwartungswert µ= 500 und Varianz σ²= 200 werden Stichproben mit Zurücklegen vom Umfang n= 50 gezogen. Geben Sie die Parameter der Verteilungs- und Dichtefunktion für den einfachen arithmetischen Stichprobenmittelwert an. Mit welcher Wahrscheinlichkeit ist der Stichprobenmittelwert mindestens 499 und höchstens 505? Lösung: Xi seien Zufallsvariable, die unabhängig und identisch normalverteilt sind mit den Parametern µ=500 und σ²=200. Der mit der Vorschrift X= n 1 n ⋅ ∑ Xi gebildete Stichprobenmittelwert ist dann ebenfalls i =1 normalverteilt mit den Parametern E(X) = µ und Var (X) = σ²/n =200/50 = 4 = 2². Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 33 Zufallsvariablen IV Normalverteilung Lösung (Fortsetzung): Im Beispiel wurde die Stichprobe mit Zurücklegen gezogen. Beim Ziehen ohne Zurücklegen – insbesondere bei einem größeren Stichprobenanteil – ist für die Varianz ein Korrekturfaktor (≤ 1) zu berücksichtigen. W(499 ≤ X ≤ 505) = W((499-500)/2 ≤ (X–500)/2 ≤ (505-500)/2) = W(-0,5 ≤ Z ≤ 2,5) = FN(2,5)–FN(-0,5) = FN(2,5)–1+FN(0,5) = 0,9938–1+0,6915 = 0,6853 Mit der Wahrscheinlichkeit von 0,6853 liegt der Stichprobenmittelwert im gefragten Wertebereich. Prof. Kück / S. Winterfeldt Lehrstuhl Statistik 34 Zufallsvariablen IV 17