x(f

Werbung
Verteilungen eindimensionaler
stetiger Zufallsvariablen
• Einführung
• Stetige Verteilungen
¾Stetige Gleichverteilung
¾Exponentialverteilung
¾Normalverteilung
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
1
Zufallsvariablen IV
Bibliografie:
¾ Prof. Dr. Kück
Universität Rostock
Statistik, Vorlesungsskript, Abschnitt 5.3
¾ Bleymüller / Gehlert
Verlag Vahlen 2003
Statistische Formeln, Tabellen und Programme
¾ Bleymüller / Gehlert / Gülicher
Verlag Vahlen 2004
Statistik für Wirtschaftswissenschaftler
¾ Hartung
Oldenbourg Verlag 2002
Statistik
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
2
Zufallsvariablen IV
1
Einführung
Wir übertragen jetzt das Gedankengut aus den vorigen
Vorlesungen auf den Fall, dass die Zufallsvariable X eine Größe
ist, deren Realisierung jede reelle Zahl in einem Intervall sein
kann.
Beispiele:
• Angabe des Alters von befragten Personen
• Durchmesser der Bohrungen in Werkstücken
• Zeitaufwand für den Bearbeitungsvorgang an einem Werkstück
Anmerkung:
Die Entscheidung, ob eine stetige oder diskrete Zufallsvariable zu
wählen ist, liegt mitunter nicht in der Natur des betrachteten
Merkmals, sondern hängt von der Absicht ab, wie dieses Merkmal
behandelt werden soll. So kann z.B. die Verteilung von
Personenmerkmalen wie Alter oder Körpergröße sowohl durch eine
stetige, als auch durch eine diskrete Zufallsvariable dargestellt werden.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
3
Zufallsvariablen IV
Einführung
Die Verteilungsfunktion hat folgende Eigenschaften:
• 0 ≤ F(x) ≤ 1
• F(x) ist eine monoton wachsende Funktion, hat also die
Eigenschaft F(x2) ≥ F(x1) für x2 ≥ x1
• Der Grenzwert für x → - ∞ ist 0.
• Der Grenzwert für x → ∞ ist 1.
Zu einer gegebenen Verteilungsfunktion erhält man die
Dichtefunktion (oder kurz: Dichte), indem man die erste
Ableitung der Verteilungsfunktion bestimmt:
f (x) =
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
dF ( x )
dx
4
Zufallsvariablen IV
2
Einführung
Die Dichtefunktion einer stetigen Zufallsvariablen X
entspricht der Wahrscheinlichkeitsfunktion einer diskreten
Zufallsvariablen. Sie besitzt folgende Eigenschaften:
+∞
f (x) ≥ 0
für alle x
und
∫ f (x)dx = 1
−∞
Die Verteilungsfunktion lässt sich als Integral über die
Dichte darstellen:
x
F(x) = W (X ≤ x) =
∫ f ( v ) dv
−∞
Die Integration im stetigen Fall entspricht der Summation bei
einer diskreten Zufallsvariablen. Der Wert des Integrals lässt
sich als Fläche zwischen der Dichtefunktion und der Abszisse in
den angegebenen Integrationsgrenzen interpretieren.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
5
Zufallsvariablen IV
Einführung
Interessieren wir uns für die Wahrscheinlichkeit, dass eine
stetige Zufallsvariable einen Wert im Intervall [a,b] annimmt,
so wird diese als Fläche unter der Dichtefunktion zwischen a
und b berechnet. Im Unterschied zum diskreten Fall ist es jetzt
unerheblich, ob die Intervallgrenzen zum Intervall gehören oder
nicht, da die Integration über einen Punkt den Wert 0 hat.
b
W(a < X < b ) = W(a ≤ X ≤ b ) = ∫ f ( x )dx = F(b ) − F(a )
a
Der letzte Term der Gleichung [=>F(b)-F(a)] zeigt, dass wir bei
der Berechnung der Wahrscheinlichkeit ohne Integrieren
auskommen, wenn uns die Verteilungsfunktion zur Verfügung
steht. Für die gängigen stetigen Verteilungen liegen die Werte
der Verteilungsfunktionen tabelliert vor. Auf den Gebrauch der
entsprechenden Tabellen gehen wir u.a. in den Übungen ein.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
6
Zufallsvariablen IV
3
Einführung
Häufig interessiert man sich auch für die Umkehrfunktion der
Verteilungsfunktion, die so genannten Quantile: Es wird zu einer
vorgegebenen Wahrscheinlichkeit p (0<p<1) der Wert xp gesucht,
so dass W(X<xp) = F(xp) = p gilt. xp heißt dann das p-Quantil der
Verteilung der Zufallsvariablen X. Die Quantile liegen
(insbesondere für Prüfverteilungen) ebenfalls tabelliert vor.
Die Maßzahlen (Parameter) zur näheren Bestimmung der
stetigen Verteilungen ergeben sich – in Analogie zu den diskreten
Verteilungen – wie folgt:
+∞
Erwartungswert:
E( X ) =
∫ x ⋅ f (x)dx
−∞
Varianz:
Var ( X ) =
+∞
+∞
−∞
−∞
2
2
2
∫ [x − E ( X )] ⋅ f ( x )dx = ∫ x ⋅ f ( x )dx − [E ( X )]
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
7
Zufallsvariablen IV
Stetige Verteilungen
Wir werden uns nun mit einigen stetigen Verteilungen
befassen und diese in der folgenden Reihung
behandeln:
•
•
•
•
•
•
Stetige Gleichverteilung
Exponentialverteilung
Normalverteilung
Chi-Quadrat-Verteilung
Studentverteilung
F-Verteilung
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
8
Zufallsvariablen IV
4
Stetige Gleichverteilung
Ausgehend von der diskreten Gleichverteilung mit n
gleichwahrscheinlichen Alternativen kommt man für
n → ∞ zur stetigen Gleichverteilung, d.h. für eine
gleichverteilte stetige Zufallsgröße X ist jeder Wert aus
einem Intervall [a,b], a<b, gleichwahrscheinlich.
Dichtefunktion:
⎧1 /(a − b ) für a ≤ x ≤ b
fG ( x) = ⎨
sonst
⎩ 0
0
für
x<a
⎧
⎪
Verteilungsfunktion: FG ( x ) = ⎨( x − a ) /(b − a ) für a ≤ x ≤ b
⎪
1
für
x>b
⎩
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
9
Zufallsvariablen IV
Stetige Gleichverteilung
1
Erwartungswert: E( X) = (a + b )
2
Varianz:
Var( X) =
1
(b − a ) 2
12
Beispiel:
An einem Marathon nehmen 13000 Läufer teil. Platz 6000
erreicht das Ziel nach 3:54:50 h, Platz 7000 nach 4:01:30 h. Unter
der Annahme, dass die Zielankünfte in der Mitte des Läuferfelds
(zwischen Platz 6000 und 7000) gleichverteilt sind, gebe man
Dichtefunktion, Erwartungswert und Varianz der Zielankünfte in
der Gruppe der 6000er-Platzierungen an und berechne die
Wahrscheinlichkeit, dass ein Läufer dieser Gruppe nach weniger
als vier Stunden ins Ziel kommt.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
10
Zufallsvariablen IV
5
Stetige Gleichverteilung
Lösung:
b = 4:01:30 h = 14490 s
und
a = 3:54:50 h = 14090 s
fG(x) = 1/(b-a) = 1/(14490 s-14090 s) = 1/(400 s)
= 0,0025 s-1 für 3:54:50 h ≤ x ≤ 4:01:30 h; sonst 0
E(X) = (a+b)/2 = (14490 s+14090 s)/2 = 14290 s = 3:58:10 h
Var(X) = (14490 s-14090 s)2/12 = (400s)2/12 = 13333,33 s2
W(3:54:50 h≤X<4:00:00 h) = 0,0025 s-1 · (14400 s-14090 s)
= 0,0025 · 310 = 0,775
Interpretation: 77,5 % der Zielankünfte (Platz 6000 bis Platz
6774) in der Gruppe der 6000er-Platzierungen erfolgen unter der
Annahme der Gleichverteilung nach weniger als vier Stunden.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
11
Zufallsvariablen IV
Stetige Gleichverteilung
Grafische Darstellungen:
Dichtefunktion
Verteilungsfunktion
0,0035
1,2
f(x) 0,003
F(x) 1
0,0025
0,8
0,002
0,6
0,0015
0,4
0,001
0,2
0,0005
0
14000
14200
14400
14600
14200
14400
14600
x
x
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
0
14000
12
Zufallsvariablen IV
6
Stetige Gleichverteilung
⇒ Annahmen über Gleichverteilung innerhalb der Klassen von
Daten, die einer Klassierung unterzogen wurden, sind mit
Vorsicht zu treffen. (Wir haben im 4. Abschnitt bei der
Quantilsbestimmung für klassiertes Datenmaterial bereits
darauf hingewiesen.) Insbesondere für breite dünnbesetzte
Klassen treffen derartige Annahmen in der Regel nicht zu.
⇒ Offene Randklassen sind niemals gleichverteilt besetzt. Sie
beziehen sich auf Intervalle, die nach oben oder nach unten
unbeschränkt sind, z.B. [a,∞[ oder ]-∞,b[ . Eine Unterstellung
der Gleichverteilung führt hier in jedem Fall zu einer Dichtefunktion mit dem konstanten Wert 0, z.B. fG(x)=1/(∞-a)= 0.
Eine Dichte von 0 ergibt keinen Sinn, u.a. weil die als Fläche
zwischen Dichtefunktion und Abszisse definierte
Verteilungsfunktion den Wert 1 nicht erreichen kann.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
13
Zufallsvariablen IV
Exponentialverteilung
Eine stetige Zufallsvariable X ist exponentialverteilt mit
dem Parameter λ > 0, wenn sie folgende Dichtefunktion besitzt:
⎧ 0
f E (x) = ⎨
− λx
⎩λ ⋅ e
für x < 0
für x ≥ 0
Durch Integration gelangt man zu folgender
Verteilungsfunktion:
⎧ 0
FE ( x ) = ⎨
− λx
⎩1 − e
für x < 0
für x ≥ 0
In Analogie zur diskreten Poissonverteilung kommt die
Exponentialverteilung mit nur einem Parameter (λ) aus.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
14
Zufallsvariablen IV
7
Exponentialverteilung
Erwartungswert und Varianz ergeben sich zu:
E( X) =
1
λ
und Var( X) =
1
λ2
Durch die Exponentialverteilung lassen sich folgende
Prozesse gut beschreiben:
⇒ Dauer von Telefongesprächen
⇒ Abstand der Kundenankünfte an einem Bankschalter
⇒ Lebensdauer von Glühlampen oder Aggregaten
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
15
Zufallsvariablen IV
Exponentialverteilung
Aus den Anwendungsfällen für Exponentialverteilung und
Poissonverteilung lässt sich erkennen, dass es zwischen
beiden Verteilungen Zusammenhänge gibt. - Diese zeigen
sich u.a. bei der Berechnung von Erwartungswerten: Ist
die Anzahl von Telefonaten pro Zeiteinheit poissonverteilt
mit einem Erwartungswert von µP=12 Anrufen pro
Stunde, dann sind die Abstände zwischen zwei Anrufen
exponentialverteilt mit dem Parameter λE = µP = 12h-1.
Der zu erwartende Abstand zwischen zwei Anrufen ist
dann EE(X) = 1/ λE = 1/(12h-1) = 0,833 h = 5 Minuten.
Anmerkung: Die Exponentialverteilung ist ein Spezialfall der Gammabzw. Erlang-Verteilung und auch der Weibull-Verteilung, die
Prozesse in Warteschlangenmodellen beschreiben.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
16
Zufallsvariablen IV
8
Exponentialverteilung
„Gedächtnislosigkeit“ der Exponentialverteilung:
Die bedingte Überlebenswahrscheinlichkeit (hier: p(x))
bezeichnet die Dichte einer Zufallsverteilung zum Zeitpunkt x = t
unter der Bedingung, dass das Zufallsereignis bis zum Zeitpunkt t
noch nicht eingetreten ist:
p(x)
= f(x)/(1-F(x))
Die Anwendung auf die Exponentialverteilung (mit x=t) führt zu:
pE(t)
pE(t)
= fE(t)/(1-FE(t)) = λ·e-λ·t/(1-(1-e-λ·t))
= λ·e-λ·t/e-λ·t → pE(t)=λ= konstant
Bleibt die bedingte Überlebenswahrscheinlichkeit über die Zeit
konstant, muss auch die bedingte Lebenserwartung (der
Erwartungswert) über die Zeit konstant sein:
EE(X|X>t)
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
= 1/λ = konstant für alle t
17
Zufallsvariablen IV
Exponentialverteilung
„Gedächtnislosigkeit“ der Exponentialverteilung:
Für verschiedene Anwendungen bedeutet das:
⇒ Wenn eine Glühbirne mit einer erwarteten Lebensdauer von drei Jahren
bereits zwei Jahre funktioniert hat, beträgt die zu erwartende
Restlebensdauer immer noch drei Jahre.
⇒ Ist in einer Telefonzentrale, in der durchschnittlich alle fünf Minuten ein
Anruf erfolgt, seit drei Minuten kein Anruf mehr eingegangen, beträgt die zu
erwartende Restzeit bis zum nächsten Anruf nach wie vor fünf Minuten.
⇒ Ist an einem Bankschalter, an dem mit einer Wahrscheinlichkeit von 0,30 in
der ersten Minute nach dem Erscheinen des letzten Kunden ein weiterer
Kunde auftaucht, sechs Minuten nach dem Erscheinen des letzten Kunden
kein zweiter Kunde angekommen, so beträgt die bedingte Wahrscheinlichkeit
für die Ankunft eines Kunden in der siebten Minute immer noch 0,30.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
18
Zufallsvariablen IV
9
Exponentialverteilung
Asymmetrie der Exponentialverteilung:
Bei einer symmetrischen Verteilung liegen die Werte je zur Hälfte
links und rechts des Erwartungswerts:
W(X<E(X)) = F(E(X)) = 0,5 = 1-F(E(X)) = W(X>E(X))
Für die Exponentialverteilung gilt:
W(X<E(X)) = F(E(X)) = F(1/λ) = 1-e-λ·(1/ λ) = 1-e-1 = 0,6321
⇒ 63,21% der Werte einer Exponentialverteilung liegen links von
E(X). Sie ist eine asymmetrische Verteilung.
⇒ Da mehr als die Hälfte der Werte links des Erwartungswerts liegt,
ist die Verteilung linkssteil bzw. rechtsschief.
⇒ Die Rechtsschiefe der Exponentialverteilung ist unabhängig von
der Größe des Parameters λ.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
19
Zufallsvariablen IV
Exponentialverteilung
Beispiel:
a)
b)
c)
d)
e)
Die Reparaturzeit von Maschinen eines bestimmten Typs sei eine
exponentialverteilte Zufallsgröße mit dem Parameter λ = 0,25 h-1.
Welche der folgenden Aussagen sind zutreffend?
Die zu erwartende Reparaturzeit einer zufällig ausgewählten
Maschine beträgt 4 h.
Die Wahrscheinlichkeit, dass die Reparaturzeit über dem
Erwartungswert für die Reparaturzeit liegt, ist unabhängig vom
Parameter λ.
Mehr als 50 % der Reparaturen dauern länger als 3 Stunden.
Nach höchstens sechs Stunden ist die Reparatur der Maschine
mit 90 % Sicherheit beendet.
Die Reparaturdauer von etwa 2 h ist fast dreimal so häufig wie die
Reparaturdauer von etwa 6 h.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
20
Zufallsvariablen IV
10
Exponentialverteilung
Lösung:
a) E(X) = 1/ λ = 1/(0,25 h-1) = 4 h.
=> Richtig.
b) W(X>E(X)) = 1-W(X ≤E(X)) = 1-FE(E(X)) = 1-FE(1/ λ)
= 1-(1-e– λ•(1/ λ)) = 1-(1-e–1) = e–1 = 0,3679
=> Richtig, unabhängig vom Wert λ dauert eine
Reparatur in etwa 37 % aller Fälle länger als zu
erwarten ist.
c) W(X>3) = 1-W(X≤ 3) = 1-FE(3) = 1-(1-e–0,25•3)
= e–0,75 = 0,472
=> Falsch, über 3 h nehmen nur 47 % der Reparaturen
in Anspruch, d.h. auch 53 % der Reparaturen sind in
weniger als 3 h erledigt.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
21
Zufallsvariablen IV
Exponentialverteilung
Lösung (Fortsetzung):
d) W(X≤x) =0,9 =1-e–0,25•x => e–0,25•x =0,1
oder:
=> ln(0,1) =–0,25•x => x =9,21
W(X≤6) = FE(6) = 1-e–0,25•6 = 1-e–1,5 = 1-0,223 = 0,777
=> Falsch, mit 90 % Sicherheit ist einer Reparatur erst
nach 9,21 h erledigt, nach 6 h sind nur 77,7 % aller
Reparaturen erledigt.
e) fE(2) =0,25·e–0,25•2 =0,152 fE(6) =0,25·e–0,25•6 =0,056
=> Richtig, denn 0,152 < 3·0,056.
(Die Dichtefunktion gibt aber nicht an, mit welcher
Wahrscheinlichkeit die Reparatur genau t Stunden dauert!)
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
22
Zufallsvariablen IV
11
Exponentialverteilung
Die grafischen Darstellungen zeigen u.a. die Asymmetrie (genauer:
die Rechtsschiefe) der exponentialverteilten Dichtefunktion.
Verteilungsfunktion
(Lambda=0,25)
Dichtefunktion
(Lambda=0,25)
f(x) 0,3
1,2
0,25
F(x) 1
0,2
0,8
0,15
0,6
0,1
0,4
0,05
0,2
0
0
0
5
10
15
0
20
5
10
15
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
20
x
x
23
Zufallsvariablen IV
Normalverteilung
Eine stetige Zufallsvariable X heißt normalverteilt,
wenn sie folgende Dichtefunktion besitzt:
−
1
fn (x) =
⋅e
σ⋅ 2⋅π
( x −µ ) 2
2⋅σ 2
(σ>0)
Die Dichtefunktion ist glockenförmig symmetrisch,
nimmt für x=µ ihr Maximum an und hat an den
Stellen x=µ-σ und x=µ+σ Wendenpunkte.
Die Kurve wird mit wachsendem Parameter σ² immer
flacher. Der Parameter µ hat die Rolle eines
Lageparameters und σ² die Rolle eines Skalen- oder
Streuungsparameters.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
24
Zufallsvariablen IV
12
Normalverteilung
Die Verteilungsfunktion der Normalverteilung
lautet:
2
x
−
1
⋅e
Fn ( x ) = ∫
−∞ σ ⋅ 2 ⋅ π
(ν − µ )
2⋅σ 2
dν
Ihr Wendepunkt liegt bei x=µ.
Erwartungswert und Varianz:
E( X) = µ und Var( X) = σ 2
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
25
Zufallsvariablen IV
Normalverteilung
Von besonderer Bedeutung ist die Normalverteilung, weil viele
Verteilungen unter gewissen Voraussetzungen durch die
Normalverteilung näherungsweise beschrieben (approximiert)
werden können. Da die Berechnung der Werte der Dichte- bzw.
Verteilungsfunktion der Normalverteilung nicht trivial ist, spielt
als Spezialfall der Normalverteilung mit µ=0 und σ²=1 die
Standardnormalverteilung eine große Rolle.
Die Funktionswerte der
Standardnormalverteilung sind
tabelliert oder werden von
Computern und guten
Taschenrechnern durch
Näherungsformeln berechnet.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
26
Zufallsvariablen IV
13
Normalverteilung
Der Zusammenhang zwischen einer normalverteilten
Zufallsgröße X mit den Parametern µ und σ² und der
dazugehörigen standardnormalverteilten Zufallsgröße
Z ist einfach hergestellt:
E(X)=µ => E(X-µ)=0 => E((X-µ)/σ)=0
und:
Var(X)=σ² => Var(X-µ)=σ² => Var((X-µ)/σ)=1
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
X−µ
σ
Z=
Transformation:
27
Zufallsvariablen IV
Normalverteilung
Dichte und Verteilungsfunktion:
fN (z) =
1
− 1 ⋅z 2
⋅e 2
2⋅π
z
FN ( z ) =
∫
−∞
1
− 1 ⋅ν 2
⋅ e 2 dν
2⋅ π
Die symmetrischen Eigenschaften der Dichte und Verteilungsfunktion ausnutzend, liegen die Werte nur für positive Argumente
vor. (Bleymüller/Gehlert, Formelsammlung)
Mit den Formeln
fN(-z)=fN(z)
und
FN(-z)=1-FN(z)
lassen sich die nicht tabellierten Werte einfach ermitteln.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
28
Zufallsvariablen IV
14
Normalverteilung
Grafische Darstellungen:
Verteilungsfunktion
(µ=0 und Sigma²=1)
Dichtefunktion
(µ=0 und Sigma²=1)
1,2
0,45
f(x) 0,4
F(x) 1
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
0,8
0,6
0,4
0,2
0
-4
-2
0
2
4
-4
-2
x
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
0
2
4
x
29
Zufallsvariablen IV
Normalverteilung
Beispiel:
In einer Klinik kommen in einem bestimmten Monat 80
Säuglinge zur Welt. Unter der Annahme, dass der Anteil
weiblicher Geburten an allen Geburten langfristig bei 0,49 liegt,
berechne man die Wahrscheinlichkeit dafür, dass sich unter den
80 Säuglingen 35 bis 40 Mädchen befinden.
Lösung:
Es handelt sich um eine Binomialverteilung, die wegen n·θ·(1-θ)
=80·0,49·(1-0,49) =19,992 ≥9 durch eine Normalverteilung
approximiert werden kann.
Hierbei sind:
µ=n·θ=80·0,49= 39,2 und σ²=n·θ·(1-θ)= 19,992.
Wahrscheinlichkeit nach Normalverteilung:
W(x1< X< x2) = Fn(x2|µ|σ²) – Fn(x1|µ|σ²)
W(34,5< X<40,5) = Fn(40,5|39,2|19,992) – Fn(34,5|39,2|19,992)
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
30
Zufallsvariablen IV
15
Normalverteilung
Lösung (Fortsetzung):
Umrechnung in die Standardnormalverteilung:
z1 = (x1–µ)/σ = (34,5–39,2)/19,9920,5 = (-4,7)/4,471 = -1,051
z2 = (x2–µ)/σ = (40,5–39,2)/19,9920,5 = (1,3)/4,471 = 0,291
Wahrscheinlichkeit nach Standardnormalverteilung:
W(x1< X< x2) = FN(z2) – FN(z1)
Da z1 negativ ist, formen wir um zu:
W(x1< X< x2) = FN(z2) – (1–FN(-z1))
W(x1< X< x2) = FN(z2) + FN(-z1) – 1
W(x1< X< x2) = FN(0,291) + FN(1,051) – 1
W(x1< X< x2) = 0,6145 + 0,8534 – 1 = 0,4679
⇒ Die Wahrscheinlichkeit, dass sich unter den 80 im Verlauf eines
Monats geborenen Säuglingen 35 bis 40 Mädchen befinden, liegt
bei ca. 47 %.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
31
Zufallsvariablen IV
Normalverteilung
Beispiel:
Wie groß ist der Anteil der Realisierungen einer normalverteilten
Zufallsgröße in den Intervallen [µ-i·σ, µ+i·σ] für i =1, 2, 3?
Lösung:
i=1: W(µ-σ<X<µ+σ) = W(-1<Z<1) = Fn(µ+σ)–Fn(µ-σ) = FN(1)–FN(-1)
= FN(1)–(1–FN(1)) = 2·FN(1)–1 = 2·0,8413–1 = 0,6827
i=2: W(µ–2·σ<X<µ+2·σ) = W(-2<Z<2) = Fn(µ+2·σ)–Fn(µ–2·σ)
= FN(2)–FN(-2) = 2·FN(2)–1 = 2·0,9772–1 = 0,9545
i=3: W(µ–3·σ<X<µ+3·σ) = W(-3<Z<3) = Fn(µ+3·σ)–Fn(µ–3·σ)
= FN(3)–FN(-3) = 2·FN(3)–1 = 2·0,9987–1 = 0,9973
Im einfachen σ-Bereich um den Erwartungswert liegen mehr als 68 %, im
doppelten σ-Bereich mehr als 95 % und im dreifachen σ-Bereich fast alle
möglichen Realisierungen einer normalverteilten Zufallsvariablen
(=> „3-σ-Regel“). Dies gilt unabhängig von den beiden Parametern der
Normalverteilung.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
32
Zufallsvariablen IV
16
Normalverteilung
Beispiel:
Aus einer normalverteilten Grundgesamtheit mit Erwartungswert
µ= 500 und Varianz σ²= 200 werden Stichproben mit Zurücklegen vom Umfang n= 50 gezogen. Geben Sie die Parameter der
Verteilungs- und Dichtefunktion für den einfachen arithmetischen Stichprobenmittelwert an.
Mit welcher Wahrscheinlichkeit ist der Stichprobenmittelwert
mindestens 499 und höchstens 505?
Lösung:
Xi seien Zufallsvariable, die unabhängig und identisch normalverteilt
sind mit den Parametern µ=500 und σ²=200. Der mit der Vorschrift
X=
n
1
n
⋅ ∑ Xi
gebildete Stichprobenmittelwert ist dann ebenfalls
i =1
normalverteilt mit den Parametern E(X) = µ und Var (X) = σ²/n
=200/50 = 4 = 2².
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
33
Zufallsvariablen IV
Normalverteilung
Lösung (Fortsetzung):
Im Beispiel wurde die Stichprobe mit Zurücklegen gezogen. Beim
Ziehen ohne Zurücklegen – insbesondere bei einem größeren
Stichprobenanteil – ist für die Varianz ein Korrekturfaktor (≤ 1)
zu berücksichtigen.
W(499 ≤ X ≤ 505) = W((499-500)/2 ≤ (X–500)/2 ≤ (505-500)/2)
= W(-0,5 ≤ Z ≤ 2,5) = FN(2,5)–FN(-0,5) = FN(2,5)–1+FN(0,5)
= 0,9938–1+0,6915 = 0,6853
Mit der Wahrscheinlichkeit von 0,6853 liegt der
Stichprobenmittelwert im gefragten Wertebereich.
Prof. Kück / S. Winterfeldt
Lehrstuhl Statistik
34
Zufallsvariablen IV
17
Herunterladen