6 (Fortsetzung) Spezielle Stetige Wahrscheinlichkeitsverteilungen

Werbung
Die Gaußsche Normalverteilung spielt eine wichtige Rolle in der
Wahrscheinlichkeitsrechnung und Statistik. Die Verteilung von vielen stetigen
Zufallsvariablen in der Technik und den Naturwissenschaften wie z.B. physikalisch
technische Messgrößen können durch die Dichtefunktion der Normalverteilung beschrieben
werden. Bei vielen Messwerten, die von vielen Einzeleinflüssen beeinflusst werden, häufen
sich die Werte in der Nähe des Mittelwerts (Sollwert). Die Dichtekurve die Form einer
Glockenkurve besitzt.
Aus der Serienproduktion zur Herstellung von Autobatterien wurde eine Stichprobe vom
Umfang N = 40 entnommen. Die Messungen der Lebensdauer X (in Jahren) der Batterien
ergab die folgende Tabelle für die Häufigkeitsverteilung:
j
Kj
1
2
3
4
5
6
7
[ 1,5
[ 2,0
[ 2,5
[ 3,0
[ 3,5
[ 4,0
[ 4,5
dj
;
;
;
;
;
;
;
2,0 )
2,5 )
3,0 )
3,5 )
4,0 )
4,5 )
5,0 )
mj
0,5
0,5
0,5
0,5
0,5
0,5
0,5
hj
1,75
2,25
2,75
3,25
3,75
4,25
4,75
fj
2
1
4
15
10
5
3
f
0,05
0,025
0,1
0,375
0,25
0,125
0,075
Fj
j
0,1
0,05
0,2
0,75
0,5
0,25
0,15
0,05
0.075
0,175
0,55
0,8
0,925
1
In der Abbildung sind das Dichtehistogramm sowie die Kurve der Dichtefunktion, die an den
Messdaten angepasst wurde, dargestellt.
0,75
0,50
0,25
0
1,75 2,25 2,75 3,25 3,75 4,25 4,75 x
3,5
4,5 [Jahre]
Die approximierte Dichtefunktion lautet:
f (x) =
1
2 π ⋅ 0 , 53
exp
2
−
1
x − 3 , 37
2
0 , 53
2
11
Wie groß ist die Wahrscheinlichkeit, dass eine zufällig aus der Produktion entnommene
Batterie eine Lebensdauer zwischen 3,5 bis 4,5 Jahre hat?
Der Flächeninhalt des 5. und 6. Rechteckes:
0,5 ⋅ 0,5 + 0,5 ⋅ 0,25 = 0,375
Der Inhalt der Fläche unterhalb des Graphen der an dem Histogramm approximierten
Dichtefunktion zwischen den Grenzen 2 und 4:
1
P ( 3 ,5 ≤ X ≤ 4,5 ) =
⋅
2 π ⋅ 0 , 53
4,5
3,5
−
e
1
x − 3 , 37
2
0 , 53
2
dx = 0 , 386
Der Wert dieses Integral muss numerisch berechnet werden.
!
Gaußsche Normal-Verteilung
Die Verteilung einer stetigen Zufallsvariable X mit der Dichtefunktion:
1
f (x) =
exp
2π σ
−
2
1
x − µ
2
σ
2
heißt Gaußsche Normalverteilung.
Dabei sind die Parameter
der Erwartungswert und
X kann die Werte : – ∞ < x < ∞ annehmen.
² die Varianz dieser Verteilung.
Die Verteilungsfunktion der Gaußschen Normalverteilung ist:
x
F
1
( x ) = P( X ≤ x ) =
exp
2π σ
− ∞
"
−
u − µ
2
σ
2
du
#
$
µ=0
σ =1
f(x)
µ=0
σ =2
µ=2
σ =1
µ=–2
σ =2
–4
2
1
–2
0
2
4
x
12
Eigenschaften der Normalverteilung
Die Kurve der Dichtefunktion der Normalverteilung ist symmetrisch bzgl. der Gerade
x=
Für eine normalverteilte Zufallsvariable liegen
ca. 68,2%
ca. 95%
ca. 99.7%
der beobachteten Werte zwischen
der beobachteten Werte zwischen
der beobachteten Werte zwischen
σ
σ
%
#
σ
µ
und
und
und
σ
+
+2
+3
σ
&
(#
)*
σ
–
– 2
– 3
##
'
#
'
(#
#
!
Möchte man für eine stetige Zufallsvariable, deren Verteilung durch die Normalverteilung
gegeben ist, die Wahrscheinlichkeit für alle Werte „kleiner als einen bestimmten Wert x0
bestimmen, so berechnet man definitionsgemäß folgendes Integral
xo
F (xo
)
= P ( X ≤ xo
)
f ( x ) dx =
=
− ∞
xo
1
2π σ
exp
2
− ∞
−
1
x − µ
2
σ
2
dx
Leider kann F (x ) , d.h. die Stammfunktion der Dichtefunktion f (x ) der Normalverteilung
nicht analytisch mit Hilfe von Integraltechniken bestimmt werden. Der Wert des Integrals
muss numerisch berechnet werden.
13
*
Die Lebensdauer X (in Jahren) der Batterien einer Serienproduktion sei eine
normalverteilte Zufallsgröße mit der Dichtefunktion: (s. Bsp. 3)
f (x
−
1
)=
e
1
x − 3 , 37
2
0 , 53
f(x )
2
P(X
3,5 )
2 π ⋅ 0 , 53
2
3 3,5 4
5
x
Wie groß ist die Wahrscheinlichkeit, dass eine zufällig aus der Produktion entnommene
Batterie eine Lebensdauer weniger als 3,5 Jahre hat?
1
F ( 3 ,5 ) = P ( X ≤ 3 ,5 ) =
2 π ⋅ 0 , 53
))* &
#
$
"
3,5
−
e
⋅
1
x − 3 , 37
2
0 , 53
2
dx = 0 , 596
− ∞
#
Da die Stammfunktion F (x ) der Dichtefunktion f (x ) der Normalverteilung nicht bestimmt
werden kann, muss der Wert für F (x0 ) für einen beliebigen x0 numerisch berechnet werden.
Man kann also numerische berechnete Werte-Tabellen erstellen, die für verschiedene xWerte sowie - und -Werten die dazugehörigen F (x ) enthalten. Leider werden solche
Tabellen sehr groß und unübersichtlich.
Geht man aber von einer beliebigen normalverteilten Zufallsvariable X durch die lineare
Transformation (Substitution) zu der standardisierten Variable:
Z =
X − µ
σ
über, so genügt die Zufallsvariable Z auch einer Normalverteilung mit = 0 und
=1
Somit lassen sich alle Normalverteilungen durch die Standardisierung auf eine einzige
Verteilung zurückführen.
14
Standard-Normalverteilung
Die Verteilung einer stetigen Zufallsvariable Z mit der Dichtefunktion:
ϕ(z
)
=
1
exp
2π
−
1 2
z
2
heißt Standardnormalverteilung.
Dabei sind die Parameter
= 0 und
² = 1.
Ihre Verteilungsfunktion lautet:
z
Φ( z
)
= P(Z ≤ z
)
=
− ∞
1
2π
exp
−
1
v
2
2
dv
Im Anhang befindet sich eine Tabelle mit den Werten der Verteilungsfunktion Φ ( z ) der
Standard-Normalverteilung für beliebige z ≥ 0.
Mit Hilfe der Standard-Normalverteilung kann die Wahrscheinlichkeit F (x0 ) = P ( X
bestimmt werden.
x0 )
Φ ( z)
P(Z
z0 ) = Φ ( z0 )
z
(z)
P(Z
z0 )
z
z0
15
Beziehung zur Bestimmung der Wahrscheinlichkeit F (x0 ) = P ( X x0 ) einer
beliebigen normalverteilten Zufallsvariable X mit Hilfe der Standard-Normalverteilung
F (xo
)
= P (X ≤ xo
)
xo
1
=
exp
2π σ
exp
2π
−
− ∞
zo
1
=
2
−
− ∞
1
z
2
1
x − µ
2
σ
2
dx
dz = P ( Z ≤ z o
)=
Φ(zo
)
(z)
F ( x0 )
f(x)
2
Φ ( z0 )
=
0
µ
xo
1
2π σ
z =
x0
exp
2
x − µ
σ
−∞
−
x
1
x − µ
2
σ
dz =
1
σ
2
dx
1
dx
z
z0
0
2π
zo
exp
−∞
−
1
2
z
2
dz
16
(*
Bestimmen Sie mit Hilfe der Tabelle für die Werte der Verteilungsfunktion der StandardNormalverteilung die Wahrscheinlichkeit aus dem vorigen Beispiel dafür, dass eine zufällig
aus der Produktion entnommene Batterie eine Lebensdauer weniger als 3,5 Jahre hat?
Die Gaußsche Normal-Verteilung lautete:
f (x
1
)=
−
e
1
x − 3 , 37
2
0 , 53
2
mit
= 3,37 und
= 0,53 .
2 π ⋅ 0 , 53
Es soll die Wahrscheinlichkeit für alle x-Werte kleiner als die obere Grenze x0 = 3,5
berechnet werden. Die Substitution liefert folgende obere Grenze für die Zufallsvariable Z:
Z =
X − µ
zo
σ
=
xo − µ
σ
=
3 , 5 − 3 , 37
= 0 , 245
0 , 53
Somit erhält man für die gesuchte Wahrscheinlichkeit:
(z)
f(x )
P(X
1
(z)=
3,5 )
2
X –
3 3,5 4
P(X
3,5 )
5
0 z0 = 0,245
x
=
=
2
Φ ( 0,245 )
Z =
2
z²
exp
P(Z
z
0,245 )
Φ ( 0,245 )
≈ 0,5967
Da in der Tabelle der Wert z 0 = 0,245 nicht eingetragen ist, wird die
Wahrscheinlichkeit Φ ( 0,245 ) näherungsweise als das arithmetische Mittel der
Wahrscheinlichkeiten Φ ( z ) für die beiden benachbarten z-Werten angegeben.
Φ ( 0,245 ) = ½ [ Φ ( 0,24 ) + Φ ( 0,25 ) ] = ½ [ 0,5948 + 0,5987 ] = 0,5967
Liegt ein z 0-Wert mit mehr als 2 Nachkommastellen vor, so kann Φ ( z 0) aus der Tabelle der
Standard-Normal-Verteilung genauer durch lineare Interpolation bestimmt werden.
+ "
(
,
17
Geben Sie mit Hilfe der Tabelle für die Werte der Verteilungsfunktion der StandardNormalverteilung die Wahrscheinlichkeit aus dem vorigen Beispiel dafür an, dass eine
zufällig aus der Produktion entnommene Batterie eine Lebensdauer weniger als 4,5 Jahre
hat?
P( X
4,5 ) = P( z
2,132 ) = Φ (2,132) = 0,9834
*
Bestimmen Sie mit Hilfe der Werte für die Verteilungsfunktion der Standard-Normalverteilung
die Wahrscheinlichkeit aus dem vorigen Beispiel dafür, dass eine zufällig aus der Produktion
entnommene Batterie eine Lebensdauer zwischen 3,5 und 4,5 Jahre hat?
P( 3,5
X
4,5 ) = P( 0,245
2,132 ) = Φ (2,132) – Φ ( 0,245 )
z
=
f(x)
P ( 3,5
0,9834
–
0,5967
=
0,3867
4,5 )
X
0.7
0.6
0.5
0.4
0.3
0.2
0.1
=
2
3 3,5 4 4,5 5
f(x)
P(X
6x
f(x)
4,5 )
0.7
0.6
0.5
0.4
0.3
0.2
0.1
–
2
3
4 4,5 5
6x
P(X
3,5 )
0.7
0.6
0.5
0.4
0.3
0.2
0.1
2
3 3,5 4
5
x
18
Formel zur Bestimmung der Wahrscheinlichkeiten einer normalverteilten
Zufallsvariable X zwischen zwei x-Werten a und b :
Aus der Beziehung
P (a ≤ X ≤ b
folgt:
a
1
)=
e
2π σ
1
=
2π
−
2
1
x − µ
2
σ
2
dx = F ( b ) − F ( a )
b
z2
e
−
1
2
z 2
z2
1
dz =
e
2π
z1
=
Φ(z2
−
1
2
z 2
dz −
2π
− ∞
)
1
− Φ ( z1
)
z1
e
−
1
2
z 2
dz
− ∞
= P ( z1 ≤ Z ≤ z 2
)
f ( x)
( z)
Φ ( z2 ) – Φ ( z1 )
F ( b) – F ( a )
σ
a
µ
b
x
z1 0
z2
z
Formel zur Bestimmung der Wahrscheinlichkeiten mit der Standardnormalverteilung für negative Wert von z :
Da die Dichtefunktion der Standardnormalverteilung symmetrisch zu 0 ist, gilt:
Φ (– z ) = 1 – Φ (z )
,
Der Durchmesse X von seriengefertigten Kugeln sei eine normalverteilte Zufallsgröße. Die
Messung des Durchmessers von mehreren hergestellten Kugeln ergab eine
Normalverteilung mit = 50 [mm] und
= 10 [mm]. Geben Sie an, welcher Anteil der
hergestellten Kugeln einen Durchmesser zwischen 45 [mm] und 62 [mm] hat.
19
Die Normalverteilung lautet:
f (x ) =
1
exp
2 π 10 2
−
x − 50
10
1
2
2
Der Anteil der Kugel mit einem Durchmesser zwischen a = 45 [mm] und b = 62 [mm]
muss berechnet werden. Dafür soll die Wahrscheinlichkeit für alle x-Werte zwischen
den Grenzen x1 = 45 und x2 = 62 berechnet werden.
1. Lösungsweg:
P ( 45 ≤ X ≤ 62
)
62
1
=
2
2 π 10
e
−
1
2
x − 50
10
2
dx = F ( 62
)
− F ( 45
)
45
Dieses Integral können wir numerisch mit Hilfe des Taschenrechners ausrechnen, oder
wir verwenden die Standard-Normal-Verteilung.
2. Lösungsweg:
Die Substitution liefert folgende Grenzen für die Zufallsvariable Z:
Z =
X − µ
σ
z
1
z
2
=
=
45 − 50
10
62 − 50
10
= − 0,5
=
1, 2
Somit erhält man für die gesuchte Wahrscheinlichkeit:
(z)
1
(z)=
exp
2
z²
2
F (62) – F(45)
f(x)
Z =
σ
4
0
6
a = 45
Φ (1,2) – Φ (– 0,5)
X – µ
σ
0
µ
b = 62
x
z1 = – 0,5
P ( 45
X
62 )
0
z2 = 1,2
=
P ( – 0,5
=
Φ ( 1,2 ) – Φ ( – 0,5 )
=
0,8849
Z
–
z
1,2 )
0,3085
= 0,5764
20
-
#
Das q-Quantil z q mit 0 < q < 1 teilt die Fläche unter dem Graphen der Standard-NormalVerteilung
ϕ ( z ) in 2 Teilflächen, so dass links von ihm der Inhalt der einen Teilfläche
q und rechts von ihm der Inhalt der anderen Teilfläche 1 – q beträgt.
(z)
P(Z
zq ) = q
Φ ( zq ) = q
q
zq
z
0
Quantilen / Perzentilen der Normal-Verteilung
Das q-Quantil z q der Sandard-Normal-Verteilung mit 0 < q < 1 ist die Zahl auf
der z-Achse , für die gilt:
Φ(zq) = q
Das q-Quantil x q der Gaußschen Normal-Verteilung mit 0 < q < 1 ist die Zahl auf
der x-Achse , für die gilt:
F(xq) = q
Dieses lässt sich dann mit Hilfe von z q wie folgt berechnen:
zq
=
xq − µ
σ
⇔
xq = σ ·zq + µ
+ " ( .
Bestimmen Sie das 0,025-Quantil (2,5%-Quantil) für die Verteilung der Lebensdauer
der Batterien aus Bsp. 3.
21
Herunterladen