7 Spezielle Stetige Wahrscheinlichkeitsverteilungen

Werbung
Die Gaußsche Normalverteilung spielt eine wichtige Rolle in der Wahrscheinlichkeitsrechnung
und Statistik. Die Verteilung von vielen stetigen Zufallsvariablen in der Technik und den
Naturwissenschaften wie z.B. physikalisch technische Messgrößen können durch die
Dichtefunktion der Normalverteilung beschrieben werden. Bei vielen Messwerten, die von vielen
Einzeleinflüssen beeinflusst werden, häufen sich die Werte in der Nähe des Mittelwerts
(Sollwert). Die Dichtekurve die Form einer Glockenkurve besitzt.
Beispiel 1
Aus der Serienproduktion zur Herstellung von Autobatterien wurde eine Stichprobe vom Umfang
N = 40 entnommen. Die Messungen der Lebensdauer T (in Jahren) der Batterien ergab die
folgende Tabelle für die Häufigkeitsverteilung:
j
Kj
1
2
3
4
5
6
7
[ 1,5
[ 2,0
[ 2,5
[ 3,0
[ 3,5
[ 4,0
[ 4,5
dj
;
;
;
;
;
;
;
2,0 )
2,5 )
3,0 )
3,5 )
4,0 )
4,5 )
5,0 )
mj
0,5
0,5
0,5
0,5
0,5
0,5
0,5
hj
1,75
2,25
2,75
3,25
3,75
4,25
4,75
fj
2
1
4
15
10
5
3
f*j
0,05
0,025
0,1
0,375
0,25
0,125
0,075
Fj
0,1
0,05
0,2
0,75
0,5
0,25
0,15
0,05
0.075
0,175
0,55
0,8
0,925
1
In der Abbildung sind das Histogramm der Klassendichten der relativen Häufigkeiten sowie die
Kurve der Dichtefunktion, die an den Messdaten angepasst wurde, dargestellt.
Histogramm der Klassendichten der Relativen Häufigkeiten
0,75
Dichtefunktion
0,50
0,25
0
1,75
2,25
2,75
3,25
3,75
3,5
4,25
4,75
4,5
t [Jahre]
Die approximierte Dichtefunktion lautet:
f (t
) =
1
2 π ⋅ 0 , 53
2
exp
−
1
t − 3 , 37
2
0 , 53
2
Frage
Wie groß ist die Wahrscheinlichkeit, dass eine zufällig aus der Produktion entnommene Batterie
eine Lebensdauer zwischen 3,5 bis 4,5 Jahre hat?
1
Lösung
Der Flächeninhalt des 5. und 6. Rechteckes:
0,5 ⋅ 0,5 + 0,5 ⋅ 0,25 = 0,375
Der Inhalt der Fläche unterhalb des Graphen der an dem Histogramm approximierten
Dichtefunktion zwischen den Grenzen 2 und 4:
1
P ( 3 ,5 ≤ T ≤ 4 ,5 ) =
2 π ⋅ 0 , 53
⋅
4,5
3,5
−
e
1
t − 3 , 37
2
0 , 53
2
dt = 0 , 386
Bemerkung
Der Wert dieses Integral muss numerisch berechnet werden.
Gaußsche Normal-Verteilung
Die Verteilung einer stetigen Zufallsvariable X mit der Dichtefunktion:
1
f (x) =
2π σ
2
exp
−
1
x − µ
2
σ
2
heißt Gaußsche Normalverteilung.
Dabei sind die Parameter
der Erwartungswert und
X kann die Werte : – ∞ < x < ∞ annehmen.
² die Varianz dieser Verteilung.
Die Verteilungsfunktion der Gaußschen Normalverteilung lautet:
F
x
1
− ∞
2π σ
( x ) = P( X ≤ x ) =
exp
2
−
1
u − µ
2
σ
2
du
Eigenschaften der Kurve der Gaußschen Normalverteilung
Die Kurve ist symmetrisch bzgl. der Gerade x =
Die Wendestellen der Kurve liegen bei x =
± σ
Gra ph für ei nig e Normal -Verteil un ge n
0 .4
0 .3
= 0 ,
²= 1
0 .2
=
– 2
,
²= 4
= 1 ,
²= 3
0 .1
x
-1 0
-5
5
10
2
!
Möchte man für eine stetige Zufallsvariable, deren Verteilung durch die Normalverteilung
gegeben ist, die Wahrscheinlichkeit für alle Werte „kleiner als einen bestimmten Wert x0
bestimmen, so berechnet man definitionsgemäß folgendes Integral
xo
F (xo
)
= P ( X ≤ xo
)
f ( x ) dx =
=
xo
1
2π σ
− ∞
2
exp
−
− ∞
1
x − µ
2
σ
2
dx
Leider kann F (x ) , d.h. die Stammfunktion der Dichtefunktion f (x ) der Normalverteilung nicht
analytisch mit Hilfe von Integraltechniken bestimmt werden. Der Wert des Integrals muss
numerisch berechnet werden.
Beispiel 1a
Die Lebensdauer T (in Jahren) der Batterien einer Serienproduktion sei eine normalverteilte
Zufallsgröße mit der Dichtefunktion: (s. Bsp. 1)
f (t
)=
1
2 π ⋅ 0 , 53
−
e
1
t − 3 , 37
2
0 , 53
f(t)
2
P(T
3,5 )
0.7
0.6
0.5
0.4
0.3
0.2
0.1
3 3,5
2
4
5
t
Wie groß ist die Wahrscheinlichkeit, dass eine zufällig aus der Produktion entnommene Batterie
eine Lebensdauer weniger als 3,5 Jahre hat?
Lösung
F ( 3 ,5 ) = P ( T ≤ 3 ,5 ) =
1
2 π ⋅ 0 , 53
3,5
−
e
⋅
1
t − 3 , 37
2
0 , 53
2
dt = 0 , 596
− ∞
3
!
"
#
Da die Stammfunktion F (x ) der Dichtefunktion f (x ) der Normalverteilung nicht bestimmt
werden kann, muss der Wert für F (x0 ) für einen beliebigen x0 numerisch berechnet werden.
Man kann also numerische berechnete Werte-Tabellen erstellen, die für verschiedene x-Werte
sowie - und -Werten die dazugehörigen F (x ) enthalten. Leider werden solche Tabellen
sehr groß und unübersichtlich.
Geht man aber von einer beliebigen normalverteilten Zufallsvariable X durch die lineare
Transformation (Substitution) zu der standardisierten Variable:
X − µ
Z =
σ
über, so genügt die Zufallsvariable Z auch einer Normalverteilung mit = 0 und
= 1 Somit
lassen sich alle Normalverteilungen durch die Standardisierung auf eine einzige Verteilung
zurückführen.
Standard-Normalverteilung
Die Verteilung einer stetigen Zufallsvariable Z mit der Dichtefunktion:
ϕ(z
)
=
1
2π
exp
−
1 2
z
2
heißt Standardnormalverteilung.
Dabei sind die Parameter
= 0 und
² = 1.
Ihre Verteilungsfunktion lautet:
z
Φ( z
)
= P(Z ≤ z
)
=
− ∞
1
2π
exp
−
1
v
2
2
dv
Bemerkung
Im Anhang befindet sich eine Tabelle mit den Werten der Verteilungsfunktion Φ ( z ) der
Standard-Normalverteilung für beliebige z ≥ 0.
Mit Hilfe der Standard-Normalverteilung kann die Wahrscheinlichkeit F (x0 ) = P ( X
bestimmt werden.
x0 )
4
Beziehung zur Bestimmung der Wahrscheinlichkeiten F (x0 ) = P ( X x0 ) einer
beliebigen normalverteilten Zufallsvariable X mit Hilfe der Standard-Normalverteilung
F (xo
)
= P (X ≤ xo
)
xo
1
=
2π σ
exp
exp
2π
−
− ∞
zo
1
=
2
−
− ∞
1
z
2
1
x − µ
2
σ
2
dx
dz = P ( Z ≤ z o
)=
Φ(zo
)
(z)
F ( x0 )
f(x)
2
Φ ( z0 )
=
0
µ
xo
1
2π σ
z =
x0
2
x − µ
σ
exp
−∞
−
x
1
x − µ
2
σ
dz =
1
σ
z
2
dx
1
dx
z0
0
2π
zo
exp
− ∞
−
1
2
z
2
dz
5
Beispiel 1b
Bestimmen Sie mit Hilfe der Tabelle für die Werte der Verteilungsfunktion der StandardNormalverteilung die Wahrscheinlichkeit aus dem vorigen Beispiel dafür, dass eine zufällig aus
der Produktion entnommene Batterie eine Lebensdauer weniger als 3,5 Jahre hat?
Lösung
Die Gaußsche Normal-Verteilung lautete:
f (t
1
)=
−
2 π ⋅ 0 , 53
e
1
t − 3 , 37
2
0 , 53
2
mit
= 3,37 und
= 0,53 .
Es soll die Wahrscheinlichkeit für alle t-Werte kleiner als die obere Grenze t0 = 3,5 berechnet
werden. Die Substitution liefert folgende obere Grenze für die Zufallsvariable Z:
Z =
T − µ
zo
σ
=
to − µ
=
σ
3 , 5 − 3 , 37
0 , 53
= 0 , 245
Somit erhält man für die gesuchte Wahrscheinlichkeit:
(z)
f(t)
0.7
0.6
0.5
0.4
0.3
0.2
0.1
1
(z)=
2
F (3,5 )
Z =
2
3 µ
4
5
P(T
3,5 )
=
=
0 z0 = 0,245
P(Z
z²
2
Φ ( 0,245 )
X –
t
t0 = 3,5
exp
z
0,245 )
Φ ( 0,245 )
≈ 0,5967
Bemerkung
Da in der Tabelle der Wert z 0 = 0,245 nicht eingetragen ist, wird die Wahrscheinlichkeit
Φ ( 0,245 ) näherungsweise als das arithmetische Mittel der Wahrscheinlichkeiten Φ ( z ) für die
beiden benachbarten z-Werten angegeben.
Φ ( 0,245 ) = ½ [ Φ ( 0,24 ) + Φ ( 0,25 ) ] = ½ [ 0,5948 + 0,5987 ] = 0,5967
6
Aufgabe 1
Geben Sie mit Hilfe der Tabelle für die Werte der Verteilungsfunktion der StandardNormalverteilung die Wahrscheinlichkeit aus dem vorigen Beispiel dafür an, dass eine zufällig
aus der Produktion entnommene Batterie eine Lebensdauer weniger als 4,5 Jahre hat?
4,5 ) = P( z
P( T
2,132 ) = Φ (2,132) = 0,9834
Beispiel 1c
Bestimmen Sie mit Hilfe der Werte für die Verteilungsfunktion der Standard-Normalverteilung die
Wahrscheinlichkeit aus dem vorigen Beispiel dafür, dass eine zufällig aus der Produktion
entnommene Batterie eine Lebensdauer zwischen 3,5 und 4,5 Jahre hat?
Lösung
P( 3,5
T
4,5 ) = P( 0,245
z
2,132 ) = Φ (2,132) – Φ ( 0,245 )
=
f(t)
P ( 3,5
0,9834
–
0,5967
=
0,3867
4,5 )
T
0.7
0.6
0.5
0.4
0.3
0.2
0.1
=
3 3,5 4 4,5 5
2
f(t)
P(T
6t
0.7
0.6
0.5
0.4
0.3
0.2
0.1
–
2
3
4 4,5 5
6t
P(T
f(t)
4,5 )
3,5 )
0.7
0.6
0.5
0.4
0.3
0.2
0.1
2
3
3,5 4
5
t
7
Formel zur Bestimmung der Wahrscheinlichkeiten einer normalverteilten
Zufallsvariable zwischen zwei x-Werten a und b :
Aus der Beziehung
P (a ≤ X ≤ b
folgt:
a
1
)=
2π σ
=
e
2
e
2π
1
x − µ
2
σ
2
dx = F ( b ) − F ( a )
b
z2
1
−
−
1
2
z 2
dz =
z1
=
z2
1
e
2π
Φ (z2
−
1
2
z 2
1
dz −
2π
− ∞
)
−
Φ ( z1
)
z1
e
−
1
2
z 2
dz
− ∞
= P ( z1 ≤ Z ≤ z 2
)
f ( x)
( z)
( z2 ) –
( – z1 )
F ( b) – F ( a )
0
a
b
x
– z1 0
z2
z
Formel zur Bestimmung der Wahrscheinlichkeiten mit der Standardnormalverteilung für negative Wert von z :
Da die Dichtefunktion der Standardnormalverteilung symmetrisch zu 0 ist, gilt für alle – z < 0:
Φ (– z ) = 1 – Φ (z )
8
Beispiel 2
Der Durchmesse X von seriengefertigten Kugeln sei eine normalverteilte Zufallsgröße. Die
Messung des Durchmessers von mehreren hergestellten Kugeln ergab eine Normalverteilung
= 10 [mm]. Geben Sie an, welcher Anteil der hergestellten Kugeln
mit = 50 [mm] und
einen Durchmesser zwischen 45 [mm] und 62 [mm] hat.
Lösung:
Die Normalverteilung lautet:
f (x ) =
1
exp
2 π 10 2
2
x − 50
10
1
−
2
Der Anteil der Kugel mit einem Durchmesser zwischen a = 45 [mm] und b = 62 [mm] muss
berechnet werden. Dafür soll die Wahrscheinlichkeit für alle x-Werte zwischen den Grenzen
x1 = 45 und x2 = 62 berechnet werden.
P ( 45 ≤ X ≤ 62
)
=
62
1
2 π 10 2
e
−
1
2
x − 50
10
2
dx = F ( 62
)
− F ( 45
)
45
Dieses Integral können wir numerisch mit Hilfe des Taschenrechners ausrechnen, oder wir
verwenden die Standard-Normal-Verteilung.
Die Substitution liefert folgende Grenzen für die Zufallsvariable Z:
45 − 50
−z1 =
= − 0,5
X − µ
10
Z =
62 − 50
σ
z2 =
= 1, 2
10
Somit erhält man für die gesuchte Wahrscheinlichkeit:
(z)
1
(z)=
2
exp
z²
2
F (62) – F(45)
f(x)
Z =
Φ (1,2) – Φ(– 0,5)
X –
σ
4
0
a = 45
6
µ
0
b = 62
P ( 45
X
62 )
x
– z1 = – 0,5 0
z2 = 1,2
z
=
P ( – 0,5
=
Φ ( 1,2 ) – Φ ( – 0,5 )
=
Φ ( 1,2 ) – [ 1 – Φ ( 0,5 ) ] = 0,5764
Z
1,2 )
9
$%
& #
Satz) Linearitätssatz der Normalverteilung
Sei X eine normalverteilte Zufallsvariable mit dem Erwartungswert µ X und der Varianz σ ² X
sowie der Dichtefunktion:
1
f (x) =
2π σ
2
x
exp
−
1
x − µx
2
σx
2
Und seien a und b beliebige reelle Zahlen. Dann ist die Zufallsvariable W = a X + b ebenfalls
normalverteilt mit der Dichtefunktion
f (w
)=
1
2π
σ w2
exp
wobei der Erwartungswert µ
W
−
1
w − µw
2
σw
2
,
= a · µ X + b und die Varianz σ ² W = a ·σ ² X sind.
Satz) Additionssatz der Normalverteilung
Seien X und Y unabhängige normalverteilte Zufallsvariablen mit den Erwartungswerten
µ X bzw. µ Y sowie den Varianzen σ ² X bzw. σ ² Y und den Dichtefunktionen:
f (x ) = fX
1
(x) =
2π σ
2
x
exp
−
2
1 x − µx
2
σx
bzw.
f (y
) = fY ( y ) =
1
2π σ
exp
2
y
−
1 y − µy
2
2
σy
Dann ist die Summe der beiden Zufallsvariablen W = X + Y ebenfalls normalverteilt mit der
Dichtefunktion
f (w
)=
1
2π
σ w2
exp
−
1
w − µw
2
σw
2
,
wobei der Erwartungswert µ w = µ X + µ Y und die Varianz σ ² W = σ ² X + σ ² Y sind.
10
σ
σ
µ
µ
·
σ
σ
σ
W=X+Y
µ
µ
µ
µ
µ
11
' ()
*"
Die Exponentialverteilung spielt eine wichtige Rolle in der Warteschlangentheorie (queuing
theory) und Zuverlässigkeit von Systemen (reliability problems). Die Verteilung der Lebensdauer
z.B. von Bauteilen kann durch die Dichtefunktion der Exponentialverteilung beschrieben
werden.
Beispiel 3
Die Lebensdauern in (Jahren) von 40 baugleichen elektronischen Dioden einer Serienproduktion
wurden gemessen. Aus den Ergebnissen der Messungen wurde die folgende klassierte
Häufigkeitstabelle erstellt.
Klasse
Kj
[0 ; 2)
[2 ; 4)
[4 ; 6)
[6 ; 8)
[8 ; 10)
j
1
2
3
4
5
KlassenBreite: d j
2–0=2
2
2
2
2
KlassenMitte: m j
½ (0+2) = 1
3
5
7
9
Abs.
Häuf. h j
16
10
8
4
2
Rel. Häuf.
fj
16 / 40 = 0,4
0,25
0,2
0,1
0,05
Klassen.Dichte: f*j
0,4 / 2 = 0,2
0,125
0,1
0,05
0,025
Kumulierte
Häufig. F j
0,4
0,65
0,85
0,95
1
In der Abbildung sind das Histogramm der Klassendichten der relativen Häufigkeiten sowie die
Kurve der Dichtefunktion, die an den Messdaten angepasst wurde, dargestellt.
f
*
j
0.3
f(t)
Die approximierte Dichtefunktion lautet:
0.25
Häufigkeiten
0.2
f (t
0.15
)=
0
0 ,3 e
für
− 0 ,3t
für
t ≤ 0
t > 0
0.1
0.05
t
0
2
4
6
8
10
12
Frage
Wie groß ist die Wahrscheinlichkeit, dass eine Diode eine Lebensdauer zwischen 2 bis 4 Jahren
besitzt?
Lösung
Der Flächeninhalt des 2. Rechteckes:
2 ⋅ 0,125 = 0,25
Der Inhalt der Fläche unterhalb des Graphen der an dem Histogramm approximierten
Dichtefunktion zwischen den Grenzen 2 und 4:
P (2 ≤ T ≤ 4) =
4
2
0,3 e
− 0 ,3t
= 0 , 247
12
Exponential-Verteilung
Die Verteilung einer stetigen Zufallsvariable X mit der Dichtefunktion:
f (x
0
)=
x ≤ 0
für
α e
− αx
x > 0
für
,
α >0
mit
heißt Exponetialverteilung.
Die Verteilungsfunktion der Exponentialverteilung lautet:
0
x
F (x
) = P(X ≤ x ) =
f ( u ) du
1− e
für
x > 0
Verteilungsfunktion der
Exponential-Verteilung
1
F ( x0 )
0.12
0.1
− αx
F(x)
Dichtefunktion der
Exponential-Verteilung
0.14
x ≤ 0
=
− ∞
f(x)
für
F ( x0 ) = P ( X
x0 )
0.08
0.06
0.04
0.02
x
0
5
x100
15
x
0
20
x0
Satz: Erwartungswert und Varianz der Exponential-Verteilung
Der Erwartungswert der Exponential-Verteilung ist:
∞
x ⋅ f ( x ) dx =
µ =
− ∞
1
α
Die Varianz der Exponential-Verteilung ist:
∞
σ
2
2
f ( x ) ⋅ ( x − µ ) dx =
=
− ∞
1
2
α
13
Aufgabe 2
Die Wahrscheinlichkeitsverteilung der Lebensdauer T aus Beispiel 3 wurde durch die folgende
Dichtefunktion gegeben:
f (t
)=
0
0 ,3 e
t ≤ 0
für
− 0 ,3t
für
t > 0
a) Berechnen Sie mit Hilfe der Verteilungsfunktion die Wahrscheinlichkeit dafür, dass die
Lebensdauer einer Diode zwischen 2 bis 4 Jahren beträgt.
b) Geben Sie die durchschnittliche Lebensdauer an.
c) Geben Sie die Varianz (bzw. die Standardabweichung) der Verteilung der Lebensdauer an.
+
*"
Die Zuverlässigkeit (Reliability) wird meist mit der Überlebenswahrscheinlichkeit
(Lebensdauerwahrscheinlichkeit) bezeichnet. Das Gegenteil dazu ist die
Ausfallwahrscheinlichkeit. Der Zusammenhang zwischen der Ausfallrate und der Lebensdauer
lässt sich mit Hilfe der Weibull-Verteilung darstellen. Die Weibull-Verteilung kann als eine
Verallgemeinerung der Exponential-Verteilung angesehen werden. Die Exponentialverteilung
bietet sich als Verteilung von Lebensdauern an, wenn die Ausfallrate als konstant angesehen
wird. Ändert sich dagegen die Ausfallsrate mit der Zeit, so wird die Verteilung durch die WeibullVerteilung gegeben.
Weibull-Verteilung
Die Verteilung einer stetigen Zufallsvariable X mit der Dichtefunktion:
f (x) =
0
α ⋅ β ⋅ x β −1 e −
α⋅x β
für
x ≤ 0
für
x > 0
,
mit
α > 0 und β > 0
heißt Weibull-Verteilung.
Die Verteilungsfunktion der Weibull-Verteilung lautet:
0
x
F (x) = P(X ≤ x
) =
f ( u ) du
− ∞
für
x ≤ 0
=
1− e
− α⋅x β
für
x > 0
14
Bemerkung:
Für β = 1 ergibt sich aus der Weibull-Verteilung die Exponential-Verteilung.
f(x)
Dichtefunktionen verschiedener
Weibull-Verteilungen
β
α
β
α
β
α
x
β
α
0
Satz: Erwartungswert und Varianz der Weibull-Verteilung
Der Erwartungswert der Weibull-Verteilung ist:
∞
x ⋅ f ( x ) dx = α
µ =
−
1
β
β +1
⋅Γ
β
− ∞
Die Varianz der Weibull-Verteilung ist:
∞
σ
2
2
f ( x ) ⋅ ( x − µ ) dx = α
=
−
2
β
⋅ Γ
− ∞
β +2
β
− Γ2
β +1
β
Bemerkung:
Γ ( α ) gibt die Gamma-Funktion an.
Gamma-Funktion
Die Funktion Γ ( α ) wird als die Gamma-Funktion bezeichnet. Einige Werte der
Gammafunktion können mit Hilfe von Rekursionsformeln berechnet werden. Einige spezielle
Werte und Rekursionsformeln der Gammafunktion sind wie folgt:
Γ
( )=
1
2
Γ(1 ) = 1
π
Γ(α + 1) = α⋅Γ(α)
mit α > 0
Γ(n + 1) = n!
mit n = 1 ; 2 ; 3 ; . . .
(
Γ n +
1
2
)=
1⋅ 3 ⋅ 5
( 2 n − 1)
2n
⋅
π
mit n = 1 ; 2 ; 3 ; . . .
15
Beispiel 4
Die Lebensdauer T (in Stunden) eines bestimmten mechanischen Bauteil sei eine Zufallsgröße,
die durch eine Weibull-Verteilung mit α = 0,1 und β = 0,5 beschrieben wird. Berechnen Sie
a) die mittlere Lebensdauer des Bauteils.
b) die Wahrscheinlichkeit, dass die Lebensdauer des Bauteils mehr als 30 Stunden ist.
Lösung:
a) µ = 0 , 1
−
1
0,5
⋅Γ
0,5 + 1
0,5
= 0 , 1 − 2 ⋅ Γ ( 3 ) = 100 ⋅ 2 ! = 200 [ h ]
b)
30
P ( T > 30
) = 1 − P ( T ≤ 30 ) = 1 −
= 1−
{
0
− ∞
0 ⋅ dt +
0
+
= 1 −
0
+
1 –
=
− ∞
= 1 −
=
f ( t ) dt
{ 0,421 }
30
0
0 ,1 ⋅ 0 , 5 ⋅ t 0 , 5 − 1 e −
1
− e
1 − e
− 0 , 1⋅ t 0 , 5
0 , 1⋅ t 0 , 5
dt
}
30
0
− 0 , 1 ⋅ 30 0 , 5
−
1 − e
− 0 , 1⋅ 0 0 , 5
= 0,578
Aufgabe 3
Leiten Sie aus der Verteilungsfunktion der Weibull-Verteilung
F(x) = 1 − e
− α ⋅x β
für
x > 0
die Dichtefunktion dieser Verteilung her.
16
Herunterladen