Stetige Zufallsvariablen und Wahrscheinlichkeitsverteilungen

Werbung
Für eine stetige Zufallsvariable X in einem Intervall [ a ; b ] kann X jeden beliebigen Wert
annehmen. Die Wahrscheinlichkeiten werden in diesem Fall nicht mehr wie bei einer
diskreten Zufallsvariable auf nur bestimmte Punkte xk konzentriert, sondern sind
kontinuierlich im Intervall a X b verteilt. Für einen xk-Wert einer diskreten
Zufallsvariable liefert die Wahrscheinlichkeitsfunktion f ( xk ) die Wahrscheinlichkeit
P ( X = xk ) oder in einem bestimmten Intervall [ a ; b ] ist die Wahrscheinlichkeit
P ( a X b ) die Summe der jeweiligen Wahrscheinlichkeiten für die verschiedenen xk Werte in diesem Intervall. Dagegen für eine stetige Zufallsvariable sind die x-Werte in
einem Intervall [ a ; b ] so viele, dass sie nicht mehr abzählbar sind und folglich deren
Wahrscheinlichkeiten auch nicht aufsummiert werden können. Somit wird die
Wahrscheinlichkeit einer stetigen Zufallsvariable in einem Intervall mit Hilfe der
Wahrscheinlichkeitsdichte oder Dichtefunktion f ( x ) angegeben. Die Wahrscheinlichkeit
in einem Intervall a X b wird durch die Fläche unterhalb der Dichtefunktion in diesem
Intervall repräsentiert.
Aus der Serienproduktion zur Herstellung von Autobatterien wurde eine Stichprobe vom
Umfang N = 40 entnommen. Die Messungen der Lebensdauer X (in Jahren) der Batterien
ergab die folgende Tabelle für Häufigkeitsverteilung:
j
K
1
2
3
4
5
6
7
d
j
[ 1,5
[ 2,0
[ 2,5
[ 3,0
[ 3,5
[ 4,0
[ 4,5
;
;
;
;
;
;
;
2,0 )
2,5 )
3,0 )
3,5 )
4,0 )
4,5 )
5,0 )
j
0,5
0,5
0,5
0,5
0,5
0,5
0,5
mj
1,75
2,25
2,75
3,25
3,75
4,25
4,75
hj
2
1
4
15
10
5
3
fj
f
0,05
0,025
0,1
0,375
0,25
0,125
0,075
*
j
f
:=
d
Fj
j
j
0,1
0,05
0,2
0,75
0,5
0,25
0,15
0,05
0.075
0,175
0,55
0,8
0,925
1
Zeichnen Sie
ein Histogramm der relativen Häufigkeiten.
ein Dichtehistogramm der Klassendichten der relativen Häufigkeiten und ein
Häufigkeitspolygon
ein geglättetes relatives Häufigkeitspolygon
Wie groß ist die Wahrscheinlichkeit dafür, dass eine zufällig aus der Produktion
entnommene Batterie eine Lebensdauer zwischen 3,5 bis 4,5 Jahre hat?
1
j
0,375
0,250
0,125
Klassendichte der relative Häufigkeiten
0
1,75 2,25 2,75 3,25 3,75 4,25 4,75
1,5
5
Lebensdauer [Jahre]
Klassendichte der relative Häufigkeiten
Relative Häufigkeiten
f
0,75
0,50
0,25
0
1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25
1,5
5
Lebensdauer [Jahre]
Die Wahrscheinlichkeit, dass eine zufällig
entnommene Batterie eine Lebensdauer
zwischen 3,5 bis 4,5 Jahre hat, ist der
Flächeninhalt des 5. und 6. Rechteckes, d.h.
0,5⋅0,5 + 0,5⋅0,25 = 0,375 oder die Fläche
unterhalb des Häufigkeitspolygons oder
näherungsweise die gefärbte Fläche unterhalb
der Glockenkurve des geglätteten
Häufigkeitspolygons (Dichtefunktion).
0,75
0,50
0,25
1,75
0
f *j
2,25 2,75 3,25 3,75 4,25 4,75
Lebensdauer [Jahre]
Zeichnen Sie für Daten des vorigen Beispiels
ein kumulatives relatives Häufigkeitspolygon (die empirische Verteilungsfunktion)
ein geglättetes kumulatives relatives Häufigkeitspolygon.
Wie groß ist die Wahrscheinlichkeit dafür, dass eine zufällig aus der Produktion
entnommene Batterie eine Lebensdauer weniger als 3,5 Jahre hat?
Häufigkeiten
Fj
!
#
"
Kumulierte Relative Häufigkeiten
1,0
0,75
0,50
0,25
0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
Lebensdauer [Jahre]
"
Lebensdauer [Jahre]
3,5
P ( X ≤ 3 ,5
) = F (3,5 ) =
f ( x ) dx ≈ 0 , 55
− ∞
2
$%
(
&
$% %
"
'
'
(
Stetige Zufallsvariable
Eine Zufallsvariable heißt stetig, wenn sie jeden beliebigen reellen Wert in einem endlichen
oder unendlichen Intervall annehmen kann.
$% %) &
!
'
(
Dichtefunktion (Wahrscheinlichkeitsdichte)
Die Wahrscheinlichkeitsverteilung einer stetigen Zufallsvariable X lässt sich durch die
Dichtefunktion oder Wahrscheinlichkeitsdichte
f(x)
beschreiben oder durch die dazugehörige Verteilungsfunktion:
x
F (x ) = P ( X ≤ x
)
f (u ) du
=
− ∞
darstellen.
Die Dichtefunktion erfüllt folgende Eigenschaften:
f(x)
0
f ist stetig bis auf endliche Punkte
∞
f ( x ) dx = 1
− ∞
)2ba
Die Flugdauer X (in Minuten) einer Airline für Flüge von Berlin nach Rom sei eine stetige
Zufallsvariable. Die Flugdauer für diese Flugstrecke kann zwischen 120 und 140 Minuten
dauern. Die Dichtefunktion, die diesen Flug beschreibt sei wie folgt:
f (x
)=
0
1
20
0
für
für
für
x < 120
120 ≤ x ≤ 140
x > 140
Zeigen Sie, dass f eine Dichtefunktion ist..
Bestimmen Sie die Verteilungsfunktion und stellen Sie die Wahrscheinlichkeitsverteilung
von X graphisch dar.
Wie groß ist der Anteil an Flügen für diese Strecke, die weniger als 130 Minuten dauern?
3
*+
Die Dichtefunktion ist in dem
Definitionsbereich [120 ; 140] positiv.
f(x)
Die Dichte Funktion ist in dem
Definitionsbereich [120 ; 140] stetig.
1/20
Es muss noch überprüft werden, ob
∞
f ( x ) dx = 1 gilt:
0
120
Flugdauer [min]
∞
140
120
f ( x )d x =
− ∞
140
0 dx +
120
− ∞
0
=
x
− ∞
20
0 dx
dx +
20
1
+
∞
1
140
140
x
+
0
= 1
120
Die Verteilungsfunktion ist:
x
120
F(x) =
f (u )d u =
− ∞
x
120
− ∞
=
0
0
F (x
1
) =
F(x)
1
0 du +
x − 6
20
1
1
+
20
20
du
x − 6
x < 120
für
120 ≤ x ≤ 140
für
x > 140
für
"
1
0
120
Flugdauer [min]
140
x
4
Die Wahrscheinlichkeit für alle Flugdauern unterhalb von X = 130 Minuten ist:
130
F ( 130 ) = P ( X ≤ 130
)=
120
f ( x )d x =
− ∞
130
0 ⋅d x +
120
− ∞
1
= 0 +
20
130
x
1
=
20
120
⋅ 130
1
20
⋅d x
−
1
20
⋅ 120
= 0,5
f(x)
F(x)
1
1/20
0,5
0
"
120
0,5
130
Flugdauer [min]
140
0
x
120
130
Flugdauer [min]
140
x
,
Wie groß ist der Anteil an Flügen für die Flugstrecke des vorigen Beispiels, die mehr als 125
Minuten dauern?
*+
∞
f ( x ) dx = 1
Für die Gesamtwahrscheinlichkeit der Dichtefunktion gilt
− ∞
Folglich ist die Wahrscheinlichkeit für alle Flugdauern oberhalb von X = 130 Minuten ist:
P ( X > 130 ) = 1 −
[
P ( X ≤ 130 )
]
= 1 − F ( 130 ) = 1 − 0 , 5 = 0 , 5
f(x)
1/20
0
120
130
Flugdauer [min]
140
x
5
$%) "
&
'
Ähnlich den Maßzahlen in der beschreibenden Statistik ordnet man der
Wahrscheinlichkeitsverteilung einer Zufallsvariable X Kennwerte oder Maßzahlen zu. Zu
ihnen zählen der Mittelwert (Erwartungswert) und die Varianz bzw. die Standardabweichung.
$%)%
&
! .
.
/0
.
!
'
Erwartungswert µ = E[ X ] einer Stetigen Zufallsvariable
Der Erwartungswert E[ X ] einer stetigen Zufallsvariable X ist:
∞
µ = E[X ] =
x ⋅ f ( x ) dx
,
− ∞
Dabei ist f ( x ) die Dichtefunktion der stetigen Zufallsvariable.
12ba
Die Flugdauer X (in Minuten) einer Airline für Flüge von Berlin nach Rom sei eine stetige
Zufallsvariable mit der Dichtefunktion:
1
f (x) =
für
20
120 ≤ x ≤ 140
0
sonst
Berechnen Sie die mittlere Flugdauer für diese Flugstrecke.
*+
∞
120
x ⋅ f ( x )d x =
µ =
− ∞
140
x ⋅0 d x +
120
− ∞
=
x⋅
0
+
1
20
⋅
x2
2
1
20
∞
x⋅0 d x
dx +
140
140
+
0
= 130
120
Also beträgt die mittlere Flugdauer für diese Flugstrecke 130 Minuten.
6
$%)%)
&
"
Varianz
23
'
.
!
² = Var[ X ] und Standardabweichung
Die Varianz
'
einer stetigen Zufallsvariable
² einer stetigen Zufallsvariable X ist:
∞
σ
2
= Var [ X
]
f (x )⋅ ( x − µ
=
) 2 dx
− ∞
Dabei sind f ( x ) die Dichtefunktion und µ der Erwartungswert der stetigen
Zufallsvariable.
Die Standardabweichung ist: σ =
σ
2
Die Varianz für stetige Zufallsvariablen kann auch mit der bequemeren Formel
berechnet werden.
∞
σ
2
f (x)⋅ x
=
2
dx
− µ
2
− ∞
,
)
Die Flugdauer X (in Minuten) einer Airline für Flüge von Berlin nach Rom sei eine stetige
Zufallsvariable mit der Dichtefunktion:
1
f (x
)=
20
0
für
120 ≤ x ≤ 140
sonst
Die mittlere Flugdauer für diese Flugstrecke beträgt 130 Minuten (s. voriges Beispiel: Bsp. 3)
Berechnen Sie die Standardabweichung der Flugdauer für diese Flugstrecke.
*+
-
7
$%)%1
4
!
'
&
Das q-Quantil mit 0 < q < 1 ist der x-Wert, der die Gesamtfläche unterhalb der
Dichtefunktion f ( x ) in zwei Teilflächen aufteilt, so dass links von ihm der Inhalt der einen
Teilfläche q und rechts von ihm der Inhalt der anderen Teilfläche ( 1 – q ) beträgt. Der
Flächeninhalt unter dem Graphen der Dichtefunktion f ( x ) bis zu einem beliebigen x-Wert
wird durch den Funktionswert der Verteilungsfunktion F ( x ) bei diesem x-Wert angegeben.
Wenn die Verteilungsfunktion F streng monoton wachsend ist, dann lassen sich die
Quantilen mit Hilfe dieser Verteilungsfunktion bestimmen.
Quantile einer stetigen Wahrscheinlichkeitsverteilung
Das q-Quantil xq mit 0 < q < 1 einer stetigen Wahrscheinlichkeitsverteilung ist die
Zahl auf der x-Achse, für die gilt:
F ( xq ) = q ,
falls die Verteilungsfunktion F streng monoton wachsend ist
,
1
Die Flugdauer X (in Minuten) einer Airline für Flüge von Berlin nach Rom sei eine stetige
Zufallsvariable mit der Verteilungsfunktion:
0
F (x
) =
1
x < 120
für
x − 6
20
1
für
120 ≤ x ≤ 140
für
x > 140
Bestimmen Sie das 0,25-Quantil x 0,25 der Flugdauer für diese Flugstrecke.
f(x)
1/20
xq
0
F(x)
Fläche F (xq)
:
q = 0,25
*+
120
x0,25
Flugdauer [min]
"
1
F (xq)
xq
q = 0,25
140 x
0
120 x0,25
Flugdauer [min]
140
x
8
'
2
'
&
In den folgenden Abschnitten werden einige wichtige stetige
Wahrscheinlichkeitsverteilungen vorgestellt, die in der Technik, Naturwissenschaften und
in der Statistik eine wichtige Rolle spielen.
$%1
5
Die Gaußsche Normalverteilung spielt eine wichtige Rolle in der
Wahrscheinlichkeitsrechnung und Statistik. Die Verteilung von vielen stetigen
Zufallsvariablen in der Technik und den Naturwissenschaften wie z.B. physikalisch
technische Messgrößen können durch die Dichtefunktion der Normalverteilung beschrieben
werden. Bei vielen Messwerten, die von vielen Einzeleinflüssen beeinflusst werden, häufen
sich die Werte in der Nähe des Mittelwerts (Sollwert). Die Dichtekurve die Form einer
Glockenkurve besitzt.
6
Aus der Serienproduktion zur Herstellung von Autobatterien wurde eine Stichprobe vom
Umfang N = 40 entnommen. Die Messungen der Lebensdauer X (in Jahren) der Batterien
ergab die folgende Tabelle für die Häufigkeitsverteilung:
j
Kj
1
2
3
4
5
6
7
[ 1,5
[ 2,0
[ 2,5
[ 3,0
[ 3,5
[ 4,0
[ 4,5
dj
;
;
;
;
;
;
;
2,0 )
2,5 )
3,0 )
3,5 )
4,0 )
4,5 )
5,0 )
mj
0,5
0,5
0,5
0,5
0,5
0,5
0,5
hj
1,75
2,25
2,75
3,25
3,75
4,25
4,75
fj
2
1
4
15
10
5
3
f
Fj
j
0,05
0,025
0,1
0,375
0,25
0,125
0,075
0,1
0,05
0,2
0,75
0,5
0,25
0,15
0,05
0.075
0,175
0,55
0,8
0,925
1
In der Abbildung sind das Dichtehistogramm sowie die Kurve der Dichtefunktion, die an den
Messdaten angepasst wurde, dargestellt.
7
0,75
0,50
0,25
0
1,75 2,25 2,75 3,25 3,75 4,25 4,75 x
3,5
4,5 [Jahre]
Die approximierte Dichtefunktion lautet:
f (x) =
1
2 π ⋅ 0 , 53
2
exp
−
1
x − 3 , 37
2
0 , 53
2
7
Wie groß ist die Wahrscheinlichkeit, dass eine zufällig aus der Produktion entnommene
Batterie eine Lebensdauer zwischen 3,5 bis 4,5 Jahre hat?
9
*+
Der Flächeninhalt des 5. und 6. Rechteckes:
0,5 ⋅ 0,5 + 0,5 ⋅ 0,25 = 0,375
Der Inhalt der Fläche unterhalb des Graphen der an dem Histogramm approximierten
Dichtefunktion zwischen den Grenzen 2 und 4:
P ( 3 ,5 ≤ X ≤ 4 ,5 ) =
4,5
1
2 π ⋅ 0 , 53
−
e
⋅
1
x − 3 , 37
2
0 , 53
2
dx = 0 , 386
3,5
Der Wert dieses Integral muss numerisch berechnet werden.
$%1%
8
5
Gaußsche Normal-Verteilung
Die Verteilung einer stetigen Zufallsvariable X mit der Dichtefunktion:
1
f (x) =
2π σ
exp
2
−
1
x − µ
2
σ
2
heißt Gaußsche Normalverteilung.
Dabei sind die Parameter
der Erwartungswert und
X kann die Werte : – ∞ < x < ∞ annehmen.
² die Varianz dieser Verteilung.
Die Verteilungsfunktion der Gaußschen Normalverteilung ist:
x
1
− ∞
2π σ
F( x ) = P( X ≤ x ) =
2
exp
−
1
u − µ
2
σ
2
du
5
"
µ=0
σ =1
f(x)
µ=0
σ =2
µ=2
σ =1
µ=–2
σ =2
–4
–2
0
2
4
x
10
Eigenschaften der Normalverteilung
Die Kurve der Dichtefunktion der Normalverteilung ist symmetrisch bzgl. der Gerade
x=
Für eine normalverteilte Zufallsvariable liegen
ca. 68,2%
ca. 95%
ca. 99.7%
der beobachteten Werte zwischen
der beobachteten Werte zwischen
der beobachteten Werte zwischen
σ
σ
$%1%)
σ
σ
µ
–
– 2
– 3
σ
und
und
und
+
+2
+3
σ
&
7
5
7
8
5
Möchte man für eine stetige Zufallsvariable, deren Verteilung durch die Normalverteilung
gegeben ist, die Wahrscheinlichkeit für alle Werte „kleiner als einen bestimmten Wert x0
bestimmen, so berechnet man definitionsgemäß folgendes Integral
xo
P ( X ≤ xo
)
= F (xo
)=
f ( x ) dx =
− ∞
xo
1
2π σ
2
exp
− ∞
−
1
x − µ
2
σ
2
dx
Leider kann F ( x ) , d.h. die Stammfunktion der Dichtefunktion f ( x ) der
Normalverteilung nicht analytisch mit Hilfe von Integraltechniken bestimmt werden. Der
Wert des Integrals muss numerisch berechnet werden.
11
6
Die Lebensdauer X (in Jahren) der Batterien einer Serienproduktion sei eine
normalverteilte Zufallsgröße mit der Dichtefunktion: (s. Bsp. 4)
f(x )
f (x
)=
1
−
2 π ⋅ 0 , 53
mit µ = 3,37 und
e
1
x − 3 , 37
2
0 , 53
2
P(X
3,5 )
σ = 0,53
µ = 3,37
= 0,53
2
3 µ
4
5
x
3,5
Wie groß ist die Wahrscheinlichkeit, dass eine zufällig aus der Produktion entnommene
Batterie eine Lebensdauer weniger als 3,5 Jahre hat?
*+
-
P ( X ≤ 3 ,5 ) = F ( 3 ,5 ) =
$%1%1 '
&
5
1
2 π ⋅ 0 , 53
3,5
−
e
⋅
1
x − 3 , 37
2
0 , 53
2
dx = 0 , 596
− ∞
"
"
5
Da die Stammfunktion F (x ) der Dichtefunktion f (x ) der Normalverteilung nicht bestimmt
werden kann, muss der Wert für F (x0 ) für einen beliebigen x0 numerisch berechnet werden.
Man kann also numerische berechnete Werte-Tabellen erstellen, die für verschiedene xWerte sowie - und -Werten die dazugehörigen F (x ) enthalten. Leider werden solche
Tabellen sehr groß und unübersichtlich.
Geht man aber von einer beliebigen normalverteilten Zufallsvariable X durch die lineare
Transformation (Substitution) zu der standardisierten Variable:
Z =
X − µ
σ
über, so genügt die Zufallsvariable Z auch einer Normalverteilung mit = 0 und
=1
Somit lassen sich alle Normalverteilungen durch die Standardisierung auf eine einzige
Verteilung zurückführen.
12
Standard-Normalverteilung
Die Verteilung einer stetigen Zufallsvariable Z mit der Dichtefunktion:
ϕ(z
)
=
1
exp
2π
−
1 2
z
2
heißt Standardnormalverteilung.
Dabei sind die Parameter
= 0 und
² = 1.
Ihre Verteilungsfunktion lautet:
z
Φ( z
)
= P(Z ≤ z
)
=
− ∞
1
2π
exp
−
1
v
2
2
dv
Im Anhang befindet sich eine Tabelle mit den Werten der Verteilungsfunktion Φ ( z ) der
Standard-Normalverteilung für beliebige z.
Mit Hilfe der Standard-Normalverteilung kann die Wahrscheinlichkeit F (x0 ) = P ( X
bestimmt werden.
x0 )
Φ ( z)
P(Z
z0 ) = Φ ( z0 )
z
(z)
P(Z
z0 )
z
z0
z.B. für z 0 = 0,76 beträgt die Wahrscheinlichkeit P ( Z
0,76 ) = Φ ( 0,76 ) = 0,7764
13
Beziehung zur Bestimmung der Wahrscheinlichkeit P ( X x0 ) einer beliebigen
normalverteilten Zufallsvariable X mit Hilfe der Standard-Normalverteilung
P(X
x0 )
P(Z
=
F ( x0 )
z0 )
Φ ( z0 )
=
(z)
F ( x0 )
f(x)
Φ ( z0 )
=
0
µ
xo
1
2π σ
z =
x0
2
x − µ
σ
exp
−
−∞
x
1
x − µ
2
σ
dz =
1
σ
z
z0
0
2
dx
zo
1
dx
exp
2π
−∞
−
1
2
z
2
dz
6
Bestimmen Sie mit Hilfe der Tabelle für die Werte der Verteilungsfunktion der StandardNormalverteilung die Wahrscheinlichkeit aus dem vorigen Beispiel dafür, dass eine zufällig
aus der Produktion entnommene Batterie eine Lebensdauer weniger als 3,5 Jahre hat?
Die Lebensdauerverteilung entspricht einer Normalverteilung mit:
µ = 3,37 und
= 0,53 .
*+
Es soll die Wahrscheinlichkeit für alle x-Werte kleiner als die obere Grenze x0 = 3,5
berechnet werden. Die Substitution liefert folgende obere Grenze für die Zufallsvariable Z:
Z =
X − µ
σ
zo
=
xo − µ
σ
=
3 , 5 − 3 , 37
0 , 53
= 0 , 245
Somit erhält man für die gesuchte Wahrscheinlichkeit:
14
(z)
f(x )
P(X
z²
exp
2
3,5 )
Z =
2
1
(z)=
3 3,5 4
P(X
3,5 )
5
Φ ( 0,245 )
X –
0 z0 = 0,245
x
=
=
2
P(Z
z
0,245 )
Φ ( 0,245 )
≈ 0,5967
Da in der Tabelle der Wert z 0 = 0,245 nicht eingetragen ist, wird die
Wahrscheinlichkeit Φ ( 0,245 ) näherungsweise als das arithmetische Mittel der
Wahrscheinlichkeiten Φ ( z ) für die beiden benachbarten z-Werten angegeben.
Φ ( 0,245 ) = ½ [ Φ ( 0,24 ) + Φ ( 0,25 ) ] = ½ [ 0,5948 + 0,5987 ] = 0,5967
Liegt ein z 0-Wert mit mehr als 2 Nachkommastellen vor, so kann Φ ( z 0) aus der Tabelle der
Standard-Normal-Verteilung genauer durch lineare Interpolation bestimmt werden.
,
6
Geben Sie mit Hilfe der Tabelle für die Werte der Verteilungsfunktion der StandardNormalverteilung die Wahrscheinlichkeit aus dem vorigen Beispiel dafür an, dass eine
zufällig aus der Produktion entnommene Batterie eine Lebensdauer weniger als 4,5 Jahre
hat?
*+
-
P( X
4,5 ) = P( z
2,132 ) = Φ (2,132) = 0,9834
6
Bestimmen Sie mit Hilfe der Werte für die Verteilungsfunktion der Standard-Normalverteilung
die Wahrscheinlichkeit aus dem vorigen Beispiel dafür, dass eine zufällig aus der Produktion
entnommene Batterie eine Lebensdauer zwischen 3,5 und 4,5 Jahre hat?
15
*+
Gesucht ist also: P ( 3,5
f(x)
P ( 3,5
X
4,5 ) = ?
X
4,5 )
0.7
0.6
0.5
0.4
0.3
0.2
0.1
8
5
P(X
3,5 )
"
=
2
3 3,5 4 4,5 5
P(X
f(x)
6
x
4,5 )
f(x)
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.7
0.6
0.5
0.4
0.3
0.2
0.1
–
2
3
4 4,5 5
6x
2
3
3,5 4
5
'
P ( 0,245
ϕ(z)
5
"
2,13 )
Z
0.7
0.6
0.5
0.4
0.3
0.2
0.1
x
=
2
3
4 2,135
0
0,245
ϕ(z)
P(Z
6 z
P(Z
ϕ(z)
2,13 )
0,245 )
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.7
0.6
0.5
0.4
0.3
0.2
0.1
–
2
P ( 3,5
3
0
X
4
2,13 5
4,5 ) =
=
=
2
6z
P ( 0,245
P(Z
Z
2,13 ) –
0,9834
3 0 0,245
4
–
5
z
2,13 )
P(Z
0,5967
0,245 )
=
0,3867
16
Formel zur Bestimmung der Wahrscheinlichkeiten einer normalverteilten
Zufallsvariable X zwischen zwei x-Werten a und b :
folgt:
Aus der Beziehung
P(a
P(Z
b)
X
b) –
F ( b) –
P(Z
F(a)
P(z1
=
a)
=
P(Z
z2) –
Φ ( z 2)
=
f ( x)
z2)
Z
P(Z
–
z1)
Φ(z1)
( z)
Φ ( z2 ) – Φ ( z1 )
F ( b) – F ( a )
σ
a
µ
b
z1 0
x
z2
z
Formel zur Bestimmung der Wahrscheinlichkeiten mit der Standardnormalverteilung für negative Wert von z :
Da die Dichtefunktion der Standardnormalverteilung symmetrisch zu 0 ist, gilt:
Φ (– z ) = 1 – Φ (z )
9
Der Durchmesse X von seriengefertigten Kugeln sei eine normalverteilte Zufallsgröße.
Langzeitige Messungen des Durchmessers von mehreren hergestellten Kugeln ergab eine
Normalverteilung mit = 50 [mm] und
= 10 [mm]. Geben Sie an, welcher Anteil der
hergestellten Kugeln einen Durchmesser zwischen 45 [mm] und 62 [mm] hat.
*+
Normalverteilung mit
= 50 [mm] und
= 10 [mm].
Der Anteil der Kugel mit einem Durchmesser zwischen a = 45 [mm] und b = 62 [mm]
muss berechnet werden. Dafür soll die Wahrscheinlichkeit für alle x-Werte zwischen den
Grenzen x1 = 45 und x2 = 62 berechnet werden.
17
1. Lösungsweg mit Hilfe des Integrals:
P ( 45 ≤ X ≤ 62
)
62
1
=
2 π 10 2
e
−
1
2
x − 50
10
2
dx = F ( 62
)
− F ( 45
)
45
Dieses Integral können wir numerisch mit Hilfe des Taschenrechners ausrechnen, denn
die beiden Grenzen sind Zahlen. Oder wir verwenden die Standard-Normal-Verteilung.
2. Lösungsweg mit Hilfe der Tabelle der Standard-Normal-Verteilung:
Die Substitution liefert folgende Grenzen für die Zufallsvariable Z:
Z =
X − µ
σ
z
1
z
2
=
=
45 − 50
10
62 − 50
10
= − 0,5
1, 2
=
Somit erhält man für die gesuchte Wahrscheinlichkeit:
(z)
1
(z)=
exp
2
z²
2
F (62) – F(45)
f(x)
Z =
σ
4
0
a = 45
µ
P ( 45
6
σ
0
b = 62
X
Φ (1,2) – Φ (– 0,5)
X – µ
62 )
x
z1 = – 0,5
0
z2 = 1,2
=
P ( – 0,5
=
Φ ( 1,2 ) – Φ ( – 0,5 )
=
0,8849
Z
–
z
1,2 )
0,3085
= 0,5764
18
$%1%6 4
5
Das q-Quantil z q mit 0 < q < 1 teilt die Fläche unter dem Graphen der Standard-NormalVerteilung ϕ ( z ) in 2 Teilflächen, so dass links von ihm der Inhalt der einen Teilfläche q
und rechts von ihm der Inhalt der anderen Teilfläche 1 – q beträgt.
(z)
P(Z
zq ) = q
Φ ( zq ) = q
q
zq
0
z
Quantilen / Perzentilen der Normal-Verteilung
Das q-Quantil z q mit 0 < q < 1 der Sandard-Normal-Verteilung ist die Zahl auf
der z-Achse , für die gilt:
Φ(zq) = q
Das q-Quantil x q mit 0 < q < 1 der Gaußschen Normal-Verteilung ist die Zahl auf
der x-Achse , für die gilt:
F(xq) = q
Dieses lässt sich dann mit Hilfe von z q wie folgt berechnen:
zq
=
xq − µ
σ
⇔
xq = σ ·zq + µ
,
9
Bestimmen Sie das 0,025-Quantil (2,5%-Quantil) x 0,025 für die Verteilung der
Lebensdauer der Batterien aus Bsp. 4.
*+
-
19
$%6
!:
Die Exponentialverteilung spielt eine wichtige Rolle in der Warteschlangentheorie (queuing
theory) und Zuverlässigkeit von Systemen (reliability problems). Die Verteilung der
Lebensdauer z.B. von Bauteilen kann durch die Dichtefunktion der Exponentialverteilung
beschrieben werden.
$
Die Lebensdauern in (Jahren) von 40 baugleichen elektronischen Dioden einer
Serienproduktion wurden gemessen.
0,2
1,5
2,7
4,8
0,3
1,6
2,78
5,0
0,4
1,72
3,1
5,8
0,55
1,8
3,2
5,99
0,6
1,9
3,8
6,0
0,8
1,92
3,96
6,7
0,84
2,0
4,1
7,0
1,0
2,1
4,32
7,4
1,2
2,35
4,5
8,6
1,45
2,5
4,65
9,4
Aus den Ergebnissen der Messungen wurde die folgende klassierte Häufigkeitstabelle
erstellt.
Klasse
Kj
[0 ; 2)
[2 ; 4)
[4 ; 6)
[6 ; 8)
[8 ; 10)
j
1
2
3
4
5
KlassenBreite: d j
2–0=2
2
2
2
2
KlassenMitte: m j
½ (0+2) = 1
3
5
7
9
Abs.
Häuf. h j
16
10
8
4
2
Rel. Häuf.
fj
16 40 = 0,4
0,25
0,2
0,1
0,05
Klassendichte: Kumulierte
Häufig. F j
f j
0,4
0,4 2 = 0,2
0,125
0,65
0,1
0,85
0,05
0,95
0,025
1
In der Abbildung sind das Dichte-Histogramm und die Kurve der Dichtefunktion, die an den
Messdaten angepasst wurde, dargestellt.
j
Häufig.
f
f(x)
0.3
Die approximierte Dichtefunktion lautet:
0.25
0.2
f (x
0.15
)=
0
0,3 e
für
− 0,3 x
für
x ≤ 0
x > 0
0.1
0.05
x
0
2
4
6
8
10
12
7
Wie groß ist die Wahrscheinlichkeit, dass eine Diode eine Lebensdauer zwischen 2 bis 4
Jahren besitzt?
*+
Mit Hilfe des Dichte-Histogramms:
Der Flächeninhalt des 2. Rechteckes:
2 ⋅ 0,125 = 0,25
20
Mit Hilfe der Dichtefunktion:
Der Flächeninhalt unterhalb des Graphen der Dichtefunktion zwischen den Grenzen 2
und 4:
P (2 ≤ X ≤ 4) =
4
2
0 ,3 e
− 0,3 x
dx = 0 , 247
Exponential-Verteilung
Die Verteilung einer stetigen Zufallsvariable X mit der Dichtefunktion:
0
f (x
x ≤ 0
für
)=
,
− αx
α e
α >0
mit
x > 0
für
heißt Exponetialverteilung.
Die Verteilungsfunktion der Exponentialverteilung lautet:
0
x
F(x
) = P(X ≤ x ) =
f ( u ) du
für
=
1− e
− ∞
− αx
F(x)
f(x)
!:
x ≤ 0
"
für
x > 0
"
!:
"
1
0.14
F ( x0 )
0.12
F ( x0 ) = P ( X
0.1
x0 )
0.08
0.06
0.04
x
0.02
0
5
x100
15
x
0
20
x0
Satz: Erwartungswert und Varianz der Exponential-Verteilung
Der Erwartungswert der Exponential-Verteilung ist:
∞
x ⋅ f ( x ) dx =
µ =
− ∞
1
α
Die Varianz der Exponential-Verteilung ist:
∞
σ
2
2
f ( x ) ⋅ ( x − µ ) dx =
=
− ∞
1
2
α
21
,
$
Die Wahrscheinlichkeitsverteilung der Lebensdauer X aus dem vorigen Beispiel (Bsp. 6)
wurde durch die folgende Dichtefunktion gegeben:
– 0,3 x
f ( x ) = 0,3 e
, für x > 0
Geben Sie mit Hilfe der Verteilungsfunktion die Wahrscheinlichkeit dafür an, dass die
Lebensdauer einer Diode zwischen 2 bis 4 Jahren beträgt.
Geben Sie die durchschnittliche Lebensdauer an.
Geben Sie die Varianz (bzw. die Standardabweichung) der Verteilung der Lebensdauer
an.
*+
-
Satz: Quantilen der Exponential-Verteilung
Das q-Quantil xq mit 0 < q < 1 der Exponentialverteilung ist die Zahl auf der x-Achse,
für die gilt:
F (xq ) = q
1− e
Folglich lässt sich das q-Quantil xq
xq
=
− α⋅ xq
!:
q
der Exponentialverteilung wie folgt bestimmen:
−
ln ( 1 − q )
α
F(x)
f(x)
=
1
"
"
!:
"
F (xq) = q
0.14
0.12
Fläche: F (xq)
0.1
0.08
0.06
0.04
0.02
0
q-Quantil
q-Quantil
q
x
x
5
10
xq
15
20
0
xq
22
$%9 &
"
Die Zuverlässigkeit (Reliability) wird meist mit der Überlebenswahrscheinlichkeit
(Lebensdauerwahrscheinlichkeit) bezeichnet. Das Gegenteil dazu ist die
Ausfallwahrscheinlichkeit. Der Zusammenhang zwischen der Ausfallrate und der
Lebensdauer lässt sich mit Hilfe der Weibull-Verteilung darstellen. Die Weibull-Verteilung
kann als eine Verallgemeinerung der Exponential-Verteilung angesehen werden. Die
Exponentialverteilung bietet sich als Verteilung von Lebensdauern an, wenn die Ausfallrate
als konstant angesehen wird. Ändert sich dagegen die Ausfallsrate mit der Zeit, so wird die
Verteilung durch die Weibull-Verteilung gegeben.
Weibull-Verteilung
Die Verteilung einer stetigen Zufallsvariable X mit der Dichtefunktion:
0
für
x ≤ 0
f (x) =
,
α ⋅ β ⋅ x β −1 e
− α⋅x β
für
mit
α > 0 und β > 0
x > 0
heißt Weibull-Verteilung.
Die Verteilungsfunktion der Weibull-Verteilung lautet:
0
x
F (x) = P(X ≤ x
) =
f ( u ) du
für
x ≤ 0
=
− ∞
1− e
− α⋅x β
für
x > 0
Für β = 1 ergibt sich aus der Weibull-Verteilung die Exponential-Verteilung.
f ( x)
α =1
β = 4
α =1
β =1
α =1
β = 0,5
α =1
β = 2
x
0
23
Satz
: Erwartungswert und Varianz der Weibull-Verteilung
Der Erwartungswert der Weibull-Verteilung ist:
∞
x ⋅ f ( x ) dx = α
µ =
−
1
β
β +1
⋅Γ
β
− ∞
Die Varianz der Weibull-Verteilung ist:
∞
σ
2
2
f ( x ) ⋅ ( x − µ ) dx = α
=
−
2
β
⋅ Γ
β +2
− ∞
β
− Γ2
β +1
β
- Γ ( α ) gibt die Gamma-Funktion an.
Gamma-Funktion
Die Funktion Γ ( α ) wird als die Gamma-Funktion bezeichnet. Einige Werte der
Gammafunktion können mit Hilfe von Rekursionsformeln berechnet werden. Einige
spezielle Werte und Rekursionsformeln der Gammafunktion sind wie folgt:
Γ
( )=
1
2
Γ(1 ) = 1
π
Γ(α + 1) = α⋅Γ(α)
mit α > 0
Γ(n + 1) = n!
mit n = 1 ; 2 ; 3 ; . . .
(
Γ n +
1
2
)=
( 2 n − 1)
1⋅ 3 ⋅ 5
2n
⋅
π
mit n = 1 ; 2 ; 3 ; . . .
;
Die Lebensdauer X (in Stunden) einer mechanischen Feder sei eine Zufallsgröße, die durch
eine Weibull-Verteilung mit α = 0,1 und β = 0,5 beschrieben wird.
Berechnen Sie
die mittlere Lebensdauer der Feder.
die Wahrscheinlichkeit, dass die Lebensdauer der Feder mehr als 30 Stunden ist.
*+
-
µ = 0 ,1
−
1
0,5
⋅Γ
0,5 + 1
0,5
= 0 , 1 − 2 ⋅ Γ ( 3 ) = 100 ⋅ 2 ! = 200 [ h ]
24
30
P ( X > 30
) = 1 − P ( X ≤ 30 ) = 1 −
= 1−
{
− ∞
0 ⋅ dx +
0
+
= 1 −
0
+
1 –
=
− ∞
0
= 1 −
=
f ( x ) dx
30
0
1
0 ,1 ⋅ 0 , 5 ⋅ x 0 , 5 − 1 e −
− e
1 − e
− 0 , 1⋅ x 0 , 5
0 , 1⋅ x 0 , 5
dx
}
30
0
− 0 , 1 ⋅ 30 0 , 5
−
1 − e
− 0 , 1⋅ 0 0 , 5
{ 0,421 } = 0,578
,
;
Leiten Sie aus der Verteilungsfunktion der Weibull-Verteilung
F(x) = 1 − e
− α ⋅x β
für
x > 0
die Dichtefunktion dieser Verteilung her.
*+
-
,
;
Die Wahrscheinlichkeitsverteilung der Lebensdauer X einer mechanischen Feder aus
Beispiel 2 wurde durch eine Weibull-Verteilung mit α = 0,1 und β = 0,5 gegeben.
Geben Sie mit Hilfe der Verteilungsfunktion die Wahrscheinlichkeit dafür an,
dass die Lebensdauer der Feder mehr als 30 Stunden dauert.
*+
-
25
$%$
*
5
$%$%
*
5
"
Wenn eine Zufallsvariable nicht selbst normalverteilt ist, sondern ihr Logarithmus
normalverteilt ist, so spricht man von einer Lognormalverteilung
Log-Normal-Verteilung
Die Verteilung einer stetigen Zufallsvariable X mit der Dichtefunktion:
0
f (x) =
1
2π β
2
⋅
1
x
⋅ exp −
für
1
ln x − α
2
β
x ≤ 0
,
2
für
mit
β > 0
x > 0
heißt Lognormalverteilung.
Die Verteilungsfunktion der Lognormalverteilung ist:
x
F (x) = P(X ≤ x
) =
x
f ( u ) du =
0
− ∞
1
2π β
2
⋅
1
u
⋅ exp −
1
ln u − α
2
β
2
du
f(x)
α
α
α
β
β
β
x
0
Satz: Erwartungswert und Varianz der Log-Normalverteilung
Der Erwartungswert der Lognormalverteilung ist:
∞
x ⋅ f ( x ) dx = e
µ =
α +
1
2
β2
− ∞
Die Varianz der Lognormalverteilung ist:
∞
σ
2
=
f ( x ) ⋅ ( x − µ ) 2 dx =
eβ
2
− 1
⋅ e 2α
+ β2
− ∞
26
$%$%)
'
&
5
Für eine beliebige log-normalverteilte Zufallsvariable X erhält man durch die Substitution
Y = ln X
eine Zufallsvariable Y , deren Verteilung der Gaußschen-Normalverteilung mit
= β genügt. Analog zu der standardisierten Variable erhält man durch die
Transformation
Y − α
ln X − α
Z =
=
β
= α und
β
eine Zufallsvariable , deren Verteilung der Standard- Normalverteilung gehorcht. Somit
lässt sich die Wahrscheinlichkeit einer log-normalverteilte Zufallsvariable X, für X < x 0,
d.h. P ( X < x 0 ) mit Hilfe der Verteilungsfunktion der Standard- Normalverteilung
bestimmen.
Die folgenden Abbildungen zeigen die graphisch Vorgehensweise zur Bestimmung der
Wahrscheinlichkeit P ( X x0 ) = F (x0 ) einer beliebigen log-normalverteilten
Zufallsvariable X mit Hilfe der Standard-Normalverteilung.
*
5
8
f ( x ) F ( x0 )
f(y)
5
'
5
"
(z)
F ( y0 )
Φ ( z0 )
=
=
0
x0
1
2π β 2
y = ln x
xo
0
1
x
0
x
exp −
dy =
1
ln x − α
2
β
1
x
2π β
z =
z0
0
z
dx
yo
2
y −α
β
y
2
1
dx
y0
α
exp −
−∞
dz =
1
y −α
2
β
1
β
dy
2
dy
1
2π
zo
exp
−∞
−
1
2
z
2
dz
27
Beziehung zur Bestimmung der Wahrscheinlichkeit P ( X x0 ) = F (x0 ) einer
beliebigen log-normalverteilten Zufallsvariable X mit Hilfe der StandardNormalverteilung
Sei x0 eine log-normalverteilte Zufallsvariable, dann lässt sich die Wahrscheinlichkeit
P ( X x0 ) mit Hilfe der Standard-Normal-Verteilung, wie folgt berechnen:
xo
F (xo
)
= P (X ≤ xo
)
1
=
2π β
0
zo
1
=
Dabei ist z o
=
ln x o − α
β
x
⋅ exp −
⋅ exp −
2π
0
⋅
2
1
1
2
z2
1
ln x − α
2
β
2
dz = P ( Z ≤ z o
dx
)=
Φ (zo
)
und µ = α und σ = β sind die Parameter der
Normalverteilung
<
Die Stromausbeute eines bestimmten Transistors wird in Einheiten des Logarithmus
Ia
gemessen, wobei Ia die Ausgangsstromstärke und Ie die Eingangsstromstärke
ln
Ie
angeben. Die Zufallsvariable ln
Ia
ist normalverteilt mit µ = 2 und σ = 0,1.
Ie
Bestimmen Sie die Wahrscheinlichkeit dafür, dass der Quotient
*+
Ia
Ie
geringer als 6,1 ist.
Die Zufallsvariable x =
Ia
Ie
ist log-normalverteilt aber die Zufallsvariable y = ln
Ia
Ie
ist normalverteilt mit µ = 2 und σ = 0,1 daher gilt für die Log-Normalverteilung von X:
α = 2 und β = 0,1.
Es soll die Wahrscheinlichkeit für alle x-Werte kleiner als die obere Grenze x0 = 6,1
berechnet werden. Die Substitution liefert folgende obere Grenze für die Zufallsvariable Z:
zo
=
ln x o − α
β
=
ln 6 , 1 − 2
0 ,1
= −2
Somit erhält man für die gesuchte Wahrscheinlichkeit:
P(X
6,1 ) = P ( Z
– 2 ) = Φ ( – 2 ) = 0,0228
28
$%;
=
3
Die Wahrscheinlichkeit, dass eine Zufallsvariable X zwischen zwei Werten a und b liegt,
kann dann exakt bestimmt werden, wenn die Wahrscheinlichkeitsverteilung bekannt ist. Ist
die Wahrscheinlichkeitsverteilung aber nicht bekannt, so ermöglicht die Tschebyschevsche
Ungleichung eine Abschätzung für die gesuchte Wahrscheinlichkeit P ( a
X
b),
wenn nur der Erwartungswert µ sowie die Standardabweichung σ bekannt sind und für a
bzw. b gilt:
a = µ – c · σ und b = µ + c · σ , wobei c größer als 1 ist.
Tschebyschevsche Ungleichung
Die Wahrscheinlichkeit dafür, dass eine Zufallsvariable X mit dem Erwartungswert
(Mittelwert) µ und Varianz σ 2 innerhalb der c-ten Standardabweichung σ um den
Mittelwert µ liegt, wobei c > 1 ist, beträgt mindestens 1 – 1 c 2 .
P(µ –c·σ
µ +c·σ )
X
1−
1
c2
f(x)
mindestens: 1 –
1
c²
x
c·σ
µ–c·σ
c·σ
µ
µ+c·σ
Die Tschebyschevsche Ungleichung gilt sowohl für stetige als auch für diskrete
Zufallsvariablen.
,
<
Die Lebensdauer X (in Stunden) von seriengefertigten Halogenlampen sei eine
Zufallsvariable mit einem Mittelwert von 800 [h] und einer Standardabweichung von 40 [h].
Wie groß ist mindestens der Anteil der hergestellten Lampen mit einer Lebensdauer
zwischen 740 [h] und 860 [h]?
*+
a
= 740 [h] ; b
a =
µ – c·σ
740 = 800 – c · 40
P(a
X
=
;
µ = 800 [h] ;
bzw.
⇔
σ =
b
=
µ
+ c·σ
c =
b )
29
Herunterladen