1 Kapitel 10 Stetige Zufallsvariablen und ihre Verteilungen Letzte

Werbung
1
Kapitel 10 Stetige Zufallsvariablen und ihre Verteilungen
Letzte Änderung: 17. Mai 2000, 20 Seiten
Den folgenden speziellen Verteilungen liegt immer eine stetige Zufallsvariable X zugrunde.
X: Ω → R
1 Die stetige Gleichverteilung
Seien a,b∈R. Eine Zufallsvariable X mit der Dichte
f:[a,b] → R mit
1
f(x) :=
, -∞ < a ≤ x ≤ b < ∞
b-a
heißt gleichverteilt auf dem Intervall [a,b].
Die Verteilungsfunktion ist offensichtlich eine Gerade, wie durch direkte Integration
gezeigt werden kann:
x-a
F(x) =
, -∞ < a ≤ x ≤ b < ∞
b-a
Eine Kurzschreibweise ist X ~ U(a,b).
1
F(x)
f(x)
0
a
b
Das Schema der stetigen Gleichverteilung U(a,b), Dichte und Verteilung
2
2 Die Dreiecksverteilung (Zelt-Verteilung)
Seien a,b,c∈ R. Eine Zufallsvariable X mit der Dichte
ah
hx
+
, 0 ≤a ≤ x≤ b
a-b b-a
ch
hx
f:[a,c] → R mit f(x):=
+
, b< x ≤ c
c-b b-c
0
, sonst
heißt dreiecksverteilt auf dem Intervall [a,c].
Dabei sind die Konstanten a, c, h so zu wählen, daß das Dreieck die Fläche 1 aufweist,
h ⋅(c – a)
Die Fläche unter dem Zelt ist
, hängt also nicht von b ab. Sei z.B. a=0, b=0.5, c=1
2
und h=2, d.h.
0 + 4x , 0 ≤ x ≤ 12
f(x):= 4 - 4x , 21 < x ≤ 1
0
, sonst
Dann ist die Verteilungsfunktion gegeben durch
0
,x <0
2
F(x) = 2x
, 0 ≤ x ≤ 21
4x - 2x2 - 1 , 21 < x ≤ 1
3
Beispiel: Eine weitere Dreiecksdichte
1-|x| if |x| ≤ 1
f(x) =
0 if |x| > 1
{
Beispiel (Aufgabe zur Dichte)
Bestimmen Sie zu der folgenden Dichte f die Verteilungsfunktion F:
1
- x ,-2≤x≤0
4
f(x) = x -2 ,2≤x≤3
0
,sonst
Beispiel (Aufgabe zur Transformation)
Sei X eine Zufallsvariable mit der Dichtefunktion
2x, 0<x<1
f(x) =
0, sonst
{
Bestimmen Sie die Dichtefunktion und die Verteilungsfunktion der Zufallsvariablen
Y: = X und skizzieren Sie beide Funktionen.
Lösung
1
1
x2
Um zu prüfen, ob f(x) überhaupt eine Dichte ist, integriere man: 2 xdx = 2⋅
= 1.
2
0
0
Aus der Verteilung F(x) = P[X ≤ x] = x2 folgt dann
P[X ≤ x] = x2 ⇒ P( X≤ x ) = y4 ⇒ P(Y≤y) = y4 ⇔ F(Y≤y) = y4 = F(y), y∈ [0,1], f(y)= 4y3,
da y = x , und x= 0 ⇒ y=0 und x = 1 ⇒ y = 1.
4
3 Die Pareto-Verteilung
Seien a,b ∈ R. Eine Zufallsvariable X mit der Dichte
a b a+1
f:[a,b] → R
f(x):= ( )
für 0<a, 0<b<x
b x
und der Verteilungsfunktion
für x ≤ b
F(x) = 0
a
b
1 - x für 0 < a, 0 <b < x
heißt Pareto-verteilt mit den Parametern a und b.
1
Mit der Variablentransformation u:=
folgt aus der Verteilung F(x) direkt die Dichte
x
durch Ableitung und umgekehrt folgt durch Integration aus der Dichte f(x) die
Verteilung F(x), die beide allen Anforderungen einer Dichte bzw. Verteilung genügen.
Typischerweise sind Einkommen Pareto-verteilt. Zwei Parametrisierungen zeigt die
folgende Abbildung:
2.0
f(x)
1.5
a = 2.0
b = 1.0
1.0
a = 0.5
b = 1.0
0.5
0.0
1
2
3
Zu weiteren Einzelheiten siehe man das Stichwort “Pareto”.
4
x
5
4 Die Exponentialverteilung
Eine Zufallsvariable X mit der Dichte und der Verteilungsfunktion
für x ≤ 0
f(x) = 0 λ für x ≤ 0 bzw. F(x) = 0
x
λe für 0 < x
1 -e -λx für 0 <x
heißt exponentialverteilt mit Parameter λ. Der Parameter λ erfüllt die Bedingung
f(x)
λ = r(x):=
= const.>0
1-F(x)
Eine Kurzschreibweise ist X ~ P(1,λ).
Die Dichten für die Parameter λ=1, λ=3 und λ=5 sehen folgendermaßen aus:
λ=5
f(x)
λ=3
λ=1
x
Anwendung aus der Theorie der Zuverlässigkeit (eine Hauptanwendung):
Sei X, etwa die Brenndauer einer Glühbirne, exponentialverteilt und sei A das
Ereignis, daß X mindestens t0 (t0>0) sei, und sei B das Ereignis, daß die Glühbirne über
t0 hinaus noch bis zum Zeitpunkt t1 (t1>t0) weiterarbeitet.
Interessiert man sich nun für die Wahrscheinlichkeit, daß eine Glühbirne, nachdem
sie schon bis zum Zeitpunkt t0 gebrannt hat, auch noch bis zum Zeitpunkt t1
weiterbrennt, d.h. für die bedingte Wahrscheinlichkeit
P(B∩A)
P(B|A) =
,
P(A)
dann erhält man für die Ereignisse
A (Funktionszeit bis mindestens t ): P(A) = e -λt0,
0
A ∩B (Funktionszeit von t 0 bis t1):
P(A ∩B) = e -λt1,
weil t1 nur erreicht werden kann, nachdem t0 erreicht worden ist. Damit gilt:
6
e-λ t1
P(B|A) =
= e- λt1 + λt0 = e- λ(t1-t0).
e-λt0
Dieses Ergebnis wird üblicherweise als die Gedächtnislosigkeit der Exponentialverteilung bezeichnet. Es kommt nur auf die Zeitdifferenz an, nicht jedoch wo diese
Zeitdifferenz anfällt.
Anwendungsbereiche dieser Verteilungen sind etwa: Die Lebensdauer von Glühbirnen oder anderen technischen Aggregaten oder die Servicezeit an Schaltern. Sie
werden typischerweise durch Exponentialverteilungen beschrieben.
Auch die Sterbewahrscheinlichkeit von Säuglingen wird durch eine ExponentialVerteilung beschrieben.
Zu weiteren Einzelheiten siehe man das Stichwort “Exponential” bzw. “Reliability”.
5 Die Erlang-Verteilung
Eine erste Verallgemeinerung der Exponentialverteilung ist die zweiparametrige
unimodale Erlangverteilung.
Eine Zufallsvariable X mit der Dichte
für x ≤ 0
f: R→R
f(x):= 0
-λx
e
x n-1 λn
für 0 < x
(n-1)!
mit n∈N und λ>0 heißt Erlang-verteilt mit Parametern λ und n.
Eine Kurzschreibweise ist X ~ P(n,λ).
Dichten mit den Parametern λ=3 und n=3 bzw. n=6 sehen folgendermaßen aus:
1
f(x)
λ=3
n=5
0,5
λ=3
n=6
0
1
2
3
4
Für n=1 ist die Exponentialverteilung zurückgewonnen.
x
7
6 Die Weibull-Verteilung
Eine zweite Verallgemeinerung der Exponentialverteilung ist die zweiparametrige
unimodale Weibull-Verteilung.
Eine Zufallsvariable X mit der Dichte
für x ≤ 0
f: R→R
f(x):= 0
λ n
nxn-1λe - x für 0 < x
mit n∈N und λ>0 heißt Weibull-verteilt mit den Parametern λ und n.
Eine Dichte mit den Parametern λ=0.25 und n=2 bzw. n=4 sieht folgendermaßen aus:
f(x)
λ = 0.25
n =4
10
λ = 0.25
n =2
0
1
2
3
4
Für n=1 ist die Exponentialverteilung zurückgewonnen.
5
6
x
8
7 Die Hyper-Exponentialverteilung
Eine dritte Verallgemeinerung der Exponentialverteilung ist die Hyper-Exponentialverteilung:
Eine Zufallsvariable X mit der Dichte
0
für x ≤ 0
n
n
a =1
f: R→R
f(x):=
∑ aiλi e-λ ix für 0 <x mit λi>0 und ∑ i , n∈N.
i=1
i=1
heißt hyper-exponential-verteilt mit Parametern ai und λ i .
Für n=1 folgt erneut die Exponentialverteilung. Hyper-Exponential-verteilte
Zufallsvariable sind sozusagen Mischungen von Exponentialverteilungen. Ein
numerisches Beispiel ist
1- F(x) = p e-λ 1 x + (1 - p) e -λ 2 x ; p = 0.294; λ 1 = 0.541; λ 2 = 0.009, x>0
allgemein 0 < p < 1, d.h.
f(x) = p λ 1 e-λ 1 x + (1 - p) λ 2 e-λ 2 x, 0<x
9
8 Die beidseitige Exponentialverteilung
Eine vierte Verallgemeinerung der
Exponentialverteilung.
Eine Zufallsvariable mit der Dichte
f: R→R
λ +λx
e
,x ≤ 0
2
f(x) :=
λ>0
λ -λx
e
,x > 0
2
Exponentialverteilung
ist
die
beidseitige
heißt beidseitig exponentialverteilt mit Parameter λ.
Dichten mit den Parametern λ=1,2,3 sehen folgendermaßen aus:
f(x)
λ=3
λ=2
λ=1
−1
0
1
x
10
9 Die Cauchy-Verteilung
Eine Zufallsvariable X mit der Dichte
k
f: R→R
f(x):=
, 0<k, - ∞ < x < ∞
2
π⋅(k + (x-m) 2)
heißt Cauchy-verteilt mit Parametern k und m.
Das Maximum der Dichte liegt in x=m:
11
Eine zweite Parameter-Variation von k wird durch die folgenden Abbildungen
gegeben (eine Variation der Cauchy für (m,k): 0,1; 0,2; 0,3)
12
10 Die t-Verteilung (Students t-Verteilung)
Eine Zufallsvariable T mit der Dichte
Γ( n+1 )
2
f: R→R
f(t):=
, -∞ < t< ∞
2 n+1
t
n
πn Γ( ) + (1 + n )
2
heißt t-verteilt mit n Freiheitsgraden.
Der Parameter n wird als Freiheitsgrad der Verteilung bezeichnet.
1
Mit n=1 und Γ( ) = π folgt aus der t-Verteilung die Cauchy-Verteilung mit k=1.
2
Es ist eine unimodale Dichte, die z.B. mit n=5 bzw. n=9 Freiheitsgraden folgendermaßen aussieht:
n=9
0,3
0,2
n=5
0,1
-3
-2
-1
0
1
2
3
13
11 Die Beta-Verteilung
Eine Zufallsvariable mit der Dichte
Γ(α+β)⋅x α-1⋅(1-x) β-1
0 < α,β, 0 <x < 1
f: R→R
f(x): =
Γ(α)⋅Γ(β)
0
sonst
heißt beta-verteilt mit Parametern α und β.
Dabei ist Γ(z) die Gammafunktion
∞
z-1 -x
Γ(z) :=
x e d x , 0 < z, 0 ≤ x < ∞
0
Die Beta-Dichte ist eine zentrale Größe. Aus ihr folgen zahlreiche andere Dichten:
12 Die Fishersche F-Verteilung
Eine Zufallsvariable X mit der Dichte
f +f
Γ( 1 2 )⋅f1f1/2⋅f2f2/2⋅xf1/2-1
2
f: [0,∞ ) → R f(x):=
, f1, f2 ganzzahlig, , 0 ≤ x <∞
f1
f2
(
f
+f
)/2
Γ( 2 )⋅Γ( 2 )⋅(f1 + f2x) 1 2
heißt F-verteilt mit Parametern f1 und f2.
f(x)
0,8
f 1 = f 2 = 10
0,7
f1 = f2 = 6
0,6
f1 = f2 = 4
0,5
0,4
0,3
0,2
0,1
0
1
2
x
Mit f1 = 1, f2 = f sowie x = t 2 ist die F-Dichte die t-Dichte.
Mit α =: f 1/2, b =: f 2/2, F:= (f 1/f2)[x/(1-x)] und f1, f2 ganzzahlig ist die F-Verteilung ein
Sonderfall der Beta-Verteilung.
Man beachte den Zusammenhang zur Binomialverteilung (den Rollentausch von
Variablen und Parametern), d.h.: mit ganzzahligen α und β und x als Parameter erhält
man die Binomial-Verteilung.
14
13 Die Gamma-Verteilung
Eine Zufallsvariable X mit der Dichte
f: (0,∞) → R
f(x) :=
x
α-1 -x/β
e
, 0 < α,β , 0 < x < ∞
α
β Γ(α)
heißt gamma-verteilt mit Parametern α und β.
Die Kurzschreibweise ist X ~ G(α,β).
14 χ 2(Chi-Quadrat)-Verteilung
Eine Zufallsvariable mit der Dichte
f: [0,∞) → R
f(x) :=
x
γ /2-1 x/2
γ /2
e
,0< γ,0≤x< ∞
2
(γ/2-1)!
heißt χ 2(Chi-Quadrat)-verteilt mit Parameter γ.
Der Parameter γ wird als Freiheitsgrad bezeichnet.
Die Kurzschreibweise ist X ~ χ 2 (γ).
Damit gilt im Vergleich zur Gammadichte die Umparametrisierung
χ 2(γ) = G(γ/2,2) bzw. χ 2(2α) = G(α,2)
f(x)
γ=6
1
γ=10
0,5
0
5
10
15
x
Die χ 2-Verteilung kann auch aus der F-Verteilung heraus, d.h. aus der BetaVerteilung spezialisiert werden: Man wähle x:= χ 2 := x/γ, γ := f1 und f2 → ∞.
15
15 Die Weibull-Gamma-Verteilung
Eine Zufallsvariable X mit der Dichte
bkdxb-1
f(x): =
(xb
k+1
,0<b,d,k,0 ≤ x
+ d)
0
,x < 0
heißt Weibull-Gamma-verteilt mit Parametern b, d und k.
Ein erster Sonderfall ist die sog. Burr-Dichte f(x) mit d=1:
bkxb-1
f(x): =
k+1
(xb)
0
, 0<b,k, 0 ≤ x
,x< 0
Ein zweiter Sonderfall ist (s.o.) die Pareto-Dichte f(y) mit d=b=1 und y:=1+x:
k
, 1≤ y
f(y): = y k+1
0 ,y < 1
16
16 Übersicht über den Zusammenhang der stetigen Verteilungen
t-Verteilung
F-Verteilung
χ2
CauchyVerteilung
Beta-Verteilung
Gamma-Verteilung
-Verteilung
Erlang-Verteilung
Doppelt
Exponentialverteilung
Hyper
Exponentialverteilung
Normalverteilung
gestutzte
Normalverteilung
bivariate
Normalverteilung
Exponentialverteilung
Weibullverteilung
Lognormalverteilung
Gleichverteilung
Weibull-Gamma-Verteilung
ParetoVerteilung
BurrVerteilung
17
17 Aufgaben
Aufgabe 1
Zeigen Sie, daß die folgende doppelt exponentielle Funktion als Verteilung dienen
kann:
-x
P[X ≤ x] = F(x) = e-e .
Bestimmen Sie einen geeigneten Definitionsbereich.
Lösunghinweis: Diese Verteilung heißt Extremwertverteilung; es ist eine Verteilung
ohne Parameter (the extreme value distribution) mit der Dichte und einer unimodalen Gestalt:
f(x) = e-x e-e -x , x∈(-∞, +∞)
Eine in der Struktur ähnliche Variable X (d.h. ohne Parameter) ist die folgende (vgl.
Mathematics of Operations Research 1989, 356)
F(x) = (1 - e-x)2, 0≤ x < ∞, f(x) = 2(1 - e-x )e-x
F(0) = 0, F(∞) = 1
Aufgabe 2
Zeigen Sie, daß f(x) = xe-x und F(x) = 1-(1+x)e-x, 0<x<∞ als Dichte und Verteilung
angesehen werden können. Wie beurteilen Sie diese parameterfreie Form?
Aufgabe 3
Bestimmen Sie die Parameter a und b derart, daß die im folgenden aufgeführte beidseitig exponentielle Funktion als Dichte dienen kann:
f(x):= {
ae
be
ax
bx
, x≤0
, x>0
.
18
Aufgabe 4
Zeigen Sie, für welche Spezifikation von α und β die folgende Funktion, die Logistik,
als Verteilung dienen kann.
1
F(x) =
, 0<x<∞,0<α, 0<β .
1 + e-(α+βx)
Zu Illustration betrachte man die Dichte und Verteilung:
f(x) =
ex–10
(1 + ex–10)2
e1.75a , F(x) =
1
1 + ex–10+1.75a
Aufgabe 5
1
, a ≥0, n= 1,2,3,... eine diskrete Verteilungsfunktion
a+n
1
und die zugehörige Zähldichte f(n) =
ist.
(a + n) (a+n - 1)
Zeigen Sie, daß F(n) = 1 -
Aufgabe 6
Die Stutzung einer Verteilung: Sei eine Zufallsvariable X beliebig über dem Intervall
[a1,b1] verteilt und sei A das Ereignis,daß X auf ein Teilintervall[a2,b2], a1≤a2, b2≤b1
eingeschränkt sei.
Zeigen Sie , daß, falls F(x) eine Verteilung über [a1,b1] ist, F(x|A) eine Verteilung über
F(x) -F(a 2)
[a2,b2] ist und F (x|A) =
.
F(b 2) - F( a2)
Aufgabe 7
Zeigen Sie, daß die Funktionen f(.) als Dichte geeignet sind und überprüfen Sie die
Funktionen auf Unimodalität und Symmetrie:
1
(1)
f(x) =
, n=1,2,3,…,, 0<x<n
π x⋅(n - x)
1
(1)’
f(x) =
, 0<x<1
π x(1-x)
die sog. Arcus-Sinus Dichte mit der Verteilung (vgl. Feller II, 49-50)
2
2
x
F(x) = arcsin x , 0<x<1, bzw. F(x) = arcsin
, 0<x<n;
π
π
n
2
(2)
f(x) =
, 0<x<1
2
π 1 –x
2
(mit E(X) = 2/π; F(x) = arc sin x, 0<x<1; vgl. Feller II, 30)
π
19
Aufgabe 8
Zeigen Sie daß die folgenden Funktion jeweils als Dichte dienen können:
1 -(x - 1)2
3
a) f(x) =
, 0 < x< ∞; b) f(x) = 2
, 0 ≤ x ≤2; c) f(x) = (1 - x 2), 0≤x≤1
4- π
2
π(1+x2)
Die folgenden Abbildungen zeigen jeweils die Dichte in der Reihefolge a) b) c)
2
1-
20
f
1-F
(i) Die Ausfallrate für die Zufallsvariable X aus dem Ereignisraum 0<x ist allgemein
f(x)
f(x)
F(x+∆) – F(x) 1
=
= lim
(eine bedingte Dichte), damit folgt:
∆
1 - F(x) P(X>x) ∆→ 0
P(X>x)
18 Ein Sonderproblem: Die Ausfallrate (im Englischen: hazard rate)
F(x+∆) – F(x)
= F(x+∆) - F(x) = P[Ein Ereignis passiert in in (x,x+∆] ] = P[x≤X≤x+∆]
∆
F(x+∆) – F(x)
(ii) P[Ein Ereignis passiert in in (x,x+∆] ] = ∆f(x) = lim ∆
= P[x≤X≤x+∆]
∆
∆→ 0
∆
(iii) Die Beschreibung durch die Verteilung auf drei aufeinander folgenden Intervallen
A, B, C; A:= [0,x], B:= (x,x+∆], C:= (x+∆, ∞), sei E ein beliebiges Ereignis
“Das Ereignis passiert in [0,x]” ∪ “Das Ereignis passiert in in (x,x+∆]” ⇔ E∈(A ∪ B),
A ∩ B = ø ⇔ A ∪ B, A ∩ B = ø, ∴ P(A ∪ B) = P(A) + P(B)
P(A) = F(x) und P(B) = F(x+∆) - F(x)
“Das Ereignis passiert in (x, ∞)”
= “Das Ereignis passiert in (x,x+∆]” ∪ “Das Ereignis passiert in (x+∆, ∞)”
⇔ E∈ A ⇔ E∈B ∪ C,
B ∩ C = ø, ∴ P( A ) = P(B) + P(C) = (F(x+∆) - F(x)) + (1 -F(x+∆)) = 1 - F(x)
“Das Ereignis passiert in [0,x+∆]” ⇔ E∈(A ∪ B)
P(A∪B) = P(A) + P(B) = F(x) + (F(x+∆) - F(x)) = F(x+∆)
P(B ∪ A ) = P(B) + P( A ) - P(B∩ A ) = P(B) + P( A ) - P(B) = 1- F(x) ⇒
P(B∩ A ) = (F(x+∆) - F(x)) + (1- F(x)) - (1- F(x)) = F(x+∆) - F(x)
(iv) Man betrachte das bedingte Ereignis der Ausfallrate:
P(Das Ereignis passiert in (x,x+∆] | Das Ereignis ist in [0,x] nicht passiert), d.h.
ein Ereignis passiert in (0,x+∆]
P(B∩A) F(x+∆) – F(x) ∆
f(x)
P(B|A ) =
=
⋅ , lim P(B|A) =
∆ ∆→ 0
P(X>x)
1 - F(x)
P(A)
Zu weiteren Einzelheiten siehe man das Stichwort “Hazard rate”
Herunterladen