Stetige Zufallsgrößen

Werbung
Wiederholung Analysis
F ( x ) sei Stammfunktion zu f ( x ) →
 f ( x)dx = F ( x)
⇔ F ′( x ) = f ( x )
f(x)
A= F(b) - F(a)
Bestimmtes Integral
b
 f ( x)dx = F (b) − F (a)
a
a
Uneigentliche Integrale
Spezialfälle
x
x

lim F ( a ) = 0 →
f (t )dt = F ( x) − lim F (a )
a →−∞
a →−∞
−∞
∞

f (t )dt = F ( x)
−∞
∞
 f (t )dt = lim F (b) − F ( x)
x
b
lim F (b) = 1 →  f (t )dt = 1 − F ( x)
b →∞
b →∞
x
x
f (t ) (>) ≥ 0  F ( x) =

f (t )dt
ist (streng) monoton wachsend
−∞
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
1
Stetige Zufallsgrößen
Eine Zufallsgröße heißt stetig, wenn sie alle Werte eines Intervalls der reellen
Achse annehmen kann.
Stetige Zufallsgrößen beschreiben zum Beispiel:
• Lebensdauer eines Bauelements
• Wartezeiten auf eine Bedienung
• Längenmessungen
Problem
Ist X eine stetige Zufallsgröße, so gilt P(X = x) = 0 für jedes x, d.h. jeder einzelne Wert
wird mit der Wahrscheinlichkeit 0 angenommen.
Eine stetige Verteilung ist also nicht über Punktwahrscheinlichkeiten P(X = x)
beschreibbar.
Ausweg
Anstelle von P(X = x) wird die Intervallwahrscheinlichkeit P(X ≤ x) für jedes x zur
Charakterisierung der Verteilung betrachtet.
Dadurch entsteht eine Verteilungsfunktion F ( x) = P ( X ≤ x) .
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
2
Verteilungsfunktion
Verteilungsfunktion der Zufallsgröße X:
F ( x ) = P ( X ≤ x), x ∈ 
Interpretation
F(x) gibt die Wahrscheinlichkeit an, dass X Werte im Intervall (-∞, x] annimmt.
Eigenschaften der Verteilungsfunktion
0 ≤ F ( x) ≤ 1
F ( x) ist monoton wachsend
lim F ( x) = 0
x →−∞
F ( x0 ) = P ( X ≤ x0 )
lim F ( x) = 1
x →+∞
Die Verteilungsfunktion einer Zufallsgröße entspricht der empirischen
Verteilungsfunktion einer Stichprobe mit Realisierungen dieser Zufallsgröße.
Anstelle der relativen Stichprobenhäufigkeiten stehen jetzt die Wahrscheinlichkeiten.
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
3
Intervallwahrscheinlichkeiten
Berechnung von Intervallwahrscheinlichkeiten mit der Verteilungsfunktion
P (a < X ≤ b) = F (b) − F (a )
P( X ≤ b) = F (b)
P(a < X ≤ b) = F (b) − F (a)
P(a < X ) = 1 − F ( a )
Da bei stetigen Zufallsgrößen alle Punktwahrscheinlichkeiten P(X = x) gleich
Null sind, sind ‚<´ und ‚≤‘ bei der Berechnung der Intervallwahrscheinlichkeiten
beliebig austauschbar.
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
4
Stetige Zufallsgrößen
Die Intervallwahrscheinlichkeiten sind umso größer, je steiler der Anstieg
von F(x) ist.
F(b‘)-F(a‘)
a‘
b‘
Das Anstiegsverhalten beschreibt die erste Ableitung : f ( x ) = F '( x )
Intervalle mit steilem Anstieg enthalten viele Realisierungen von X, dort nimmt f ( x )
große Werte an, daher bezeichnet man f ( x ) als Dichte.
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
5
Dichte
Dichte f ( x) einer stetigen Zufallsgröße X mit der Verteilungsfunktion F ist
f ( x) = F ′( x)
Eigenschaften der Dichte
 f ( x) ≥ 0

+∞
−∞
f ( x)dx = F (∞) − F (−∞) = 1
 In Intervallen mit Dichte = 0 liegen
(quasi) keine Realisierungen von X
 In Intervallen mit hoher Dichte liegen
' viele' Werte der Zufallsgröße
(X liegt dort mit hoher Wahrscheinlichkeit)
Berechnung der Verteilungsfunktion aus der Dichte
x
F ( x) =

f (t ) dt
 5.1
−∞
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
6
Dichte
Dichte ist Grenzfall des Histogramms
(n → ∞, Klassenbreite → 0)
30
50
15
40
Count
Count
Count
20
10
30
20
10
5
10
-3,00
0
0
-2,00
-1,00
0,00
r100
1,00
2,00
-2,00
-1,00
0,00
1,00
2,00
-2,00
-1,00
0,00
1,00
2,00
r400
r200
Histogramme von 100, 200 bzw. 400 simulierten normalverteilten Zufallszahlen
steigende Klassenanzahl bei fallender Klassenbreite, überlagert ist die Dichte der Verteilung
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
7
Dichte
Berechnung von Intervallwahrscheinlichkeiten mit der Dichte
b
P ( a < X ≤ b) =  f ( x) dx
P (a < X ≤ b)
a
a
b
a
P( X ≤ a) =  f ( x)dx
P(X ≤ a)
−∞
a
∞
P ( X > b) =  f ( x) dx
P( X > b)
b
b
Da bei stetigen Zufallsgrößen die Punktwahrscheinlichkeiten P(X = x) alle gleich
Null sind, sind ‚<´ und ‚≤‘ bei der Berechnung der Intervallwahrscheinlichkeiten
beliebig austauschbar.
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
8
Kenngrößen stetiger Verteilungen
X sei eine stetige Zufallsgröße mit der Dichte f(x):
Erwartungswert
EX =  x ⋅ f ( x)dx
Varianz
VarX =  ( x − EX )2 f ( x)dx
=  x 2 f ( x)dx − (EX )2
Standardabweichung s = + VarX
(Streuung)
Variationskoeffizient
SS 2017
v=
s
EX
(nur bei X >= 0)
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
9
Kenngrößen stetiger Verteilungen
Vergleich der Formelstrukturen
Erwartungswert
Varianz
stetige Zufallsgröße
diskrete Zufallsgröße
EX =  x ⋅ f ( x)dx
EX =  xk P ( X = xk )
VarX =  ( x − EX )2 f ( x )dx
k
Var X =  ( xk − EX ) 2 P ( X = xk )
k
Analogie für Erwartungswert und Standardabweichung bei stetigen und
diskreten Zufallsgrößen
• Dichte f(x) entspricht der Wahrscheinlichkeitsfunktion pk = P(X=xk)
• Integral entspricht dem Summenzeichen
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
10
Kenngrößen stetiger Verteilungen
uα heißt α - Quantil der Verteilung von X, wenn
P( X < uα ) = α, 0 < α < 1
Zusammenhang Quantil - Dichte
P ( X < uα ) = α ⇔ 
uα
−∞
f ( x) dx = α
Zusammenhang Quantil - Verteilungsfkt
α = P( X < uα ) = F (uα )
α
uα
uα
α
Speziell bei strenger Monotonie von F
uα = F −1 (α)
Interpretation
links von uα liegen α · 100% der Werte von X
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
11
Spezielle stetige Verteilungen
Wichtige Verteilungen für Modellierung (Auswahl):
Gleichverteilung Gl[a,b]
Weibullverteilung Wei(b,T)
Exponentialverteilung exp(λ)
Erlangverteilung Erlang(λ,n)
Normalverteilung N(μ, σ2)
Gammaverteilung Γ 2(a,n)
Wichtige Testverteilungen in schließender Statistik:
T – Verteilung tn
χ2
- Verteilung χ2n
F – Verteilung Fm,n
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
12
Spezielle stetige Verteilungen
Gleichverteilung auf Intervall [ a, b ]
Modell
Außerhalb des Intervalls [ a, b ] liegen keine Werte von X.
Die Wahrscheinlichkeit, dass X Werte in einem Teilintervall von [ a, b ] annimmt,
ist nur abhängig von der Intervalllänge, aber nicht von der Lage des Teilintervalls.
Bezeichnung: X ~ Gl[a,b]
Dichte
Verteilungsfunktion
Erwartungswert EX =
SS 2017
 1

f ( x) =  b − a
0
0
x − a
F ( x) = 
b − a
1
a+b
2
x ∈ [ a, b ]
sonst
a
b
a
b
x≤a
a< x≤b
x>b
Varianz VarX =
Prof. Dr. J. Schütze, FB GW
(b − a )
12
2
 5.2
Stet. Vert.
13
Normalverteilung
Normalverteilung N(μ, σ2)
Anwendungen
Verteilung zufälliger Messfehler
Verteilung der Summe von vielen unabhängigen Zufallsgrößen
Verteilung des Mittelwertes von unabhängigen Zufallsgrößen
1 n
X =  X i für n ≥ 30 in guter Näherung
n i =1
 Bedeutung in der Statistik
Normalverteilung ist die am besten untersuchte stetige Verteilung in Statistik!
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
14
Normalverteilung
Normalverteilung N(μ, σ2)
Dichte :
Gaußsche Glockenkurve
f ( x) =
1
2 πσ 2
e
−
( x −μ )2
2 σ2
Parameter μ ∈ , σ 2 > 0
Kurvendiskussion der Dichte:
- Maximum in μ
- symmetrisch zu μ
- Wendepunkte in μ ± σ
μ−σ
SS 2017
μ
μ+σ
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
15
Normalverteilung
Normalverteilung N(μ, σ2)
Form der Dichte in Abhängigkeit von den Parametern
1. Die Werte der Zufallsgröße X sind um μ konzentriert
2. Je größer der Abstand von μ, desto seltener liegen die Werte
3. Je kleiner σ , desto enger ist die Kurve
0.4
Bedeutung der Parameter
0.35
Erwartungswert: E X = μ
Varianz:
Var X = σ²
N(0,1)
N(0,4)
N(1,1)
0.3
0.25
0.2
0.15
0.1
0.05
0
-5
SS 2017
Prof. Dr. J. Schütze, FB GW
-4
-3
-2
-1
0
1
2
3
4
Stet. Vert.
5
16
Normalverteilung
x
Verteilungsfunktion φ (μ ,σ 2 ) ( x ) =

−∞
1
2 πσ
2
e
2
t −μ )
(
−
2σ2
dt
Intervallwahrscheinlichkeiten
( x −μ ) 2
b
1
2
P (a < X ≤ b) = 
e 2 σ dx
a
2 πσ 2
Es gibt keine geschlossene Stammfunktion für das Integral!
Spezialfall μ = 0, σ2 = 1
Standardnormalverteilung
φ ( 0,1) ( x ) = φ ( x )
Für die Standardnormalverteilung ist die Verteilungsfunktion tabelliert.
2
Für Normalverteilungen mit μ ≠ 0, σ ≠ 1 ist Transformation erforderlich,
um diese Tabellen nutzen zu können.
Computerprogramme enthalten die Verteilungsfunktion für beliebige μ und σ2.
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
17
Normalverteilung
Transformation in Standardnormalverteilung
X sei eine normalverteilte Zufallsgröße, X ~ N(μ, σ2), dann gilt:
X −μ
Z =
 N (0,1)
σ
Da die Standardnormalverteilung symmetrisch zu Null ist,
enthalten Tabellen meist nur die Funktionswerte für x ≥ 0.
Für x < 0 gilt:
Φ (− x) = 1 − Φ ( x)
1
0.9
0.8
0.7
tabelliert
0.6
Φ (− x) = 1 − Φ ( x)
0.5
0.4
0.3
Beispiel
X~ N(2, 9), dann ist μ = 2, σ = 3
0.2
0.1
0
-3
-2
−x
-1
0
x
1
1− 2  = Φ
Φ (2,9) (1) = Φ (0,1) 

(0,1) ( −0.33 ) = 1 − Φ (0,1) ( 0.33 ) = 1 − 0.6293 = 0.3707
 3 
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
18
2
3
Normalverteilung
Standardnormalverteilung: Tabellierte Verteilungsfunktion Φ (0,1) ( x) = Φ ( x)
Auf den Rändern steht das Argument x mit maximal 2 Dezimalstellen,
im Inneren der entsprechende Funktionswert.
0,00
0,00
0,01
0,02
0,03
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,00
,5000
,5040
,5080
,5120
,5160
,5199
,5239
,5279
,5319
,5359
0,10
,5398
,5438
,5478
,5517
,5557
,5596
,5636
,5675
,5714
,5753
0,20
,5793
,5832
,5871
,5910
,5948
,5987
,6026
,6064
,6103
,6141
0,30
0,30
,6179
,6217
,6255
,6293
,6293
,6331
,6368
,6406
,6443
,6480
,6517
0,40
,6554
,6591
,6628
,6664
,6700
,6736
,6772
,6808
,6844
,6879
0,50
,6915
,6950
,6985
,7019
,7054
,7088
,7123
,7157
,7190
,7224
0,60
,7257
,7291
,7324
,7357
,7389
,7422
,7454
,7486
,7517
,7549
0,70
,7580
,7611
,7642
,7673
,7704
,7734
,7764
,7794
,7823
,7852
0,80
,7881
,7910
,7939
,7967
,7995
,8023
,8051
,8078
,8106
,8133
Ablesebeispiel
Φ (0,1) ( 0.33) = 0.6293
Bequemer mit Computerprogramm, z.B. MATLAB: normcdf
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
19
Normalverteilung
Berechnung von Intervallwahrscheinlichkeiten für X ~ N ( μ , σ 2 )
b−μ
a−μ
−
Φ
P (a < X ≤ b) = Φ 



 σ 
 σ 
a−μ
P (a < X ) = 1 − Φ 

 σ 
b−μ
P ( X ≤ b) = Φ 

 σ 
k- σ- Regel für normalverteilte Zufallsgrößen für k = 1, 2,3
P (μ − σ < X < μ + σ ) = 0.6826
P (μ − 2 σ < X < μ + 2 σ ) = 0.9544
P (μ − 3σ < X < μ + 3σ ) = 0.9973
SS 2017
Prof. Dr. J. Schütze, FB GW
 5.3
Stet. Vert.
20
Additionssatz
Additionssatz für unabhängige, normalverteilte Zufallsgrößen
Sei X 1 ~ N ( μ1 ,σ 12 ), X 2 ~ N ( μ 2 ,σ 22 ), unabhängig.
Dann ist X 1 + X 2 ~ N ( μ1 + μ2 ,σ 12 + σ 22 )
Die Verteilung der Summe von Zufallsgrößen nennt man Faltung. Eine explizite
Berechnung von Faltungen ist oft elementar schwierig. Der Additionssatz besagt,
dass eine Faltung von unabhängigen Normalverteilungen wieder eine NV ergibt,
wobei sich Erwartungswert und Varianz addieren.
Folgerung
X 1 ,..., X n
seien unabhängig, identisch verteilt nach N (μ, σ 2 )
Dann gilt
1 n
X =  X i ~ N (μ, σ 2 / n)
n i =1
SS 2017
Prof. Dr. J. Schütze, FB GW
 5.4
Stet. Vert.
21
Quantile der Standardnormalverteilung
Die Quantile der Normalverteilung erhält man aus der Verteilungstabelle, indem man
α im Inneren der Tabelle als Funktionswert nachschlägt, das dazugehörige Argument
auf dem Rand ist dann das Quantil der Ordnung α.
Die Symmetrie der Dichte bewirkt folgende
Symmetrie der Quantile
zα = − z1−α
Spezielle Quantile
z0.95 = 1.64, z0.05 = −1.64
z0.975 = 1.96, z0.025 = −1.96
α
α
zα
SS 2017
z1−α
Prof. Dr. J. Schütze, FB GW
z0.99 = 2.33, z0.01 = −2.33
NV - Quantil mit MATLAB: norminv
Stet. Vert.
22
Lebensdauerverteilungen
T sei die zufällige Lebensdauer eines Bauelements, dann beschreibt die
Verteilung von T die Ausfallwahrscheinlichkeit bis zur Zeit t
P (T < t ) = F (t ), t > 0
F(t) gibt also die Wahrscheinlichkeit an, dass das Element in [0, t] ausfällt.
R sei die (zufällige) Überlebensfunktion/Zuverlässigkeitsfunktion des Bauelements,
R (t ) = P (T ≥ t ) = 1 − F (t ), t ≥ 0
R(t) ist die Wahrscheinlichkeit dafür, dass in [0, t] kein Ausfall erfolgt.
Dichte der Lebensdauer/Ausfalldichte
f (t ) = F '(t )
Für beliebig kleine Zeiträume Δt gibt
f (t ) ⋅ Δt
die Wahrscheinlichkeit des Ausfalls in [t , t + Δt ] an.
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
23
Lebensdauerverteilungen
Ausfallrate (Hazardfunktion)
beschreibt das bedingte Ausfallverhalten eines Elements, das bis t überlebt hat
f (t )
f (t )
h(t ) =
=
1 − F (t ) R (t )
Für beliebig kleine Zeiträume Δt ist
h(t ) ⋅ Δt
die bedingte Wahrscheinlichkeit dafür, dass ein Element in [t , t + Δt ] ausfallen wird
wenn es bis zum Zeitpunkt t überlebt hat.
Mittlere Lebensdauer
∞
ET =  t ⋅ f (t ) dt
0
Eigenschaften
∞
ET =  R (t )dt , falls ET < ∞
0
R (t ) = e
SS 2017
t

− h ( x ) dx
0
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
24
Exponentialverteilung
Exponentialverteilung mit Parameter λ
Modell
Lebensdauerverteilung mit ‚Nichtalterungseigenschaft‘
1/λ ist das mittlere Alter einer so verteilten Größe, λ > 0
Bezeichnung: X ~ Exp(λ)
0
f ( x) =  −λx
λ e
Dichte
y
x≤0
x>0
1.2
F(x)
1.0
0.8
0.6
0.4
0
F ( x) = 
−λx
1 − e
Verteilungsfunktion
x≤0
x>0
0.2
0.0
1000
2000
3000
4000
-0.2
Erwartungswert EX =
1
λ
Varianz VarX =
1
λ2
 5.5
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
25
5000
x
Exponentialverteilung
Nichtalterungseigenschaft der Exponentialverteilung
P ( X ≥ t + h / X ≥ t ) = P ( X ≥ h) für alle t ≥ 0, h ≥ 0
Interpretation
Fällt ein Teil mit exponentiell verteilter Lebensdauer im Intervall (0, t) nicht aus,
dann ist Wahrscheinlichkeit, noch länger als h Zeiteinheiten zu leben so groß wie
die Wahrscheinlichkeit, als neues Teil (startend in 0) länger als h zu leben.
Verteilung des Minimums von Exponentialverteilungen
Seien X 1 , X 2 ,..., X n unabhängige, exponentialverteilte Zufallsgrößen mit den
Parametern λ1 ,..., λ n
Das Minimum min( X 1 , X 2 ,..., X n ) ist exponentialverteilt mit dem Parameter
n
λ
Anwendung
Lebensdauer eines Seriensystems aus n unabhängigen Komponenten Xi
mit Xi ~ Exp(λi) ist exponentialverteilt mit Parameter  λ k .
Die mittlere Lebensdauer ist daher gleich 1 /  λ k
SS 2017
Prof. Dr. J. Schütze, FB GW
k
k =1
Stet. Vert.
 5.6
26
Erlangverteilung
Modell
Verteilung der Summe von Exponentialverteilungen (Faltung)
Seien X 1 , X 2 ,..., X n unabhängige, exponentialverteilte Zufallsgrößen mit dem
gleichen Parameter λ
Die Summe X = X 1 + X 2 + ... + X n heißt erlangverteilt der Ordnung n mit Parameter λ
X ~ Erl(n,λ) (Faltung n unabhängiger exponentialverteilter ZG mit gleichem λ)
Verteilungsfunktion
F ( x) = 1 − e
−λx
(λ x ) k

k!
k =0
n −1
Dichte
(λx) n−1 −λx
f ( x) = λ
e
(n − 1)!
Erwartungswert
EX =
Varianz
VarX =
SS 2017
n
λ
n
λ2
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
27
Weibullverteilung
Weibullverteilung mit den Parametern b und T
Modell
Lebensdauerverteilung mit zeitabhängiger Ausfallrate (Alterung modellierbar)
Bezeichnung: X ~ Wei(b,T), b > 0, T > 0
Verteilungsfunktion F ( x) = 1 − e
Dichte
f ( x) =
x
− 
T 
bx
 
T T 
b
, x≥0
b −1
e
 x
− 
T 
Dichten für verschiedene b
b
Bedeutung der Parameter
T > 0: charakteristische Lebensdauer,
das entspricht der Zeit, in der 63.2% aller
Objekte ausgefallen sind
b > 0: Ausfallsteilheit, in der Praxis meist 0.25 < b < 5
ab b = 3.5 Ähnlichkeit mit NV
Speziell bei b = 1: Exponentialverteilung mit λ = 1/T
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
28
Weibullverteilung
Alternative Darstellung mit
Weibullverteilung mit den
Parametern b und T
Verteilungsfunktion F ( x) = 1 − e
1
β = b und α =  
T 
x
− 
T 
b −1
Dichte
Erwartungswert
b
bx
  e
T T 
1 
EX = T Γ  + 1
b 
f ( x) =
β
β
F ( x ) = 1 − e −αx , x ≥ 0
, x≥0
 x
− 
T 
b
f ( x) = αβ xβ−1e −αx
β
1 
EX = α −1/ β Γ  + 1
β 
Varianz
  2    1  2 
2
VarX = T  Γ  + 1 −  Γ  + 1  
  b    b  


Ausfallrate
1
λ ( x) =   b ⋅ x b−1
T 
2



2
1



 
−2 / β
VarX = α  Γ  + 1 −  Γ  + 1  
  β    β  


b
wobei die Gamma-Funktion definiert ist durch
λ ( x) = αβ ⋅ xβ−1
∞
Γ(a ) =  e− y y α−1dy
0
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
29
Gamma-Funktion
Die Gamma-Funktion ist eine ‚Fortsetzung‘ von f (n) = (n − 1)! auf die reellen
Zahlen mit Ausnahme der negativen ganzen Zahlen und Null, definiert durch
∞
Γ(a ) =  e − y y α−1dy
0
Spezielle Funktionswerte erhält man aus folgenden Eigenschaften:
Eigenschaften der Gamma-Funktion
12
Γ(1) = 1
10
Γ(n) = (n − 1)!
Γ (α) = (α − 1)Γ (α − 1)
8
6
Γ(1/ 2) = π
1
1 ⋅ 3 ⋅ 5 ⋅ ... ⋅ (2n − 1)

Γn +  = π
2
2n

Bsp.
Γ(3 / 2) =Γ(1 + 1 / 2) = π
y
4
2
0
0
1
2
3
4
5
x
1 ⋅ ... ⋅ (2 ⋅ 1 − 1)
π
=
21
2
weitere Funktionswerte sind tabelliert bzw. mit MATLAB berechenbar
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
30
Weibullverteilung
Anwendung der Weibullverteilung:
Modellierung der Ausfallwahrscheinlichkeit/Lebensdauer von Systemen bei
nicht konstanter Ausfallrate (im Gegensatz zu Exponentialverteilung!)
Ausfallwahrscheinlichkeit:
Zuverlässigkeit:
Ausfallrate:
W ( X ≤ t ) = F (t ) = 1 − e
R(t ) = 1 − F (t ) = e
t
− 
T 
t
b 
f (t )
T
h(t ) =
=  
R(t )
b
b
b −1
⋅
e
t
− 
T 
1
⋅e
T
t
− 
T 
b
t
→ f (t ) = b  
T 
t
− 
T 
b −1
⋅
1
⋅e
T
b
t
− 
T 
b
b t 
=  
T T 
b −1
b > 1: Ausfallrate λ(t ) steigt mit t (Verschleißausfälle, Spätausfälle)
b < 1: Ausfallrate λ(t ) ist monoton fallend (Frühausfälle, dann Stabilität)
b = 1: konstante Ausfallrate λ(t ) =
1
(Exponentialverteilung)
T
Durch intervallweise Kombination verschiedener Ausfallraten entstehen die typischen
‚Badewannenkurven‘. Dann braucht man einen weiteren Parameter für die Startzeit.
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
31
Lebensdauerverteilungen
Lebensdauerverteilungen im Vergleich
Verteilung
Ausfallwahrscheinlichkeit
Exp( λ )
1 − e − λt
Erl(n, λ )
(λ t ) k
1− e 
k!
k =0
−λ
Wei(T, b)
1− e
SS 2017
Dichte
(t > 0)
λ e − λt
n −1
t
− 
T 
b
(λt ) n−1 −λt
λ
e
(n − 1)!
b x
 
T T 
b −1
e
x
− 
T 
Zuverlässigkeit
Ausfallrate
Mittlere
Lebensdauer
e − λt
λ
1/ λ
(λ t ) k
e 
k =0 k !
λ für t → ∞ λ / n
−λ
n −1
b
e
t
− 
T 
b
Prof. Dr. J. Schütze, FB GW
b t 
 
T T 
b −1
1 
T Γ  + 1
b 
Stet. Vert.
32
Testverteilung
Testverteilungen sind wichtig in der schließenden Statistik, sie beschreiben die
Verteilung von Testgrößen für Hypothesentests.
Standardnormalverteilung
χ 2 - Verteilung mit n Freiheitsgraden
t - Verteilung mit n Freiheitsgraden
F – Verteilung mit (n, m) Freiheitsgraden
Die Freiheitsgrade stehen im Zusammenhang zum jeweiligen Stichprobenumfang.
Die Werte der Quantile dieser Testverteilungen sind für verschiedene Freiheitsgrade
und Quantilordnungen α tabelliert bzw. mit Statistiksoftware berechenbar.
Für das α -Quantil ua der streng monotonen Verteilungsfunktionen F gilt
F (ua ) = α ↔ ua = F −1 (α )
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
33
Stetige Verteilung
χ 2 - Verteilung mit n Freiheitsgraden:
χ 2n = Z12 + ... + Z n2
mit Z i ~ N (0,1), unabhängig
2
Die χ -Verteilungen sind
nicht symmetrisch!
Daher hat man auch keine
Symmetrie in den Quantilen,
χ 2n ,α und χ 2n ,1−α
können nicht ineinander
umgerechnet werden.
Ab n > 30 können die Quantile
mit denen der NV genähert
werden,
p-Quantil in Matlab: chi2inv(p,k)
SS 2017
Prof. Dr. J. Schütze, FB GW
1
χ 2n ,α ≈ ( zα + 2n − 1) 2
2
Stet. Vert.
34
Stetige Verteilung
t - Verteilung mit n Freiheitsgraden:
Tn = Z / χ n2 / n
mit Z ~ N (0,1),
χ 2n chi-quadrat-verteilt
mit n FG, unabh. von Z
Die t-Verteilung besitzt die gleiche
Symmetrieeigenschaft wie die NV,
folglich ist t1−α = −ta
Mit wachsendem n nähert sich
die t-Verteilung der NV,
ab n = 30 kann sie durch
die der NV in guter Näherung
ersetzt werden.
p-Quantil in MATLAB: tinv(p,n)
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
35
Stetige Verteilung
F – Verteilung mit (n, m) FG:
Fn ,m = (χ n2 / n) /(χ m2 / m)
mit χ 2n , χ 2m chi-quadrat-verteilt
mit n bzw. m Freiheitsgraden,
unabhängig
Für die Quantile gilt folgende
Beziehung
f m.n . a =
1
f n ,m ,1−α
p-Quantil in MATLAB: finv(p,n,m)
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
36
Grenzwertsätze
Was passiert mit der Verteilung des Mittelwerts, wenn die Anzahl der eingehenden
Beobachtungen einer Zufallsgröße sehr groß ist?
X 1 , X 2 ,... X n seien unabhängige Zufallsgrößen mit gleicher Verteilung.
Das hat insbesondere zur Folge, dass für jedes i gilt: EX i = μ, VarX i = σ 2
n
S = X 1 + ... + X n =  X i
X = ( X 1 + ... + X n ) / n =
i =1
Erwartungswert
Varianz
Standardabweichung
Verteilung
ES = n ⋅μ
EX = μ
VarS = n ⋅ σ 2
VarX = σ2 / n
ST ( S ) = n ⋅ σ
ST ( X ) = σ / n
NV, falls alle Xi NV
NV, falls alle Xi NV
1 n
 Xi
n i =1
Die Größe ST ( X ) = σ / n heißt Standardfehler des Mittelwerts,
Maß für Abweichung des Durchschnitts X von μ,
im Unterschied zu σ als Maß für Abweichung des Einzelwerts X i von μ
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
37
Grenzwertsätze
Bei normalverteilten Zufallsgrößen ergibt Standardisierung von Summe bzw. Mittelwert
n
X
− nμ
X −μ
 N (0,1)
σ n
σ/ n
Näherungsweise gilt das auch ohne Voraussetzung der NV für großes n.
Zn =
i
=
i =1
Zentraler Grenzwertsatz
Sei X 1 , X 2 ,... eine Folge unabhängiger, identisch verteilter Zufallsgrößen mit
EX i = μ , VarX i = σ 2 .
Dann nähert sich die Verteilungsfunktion Fn ( z ) = P ( Z n ≤ z ) der standardisierten
Sum me Z n mit
n
X i − nμ

X −μ
= i =1
Zn =
σ/ n
σ n
für n → ∞ der Verteilungsfunktion der Standardnormalverteilung.
Faustregel für gute Näherung: n ≥ 30
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
38
Grenzwertsätze
Faustregel für gute Näherung der Verteilung von Summen durch NV: n ≥ 30
bei symmetrischen Verteilungen reicht oft schon kleineres n
Beispiel
Widerstände von 330 Ω werden vom Hersteller mit einer Fehlertoleranz von 5%
ausgewiesen, d.h. zwischen 315.5 Ω und 346.5 Ω.
Annahme der Gleichverteilung: Ri ~ Gl [315.5 , 346.5] , dann ist
313.5 + 346.5
346.5 − 313.5
ERi =
= 330, VarRi =
= 90.75, sRi = 90.75 = 9.53
2
12
Gesamtwiderstand R einer Reihenschaltung von 5 zufällig ausgewählten Widerständen
ER = E ( R1 + ... + R5 ) = 5 ⋅ 330 = 1650, VarR = 5 ⋅ 90.75 = 453.75, sR = 453.75 = 21.3
Histogramm des Gesamtwiderstands R
Simulation der 5 Zufallsgrößen Ri (10000 mal) mit MATLAB:
R = random(`unif‘,315.5,346.5,[10000,5])
R_sum = sum(R‘)‘
hist(R_sum)
2500
2000
1500
1000
500
Histogramm zeigt bei 5 Summanden gute Näherung an NV
SS 2017
Prof. Dr. J. Schütze, FB GW
0
1580
1600
1620
1640
1660
Stet. Vert.
1680
39
1700
1720
Grenzwertsätze
Spezialfall: Grenzwertsatz von Moivre-Laplace
Sei X ~ Bin ( n , p ) , dann nähert sich die Verteilung von Z n =
n → ∞ der Standardnormalverteilung.
9
(Faustregel: n >
, bei p ≈ 0.5 auch n ⋅ p > 5)
p(1 − p )
X − np
für
np (1 − p )
Damit lässt sich die Binomialverteilung Bin(n,p) durch eine Normalverteilung mit
μ = np, σ2 = np(1 − p ) approximieren. Es gilt für X ~ Bin(n,p)
 x − np 
P( X ≤ x ) ≈ Φ 

np
(1
p
)
−


Approximation mit Stetigkeitskorrektur
 x + 0.5 − np 
 x − 0.5 − np 
P( X = x ) ≈ Φ 
 − Φ

np
(1
p
)
np
(1
p
)
−
−




Anwendung: Berechnung von Binomialwahrscheinlichkeiten für großes n
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
 5.7
40
Grenzwertsätze
Tschebyscheffsche Ungleichung
P( Y − EY ≥ ε) ≤
VarY
, ε>0
2
ε
Folgerungen
σ2 1
8
(1) P( Y − EY ≥ 3σ) ≤ 2 = , folglich P ( Y − EY < 3σ) ≥
9σ
9
9
(2) P( Y − μ ≥ ε) ≤
2
σ
n ⋅ ε2
mit
1 n
Y =  Yi ,
n i =1
μ = EYi , σ 2 = VarYi
Schwaches Gesetz der großen Zahlen
Sei
(Yn ) n=1,2,...
eine Folge unabhängiger, identisch verteilter Zufallsgrößen mit
EYn = μ, VarYn = σ 2
Dann gilt für alle ε > 0
 1 N

lim N →∞ P   Yn − μ ≥ ε  = 0
 N n=1

SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
41
Grenzwertsätze
Folgerung
Konvergenz der relativen Häufigkeiten eines Ereignisses gegen seine
Wahrscheinlichkeit
Serie von N unabhängigen, zufälligen Versuchen zur Beobachtung des Ereignisses A
1 falls A im i -ten Versuch eintritt
Yi = 
0 sonst
Gesucht:
p = P ( A)
Es gilt
P(Yi = 1) = p, P(Yi = 0) = 1 − p,
EYi = p
1 N  1 N
E   Yi  =  EYi
N
1
 N i =1  N i =1
f N ( A) =  Yi
N i =1
1
= ⋅ N ⋅ p = p = P ( A)
N
Schwaches Gesetz der großen Zahlen, angewandt auf die relativen Häufigkeiten
Schätzung von p durch relative Häufigkeit
 1 N

lim N →∞ P   X n − μ ≥ ε  = lim N →∞ P ( f N ( A) − P ( A) ≥ ε ) = 0
 N n=1

SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
42
Vektoren stetiger Zufallsgrößen
X = [X1, X2 ] sei Vektor stetiger Zufallsgrößen über der gleichen Grundmenge Ω
Gemeinsame Verteilungsfunktion
FX ( x1 , x2 ) = P( X 1 ≤ x1 ∩ X 2 ≤ x2 ), x1 , x2 ∈ 
Randverteilungen der Komponenten (wieder eindimensional)
FX1 ( x) = lim x2 →∞ FX ( x, x2 ), FX 2 ( x) = lim x1 →∞ FX ( x1 , x)
Die Komponenten X1, X2 sind unabhängig, wenn
FX ( x1 , x2 ) = FX1 ( x1 ) ⋅ FX 2 ( x2 ), x1 , x2 ∈ 
Der Vektor heißt stetig verteilt mit der gemeinsamen Dichte f X ( x1 , x2 ) , wenn
x1 x2
FX ( x1 , x2 ) =

f X (ξ1 , ξ 2 )d ξ2 d ξ1
−∞ −∞
Bei Unabhängigkeit ist diese Dichte gleich dem Produkt der Randdichten
f X i ( x) = FX' i ( x), i = 1, 2
f X ( x1 , x2 ) = f X1 ( x1 ) ⋅ f X 2 ( x2 )
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
43
Vektoren stetiger Zufallsgrößen
X1, X2 seien stetige Zufallsgröße mit der gemeinsamen Dichte fX
Kovarianz
Cov( X 1 , X 2 ) = E ( X 1 − EX 1 )( X 2 − EX 2 )
=
Korrelation
ρ=
∞ ∞
  (x
1
− EX 1 )( x2 − EX 2 ) f X ( x1 , x2 )dx2 dx1
−∞ −∞
Cov( X 1 , X 2 )
VarX 1 ⋅ VarX 2
Mit -1 ≤ ρ ≤ 1 ist die Korrelation ein Maß für die lineare Abhängigkeit.
Bei linearer Unabhängigkeit gilt ρ = 0.
Faltung von X1, X2 : Verteilung der Summe Z = X1 + X2
Dichte der Faltung bei zusätzlicher Voraussetzung der Unabhängigkeit von X1, X2
f Z ( z ) = f X 1∗ X 2 ( z ) =
+∞

f X1 ( x ) f X 2 ( z − x)dx
−∞
SS 2017
Prof. Dr. J. Schütze, FB GW
Stet. Vert.
44
Herunterladen