systementwurf

Werbung
SYSTEMENTWURF
Stochastische Grundlagen
Vorlesung im WS 2012/13
System- und Software-Engineering
Prof. Dr.-Ing. Armin Zimmermann
Inhalt
 Wahrscheinlichkeit
 Zufallsvariablen
 Verteilung von Zufallsvariablen
 Momente
 Quantile
 Einige wichtige Verteilungen
 Bestimmen von Verteilungen
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 2
Wahrscheinlichkeit
 Wahrscheinlichkeit


Viele Vorgänge sind nicht exakt vorhersagbar,
z. B. Ausfall eines Rechners
Stochastik: mathematische Modelle
für quantitative Aussagen
 Begriffe

Zufallsexperiment (random experiment)


Elementarereignis (elementary event)


Jeder einzelne mögliche Versuchsausgang
Ereignisraum (sample space)


Experiment mit mehreren möglichen Versuchsausgängen
Menge S aller möglichen Elementarereignisse
Ereignis (event)

Menge E von Elementarereignissen, E Í S
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 3
Wahrscheinlichkeit
 Beispiel: redundantes Rechnersystem



System aus zwei (ausfallenden) Komponenten A und B
System intakt, falls mindestens eine Komponente intakt
Zufallsexperiment




Beobachtung des Systems nach 1000 Betriebsstunden
Mögliche Elementarereignisse:
e1 = A und B intakt
e2 = A intakt, B defekt
e3 = A defekt, B intakt
e4 = A und B defekt
Ereignisraum: S = {e1,e2,e3,e4 }
Ereignisse:
Gesamtsystem intakt : E1 = {e1,e2,e3}
Gesamtsystem defekt: E2 = {e4 }
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 4
Wahrscheinlichkeit
 Beispiel: Lebensdauer einer Festplatte


Anfangs intakt, Ausfall möglich
Zufallsexperiment




Zeitpunkt des Ausfalls
Ereignisraum: S = [0, ¥)
Ereignis: Lebensdauer 1000h: E = [1000, ¥)
Fragestellung in beiden Beispielen:
wie wahrscheinlich sind Ereignisse?
 Formalisierung des
Wahrscheinlichkeitsbegriffes

Die Wahrscheinlichkeit (probability) P(E) ist eine
Maßfunktion, die jedem Ereignis E Í S eine reelle Zahl
aus dem Intervall [0,1] zuordnet
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 5
Wahrscheinlichkeit
 Definitionen und Rechenregeln







(Fast) unmögliches Ereignis P(Æ) = 0
(Fast) sicheres Ereignis P(S) = 1
Komplementäres Ereignis P(E) = P(S \ E) = 1 - P(E)
Durchschnitt E1 Ç E2 ist Ereignis, wenn E1 und E2
eintreten
Vereinigung E1 È E2 ist ein Ereignis, wenn E1 oder E2
(oder beide) eintreten
Disjunkte Ereignisse P(E1 È E2 ) = P(E1 ) + P(E2 )
Veranschaulichung durch
S
Venn-Diagramm
E1
SSE Zimmermann
Systementwurf
E1  E2
E2
Stochastische Grundlagen - 6
Wahrscheinlichkeit
 Bedingte Wahrscheinlichkeit
(conditional probability)



Wahrscheinlichkeit von E1 unter der Voraussetzung, dass
P(E1 Ç E2 )
P(E
|
E
)
=
E2 eingetreten ist:
1
2
P(E2 )
Unabhängigkeit (independence)
 E1 und E2 heißen unabhängig, falls P(E1 | E2 ) = P(E1 )
 Äquivalent zu P(E1 Ç E2 ) = P(E1 ) ⋅ P(E2 )
Beispiel: Zweikomponenten-System


Wahrscheinlichkeit, dass eine Komponente intakt = 0.9
Falls Ausfälle beider Komponenten unabhängig, gilt:
P(A und B intakt) = P(A intakt)  P(B intakt) = 0.92 = 0.81
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 7
 Wahrscheinlichkeit
 Zufallsvariablen
 Verteilung von Zufallsvariablen
 Momente
 Quantile
 Einige wichtige Verteilungen
 Bestimmen von Verteilungen
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 8
Zufallsvariablen
 Zufallsvariablen





Abstraktion: Zuordnung eines numerischen Wertes
zu jedem Elementarereignis
Zufallsvariable (random variable) X ist Abbildung S  
Jedem Elementarereignis e  S wird eine
reelle Zahl X(e) zugeordnet
Begriff Der Funktionswert ist vor Durchführung eines
Experiments unbekannt, danach aber ein fester Wert
Mögliche Fälle:

diskrete Zufallsvariable
Wertebereich der Zufallsvariablen ist endlich oder abzählbar:
X (S )  

kontinuierliche (oder stetige) Zufallsvariable
Wertebereich der Zufallsvariablen ist überabzählbar groß: X (S )  
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 9
Zufallsvariablen
 Beispiel: Zweikomponenten-System


X(A und B intakt) = 2
X(A intakt, B defekt) = 1
X(A defekt, B intakt) = 1
X(A und B defekt) = 0
X(S) = {0,1, 2} (Zufallsvariable ist diskret)
A und B defekt
0
A defekt B intakt
A intakt B defekt
1
A und B intakt
2
S
Zahlengerade
 Beispiel: Lebensdauer Festplatte


X(Lebensdauer y in Stunden) = y
X(S) = [0, ¥) (Zufallsvariable ist kontinuierlich)
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 10
 Wahrscheinlichkeit
 Zufallsvariablen
 Verteilung von Zufallsvariablen
 Momente
 Quantile
 Einige wichtige Verteilungen
 Bestimmen von Verteilungen
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 11
Verteilung von Zufallsvariablen

Verteilung: Beschreibung, mit welcher Wahrscheinlichkeit
eine Zufallsvariable bestimmte Werte annimmt
 Verteilung einer diskreten Zufallsvariablen




Wahrscheinlichkeit jedes einzelnen Werts pn = P(X = x n )
pn heißt diskrete Wahrscheinlichkeitsdichte
(probability mass function, pmf oder discrete density fct.)
Grafische Repräsentation durch Balkendiagramm
Wahrscheinlichkeit, dass Zufallsvariable X einen Wert
annimmt, der ein vorgegebenes x nicht übersteigt:
F(x) = P(X £ x) =
å pn
xn £x

F(x) heißt Wahrscheinlichkeits-Verteilungsfunktion
([cumulative] distribution function, CDF)
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 12
Verteilung von Zufallsvariablen
 Wahrscheinlichkeits-Verteilungsfunktion F(x)








F(x) ist eine Treppenfunktion mit Sprungstellen
Sprunghöhe pn an der Stelle x n
Wertebereich von X endlich bzw. unendlich
 endlich bzw. unendlich viele Sprungstellen
Eigenschaften von Verteilungsfunktionen
0 £ F(x) £ 1
F(x) ist monoton steigend (aber nicht streng)
lim F(x) = 0
x -¥
lim F(x) = 1
x ¥
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 13
Verteilung von Zufallsvariablen
 Beispiel: Zweikomponenten-System


X gibt Anzahl der intakten Komponenten an
Annahmen: P(X = 0) = p0 = 0.1
P(X = 1) = p1 = 0.6
P(X = 2) = p2 = 0.3
pn
F(x)
0.6
0.3
1.0
0.7
0.1
0.1
0
1
SSE Zimmermann
2
x
Systementwurf
0
1
2
x
Stochastische Grundlagen - 14
Verteilung von Zufallsvariablen
 Verteilung einer stetigen Zufallsvariablen

Wie im diskreten Fall kann die WahrscheinlichkeitsVerteilungsfunktion F(x) definiert werden als
F(x) = P(X £ x)

In Analogie zum diskreten Fall wird eine stetige Wahrscheinlichkeitsdichte f(x) (probability density function,
pdf) definiert mit der Eigenschaft
x
F(x) =
ò
f(y)dy
-¥

f(x) ist somit gegeben durch f(x) =
(falls die Ableitung existiert)
SSE Zimmermann
Systementwurf
d
dx
F(x)
Stochastische Grundlagen - 15
Verteilung von Zufallsvariablen
 Beispiel: Gleichverteilung (uniform distribution)

Alle Werte in [a, b] gleich wahrscheinlich
ìï 0
x<a
ï
1
ì b -a a £ x < b
ï
ï
ï
-a a £ x < b
f(x) = í
, F(x) = ï
í bx a
ï
ï
0
sonst
ï
ï
î
ïï1
x³b
î
F(x)
f(x)
1.0
1
b-a
a
SSE Zimmermann
b
x
Systementwurf
a
b
x
Stochastische Grundlagen - 16
Verteilung von Zufallsvariablen
 Eigenschaften


Für diskrete V. genannte Eigenschaften gelten unverändert
Eine Fläche unter f(x) im Intervall [c, d] ist ein Maß für die
Wahrscheinlichkeit, dass X Werte in diesem Intervall
annimmt: P(c < X £ d) = P(X £ d) -dP(X £ c)
= F(d) - F(c) =
ò f(x)dx
c
F(x)
f(x)
1.0
1
b-a
a
SSE Zimmermann
c
db
x
Systementwurf
a
c
d b
x
Stochastische Grundlagen - 17
Verteilung von Zufallsvariablen
 Eigenschaften
¥

ò
f(x)dx = 1 (sicheres Ereignis)
-¥



Die Wahrscheinlichkeit für ein einzelnes
Elementarereignis ist Null
P(X = c) = F(c) - F(c) = 0
Nur Flächen unter f(x) sind Wahrscheinlichkeiten,
Funktionswerte von f(x) nicht
Der Verlauf von f(x) veranschaulicht, wie sich die
Wahrscheinlichkeit auf die Wertebereiche der
Zufallsvariablen verteilt
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 18
Verteilung von Zufallsvariablen
 Gemischte Zufallsvariablen



Diskrete Zufallsvariable  F(x) hat Sprünge
Stetige Zufallsvariable  F(x) steigt stetig
Weitere Möglichkeit
 F(x) hat stetige Anteile und Sprungstellen


X heißt dann gemischte Zufallsvariable
F(x) heißt gemischte Verteilungsfunktion
F(x)
1.0
x
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 19
Verteilung von Zufallsvariablen
 Gemischte Zufallsvariablen


Frage: welche Gestalt hat dann die Dichtefunktion?
Zwei Möglichkeiten



Aufspaltung in diskreten und stetigen Anteil
Verallgemeinerte Funktionen (Dirac-Impuls)
Dirac-Impuls erlaubt die einheitliche Behandlung
diskreter, stetiger und gemischter Zufallsvariablen
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 20
Verteilung von Zufallsvariablen
 Dirac-Impuls



Definition des Einheitsimpulses:
Rechtecke mit Fläche 1, Breite , Höhe 1/
Grenzübergang e  0 liefert Dirac-Impuls d(x)
(x)
 0
1/
- /2
SSE Zimmermann
0
+/2
x
Systementwurf
0
x
Stochastische Grundlagen - 21
Verteilung von Zufallsvariablen
 Dirac-Impuls

Dirac-Impuls an Stelle a : d(x - a)
¥

Ausblendeigenschaft:
ò
g(x) d(x - a)dx = g(a)
-¥
(falls g(x) differenzierbar)
 Sprungfunktion



Integral über Dirac-Impuls für Verteilungsfunktionen
0 x£0
ì
ï
ï
Definition: s(x) = í
1 x>0
ï
ï
î
Beziehungen: d(x - a) = ds(x - a) dx
s(x - a) =
SSE Zimmermann
x
ò-¥ d(t - a) ⋅ dt
Systementwurf
Stochastische Grundlagen - 22
Verteilung von Zufallsvariablen
 Beispiel: deterministische „Verteilung“





Taktzeit in einem Rechnersystem sei fest und gleich 
Fasst man die Zeit als Zufallsvariable X auf, nimmt X
immer den Wert  an
X ist diskret „verteilt“ mit der Dichte P(X = t) = 1
Dichtefunktion: Einheitsimpuls an Stelle  f(x) = d(x - t)
Verteilungsfunktion: Einheitssprung an Stelle 
x
F(x) =
ò
-¥
x
f(y)dy = ò d(y - t)dy = s(x - t)
-¥
F(x)
f(x)
1

SSE Zimmermann
x
Systementwurf

x
Stochastische Grundlagen - 23
Verteilung von Zufallsvariablen
 Beispiel: gemischte Verteilung




Eine Zufallsvariable sei gleichverteilt zwischen [1, 2] mit
dem Wert 0.5
Der einzelne Wert 2 wird mit Wahrscheinlichkeit 0.5
eingenommen
Anwendung: die Bearbeitungszeit für einen Auftrag ist
gleichverteilt, aber begrenzt durch eine Zeitschranke
Dichte- und Verteilungsfunktion:
ìï 0
x <1
ïï
f(x) = ïí 0.5
1£x <2
ïï
ïï 0.5d(x - 2) x ³ 2
ïî
SSE Zimmermann
ìï 0
x <1
ïï
F(x) = ïí 0.5 ⋅ (x - 1) 1 £ x < 2
ïï
ïï1
x³2
î
Systementwurf
Stochastische Grundlagen - 24
Verteilung von Zufallsvariablen
 Beispiel: gemischte Verteilung

Grafisch:
f(x)
F(x)
1
0.5
0.5
1

2
x
1
2
x
Alternative Darstellung:
f(x) = 0.5 ⋅ s(x - 1) + 0.5 ⋅ d(x - 2) - 0.5 ⋅ s(x - 2)
F(x) = 0.5 ⋅ s(x - 1) ⋅ (x - 1) + 0.5 ⋅ s(x - 2)
-0.5 ⋅ s(x - 2) ⋅ (x - 2)
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 25
 Wahrscheinlichkeit
 Zufallsvariablen
 Verteilung von Zufallsvariablen
 Momente
 Quantile
 Einige wichtige Verteilungen
 Bestimmen von Verteilungen
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 26
Momente und Quantile
 Momente und Quantile


Verteilungs- oder Dichtefunktion charakterisieren
Zufallsvariable vollständig
 Oft zu aufwendig bzw. nicht vollständig bekannt!
Gesucht: einfachere Kenngrößen, die eine Zufallsvariable
hinreichend genau beschreiben




Beispiel: „Die mittlere Verzögerungszeit beträgt 30ms“
Beispiel: „95% aller Anfragen werden innerhalb von
24 Stunden beantwortet“
 Momente und Quantile von Verteilungsfunktionen
Die wichtigsten: Mittelwert und Streuung
Kenngrößen sind


aus der Verteilungsfunktion berechenbar
oder z.B. bei unbekannter Funktionsform geschätzt
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 27
Momente
 Wichtigstes Moment: Erwartungswert


f(x) sei Dichtefunktion der Zufallsvariablen X
E [ X ] heißt Erwartungswert (expectation) oder
Mittelwert (mean value) von X
¥

Berechnung:
E[ X ] =
ò
x ⋅ f(x)dx
-¥


Das Integral muss nicht existieren, in diesem Fall gibt es
keinen Erwartungswert
Vereinfachte Schreibweise für diskrete Zufallsvariablen:
E[ X ] =
å x n ⋅ pn
n
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 28
Momente
 Beispiele für die Berechnung des
Erwartungswertes


Beispiel diskreter Fall: Zweikomponenten-System

Wahrscheinlichkeiten der einzelnen Ereignisse:

Erwartungswert: mittlere Anzahl intakter Komponenten
E [ X ] = 0 ⋅ 0.1 + 1 ⋅ 0.6 + 2 ⋅ 0.3 = 1.2
p0 = 0.1, p1 = 0.6, p2 = 0.3
Beispiel kontinuierlicher Fall: Lebensdauer Batterie


Gleichverteilung im Intervall [a, b]
Erwartungswert: mittlere Lebensdauer
b
E[ X ] =
ò
a

b
x
x2
b2 - a 2
a+b
dx =
=
=
b-a
2(b - a) a
2(b - a)
2
Auch geometrisch aus Funktion ableitbar
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 29
Momente
 Funktion einer Zufallsvariablen


Funktion g definiert neue Zufallsvariable Y = g(X)
¥
dann gilt E[Y] = E[g(X)] = ò g(x)f(x) dx
-¥

Der Erwartungswert-Operator ist linear:
 Seien X, Y Zufallsvariablen und ,  Skalare, dann gilt
E[aX + bY] = aE[X] + bE[Y]

Beispiel



Lebensdauer X einer Batterie ist gleichverteilt in [100, 200]
Erwartungswert: (100+200)/2 = 150
Wie groß ist mittlere Lebensdauer einer Batterie mit
dreifachen Parametern [300, 600] (Zufallsvariable Y)?
E[Y] = E[3X] = 3E[X] = 450
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 30
Momente
 Weiteres wichtiges Moment: Varianz

Die Varianz von X, Var[X] ist die mittlere quadratische
Abweichung der Werte der Zufallsvariablen von ihrem
Erwartungswert:
Var[X] = E[(X - E[X])2 ]



Erwartungswert der Abweichung muss nicht existieren,
in diesem Fall ist die Varianz nicht definiert
Beispiel: „heavy-tailed” distributions
Einsetzen liefert
¥
Var[X] =
ò
(x - E[X])2 f(x) dx
-¥

Vereinfachte Schreibweise im diskreten Fall:
Var[X] = å (x n - E[X])2 pn
n
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 31
Momente
 Beispiele für die Berechnung der Varianz

Beispiel diskreter Fall: Zweikomponenten-System

Wahrscheinlichkeiten der einzelnen Ereignisse:

Varianz: mittlere quadratische Abweichung vom Mittelwert
p0 = 0.1, p1 = 0.6, p2 = 0.3
Var [ X ] = (0 - 1.2)2 ⋅ 0.1 + (1 - 1.2)2 ⋅ 0.6 + (2 - 1.2)2
= 0.36

Beispiel kontinuierlicher Fall: Lebensdauer Batterie
a+b
 Gleichverteilung im Intervall [a, b], E [ X ] =
2

Varianz:
Var[x] =
b
ò
a
SSE Zimmermann
2
(b
a)
(x - a +2 b )2 b-1 a dx =  =
12
Systementwurf
Stochastische Grundlagen - 32
Momente
 Alternativen zur Varianz


Es existieren weitere gebräuchliche Maße für die
Abweichung vom Mittelwert
Standardabweichung (standard deviation) s




Quadratische Berechnung vom Mittelwert bei Varianz:
positive und negative Abweichungen dürfen sich nicht
aufheben
Maße im Bereich der Werte: Wurzel aus Varianz
Berechnung: s = Var[X]
Variationskoeffizient (coefficient of variation) C



Varianz und Standardabweichung messen Abweichungen
abhängig von Größenordnung der Werte
Relative, unabhängig von Werten normierte Größe
s
Berechnung: C =
E[X]
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 33
Momente
 Allgemeiner Begriff des Moments

Definition des Erwartungswertes: E [ X ] =
¥

Verallgemeinerung E[X n ] =
heißt n-tes Moment



ò
¥
ò
x ⋅ f(x)dx
-¥
x n f(x) dx
-¥
Erwartungswert: Erstes Moment
Unter bestimmten Voraussetzungen ist eine Verteilung
durch ihre (unendlich vielen) Momente eindeutig bestimmt
Varianz ist aus dem 1. und 2. Moment berechenbar:
Var[X] = E[(X - E[X])2 ] = E[X2 - 2XE[X] + E[X]2 ]
= E[X2 ] - 2E[X]2 + E[X]2 = E[X2 ] - E[X]2

Varianz wird daher 2. zentriertes Moment genannt
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 34
 Wahrscheinlichkeit
 Zufallsvariablen
 Verteilung von Zufallsvariablen
 Momente
 Quantile
 Einige wichtige Verteilungen
 Bestimmen von Verteilungen
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 35
Quantile
 Beschreibung von Zufallsvariablen mit
Quantilen




Vorgegeben ist die Wahrscheinlichkeit 
Das -Quantil einer Zufallsvariablen X ist der Wert xa ,
für den gilt:
P(X £ xa ) = F(xa ) = a
Anschaulich: a ⋅ 100% der möglichen Werte von X
sind kleiner gleich xa
Median



Wert der Zufallsvariablen, bei dem jeweils die Hälfte der
Wahrscheinlichkeitsmasse darüber bzw. darunter liegt
Median = 0.5-Quantil
Nur manchmal (z.B. symmetrische V.) mit Mittelwert
identisch!
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 36
Quantile
 Beispiel für ein Quantil


Bearbeitungszeit für einen Auftrag sei gemäß F(x) verteilt
Wie groß ist die Zeit x 0.95 , in der 95% aller Aufträge
bearbeitet sind?
f(x)
Fläche = 0.05
Fläche = 0.95
x0.95
SSE Zimmermann
Systementwurf
x
Stochastische Grundlagen - 37
 Wahrscheinlichkeit
 Zufallsvariablen
 Verteilung von Zufallsvariablen
 Momente, Quantile
 Einige wichtige Verteilungen


Diskrete Verteilungen
Kontinuierliche Verteilungen
 Bestimmen von Verteilungen
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 38
Wichtige Verteilungen
 Diskrete Verteilungen


Gleichverteilung
Bernoulli-Verteilung, Geometrische Verteilung,
Binomialverteilung, Poisson-Verteilung
 Kontinuierliche Verteilungen



Gleichverteilung
Exponentialverteilung, Erlang-, Gamma-,
Hypo- / Hyperexponential-Verteilung
Normalverteilung, Weibull-Verteilung
 Bedeutung


Messung: Verteilung erkennen bzw. approximieren
Modellierung: Entscheidung für Funktionsform
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 39
Wichtige Verteilungen
 Diskrete Gleichverteilung






discrete uniform, DU(i, j)
Zufälliger Versuchsausgang mit
gleich wahrscheinlichen Ereignissen
Ereignisraum S = {i, i + 1, , j}
i+j
Mittelwert E(X) =
2
(j - i + 1)2 - 1
Varianz Var(X) =
12
Beispiel: Würfel = DU(1,6)
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 40
Wichtige Verteilungen
 Diskrete Gleichverteilung

Sei q =
1
j- i +1
F(X)
1
P(X)
q
q
i-1 i i+1
j-1 j j+1 X
Dichtefunktion
SSE Zimmermann
i i+1
j
X
Verteilungsfunktion
Systementwurf
Stochastische Grundlagen - 41
Wichtige Verteilungen
 Bernoulli-Verteilung


Jakob Bernoulli, 1655-1705
Zufallsversuch mit zwei möglichen Ausgängen
 „Bernoulli trial“, Ereignisraum S = {0,1}







Bezeichnung als „Erfolg“ und „Misserfolg“
Wahrscheinlichkeiten: P[Erfolg] = p,
P[Misserfolg] = q, p+q=1
Bernoulli-Verteilung mit Parameter p: Wahrscheinlichkeitsverteilung P(X) einer Zufallsvariable X, die bei Erfolg
den Wert 1 und bei Misserfolg den Wert 0 annimmt
P(X = 1) = p, P(X = 0) = q oder P(X) = pX q1-X
Erwartungswert E(X) = p , Varianz Var(X) = pq
Grundlage für Binomial-Verteilung und Geometrische V.
Bezeichnung: Bernoulli(p)
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 42
Wichtige Verteilungen
 Bernoulli-Verteilung
F(X)
P(X)
1
q
q
p
0
1
X
Dichtefunktion
SSE Zimmermann
0
1
X
Verteilungsfunktion
Systementwurf
Stochastische Grundlagen - 43
Wichtige Verteilungen
 Geometrische Verteilung

Annahmen









Vorgang ist mit einem Bernoulli-Versuch beschreibbar
Mehrfache Ausführung (beliebig oft?)
Jeder Einzelversuch ist unabhängig
Fortführung bis zum ersten Erfolg
Beispiele: Rechner defekt oder intakt, Betriebsmittel belegt
oder frei, 6 gewürfelt oder nicht, …
Ergebnis: unendliche Folge von Erfolg und Misserfolg
Bezeichne 0 Misserfolg und 1 Erfolg
Ereignisraum S = {0i-11 | i = 1, 2, }
Bezeichnung: geom(p)
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 44
Wichtige Verteilungen
 Geometrische Verteilung


Eine wichtige Zufallsvariable ist die Nummer K
des ersten erfolgreichen Versuchs
Ein Erfolg beim k-ten Versuch setzt k – 1 Misserfolge
voraus: p = P(K = k) = q k-1p = (1 - p)k-1 p
k

Versuche sind laut Voraussetzung unabhängig,
daher Produkt für Und-Verknüpfung
pk
p

Dichtefunktion:
0
SSE Zimmermann
1
Systementwurf
2
3
4
5
k
Stochastische Grundlagen - 45
Wichtige Verteilungen
 Geometrische Verteilung


Verteilungsfunktion
k
F(k) = P(K £ k) = å i=1 pi = 1 - (1 - p)k
Wegen p, q < 1 konvergiert die Reihe:
p
¥
F(¥) = å i=1 pq i =
=1
1-q


k = 1,2,¼
d.h. F(k) ist wirklich eine Verteilung
Erwartungswert der geometrischen Verteilung
1
¥
¥
k -1
E[K] = å k =1 k ⋅ p = p ⋅ å k =1 k ⋅ (1 - p)
=
k
p

Je kleiner die Erfolgswahrscheinlichkeit p, desto länger
muss man im Mittel auf den ersten Erfolg warten
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 46
Wichtige Verteilungen
 Varianz
Var[K] =
1-p
p2
 Gedächtnislosigkeit
der geometrischen Verteilung




Erfolg jedes Versuchs tritt mit p ein
Für den Ausgang des aktuellen Versuchs ist daher die
„Vorgeschichte“ egal
Daher wird geometrische Verteilung als gedächtnislos
(memoryless) bezeichnet
Einzige diskrete Verteilung mit dieser Eigenschaft!
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 47
Wichtige Verteilungen
 Anwendungsbeispiele der geometrischen
Verteilung

Beispiel Round-Robin Scheduling mit Zeitscheiben





Ein Prozess erhält bei jeder Zuteilung eine Zeitscheibe
Prozess terminiert mit der Wahrscheinlichkeit p innerhalb der
Zeitscheibe und benötigt mit 1 – p mehr Rechenzeit
Fortgesetzte Zuweisung von Zeitscheiben entspricht
Folge von Misserfolgen
Terminierung entspricht dem Erfolg
Die benötigte Anzahl von Zeitscheiben und damit die
benötigte Rechenzeit ist geometrisch mit p verteilt
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 48
Wichtige Verteilungen
 Anwendungsbeispiele der geometrischen
Verteilung

Beispiel Kommunikationskanal






Ein Kommunikationskanal kann Datenpakete zu festen
Zeitpunkten i = 0, 1, … übertragen („getaktet“)
Pakete haben feste Länge
Übertragung eines Paketes dauert eine Zeiteinheit
Zur Zeit i will eine Station ein Paket mit Wahrscheinlichkeit p
senden, mit 1 – p ist kein Paket da
Dauer der fortgesetzten Belegung ist geometrisch verteilt
Dauer der Nichtbelegung des Kanals ist geometrisch verteilt
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 49
Wichtige Verteilungen
 Binomialverteilung



Wieder werden Bernoulli-Versuche durchgeführt
Es interessiert die Zufallsvariable S, die die Anzahl der
Erfolge innerhalb von n Versuchen beschreibt
Sei s  n eine Menge von Versuchen

Wahrscheinlichkeit, dass genau diese s Versuche erfolgreich
sind
ps (1 - p)n -s

Anzahl der Möglichkeiten, s aus n Versuchen unterschiedlich
auszuwählen
ænö
n!
çç ÷÷ =
çè s ÷ø s ! (n - s)!

(Binomialkoeffizient)
Bezeichnung: bin(n, p) falls Grundversuch Bernoulli(p)
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 50
Wichtige Verteilungen
 Binomialverteilung

Dichtefunktion der Binomialverteilung




Wahrscheinlichkeit, dass s Erfolge unter n Versuchen sind
ænö s
P(S = s) = çç s ÷÷ ⋅ p ⋅ (1 - p)n-s
çè ÷ø
Erwartungswert E[S] = np
Varianz
Var[S] = np(1 - p)
Betrachtung der Zufallsvariablen S/n, d.h. der Häufigkeit,
mit der Erfolge innerhalb von n Versuchen auftreten


Erwartungswert für beliebiges n ist p
Erfahrung zeigt, dass für großes n die Häufigkeit S/n
die Wahrscheinlichkeit p gut annähert
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 51
Wichtige Verteilungen
 Binomialverteilung
s
Dichtefunktionen für p=0.5 und verschiedene n
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 52
Wichtige Verteilungen
 Anwendungsbeispiele der Binomialverteilung

Beispiel Zeitscheiben
Anzahl von Prozessen, die innerhalb von n Zeitscheiben
terminieren, ist binomialverteilt
 Ihr Mittelwert ist n·p, der mittlere Systemdurchsatz ist
p Prozesse pro Zeiteinheit (= Zeitscheibe)
Beispiel Kommunikationskanal
 Anzahl übertragener Pakete in n Zeiteinheiten:
binomialverteilt
 Mittlerer Kanaldurchsatz: p Pakete/Zeiteinheit
Beispiel Qualitätssicherung
 Anzahl fehlerhafter Produkte bei einer Stichprobe aus einer
Serie ist binomialverteilt
 Sind s von n entnommenen Produkten fehlerhaft, dann ist
p = s/n eine Näherung der Fehlerwahrscheinlichkeit



SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 53
Wichtige Verteilungen
 Poisson-Verteilung


Beispiel: betrachten Anzahl von Aufträgen, die in einem
Datenbankserver innerhalb der Zeit t ankommen
Annahmen






Aufträge werden zufällig erzeugt
Auftragserzeugung mit konstanter Rate  pro Zeiteinheit
Es kommen nie mehrere gleichzeitig an
Falls t ausreichend klein gewählt, ist Wahrscheinlichkeit
für das Eintreffen eines Auftrags in t = * t, und
Wahrscheinlichkeit für mehr als einen Auftrag null
Anzahl der Aufträge innerhalb t ist dann Poisson-verteilt
Bezeichnung: Poisson()
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 54
Wichtige Verteilungen
 Poisson-Verteilung


Herleitung aus Binomial-Verteilung und
Grenzwert für t gegen Null
Dichtefunktion
e-l l x
P(X = x) =
x!
-l

Verteilungsfunktion P(X £ x) = e

Mittelwert E[X] = l

Varianz Var[X] = l
SSE Zimmermann
Systementwurf
ëxû
li
å i!
i=0
(x Î )
(x ³ 0)
Stochastische Grundlagen - 55
Wichtige Verteilungen
 Beispiel Poisson-Verteilung




Ein Kaufhaus wird durchschnittlich alle 10s
von einem Kunden betreten
Werden die pro Minute eintretenden Personen gezählt,
würde man im Mittel 6 Personen erwarten (=6)
P6(n) gibt die Wahrscheinlichkeit dafür an, dass in der
nächsten Minute
genau n Kunden
das Kaufhaus
betreten
Poisson(6)
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 56
 Wahrscheinlichkeit
 Zufallsvariablen
 Verteilung von Zufallsvariablen
 Momente, Quantile
 Einige wichtige Verteilungen


Diskrete Verteilungen
Kontinuierliche Verteilungen
 Bestimmen von Verteilungen
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 57
Wichtige Verteilungen
 Gleichverteilung






Uniform bzw. rectangular U(a, b)
Zufälliger Versuchsausgang mit
gleich wahrscheinlichen Ereignissen
Ereignisraum S = [a, b] a, b Î 
a+b
Mittelwert E(X) =
2
(b - a)2
Varianz Var(X) =
12
Beispiel: Zufallszahlengenerator im Rechner U[0,1]
(näherungsweise)
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 58
Wichtige Verteilungen
 Gleichverteilung

Sei q =
1
b-a
F(X)
1
P(X)
q
a
b
X
Dichtefunktion
SSE Zimmermann
a
b
X
Verteilungsfunktion
Systementwurf
Stochastische Grundlagen - 59
Wichtige Verteilungen
 Exponentialverteilung (exponential distribution)



Wahrscheinlichkeitsdichte
ìï le-lx x > 0
f(x) = ïí
ïï 0
sonst
î
Eindeutig durch den Parameter  (Rate) beschrieben
Anwendungen der kontinuierlichen Exponentialverteilung



Zwischenankunftszeit = Zeit zwischen zwei Aufträgen
Lebenszeit eines Geräts = Zeit bis zum Ausfall
Verteilungsfunktion
ìï1 - e-lx
F(x) = ïí
ïï
0
î
SSE Zimmermann
x>0
Systementwurf
sonst
Stochastische Grundlagen - 60
Wichtige Verteilungen
 Exponentialverteilung

Dichtefunktion


1
2

SSE Zimmermann
3
4
1
4
Systementwurf
Stochastische Grundlagen - 61
Wichtige Verteilungen
 Exponentialverteilung

Verteilungsfunktion
1
l=
0.8
3
4
l=
0.6
1
2
l=
1
4
0.4
0.2
0
0
SSE Zimmermann
2
4
Systementwurf
6
8
10
Stochastische Grundlagen - 62
Wichtige Verteilungen
 Exponentialverteilung


Erwartungswert
E[X] =
ò0

x⋅l⋅e
1
dx =
l
Schaltrate:  (pro Zeiteinheit des Modells)
Mittlere Zeit bis zum Schalten: 1/ 
Varianz
Var [ X ] =
¥
ò
(x - l1 ) l1 ⋅ e-lx dx =  =
0

-lx
Transitionen im stochastischen Petri-Netz mit
exponential verteilter Schaltzeit


¥
1
l2
Gedächtnislosigkeit

Häufig in der Leistungs- und Zuverlässigkeitsbewertung
eingesetzt, da analytisch sehr einfach zu behandeln
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 63
Wichtige Verteilungen
 Erlang-Verteilung


A. K. Erlang, 1878-1929
Annahmen



Vorgang aus r aufeinander folgenden Phasen
Jeweilige Dauer ist exponentialverteilt
Mit gleichem Parameter 

Dann ist Gesamtdauer Erlang-verteilt (r=1: Exponential-V.)

l r tr-1e-lt
Dichtefunktion f(t) =
(r - 1)! r-1


(lt)k -lt
Verteilungsfunktion F(t) = 1 - å
e
k=0 k !
Erlang: Spezialfall wenn r positiv ganzzahlig ist; sonst
Gamma-Verteilung (nicht geschlossen darstellbar)
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 64
Wichtige Verteilungen
 Erlang-Verteilung
r
l
r
Var(X) = 2
l

Mittelwert E(X) =

Varianz

Beispiele für
Dichtefunktionen
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 65
Wichtige Verteilungen
 Hypoexponential-Verteilung

Verallgemeinerung der Erlang-Verteilung, falls nicht alle
Phasen den gleichen Parameter  haben
 Hyperexponential-Verteilung

k alternative Phasen statt aufeinander folgende Phasen
k

Dichtefunktion f(t) =
-l i t
a
l
e
å i i
i =1

Verteilungsfunktion F(t) =
k
-l i t
a
(1
e
)
å i
i =1
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 66
Wichtige Verteilungen
 Normalverteilung oder Gauß-Verteilung
(normal or Gaussian distribution)


C. F. Gauss, 1777-1855
Beschreibung vieler natürlicher Vorgänge



Grund: die Verteilung der Summe unabhängiger,
(identisch verteilter) Zufallsvariablen strebt gegen eine
Normalverteilung


... die zufällig um einen Mittelwert herum variieren
... oder Ergebnis einer Menge von einzelnen Vorgängen sind
zentraler Grenzwertsatz
Verwendung in statistischen Schätzverfahren
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 67
Wichtige Verteilungen
 Normalverteilung
x -m 2
1
- 21 ( s )
⋅e
f(x) =
s 2p

Dichtefunktion

Verteilungsfunktion: nicht geschlossen darstellbar
Normalverteilung ist definiert durch




Mittelwert 
Varianz 2
Bezeichnung N(, 2)
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 68
Wichtige Verteilungen
 Normalverteilung

Beispiel:  = 2, 2 = 1
0.4
f(x)
0.3

0.2
0.1
2
3
0
-1
SSE Zimmermann
0
1
Systementwurf
2
3
4
5
x
Stochastische Grundlagen - 69
Wichtige Verteilungen
 Normalverteilung

Mit welcher Wahrscheinlichkeit liegt eine Zufallsgröße X
innerhalb eines Vielfachen der Standardabweichung  ?
P(m - s < X £ m + s) = 0.683
P(m - 2s < X £ m + 2s) = 0.955
P(m - 3s < X £ m + 3s) = 0.997

Das Integral für F(x) ist nicht geschlossen lösbar


Benutzung von Tabellen einer standardisierten Version
Standardisierte Normalverteilung


Zufallsvariable Z ist normalverteilt mit Mittelwert  = 0 und
Standardabweichung  = 1
Werte von FZ (x) sind tabelliert, Umrechnung:
FX (x) = FZ ( x -m
s )
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 70
Wichtige Verteilungen
 Weibull-Verteilung

E. Weibull, 1887-1979
Beschreibung von Lebensdauern (MTTF)
Parametereinstellung geeignet für alle Phasen der
„Badewannen-Kurve“ von Ausfällen
b-1 -atb
Dichtefunktion f(t) = abt e

Verteilungsfunktion F(t) = 1 - e-at

Sonderfall: Exponentialfunktion für  =1

Bezeichnung: Weibull(, )



b

Parameter: Form , Skalierung 
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 71
Wichtige Verteilungen
 Weibull-Verteilung

Dichte
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 72
 Wahrscheinlichkeit
 Zufallsvariablen
 Verteilung von Zufallsvariablen
 Momente
 Quantile
 Einige wichtige Verteilungen
 Bestimmen von Verteilungen
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 73
Bestimmen von Verteilungen
 Wichtige Festlegung bei der Modellerstellung


Systemteile (Servicedauer, Lagerzeit, …)
Lastmodell (Ankunftsrate, Paketlänge, …)
 Nötige Informationen


Art der Verteilung
Parameter (Lage und Form)
 Woher?




Messen von Teilsystemen
Übernehmen bekannten Verhaltens
Sinnvolle Annahmen
Auch hier: Abwägung Genauigkeit – Aufwand!
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 74
Bestimmen von Verteilungen
 Schritte

Überblick über charakteristische Werte


Histogramm


„summary statistics“
Z.B. Balkendiagramm
Art der Verteilung vermuten

Listen und Bilder, Erfahrungen was wo passt

Parameter aus Messwerten berechnen

Alternativ: Spezialsoftware einsetzen

SPSS, http://www.freestatistics.info/ …
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 75
Bestimmen von Verteilungen
 Typische Anwendung von Verteilungen






Fest getaktet, feste Paketlänge etc. – Deterministisch
Verteilung mit Maximum und Minimum – Gleichverteilung
Ebenso mit höherer Wahrscheinlichkeit dazwischen
– Dreiecksverteilung
Max, Min mit anpassbarem Mittelwert und Varianz – Beta
Natürliche Vorgänge mit Schwankung um einen
Mittelwert – Normalverteilung
Vorgänge mit gedächtnislosem Verhalten – Exponentialoder geometrische Verteilung


Oft ausgelöst durch eine Population unabhängiger Akteure
mit Poisson-Ankunftsprozess
Analytisch einfach zu handhaben
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 76
Bestimmen von Verteilungen
 Typische Anwendung von Verteilungen

Zuverlässigkeitsuntersuchungen, Lebensdauer


Zeit bis zum Abschluss einer Aktion





Gamma, Weibull, Lognormal, Pearson, Log-logistic
Große Werte, großer Variationskoeffizient


Weibull, Pareto, Exponential
heavy-tailed distribution? Pareto
Spitze bei kleinen Werten: lognormal
Positive Werte, Varianz nahe Eins: Exponentialverteilung
Positive Werte, Varianz > 1: Weibull oder Gamma (<1)
… siehe auch Kapitel Stochastische Grundlagen
gute Übersicht: Buch von Law/Kelton (Handout)
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 77
Bestimmen von Verteilungen
 Eingangsdaten: Messen


Erheben von Einzelwerten
Statistisch aussagekräftig:
gesamten modellierten Vorgang abdecken


Oft Instrumentierung des gemessenen Objekts nötig



Sonst Verfälschung!
Einfluss auf Messwerte beachten
Realistische Umgebung herstellen
Ausreichende Anzahl

Genauigkeit: Simulations-Kapitel
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 78
Bestimmen von Verteilungen
 Charakterisierung der Messwerte




Daten x1, x2, , x n
Anzahl n
Achtung: Aus Messwerten gewonnene Informationen sind
keine genauen Daten für die Ursprungsverteilung!
Minimal- und Maximalwert min(x i ) max(x i )
n

Mittelwert (sample mean)

Median
SSE Zimmermann
1
mˆ = å x i
n i=1
Systementwurf
Stochastische Grundlagen - 79
Bestimmen von Verteilungen
 Charakterisierung der Messwerte
n


1
2
Varianz (sample variation) S2 (n) =
ˆ
(x
)
m
i
n -1å
i =1
Variationskoeffizient
(coefficient of variation)
CoV =
S2 (n)
mˆ
n
nˆ(n) =

Schiefe (skewness)

Größte Werte (mode)
SSE Zimmermann
Systementwurf
3
ˆ
m
(x
)
n
å i
i =1
3
[ S (n) ] 2
2
Stochastische Grundlagen - 80
Bestimmen von Verteilungen
 Histogramm

Anzahl der k Kategorien auswählen für n Messwerte
 Sturge‘s Rule: k = ê 1 + log n ú
ë
2 û



Probieren für „gutes“ Aussehen der Kurve
Messwerte in Kategorien einteilen und zählen
Anzahl jeweils auf y-Achse abtragen
 Art der Verteilung ableiten


Mit Bildern vergleichen
Anhand grundsätzlicher Erwägungen ausschließen


Positive Werte, symmetrisch, …
Gewichtete Summen von bekannten Verteilungen
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 81
Bestimmen von Verteilungen
k = êë 1 + log2 n úû
Histogramm-Beispiel
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 82
Bestimmen von Verteilungen
 Parameter schätzen

Arten von Parametern





Location (shift), z.B. Mittelwert der Normalverteilung
Scale, z.B. Standardabweichung für Normalverteilung
Shape, z.B. Beta-Verteilung, skewness
Mittelwert und Varianz siehe Charakterisierung
Maximum-Likelihood-Schätzer (MLE) für individuelle
Verteilungen siehe Literatur (Handout Law/Kelton)
 Auswahl und Parameterbestimmung



„Kurven-Fitting“
Numerische Maße für die Qualität der Anpassung
Statistische Testmethoden für Annahme oder Ablehnung
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 83
Bestimmen von Verteilungen
 Überprüfen der Qualität der Funktion

Gemeinsame grafische Darstellung von geschätzter
Dichtefunktion und Histogramm der Messwerte



Grafische Darstellung der Differenz der
Verteilungsfunktionen


Entsprechend für diskrete Verteilung: Häufigkeitsverteilung
Genaue Übereinstimmung: perfekte Anpassung
Horizontale Linie: Perfekt
Mathematische Verfahren


Chi-Quadrat-Test
Kolmogorow-Smirnow-Test
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 84
Bestimmen von Verteilungen
Quelle: Willig
SSE Zimmermann
Systementwurf
Stochastische Grundlagen - 85
Herunterladen