SYSTEMENTWURF Stochastische Grundlagen Vorlesung im WS 2012/13 System- und Software-Engineering Prof. Dr.-Ing. Armin Zimmermann Inhalt Wahrscheinlichkeit Zufallsvariablen Verteilung von Zufallsvariablen Momente Quantile Einige wichtige Verteilungen Bestimmen von Verteilungen SSE Zimmermann Systementwurf Stochastische Grundlagen - 2 Wahrscheinlichkeit Wahrscheinlichkeit Viele Vorgänge sind nicht exakt vorhersagbar, z. B. Ausfall eines Rechners Stochastik: mathematische Modelle für quantitative Aussagen Begriffe Zufallsexperiment (random experiment) Elementarereignis (elementary event) Jeder einzelne mögliche Versuchsausgang Ereignisraum (sample space) Experiment mit mehreren möglichen Versuchsausgängen Menge S aller möglichen Elementarereignisse Ereignis (event) Menge E von Elementarereignissen, E Í S SSE Zimmermann Systementwurf Stochastische Grundlagen - 3 Wahrscheinlichkeit Beispiel: redundantes Rechnersystem System aus zwei (ausfallenden) Komponenten A und B System intakt, falls mindestens eine Komponente intakt Zufallsexperiment Beobachtung des Systems nach 1000 Betriebsstunden Mögliche Elementarereignisse: e1 = A und B intakt e2 = A intakt, B defekt e3 = A defekt, B intakt e4 = A und B defekt Ereignisraum: S = {e1,e2,e3,e4 } Ereignisse: Gesamtsystem intakt : E1 = {e1,e2,e3} Gesamtsystem defekt: E2 = {e4 } SSE Zimmermann Systementwurf Stochastische Grundlagen - 4 Wahrscheinlichkeit Beispiel: Lebensdauer einer Festplatte Anfangs intakt, Ausfall möglich Zufallsexperiment Zeitpunkt des Ausfalls Ereignisraum: S = [0, ¥) Ereignis: Lebensdauer 1000h: E = [1000, ¥) Fragestellung in beiden Beispielen: wie wahrscheinlich sind Ereignisse? Formalisierung des Wahrscheinlichkeitsbegriffes Die Wahrscheinlichkeit (probability) P(E) ist eine Maßfunktion, die jedem Ereignis E Í S eine reelle Zahl aus dem Intervall [0,1] zuordnet SSE Zimmermann Systementwurf Stochastische Grundlagen - 5 Wahrscheinlichkeit Definitionen und Rechenregeln (Fast) unmögliches Ereignis P(Æ) = 0 (Fast) sicheres Ereignis P(S) = 1 Komplementäres Ereignis P(E) = P(S \ E) = 1 - P(E) Durchschnitt E1 Ç E2 ist Ereignis, wenn E1 und E2 eintreten Vereinigung E1 È E2 ist ein Ereignis, wenn E1 oder E2 (oder beide) eintreten Disjunkte Ereignisse P(E1 È E2 ) = P(E1 ) + P(E2 ) Veranschaulichung durch S Venn-Diagramm E1 SSE Zimmermann Systementwurf E1 E2 E2 Stochastische Grundlagen - 6 Wahrscheinlichkeit Bedingte Wahrscheinlichkeit (conditional probability) Wahrscheinlichkeit von E1 unter der Voraussetzung, dass P(E1 Ç E2 ) P(E | E ) = E2 eingetreten ist: 1 2 P(E2 ) Unabhängigkeit (independence) E1 und E2 heißen unabhängig, falls P(E1 | E2 ) = P(E1 ) Äquivalent zu P(E1 Ç E2 ) = P(E1 ) ⋅ P(E2 ) Beispiel: Zweikomponenten-System Wahrscheinlichkeit, dass eine Komponente intakt = 0.9 Falls Ausfälle beider Komponenten unabhängig, gilt: P(A und B intakt) = P(A intakt) P(B intakt) = 0.92 = 0.81 SSE Zimmermann Systementwurf Stochastische Grundlagen - 7 Wahrscheinlichkeit Zufallsvariablen Verteilung von Zufallsvariablen Momente Quantile Einige wichtige Verteilungen Bestimmen von Verteilungen SSE Zimmermann Systementwurf Stochastische Grundlagen - 8 Zufallsvariablen Zufallsvariablen Abstraktion: Zuordnung eines numerischen Wertes zu jedem Elementarereignis Zufallsvariable (random variable) X ist Abbildung S Jedem Elementarereignis e S wird eine reelle Zahl X(e) zugeordnet Begriff Der Funktionswert ist vor Durchführung eines Experiments unbekannt, danach aber ein fester Wert Mögliche Fälle: diskrete Zufallsvariable Wertebereich der Zufallsvariablen ist endlich oder abzählbar: X (S ) kontinuierliche (oder stetige) Zufallsvariable Wertebereich der Zufallsvariablen ist überabzählbar groß: X (S ) SSE Zimmermann Systementwurf Stochastische Grundlagen - 9 Zufallsvariablen Beispiel: Zweikomponenten-System X(A und B intakt) = 2 X(A intakt, B defekt) = 1 X(A defekt, B intakt) = 1 X(A und B defekt) = 0 X(S) = {0,1, 2} (Zufallsvariable ist diskret) A und B defekt 0 A defekt B intakt A intakt B defekt 1 A und B intakt 2 S Zahlengerade Beispiel: Lebensdauer Festplatte X(Lebensdauer y in Stunden) = y X(S) = [0, ¥) (Zufallsvariable ist kontinuierlich) SSE Zimmermann Systementwurf Stochastische Grundlagen - 10 Wahrscheinlichkeit Zufallsvariablen Verteilung von Zufallsvariablen Momente Quantile Einige wichtige Verteilungen Bestimmen von Verteilungen SSE Zimmermann Systementwurf Stochastische Grundlagen - 11 Verteilung von Zufallsvariablen Verteilung: Beschreibung, mit welcher Wahrscheinlichkeit eine Zufallsvariable bestimmte Werte annimmt Verteilung einer diskreten Zufallsvariablen Wahrscheinlichkeit jedes einzelnen Werts pn = P(X = x n ) pn heißt diskrete Wahrscheinlichkeitsdichte (probability mass function, pmf oder discrete density fct.) Grafische Repräsentation durch Balkendiagramm Wahrscheinlichkeit, dass Zufallsvariable X einen Wert annimmt, der ein vorgegebenes x nicht übersteigt: F(x) = P(X £ x) = å pn xn £x F(x) heißt Wahrscheinlichkeits-Verteilungsfunktion ([cumulative] distribution function, CDF) SSE Zimmermann Systementwurf Stochastische Grundlagen - 12 Verteilung von Zufallsvariablen Wahrscheinlichkeits-Verteilungsfunktion F(x) F(x) ist eine Treppenfunktion mit Sprungstellen Sprunghöhe pn an der Stelle x n Wertebereich von X endlich bzw. unendlich endlich bzw. unendlich viele Sprungstellen Eigenschaften von Verteilungsfunktionen 0 £ F(x) £ 1 F(x) ist monoton steigend (aber nicht streng) lim F(x) = 0 x -¥ lim F(x) = 1 x ¥ SSE Zimmermann Systementwurf Stochastische Grundlagen - 13 Verteilung von Zufallsvariablen Beispiel: Zweikomponenten-System X gibt Anzahl der intakten Komponenten an Annahmen: P(X = 0) = p0 = 0.1 P(X = 1) = p1 = 0.6 P(X = 2) = p2 = 0.3 pn F(x) 0.6 0.3 1.0 0.7 0.1 0.1 0 1 SSE Zimmermann 2 x Systementwurf 0 1 2 x Stochastische Grundlagen - 14 Verteilung von Zufallsvariablen Verteilung einer stetigen Zufallsvariablen Wie im diskreten Fall kann die WahrscheinlichkeitsVerteilungsfunktion F(x) definiert werden als F(x) = P(X £ x) In Analogie zum diskreten Fall wird eine stetige Wahrscheinlichkeitsdichte f(x) (probability density function, pdf) definiert mit der Eigenschaft x F(x) = ò f(y)dy -¥ f(x) ist somit gegeben durch f(x) = (falls die Ableitung existiert) SSE Zimmermann Systementwurf d dx F(x) Stochastische Grundlagen - 15 Verteilung von Zufallsvariablen Beispiel: Gleichverteilung (uniform distribution) Alle Werte in [a, b] gleich wahrscheinlich ìï 0 x<a ï 1 ì b -a a £ x < b ï ï ï -a a £ x < b f(x) = í , F(x) = ï í bx a ï ï 0 sonst ï ï î ïï1 x³b î F(x) f(x) 1.0 1 b-a a SSE Zimmermann b x Systementwurf a b x Stochastische Grundlagen - 16 Verteilung von Zufallsvariablen Eigenschaften Für diskrete V. genannte Eigenschaften gelten unverändert Eine Fläche unter f(x) im Intervall [c, d] ist ein Maß für die Wahrscheinlichkeit, dass X Werte in diesem Intervall annimmt: P(c < X £ d) = P(X £ d) -dP(X £ c) = F(d) - F(c) = ò f(x)dx c F(x) f(x) 1.0 1 b-a a SSE Zimmermann c db x Systementwurf a c d b x Stochastische Grundlagen - 17 Verteilung von Zufallsvariablen Eigenschaften ¥ ò f(x)dx = 1 (sicheres Ereignis) -¥ Die Wahrscheinlichkeit für ein einzelnes Elementarereignis ist Null P(X = c) = F(c) - F(c) = 0 Nur Flächen unter f(x) sind Wahrscheinlichkeiten, Funktionswerte von f(x) nicht Der Verlauf von f(x) veranschaulicht, wie sich die Wahrscheinlichkeit auf die Wertebereiche der Zufallsvariablen verteilt SSE Zimmermann Systementwurf Stochastische Grundlagen - 18 Verteilung von Zufallsvariablen Gemischte Zufallsvariablen Diskrete Zufallsvariable F(x) hat Sprünge Stetige Zufallsvariable F(x) steigt stetig Weitere Möglichkeit F(x) hat stetige Anteile und Sprungstellen X heißt dann gemischte Zufallsvariable F(x) heißt gemischte Verteilungsfunktion F(x) 1.0 x SSE Zimmermann Systementwurf Stochastische Grundlagen - 19 Verteilung von Zufallsvariablen Gemischte Zufallsvariablen Frage: welche Gestalt hat dann die Dichtefunktion? Zwei Möglichkeiten Aufspaltung in diskreten und stetigen Anteil Verallgemeinerte Funktionen (Dirac-Impuls) Dirac-Impuls erlaubt die einheitliche Behandlung diskreter, stetiger und gemischter Zufallsvariablen SSE Zimmermann Systementwurf Stochastische Grundlagen - 20 Verteilung von Zufallsvariablen Dirac-Impuls Definition des Einheitsimpulses: Rechtecke mit Fläche 1, Breite , Höhe 1/ Grenzübergang e 0 liefert Dirac-Impuls d(x) (x) 0 1/ - /2 SSE Zimmermann 0 +/2 x Systementwurf 0 x Stochastische Grundlagen - 21 Verteilung von Zufallsvariablen Dirac-Impuls Dirac-Impuls an Stelle a : d(x - a) ¥ Ausblendeigenschaft: ò g(x) d(x - a)dx = g(a) -¥ (falls g(x) differenzierbar) Sprungfunktion Integral über Dirac-Impuls für Verteilungsfunktionen 0 x£0 ì ï ï Definition: s(x) = í 1 x>0 ï ï î Beziehungen: d(x - a) = ds(x - a) dx s(x - a) = SSE Zimmermann x ò-¥ d(t - a) ⋅ dt Systementwurf Stochastische Grundlagen - 22 Verteilung von Zufallsvariablen Beispiel: deterministische „Verteilung“ Taktzeit in einem Rechnersystem sei fest und gleich Fasst man die Zeit als Zufallsvariable X auf, nimmt X immer den Wert an X ist diskret „verteilt“ mit der Dichte P(X = t) = 1 Dichtefunktion: Einheitsimpuls an Stelle f(x) = d(x - t) Verteilungsfunktion: Einheitssprung an Stelle x F(x) = ò -¥ x f(y)dy = ò d(y - t)dy = s(x - t) -¥ F(x) f(x) 1 SSE Zimmermann x Systementwurf x Stochastische Grundlagen - 23 Verteilung von Zufallsvariablen Beispiel: gemischte Verteilung Eine Zufallsvariable sei gleichverteilt zwischen [1, 2] mit dem Wert 0.5 Der einzelne Wert 2 wird mit Wahrscheinlichkeit 0.5 eingenommen Anwendung: die Bearbeitungszeit für einen Auftrag ist gleichverteilt, aber begrenzt durch eine Zeitschranke Dichte- und Verteilungsfunktion: ìï 0 x <1 ïï f(x) = ïí 0.5 1£x <2 ïï ïï 0.5d(x - 2) x ³ 2 ïî SSE Zimmermann ìï 0 x <1 ïï F(x) = ïí 0.5 ⋅ (x - 1) 1 £ x < 2 ïï ïï1 x³2 î Systementwurf Stochastische Grundlagen - 24 Verteilung von Zufallsvariablen Beispiel: gemischte Verteilung Grafisch: f(x) F(x) 1 0.5 0.5 1 2 x 1 2 x Alternative Darstellung: f(x) = 0.5 ⋅ s(x - 1) + 0.5 ⋅ d(x - 2) - 0.5 ⋅ s(x - 2) F(x) = 0.5 ⋅ s(x - 1) ⋅ (x - 1) + 0.5 ⋅ s(x - 2) -0.5 ⋅ s(x - 2) ⋅ (x - 2) SSE Zimmermann Systementwurf Stochastische Grundlagen - 25 Wahrscheinlichkeit Zufallsvariablen Verteilung von Zufallsvariablen Momente Quantile Einige wichtige Verteilungen Bestimmen von Verteilungen SSE Zimmermann Systementwurf Stochastische Grundlagen - 26 Momente und Quantile Momente und Quantile Verteilungs- oder Dichtefunktion charakterisieren Zufallsvariable vollständig Oft zu aufwendig bzw. nicht vollständig bekannt! Gesucht: einfachere Kenngrößen, die eine Zufallsvariable hinreichend genau beschreiben Beispiel: „Die mittlere Verzögerungszeit beträgt 30ms“ Beispiel: „95% aller Anfragen werden innerhalb von 24 Stunden beantwortet“ Momente und Quantile von Verteilungsfunktionen Die wichtigsten: Mittelwert und Streuung Kenngrößen sind aus der Verteilungsfunktion berechenbar oder z.B. bei unbekannter Funktionsform geschätzt SSE Zimmermann Systementwurf Stochastische Grundlagen - 27 Momente Wichtigstes Moment: Erwartungswert f(x) sei Dichtefunktion der Zufallsvariablen X E [ X ] heißt Erwartungswert (expectation) oder Mittelwert (mean value) von X ¥ Berechnung: E[ X ] = ò x ⋅ f(x)dx -¥ Das Integral muss nicht existieren, in diesem Fall gibt es keinen Erwartungswert Vereinfachte Schreibweise für diskrete Zufallsvariablen: E[ X ] = å x n ⋅ pn n SSE Zimmermann Systementwurf Stochastische Grundlagen - 28 Momente Beispiele für die Berechnung des Erwartungswertes Beispiel diskreter Fall: Zweikomponenten-System Wahrscheinlichkeiten der einzelnen Ereignisse: Erwartungswert: mittlere Anzahl intakter Komponenten E [ X ] = 0 ⋅ 0.1 + 1 ⋅ 0.6 + 2 ⋅ 0.3 = 1.2 p0 = 0.1, p1 = 0.6, p2 = 0.3 Beispiel kontinuierlicher Fall: Lebensdauer Batterie Gleichverteilung im Intervall [a, b] Erwartungswert: mittlere Lebensdauer b E[ X ] = ò a b x x2 b2 - a 2 a+b dx = = = b-a 2(b - a) a 2(b - a) 2 Auch geometrisch aus Funktion ableitbar SSE Zimmermann Systementwurf Stochastische Grundlagen - 29 Momente Funktion einer Zufallsvariablen Funktion g definiert neue Zufallsvariable Y = g(X) ¥ dann gilt E[Y] = E[g(X)] = ò g(x)f(x) dx -¥ Der Erwartungswert-Operator ist linear: Seien X, Y Zufallsvariablen und , Skalare, dann gilt E[aX + bY] = aE[X] + bE[Y] Beispiel Lebensdauer X einer Batterie ist gleichverteilt in [100, 200] Erwartungswert: (100+200)/2 = 150 Wie groß ist mittlere Lebensdauer einer Batterie mit dreifachen Parametern [300, 600] (Zufallsvariable Y)? E[Y] = E[3X] = 3E[X] = 450 SSE Zimmermann Systementwurf Stochastische Grundlagen - 30 Momente Weiteres wichtiges Moment: Varianz Die Varianz von X, Var[X] ist die mittlere quadratische Abweichung der Werte der Zufallsvariablen von ihrem Erwartungswert: Var[X] = E[(X - E[X])2 ] Erwartungswert der Abweichung muss nicht existieren, in diesem Fall ist die Varianz nicht definiert Beispiel: „heavy-tailed” distributions Einsetzen liefert ¥ Var[X] = ò (x - E[X])2 f(x) dx -¥ Vereinfachte Schreibweise im diskreten Fall: Var[X] = å (x n - E[X])2 pn n SSE Zimmermann Systementwurf Stochastische Grundlagen - 31 Momente Beispiele für die Berechnung der Varianz Beispiel diskreter Fall: Zweikomponenten-System Wahrscheinlichkeiten der einzelnen Ereignisse: Varianz: mittlere quadratische Abweichung vom Mittelwert p0 = 0.1, p1 = 0.6, p2 = 0.3 Var [ X ] = (0 - 1.2)2 ⋅ 0.1 + (1 - 1.2)2 ⋅ 0.6 + (2 - 1.2)2 = 0.36 Beispiel kontinuierlicher Fall: Lebensdauer Batterie a+b Gleichverteilung im Intervall [a, b], E [ X ] = 2 Varianz: Var[x] = b ò a SSE Zimmermann 2 (b a) (x - a +2 b )2 b-1 a dx = = 12 Systementwurf Stochastische Grundlagen - 32 Momente Alternativen zur Varianz Es existieren weitere gebräuchliche Maße für die Abweichung vom Mittelwert Standardabweichung (standard deviation) s Quadratische Berechnung vom Mittelwert bei Varianz: positive und negative Abweichungen dürfen sich nicht aufheben Maße im Bereich der Werte: Wurzel aus Varianz Berechnung: s = Var[X] Variationskoeffizient (coefficient of variation) C Varianz und Standardabweichung messen Abweichungen abhängig von Größenordnung der Werte Relative, unabhängig von Werten normierte Größe s Berechnung: C = E[X] SSE Zimmermann Systementwurf Stochastische Grundlagen - 33 Momente Allgemeiner Begriff des Moments Definition des Erwartungswertes: E [ X ] = ¥ Verallgemeinerung E[X n ] = heißt n-tes Moment ò ¥ ò x ⋅ f(x)dx -¥ x n f(x) dx -¥ Erwartungswert: Erstes Moment Unter bestimmten Voraussetzungen ist eine Verteilung durch ihre (unendlich vielen) Momente eindeutig bestimmt Varianz ist aus dem 1. und 2. Moment berechenbar: Var[X] = E[(X - E[X])2 ] = E[X2 - 2XE[X] + E[X]2 ] = E[X2 ] - 2E[X]2 + E[X]2 = E[X2 ] - E[X]2 Varianz wird daher 2. zentriertes Moment genannt SSE Zimmermann Systementwurf Stochastische Grundlagen - 34 Wahrscheinlichkeit Zufallsvariablen Verteilung von Zufallsvariablen Momente Quantile Einige wichtige Verteilungen Bestimmen von Verteilungen SSE Zimmermann Systementwurf Stochastische Grundlagen - 35 Quantile Beschreibung von Zufallsvariablen mit Quantilen Vorgegeben ist die Wahrscheinlichkeit Das -Quantil einer Zufallsvariablen X ist der Wert xa , für den gilt: P(X £ xa ) = F(xa ) = a Anschaulich: a ⋅ 100% der möglichen Werte von X sind kleiner gleich xa Median Wert der Zufallsvariablen, bei dem jeweils die Hälfte der Wahrscheinlichkeitsmasse darüber bzw. darunter liegt Median = 0.5-Quantil Nur manchmal (z.B. symmetrische V.) mit Mittelwert identisch! SSE Zimmermann Systementwurf Stochastische Grundlagen - 36 Quantile Beispiel für ein Quantil Bearbeitungszeit für einen Auftrag sei gemäß F(x) verteilt Wie groß ist die Zeit x 0.95 , in der 95% aller Aufträge bearbeitet sind? f(x) Fläche = 0.05 Fläche = 0.95 x0.95 SSE Zimmermann Systementwurf x Stochastische Grundlagen - 37 Wahrscheinlichkeit Zufallsvariablen Verteilung von Zufallsvariablen Momente, Quantile Einige wichtige Verteilungen Diskrete Verteilungen Kontinuierliche Verteilungen Bestimmen von Verteilungen SSE Zimmermann Systementwurf Stochastische Grundlagen - 38 Wichtige Verteilungen Diskrete Verteilungen Gleichverteilung Bernoulli-Verteilung, Geometrische Verteilung, Binomialverteilung, Poisson-Verteilung Kontinuierliche Verteilungen Gleichverteilung Exponentialverteilung, Erlang-, Gamma-, Hypo- / Hyperexponential-Verteilung Normalverteilung, Weibull-Verteilung Bedeutung Messung: Verteilung erkennen bzw. approximieren Modellierung: Entscheidung für Funktionsform SSE Zimmermann Systementwurf Stochastische Grundlagen - 39 Wichtige Verteilungen Diskrete Gleichverteilung discrete uniform, DU(i, j) Zufälliger Versuchsausgang mit gleich wahrscheinlichen Ereignissen Ereignisraum S = {i, i + 1, , j} i+j Mittelwert E(X) = 2 (j - i + 1)2 - 1 Varianz Var(X) = 12 Beispiel: Würfel = DU(1,6) SSE Zimmermann Systementwurf Stochastische Grundlagen - 40 Wichtige Verteilungen Diskrete Gleichverteilung Sei q = 1 j- i +1 F(X) 1 P(X) q q i-1 i i+1 j-1 j j+1 X Dichtefunktion SSE Zimmermann i i+1 j X Verteilungsfunktion Systementwurf Stochastische Grundlagen - 41 Wichtige Verteilungen Bernoulli-Verteilung Jakob Bernoulli, 1655-1705 Zufallsversuch mit zwei möglichen Ausgängen „Bernoulli trial“, Ereignisraum S = {0,1} Bezeichnung als „Erfolg“ und „Misserfolg“ Wahrscheinlichkeiten: P[Erfolg] = p, P[Misserfolg] = q, p+q=1 Bernoulli-Verteilung mit Parameter p: Wahrscheinlichkeitsverteilung P(X) einer Zufallsvariable X, die bei Erfolg den Wert 1 und bei Misserfolg den Wert 0 annimmt P(X = 1) = p, P(X = 0) = q oder P(X) = pX q1-X Erwartungswert E(X) = p , Varianz Var(X) = pq Grundlage für Binomial-Verteilung und Geometrische V. Bezeichnung: Bernoulli(p) SSE Zimmermann Systementwurf Stochastische Grundlagen - 42 Wichtige Verteilungen Bernoulli-Verteilung F(X) P(X) 1 q q p 0 1 X Dichtefunktion SSE Zimmermann 0 1 X Verteilungsfunktion Systementwurf Stochastische Grundlagen - 43 Wichtige Verteilungen Geometrische Verteilung Annahmen Vorgang ist mit einem Bernoulli-Versuch beschreibbar Mehrfache Ausführung (beliebig oft?) Jeder Einzelversuch ist unabhängig Fortführung bis zum ersten Erfolg Beispiele: Rechner defekt oder intakt, Betriebsmittel belegt oder frei, 6 gewürfelt oder nicht, … Ergebnis: unendliche Folge von Erfolg und Misserfolg Bezeichne 0 Misserfolg und 1 Erfolg Ereignisraum S = {0i-11 | i = 1, 2, } Bezeichnung: geom(p) SSE Zimmermann Systementwurf Stochastische Grundlagen - 44 Wichtige Verteilungen Geometrische Verteilung Eine wichtige Zufallsvariable ist die Nummer K des ersten erfolgreichen Versuchs Ein Erfolg beim k-ten Versuch setzt k – 1 Misserfolge voraus: p = P(K = k) = q k-1p = (1 - p)k-1 p k Versuche sind laut Voraussetzung unabhängig, daher Produkt für Und-Verknüpfung pk p Dichtefunktion: 0 SSE Zimmermann 1 Systementwurf 2 3 4 5 k Stochastische Grundlagen - 45 Wichtige Verteilungen Geometrische Verteilung Verteilungsfunktion k F(k) = P(K £ k) = å i=1 pi = 1 - (1 - p)k Wegen p, q < 1 konvergiert die Reihe: p ¥ F(¥) = å i=1 pq i = =1 1-q k = 1,2,¼ d.h. F(k) ist wirklich eine Verteilung Erwartungswert der geometrischen Verteilung 1 ¥ ¥ k -1 E[K] = å k =1 k ⋅ p = p ⋅ å k =1 k ⋅ (1 - p) = k p Je kleiner die Erfolgswahrscheinlichkeit p, desto länger muss man im Mittel auf den ersten Erfolg warten SSE Zimmermann Systementwurf Stochastische Grundlagen - 46 Wichtige Verteilungen Varianz Var[K] = 1-p p2 Gedächtnislosigkeit der geometrischen Verteilung Erfolg jedes Versuchs tritt mit p ein Für den Ausgang des aktuellen Versuchs ist daher die „Vorgeschichte“ egal Daher wird geometrische Verteilung als gedächtnislos (memoryless) bezeichnet Einzige diskrete Verteilung mit dieser Eigenschaft! SSE Zimmermann Systementwurf Stochastische Grundlagen - 47 Wichtige Verteilungen Anwendungsbeispiele der geometrischen Verteilung Beispiel Round-Robin Scheduling mit Zeitscheiben Ein Prozess erhält bei jeder Zuteilung eine Zeitscheibe Prozess terminiert mit der Wahrscheinlichkeit p innerhalb der Zeitscheibe und benötigt mit 1 – p mehr Rechenzeit Fortgesetzte Zuweisung von Zeitscheiben entspricht Folge von Misserfolgen Terminierung entspricht dem Erfolg Die benötigte Anzahl von Zeitscheiben und damit die benötigte Rechenzeit ist geometrisch mit p verteilt SSE Zimmermann Systementwurf Stochastische Grundlagen - 48 Wichtige Verteilungen Anwendungsbeispiele der geometrischen Verteilung Beispiel Kommunikationskanal Ein Kommunikationskanal kann Datenpakete zu festen Zeitpunkten i = 0, 1, … übertragen („getaktet“) Pakete haben feste Länge Übertragung eines Paketes dauert eine Zeiteinheit Zur Zeit i will eine Station ein Paket mit Wahrscheinlichkeit p senden, mit 1 – p ist kein Paket da Dauer der fortgesetzten Belegung ist geometrisch verteilt Dauer der Nichtbelegung des Kanals ist geometrisch verteilt SSE Zimmermann Systementwurf Stochastische Grundlagen - 49 Wichtige Verteilungen Binomialverteilung Wieder werden Bernoulli-Versuche durchgeführt Es interessiert die Zufallsvariable S, die die Anzahl der Erfolge innerhalb von n Versuchen beschreibt Sei s n eine Menge von Versuchen Wahrscheinlichkeit, dass genau diese s Versuche erfolgreich sind ps (1 - p)n -s Anzahl der Möglichkeiten, s aus n Versuchen unterschiedlich auszuwählen ænö n! çç ÷÷ = çè s ÷ø s ! (n - s)! (Binomialkoeffizient) Bezeichnung: bin(n, p) falls Grundversuch Bernoulli(p) SSE Zimmermann Systementwurf Stochastische Grundlagen - 50 Wichtige Verteilungen Binomialverteilung Dichtefunktion der Binomialverteilung Wahrscheinlichkeit, dass s Erfolge unter n Versuchen sind ænö s P(S = s) = çç s ÷÷ ⋅ p ⋅ (1 - p)n-s çè ÷ø Erwartungswert E[S] = np Varianz Var[S] = np(1 - p) Betrachtung der Zufallsvariablen S/n, d.h. der Häufigkeit, mit der Erfolge innerhalb von n Versuchen auftreten Erwartungswert für beliebiges n ist p Erfahrung zeigt, dass für großes n die Häufigkeit S/n die Wahrscheinlichkeit p gut annähert SSE Zimmermann Systementwurf Stochastische Grundlagen - 51 Wichtige Verteilungen Binomialverteilung s Dichtefunktionen für p=0.5 und verschiedene n SSE Zimmermann Systementwurf Stochastische Grundlagen - 52 Wichtige Verteilungen Anwendungsbeispiele der Binomialverteilung Beispiel Zeitscheiben Anzahl von Prozessen, die innerhalb von n Zeitscheiben terminieren, ist binomialverteilt Ihr Mittelwert ist n·p, der mittlere Systemdurchsatz ist p Prozesse pro Zeiteinheit (= Zeitscheibe) Beispiel Kommunikationskanal Anzahl übertragener Pakete in n Zeiteinheiten: binomialverteilt Mittlerer Kanaldurchsatz: p Pakete/Zeiteinheit Beispiel Qualitätssicherung Anzahl fehlerhafter Produkte bei einer Stichprobe aus einer Serie ist binomialverteilt Sind s von n entnommenen Produkten fehlerhaft, dann ist p = s/n eine Näherung der Fehlerwahrscheinlichkeit SSE Zimmermann Systementwurf Stochastische Grundlagen - 53 Wichtige Verteilungen Poisson-Verteilung Beispiel: betrachten Anzahl von Aufträgen, die in einem Datenbankserver innerhalb der Zeit t ankommen Annahmen Aufträge werden zufällig erzeugt Auftragserzeugung mit konstanter Rate pro Zeiteinheit Es kommen nie mehrere gleichzeitig an Falls t ausreichend klein gewählt, ist Wahrscheinlichkeit für das Eintreffen eines Auftrags in t = * t, und Wahrscheinlichkeit für mehr als einen Auftrag null Anzahl der Aufträge innerhalb t ist dann Poisson-verteilt Bezeichnung: Poisson() SSE Zimmermann Systementwurf Stochastische Grundlagen - 54 Wichtige Verteilungen Poisson-Verteilung Herleitung aus Binomial-Verteilung und Grenzwert für t gegen Null Dichtefunktion e-l l x P(X = x) = x! -l Verteilungsfunktion P(X £ x) = e Mittelwert E[X] = l Varianz Var[X] = l SSE Zimmermann Systementwurf ëxû li å i! i=0 (x Î ) (x ³ 0) Stochastische Grundlagen - 55 Wichtige Verteilungen Beispiel Poisson-Verteilung Ein Kaufhaus wird durchschnittlich alle 10s von einem Kunden betreten Werden die pro Minute eintretenden Personen gezählt, würde man im Mittel 6 Personen erwarten (=6) P6(n) gibt die Wahrscheinlichkeit dafür an, dass in der nächsten Minute genau n Kunden das Kaufhaus betreten Poisson(6) SSE Zimmermann Systementwurf Stochastische Grundlagen - 56 Wahrscheinlichkeit Zufallsvariablen Verteilung von Zufallsvariablen Momente, Quantile Einige wichtige Verteilungen Diskrete Verteilungen Kontinuierliche Verteilungen Bestimmen von Verteilungen SSE Zimmermann Systementwurf Stochastische Grundlagen - 57 Wichtige Verteilungen Gleichverteilung Uniform bzw. rectangular U(a, b) Zufälliger Versuchsausgang mit gleich wahrscheinlichen Ereignissen Ereignisraum S = [a, b] a, b Î a+b Mittelwert E(X) = 2 (b - a)2 Varianz Var(X) = 12 Beispiel: Zufallszahlengenerator im Rechner U[0,1] (näherungsweise) SSE Zimmermann Systementwurf Stochastische Grundlagen - 58 Wichtige Verteilungen Gleichverteilung Sei q = 1 b-a F(X) 1 P(X) q a b X Dichtefunktion SSE Zimmermann a b X Verteilungsfunktion Systementwurf Stochastische Grundlagen - 59 Wichtige Verteilungen Exponentialverteilung (exponential distribution) Wahrscheinlichkeitsdichte ìï le-lx x > 0 f(x) = ïí ïï 0 sonst î Eindeutig durch den Parameter (Rate) beschrieben Anwendungen der kontinuierlichen Exponentialverteilung Zwischenankunftszeit = Zeit zwischen zwei Aufträgen Lebenszeit eines Geräts = Zeit bis zum Ausfall Verteilungsfunktion ìï1 - e-lx F(x) = ïí ïï 0 î SSE Zimmermann x>0 Systementwurf sonst Stochastische Grundlagen - 60 Wichtige Verteilungen Exponentialverteilung Dichtefunktion 1 2 SSE Zimmermann 3 4 1 4 Systementwurf Stochastische Grundlagen - 61 Wichtige Verteilungen Exponentialverteilung Verteilungsfunktion 1 l= 0.8 3 4 l= 0.6 1 2 l= 1 4 0.4 0.2 0 0 SSE Zimmermann 2 4 Systementwurf 6 8 10 Stochastische Grundlagen - 62 Wichtige Verteilungen Exponentialverteilung Erwartungswert E[X] = ò0 x⋅l⋅e 1 dx = l Schaltrate: (pro Zeiteinheit des Modells) Mittlere Zeit bis zum Schalten: 1/ Varianz Var [ X ] = ¥ ò (x - l1 ) l1 ⋅ e-lx dx = = 0 -lx Transitionen im stochastischen Petri-Netz mit exponential verteilter Schaltzeit ¥ 1 l2 Gedächtnislosigkeit Häufig in der Leistungs- und Zuverlässigkeitsbewertung eingesetzt, da analytisch sehr einfach zu behandeln SSE Zimmermann Systementwurf Stochastische Grundlagen - 63 Wichtige Verteilungen Erlang-Verteilung A. K. Erlang, 1878-1929 Annahmen Vorgang aus r aufeinander folgenden Phasen Jeweilige Dauer ist exponentialverteilt Mit gleichem Parameter Dann ist Gesamtdauer Erlang-verteilt (r=1: Exponential-V.) l r tr-1e-lt Dichtefunktion f(t) = (r - 1)! r-1 (lt)k -lt Verteilungsfunktion F(t) = 1 - å e k=0 k ! Erlang: Spezialfall wenn r positiv ganzzahlig ist; sonst Gamma-Verteilung (nicht geschlossen darstellbar) SSE Zimmermann Systementwurf Stochastische Grundlagen - 64 Wichtige Verteilungen Erlang-Verteilung r l r Var(X) = 2 l Mittelwert E(X) = Varianz Beispiele für Dichtefunktionen SSE Zimmermann Systementwurf Stochastische Grundlagen - 65 Wichtige Verteilungen Hypoexponential-Verteilung Verallgemeinerung der Erlang-Verteilung, falls nicht alle Phasen den gleichen Parameter haben Hyperexponential-Verteilung k alternative Phasen statt aufeinander folgende Phasen k Dichtefunktion f(t) = -l i t a l e å i i i =1 Verteilungsfunktion F(t) = k -l i t a (1 e ) å i i =1 SSE Zimmermann Systementwurf Stochastische Grundlagen - 66 Wichtige Verteilungen Normalverteilung oder Gauß-Verteilung (normal or Gaussian distribution) C. F. Gauss, 1777-1855 Beschreibung vieler natürlicher Vorgänge Grund: die Verteilung der Summe unabhängiger, (identisch verteilter) Zufallsvariablen strebt gegen eine Normalverteilung ... die zufällig um einen Mittelwert herum variieren ... oder Ergebnis einer Menge von einzelnen Vorgängen sind zentraler Grenzwertsatz Verwendung in statistischen Schätzverfahren SSE Zimmermann Systementwurf Stochastische Grundlagen - 67 Wichtige Verteilungen Normalverteilung x -m 2 1 - 21 ( s ) ⋅e f(x) = s 2p Dichtefunktion Verteilungsfunktion: nicht geschlossen darstellbar Normalverteilung ist definiert durch Mittelwert Varianz 2 Bezeichnung N(, 2) SSE Zimmermann Systementwurf Stochastische Grundlagen - 68 Wichtige Verteilungen Normalverteilung Beispiel: = 2, 2 = 1 0.4 f(x) 0.3 0.2 0.1 2 3 0 -1 SSE Zimmermann 0 1 Systementwurf 2 3 4 5 x Stochastische Grundlagen - 69 Wichtige Verteilungen Normalverteilung Mit welcher Wahrscheinlichkeit liegt eine Zufallsgröße X innerhalb eines Vielfachen der Standardabweichung ? P(m - s < X £ m + s) = 0.683 P(m - 2s < X £ m + 2s) = 0.955 P(m - 3s < X £ m + 3s) = 0.997 Das Integral für F(x) ist nicht geschlossen lösbar Benutzung von Tabellen einer standardisierten Version Standardisierte Normalverteilung Zufallsvariable Z ist normalverteilt mit Mittelwert = 0 und Standardabweichung = 1 Werte von FZ (x) sind tabelliert, Umrechnung: FX (x) = FZ ( x -m s ) SSE Zimmermann Systementwurf Stochastische Grundlagen - 70 Wichtige Verteilungen Weibull-Verteilung E. Weibull, 1887-1979 Beschreibung von Lebensdauern (MTTF) Parametereinstellung geeignet für alle Phasen der „Badewannen-Kurve“ von Ausfällen b-1 -atb Dichtefunktion f(t) = abt e Verteilungsfunktion F(t) = 1 - e-at Sonderfall: Exponentialfunktion für =1 Bezeichnung: Weibull(, ) b Parameter: Form , Skalierung SSE Zimmermann Systementwurf Stochastische Grundlagen - 71 Wichtige Verteilungen Weibull-Verteilung Dichte SSE Zimmermann Systementwurf Stochastische Grundlagen - 72 Wahrscheinlichkeit Zufallsvariablen Verteilung von Zufallsvariablen Momente Quantile Einige wichtige Verteilungen Bestimmen von Verteilungen SSE Zimmermann Systementwurf Stochastische Grundlagen - 73 Bestimmen von Verteilungen Wichtige Festlegung bei der Modellerstellung Systemteile (Servicedauer, Lagerzeit, …) Lastmodell (Ankunftsrate, Paketlänge, …) Nötige Informationen Art der Verteilung Parameter (Lage und Form) Woher? Messen von Teilsystemen Übernehmen bekannten Verhaltens Sinnvolle Annahmen Auch hier: Abwägung Genauigkeit – Aufwand! SSE Zimmermann Systementwurf Stochastische Grundlagen - 74 Bestimmen von Verteilungen Schritte Überblick über charakteristische Werte Histogramm „summary statistics“ Z.B. Balkendiagramm Art der Verteilung vermuten Listen und Bilder, Erfahrungen was wo passt Parameter aus Messwerten berechnen Alternativ: Spezialsoftware einsetzen SPSS, http://www.freestatistics.info/ … SSE Zimmermann Systementwurf Stochastische Grundlagen - 75 Bestimmen von Verteilungen Typische Anwendung von Verteilungen Fest getaktet, feste Paketlänge etc. – Deterministisch Verteilung mit Maximum und Minimum – Gleichverteilung Ebenso mit höherer Wahrscheinlichkeit dazwischen – Dreiecksverteilung Max, Min mit anpassbarem Mittelwert und Varianz – Beta Natürliche Vorgänge mit Schwankung um einen Mittelwert – Normalverteilung Vorgänge mit gedächtnislosem Verhalten – Exponentialoder geometrische Verteilung Oft ausgelöst durch eine Population unabhängiger Akteure mit Poisson-Ankunftsprozess Analytisch einfach zu handhaben SSE Zimmermann Systementwurf Stochastische Grundlagen - 76 Bestimmen von Verteilungen Typische Anwendung von Verteilungen Zuverlässigkeitsuntersuchungen, Lebensdauer Zeit bis zum Abschluss einer Aktion Gamma, Weibull, Lognormal, Pearson, Log-logistic Große Werte, großer Variationskoeffizient Weibull, Pareto, Exponential heavy-tailed distribution? Pareto Spitze bei kleinen Werten: lognormal Positive Werte, Varianz nahe Eins: Exponentialverteilung Positive Werte, Varianz > 1: Weibull oder Gamma (<1) … siehe auch Kapitel Stochastische Grundlagen gute Übersicht: Buch von Law/Kelton (Handout) SSE Zimmermann Systementwurf Stochastische Grundlagen - 77 Bestimmen von Verteilungen Eingangsdaten: Messen Erheben von Einzelwerten Statistisch aussagekräftig: gesamten modellierten Vorgang abdecken Oft Instrumentierung des gemessenen Objekts nötig Sonst Verfälschung! Einfluss auf Messwerte beachten Realistische Umgebung herstellen Ausreichende Anzahl Genauigkeit: Simulations-Kapitel SSE Zimmermann Systementwurf Stochastische Grundlagen - 78 Bestimmen von Verteilungen Charakterisierung der Messwerte Daten x1, x2, , x n Anzahl n Achtung: Aus Messwerten gewonnene Informationen sind keine genauen Daten für die Ursprungsverteilung! Minimal- und Maximalwert min(x i ) max(x i ) n Mittelwert (sample mean) Median SSE Zimmermann 1 mˆ = å x i n i=1 Systementwurf Stochastische Grundlagen - 79 Bestimmen von Verteilungen Charakterisierung der Messwerte n 1 2 Varianz (sample variation) S2 (n) = ˆ (x ) m i n -1å i =1 Variationskoeffizient (coefficient of variation) CoV = S2 (n) mˆ n nˆ(n) = Schiefe (skewness) Größte Werte (mode) SSE Zimmermann Systementwurf 3 ˆ m (x ) n å i i =1 3 [ S (n) ] 2 2 Stochastische Grundlagen - 80 Bestimmen von Verteilungen Histogramm Anzahl der k Kategorien auswählen für n Messwerte Sturge‘s Rule: k = ê 1 + log n ú ë 2 û Probieren für „gutes“ Aussehen der Kurve Messwerte in Kategorien einteilen und zählen Anzahl jeweils auf y-Achse abtragen Art der Verteilung ableiten Mit Bildern vergleichen Anhand grundsätzlicher Erwägungen ausschließen Positive Werte, symmetrisch, … Gewichtete Summen von bekannten Verteilungen SSE Zimmermann Systementwurf Stochastische Grundlagen - 81 Bestimmen von Verteilungen k = êë 1 + log2 n úû Histogramm-Beispiel SSE Zimmermann Systementwurf Stochastische Grundlagen - 82 Bestimmen von Verteilungen Parameter schätzen Arten von Parametern Location (shift), z.B. Mittelwert der Normalverteilung Scale, z.B. Standardabweichung für Normalverteilung Shape, z.B. Beta-Verteilung, skewness Mittelwert und Varianz siehe Charakterisierung Maximum-Likelihood-Schätzer (MLE) für individuelle Verteilungen siehe Literatur (Handout Law/Kelton) Auswahl und Parameterbestimmung „Kurven-Fitting“ Numerische Maße für die Qualität der Anpassung Statistische Testmethoden für Annahme oder Ablehnung SSE Zimmermann Systementwurf Stochastische Grundlagen - 83 Bestimmen von Verteilungen Überprüfen der Qualität der Funktion Gemeinsame grafische Darstellung von geschätzter Dichtefunktion und Histogramm der Messwerte Grafische Darstellung der Differenz der Verteilungsfunktionen Entsprechend für diskrete Verteilung: Häufigkeitsverteilung Genaue Übereinstimmung: perfekte Anpassung Horizontale Linie: Perfekt Mathematische Verfahren Chi-Quadrat-Test Kolmogorow-Smirnow-Test SSE Zimmermann Systementwurf Stochastische Grundlagen - 84 Bestimmen von Verteilungen Quelle: Willig SSE Zimmermann Systementwurf Stochastische Grundlagen - 85