Statistik und Wahrscheinlichkeitsrechnung Statistik und Statistik und Wahrscheinlichkeitsrechnung Prof. Dr. Michael Havbro Faber 14.04.2010 1 Statistik und Wahrscheinlichkeitsrechnung Am nächsten Dienstag (20. April) g p findet keine Vorlesung statt! SStattdessen Übung: d Üb Start 8:00 Uhr, Raumaufteilung: Übung von Markus: Übung von Markus: Übung von Mathias: Üb Übung von Gerhard: G h d Übung von Katharina: 14.04.2010 HIL E 1 HIL E1 HIL E 6 HCI D 8 HCI D 8 HCI D 2 2 Statistik und Wahrscheinlichkeitsrechnung Der Enscheidungskontext! Wieso Unsicherheitenmodellierung? Unsichere Phänomene Daten Zufallsvariablen Zufallsprozesse Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Konsequenzen von Ereignissen Risiken 14.04.2010 Entscheidungsfindung 3 Statistik und Wahrscheinlichkeitsrechnung Inhalt der heutigen Vorlesung Zufallsprozesse Poissonprozess Exponentialverteilung, Gammaverteilung Exponentialverteilung Gammaverteilung Normalprozess Stationarität und Ergodizität und Ergodizität Kontinuierlicher Zufallsprozess Extreme von Zufallsprozessen p 14.04.2010 4 Statistik und Wahrscheinlichkeitsrechnung Zufallsvariablen und Zufallsprozesse Wir haben Zufallsvariablen eingeführt um zufällige bzw. unsichere Ereignisse Wi h b Z f ll i bl i füh t fälli b i h E i i abzubilden, z.B. Eigenschaften von Objekten, Autos welche abbiegen usw. Wenn wir Ereignisse über die Zeit betrachten sprechen wir von Zufallsprozessen. Mit Hilfe von Modellen für Zufallsprozesse können wir die Wahrscheinlichkeit von zufälligen Ereignissen in der Zukunft abschätzen. Beispiele: Erdbeben mit einer Wiederkehrperiode von 475 Jahren Erdbeben mit einer Wiederkehrperiode von 475 Jahren 100 jähriges Hochwasser Maximale Lasten während der Lebensdauer eines Bauwerks 14.04.2010 5 Statistik und Wahrscheinlichkeitsrechnung Zufallsvariablen und Zufallsprozesse Hochwasserereignis (diskret) Für viele Ingenieurfragen müssen wir die zufälligen l f d f ll Schwankungen über die Zeit spezifischer erfassen können: Diskreter Zufallsprozess: Das zufällige Eintreten von Ereignissen zu diskreten Zeitpunkten (Unfälle, Steinschlag, Erdbeben, Stau, Zeitpunkten (Unfälle, Steinschlag, Erdbeben, Stau, Versagen, usw.) Poissonprozess, Exponentialverteilung, Gammaverteilung Belastungsschwankungen aufgrund Wellen (kontinuierlich) Kontinuierlicher Zufallsprozess: Di Die zufälligen Ausprägungen von Ereignissen, welche fälli A ä E i i l h kontinuierlich über die Zeit eintreten (Winddruck, Wellendruck, Temperaturen, usw.) (Normalprozess) 14.04.2010 6 Statistik und Wahrscheinlichkeitsrechnung Zufallsvariablen und Zufallsprozesse W Was wir heute näher betrachten wollen: i h t äh b t ht ll Zufallssequenzen: Poissonprozess Wartezeit zwischen zwei Ereignissen: Exponentialverteilung, Gammaverteilung g Kontinuierliche Zufallsprozesse: Normalprozess Kriterien für das Extrapolieren von Extremen: Stationarität und Ergodizität 14.04.2010 7 Statistik und Wahrscheinlichkeitsrechnung Zufallssequenzen: Poissonprozess Der Poissonprozess ist eine der am häufigsten verwendeten Verteilungs‐ d h f d l familien von Wahrscheinlichkeitsverteilungen in der Zuverlässigkeitstheorie. Der Prozess N(t), welcher die Anzahl Ereignisse in einem (Zeit)Intervall (t t+t[ bezeichnet wird Poissonprozess genannt wenn folgende (t,t+t[ bezeichnet, wird Poissonprozess genannt wenn folgende Bedingungen erfüllt sind: Die Wahrscheinlichkeit eines Ereignisses im Intervall (t,t+t[ ist asymptotisch proportional zu t. 2) Die Wahrscheinlichkeit von mehr als einem Ereignis im Intervall (t,t+t[ ist Die Wahrscheinlichkeit von mehr als einem Ereignis im Intervall (t t+t[ ist eine Funktion höherer Ordnung von t für t→0. 3) Ereignisse in disjunkten (sich nicht überlappenden) Intervallen sind unabhängig. bhä i 1) 14.04.2010 8 Statistik und Wahrscheinlichkeitsrechnung Zufallssequenzen: Poissonprozess Der Poissonprozess kann durch seine Intensität beschrieben v t werden: 1 (t) lim P(ein Ereignis in t, t t) t 0 t v t wenn = konstant, dann ist es ein homogener Poissonprozess, , g p , ansonsten ist es ein inhomogener Poissonprozess. Die Wahrscheinlichkeit von n h h l hk Ereignissen im Zeitintervall (0,t[ ist: ll ( [ n ( ) d t 0 Pn t exp ( )d n! 0 t Für den inhomogenen Poissonprozess. 14.04.2010 Pn t tn n! exp t Für den homogenen Poissonprozess. 9 Statistik und Wahrscheinlichkeitsrechnung Zufallssequenzen: Poissonprozess Der Mittelwert und die Varianz der Zufallsvariable N, welche D Mi l d di V i d Z f ll i bl N l h die Anzahl Ereignisse in einem bestimmten Intervall (0,t[ bezeichnet sind wie folgt gegeben: bezeichnet, sind wie folgt gegeben: t E N(t ) Var N(t ) ( )d Für den inhomogenen Poissonprozess. E N (t ) Var V N (t ) t Für den homogenen Poissonprozess. 0 14.04.2010 10 Statistik und Wahrscheinlichkeitsrechnung Zufallssequenzen: Exponentialverteilung Die Wahrscheinlichkeit von keinem Ereignis in einem gegebenen Zeitintervall (0,t[ ist sehr oft von Interesse in Ingenieurproblemen. Kein ernsthafter Sturm in 10 Jahren. Kein ernsthafter Sturm in 10 Jahren Kein Strukturversagen in 100 Jahren. Kein Erdbeben nächstes Jahr. Kein Erdbeben nächstes Jahr Diese Wahrscheinlichkeit wird folgendermassen erhalten: 0 t ( )d t 0 P0 t p ( )d exp 0! 0 0 t exp ( )d )d 0 Für den inhomogenen Poissonprozess. Für den homogenen Poissonprozess. 14.04.2010 P t exp t 11 Statistik und Wahrscheinlichkeitsrechnung Zufallssequenzen: Exponentialverteilung Die kumulative Wahrscheinlichkeitsverteilungsfunktion der (Warte‐) ( ) Zeit bis zum ersten Ereignis T1 kann leicht hergeleitet werden. Wenn die Wahrscheinlichkeit von T1 > tt grösser ist als P die Wahrscheinlichkeit von T grösser ist als P0(t) dann erhalten dann erhalten wir: Für den inhomogenen Poissonprozess Für den homogenen Poissonprozess FT1 (t1 ) 1 exp( t ) FT1 (t1 ) 1 P0 (t1 ) Exponentiale kumulative Verteilungsfunktion t 1 exp(( ( )d ) Exponentiale Verteilungsdichtefunktion 0 fT1 (t1 ) exp( t ) 14.04.2010 12 Statistik und Wahrscheinlichkeitsrechnung Poissonprozess ‐ Exponentialverteilung Exponentialverteilung: Die Wahrscheinlichkeit von einem Ereignis in Abhängigkeit von (der Wartezeit) t (der Wartezeit) t. fT (t ) FT (t ) 2 2.5 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 2 FT t 1 e vt t fT (t ) t e t t 1.5 1 0.5 0 0 1 2 3 4 fT (t ) FT (t ) 14.04.2010 13 Statistik und Wahrscheinlichkeitsrechnung Zufallssequenzen: Exponentialverteilung Die Exponentialverteilung wird oft benutzt, um Wartezeiten i i l il id f b i zu modellieren: Zeit bis zu einem Versagen Zeit bis zum nächsten Erdbeben Zeit bis zum nächsten Erdbeben Zeit bis zum nächsten Unfall fT (t ) t e t t Der Erwartungswert und die Varianz einer exponentiell verteilten Zufallsvariable T sind gegeben als: E T Var T 1 / 14.04.2010 14 Statistik und Wahrscheinlichkeitsrechnung Zufallssequenzen: Gammaverteilung Oft ist auch die Zeit T f hd b bis zum n ‐ten Ereignis von Interesse im Ingenieurwesen: Überschwemmungsereignisse Eintreffen von Fahrzeugen an einer Strassenkreuzung ff h k Zeit bis zu notwendigen Unterhaltsarbeiten Wenn TTi, i=1,2,..n unabhängige, exponentiell verteilte Wartezeiten sind, dann W i 12 bhä i ti ll t ilt W t it i d d folgt ihre Summe T T T1 T2 ... Tn1 Tn einer Gammaverteilung fT (t ) 14.04.2010 ( t )( n-1) exp( t ) (n 1)! Diese folgt aus der wiederholten g Anwendung des Resultats der Verteilung der Summe aus zwei Zufallsvariablen. 15 Statistik und Wahrscheinlichkeitsrechnung Zufallssequenzen: Gammaverteilung Wahrscheinlichkeitsdichtefunktion der Gammaverteilung fT (t ) 2 n=1 2.5 n=4 2 1.5 Exponential p 1 0.5 Gamma t 0 0 14.04.2010 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 16 Statistik und Wahrscheinlichkeitsrechnung Zufallsprozesse Kontinuierlicher Zufallsprozess Mit einem kontinuierlichen Zufallsprozess werden Mit einem kontinuierlichen Zufallsprozess werden Zufallsgrössen beschrieben, die sich über die Zeit kontinuierlich realisieren. Variationen von: 18.03.2008 Pegelständen Windgeschwindigkeiten H f Herzfrequenzen Geschwindigkeiten von Objekten …. 17 Statistik und Wahrscheinlichkeitsrechnung Zufallsprozesse Realisation eines kontinuierlichen Zufallsprozesses – Pegel, Abfluss und Temperatur der Limmat bei Baden. 18.03.2008 18 Statistik und Wahrscheinlichkeitsrechnung Zufallsprozesse Kontinuierlicher stochastischer Prozess Der Mittelwert der möglichen Realisation des Zufallsprozesses ist gegeben mit: X (t) E X (t) x fX (x ;t)dx Funktion der Zeit! Die Autokorrelation zwischen den Realisationen an zwei Zeitpunkten ist gegeben mit: RXX (t1, t2 ) E X (t1) X (t2 ) x x 1 2 f XX ( x1, x2;t1, t2 )dx d 1dx d2 18.03.2008 19 Statistik und Wahrscheinlichkeitsrechnung Zufallsprozesse Kontinuierlicher stochastischer Prozess Die Auto‐Kovarianz‐Funktion ist definiert als: CXX (t1, t2 ) E ( X (t1) X (t1))( X (t2 ) X (t2 )) (x1 X (t1)) (x2 X (t2 )) f XX (x1, x2;t1, t2 )dx1dx2 t1 t2 t für wird die Auto‐Kovarianz‐Funktion zur Kovarianz 2 2 Funktion: X ( t ) CXX ( t ,t ) RXX ( t ,t ) X ( t ) X (t ) 18.03.2008 “Standardabweichungs g Funktion” 20 Statistik und Wahrscheinlichkeitsrechnung Zufallsprozesse Kontinuierlicher stochastischer Prozess Ein vektorwertiger Prozess ist ein Zufallsprozess mit zwei oder mehr Komponenten: h K X (t ) ( X 1 (t ), X 2 (t ),..., X n (t ))T mit Kovarianz Funktion: CXi X j (t1, t2 ) E ( Xi (t1 ) Xi (t1 ))( X j (t2 ) X j (t2 )) i j Auto‐Kovarianz Funktion i j Kreuz‐Kovarianz Funktion Die Korrelationskoeffizienten Funktion ist definiert mit: X i (t1 ), ) X j (t2 ) C X i X j (t1 , t2 ) X (t1 ) X (t2 ) i 18.03.2008 j 21 Statistik und Wahrscheinlichkeitsrechnung Zufallsprozesse Normal oder Gauss Prozess Ein Zufallsprozess wird als Normal bezeichnet, wenn: X t für beliebige; X t1 , X t2 , X t3 ,..., X t j die gemeinsame Wahrscheinlichkeits‐Verteilung von X t1 , X t2 , X t3 ,..., X t j die Normalverteilung ist. g 18.03.2008 22 Statistik und Wahrscheinlichkeitsrechnung Zufallsprozesse Stationarität und Ergodizität Ein Zufallsprozess wird als streng stationär bezeichnet, wenn alle seine Momente invariant sind über die Zeit. Ein Zufallsprozess wird als schwach stationär bezeichnet, wenn seine zwei ersten Momente also der Mittelwert und wenn seine zwei ersten Momente, also der Mittelwert und die Autokorrelationsfunktion, invariant sind über die Zeit. X (t ) cst RXX (t1, t2 ) f (t2 t1 ) 18.03.2008 Schwach stationär 23 Statistik und Wahrscheinlichkeitsrechnung Zufallsprozesse Stationarität und Ergodizität Ein Zufallsprozess wird als streng ergodisch bezeichnet, wenn er streng stationär ist und zusätzlich alle seine Momente aufgrund einer Realisation des Prozesses bestimmt werden können. Ein Zufallsprozess wird als schwach ergodisch bezeichnet, wenn er schwach stationär ist und zusätzlich seine zwei ersten Momente aufgrund einer Realisation des Prozesses bestimmt werden können. 18.03.2008 24 Statistik und Wahrscheinlichkeitsrechnung Zufallsprozesse Stationarität und Ergodizität Wieso sind Annahmen bezüglich Stationarität und Ergodizität nützlich im Ingenieurwesen? Wenn ein Zufallsprozess ergodisch ist, dann können wir probabilistische Modelle von Extremereignissen wir probabilistische Modelle von Extremereignissen aus kurzen Referenzperioden für längere Referenzperioden extrapolieren. 18.03.2008 25 Statistik und Wahrscheinlichkeitsrechnung Extremwertverteilungen Bei Extremwerten handelt es sich jeweils um den grössten, oder um den h l h l kleinsten Wert einer bestimmten Grösse innerhalb eines gegebenen Zeitintervalls: Grösstes Erdbeben in einem Jahr Höchste Welle in einer Winterperiode Grösste Niederschlagsmenge in 100 Jahren …oder um den grössten oder kleinsten Wert einer bestimmten Grösse oder um den grössten oder kleinsten Wert einer bestimmten Grösse innerhalb einer bestimmten Fläche oder Volumen: Die grösste Konzentration von Pestiziden in einem Kubikmeter Boden Das schwächste Glied in einer Kette Die kleinste Betonüberdeckung 18.03.2008 26 Statistik und Wahrscheinlichkeitsrechnung Extremwertverteilungen Beobachtete 6‐monatliche Extremwerte Beobachtete jährliche B b ht t jäh li h Extremwerte Beobachtete 5‐Jahres Beobachtete 5‐Jahres Extremwerte 18.03.2008 27 Statistik und Wahrscheinlichkeitsrechnung Extremwertverteilungen Beobachtete Extremwerte 10 Tage Intervalle Beobachtete Extremwerte 5 Tage Intervalle 18.03.2008 28 Statistik und Wahrscheinlichkeitsrechnung Extremwertverteilungen Wenn die Extremwerte innerhalb einer Periode T d h lb d eines ergodischen d h Zufallsprozesses X(t) unabhängig sind und der Verteilung FXmax ,T ( x) folgen, dann werden die Extremwerte des gleichen Prozesses innerhalb der Periode n T folgender Verteilung folgen: folgender Verteilung folgen: max X ,nT T F 18.03.2008 (x) F max X ,T (x) n 29 Statistik und Wahrscheinlichkeitsrechnung Extremwertverteilungen Verschieden Typen von Extremwertverteilungen in Abhängigkeit von der h d l bh k d Form der Dichteverteilung der Variablen in den ‚Extremen‘. Typ I: Oberer Bereich fällt exponentiell ab ‐> z.B. Gumbel max. Typ II: nach unten begrenzt + Abfall im oberen Bereich 1 FX (x) 1 ( ) k ‐> z.B. Frechet x max. Typ III: nach unten begrenzt bei und Abfall im unteren Bereich F( x) c( x )k ‐> z.B. Weibull B W ib ll min i 18.03.2008 30 Statistik und Wahrscheinlichkeitsrechnung Extremwertverteilungen: Gumbel Max Wenn der obere Schwanz der Wahrscheinlichkeitsdichtefunktion exponentiell abfällt (Exponential‐, Normal‐ und Gammaverteilung) dann wird das Maximum im Zeitintervall T Gammaverteilung), dann wird das Maximum im Zeitintervall T als Typ I extremverteilt bezeichnet. f Xmax ((x u) exp(((x u))) ,T ( x) exp( FXmax p( exp( p((x u))) ,T T ( x) exp( X max T X max T 18.03.2008 0.577216 u u 6 Für zunehmende Zeitintervalle ist die Varianz konstant, aber der Mittelwert wird grösser: X max nT X max T 6 X ln((n) max T 31 Statistik und Wahrscheinlichkeitsrechnung Extremwertverteilungen: Frechet Max Wenn eine Wahrscheinlichkeitsdichtefunktion unten bei Null begrenzt ist, und in ihrem oberen Ende abfällt in der Form 1 FX ( x) 1 ( ) k x dann wird das Maximum im Zeitintervall T als Typ II extremverteilt bezeichnet. k u max FX ,T ( x) exp( ) x k u f Xmax x ( ) ,T u x 18.03.2008 k 1 Mittelwert und Standardabweichung k u exp( ) x X max T X2 max T 1 u(1 ) k 2 1 u 2 (1 ) 2 (1 ) k k 32 Statistik und Wahrscheinlichkeitsrechnung Extremwertverteilungen: Weibull Min Wenn eine Wahrscheinlichkeitsdichtefunktion unten bei ε begrenzt ist, und das untere Ende zu ε hin abfällt in der Form F(x) c(x ) k dann wird das Maximum im Zeitintervall T als Typ III extremverteilt bezeichnet. k x min FX ,T ( x) 1 exp u k min f X ,T ( x) u 18.03.2008 x u k 1 Mittelwert und Standardabweichung X x k 2 exp p X u min T min T 1 (u )(1 ) k 2 1 (u ) 2 (1 ) 2 (1 ) k k 33 Statistik und Wahrscheinlichkeitsrechnung Wiederkehrperiode Die Wiederkehrperiode d k h d für Extremereignisse T f dd f l R wird definiert als: TR = n⋅T = 1 T max (1- FX ,T (x)) Beispiel: p Nehmen wir an, dass gemäss der kumulativen Wahrscheinlichkeits‐ verteilungsfunktion des jährlichen Maximums der Verkehrslasten, die jährliche Wahrscheinlichkeit einer Verkehrslast grösser als 100 Tonnen die jährliche Wahrscheinlichkeit einer Verkehrslast grösser als 100 Tonnen gleich 0.02 ist ‐ dann ist die Wiederkehrperiode einer solchen Last: TR n T 1 1 1 1 50 Jahre 0.02 0.02 T=1 (jährliche Wahrscheinlichkeit) 18.03.2008 34 Statistik und Wahrscheinlichkeitsrechnung Statistik und Statistik und Wahrscheinlichkeitsrechnung Prof. Dr. Michael Havbro Faber 14.04.2010 35