Wiederholung Analysis F ( x ) sei Stammfunktion zu f ( x ) → f ( x)dx = F ( x) ⇔ F ′( x ) = f ( x ) f(x) A= F(b) - F(a) Bestimmtes Integral b f ( x)dx = F (b) − F (a) a a Uneigentliche Integrale Spezialfälle x x lim F ( a ) = 0 → f (t )dt = F ( x) − lim F (a ) a →−∞ a →−∞ −∞ ∞ f (t )dt = F ( x) −∞ ∞ f (t )dt = lim F (b) − F ( x) x b lim F (b) = 1 → f (t )dt = 1 − F ( x) b →∞ b →∞ x x f (t ) (>) ≥ 0 F ( x) = f (t )dt ist (streng) monoton wachsend −∞ SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 1 Stetige Zufallsgrößen Eine Zufallsgröße heißt stetig, wenn sie alle Werte eines Intervalls der reellen Achse annehmen kann. Stetige Zufallsgrößen beschreiben zum Beispiel: • Lebensdauer eines Bauelements • Wartezeiten auf eine Bedienung • Längenmessungen Problem Ist X eine stetige Zufallsgröße, so gilt P(X = x) = 0 für jedes x, d.h. jeder einzelne Wert wird mit der Wahrscheinlichkeit 0 angenommen. Eine stetige Verteilung ist also nicht über Punktwahrscheinlichkeiten P(X = x) beschreibbar. Ausweg Anstelle von P(X = x) wird die Intervallwahrscheinlichkeit P(X ≤ x) für jedes x zur Charakterisierung der Verteilung betrachtet. Dadurch entsteht eine Verteilungsfunktion F ( x) = P ( X ≤ x) . SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 2 Verteilungsfunktion Verteilungsfunktion der Zufallsgröße X: F ( x ) = P ( X ≤ x), x ∈ Interpretation F(x) gibt die Wahrscheinlichkeit an, dass X Werte im Intervall (-∞, x] annimmt. Eigenschaften der Verteilungsfunktion 0 ≤ F ( x) ≤ 1 F ( x) ist monoton wachsend lim F ( x) = 0 x →−∞ F ( x0 ) = P ( X ≤ x0 ) lim F ( x) = 1 x →+∞ Die Verteilungsfunktion einer Zufallsgröße entspricht der empirischen Verteilungsfunktion einer Stichprobe mit Realisierungen dieser Zufallsgröße. Anstelle der relativen Stichprobenhäufigkeiten stehen jetzt die Wahrscheinlichkeiten. SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 3 Intervallwahrscheinlichkeiten Berechnung von Intervallwahrscheinlichkeiten mit der Verteilungsfunktion P (a < X ≤ b) = F (b) − F (a ) P( X ≤ b) = F (b) P(a < X ≤ b) = F (b) − F (a) P(a < X ) = 1 − F ( a ) Da bei stetigen Zufallsgrößen alle Punktwahrscheinlichkeiten P(X = x) gleich Null sind, sind ‚<´ und ‚≤‘ bei der Berechnung der Intervallwahrscheinlichkeiten beliebig austauschbar. SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 4 Stetige Zufallsgrößen Die Intervallwahrscheinlichkeiten sind umso größer, je steiler der Anstieg von F(x) ist. F(b‘)-F(a‘) a‘ b‘ Das Anstiegsverhalten beschreibt die erste Ableitung : f ( x ) = F '( x ) Intervalle mit steilem Anstieg enthalten viele Realisierungen von X, dort nimmt f ( x ) große Werte an, daher bezeichnet man f ( x ) als Dichte. SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 5 Dichte Dichte f ( x) einer stetigen Zufallsgröße X mit der Verteilungsfunktion F ist f ( x) = F ′( x) Eigenschaften der Dichte f ( x) ≥ 0 +∞ −∞ f ( x)dx = F (∞) − F (−∞) = 1 In Intervallen mit Dichte = 0 liegen (quasi) keine Realisierungen von X In Intervallen mit hoher Dichte liegen ' viele' Werte der Zufallsgröße (X liegt dort mit hoher Wahrscheinlichkeit) Berechnung der Verteilungsfunktion aus der Dichte x F ( x) = f (t ) dt 5.1 −∞ SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 6 Dichte Dichte ist Grenzfall des Histogramms (n → ∞, Klassenbreite → 0) 30 50 15 40 Count Count Count 20 10 30 20 10 5 10 -3,00 0 0 -2,00 -1,00 0,00 r100 1,00 2,00 -2,00 -1,00 0,00 1,00 2,00 -2,00 -1,00 0,00 1,00 2,00 r400 r200 Histogramme von 100, 200 bzw. 400 simulierten normalverteilten Zufallszahlen steigende Klassenanzahl bei fallender Klassenbreite, überlagert ist die Dichte der Verteilung SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 7 Dichte Berechnung von Intervallwahrscheinlichkeiten mit der Dichte b P ( a < X ≤ b) = f ( x) dx P (a < X ≤ b) a a b a P( X ≤ a) = f ( x)dx P(X ≤ a) −∞ a ∞ P ( X > b) = f ( x) dx P( X > b) b b Da bei stetigen Zufallsgrößen die Punktwahrscheinlichkeiten P(X = x) alle gleich Null sind, sind ‚<´ und ‚≤‘ bei der Berechnung der Intervallwahrscheinlichkeiten beliebig austauschbar. SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 8 Kenngrößen stetiger Verteilungen X sei eine stetige Zufallsgröße mit der Dichte f(x): Erwartungswert EX = x ⋅ f ( x)dx Varianz VarX = ( x − EX )2 f ( x)dx = x 2 f ( x)dx − (EX )2 Standardabweichung s = + VarX (Streuung) Variationskoeffizient SS 2017 v= s EX (nur bei X >= 0) Prof. Dr. J. Schütze, FB GW Stet. Vert. 9 Kenngrößen stetiger Verteilungen Vergleich der Formelstrukturen Erwartungswert Varianz stetige Zufallsgröße diskrete Zufallsgröße EX = x ⋅ f ( x)dx EX = xk P ( X = xk ) VarX = ( x − EX )2 f ( x )dx k Var X = ( xk − EX ) 2 P ( X = xk ) k Analogie für Erwartungswert und Standardabweichung bei stetigen und diskreten Zufallsgrößen • Dichte f(x) entspricht der Wahrscheinlichkeitsfunktion pk = P(X=xk) • Integral entspricht dem Summenzeichen SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 10 Kenngrößen stetiger Verteilungen uα heißt α - Quantil der Verteilung von X, wenn P( X < uα ) = α, 0 < α < 1 Zusammenhang Quantil - Dichte P ( X < uα ) = α ⇔ uα −∞ f ( x) dx = α Zusammenhang Quantil - Verteilungsfkt α = P( X < uα ) = F (uα ) α uα uα α Speziell bei strenger Monotonie von F uα = F −1 (α) Interpretation links von uα liegen α · 100% der Werte von X SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 11 Spezielle stetige Verteilungen Wichtige Verteilungen für Modellierung (Auswahl): Gleichverteilung Gl[a,b] Weibullverteilung Wei(b,T) Exponentialverteilung exp(λ) Erlangverteilung Erlang(λ,n) Normalverteilung N(μ, σ2) Gammaverteilung Γ 2(a,n) Wichtige Testverteilungen in schließender Statistik: T – Verteilung tn χ2 - Verteilung χ2n F – Verteilung Fm,n SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 12 Spezielle stetige Verteilungen Gleichverteilung auf Intervall [ a, b ] Modell Außerhalb des Intervalls [ a, b ] liegen keine Werte von X. Die Wahrscheinlichkeit, dass X Werte in einem Teilintervall von [ a, b ] annimmt, ist nur abhängig von der Intervalllänge, aber nicht von der Lage des Teilintervalls. Bezeichnung: X ~ Gl[a,b] Dichte Verteilungsfunktion Erwartungswert EX = SS 2017 1 f ( x) = b − a 0 0 x − a F ( x) = b − a 1 a+b 2 x ∈ [ a, b ] sonst a b a b x≤a a< x≤b x>b Varianz VarX = Prof. Dr. J. Schütze, FB GW (b − a ) 12 2 5.2 Stet. Vert. 13 Normalverteilung Normalverteilung N(μ, σ2) Anwendungen Verteilung zufälliger Messfehler Verteilung der Summe von vielen unabhängigen Zufallsgrößen Verteilung des Mittelwertes von unabhängigen Zufallsgrößen 1 n X = X i für n ≥ 30 in guter Näherung n i =1 Bedeutung in der Statistik Normalverteilung ist die am besten untersuchte stetige Verteilung in Statistik! SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 14 Normalverteilung Normalverteilung N(μ, σ2) Dichte : Gaußsche Glockenkurve f ( x) = 1 2 πσ 2 e − ( x −μ )2 2 σ2 Parameter μ ∈ , σ 2 > 0 Kurvendiskussion der Dichte: - Maximum in μ - symmetrisch zu μ - Wendepunkte in μ ± σ μ−σ SS 2017 μ μ+σ Prof. Dr. J. Schütze, FB GW Stet. Vert. 15 Normalverteilung Normalverteilung N(μ, σ2) Form der Dichte in Abhängigkeit von den Parametern 1. Die Werte der Zufallsgröße X sind um μ konzentriert 2. Je größer der Abstand von μ, desto seltener liegen die Werte 3. Je kleiner σ , desto enger ist die Kurve 0.4 Bedeutung der Parameter 0.35 Erwartungswert: E X = μ Varianz: Var X = σ² N(0,1) N(0,4) N(1,1) 0.3 0.25 0.2 0.15 0.1 0.05 0 -5 SS 2017 Prof. Dr. J. Schütze, FB GW -4 -3 -2 -1 0 1 2 3 4 Stet. Vert. 5 16 Normalverteilung x Verteilungsfunktion φ (μ ,σ 2 ) ( x ) = −∞ 1 2 πσ 2 e 2 t −μ ) ( − 2σ2 dt Intervallwahrscheinlichkeiten ( x −μ ) 2 b 1 2 P (a < X ≤ b) = e 2 σ dx a 2 πσ 2 Es gibt keine geschlossene Stammfunktion für das Integral! Spezialfall μ = 0, σ2 = 1 Standardnormalverteilung φ ( 0,1) ( x ) = φ ( x ) Für die Standardnormalverteilung ist die Verteilungsfunktion tabelliert. 2 Für Normalverteilungen mit μ ≠ 0, σ ≠ 1 ist Transformation erforderlich, um diese Tabellen nutzen zu können. Computerprogramme enthalten die Verteilungsfunktion für beliebige μ und σ2. SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 17 Normalverteilung Transformation in Standardnormalverteilung X sei eine normalverteilte Zufallsgröße, X ~ N(μ, σ2), dann gilt: X −μ Z = N (0,1) σ Da die Standardnormalverteilung symmetrisch zu Null ist, enthalten Tabellen meist nur die Funktionswerte für x ≥ 0. Für x < 0 gilt: Φ (− x) = 1 − Φ ( x) 1 0.9 0.8 0.7 tabelliert 0.6 Φ (− x) = 1 − Φ ( x) 0.5 0.4 0.3 Beispiel X~ N(2, 9), dann ist μ = 2, σ = 3 0.2 0.1 0 -3 -2 −x -1 0 x 1 1− 2 = Φ Φ (2,9) (1) = Φ (0,1) (0,1) ( −0.33 ) = 1 − Φ (0,1) ( 0.33 ) = 1 − 0.6293 = 0.3707 3 SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 18 2 3 Normalverteilung Standardnormalverteilung: Tabellierte Verteilungsfunktion Φ (0,1) ( x) = Φ ( x) Auf den Rändern steht das Argument x mit maximal 2 Dezimalstellen, im Inneren der entsprechende Funktionswert. 0,00 0,00 0,01 0,02 0,03 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,00 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359 0,10 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5753 0,20 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6064 ,6103 ,6141 0,30 0,30 ,6179 ,6217 ,6255 ,6293 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517 0,40 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879 0,50 ,6915 ,6950 ,6985 ,7019 ,7054 ,7088 ,7123 ,7157 ,7190 ,7224 0,60 ,7257 ,7291 ,7324 ,7357 ,7389 ,7422 ,7454 ,7486 ,7517 ,7549 0,70 ,7580 ,7611 ,7642 ,7673 ,7704 ,7734 ,7764 ,7794 ,7823 ,7852 0,80 ,7881 ,7910 ,7939 ,7967 ,7995 ,8023 ,8051 ,8078 ,8106 ,8133 Ablesebeispiel Φ (0,1) ( 0.33) = 0.6293 Bequemer mit Computerprogramm, z.B. MATLAB: normcdf SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 19 Normalverteilung Berechnung von Intervallwahrscheinlichkeiten für X ~ N ( μ , σ 2 ) b−μ a−μ − Φ P (a < X ≤ b) = Φ σ σ a−μ P (a < X ) = 1 − Φ σ b−μ P ( X ≤ b) = Φ σ k- σ- Regel für normalverteilte Zufallsgrößen für k = 1, 2,3 P (μ − σ < X < μ + σ ) = 0.6826 P (μ − 2 σ < X < μ + 2 σ ) = 0.9544 P (μ − 3σ < X < μ + 3σ ) = 0.9973 SS 2017 Prof. Dr. J. Schütze, FB GW 5.3 Stet. Vert. 20 Additionssatz Additionssatz für unabhängige, normalverteilte Zufallsgrößen Sei X 1 ~ N ( μ1 ,σ 12 ), X 2 ~ N ( μ 2 ,σ 22 ), unabhängig. Dann ist X 1 + X 2 ~ N ( μ1 + μ2 ,σ 12 + σ 22 ) Die Verteilung der Summe von Zufallsgrößen nennt man Faltung. Eine explizite Berechnung von Faltungen ist oft elementar schwierig. Der Additionssatz besagt, dass eine Faltung von unabhängigen Normalverteilungen wieder eine NV ergibt, wobei sich Erwartungswert und Varianz addieren. Folgerung X 1 ,..., X n seien unabhängig, identisch verteilt nach N (μ, σ 2 ) Dann gilt 1 n X = X i ~ N (μ, σ 2 / n) n i =1 SS 2017 Prof. Dr. J. Schütze, FB GW 5.4 Stet. Vert. 21 Quantile der Standardnormalverteilung Die Quantile der Normalverteilung erhält man aus der Verteilungstabelle, indem man α im Inneren der Tabelle als Funktionswert nachschlägt, das dazugehörige Argument auf dem Rand ist dann das Quantil der Ordnung α. Die Symmetrie der Dichte bewirkt folgende Symmetrie der Quantile zα = − z1−α Spezielle Quantile z0.95 = 1.64, z0.05 = −1.64 z0.975 = 1.96, z0.025 = −1.96 α α zα SS 2017 z1−α Prof. Dr. J. Schütze, FB GW z0.99 = 2.33, z0.01 = −2.33 NV - Quantil mit MATLAB: norminv Stet. Vert. 22 Lebensdauerverteilungen T sei die zufällige Lebensdauer eines Bauelements, dann beschreibt die Verteilung von T die Ausfallwahrscheinlichkeit bis zur Zeit t P (T < t ) = F (t ), t > 0 F(t) gibt also die Wahrscheinlichkeit an, dass das Element in [0, t] ausfällt. R sei die (zufällige) Überlebensfunktion/Zuverlässigkeitsfunktion des Bauelements, R (t ) = P (T ≥ t ) = 1 − F (t ), t ≥ 0 R(t) ist die Wahrscheinlichkeit dafür, dass in [0, t] kein Ausfall erfolgt. Dichte der Lebensdauer/Ausfalldichte f (t ) = F '(t ) Für beliebig kleine Zeiträume Δt gibt f (t ) ⋅ Δt die Wahrscheinlichkeit des Ausfalls in [t , t + Δt ] an. SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 23 Lebensdauerverteilungen Ausfallrate (Hazardfunktion) beschreibt das bedingte Ausfallverhalten eines Elements, das bis t überlebt hat f (t ) f (t ) h(t ) = = 1 − F (t ) R (t ) Für beliebig kleine Zeiträume Δt ist h(t ) ⋅ Δt die bedingte Wahrscheinlichkeit dafür, dass ein Element in [t , t + Δt ] ausfallen wird wenn es bis zum Zeitpunkt t überlebt hat. Mittlere Lebensdauer ∞ ET = t ⋅ f (t ) dt 0 Eigenschaften ∞ ET = R (t )dt , falls ET < ∞ 0 R (t ) = e SS 2017 t − h ( x ) dx 0 Prof. Dr. J. Schütze, FB GW Stet. Vert. 24 Exponentialverteilung Exponentialverteilung mit Parameter λ Modell Lebensdauerverteilung mit ‚Nichtalterungseigenschaft‘ 1/λ ist das mittlere Alter einer so verteilten Größe, λ > 0 Bezeichnung: X ~ Exp(λ) 0 f ( x) = −λx λ e Dichte y x≤0 x>0 1.2 F(x) 1.0 0.8 0.6 0.4 0 F ( x) = −λx 1 − e Verteilungsfunktion x≤0 x>0 0.2 0.0 1000 2000 3000 4000 -0.2 Erwartungswert EX = 1 λ Varianz VarX = 1 λ2 5.5 SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 25 5000 x Exponentialverteilung Nichtalterungseigenschaft der Exponentialverteilung P ( X ≥ t + h / X ≥ t ) = P ( X ≥ h) für alle t ≥ 0, h ≥ 0 Interpretation Fällt ein Teil mit exponentiell verteilter Lebensdauer im Intervall (0, t) nicht aus, dann ist Wahrscheinlichkeit, noch länger als h Zeiteinheiten zu leben so groß wie die Wahrscheinlichkeit, als neues Teil (startend in 0) länger als h zu leben. Verteilung des Minimums von Exponentialverteilungen Seien X 1 , X 2 ,..., X n unabhängige, exponentialverteilte Zufallsgrößen mit den Parametern λ1 ,..., λ n Das Minimum min( X 1 , X 2 ,..., X n ) ist exponentialverteilt mit dem Parameter n λ Anwendung Lebensdauer eines Seriensystems aus n unabhängigen Komponenten Xi mit Xi ~ Exp(λi) ist exponentialverteilt mit Parameter λ k . Die mittlere Lebensdauer ist daher gleich 1 / λ k SS 2017 Prof. Dr. J. Schütze, FB GW k k =1 Stet. Vert. 5.6 26 Erlangverteilung Modell Verteilung der Summe von Exponentialverteilungen (Faltung) Seien X 1 , X 2 ,..., X n unabhängige, exponentialverteilte Zufallsgrößen mit dem gleichen Parameter λ Die Summe X = X 1 + X 2 + ... + X n heißt erlangverteilt der Ordnung n mit Parameter λ X ~ Erl(n,λ) (Faltung n unabhängiger exponentialverteilter ZG mit gleichem λ) Verteilungsfunktion F ( x) = 1 − e −λx (λ x ) k k! k =0 n −1 Dichte (λx) n−1 −λx f ( x) = λ e (n − 1)! Erwartungswert EX = Varianz VarX = SS 2017 n λ n λ2 Prof. Dr. J. Schütze, FB GW Stet. Vert. 27 Weibullverteilung Weibullverteilung mit den Parametern b und T Modell Lebensdauerverteilung mit zeitabhängiger Ausfallrate (Alterung modellierbar) Bezeichnung: X ~ Wei(b,T), b > 0, T > 0 Verteilungsfunktion F ( x) = 1 − e Dichte f ( x) = x − T bx T T b , x≥0 b −1 e x − T Dichten für verschiedene b b Bedeutung der Parameter T > 0: charakteristische Lebensdauer, das entspricht der Zeit, in der 63.2% aller Objekte ausgefallen sind b > 0: Ausfallsteilheit, in der Praxis meist 0.25 < b < 5 ab b = 3.5 Ähnlichkeit mit NV Speziell bei b = 1: Exponentialverteilung mit λ = 1/T SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 28 Weibullverteilung Alternative Darstellung mit Weibullverteilung mit den Parametern b und T Verteilungsfunktion F ( x) = 1 − e 1 β = b und α = T x − T b −1 Dichte Erwartungswert b bx e T T 1 EX = T Γ + 1 b f ( x) = β β F ( x ) = 1 − e −αx , x ≥ 0 , x≥0 x − T b f ( x) = αβ xβ−1e −αx β 1 EX = α −1/ β Γ + 1 β Varianz 2 1 2 2 VarX = T Γ + 1 − Γ + 1 b b Ausfallrate 1 λ ( x) = b ⋅ x b−1 T 2 2 1 −2 / β VarX = α Γ + 1 − Γ + 1 β β b wobei die Gamma-Funktion definiert ist durch λ ( x) = αβ ⋅ xβ−1 ∞ Γ(a ) = e− y y α−1dy 0 SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 29 Gamma-Funktion Die Gamma-Funktion ist eine ‚Fortsetzung‘ von f (n) = (n − 1)! auf die reellen Zahlen mit Ausnahme der negativen ganzen Zahlen und Null, definiert durch ∞ Γ(a ) = e − y y α−1dy 0 Spezielle Funktionswerte erhält man aus folgenden Eigenschaften: Eigenschaften der Gamma-Funktion 12 Γ(1) = 1 10 Γ(n) = (n − 1)! Γ (α) = (α − 1)Γ (α − 1) 8 6 Γ(1/ 2) = π 1 1 ⋅ 3 ⋅ 5 ⋅ ... ⋅ (2n − 1) Γn + = π 2 2n Bsp. Γ(3 / 2) =Γ(1 + 1 / 2) = π y 4 2 0 0 1 2 3 4 5 x 1 ⋅ ... ⋅ (2 ⋅ 1 − 1) π = 21 2 weitere Funktionswerte sind tabelliert bzw. mit MATLAB berechenbar SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 30 Weibullverteilung Anwendung der Weibullverteilung: Modellierung der Ausfallwahrscheinlichkeit/Lebensdauer von Systemen bei nicht konstanter Ausfallrate (im Gegensatz zu Exponentialverteilung!) Ausfallwahrscheinlichkeit: Zuverlässigkeit: Ausfallrate: W ( X ≤ t ) = F (t ) = 1 − e R(t ) = 1 − F (t ) = e t − T t b f (t ) T h(t ) = = R(t ) b b b −1 ⋅ e t − T 1 ⋅e T t − T b t → f (t ) = b T t − T b −1 ⋅ 1 ⋅e T b t − T b b t = T T b −1 b > 1: Ausfallrate λ(t ) steigt mit t (Verschleißausfälle, Spätausfälle) b < 1: Ausfallrate λ(t ) ist monoton fallend (Frühausfälle, dann Stabilität) b = 1: konstante Ausfallrate λ(t ) = 1 (Exponentialverteilung) T Durch intervallweise Kombination verschiedener Ausfallraten entstehen die typischen ‚Badewannenkurven‘. Dann braucht man einen weiteren Parameter für die Startzeit. SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 31 Lebensdauerverteilungen Lebensdauerverteilungen im Vergleich Verteilung Ausfallwahrscheinlichkeit Exp( λ ) 1 − e − λt Erl(n, λ ) (λ t ) k 1− e k! k =0 −λ Wei(T, b) 1− e SS 2017 Dichte (t > 0) λ e − λt n −1 t − T b (λt ) n−1 −λt λ e (n − 1)! b x T T b −1 e x − T Zuverlässigkeit Ausfallrate Mittlere Lebensdauer e − λt λ 1/ λ (λ t ) k e k =0 k ! λ für t → ∞ λ / n −λ n −1 b e t − T b Prof. Dr. J. Schütze, FB GW b t T T b −1 1 T Γ + 1 b Stet. Vert. 32 Testverteilung Testverteilungen sind wichtig in der schließenden Statistik, sie beschreiben die Verteilung von Testgrößen für Hypothesentests. Standardnormalverteilung χ 2 - Verteilung mit n Freiheitsgraden t - Verteilung mit n Freiheitsgraden F – Verteilung mit (n, m) Freiheitsgraden Die Freiheitsgrade stehen im Zusammenhang zum jeweiligen Stichprobenumfang. Die Werte der Quantile dieser Testverteilungen sind für verschiedene Freiheitsgrade und Quantilordnungen α tabelliert bzw. mit Statistiksoftware berechenbar. Für das α -Quantil ua der streng monotonen Verteilungsfunktionen F gilt F (ua ) = α ↔ ua = F −1 (α ) SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 33 Stetige Verteilung χ 2 - Verteilung mit n Freiheitsgraden: χ 2n = Z12 + ... + Z n2 mit Z i ~ N (0,1), unabhängig 2 Die χ -Verteilungen sind nicht symmetrisch! Daher hat man auch keine Symmetrie in den Quantilen, χ 2n ,α und χ 2n ,1−α können nicht ineinander umgerechnet werden. Ab n > 30 können die Quantile mit denen der NV genähert werden, p-Quantil in Matlab: chi2inv(p,k) SS 2017 Prof. Dr. J. Schütze, FB GW 1 χ 2n ,α ≈ ( zα + 2n − 1) 2 2 Stet. Vert. 34 Stetige Verteilung t - Verteilung mit n Freiheitsgraden: Tn = Z / χ n2 / n mit Z ~ N (0,1), χ 2n chi-quadrat-verteilt mit n FG, unabh. von Z Die t-Verteilung besitzt die gleiche Symmetrieeigenschaft wie die NV, folglich ist t1−α = −ta Mit wachsendem n nähert sich die t-Verteilung der NV, ab n = 30 kann sie durch die der NV in guter Näherung ersetzt werden. p-Quantil in MATLAB: tinv(p,n) SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 35 Stetige Verteilung F – Verteilung mit (n, m) FG: Fn ,m = (χ n2 / n) /(χ m2 / m) mit χ 2n , χ 2m chi-quadrat-verteilt mit n bzw. m Freiheitsgraden, unabhängig Für die Quantile gilt folgende Beziehung f m.n . a = 1 f n ,m ,1−α p-Quantil in MATLAB: finv(p,n,m) SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 36 Grenzwertsätze Was passiert mit der Verteilung des Mittelwerts, wenn die Anzahl der eingehenden Beobachtungen einer Zufallsgröße sehr groß ist? X 1 , X 2 ,... X n seien unabhängige Zufallsgrößen mit gleicher Verteilung. Das hat insbesondere zur Folge, dass für jedes i gilt: EX i = μ, VarX i = σ 2 n S = X 1 + ... + X n = X i X = ( X 1 + ... + X n ) / n = i =1 Erwartungswert Varianz Standardabweichung Verteilung ES = n ⋅μ EX = μ VarS = n ⋅ σ 2 VarX = σ2 / n ST ( S ) = n ⋅ σ ST ( X ) = σ / n NV, falls alle Xi NV NV, falls alle Xi NV 1 n Xi n i =1 Die Größe ST ( X ) = σ / n heißt Standardfehler des Mittelwerts, Maß für Abweichung des Durchschnitts X von μ, im Unterschied zu σ als Maß für Abweichung des Einzelwerts X i von μ SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 37 Grenzwertsätze Bei normalverteilten Zufallsgrößen ergibt Standardisierung von Summe bzw. Mittelwert n X − nμ X −μ N (0,1) σ n σ/ n Näherungsweise gilt das auch ohne Voraussetzung der NV für großes n. Zn = i = i =1 Zentraler Grenzwertsatz Sei X 1 , X 2 ,... eine Folge unabhängiger, identisch verteilter Zufallsgrößen mit EX i = μ , VarX i = σ 2 . Dann nähert sich die Verteilungsfunktion Fn ( z ) = P ( Z n ≤ z ) der standardisierten Sum me Z n mit n X i − nμ X −μ = i =1 Zn = σ/ n σ n für n → ∞ der Verteilungsfunktion der Standardnormalverteilung. Faustregel für gute Näherung: n ≥ 30 SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 38 Grenzwertsätze Faustregel für gute Näherung der Verteilung von Summen durch NV: n ≥ 30 bei symmetrischen Verteilungen reicht oft schon kleineres n Beispiel Widerstände von 330 Ω werden vom Hersteller mit einer Fehlertoleranz von 5% ausgewiesen, d.h. zwischen 315.5 Ω und 346.5 Ω. Annahme der Gleichverteilung: Ri ~ Gl [315.5 , 346.5] , dann ist 313.5 + 346.5 346.5 − 313.5 ERi = = 330, VarRi = = 90.75, sRi = 90.75 = 9.53 2 12 Gesamtwiderstand R einer Reihenschaltung von 5 zufällig ausgewählten Widerständen ER = E ( R1 + ... + R5 ) = 5 ⋅ 330 = 1650, VarR = 5 ⋅ 90.75 = 453.75, sR = 453.75 = 21.3 Histogramm des Gesamtwiderstands R Simulation der 5 Zufallsgrößen Ri (10000 mal) mit MATLAB: R = random(`unif‘,315.5,346.5,[10000,5]) R_sum = sum(R‘)‘ hist(R_sum) 2500 2000 1500 1000 500 Histogramm zeigt bei 5 Summanden gute Näherung an NV SS 2017 Prof. Dr. J. Schütze, FB GW 0 1580 1600 1620 1640 1660 Stet. Vert. 1680 39 1700 1720 Grenzwertsätze Spezialfall: Grenzwertsatz von Moivre-Laplace Sei X ~ Bin ( n , p ) , dann nähert sich die Verteilung von Z n = n → ∞ der Standardnormalverteilung. 9 (Faustregel: n > , bei p ≈ 0.5 auch n ⋅ p > 5) p(1 − p ) X − np für np (1 − p ) Damit lässt sich die Binomialverteilung Bin(n,p) durch eine Normalverteilung mit μ = np, σ2 = np(1 − p ) approximieren. Es gilt für X ~ Bin(n,p) x − np P( X ≤ x ) ≈ Φ np (1 p ) − Approximation mit Stetigkeitskorrektur x + 0.5 − np x − 0.5 − np P( X = x ) ≈ Φ − Φ np (1 p ) np (1 p ) − − Anwendung: Berechnung von Binomialwahrscheinlichkeiten für großes n SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 5.7 40 Grenzwertsätze Tschebyscheffsche Ungleichung P( Y − EY ≥ ε) ≤ VarY , ε>0 2 ε Folgerungen σ2 1 8 (1) P( Y − EY ≥ 3σ) ≤ 2 = , folglich P ( Y − EY < 3σ) ≥ 9σ 9 9 (2) P( Y − μ ≥ ε) ≤ 2 σ n ⋅ ε2 mit 1 n Y = Yi , n i =1 μ = EYi , σ 2 = VarYi Schwaches Gesetz der großen Zahlen Sei (Yn ) n=1,2,... eine Folge unabhängiger, identisch verteilter Zufallsgrößen mit EYn = μ, VarYn = σ 2 Dann gilt für alle ε > 0 1 N lim N →∞ P Yn − μ ≥ ε = 0 N n=1 SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 41 Grenzwertsätze Folgerung Konvergenz der relativen Häufigkeiten eines Ereignisses gegen seine Wahrscheinlichkeit Serie von N unabhängigen, zufälligen Versuchen zur Beobachtung des Ereignisses A 1 falls A im i -ten Versuch eintritt Yi = 0 sonst Gesucht: p = P ( A) Es gilt P(Yi = 1) = p, P(Yi = 0) = 1 − p, EYi = p 1 N 1 N E Yi = EYi N 1 N i =1 N i =1 f N ( A) = Yi N i =1 1 = ⋅ N ⋅ p = p = P ( A) N Schwaches Gesetz der großen Zahlen, angewandt auf die relativen Häufigkeiten Schätzung von p durch relative Häufigkeit 1 N lim N →∞ P X n − μ ≥ ε = lim N →∞ P ( f N ( A) − P ( A) ≥ ε ) = 0 N n=1 SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 42 Vektoren stetiger Zufallsgrößen X = [X1, X2 ] sei Vektor stetiger Zufallsgrößen über der gleichen Grundmenge Ω Gemeinsame Verteilungsfunktion FX ( x1 , x2 ) = P( X 1 ≤ x1 ∩ X 2 ≤ x2 ), x1 , x2 ∈ Randverteilungen der Komponenten (wieder eindimensional) FX1 ( x) = lim x2 →∞ FX ( x, x2 ), FX 2 ( x) = lim x1 →∞ FX ( x1 , x) Die Komponenten X1, X2 sind unabhängig, wenn FX ( x1 , x2 ) = FX1 ( x1 ) ⋅ FX 2 ( x2 ), x1 , x2 ∈ Der Vektor heißt stetig verteilt mit der gemeinsamen Dichte f X ( x1 , x2 ) , wenn x1 x2 FX ( x1 , x2 ) = f X (ξ1 , ξ 2 )d ξ2 d ξ1 −∞ −∞ Bei Unabhängigkeit ist diese Dichte gleich dem Produkt der Randdichten f X i ( x) = FX' i ( x), i = 1, 2 f X ( x1 , x2 ) = f X1 ( x1 ) ⋅ f X 2 ( x2 ) SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 43 Vektoren stetiger Zufallsgrößen X1, X2 seien stetige Zufallsgröße mit der gemeinsamen Dichte fX Kovarianz Cov( X 1 , X 2 ) = E ( X 1 − EX 1 )( X 2 − EX 2 ) = Korrelation ρ= ∞ ∞ (x 1 − EX 1 )( x2 − EX 2 ) f X ( x1 , x2 )dx2 dx1 −∞ −∞ Cov( X 1 , X 2 ) VarX 1 ⋅ VarX 2 Mit -1 ≤ ρ ≤ 1 ist die Korrelation ein Maß für die lineare Abhängigkeit. Bei linearer Unabhängigkeit gilt ρ = 0. Faltung von X1, X2 : Verteilung der Summe Z = X1 + X2 Dichte der Faltung bei zusätzlicher Voraussetzung der Unabhängigkeit von X1, X2 f Z ( z ) = f X 1∗ X 2 ( z ) = +∞ f X1 ( x ) f X 2 ( z − x)dx −∞ SS 2017 Prof. Dr. J. Schütze, FB GW Stet. Vert. 44