Die Gaußsche Normalverteilung spielt eine wichtige Rolle in der Wahrscheinlichkeitsrechnung und Statistik. Die Verteilung von vielen stetigen Zufallsvariablen in der Technik und den Naturwissenschaften wie z.B. physikalisch technische Messgrößen können durch die Dichtefunktion der Normalverteilung beschrieben werden. Bei vielen Messwerten, die von vielen Einzeleinflüssen beeinflusst werden, häufen sich die Werte in der Nähe des Mittelwerts (Sollwert). Die Dichtekurve die Form einer Glockenkurve besitzt. Beispiel 1 Aus der Serienproduktion zur Herstellung von Autobatterien wurde eine Stichprobe vom Umfang N = 40 entnommen. Die Messungen der Lebensdauer T (in Jahren) der Batterien ergab die folgende Tabelle für die Häufigkeitsverteilung: j Kj 1 2 3 4 5 6 7 [ 1,5 [ 2,0 [ 2,5 [ 3,0 [ 3,5 [ 4,0 [ 4,5 dj ; ; ; ; ; ; ; 2,0 ) 2,5 ) 3,0 ) 3,5 ) 4,0 ) 4,5 ) 5,0 ) mj 0,5 0,5 0,5 0,5 0,5 0,5 0,5 hj 1,75 2,25 2,75 3,25 3,75 4,25 4,75 fj 2 1 4 15 10 5 3 f*j 0,05 0,025 0,1 0,375 0,25 0,125 0,075 Fj 0,1 0,05 0,2 0,75 0,5 0,25 0,15 0,05 0.075 0,175 0,55 0,8 0,925 1 In der Abbildung sind das Histogramm der Klassendichten der relativen Häufigkeiten sowie die Kurve der Dichtefunktion, die an den Messdaten angepasst wurde, dargestellt. Histogramm der Klassendichten der Relativen Häufigkeiten 0,75 Dichtefunktion 0,50 0,25 0 1,75 2,25 2,75 3,25 3,75 3,5 4,25 4,75 4,5 t [Jahre] Die approximierte Dichtefunktion lautet: f (t ) = 1 2 π ⋅ 0 , 53 2 exp − 1 t − 3 , 37 2 0 , 53 2 Frage Wie groß ist die Wahrscheinlichkeit, dass eine zufällig aus der Produktion entnommene Batterie eine Lebensdauer zwischen 3,5 bis 4,5 Jahre hat? 1 Lösung Der Flächeninhalt des 5. und 6. Rechteckes: 0,5 ⋅ 0,5 + 0,5 ⋅ 0,25 = 0,375 Der Inhalt der Fläche unterhalb des Graphen der an dem Histogramm approximierten Dichtefunktion zwischen den Grenzen 2 und 4: 1 P ( 3 ,5 ≤ T ≤ 4 ,5 ) = 2 π ⋅ 0 , 53 ⋅ 4,5 3,5 − e 1 t − 3 , 37 2 0 , 53 2 dt = 0 , 386 Bemerkung Der Wert dieses Integral muss numerisch berechnet werden. Gaußsche Normal-Verteilung Die Verteilung einer stetigen Zufallsvariable X mit der Dichtefunktion: 1 f (x) = 2π σ 2 exp − 1 x − µ 2 σ 2 heißt Gaußsche Normalverteilung. Dabei sind die Parameter der Erwartungswert und X kann die Werte : – ∞ < x < ∞ annehmen. ² die Varianz dieser Verteilung. Die Verteilungsfunktion der Gaußschen Normalverteilung lautet: F x 1 − ∞ 2π σ ( x ) = P( X ≤ x ) = exp 2 − 1 u − µ 2 σ 2 du Eigenschaften der Kurve der Gaußschen Normalverteilung Die Kurve ist symmetrisch bzgl. der Gerade x = Die Wendestellen der Kurve liegen bei x = ± σ Gra ph für ei nig e Normal -Verteil un ge n 0 .4 0 .3 = 0 , ²= 1 0 .2 = – 2 , ²= 4 = 1 , ²= 3 0 .1 x -1 0 -5 5 10 2 ! Möchte man für eine stetige Zufallsvariable, deren Verteilung durch die Normalverteilung gegeben ist, die Wahrscheinlichkeit für alle Werte „kleiner als einen bestimmten Wert x0 bestimmen, so berechnet man definitionsgemäß folgendes Integral xo F (xo ) = P ( X ≤ xo ) f ( x ) dx = = xo 1 2π σ − ∞ 2 exp − − ∞ 1 x − µ 2 σ 2 dx Leider kann F (x ) , d.h. die Stammfunktion der Dichtefunktion f (x ) der Normalverteilung nicht analytisch mit Hilfe von Integraltechniken bestimmt werden. Der Wert des Integrals muss numerisch berechnet werden. Beispiel 1a Die Lebensdauer T (in Jahren) der Batterien einer Serienproduktion sei eine normalverteilte Zufallsgröße mit der Dichtefunktion: (s. Bsp. 1) f (t )= 1 2 π ⋅ 0 , 53 − e 1 t − 3 , 37 2 0 , 53 f(t) 2 P(T 3,5 ) 0.7 0.6 0.5 0.4 0.3 0.2 0.1 3 3,5 2 4 5 t Wie groß ist die Wahrscheinlichkeit, dass eine zufällig aus der Produktion entnommene Batterie eine Lebensdauer weniger als 3,5 Jahre hat? Lösung F ( 3 ,5 ) = P ( T ≤ 3 ,5 ) = 1 2 π ⋅ 0 , 53 3,5 − e ⋅ 1 t − 3 , 37 2 0 , 53 2 dt = 0 , 596 − ∞ 3 ! " # Da die Stammfunktion F (x ) der Dichtefunktion f (x ) der Normalverteilung nicht bestimmt werden kann, muss der Wert für F (x0 ) für einen beliebigen x0 numerisch berechnet werden. Man kann also numerische berechnete Werte-Tabellen erstellen, die für verschiedene x-Werte sowie - und -Werten die dazugehörigen F (x ) enthalten. Leider werden solche Tabellen sehr groß und unübersichtlich. Geht man aber von einer beliebigen normalverteilten Zufallsvariable X durch die lineare Transformation (Substitution) zu der standardisierten Variable: X − µ Z = σ über, so genügt die Zufallsvariable Z auch einer Normalverteilung mit = 0 und = 1 Somit lassen sich alle Normalverteilungen durch die Standardisierung auf eine einzige Verteilung zurückführen. Standard-Normalverteilung Die Verteilung einer stetigen Zufallsvariable Z mit der Dichtefunktion: ϕ(z ) = 1 2π exp − 1 2 z 2 heißt Standardnormalverteilung. Dabei sind die Parameter = 0 und ² = 1. Ihre Verteilungsfunktion lautet: z Φ( z ) = P(Z ≤ z ) = − ∞ 1 2π exp − 1 v 2 2 dv Bemerkung Im Anhang befindet sich eine Tabelle mit den Werten der Verteilungsfunktion Φ ( z ) der Standard-Normalverteilung für beliebige z ≥ 0. Mit Hilfe der Standard-Normalverteilung kann die Wahrscheinlichkeit F (x0 ) = P ( X bestimmt werden. x0 ) 4 Beziehung zur Bestimmung der Wahrscheinlichkeiten F (x0 ) = P ( X x0 ) einer beliebigen normalverteilten Zufallsvariable X mit Hilfe der Standard-Normalverteilung F (xo ) = P (X ≤ xo ) xo 1 = 2π σ exp exp 2π − − ∞ zo 1 = 2 − − ∞ 1 z 2 1 x − µ 2 σ 2 dx dz = P ( Z ≤ z o )= Φ(zo ) (z) F ( x0 ) f(x) 2 Φ ( z0 ) = 0 µ xo 1 2π σ z = x0 2 x − µ σ exp −∞ − x 1 x − µ 2 σ dz = 1 σ z 2 dx 1 dx z0 0 2π zo exp − ∞ − 1 2 z 2 dz 5 Beispiel 1b Bestimmen Sie mit Hilfe der Tabelle für die Werte der Verteilungsfunktion der StandardNormalverteilung die Wahrscheinlichkeit aus dem vorigen Beispiel dafür, dass eine zufällig aus der Produktion entnommene Batterie eine Lebensdauer weniger als 3,5 Jahre hat? Lösung Die Gaußsche Normal-Verteilung lautete: f (t 1 )= − 2 π ⋅ 0 , 53 e 1 t − 3 , 37 2 0 , 53 2 mit = 3,37 und = 0,53 . Es soll die Wahrscheinlichkeit für alle t-Werte kleiner als die obere Grenze t0 = 3,5 berechnet werden. Die Substitution liefert folgende obere Grenze für die Zufallsvariable Z: Z = T − µ zo σ = to − µ = σ 3 , 5 − 3 , 37 0 , 53 = 0 , 245 Somit erhält man für die gesuchte Wahrscheinlichkeit: (z) f(t) 0.7 0.6 0.5 0.4 0.3 0.2 0.1 1 (z)= 2 F (3,5 ) Z = 2 3 µ 4 5 P(T 3,5 ) = = 0 z0 = 0,245 P(Z z² 2 Φ ( 0,245 ) X – t t0 = 3,5 exp z 0,245 ) Φ ( 0,245 ) ≈ 0,5967 Bemerkung Da in der Tabelle der Wert z 0 = 0,245 nicht eingetragen ist, wird die Wahrscheinlichkeit Φ ( 0,245 ) näherungsweise als das arithmetische Mittel der Wahrscheinlichkeiten Φ ( z ) für die beiden benachbarten z-Werten angegeben. Φ ( 0,245 ) = ½ [ Φ ( 0,24 ) + Φ ( 0,25 ) ] = ½ [ 0,5948 + 0,5987 ] = 0,5967 6 Aufgabe 1 Geben Sie mit Hilfe der Tabelle für die Werte der Verteilungsfunktion der StandardNormalverteilung die Wahrscheinlichkeit aus dem vorigen Beispiel dafür an, dass eine zufällig aus der Produktion entnommene Batterie eine Lebensdauer weniger als 4,5 Jahre hat? 4,5 ) = P( z P( T 2,132 ) = Φ (2,132) = 0,9834 Beispiel 1c Bestimmen Sie mit Hilfe der Werte für die Verteilungsfunktion der Standard-Normalverteilung die Wahrscheinlichkeit aus dem vorigen Beispiel dafür, dass eine zufällig aus der Produktion entnommene Batterie eine Lebensdauer zwischen 3,5 und 4,5 Jahre hat? Lösung P( 3,5 T 4,5 ) = P( 0,245 z 2,132 ) = Φ (2,132) – Φ ( 0,245 ) = f(t) P ( 3,5 0,9834 – 0,5967 = 0,3867 4,5 ) T 0.7 0.6 0.5 0.4 0.3 0.2 0.1 = 3 3,5 4 4,5 5 2 f(t) P(T 6t 0.7 0.6 0.5 0.4 0.3 0.2 0.1 – 2 3 4 4,5 5 6t P(T f(t) 4,5 ) 3,5 ) 0.7 0.6 0.5 0.4 0.3 0.2 0.1 2 3 3,5 4 5 t 7 Formel zur Bestimmung der Wahrscheinlichkeiten einer normalverteilten Zufallsvariable zwischen zwei x-Werten a und b : Aus der Beziehung P (a ≤ X ≤ b folgt: a 1 )= 2π σ = e 2 e 2π 1 x − µ 2 σ 2 dx = F ( b ) − F ( a ) b z2 1 − − 1 2 z 2 dz = z1 = z2 1 e 2π Φ (z2 − 1 2 z 2 1 dz − 2π − ∞ ) − Φ ( z1 ) z1 e − 1 2 z 2 dz − ∞ = P ( z1 ≤ Z ≤ z 2 ) f ( x) ( z) ( z2 ) – ( – z1 ) F ( b) – F ( a ) 0 a b x – z1 0 z2 z Formel zur Bestimmung der Wahrscheinlichkeiten mit der Standardnormalverteilung für negative Wert von z : Da die Dichtefunktion der Standardnormalverteilung symmetrisch zu 0 ist, gilt für alle – z < 0: Φ (– z ) = 1 – Φ (z ) 8 Beispiel 2 Der Durchmesse X von seriengefertigten Kugeln sei eine normalverteilte Zufallsgröße. Die Messung des Durchmessers von mehreren hergestellten Kugeln ergab eine Normalverteilung = 10 [mm]. Geben Sie an, welcher Anteil der hergestellten Kugeln mit = 50 [mm] und einen Durchmesser zwischen 45 [mm] und 62 [mm] hat. Lösung: Die Normalverteilung lautet: f (x ) = 1 exp 2 π 10 2 2 x − 50 10 1 − 2 Der Anteil der Kugel mit einem Durchmesser zwischen a = 45 [mm] und b = 62 [mm] muss berechnet werden. Dafür soll die Wahrscheinlichkeit für alle x-Werte zwischen den Grenzen x1 = 45 und x2 = 62 berechnet werden. P ( 45 ≤ X ≤ 62 ) = 62 1 2 π 10 2 e − 1 2 x − 50 10 2 dx = F ( 62 ) − F ( 45 ) 45 Dieses Integral können wir numerisch mit Hilfe des Taschenrechners ausrechnen, oder wir verwenden die Standard-Normal-Verteilung. Die Substitution liefert folgende Grenzen für die Zufallsvariable Z: 45 − 50 −z1 = = − 0,5 X − µ 10 Z = 62 − 50 σ z2 = = 1, 2 10 Somit erhält man für die gesuchte Wahrscheinlichkeit: (z) 1 (z)= 2 exp z² 2 F (62) – F(45) f(x) Z = Φ (1,2) – Φ(– 0,5) X – σ 4 0 a = 45 6 µ 0 b = 62 P ( 45 X 62 ) x – z1 = – 0,5 0 z2 = 1,2 z = P ( – 0,5 = Φ ( 1,2 ) – Φ ( – 0,5 ) = Φ ( 1,2 ) – [ 1 – Φ ( 0,5 ) ] = 0,5764 Z 1,2 ) 9 $% & # Satz) Linearitätssatz der Normalverteilung Sei X eine normalverteilte Zufallsvariable mit dem Erwartungswert µ X und der Varianz σ ² X sowie der Dichtefunktion: 1 f (x) = 2π σ 2 x exp − 1 x − µx 2 σx 2 Und seien a und b beliebige reelle Zahlen. Dann ist die Zufallsvariable W = a X + b ebenfalls normalverteilt mit der Dichtefunktion f (w )= 1 2π σ w2 exp wobei der Erwartungswert µ W − 1 w − µw 2 σw 2 , = a · µ X + b und die Varianz σ ² W = a ·σ ² X sind. Satz) Additionssatz der Normalverteilung Seien X und Y unabhängige normalverteilte Zufallsvariablen mit den Erwartungswerten µ X bzw. µ Y sowie den Varianzen σ ² X bzw. σ ² Y und den Dichtefunktionen: f (x ) = fX 1 (x) = 2π σ 2 x exp − 2 1 x − µx 2 σx bzw. f (y ) = fY ( y ) = 1 2π σ exp 2 y − 1 y − µy 2 2 σy Dann ist die Summe der beiden Zufallsvariablen W = X + Y ebenfalls normalverteilt mit der Dichtefunktion f (w )= 1 2π σ w2 exp − 1 w − µw 2 σw 2 , wobei der Erwartungswert µ w = µ X + µ Y und die Varianz σ ² W = σ ² X + σ ² Y sind. 10 σ σ µ µ · σ σ σ W=X+Y µ µ µ µ µ 11 ' () *" Die Exponentialverteilung spielt eine wichtige Rolle in der Warteschlangentheorie (queuing theory) und Zuverlässigkeit von Systemen (reliability problems). Die Verteilung der Lebensdauer z.B. von Bauteilen kann durch die Dichtefunktion der Exponentialverteilung beschrieben werden. Beispiel 3 Die Lebensdauern in (Jahren) von 40 baugleichen elektronischen Dioden einer Serienproduktion wurden gemessen. Aus den Ergebnissen der Messungen wurde die folgende klassierte Häufigkeitstabelle erstellt. Klasse Kj [0 ; 2) [2 ; 4) [4 ; 6) [6 ; 8) [8 ; 10) j 1 2 3 4 5 KlassenBreite: d j 2–0=2 2 2 2 2 KlassenMitte: m j ½ (0+2) = 1 3 5 7 9 Abs. Häuf. h j 16 10 8 4 2 Rel. Häuf. fj 16 / 40 = 0,4 0,25 0,2 0,1 0,05 Klassen.Dichte: f*j 0,4 / 2 = 0,2 0,125 0,1 0,05 0,025 Kumulierte Häufig. F j 0,4 0,65 0,85 0,95 1 In der Abbildung sind das Histogramm der Klassendichten der relativen Häufigkeiten sowie die Kurve der Dichtefunktion, die an den Messdaten angepasst wurde, dargestellt. f * j 0.3 f(t) Die approximierte Dichtefunktion lautet: 0.25 Häufigkeiten 0.2 f (t 0.15 )= 0 0 ,3 e für − 0 ,3t für t ≤ 0 t > 0 0.1 0.05 t 0 2 4 6 8 10 12 Frage Wie groß ist die Wahrscheinlichkeit, dass eine Diode eine Lebensdauer zwischen 2 bis 4 Jahren besitzt? Lösung Der Flächeninhalt des 2. Rechteckes: 2 ⋅ 0,125 = 0,25 Der Inhalt der Fläche unterhalb des Graphen der an dem Histogramm approximierten Dichtefunktion zwischen den Grenzen 2 und 4: P (2 ≤ T ≤ 4) = 4 2 0,3 e − 0 ,3t = 0 , 247 12 Exponential-Verteilung Die Verteilung einer stetigen Zufallsvariable X mit der Dichtefunktion: f (x 0 )= x ≤ 0 für α e − αx x > 0 für , α >0 mit heißt Exponetialverteilung. Die Verteilungsfunktion der Exponentialverteilung lautet: 0 x F (x ) = P(X ≤ x ) = f ( u ) du 1− e für x > 0 Verteilungsfunktion der Exponential-Verteilung 1 F ( x0 ) 0.12 0.1 − αx F(x) Dichtefunktion der Exponential-Verteilung 0.14 x ≤ 0 = − ∞ f(x) für F ( x0 ) = P ( X x0 ) 0.08 0.06 0.04 0.02 x 0 5 x100 15 x 0 20 x0 Satz: Erwartungswert und Varianz der Exponential-Verteilung Der Erwartungswert der Exponential-Verteilung ist: ∞ x ⋅ f ( x ) dx = µ = − ∞ 1 α Die Varianz der Exponential-Verteilung ist: ∞ σ 2 2 f ( x ) ⋅ ( x − µ ) dx = = − ∞ 1 2 α 13 Aufgabe 2 Die Wahrscheinlichkeitsverteilung der Lebensdauer T aus Beispiel 3 wurde durch die folgende Dichtefunktion gegeben: f (t )= 0 0 ,3 e t ≤ 0 für − 0 ,3t für t > 0 a) Berechnen Sie mit Hilfe der Verteilungsfunktion die Wahrscheinlichkeit dafür, dass die Lebensdauer einer Diode zwischen 2 bis 4 Jahren beträgt. b) Geben Sie die durchschnittliche Lebensdauer an. c) Geben Sie die Varianz (bzw. die Standardabweichung) der Verteilung der Lebensdauer an. + *" Die Zuverlässigkeit (Reliability) wird meist mit der Überlebenswahrscheinlichkeit (Lebensdauerwahrscheinlichkeit) bezeichnet. Das Gegenteil dazu ist die Ausfallwahrscheinlichkeit. Der Zusammenhang zwischen der Ausfallrate und der Lebensdauer lässt sich mit Hilfe der Weibull-Verteilung darstellen. Die Weibull-Verteilung kann als eine Verallgemeinerung der Exponential-Verteilung angesehen werden. Die Exponentialverteilung bietet sich als Verteilung von Lebensdauern an, wenn die Ausfallrate als konstant angesehen wird. Ändert sich dagegen die Ausfallsrate mit der Zeit, so wird die Verteilung durch die WeibullVerteilung gegeben. Weibull-Verteilung Die Verteilung einer stetigen Zufallsvariable X mit der Dichtefunktion: f (x) = 0 α ⋅ β ⋅ x β −1 e − α⋅x β für x ≤ 0 für x > 0 , mit α > 0 und β > 0 heißt Weibull-Verteilung. Die Verteilungsfunktion der Weibull-Verteilung lautet: 0 x F (x) = P(X ≤ x ) = f ( u ) du − ∞ für x ≤ 0 = 1− e − α⋅x β für x > 0 14 Bemerkung: Für β = 1 ergibt sich aus der Weibull-Verteilung die Exponential-Verteilung. f(x) Dichtefunktionen verschiedener Weibull-Verteilungen β α β α β α x β α 0 Satz: Erwartungswert und Varianz der Weibull-Verteilung Der Erwartungswert der Weibull-Verteilung ist: ∞ x ⋅ f ( x ) dx = α µ = − 1 β β +1 ⋅Γ β − ∞ Die Varianz der Weibull-Verteilung ist: ∞ σ 2 2 f ( x ) ⋅ ( x − µ ) dx = α = − 2 β ⋅ Γ − ∞ β +2 β − Γ2 β +1 β Bemerkung: Γ ( α ) gibt die Gamma-Funktion an. Gamma-Funktion Die Funktion Γ ( α ) wird als die Gamma-Funktion bezeichnet. Einige Werte der Gammafunktion können mit Hilfe von Rekursionsformeln berechnet werden. Einige spezielle Werte und Rekursionsformeln der Gammafunktion sind wie folgt: Γ ( )= 1 2 Γ(1 ) = 1 π Γ(α + 1) = α⋅Γ(α) mit α > 0 Γ(n + 1) = n! mit n = 1 ; 2 ; 3 ; . . . ( Γ n + 1 2 )= 1⋅ 3 ⋅ 5 ( 2 n − 1) 2n ⋅ π mit n = 1 ; 2 ; 3 ; . . . 15 Beispiel 4 Die Lebensdauer T (in Stunden) eines bestimmten mechanischen Bauteil sei eine Zufallsgröße, die durch eine Weibull-Verteilung mit α = 0,1 und β = 0,5 beschrieben wird. Berechnen Sie a) die mittlere Lebensdauer des Bauteils. b) die Wahrscheinlichkeit, dass die Lebensdauer des Bauteils mehr als 30 Stunden ist. Lösung: a) µ = 0 , 1 − 1 0,5 ⋅Γ 0,5 + 1 0,5 = 0 , 1 − 2 ⋅ Γ ( 3 ) = 100 ⋅ 2 ! = 200 [ h ] b) 30 P ( T > 30 ) = 1 − P ( T ≤ 30 ) = 1 − = 1− { 0 − ∞ 0 ⋅ dt + 0 + = 1 − 0 + 1 – = − ∞ = 1 − = f ( t ) dt { 0,421 } 30 0 0 ,1 ⋅ 0 , 5 ⋅ t 0 , 5 − 1 e − 1 − e 1 − e − 0 , 1⋅ t 0 , 5 0 , 1⋅ t 0 , 5 dt } 30 0 − 0 , 1 ⋅ 30 0 , 5 − 1 − e − 0 , 1⋅ 0 0 , 5 = 0,578 Aufgabe 3 Leiten Sie aus der Verteilungsfunktion der Weibull-Verteilung F(x) = 1 − e − α ⋅x β für x > 0 die Dichtefunktion dieser Verteilung her. 16