Die Gaußsche Normalverteilung spielt eine wichtige Rolle in der Wahrscheinlichkeitsrechnung und Statistik. Die Verteilung von vielen stetigen Zufallsvariablen in der Technik und den Naturwissenschaften wie z.B. physikalisch technische Messgrößen können durch die Dichtefunktion der Normalverteilung beschrieben werden. Bei vielen Messwerten, die von vielen Einzeleinflüssen beeinflusst werden, häufen sich die Werte in der Nähe des Mittelwerts (Sollwert). Die Dichtekurve die Form einer Glockenkurve besitzt. Aus der Serienproduktion zur Herstellung von Autobatterien wurde eine Stichprobe vom Umfang N = 40 entnommen. Die Messungen der Lebensdauer X (in Jahren) der Batterien ergab die folgende Tabelle für die Häufigkeitsverteilung: j Kj 1 2 3 4 5 6 7 [ 1,5 [ 2,0 [ 2,5 [ 3,0 [ 3,5 [ 4,0 [ 4,5 dj ; ; ; ; ; ; ; 2,0 ) 2,5 ) 3,0 ) 3,5 ) 4,0 ) 4,5 ) 5,0 ) mj 0,5 0,5 0,5 0,5 0,5 0,5 0,5 hj 1,75 2,25 2,75 3,25 3,75 4,25 4,75 fj 2 1 4 15 10 5 3 f 0,05 0,025 0,1 0,375 0,25 0,125 0,075 Fj j 0,1 0,05 0,2 0,75 0,5 0,25 0,15 0,05 0.075 0,175 0,55 0,8 0,925 1 In der Abbildung sind das Dichtehistogramm sowie die Kurve der Dichtefunktion, die an den Messdaten angepasst wurde, dargestellt. 0,75 0,50 0,25 0 1,75 2,25 2,75 3,25 3,75 4,25 4,75 x 3,5 4,5 [Jahre] Die approximierte Dichtefunktion lautet: f (x) = 1 2 π ⋅ 0 , 53 exp 2 − 1 x − 3 , 37 2 0 , 53 2 11 Wie groß ist die Wahrscheinlichkeit, dass eine zufällig aus der Produktion entnommene Batterie eine Lebensdauer zwischen 3,5 bis 4,5 Jahre hat? Der Flächeninhalt des 5. und 6. Rechteckes: 0,5 ⋅ 0,5 + 0,5 ⋅ 0,25 = 0,375 Der Inhalt der Fläche unterhalb des Graphen der an dem Histogramm approximierten Dichtefunktion zwischen den Grenzen 2 und 4: 1 P ( 3 ,5 ≤ X ≤ 4,5 ) = ⋅ 2 π ⋅ 0 , 53 4,5 3,5 − e 1 x − 3 , 37 2 0 , 53 2 dx = 0 , 386 Der Wert dieses Integral muss numerisch berechnet werden. ! Gaußsche Normal-Verteilung Die Verteilung einer stetigen Zufallsvariable X mit der Dichtefunktion: 1 f (x) = exp 2π σ − 2 1 x − µ 2 σ 2 heißt Gaußsche Normalverteilung. Dabei sind die Parameter der Erwartungswert und X kann die Werte : – ∞ < x < ∞ annehmen. ² die Varianz dieser Verteilung. Die Verteilungsfunktion der Gaußschen Normalverteilung ist: x F 1 ( x ) = P( X ≤ x ) = exp 2π σ − ∞ " − u − µ 2 σ 2 du # $ µ=0 σ =1 f(x) µ=0 σ =2 µ=2 σ =1 µ=–2 σ =2 –4 2 1 –2 0 2 4 x 12 Eigenschaften der Normalverteilung Die Kurve der Dichtefunktion der Normalverteilung ist symmetrisch bzgl. der Gerade x= Für eine normalverteilte Zufallsvariable liegen ca. 68,2% ca. 95% ca. 99.7% der beobachteten Werte zwischen der beobachteten Werte zwischen der beobachteten Werte zwischen σ σ % # σ µ und und und σ + +2 +3 σ & (# )* σ – – 2 – 3 ## ' # ' (# # ! Möchte man für eine stetige Zufallsvariable, deren Verteilung durch die Normalverteilung gegeben ist, die Wahrscheinlichkeit für alle Werte „kleiner als einen bestimmten Wert x0 bestimmen, so berechnet man definitionsgemäß folgendes Integral xo F (xo ) = P ( X ≤ xo ) f ( x ) dx = = − ∞ xo 1 2π σ exp 2 − ∞ − 1 x − µ 2 σ 2 dx Leider kann F (x ) , d.h. die Stammfunktion der Dichtefunktion f (x ) der Normalverteilung nicht analytisch mit Hilfe von Integraltechniken bestimmt werden. Der Wert des Integrals muss numerisch berechnet werden. 13 * Die Lebensdauer X (in Jahren) der Batterien einer Serienproduktion sei eine normalverteilte Zufallsgröße mit der Dichtefunktion: (s. Bsp. 3) f (x − 1 )= e 1 x − 3 , 37 2 0 , 53 f(x ) 2 P(X 3,5 ) 2 π ⋅ 0 , 53 2 3 3,5 4 5 x Wie groß ist die Wahrscheinlichkeit, dass eine zufällig aus der Produktion entnommene Batterie eine Lebensdauer weniger als 3,5 Jahre hat? 1 F ( 3 ,5 ) = P ( X ≤ 3 ,5 ) = 2 π ⋅ 0 , 53 ))* & # $ " 3,5 − e ⋅ 1 x − 3 , 37 2 0 , 53 2 dx = 0 , 596 − ∞ # Da die Stammfunktion F (x ) der Dichtefunktion f (x ) der Normalverteilung nicht bestimmt werden kann, muss der Wert für F (x0 ) für einen beliebigen x0 numerisch berechnet werden. Man kann also numerische berechnete Werte-Tabellen erstellen, die für verschiedene xWerte sowie - und -Werten die dazugehörigen F (x ) enthalten. Leider werden solche Tabellen sehr groß und unübersichtlich. Geht man aber von einer beliebigen normalverteilten Zufallsvariable X durch die lineare Transformation (Substitution) zu der standardisierten Variable: Z = X − µ σ über, so genügt die Zufallsvariable Z auch einer Normalverteilung mit = 0 und =1 Somit lassen sich alle Normalverteilungen durch die Standardisierung auf eine einzige Verteilung zurückführen. 14 Standard-Normalverteilung Die Verteilung einer stetigen Zufallsvariable Z mit der Dichtefunktion: ϕ(z ) = 1 exp 2π − 1 2 z 2 heißt Standardnormalverteilung. Dabei sind die Parameter = 0 und ² = 1. Ihre Verteilungsfunktion lautet: z Φ( z ) = P(Z ≤ z ) = − ∞ 1 2π exp − 1 v 2 2 dv Im Anhang befindet sich eine Tabelle mit den Werten der Verteilungsfunktion Φ ( z ) der Standard-Normalverteilung für beliebige z ≥ 0. Mit Hilfe der Standard-Normalverteilung kann die Wahrscheinlichkeit F (x0 ) = P ( X bestimmt werden. x0 ) Φ ( z) P(Z z0 ) = Φ ( z0 ) z (z) P(Z z0 ) z z0 15 Beziehung zur Bestimmung der Wahrscheinlichkeit F (x0 ) = P ( X x0 ) einer beliebigen normalverteilten Zufallsvariable X mit Hilfe der Standard-Normalverteilung F (xo ) = P (X ≤ xo ) xo 1 = exp 2π σ exp 2π − − ∞ zo 1 = 2 − − ∞ 1 z 2 1 x − µ 2 σ 2 dx dz = P ( Z ≤ z o )= Φ(zo ) (z) F ( x0 ) f(x) 2 Φ ( z0 ) = 0 µ xo 1 2π σ z = x0 exp 2 x − µ σ −∞ − x 1 x − µ 2 σ dz = 1 σ 2 dx 1 dx z z0 0 2π zo exp −∞ − 1 2 z 2 dz 16 (* Bestimmen Sie mit Hilfe der Tabelle für die Werte der Verteilungsfunktion der StandardNormalverteilung die Wahrscheinlichkeit aus dem vorigen Beispiel dafür, dass eine zufällig aus der Produktion entnommene Batterie eine Lebensdauer weniger als 3,5 Jahre hat? Die Gaußsche Normal-Verteilung lautete: f (x 1 )= − e 1 x − 3 , 37 2 0 , 53 2 mit = 3,37 und = 0,53 . 2 π ⋅ 0 , 53 Es soll die Wahrscheinlichkeit für alle x-Werte kleiner als die obere Grenze x0 = 3,5 berechnet werden. Die Substitution liefert folgende obere Grenze für die Zufallsvariable Z: Z = X − µ zo σ = xo − µ σ = 3 , 5 − 3 , 37 = 0 , 245 0 , 53 Somit erhält man für die gesuchte Wahrscheinlichkeit: (z) f(x ) P(X 1 (z)= 3,5 ) 2 X – 3 3,5 4 P(X 3,5 ) 5 0 z0 = 0,245 x = = 2 Φ ( 0,245 ) Z = 2 z² exp P(Z z 0,245 ) Φ ( 0,245 ) ≈ 0,5967 Da in der Tabelle der Wert z 0 = 0,245 nicht eingetragen ist, wird die Wahrscheinlichkeit Φ ( 0,245 ) näherungsweise als das arithmetische Mittel der Wahrscheinlichkeiten Φ ( z ) für die beiden benachbarten z-Werten angegeben. Φ ( 0,245 ) = ½ [ Φ ( 0,24 ) + Φ ( 0,25 ) ] = ½ [ 0,5948 + 0,5987 ] = 0,5967 Liegt ein z 0-Wert mit mehr als 2 Nachkommastellen vor, so kann Φ ( z 0) aus der Tabelle der Standard-Normal-Verteilung genauer durch lineare Interpolation bestimmt werden. + " ( , 17 Geben Sie mit Hilfe der Tabelle für die Werte der Verteilungsfunktion der StandardNormalverteilung die Wahrscheinlichkeit aus dem vorigen Beispiel dafür an, dass eine zufällig aus der Produktion entnommene Batterie eine Lebensdauer weniger als 4,5 Jahre hat? P( X 4,5 ) = P( z 2,132 ) = Φ (2,132) = 0,9834 * Bestimmen Sie mit Hilfe der Werte für die Verteilungsfunktion der Standard-Normalverteilung die Wahrscheinlichkeit aus dem vorigen Beispiel dafür, dass eine zufällig aus der Produktion entnommene Batterie eine Lebensdauer zwischen 3,5 und 4,5 Jahre hat? P( 3,5 X 4,5 ) = P( 0,245 2,132 ) = Φ (2,132) – Φ ( 0,245 ) z = f(x) P ( 3,5 0,9834 – 0,5967 = 0,3867 4,5 ) X 0.7 0.6 0.5 0.4 0.3 0.2 0.1 = 2 3 3,5 4 4,5 5 f(x) P(X 6x f(x) 4,5 ) 0.7 0.6 0.5 0.4 0.3 0.2 0.1 – 2 3 4 4,5 5 6x P(X 3,5 ) 0.7 0.6 0.5 0.4 0.3 0.2 0.1 2 3 3,5 4 5 x 18 Formel zur Bestimmung der Wahrscheinlichkeiten einer normalverteilten Zufallsvariable X zwischen zwei x-Werten a und b : Aus der Beziehung P (a ≤ X ≤ b folgt: a 1 )= e 2π σ 1 = 2π − 2 1 x − µ 2 σ 2 dx = F ( b ) − F ( a ) b z2 e − 1 2 z 2 z2 1 dz = e 2π z1 = Φ(z2 − 1 2 z 2 dz − 2π − ∞ ) 1 − Φ ( z1 ) z1 e − 1 2 z 2 dz − ∞ = P ( z1 ≤ Z ≤ z 2 ) f ( x) ( z) Φ ( z2 ) – Φ ( z1 ) F ( b) – F ( a ) σ a µ b x z1 0 z2 z Formel zur Bestimmung der Wahrscheinlichkeiten mit der Standardnormalverteilung für negative Wert von z : Da die Dichtefunktion der Standardnormalverteilung symmetrisch zu 0 ist, gilt: Φ (– z ) = 1 – Φ (z ) , Der Durchmesse X von seriengefertigten Kugeln sei eine normalverteilte Zufallsgröße. Die Messung des Durchmessers von mehreren hergestellten Kugeln ergab eine Normalverteilung mit = 50 [mm] und = 10 [mm]. Geben Sie an, welcher Anteil der hergestellten Kugeln einen Durchmesser zwischen 45 [mm] und 62 [mm] hat. 19 Die Normalverteilung lautet: f (x ) = 1 exp 2 π 10 2 − x − 50 10 1 2 2 Der Anteil der Kugel mit einem Durchmesser zwischen a = 45 [mm] und b = 62 [mm] muss berechnet werden. Dafür soll die Wahrscheinlichkeit für alle x-Werte zwischen den Grenzen x1 = 45 und x2 = 62 berechnet werden. 1. Lösungsweg: P ( 45 ≤ X ≤ 62 ) 62 1 = 2 2 π 10 e − 1 2 x − 50 10 2 dx = F ( 62 ) − F ( 45 ) 45 Dieses Integral können wir numerisch mit Hilfe des Taschenrechners ausrechnen, oder wir verwenden die Standard-Normal-Verteilung. 2. Lösungsweg: Die Substitution liefert folgende Grenzen für die Zufallsvariable Z: Z = X − µ σ z 1 z 2 = = 45 − 50 10 62 − 50 10 = − 0,5 = 1, 2 Somit erhält man für die gesuchte Wahrscheinlichkeit: (z) 1 (z)= exp 2 z² 2 F (62) – F(45) f(x) Z = σ 4 0 6 a = 45 Φ (1,2) – Φ (– 0,5) X – µ σ 0 µ b = 62 x z1 = – 0,5 P ( 45 X 62 ) 0 z2 = 1,2 = P ( – 0,5 = Φ ( 1,2 ) – Φ ( – 0,5 ) = 0,8849 Z – z 1,2 ) 0,3085 = 0,5764 20 - # Das q-Quantil z q mit 0 < q < 1 teilt die Fläche unter dem Graphen der Standard-NormalVerteilung ϕ ( z ) in 2 Teilflächen, so dass links von ihm der Inhalt der einen Teilfläche q und rechts von ihm der Inhalt der anderen Teilfläche 1 – q beträgt. (z) P(Z zq ) = q Φ ( zq ) = q q zq z 0 Quantilen / Perzentilen der Normal-Verteilung Das q-Quantil z q der Sandard-Normal-Verteilung mit 0 < q < 1 ist die Zahl auf der z-Achse , für die gilt: Φ(zq) = q Das q-Quantil x q der Gaußschen Normal-Verteilung mit 0 < q < 1 ist die Zahl auf der x-Achse , für die gilt: F(xq) = q Dieses lässt sich dann mit Hilfe von z q wie folgt berechnen: zq = xq − µ σ ⇔ xq = σ ·zq + µ + " ( . Bestimmen Sie das 0,025-Quantil (2,5%-Quantil) für die Verteilung der Lebensdauer der Batterien aus Bsp. 3. 21