Spezielle stetige Verteilungen Rechteckverteilung oder stetige Gleichverteilung Exponentialverteilung Normalverteilung Approximationen Chi-Quadrat-Verteilung Studentverteilung Fisherverteilung Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 1 Bibliografie Bleymüller / Gehlert / Gülicher Verlag Vahlen Statistik für Wirtschaftswissenschaftler Bleymüller / Gehlert Verlag Vahlen Statistische Formeln, Tabellen und Programme PowerPointPräsentationen (Prof. Mohr/ Dr. Ricabal) Vorlesungsskript für Statistik I (Dr. Pu Chen) Vorlesungsskript für Statistik II (Prof. Mohr, Private Hanseuniversität Rostock) http://www.wiwi.uni-rostock.de/vwl/statistik/download/ba/ Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 2 Dichtefunktion der stetigen Gleichverteilung Die Dichtefunktion einer Rechtecksverteilung bzw. einer stetigen Gleichverteilung ist über einem (stetigen) Intervall [a, b] konstant, d. h. f(x) ⎧k a ≤ x ≤ b 1 f ( x / a ; b) = ⎨ mit k = b-a ⎩ 0 sonst k ∫ ∞ ∫ a −∞ b x a Beweis: a b ∞ −∞ a b f ( x )dx = 1 ⇔ ∫ f ( x )dx + ∫ f ( x )dx + ∫ f ( x )dx = 1 b ∞ b a b a 0dx + ∫ kdx + ∫ 0dx = 1 ⇔ ∫ kdx = 1 −∞ kx a = 1 ⇔ k (b − a ) = 1 ⇒ k = b 1 b−a Beispiel: Glückrad mit a=0° und b=360° Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 3 Stetige Gleichverteilung Verteilungsfunktion: ⎧0 ⎪x − a F( x / a; b) = ⎨ ⎪b − a ⎩1 F(x) 1 x<a 0,5 a≤x≤b x>b a b x a+b 2 ∞ Erwartungswert: E(X) = ∫−∞ x ⋅ f ( x )dx = Varianz: E(X) Var (X) = E[X − E (X)] = 2 (b − a )2 12 Aufgabe: Beweisen Sie, dass die vorigen Formeln gelten. Nutzen Sie dabei als Beispiel die Berechnung von k in der vorigen Folie. Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 4 Beispiel: Stetige Gleichverteilung Eine Person, die selten die Straßenbahn einer Großstadt benutzt, weiß nur, dass diese alle 10 Minuten fährt. Sei X die Wartezeit (in Minuten). Wie groß ist die Wahrscheinlichkeit, dass die Person zwischen 4 uns 7 Minuten warten muss? Wie lange muss die Person durchschnittlich warten? Es gilt: X ~ G (a = 0; b = 10) 7 ∞ W (4 ≤ X ≤ 7) = ∫ f ( x )dx =F(7) − F(4) E(X) = ∫ x ⋅ f ( x )dx = 7 4 3 = − = = 0,3 10 10 10 = −∞ 4 0 + 10 = 5 Minuten 2 ⎧1 ⎪ 0 ≤ x ≤ 10 f ( x / 0;10) = ⎨10 ⎪⎩ 0 sonst F(x) 1 ⎧0 x < 0 ⎪x F( x / 0;10) = ⎨ 0 ≤ x ≤ 10 ⎪10 x > 10 ⎩1 Prof. Mohr / Dr. Ricabal a+b 2 0 4 Spezielle stetige Verteilungen 7 10 5 Exponentialverteilung Eine stetige Zufallsvariable X ist exponentialverteilt mit dem Parameter λ > 0, wenn sie folgende Dichtefunktion besitzt: ⎧ 0 f E ( x / λ) = ⎨ − λx ⎩λ ⋅ e für x < 0 für x ≥ 0 λ f(x) Verteilungsfunktion: ⎧ 0 FE ( x / λ) = W (X ≤ x ) = ⎨ − λx ⎩1 − e für x < 0 für x ≥ 0 1 x F(x) W (X > x ) = 1 − W (X ≤ x ) = 1 − F( x ) = e − λx x Erwartungswert, Varianz und Standardabweichung E(X) = 1 λ ; Var (X) = Prof. Mohr / Dr. Ricabal 1 λ2 und σ(X) = 1 ⇒ E (X) = σ(X) λ Spezielle stetige Verteilungen 6 x Bemerkung zur Exponentialverteilung Die Exponentialverteilung spielt eine wichtige Rolle zur Beschreibung von: Lebensdauer insbesondere bei Objekten, die wenig altern, für den Zeitraum zwischen zwei aufeinander folgenden Ereignissen einer Poissonverteilung. Ist die Anzahl von Ereignissen pro Zeiteinheit poissonverteilt mit dem Parameter µ (durchschnittliche Anzahl von Ereignissen pro Zeiteinheit), dann ist die Zeit zwischen zwei aufeinander folgenden Ereignissen exponentialverteilt mit dem Parameter λ = µ (d. h mit dem durchschnittliche Zeit von 1/λ = 1/µ Zeiteinheiten). Beispiele: Dauer von Telefongesprächen Abstand der Kundenankünfte an einem Bankschalter Lebensdauer von Glühlampen oder Aggregaten Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 7 Beispiel: Exponentialverteilung In einer Versicherung treten im Durchschnitt 4 Großunfälle pro Jahr nach der Poissonverteilung auf. Wie groß ist die Wahrscheinlichkeit dafür, dass die Zeit zwischen zwei aufeinander folgenden Großunfällen: a) Höchstens 1 Jahr beträgt? b) Zwischen einem halben und einem Jahr liegt? c) Wie groß ist die mittlere Zeitspanne? Sei X die Zeitspanne [in Jahre] zwischen zwei Großunfällen. Es gilt: X ~ E (λ = 4) 1 a ) W(X ≤ 1) = ∫ f ( x )dx = FE (1 / 4) = 1 − e − 4⋅1 = 1 − 0,0183 = 0,9817 −∞ b) W(0,5 ≤ X ≤ 1) = FE (1 / 4) − FE (0,5 / 4) = (1 − e −4⋅1 ) − (1 − e −4⋅0,5 ) = e − 2 − e − 4 = 0,1353 − 0,183 = 0,1170 c) E(X) = 1 1 = Jahr λ 4 Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 8 Asymmetrie der Exponentialverteilung Bei einer symmetrischen Verteilung liegen die Werte je zur Hälfte links und rechts des Erwartungswerts (Me = µ). Für die Exponentialverteilung gilt: W(X ≤ E(X)) = W(X ≤ 1/λ) = F(1/λ) = 1 - e-λ·(1/ λ) = 1 - e-1 = 0,6321 63,21% der Werte einer Exponentialverteilung liegen links von E(X). Sie ist eine asymmetrische Verteilung. Da mehr als die Hälfte der Werte links des Erwartungswerts liegt, ist die Verteilung linkssteil bzw. rechtsschief (Me < µ). Die Rechtsschiefe der Exponentialverteilung ist unabhängig von der Größe des Parameters λ. Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 9 Beispiel: Exponentialverteilung Die Reparaturzeit von Maschinen eines bestimmten Typs sei eine exponentialverteilte Zufallsgröße mit dem Parameter λ = 0,25 h-1. Welche der folgenden Aussagen sind zutreffend? a) Die zu erwartende Reparaturzeit einer zufällig ausgewählten Maschine beträgt 4 h. b) Die Wahrscheinlichkeit, dass die Reparaturzeit über dem Erwartungswert für die Reparaturzeit liegt, ist unabhängig vom Parameter λ. c) Mehr als 50 % der Reparaturen dauern länger als 3 Stunden. d) Nach höchstens sechs Stunden ist die Reparatur der Maschine mit 90 % Sicherheit beendet. Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 10 Beispiel: Lösung Teil a) bis d) a) E(X) = 1/ λ = 1/(0,25 h-1) = 4 h ⇒ Richtig. b) W(X > E(X)) = 1 - W(X ≤ E(X)) = 1 - FE(E(X)) = 1 - FE(1/ λ) = 1 - (1 - e– λ ·(1/ λ)) = 1 - (1 - e–1) = e–1 = 0,3679 ⇒ Richtig, unabhängig vom Wert λ dauert eine Reparatur in etwa 37 % aller Fälle länger als im Durchschnitt. c) W(X > 3) = 1 - W(X ≤ 3) = 1 - FE(3) = 1 - (1 - e–0,25 · 3) = e–0,75 = 0,472 ⇒ Falsch, über 3 h nehmen nur 47,2 % der Reparaturen in Anspruch, d.h. 53 % der Reparaturen sind in höchstens 3 h erledigt. d) W(X ≤ x) =0,9 =1 - e–0,25 · x ⇒ e–0,25 · x =0,1 ⇒ ln(0,1) =–0,25 · x ⇒ x =9,21 oder: –0,25 · 6 –1,5 W(X ≤ 6) = FE(6) = 1 - e = 1 - e = 1 - 0,223 = 0,777 ⇒ Falsch, mit 90 % Sicherheit ist einer Reparatur erst nach 9,21 h erledigt, nach 6 h sind nur 77,7 % aller Reparaturen erledigt. Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 11 Gedächtnislosigkeit der Exponentialverteilung Sei X ~ E(λ). Seien A = (X > t0 +t) und B = (X >t0) zwei Ereignisse, die mit Hilfe von X dargestellt werden. Zu berechnen ist die bedingte Wahrscheinlichkeit W(A|B). Es gilt: W (X > x ) = 1 − W (X ≤ x ) = 1 − F( x ) = e − λx W (A | B) = = e −λ( t +t 0 ) e − λt 0 W (A ∩ B) W (X > t + t 0 ) = W (B) W (X > t 0 ) A B 0 t0 t0+ t X = e − λ ( t + t 0 ) − ( − λt 0 ) = e − λ ( t + t 0 − t 0 ) = e − λt = W ( X > t ) Beispiel: Die Wahrscheinlichkeit dafür, dass eine Glühbirne eine Lebensdauer t überschreitet, hängt nicht von der Zeit t0, die sie schon überlebt hat, sondern nur von der Dauer t ab. Die Verteilung „vergisst“ einfach, was vorher passiert ist. Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 12 Wichtigkeit der Normalverteilung Die Nomalverteilung ist sowohl in der Theorie als auch in der Praxis die wichtigste statistische Verteilung. Einige Gründe dafür sind: Viele empirische Beobachtungen, insbesondere bei Massendaten, genügen approximativ einer Normalverteilung (z. B. Körpergröße und Gewichte erwachsener Personen, Laufleistung von Autoreifen, etc). Es wirken dabei viele Faktoren mit relativen geringem Einfluss unabhängig von einander. Die Normalverteilung kann zur Approximation diskreter Verteilungen verwendet werden (Binomial-, Hypergeometrische-, Poission-Verteilung). Der Mittelwert ⎯x einer Stichprobe vom Umfang n ist für hinreichend großen n approximativ normalverteilt (Zentraler Grenzwertsatz), unabhängig von der Ausgangverteilung. Aus der Normalverteilung lassen sich andere wichtige Verteilungen herleiten: z. B. die t-Verteilung, F-Verteilung und die χ2-Verteilung. Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 13 Normalverteilung Eine Zufallsvariable X heißt normalverteilt mit den Parametern µ und σ2 mit σ > 0, wenn die Dichtefunktion folgender Gleichung genügt: f n ( x / µ; σ 2 ) = 1 2πσ 2 ⋅e 1 ⎛ x −µ ⎞ − ⎜ ⎟ 2⎝ σ ⎠ Für X~N(µ; σ2) gilt: 1 Erwartungswert: E(X) = µ 2 für alle - ∞ < x < ∞ f(x) 2πσ2 Varianz: Var(X) = σ2 Standardabweichung: σ(X) = σ Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen x µ 14 Normalverteilungsfunktion Die Verteilungsfunktion einer normalverteilten Zufallsvariable hat die Gestalt: x Fn ( x / µ; σ ) = W (X ≤ x ) = ∫ f n ( v / µ; σ ) ⋅ dv = 2 x 2 −∞ ∫ −∞ Sie stellt die Fläche unter der Dichtefunktion dar, die links von x liegt. 1 2πσ 2 ⋅e 1 ⎛ v −µ ⎞ − ⎜ ⎟ 2⎝ σ ⎠ 2 ⋅ dv F(x) 1 0,5 0 x µ Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 15 Kurvendiskussion für die Dichte 1 f n ( x / µ; σ 2 ) = ⋅e 2πσ 2 1 ⎛ x −µ ⎞ − ⎜ ⎟ 2⎝ σ ⎠ 2 Symmetrisch um µ: f ( x − µ) = f ( x + µ) Maximum an der Stelle x = µ mit f (µ) = Wendepunkte an den Stellen x1 = µ - σ und x2 = µ + σ mit f (µ ± σ) = 1 2πσ 2 e − 1 2 1 1 2πσ2 f(x) 2πσ2 Glockenform x µ Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 16 Wirkung der Änderung von µ Eine Änderung von µ bewirkt eine Lageverschiebung entlang der x-Achse X1~N(2; 1) 0.0 0.0 0.1 0.1 0.2 0.2 0.3 0.3 0.4 0.4 X1~N(0; 1) -4 -2 0 2 4 -2 0 x 2 4 6 x Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 17 Wirkung der Änderung von σ 0.4 Eine Änderung von σ bewirkt eine Formänderung (Wölbung flacher oder höher) f (µ) = 1 2πσ2 0.2 0.3 X1~N(0; 1) 0.0 0.1 X2~N(0; 22) -4 Prof. Mohr / Dr. Ricabal -2 0 x 2 4 Spezielle stetige Verteilungen 18 Standardisierung Sei X eine normalverteilte Zufallsvariable mit den Parametern µ und σ2. Die lineare Transformation Z = (X – µ)/σ heißt Standardisierung. Es kann bewiesen werden, dass Z auch einer Normalverteilung mit E(Z) = 0 und Var (Z) = 1 genügt. Es gilt dann: Dichtefunktion: 1 − z2 1 f N (z) = ⋅e 2 2π Verteilungsfunktion: z FN (z) = ∫ −∞ 1 − v2 1 ⋅ e 2 ⋅ dv 2π W ( Z ≤ −z) = W ( Z ≥ z) = 1 − W ( Z < z) = 1 − W( Z ≤ z) Prof. Mohr / Dr. Ricabal FN (−z) = 1 − FN (z) Spezielle stetige Verteilungen 19 Ablesen aus der Standardnormalverteilung - Tabellen Zu bestimmen sind: a) W(Z ≤ 1,645) ⇒ FN (1,645) = 0,9500 (Tabelle 12, Seite 125) b) z , für die W(Z ≤ z) = FN(z) = 0,975 gilt. ⇒ z = 1,96 (Tabelle 12, Seite 126) c) W(-1,96 ≤ Z ≤ 1,96) = FN(1,96) - FN(-1,96) = FN(1,96) – [1- FN(1,96) ] =2 FN(1,96) -1 = 2.0,975 – 1 = 0,95 (Tabelle 12, Seite 126) oder direkt aus der Tabelle 14 W(-1,96 ≤ Z ≤ 1,96) = 0,95 d) W(-z ≤ Z ≤ z) = 0,90 ⇒ z = Prof. Mohr / Dr. Ricabal (Tabelle 14, Seite 131) 1,64 + 1,65 = 1,645 (Tabelle 14, Seite 131) 2 Spezielle stetige Verteilungen 20 Berechnung von Wahrscheinlichkeiten einer Normalverteilung Zur Berechnung von entsprechenden Wahrscheinlichkeiten liegt die Verteilungsfunktion der Standardnormalverteilung tabellarisch vor. Jede beliebige Normalverteilung lässt sich in die Standardnormalverteilung umrechnen. X ~ N(µ; σ 2 ) ⇒ Z = W (X ≤ a ) = W ( X−µ ~ N(0;1) σ X −µ a −µ a −µ a −µ ≤ ) = W(Z ≤ ) = FN ( ) σ σ σ σ a −µ X −µ b−µ ) ≤ ≤ σ σ σ a −µ b−µ b−µ a −µ = W( ≤Z≤ ) = FN ( ) − FN ( ) σ σ σ σ W (a ≤ X ≤ b ) = W ( Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 21 Beispiel a): Normalverteilung Das Gewicht von Schokoladetafel ist approximativ normalverteilt mit µ = 100 [g] und σ2 = 25 [g2], d. h. X ~ N(100; 25). Man berechne: 112,6 − 100 ) 5 a) W (X ≤ 112,6) = Fn (112,6 / 100; 25) = FN ( = FN (2,52) = 0,9941 (Tabelle 12, Seite 127) Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 22 Beispiel b): Normalverteilung Das Gewicht von Schokoladetafeln ist approximativ normalverteilt mit µ = 100 [g] und σ2 = 25 [g2]. Man berechne: b) 92 − 100 ) 5 = FN (−1,6) = 1 − FN (1,6) = 1 − 0,9452 = 0,0548 W (X ≤ 92) = Fn (92 / 100; 25) = FN ( (Tabelle 12, Seite 125) Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 23 Beispiel b): Normalverteilung Das Gewicht von Schokoladetafeln ist approximativ normalverteilt mit µ = 100 [g] und σ2 = 25 [g2]. Man berechne: c) W (90 ≤ X ≤ 106) = Fn (106 / 100; 25) − Fn (90 / 100; 25) 106 − 100 90 − 100 ) − FN ( ) = FN (1,2) − FN (−2) 5 5 = FN (1,2) − [1 − FN (2)] = 0,8849 − [1 − 0,9772] = 0,8621 = FN ( (Tabelle 12, Seite 124 und 126) Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 24 Approximationen Die Normalverteilung kann unter bestimmten Bedingungen als Approximation von einigen anderen Verteilungen genutzt werden. X~H(N; n; M) X~B(n; θ) θ = M/N X~P(µ) µ≥9 n ≥ 30 n θ (1- θ) ≥ 9 0,1 ≤ θ ≤ 0,9 n ≥ 30 n/N < 0,05 µ=nθ σ2 = n θ (1- θ) µ=nθ σ2 = n θ (1 – θ) (N-n)/N-1) Prof. Mohr / Dr. Ricabal σ2 = µ X~N(µ; σ2) Spezielle stetige Verteilungen 25 Yates Korrektur Wenn eine diskrete durch eine stetige Verteilung (hier die Normalverteilung) approximiert werden soll, ist eine Stetigkeitskorrektur vorzunehmen: Fdiskret ( x ) ≈ Fn ( x + 0,5 / µ; σ 2 ) = FN ( ⇨ FB ( x / n; θ) ≈ FN ( x + 0,5 − µ ) σ ⇨ FH ( x / N; n; M ) ≈ FN ( ⇨ FP ( x / µ) ≈ FN ( Prof. Mohr / Dr. Ricabal mit x + 0,5 − µ ) σ Yates-Korrektur µ = nθ und σ = nθ(1 - θ) M N-n x + 0,5 − µ ) mit θ = ; µ = nθ; σ 2 = nθ(1 - θ) N N -1 σ x + 0,5 − µ ) σ mit σ 2 = µ ⇒ σ = µ Spezielle stetige Verteilungen 26 Beispiel: Approximation der Hypergeom. Verteilung durch die Normalverteilung Von 2000 Studierenden eines Fachbereiches bestreiten 600 ihr Studium vollständig aus eigenen Mitteln. Wie groß ist die Wahrscheinlichkeit, dass unter 30 zufällig und ohne Zurücklegen ausgewählten Studenten 9 bis 12 zu dieser Gruppe gehören? (1) Exakter Ansatz: Hypergeometrische Verteilung mit den Parametern N = 2000, M = 600 und n = 30 (2) Approximation der Hypergeometrischen Verteilung durch die Normalverteilung. Approximationsregeln: n ≥ 30; n < 0,05 N = 400; θ = M/N = 600/2000 = 0,3; 0,1 ≤ θ ≤ 0,9 (Fortsetzung in der nächste Folie) Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 27 Beispiel: Approximation der Hypergeom. Verteilung durch die Normalverteilung (1) Exakter Ansatz: Hypergeometrische Verteilung mit den Parametern N = 2000, M = 600 und n = 30 W (9 ≤ X ≤ 12) = 0,48644 (genaue berechnung mit R) (2) Approximation der Hypergeometrischen Verteilung durch die Normalverteilung. θ = 600/2000 = 0,3; µ = n·θ = 30·0,3 = 9; σ2 = n·θ·(1 – θ) (N-n)/(N-1)= 30·0,3·0,7·1970/1999= 6,21 W (9 ≤ X ≤ 12) = FH (12 / N; n; M ) − FH (8 / N; n; M ) 12 + 0,5 − 9 8 + 0,5 − 9 ) − FN ( ) = FN (1,406) − FN (−0,201) 2,49 2,49 = FN (1,406) − [1 − FN (0,201)] = 0,9201 − (1 − 0,5797) = 0,4998 ≈ FN ( (Tabelle 12, S. 126 bzw. S. 122 ) Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 28 Beispiel: Approximation der Binomialverteilung durch die Normalverteilung In einer Klinik sollen in einem bestimmten Monat 80 Säuglinge zur Welt kommen. Unter der Annahme, dass der Anteil weiblicher Geburten an allen Geburten langfristig bei 0,49 liegt, berechne man die Wahrscheinlichkeit dafür, dass sich unter den 80 Säuglingen 35 bis 40 Mädchen befinden. (1) Exakter Ansatz: Binomialverteilung mit den Parametern n=80 und θ=0,49 (2) Approximation durch die Normalverteilung Regel: n·θ·(1-θ) = 80·0,49·(1 - 0,49) = 19,992 ≥ 9 Parameter: µ = n·θ = 80·0,49 = 39,2 und σ² = n·θ·(1-θ)= 19,992. Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 29 Beispiel: Approximation der Binomialverteilung durch die Normalverteilung (1) Exakter Ansatz: Binomialverteilung mit den Parametern n = 80 und θ = 0,49. (Genaue Berechnung mit R) W(35 ≤ X ≤ 40) = 0.05757102 + 0.06914167 + 0.07899811 +0.08588701 + 0.08886650 + 0.08751607 = 0,4679804 (2) Approximation durch die Normalverteilung Parameter: µ=n·θ=80 · 0,49= 39,2 und σ²=n · θ · (1-θ)= 19,992 W (35 ≤ X ≤ 40) = FB (40 | n; θ) − FB (34 | n; θ) 40,5 − µ 34,5 − µ ) − FN ( ) σ σ = FN (0,291) − FN (−1,051) = 0,6145 − (1 − 0,8534) = 0,4679 ≈ Fn (40,5 | µ; σ 2 ) − Fn (34,5 | µ; σ 2 ) = FN ( (Tabelle 12, S. 122 bzw. S. 124 ) Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 30 Drei Sigma Regel Wie groß ist der Anteil der Realisierungen einer normalverteilten Zufallsgröße in den zentralen Schwankungsintervallen [µ - k·σ , µ + k·σ] für k = 1, 2, 3? W(µ - σ ≤ X ≤ µ + σ) = W(-1 ≤ Z ≤ 1) = 0,6827* * (Tabelle 14, S. 131) W(µ – 2·σ ≤ X ≤ µ + 2·σ) = W(-2 ≤ Z ≤ 2) = 0,9545* W(µ – 3·σ ≤ X ≤ µ + 3·σ) = W(-3 ≤ Z ≤ 3) = 0,9973* Im einfachen zentralen Schwankungsintervall liegen 68,27 %, im doppelten ca. 95,45 % und im dreifachen fast alle möglichen Realisierungen (99,73%) einer normalverteilten Zufallsvariablen. Dies gilt unabhängig von den beiden Parametern der Normalverteilung. Es ist als („3-σ-Regel“) bekannt. Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 31 Drei Sigma Regel. Grafische Darstellung W(µ - σ < X < µ + σ) = W(-1 ≤ Z ≤ 1) = 0,6827 W(µ – 2·σ < X < µ + 2·σ) = W(-2 ≤ Z ≤ 2) = 0,9545 -4 -2 0 68,27 % 2 4 x W(µ – 3·σ < X <µ + 3·σ) = W(-3 ≤ Z ≤ 3) = 0,9973 95,45 % 99,73 % Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 32 Chi-Quadrat-Verteilung Die Formel der Chi-Quadrat-Verteilung geht auf den Astronomen F. R. Helmert (1875) zurück; den Namen aber gab ihr erst der bekannte englische Statistiker Karl Pearson im Jahre 1900. Die Chi-Quadrat-Verteilung entspricht dem folgenden stochastischen Modell: Sind Z1, Z2, … ,Zν unabhängig standardnormalverteilte Zufallsvariable (d. h. normalverteilte Zufallsvariablen mit E(Zi) = 0 und Var (Zi) = 1 für i = 1, 2, … , ν), so besitzt ν χ 2 = Z12 + Z 22 + L + Zν2 = ∑ Z 2i i =1 eine Chi-Quadrat-Verteilung mit ν Freiheitsgrad. ν ist der Parameter der Verteilung. Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 33 Dichtefunktion der χ²-Verteilung Die Dichtefunktion der Chi-Quadrat-Verteilung lautet: χ ν ⎧ ( −1) − 1 2 2 2 e ( ) χ ⎪ ⎪ f ch (χ 2 / ν) = ⎨ 2ν / 2 Γ( ν ) 2 ⎪ ⎪⎩ 0 für χ 2 ≥ 0 sonst Anmerkung: Mit Γ(ν) wird die Gammafunktion bezeichnet. 0 5 x Prof. Mohr / Dr. Ricabal 10 15 0.00 0.00 0.05 dchisq(x, 3) 0.10 0.15 dchisq(x, 5) 0.05 0.10 0.20 0.15 0.25 2 0 Spezielle stetige Verteilungen 5 10 x 15 34 Erwartungswert und Varianz der χ²-Verteilung Die Chi-Quadrat-Verteilung besitzt den Erwartungswert E(χ²) = ν und die Varianz Var(χ²) = 2ν Mit wachsendem ν näher sich die Chi-Quadrat-Verteilung einer Normalverteilung mit dem Parameter µ = ν und σ² = 2ν. Die Variable Z= χ2 − ν 2ν ist also näherungsweise standardnormalverteilt. Eine bessere Approximation liefert jedoch die Größe sie ist ebenfalls asymptotisch normalverteilt mit und σ² = 1. Die standardisierte Zufallsgröße 2χ 2 µ = 2ν − 1 Z = 2χ 2 − 2ν − 1 ist somit annähernd standardnormalverteilt. χ²- Werte zu gegebenen Werten von F(χ² / ν ) sind tabelliert (Tab. 15) Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 35 Studentverteilung Die Studentverteilung (auch t-Verteilung genannt) verdankt ihren Namen dem englischen Statistiker W. S. Gosset, der 1908 unter dem Pseudonym „Student“ einen Artikel mit ihrer Ableitung veröffentlichte. Betrachtet man die beiden voneinander unabhängigen Zufallsvariablen Z und U, wobei Z standardnormalverteilt und U chi-quadratverteilt mit ν Freiheitsgraden ist, dann genügt die Zufallsvariable T= Z U ν einer Studentverteilung mit ν Freiheitsgraden. Die Freiheitsgrade ν ist der Parameter der Verteilung. Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 36 Dichtefunktion der t-Verteilung Die Dichtefunktion der t-Verteilung lautet ν +1 ) 1 2 f s ( t / ν) = ⋅ ν +1 ν t νπ ⋅ Γ( ) (1 + ² ) 2 2 ν Γ( für - ∞ ≤ t ≤ ∞ -3 -2 -1 0 x 1 2 Prof. Mohr / Dr. Ricabal 3 dt(x, 100) 0.2 0.3 0.1 0.0 dt(x, 1) 0.05 0.10 0.15 0.20 0.25 0.30 dt(x, 3) 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.4 Beispiele: Dichtefunktion für verschiedene Freiheitsgrade. -3 -2 -1 0 x 1 2 3 -3 Spezielle stetige Verteilungen -2 -1 0 x 1 2 3 37 Erwartungswert und Varianz der Studentverteilung Erwartungswert: E(T) = 0 Varianz: Var(T) = ν/(ν – 2) für ν > 1 für ν > 2 Für ν = 1 existiert kein Erwartungswert und für ν ≤ 2 keine Varianz. Für ν → ∞ geht die Studentverteilung in die Srtandardnormalverteilung über. Ab ν ≥ 30 kann die Studentverteilung in guter Näherung durch die Standardnormalverteilung approximiert werden. Werte von t zu gegebenen zweiseitigen symmetrischen Flächenanteilen sind tabelliert (Tabelle 17). Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 38 F-Verteilung Sind U1 und U2 allegemein zwei voneinander unabhängige Zufallsvariable, die Chi-QuadratVerteilungen mit ν1 bzw. ν2 Freiheitsgarden besitzen, dann genügt, wie R. A. Fischer gezeigt hat, der Quotient U1 ν F= 1 U2 ν2 einer sogenannten F-Verteilung mit ν1 und ν2 Freiheitsgraden. Die Anzahl der Freiheitsgrade sind die Parameter der Verteilung Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 39 Dichtefunktion der F-Verteilung Die Dichtefunktion der F-Verteilung lautet: füt f > 0 0.0 0.1 0.2 df(x, 9, 6) 0.3 0.4 0.5 0.6 df(x, 6, 9) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.7 ν1 ν1 + ν 2 ν1 ⎧ −1 ⎪ Γ( 2 ) ⎛ ν1 ⎞ 2 f2 ⎜ ⎟ ⋅ ⎪ ν1 + ν 2 f F (f / ν1 ; ν 2 ) = ⎨ Γ( ν1 ) ⋅ Γ( ν 2 ) ⎜⎝ ν 2 ⎟⎠ ν1 2 + ( 1 f ) ⎪ 2 2 ν2 ⎪ 0 für f ≤ 0 ⎩ 0 5 10 15 0 x Prof. Mohr / Dr. Ricabal 5 10 15 x Spezielle stetige Verteilungen 40 Erwartungswert und Varianz der F-verteilung Für ν2 > 2 ergibt sich der Erwartungswert E(F) = ν2 / (ν2 – 2) und für ν2 > 4 erhält man die Varianz Var(F) = [2 ν22 (ν1 + ν2 – 2) ] / [ν1(ν2 – 2)² (ν2 – 4)] Für unterschiedliche Freiheitsgrade ν1 und ν2 sind die Prozentpunkte der F-Verteilung tabelliert (Tabellen 18 und 19). Prof. Mohr / Dr. Ricabal Spezielle stetige Verteilungen 41