Gaußsche Glockenkurve Wichtige Verteilungen Histogramm mit Glockenkurve Normalverteilung 30 Logarithmische Normalverteilung absolute Häufigkeit Binomial- oder Bernoulli-Verteilung Poisson-Verteilung Hypergeometrische Verteilung Exponentialverteilung 20 10 Tschebyscheffsche Ungleichung 0 Zentraler Grenzwertsatz 3300 3700 4100 4500 4900 5300 5700 6100 6500 6900 7300 Milchleistung [kg/a] Galton-Brett Wichtige Verteilungen KRAFT Wichtige Verteilungen KRAFT Normalverteilung Standardnormalverteilung Dichtefunktion & 1 f(x) ' F 2B µ = E(X) = 0 F2 = Var(X) = 1 (x&µ)2 2F2 @e für &4< x< %4 und F >0 Dichtefunktion n(x) ' Verteilungsfunktion F(x) ' x & @ e m F 2B &4 1 dt 0.5 F = 0.7 M(x) ' F=1 0.2 0.1 0.1 -3 0.0 -3 -2 -1 0 Wendepunkt Wichtige Verteilungen t2 2 dt M(x) 1 : -2F 1 2 3 -2 -1 0.5 0 1 2 3 x -3 -2 -1 0 1 2 3 x x Wendepunkt F : -3F & 0.3 0.2 -4 x @ e m 2B &4 1 0.4 :=1 : = -2 0.3 -5 für &4 <x <%4 n(x) :=0 F = 1.5 0.4 @e x2 2 Verteilungsfunktion µ = E(X): Erwartungswert oder Mittelwert F2 = Var(X): Varianz f(x) 0.6 & 2B (t&µ)2 2F2 1 : -F F : : + F : +2 F : +3F x KRAFT Wichtige Verteilungen KRAFT Spezielle Fraktilen und Grenzen der Normalverteilung Transformation auf Standardnormalvariable X - (µ,F2)-n.v., dann ist F(x) ' M X&µ - (0,12)-n.v. F x& µ F P(a<X#b) ' F(b)& F(a) ' M b&µ a&µ &M F F F F : -3F : -2F : -F : -3 -2 -1 0 1 2 u 3 M(!x) M(x) M(x)!M(!x) 0.000 1.000 1.645 1.960 2.000 2.326 2.576 3.000 3.090 3.290 4.000 0.5000 0.1587 0.0500 0.0250 0.0228 0.0100 0.0050 0.0013 0.0010 0.0005 0.5000 0.8413 0.9500 0.9750 0.9773 0.9900 0.9950 0.9987 0.9990 0.9995 0.0000 0.6826 0.9000 0.9500 0.9545 0.9800 0.9900 0.9974 0.9980 0.9990 0.9999 1F-Bereich: P(µ!1F<X#µ+0F) = M(1)!M(!1) = 0.6826 . 068% 2F-Bereich: P(µ!2F<X#µ+2F) = M(2)!M(!2) = 0.9545 . 095% 3F-Bereich: P(µ!3F<X#µ+3F) = M(3)!M(!3) = 0.9974 > 099% 4F-Bereich: P(µ!4F<X#µ+4F) = M(4)!M(!4) = 0.9999 . 100% x : + F : +2F : +3 F x P(µ!1.960F<X#µ+1.960F) = 0.950 = 95.0% P(µ!2.576F<X#µ+2.576F) = 0.990 = 99.0% P(µ!3.290F<X#µ+3.290F) = 0.999 = 99.9% Additionstheorem der Normalverteilung Die Summe von n unabhängigen normalverteilten Zufallsvariablen ist wieder eine normalverteilte Zufallsvariable: Xi (i = 1,2,...,n) - (µi Fi )-n.v., dann ist X' j ki @ Xi - (µ F2)-n.v. mit µ ' j ki @ µi und F2 ' j ki @Fi n n n i'1 i'1 i'1 Wichtige Verteilungen 2 68% 16% : -F 2 2 KRAFT 16% : :+ F Wichtige Verteilungen 2.5% x : -1.96 F 95% : 2.5% : +1.96 F x KRAFT Milchleistung M - (5000,6002)-n.v. Logarithmische Normalverteilung 0.0007 X logarithmisch normalverteilt, wenn Y = log X normalverteilt Y = log X - (log>,F2)-n.v. 0.0006 Dichte 0.0005 Dichte- und Verteilungsfunktion 0.0004 0.0003 log e 0.0002 f(x) ' 0.0001 Fx 2B & (logx&log>)2 2F2 @e für x >0 0 0.0000 3000 4000 5000 6000 für x# 0 7000 Milchleistung [kg/a] 2 F(x) ' 1F-Bereich: P(µ!1F#M#µ+0F)=P(4400#M#5600).68% 2F-Bereich: P(µ!2F#M#µ+2F)=P(3800#M#6200).95% 3F-Bereich: P(µ!3F#M#µ+3F)=P(3200#M#6800).99% logx & (t&log>) 2F2 @ e m F 2B &4 1 dt 0 P(µ!1.960F#M#µ+1.960F)=P(3824#M#6176)=95.0% P(µ!2.576F#M#µ+2.576F)=P(3454#M#6546)=99.0% P(µ!3.290F#M#µ+3.290F)=P(3026#M#6974)=99.9% für x >0 für x# 0 1.0 F(x) 0.9 0.8 P(M=6000)=0 P(M<5000)=P(M#5000)=P(M>5000)=P(M$5000)=0.5 P(M<6000)=F(6000)=M((6000!5000)/600)=M(1.67)=0.9525 P(M>6200)=1!F(6200)=1!M(2)=1!0.9773=0.0227 P(5000#M#6000)=F(6000)!F(5000)=0.9525!0.5=0.4525 f(x), F(x) 0.7 0.6 0.5 0.4 0.3 P(M#c)=0.9]F(c)=M((c!5000)/600)=0.9] ](c!5000)/600=u0.95=1.282]c=5769 also P(M#5769)=90% und P(M>5769)=1-0.9=0.1=10% P(µ!c#M#µ+c)=0.9]F(µ+c)!F(µ!c)=0.9] ] M((µ+c!µ)/F)!M((µ!c!µ)/F)=M(c/F)!M(!c/F)=0.9] ]c/F=80.9=1.645Yc=1.645@600=987 also P(4013#M#5987)=90% Wichtige Verteilungen 0.2 0.1 f(x) 0.0 0 1 2 3 4 5 6 7 8 9 10 x KRAFT Wichtige Verteilungen KRAFT Hydroxymethylfurfurolgehalt von Honig Bernoullisches Zufallsexperiment Descriptive Statistics 2 Komplementäre Ereignisse: A (Erfolg) und A (kein Erfolg) mit P(A) = p und P( A ) = q = 1 ! p (also p + q = 1) Variable: HMF n-malige Durchführung eines Bernoullischen Zufallsexperiments liefert Folge von n Ereignissen A oder A , Anderson-Darling Normality Test A-Squared: P-Value: 0 2 4 6 8 95% Confidence Interval for Mu 3.085 0.000 Mean StDev Variance Skewness Kurtosis N 2.34312 1.64210 2.69648 1.73887 3.83100 80 Minimum 1st Quartile Median 3rd Quartile Maximum 0.27000 1.14000 1.87500 2.92250 9.41000 z.B. AAA A A A ... A A AA (n mal) mit P(AAA A A A ... A A AA) = p@p@p@q@p@q@...@q@q@p@p Reihenfolge egal P(AA...A k mal und A A ... A n!k mal) = pk@qn!k n n! Anordnungen mit Wahrscheinlichkeit pk@qn!k ' k (n&k)! @k! 95% Confidence Interval for Mu 1.97769 1.6 2.1 2.6 2.70856 95% Confidence Interval for Sigma 1.42116 1.94502 95% Confidence Interval for Median 95% Confidence Interval for Median 1.61115 P(n,k,p) ' 2.41885 Descriptive Statistics n k @p k @ q n&k (k' 0,1,2,...,n) Münzwurf Variable: ln HMF p = q = 0.5 Anderson-Darling Normality Test A-Squared: P-Value: -1.00 -0.25 0.50 1.25 2.00 95% Confidence Interval for Mu 0.180 0.913 Mean StDev Variance Skewness Kurtosis N 0.637234 0.669219 0.447854 -1.4E-01 -4.7E-02 80 Minimum 1st Quartile Median 3rd Quartile Maximum -1.30933 0.13103 0.62861 1.07243 2.24177 Urne: a rote, b grüne Kugeln, Ziehen mit Zurücklegen p = a / (a + b), q = b / (a + b) = 1 ! p Toxizitätsprüfung an Laborratten Mortalitätsrate Überlebensrate 95% Confidence Interval for Mu 0.48831 0.5 0.6 0.7 0.8 0.9 Wichtige Verteilungen 0.78616 p = 0.1 = 10% q = 0.9 = 90% = 1 ! p 95% Confidence Interval for Sigma 0.57918 95% Confidence Interval for Median (symmetrische Münze) 0.79267 95% Confidence Interval for Median 0.47689 0.88327 KRAFT Wichtige Verteilungen KRAFT Bernoulli- oder Binomialverteilung Toxizitätsprüfung Wahrscheinlichkeits- und Verteilungsfunktion P(n,x,p) ' f(x) ' n x @p x @(1 &p)n&x für x '0,1,2,ÿ,n 0 F(x) ' 10 Ratten, Mortalitätsrate 10% sonst j f(t) für x$ 0 t#x 0 für x< 0 x f(x) = P(X = x) F(x) = P(X # x) 0 1 2 3 4 5 6 0.3487 0.3874 0.1937 0.0574 0.0112 0.0015 0.0001 0.3487 0.7361 0.9298 0.9872 0.9984 0.9999 1.0000 Erwartungswert und Varianz 10 @ 0.12 @ 0.98 ' 45@ 0.01@ 0.43' 0.19' 19% 2 P(#2) = F(2) = f(0) + f(1) + f(2) = 0.35 + 0.39 + 0.19 = 0.93 = 93% P(<2) = f(0) + f(1) = F(1) = 0.35 + 0.39 = 0.74 = 74% P(>2) = 1 ! P(#2) = 1 ! 0.93 = 0.07 = 7% P($9) = P(9) + P(10) = 0.00 + 0.00 = 0 P(2) 'f(2) ' E(X) = n @ p, Var(X) = n @ p @ q 0.4 p = 0.1 n = 10 p = 0.9 p = 0.25 0.3 p = 0.75 f(x) p = 0.5 1.0 0.9 0.2 0.8 f(x), F(x) 0.7 0.1 0.6 n = 10, p = 0.1 0.5 0.4 0.3 0.0 0 1 2 3 4 5 6 7 8 9 0.2 10 0.1 x 0.0 0 1 2 3 4 5 6 7 8 9 10 x Wichtige Verteilungen KRAFT Wichtige Verteilungen KRAFT Poisson-Verteilung Binomial- und Poisson-Verteilung Wahrscheinlichkeits- und Verteilungsfunktion Bernoulli-Experiment: n groß, p sehr klein (seltenes Ereignis) Mit 8 = n@p Approximation der Binomial- durch Poisson-Vertlg.: 8k &8 P(n,k,p) ' P(k,8) . @ e für n@p # 10 und n > 1500@p k! Beispiele: P(x,8) ' f(x) ' 8x &8 @ e für x' 0,1,2,ÿ x! 0 Radioaktiver Zerfall ("-Teilchen pro Zeitintervall) Druckfehler pro Seite Fahrzeuge pro Zeitintervall Unkrautsamen pro Flächeneinheit Chromosomenaustausch in Zellen F(x) ' e&8 @ j t#x sonst 8t für x$ 0 t! 0 für x< 0 Erwartungswert und Varianz E(X) = 8, Var(X) = 8 0.7 Binomial-, Poisson- und Normalverteilung lambda = 0.5 0.6 0.5 Binomialverteilung mit E(X) = n @ p, Var(X) = n @ p @ q f(x) 0.4 8 = n@p # 10 und n > 1500@p: Poissonverteilung mit E(X) = 8, Var(X) = 8 0.3 8 $ 9: Normalverteilung mit E(X) = µ = 8 und Var(X) = F2 = 8 lambda = 1 0.2 lambda = 4 0.1 0.0 0 1 2 3 4 5 6 7 8 9 10 11 12 x Wichtige Verteilungen KRAFT Wichtige Verteilungen KRAFT Schadschwellenkonzept Hypergeometrische Verteilung Zufallsexperiment: Urne mit N Kugeln, davon N1 weiß und N2 = N ! N1 schwarz. Aus der Urne werden n Kugeln gezogen. Gesucht ist die Wahrscheinlichkeit, genau k weiße zu ziehen. Zählrahmen an 50 Stellen: Problemunkräuter Häufigkeit 0 1 2 3 4 5 6 06 15 12 13 02 01 01 6 6 mit Zurücklegen ohne Zurücklegen N n MUGE: P x '1.94, s 2 '1.69 ' N1 k k n&k n&k N n N1 Modell: N n Poisson-Modell mit 8 = 1.94 f(x) ' = P(X=0) + P(X=1) + P(X=2) + P(X=3) + P(X=4) = = e-1.94@(1.940/0!+1.941/1!+1.942/2!+1.943/3!+1.944/4!) = = 0.1437 @ (1 + 1.94 + 1.8818 + 1.2169 + 0.5902) = = 0.9526 = 95.25% P Wahrscheinlichkeit, daß mehr als 4 Unkräuter vorkommen, ist also kleiner als 5% KRAFT N1 x ' N&N1 @ x n&x für x' 0,1,2,ÿ,min(N1,n) N n 0 sonst Erwartungswert und Varianz = 1 ! P(X # 4) = 1 ! 0.9526 = 0.0474 = 4.74% Wichtige Verteilungen N&N1 Wahrscheinlichkeitsfunktion > 4 Unkräuter pro Zählrahmen P(X > 4) k @ N&N1 @ Schadschwelle: P(X # 4) N1 GUGE: N1 N n Binomialverteilung Hypergeometrische Verteilung E(X)' n@ N1 N , Var(X) 'n @ Wichtige Verteilungen N1 N @ 1& N1 N @ N&n N&1 KRAFT Biologiestudenten Exponentialverteilung 20 Biologiestudenten, davon 15 weiblich (w) und 5 männlich (m), 10 Studenten zufällig ausgewählt Dichte- und Verteilungsfunktion Wahrscheinlichkeit nur weibliche: f(x) ' P(10w)' 15 10 @ 5 0 8 @e&8@ x für x $0, 8> 0 0 20 10 E(X)' P(8w,2m)' 0 für x <0 Erwartungswert und Varianz Wahrscheinlichkeit 8 weibliche und 2 männliche: 15 8 1 &8 @e&8@ x für x $0, 8> 0 F(x) ' ' 0.016' 1.6% für x <0 @ 5 2 1 1 , Var(X)' 8 82 ' 0.348' 34.8% 20 10 1.0 f(x) F(x) P(5w,5m)' 15 5 @ 5 5 f(x), F(x) Wahrscheinlichkeit 5 weibliche und 5 männliche: ' 0.016' 1.6% 20 10 0.5 8=1 0.0 0 1 2 3 4 5 x Wichtige Verteilungen KRAFT Wichtige Verteilungen KRAFT Tschernobyl 137 55 Cs 6 137 56 Ba + 0 &1 e, Tschebyscheffsche Ungleichung X beliebig verteilt mit E(X) = µ und Var(X) = F2 … 0, dann gilt: tH = 30 a Lebensdauer T (Zeit bis zum Zerfall) eines Cäsiumkerns ist exponentialverteilt nach f(t) = 8 @ e!8 @ t bzw. F(t) = 1 ! e!8t P(|X ! µ| < k@F) $ 1 ! 1/k2 oder P(|X ! µ| $ k@F) # 1/k2 Halbwertszeit = Median: tH = t0.5 = 30 a Zerfallskonstante 8: F(tH) = 0.5 = 1 ! e!8 @ 30 a, also 8 = 0.023 a!1 Erwartungswert: E(T) = 1/8 = 43 a P(|X!µ|<2F) = 0.75 = 75% oder P(|X!µ|$2F) = 0.25 = 25% P(|X!µ|<3F) = 0.89 = 89% oder P(|X!µ|$3F) = 0.11 = 11% P(|X!µ|<4F) = 0.94 = 94% oder P(|X!µ|$4F) = 0.06 = 06% Wahrscheinlichkeit, daß Cäsiumkern höchstens 30 a überlebt: P(T # 30 a) = 50% = 0.5 = F(30 a) = 1 ! e!0.023 1/a @ 30 a Wahrscheinlichkeit, daß Cäsiumkern höchstens 43 a überlebt: P(T # 43 a) = F(43 a) = 1 ! e!0.023 1/a @ 43 a = 1 ! 0.37 = 0.63 = 63% Bei einer beliebigen Verteilung liegen also mindestens 75% aller möglichen Realisationen innerhalb des 2F-Bereichs, 89% innerhalb des 3FBereichs und 94% innerhalb des 4F-Bereichs. Oder anders herum: Höchstens 25% liegen außerhalb des 2F-Bereichs, 11% außerhalb des 3F-Bereichs und 6% außerhalb des 4F-Bereichs. Wahrscheinlichkeit, daß Cäsiumkern mindestens 100 a überlebt: P(T $ 100 a) = 1 ! F(100 a) = e!0.023 1/a @ 100 a = 0.10 = 10% Für spezielle Verteilungen kann man natürlich schärfere Aussagen formulieren, z.B. für die Normalverteilung: P(|X!µ| $ 2F) = 0.0455 P(|X!µ| $ 3F) = 0.0027 P(|X!µ| $ 4F) = 0.0000 1.0 0.9 0.8 0.7 F(t) 0.6 0.5 Zentraler Grenzwertsatz 0.4 0.3 Xi (i = 1,2,...,n) mit E(Xi) = µi und Var(Xi) = Fi2 beliebig verteilt 0.2 X' j Xi - (nµ,nF2)-n.v. für n 6 4 (praktisch für n relativ groß) n 0.1 i'1 0.0 0 10 20 30 40 50 60 70 80 90 100 t [a] Wichtige Verteilungen KRAFT Wichtige Verteilungen KRAFT