Wahrscheinlichkeitsbe- σ[aX+b] = Var[aX + b] = PrdisV (X < xk ) = F(xk−1 ) Eine Zufallsvariable X ist eine Zuordnungsvorschrift, die jedem möglichen Ergebnis eines Zufallsexperiments eine reelle Zahl zuordnet X: Ω → R ω 7→ X(ω) A oder A heisst A ∪ B mit Pr(A ∪ B) = Pr(A) + Pr(B), falls A und B stochastich unabhängig PrdisV (X > xk ) = 1 − F(xk ) Verteilungsfunktion 0, x ≤ x0 F(x) = F(x ), x i−1 i−1 ≤ x < xi ; i = 1, . . . ; n 1, x ≥ xn PrdisV (xi < X ≤ x j ) = F(x j ) − F(xi ) PrdisV (xi ≤ X ≤ x j ) = F(x j ) − F(xi−1 ) PrdisV (xi ≤ X < x j ) = F(x j−1 ) − F(xi−1 ) F(x) X ist weniger als x heisst X < x PrdisV (|X − a| ≤ b) = PrdisV (a − b ≤ X ≤ a + b) 1 X ist mehr als x heisst X > x PrdisV (|X − a| < b) = PrdisV (a − b < X < a + b) PrdisV (|X − a| ≥ b) = 1 − PrdisV (|X − a| ≤ b − 1) X ist mindestens x heisst X ≥ x a2 Var[X] = |a|σ[X] Var[X] = σ2 [X] PrdisV (xi < X < x j ) = F(x j−1 ) − F(xi ) A und A heisst A ∩ B mit Pr(A ∩ B) = Pr(A) ∗ Pr(B) p E[|X − E[X]|] ≤ σ[X] PrdisV (X ≥ xk ) = 1 − F(xk−1 ) Ereignismenge Ω F(x1 ) PrdisV (|X − a| > b) = 1 − PrdisV (|X − a| ≤ b) = P xk fdisV (xk ) = k F(x0 ) k Diskrete Zufallsvariable P Varianz Var[X] = (xk − E[X])2 fdisV (xk ) k P (xk − E[X])2 PrdisV (X = xk ) = xk x xn Gegenereignis A mit Pr(A) = 1 − Pr(A) Erwartungswert E[X] P xk PrdisV (X = xk ) x0 X ist höchstens x heisst X ≤ x 2 √ x1 Der griff E[aX + b] = aE[X] + b fdisV (xk ) = PrdisV (X = xk ) mit P fdisV (xk ) = 1 k Var[X] = E[X 2 ] − (E[X])2 fdisV (xk ) ≥ 0 2 Die Verteilung einer diskreten Zufallsvariable X sei ((xk , PrdisV (X = xk ))|k = 1, 2, . . . ) mit xk < xk+1 FdisV (xk ) = PrdisV (X ≤ xk ) = P i≤k f (xi ) 3 Var[X] = E[(X − a) ] − (E[X] − a) Binomialverteilung 2 fBin(n,p) (k) = PrBin(n,p) (X = k) = 2 Var[aX + b] = a Var[X] Standardabweichung σ[X] = √ Var[X] n k pk (1 − p)n−k E[X] = np Var[X] = np(1 − p) 1 PrdisV (X ≤ xk ) = F(xk ) Abbildung 2.1: Graph der Verteilungsfunktion Var[X] ≥ 0 Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected] 1 4 j=0 j j p (1 − p) n− j F Poi(λ) (k) = PrPoi(λ) (X ≤ k) = Die geometrische Verteilung 1 p Var[X] = 1− p p2 fDiG(a;d;n) (xk ) = PrDiG(a;d;n) (X = xk ) = a + dk; k = 0, 1, 2, . . . , n Var[X] = Als Verteilungsfunktion einer stetigen Zufallsvariable bezeichnet man die Beziehung = F steV (x) = Pr steV (X ≤ x) = xk − a + d d(n + 1) F DiG(a;d;n) (Rg(k)) = PrDiG(a;d;n) (Rg(X) ≤ k) = k+1 n+1 E[X] = +∞ R −∞ f steV (t)dt E[X] = λk −λ k! e , −∞ t fS eG(a,b) (t)dt = 9 a+b 2 +∞ R −∞ +∞ R (t − E[X])2 fS eG(a,b) (t)dt = (b−a)2 12 Allgemeine Normal– Gauss–Verteilung E[aX + b] = aE[X] + b Var[X] =≥ 0 F Nor(µ,σ2 ) (x) = PrNor(µ,σ2 ) (X ≤ x) −∞ Var[X] = wobei λ > 0 +∞ R Var[X] = t f steV (t)dt a≤x≤b sonst (x − µ)2 − 1 fNor(µ,σ2 ) (x) := √ · e 2σ2 ; x ∈ R σ 2π Var[X] = Poisson Verteilung (t − E[X])2 f steV (t)dt +∞ R 2 2 2 t f steV (t)dt−(E[X]) = E[X ]−(E[X]) −∞ Var[aX + b] = a2 Var[X] √ σ[X] = Var[X] 2 X ∼ Nor(µ, σ2 ) ⇒ Z = X−µ σ oder ∼ Nor(0, 1) PrNor(µ,σ2 ) (a ≤ X ≤ b) = PrNor(0,1) ( a−µ σ ≤Z ≤ b−µ σ ) ≤ Z ≤ PrNor(µ,σ2 ) (|X − a| ≤ b) = PrNor(0,1) ( a−b−µ σ a+b−µ σ ) 2 Var[X] = λ t=x R a2 Var[X] = |a|σ[X] 0, x<a x−a FS eG(a,b) (x) = b−a , a ≤ x < b 1, x≥b −∞ Pr steV (X ≥ a) = 1 − F steV (a) d 2 n(n+2) 12 E[X] = λ f steV (t)dt = 1 d.h. die Gesamtfläche zwischen x–Achse und der Dichte f steV (x) ist gleich 1. 1 n+1 , xk p Rechteckverteilung bzw. stetige Gleichverteilung 1 , b−a fS eG(a,b) (x) = 0, −∞ k dn 2 fPoi(λ) (k) = PrPoi(λ) (X = k) = 8 Pr steV (a ≤ X ≤ b) = F steV (b) − F steV (a) F DiG(a;d;n) (xk ) = PrDiG(a;d;n) (X ≤ xk ) = 6 +∞ R Var[aX + b] = E[|X − E[X]|] ≤ σ[X] Die Funktion f steV (x) heisst Dichtefunktion (oder Wahrscheinlichkeitsdichte) von X. Normierungseigenschaft: Diskrete Gleichverteilung E[X] = a + λ −λ j! e Nichtnegativität: f steV (x) ≥ 0 für alle x ∈ R FGeo(p) (k) = PrGeo(p) (X ≤ k) = 1 − (1 − p) 5 j=0 √ j 7 Stetige Zufallsvariable fGeo(p) (k) = PrGeo(p) (X = k) = (1 − p)k−1 p; k = 1, 2, 3, . . . E[X] = k P σ[aX+b] = Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected] F Bin(n,p) (k) = PrBin(n,p) (X ≤ k) = k P n F Nor(µ,σ2 ) (x) = F Nor(0,1) ( x−µ σ ) 10 Test auf µ unter Normalverteilung bei bekannter Varianz 11 Test auf µ unter Normalverteilung bei unbekannter Varianz x(Nor(µ, σ2 ), π) = σ · x(Nor(0, 1), π) + µ PrNor(0,1) (Z ≤ z) = π ⇒ z = x(Nor(0, 1), π) Modell Signifikanz niveau α Stichprobe n Werte, x1 , x2 , . . . , xn Stichprobenmittel wert Hypothesen Teststatistik Quantil . Xi ∼ Nor(µ, σ2 ) für i = 1, . . . , n H0 ablehnen, wenn X= n P i=1 n Xi ∼ Nor(µ, σ2 ) für i = 1, . . . , n Signifikanz niveau α Stichprobe n Werte, x1 , x2 , . . . , xn n P xi i=1 xi 2 ∼ Nor(µ0 , σn ) H0 : µ ≤ µ0 H0 : µ = µ0 H0 : µ ≥ µ0 H1 : µ > µ0 H1 : µ , µ0 H1 : µ < µ0 Zbere = Modell X − µ0 Hypothesen Teststatistik ∼ Nor(0, 1) x(Nor(0, 1), 1 − α) σ √ n x(Nor(0, 1), 1 − α2 ) x(Nor(0, 1), 1 − α) Zbere > x(Nor(0, 1), 1 − α) |Zbere | > x(Nor(0, 1), 1 − α2 ) Zbere < −x(Nor(0, 1), 1 − α) Quantil . H0 ablehnen, wenn e s= X= n v u u n tP (xi − X)2 i=1 n−1 H0 : µ ≤ µ0 H0 : µ = µ0 H0 : µ ≥ µ0 H1 : µ > µ0 H1 : µ , µ0 H1 : µ < µ0 T bere = X − µ0 x(T (n − 1), 1 − α) ∼ T (n − 1) e s √ n x(T (n − x(T (n − 1), 1 − α2 ) 1), 1 − α) T bere > x(T (n − 1), 1 − α) |T bere| > x(T (n − 1), 1 − α2 ) Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected] PrNor(µ,σ2 ) (|X − a| ≥ b) = 1 − PrNor(0,1) ( a−b−µ ≤ σ Z ≤ a+b−µ ) σ T bere < −x(T (n − 1), 1 − α) 3 Modell 2 Xi ∼ Nor(µ, σ ) für i = 1, . . . , n Signifikanz niveau α Versuche n Erfolge k geschätztes Hypothesen Teststatistik Quantil . H0 ablehnen, wenn b p= · √ n−1 q xi √ e s· n−1 x(χ2 (n − 1), α2 ) k n H0 : p ≥ p 0 H1 : p > p 0 H1 : p , p 0 H1 : p < p 0 ∼ Nor(0, 1) x(Nor(0, 1), 1 − α) σ √ n x(Nor(0, 1), 1 − α2 ) x(Nor(0, 1), 1 − α) Zbere > x(Nor(0, 1), 1 − α) |Zbere | > x(Nor(0, 1), 1 − α2 ) Zbere < −x(Nor(0, 1), 1 − α) 13 Konfidenzintervall für den Erwartungswert unter Normalverteilung Bei unbekannter Varianz 1 − α–Konfidenzintervall I1−α = [Iunten ; Ioben ] √ n−1 x(χ2 (n − 1), 1 − α2 ) 15 Chi Quadrat Unabhängigkeitstest Länge des 1 − α–Konfidenzintervalls L1−α e s 2 · x(T (n − 1), 1 − α2 ) · √ n−1 = 14 Konfidenzintervall für die Standardabweichung unter Normalverteilung bei unbekanntem Erwartungswert 1 − α–Konfidenzintervall I1−α = [Iunten ; Ioben ] √ e s· n−1 Iunten = q x(χ2 (n − 1), 1 − α2 ) √ e s· n−1 Ioben = q x(χ2 (n − 1), α2 ) n P xi i=1 Mittelwert X = n Sicherheitswahrscheinlichkeit γ = 1 − α v u u n tP (xi − X)2 i=1 e s= n−1 Länge des 1 − α–Konfidenzintervalls L1−α j=1 Y1 ... ... j=m Ym Σ i=1 .. . X1 .. . a1,1 .. . ... .. . a1,m .. . a1,• . .. . i=n Xn an,1 ... an,m an,• Σ a•,1 ... a•,m a•,• H0 : X und Y sind unabhängig H1 : X und Y sind abhängig absolute Häufigkeit ai, j erwartete Häufigkeit ei, j ei, j = ai,• · a•, j a•,• Bedingung ei, j > 5 für alle i und j Test-statistik: Xbere = n P m (ai, j − ei, j )2 P ei, j i=1 j=1 α sonst α = 0.05 Der kritischer Wert x(χ2 ((n − 1) · (m − 1)); 1 − α) ist aus einem Tafelwerk abzulesen falls Xbere > x(χ2 ((n − 1) · (m − 1)); 1 − α), ist H0 auf dem α–Signifikanzniveau abzulehnen = 4 e s Iunten = X − x(T (n − 1), 1 − α2 ) · √ n−1 − q e s· i=1 Sicherheitswahrscheinlichkeit γ = 1 − α H0 : p = p 0 b p − p0 n P e s Mittelwert X = n v u u n tP (xi − X)2 i=1 e s= n−1 H0 : p ≤ p 0 Zbere = Ioben = X + x(T (n − 1), 1 − α 2) Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected] 12 Test für einen Anteilswert p Das einfache zentrale Schwankungsintervall ist [µ − σ; µ + σ] a= pi gegeben bzw. gerechnet b p gegeben bzw. geschätzt b p= absolute Häufigkeit ai erwartete Häufigkeit ei = api ei > 1 für alle i und ei > 5 für mindestens 80% alle i, sonst Nachbarklassen zusammenfassen Das dreifache zentrale Schwankungsintervall ist [µ − 3σ; µ + 3σ] H0 : Pr(xi ) = pi für alle i • im Intervall [µ − 3σ; µ + 3σ] mindestens 89% Der kritischer Wert x(χ2 (n − 1); 1 − α) ist aus einem Tafelwerk abzulesen i xi ai pi ei 1 x1 a1 p1 e1 2 .. . x2 .. . a2 .. . p2 .. . e2 .. . n−1 xn−1 an−1 pn−1 en−1 xn an pn = 1 + p1 -. . . -pn−1 en a 1 a n . Σ i=1 absolute Häufigkeit ai H1 : Es liegt nicht eine Diskrete Gleichverteilung vor Test-statistik: Xbere = n (ai − ei )2 P ei i=1 α sonst α = 0.05 Der kritischer Wert x(χ2 (n − 1 − m); 1 − α) ist aus einem Tafelwerk abzulesen 18 Chi Anpassungstest für die Wahrscheinlichkeiten einer Diskrete Gleichverteilung i xi ai pi ei 1 x1 a1 p1 e1 2 .. . x2 .. . a2 .. . p2 .. . e2 .. . n−1 xn−1 an−1 pn−1 en−1 xn an pn en a 1 a n ai Anzahl der geschätzten Parameter m Σ falls Xbere > x(χ2 (n − 1 − m); 1 − α), ist H0 auf dem α–Signifikanzniveau abzulehnen . 5 a= n P 2 falls Xbere > x(χ (n − 1); 1 − α), ist H0 auf dem α–Signifikanzniveau abzulehnen 17 Chi Anpassungstest für diskreten Wahrscheinlichkeiten pi = b p H0 : Es liegt eine Diskrete Gleichverteilung vor α sonst α = 0.05 aller xi –Werte zu erwarten n ei > 1 für alle i und ei > 5 für mindestens 80% alle i, sonst Nachbarklassen zusammenfassen n (ai − ei )2 P = ei i=1 • im Intervall [µ − 2σ; µ + 2σ] mindestens 75% • im Intervall [µ − 4σ; µ + 4σ] mindestens 93.75% 1 erwartete Häufigkeit ei = api H1 : Pr(x j ) , p j für mindestens ein j Test-statistik: Xbere ai i=1 Das zweifache zentrale Schwankungsintervall ist [µ − 2σ; µ + 2σ] Bei jeder Zufallsvariable X sind wegen Pr(|X − 1 E[X]| ≥ kσ[X]) ≤ 2 k n P Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected] 16 zentrale Schwankungsintervall i ai pi ei 1 a1 p1 e1 2 .. . a2 .. . p2 .. . e2 .. . n−1 an−1 pn−1 en−1 >n .. . an .. . pn = 1 - p1 -. . . -pn−1 .. . en .. . Σ a 1 a a= X= n P iai i=1 a b p gegeben bzw. geschätzt b p= n (ai − ei )2 P ei i=1 absolute Häufigkeit ai erwartete Häufigkeit ei = api α sonst α = 0.05 Der kritischer Wert x(χ2 (n − 1 − m); 1 − α) ist aus einem Tafelwerk abzulesen ei > 1 für alle i und ei > 5 für mindestens 80% alle i, sonst Nachbarklassen zusammenfassen falls Xbere > x(χ2 (n − 1 − m); 1 − α), ist H0 auf dem α–Signifikanzniveau abzulehnen H0 : Es liegt eine Binomialverteilung vor . ai i=1 n P Test-statistik: Xbere = 1 X pi = PrGeo(bp) (X = i) für i < n Anzahl der geschätzten Parameter m absolute Häufigkeit ai Test-statistik: Xbere = 20 Chi Anpassungstest für die Wahrscheinlichkeiten einer Binomialverteilung i ai pi ei 0 a0 p0 e0 1 a1 p1 e1 2 .. . a2 .. . p2 .. . e2 .. . n−1 an−1 pn−1 en−1 n an pn = 1 - p1 -. . . -pn−1 en Σ a 1 a a= erwartete Häufigkeit ei = api ei > 1 für alle i und ei > 5 für mindestens 80% alle i, sonst Nachbarklassen zusammenfassen H0 : Es liegt eine Geometrische Verteilung vor X= n P ai i=0 n P iai i=0 a b p gegeben bzw. geschätzt b p= X n pi = PrBin(n,bp) (X = i) für i < n H1 : Es liegt nicht eine Geometrische Verteilung vor H1 : Es liegt nicht eine Binomialverteilung vor Anzahl der geschätzten Parameter m n (ai − ei )2 P ei i=0 α sonst α = 0.05 Der kritischer Wert x(χ2 (n − 1 − m); 1 − α) ist aus einem Tafelwerk abzulesen falls Xbere > x(χ2 (n − 1 − m); 1 − α), ist H0 auf dem α–Signifikanzniveau abzulehnen . 21 Chi Anpassungstest für die Wahrscheinlichkeiten einer Poissonverteilung ai pi ei 0 a0 p0 e0 1 a1 p1 e1 2 .. . a2 .. . p2 .. . e2 .. . n−1 an−1 pn−1 en−1 >n .. . an .. . pn = 1 - p1 -. . . -pn−1 ... en .. . Σ a 1 a . 6 i Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected] 19 Chi Anpassungstest für die Wahrscheinlichkeiten einer Geometrische Verteilung X= n P 22 Chi Anpassungstest für die Wahrscheinlichkeiten einer Normalverteilung ai i=0 n P iai i=0 a F Nor(bµ,bσ2 ) (x1 ) ,i = 1 pi = F Nor(bµ,bσ2 ) (xi ) − F Nor(bµ,bσ2 ) (xi−1 ) , 1 < i < n 1 − p1 − · · · − pn−1 ,i = n b λ gegeben bzw. geschätzt b λ=X i Klassen ai pi ei Anzahl der geschätzten Parameter m 1 a1 p1 e1 absolute Häufigkeit ai Anzahl der geschätzten Parameter m 2 .. . ] − ∞, x1 ] ]x1 , x2 ] .. . a2 .. . p2 .. . e2 .. . ]xn−2 , xn−1 ] an−1 pn−1 en−1 ]xn−1 , +∞[ an pn en a 1 a pi = PrPoi(bλ) (X = i) für i < n absolute Häufigkeit ai erwartete Häufigkeit ei = api n−1 n Σ ei > 1 für alle i und ei > 5 für mindestens 80% alle i, sonst Nachbarklassen zusammenfassen H0 : Es liegt eine Poissonverteilung vor H1 : Es liegt nicht eine Poissonverteilung vor Test-statistik: Xbere n (ai − ei )2 P = ei i=0 a= 2 falls Xbere > x(χ (n − 1 − m); 1 − α), ist H0 auf dem α–Signifikanzniveau abzulehnen erwartete Häufigkeit ei = api ei > 1 für alle i und ei > 5 für mindestens 80% alle i, sonst Nachbarklassen zusammenfassen H0 : Es liegt eine Normalverteilung vor H1 : Es liegt nicht eine Normalverteilung vor ai i=1 x1 Klassenmitte ci = 0.5(xi + xi−1 ) xn−1 α sonst α = 0.05 Der kritischer Wert x(χ2 (n − 1 − m); 1 − α) ist aus einem Tafelwerk abzulesen n P . X= n P ,i = 1 ,1 < i < n ,i = n Test-statistik: Xbere = n (ai − ei )2 P ei i=1 α sonst α = 0.05 Der kritischer Wert x(χ2 (n − 1 − m); 1 − α) ist aus einem Tafelwerk abzulesen ci a i i=1 falls Xbere > x(χ2 (n − 1 − m); 1 − α), ist H0 auf dem α–Signifikanzniveau abzulehnen a b µ gegeben bzw. geschätzt b µ=X v u u n tP b σ gegeben bzw. geschätzt b σ= (ci − b µ)2 ai i=1 Dozent Mohamed Naji http://infonaji.comlu.com 12. April 2017 [email protected] a= a 7