7 Tests für Mittelwert und Varianz Gauß-Test für den Mittelwert 7.1 Zusammenfassung: Gauß-Test für den Mittelwert 7 Tests für Mittelwert und Varianz Gauß-Test für Anteilswert p 7.2 Zusammenfassung: (Approx.) Gauß-Test für Anteilswert p bei bekannter Varianz Anwendungsvoraussetzungen exakt: Y ∼ N(µ, σ 2 ) mit µ ∈ R unbekannt, σ 2 bekannt approximativ: E (Y ) = µ ∈ R unbekannt, Var(Y ) = σ 2 bekannt X1 , . . . , Xn einfache Stichprobe zu Y Nullhypothese Gegenhypothese H0 : µ ≤ µ0 H1 : µ > µ0 H0 : µ = µ0 H1 : µ 6= µ0 Teststatistik Verteilung (H0 ) Benötigte Größen Kritischer Bereich zum Niveau α N= H0 : µ ≥ µ0 H1 : µ < µ0 Verteilung (H0 ) (N1−α , ∞) 2 · (1 − Φ(|N|)) p-Wert Benötigte Größen (−∞, −N1−α ) 1 − Φ(N) Kritischer Bereich zum Niveau α H0 : p ≤ p0 H1 : p > p0 H0 : p = p0 H1 : p 6= p0 H0 : p ≥ p0 H1 : p < p0 2 · (1 − Φ(|N|)) p-Wert Φ(N) einer normalverteilten Zufallsvariablen mit bekanntem Erwartungswert exakt: Y ∼ N(µ, σ 2 ) mit µ ∈ R, σ 2 ∈ R++ unbekannt approximativ: E (Y ) = µ ∈ R, Var(Y ) = σ 2 ∈ R++ unbekannt X1 , . . . , Xn einfache Stichprobe zu Y t= Benötigte Größen 1 − Φ(N) Φ(N) (−∞, −tn−1;1− α2 ) ∪(tn−1;1− α2 , ∞) Kritischer Bereich zum Niveau α Folie 132 Chi-Quadrat-Test für die Varianz 7.4 Schließende Statistik (WS 2013/14) Folie 134 8 Anpassungs- und Unabhängigkeitstests Chi-Quadrat-Anpassungstest 8.1 X − µ0 √ n S (tn−1;1−α , ∞) 2 · (1 − Ft(n−1) (|t|)) 1 − Ft(n−1) (t) Folie 138 Zusammenfassung: Chi-Quadrat-Anpassungstest zur Anpassung an eine vorgegebene Verteilung zur Anpassung an parametrische Verteilungsfamilie H0 : σ 2 = σ02 H1 : σ 2 6= σ02 Nullhypothese Gegenhypothese H0 : σ 2 ≤ σ02 H1 : σ 2 > σ02 χ2 = Teststatistik Verteilung (H0 ) Benötigte Größen v u u S =t p-Wert Schließende Statistik (WS 2013/14) n 1X Xi n i=1 [0, χ2n−1; α ) 2 ∪(χ2n−1;1− α , ∞) 2 2 · min Fχ2 (n−1) (χ2 ), 1 − Fχ2 (n−1) (χ2 ) Benötigte Größen [0, χ2n−1;α ) 1 − Fχ2 (n−1) (χ2 ) Fχ2 (n−1) (χ2 ) H0 : µA ≤ µB H1 : µA > µB Teststatistik Verteilung (H0 ) Benötigte Größen Kritischer Bereich zum Niveau α p-Wert Schließende Statistik (WS 2013/14) t= H0 : µA ≥ µB H1 : µA < µB 2 · (1 − Ft(n−1) (|t|)) X√ n S Schließende Statistik (WS 2013/14) Folie 157 9 Mittelwert- und Varianzvergleiche Mittelwertvergleiche bei zwei unabhängigen Stichproben 9.2 (−∞, −tn−1;1−α ) 1 − Ft(n−1) (t) Ft(n−1) (t) Folie 183 Anwendungsvoraussetzungen Kritischer Bereich zum Niveau α p-Wert Anwendungsvoraussetzungen exakt: Y A ∼ N(µA , σA2 ), Y B ∼ N(µB , σB2 ), σA2 , σB2 bekannt X1A , . . . , XnAA einfache Stichprobe zu Y A , unabhängig von einfacher Stichprobe X1B , . . . , XnBB zu Y B . H0 : µA ≤ µB H1 : µA > µB H0 : µA = µB H1 : µA 6= µB Nullhypothese Gegenhypothese H0 : µA ≥ µB H1 : µA < µB XA − XB N= q 2 σA σ2 + nBB nA Teststatistik Verteilung (H0 ) N für µA = µB N(0, 1)-verteilt XA = 1 nA PnA i=1 XiA , XB = 1 nB (−∞, −N1− α2 ) ∪(N1− α2 , ∞) 2 · (1 − Φ(|N|)) PnB i=1 Benötigte Größen XiB (N1−α , ∞) (−∞, −N1−α ) 1 − Φ(N) Φ(N) zum Niveau α p-Wert Folie 187 9 Mittelwert- und Varianzvergleiche Nullhypothese Gegenhypothese H0 : H1 : = 6 = H0 : H1 : Benötigte Größen SY2 B Kritischer Bereich zum Niveau α p-Wert Schließende Statistik (WS 2013/14) ≥ < σB2 σB2 Mittelwertvergleiche bei k > 2 unabhängigen Stichproben 9.4 [0, FnA −1,nB −1; α ) 2 nA −1,nB −1;1− α 2 ∪(F , ∞) 2·min FF (nA −1,nB −1) (F ), 1 − FF (nA −1,nB −1) (F ) (FnA −1,nB −1;1−α , ∞) 1−FF (nA −1,nB −1) (F ) Nullhypothese Gegenhypothese exakt: Yj ∼ N(µj , σ 2 ) für j ∈ {1, . . . , k} approximativ: Yj beliebig verteilt mit E(Yj ) = µj , Var(Yj ) = σ 2 k unabhängige einfache Stichproben Xj,1 , . . . , Xj,nj vom Umfang P nj zu Yj für j ∈ {1, . . . , k}, n = kj=1 nj H0 : µ1 = µj für alle j ∈ {2, . . . , k} H1 : µ1 6= µj für (mindestens) ein j ∈ {2, . . . , k} SB/(k − 1) F = SW /(n − k) Teststatistik F unter H0 für σA2 = σB2 F (nA − 1, nB − 1)-verteilt PnA A PB B X B = n1B ni=1 Xi , i=1 Xi , P PA 2 nA = nA1−1 ni=1 (XiA − X A )2 = nA1−1 (X A )2 − nA X A Pi=1 i PnB 2 nB B 2 B 2 1 1 B B − nB X = nB −1 i=1 (Xi − X ) = nB −1 i=1 (Xi ) 1 nA XA = SY2 A H0 : H1 : σA2 σA2 S2 A F = Y2 SY B Teststatistik Verteilung (H0 ) ≤ > σB2 σB2 Verteilung (H0 ) Benötigte Größen FF (nA −1,nB −1) (F ) j=1 Kritischer Bereich zum Niveau α p-Wert Folie 203 k X Schließende Statistik (WS 2013/14) nj · (x j − x)2 , SW = H0 : µA ≤ µB H1 : µA > µB H0 : µA = µB H1 : µA 6= µB Y nA +nB −2 (−∞, −tnA +nB −2;1− α ) 2 ∪(tnA +nB −2;1− α , ∞) i=1 1 − Ft(nA +nB −2) (t) [0, χ2n;α ) Fχ2 (n) (χ2 ) 1 − Fχ2 (n) (χ ) Folie 147 8 Anpassungs- und Unabhängigkeitstests Chi-Quadrat-Unabhängigkeitstest 8.2 Anwendungsvoraussetzungen approximativ: (Y A , Y B ) beliebig verteilt (X1A , X1B ), . . . , (XnA , XnB ) einfache Stichprobe zu (Y A , Y B ) Ausprägungen {a1 , . . . , ak } von Y A , {b1 , . . . , bl } von Y B oder Klassengrenzen a1 < . . . < ak−1 zu Y A , b1 < . . . < bl−1 zu Y B Nullhypothese Gegenhypothese H0 : Y A ,Y B stochastisch unabhängig H1 : Y A ,Y B nicht stochastisch unabhängig k X l k X l X X nij2 (nij − e nij )2 −n χ2 = = e e nij nij i=1 j=1 i=1 j=1 Teststatistik Verteilung (H0 ) Benötigte Größen χ2 ist näherungsweise χ2 ((k − 1) · (l − 1))-verteilt, falls H0 gilt (Näherung nur vernünftig, falls e nij ≥ 5 für alle i, j) nij = #{m ∈ {1, . . . , n} | (xm , ym ) ∈ Ai × Bj } für alle i, j mit Ai = {ai }, Bj = {bj } bzw. Klassen Ai , Bj nach vorg. Grenzen, P P n ·n e nij = i·n ·j mit ni· = lj=1 nij , n·j = ki=1 nij , (χ2(k−1)·(l−1);1−α , ∞) 1 − Fχ2 ((k−1)·(l−1)) (χ2 ) Schließende Statistik (WS 2013/14) Folie 177 9 Mittelwert- und Varianzvergleiche Anwendungsvoraussetzungen Nullhypothese Gegenhypothese Verteilung (H0 ) Benötigte Größen (−∞, −tnA +nB −2;1−α ) 2 2 · (1 − Ft(nA +nB −2) (|t|)) 2 Schließende Statistik (WS 2013/14) Teststatistik PnB (XiA −X A )2 + i=1 (XiB −X B )2 nA +nB −2 (tnA +nB −2;1−α , ∞) (χ2n;1−α , ∞) Mittelwertvergleiche bei zwei unabhängigen Stichproben 9.2 Ft(nA +nB −2) (t) Folie 189 Konfidenzintervalle und Tests 10.4 Kritischer Bereich zum Niveau α p-Wert approx.: Y A ∼ B(1, pA ), Y B ∼ B(1, pB ), pA , pB unbekannt X1A , . . . , XnAA einfache Stichprobe zu Y A , unabhängig von einfacher Stichprobe X1B , . . . , XnBB zu Y B . H0 : pA ≤ pB H1 : pA > pB H0 : pA = pB H1 : pA 6= pB H0 : pA ≥ pB H1 : pA < pB r b b pA − b pB pA − b pB nA · nB t= q = 2 S nA + nB S2 + nSB nA t für pA = pB näherungsweise t(nA + nB − 2)-verteilt (Näherung ok, falls 5 ≤ nA b pA ≤ nA − 5 und 5 ≤ nB b pB ≤ nB − 5) PnA A PnB B b pA = n1A i=1 Xi , b pB = n1B i=1 Xi , q pA )+nB ·b pB ·(1−b pB ) S = nA ·bpA ·(1−b nA +nB −2 (−∞, −tnA +nB −2;1− α ) 2 ∪(tnA +nB −2;1− α , ∞) (tnA +nB −2;1−α , ∞) (−∞, −tnA +nB −2;1−α ) 1 − Ft(nA +nB −2) (t) Ft(nA +nB −2) (t) 2 2 · (1 − Ft(nA +nB −2) (|t|)) Schließende Statistik (WS 2013/14) Folie 193 10 Lineare Regression Konfidenzintervalle und Tests 10.4 Zusammenfassung: t-Test für den Parameter β1 Zusammenfassung: t-Test für den Parameter β2 im einfachen linearen Regressionsmodell mit Normalverteilungsannahme im einfachen linearen Regressionsmodell mit Normalverteilungsannahme Anwendungsvoraussetzungen Nullhypothese Gegenhypothese Kritischer Bereich zum Niveau α j=1 i=1 PnA = 10 Lineare Regression Benötigte Größen (Fk−1,n−k;1−α , ∞) Y Schließende Statistik (WS 2013/14) Verteilung (H0 ) nj k X X (xj,i − x j )2 H0 : µA ≥ µB H1 : µA < µB r XA − XB XA − XB nA · nB t= q = 2 S nA + nB S2 + nSB nA t für µA = µB (näherungsweise) t(nA + nB − 2)-verteilt PA A PB B X A = n1A ni=1 Xi , X B = n1B ni=1 Xi , r r (nA −1)S 2 A +(nB −1)S 2 B [0, χ2n; α ) 2 ∪(χ2n;1− α , ∞) 2 2 · min Fχ2 (n) (χ2 ), 1 − Fχ2 (n) (χ2 ) Zusammenfassung: 2-Stichproben-t-Test für Anteilswerte exakt: Y A ∼ N(µA , σA2 ), Y B ∼ N(µB , σB2 ), µA , µB , σA2 = σB2 unbek. approx.: E(Y A ) = µA , E(Y B ) = µB , Var(Y A ) = Var(Y B ) unbekannt X1A , . . . , XnAA einfache Stichprobe zu Y A , unabhängig von einfacher Stichprobe X1B , . . . , XnBB zu Y B . iid exakt: yi = β1 + β2 · xi + ui mit ui ∼ N(0, σ 2 ) für i ∈ {1, . . . , n}, σ 2 unbekannt, x1 , . . . , xn deterministisch und bekannt, Realisation y1 , . . . , yn beobachtet H0 : β1 = β10 H1 : β1 6= β10 H0 : β1 ≤ β10 H1 : β1 > β10 Teststatistik F ist (approx.) F (k − 1, n − k)-verteilt, falls µ1 = . . . = µk nj k 1 X 1X xj = xj,i für j ∈ {1, . . . , k}, x = nj · x j , nj i=1 n j=1 SB = [0, FnA −1,nB −1;α ) Kritischer Bereich Folie 168 Mittelwertvergleiche bei zwei unabhängigen Stichproben 9.2 S= Schließende Statistik (WS 2013/14) Anwendungsvoraussetzungen exakt: Y ∼ N(µA , σA2 ), Y B ∼ N(µB , σB2 ), µA , µB , σA2 , σB2 unbek. X1A , . . . , XnAA einfache Stichprobe zu Y A , unabhängig von einfacher Stichprobe X1B , . . . , XnBB zu Y B . 9 Mittelwert- und Varianzvergleiche H0 : σ 2 ≥ σ02 H1 : σ 2 < σ02 e2 n·S χ2 = σ02 χ2 (für σ 2 = σ02 ) χ2 (n)-verteilt v u n u1 X e=t S (Xi − µ)2 n i=1 p-Wert 1 − Fχ2 (k−r −1) (χ2 ) Schließende Statistik (WS 2013/14) p-Wert Kritischer Bereich zum Niveau α (χ2k−r −1;1−α , ∞) bei unbekannten, aber übereinstimmenden Varianzen Zusammenfassung: Einfache Varianzanalyse A σA2 σA2 pi0 = Fθb(ak ) − Fθb(ak−1 ) mit a0 := −∞, ak := ∞, ni = #{j ∈ {1, . . . , n} | xj ∈ (ai−1 , ai ]}, i ∈ {1, . . . , k} Zusammenfassung: 2-Stichproben-t-Test zweier normalverteilter Zufallsvariablen σB2 σB2 i=1 bei bekannten Varianzen Benötigte Größen Varianzvergleiche bei zwei unabhängigen Stichproben 9.3 σA2 σA2 χ2 ist unter H0 näherungsweise χ2 (k − r − 1)-verteilt, wenn θb ML-Schätzer des r -dim. Verteilungsparameters θ auf Basis klassierter Daten ist (Verwendung von θb siehe unten). (Näherung nur vernünftig, falls npi0 ≥ 5 für i ∈ {1, . . . , k}) Zusammenfassung: 2-Stichproben-Gauß-Test Verteilung (H0 ) Zusammenfassung: F -Test zum Vergleich der Varianzen Anwendungsvoraussetzungen χ2 = Verteilung (H0 ) Kritischer Bereich zum Niveau α 1 − Fχ2 (k−1) (χ2 ) Teststatistik (tn−1;1−α , ∞) 9 Mittelwert- und Varianzvergleiche Teststatistik Benötigte Größen (χ2k−1;1−α , ∞) Nullhypothese Gegenhypothese t für µA = µB (näherungsweise) t(n − 1)-verteilt n 1X Xi = XiA − XiB für i ∈ {1, . . . , n}, X = Xi n i=1 v v ! u u n n X u 1 u 1 X 2 S =t (Xi − X )2 = t X 2 − nX n − 1 i=1 n − 1 i=1 i (−∞, −tn−1;1− α2 ) ∪(tn−1;1− α2 , ∞) −n H0 : FY = Fθ für ein θ ∈ Θ H1 : FY 6= Fθ (für alle θ ∈ Θ) ! 2 k k ni X − pi0 (ni − npi0 )2 1 X ni2 n =n = −n n i=1 pi0 npi0 pi0 i=1 p-Wert Folie 150 exakt: (Y A , Y B ) gemeinsam (zweidimensional) normalverteilt, E(Y A ) = µA , E(Y B ) = µB sowie Varianzen/Kovarianz unbekannt approx.: E(Y A ) = µA , E(Y B ) = µB , Var(Y A ), Var(Y B ) unbek. (X1A , X1B ), . . . , (XnA , XnB ) einfache Stichprobe zu (Y A , Y B ) H0 : µA = µB H1 : µA 6= µB ! k X H0 : σ 2 ≤ σ02 H1 : σ 2 > σ02 Zusammenfassung: Chi-Quadrat-Unabhängigkeitstest approx.: Y beliebig verteilt, X1 , . . . , Xn einf. Stichprobe zu Y Familie von Verteilungsfunktionen Fθ für θ ∈ Θ vorgegeben k − 1 Klassengrenzen a1 < a2 < . . . < ak−1 vorgegeben Nullhypothese Gegenhypothese pi0 = F0 (ai ) − F0 (ai−1 ) mit a0 := −∞, ak := ∞, ni = #{j ∈ {1, . . . , n} | xj ∈ (ai−1 , ai ]}, i ∈ {1, . . . , k} p-Wert Mittelwertvergleiche bei verbundenen Stichproben 9.1 Nullhypothese Gegenhypothese k 1 X ni2 n i=1 pi0 Anwendungsvoraussetzungen χ2 ist näherungsweise χ2 (k − 1)-verteilt, falls FY = F0 (Näherung nur vernünftig, falls npi0 ≥ 5 für i ∈ {1, . . . , k}) Kritischer Bereich zum Niveau α Zusammenfassung: t-Differenzentest Anwendungsvoraussetzungen H0 : FY = F0 H1 : FY 6= F0 2 k k ni 0 2 X (ni − np ) X − pi0 i n χ2 = =n = 0 np pi0 i i=1 i=1 Verteilung (H0 ) (χ2n−1;1−α , ∞) 9 Mittelwert- und Varianzvergleiche Nullhypothese Gegenhypothese Teststatistik χ2 (für σ 2 = σ02 ) χ2 (n − 1)-verteilt v ! u n n X u 1 1 X 2 (Xi − X )2 = t X 2 − nX n − 1 i=1 n − 1 i=1 i mit X = Kritischer Bereich zum Niveau α (n − 1)S σ02 H0 : σ 2 ≥ σ02 H1 : σ 2 < σ02 2 approximativ: Y beliebig verteilt X1 , . . . , Xn einfache Stichprobe zu Y k − 1 Klassengrenzen a1 < a2 < . . . < ak−1 vorgegeben Kritischer Bereich zum Niveau α Ft(n−1) (t) Zusammenfassung: Chi-Quadrat-Anpassungstest Anwendungsvoraussetzungen Benötigte Größen Chi-Quadrat-Anpassungstest 8.1 einer normalverteilten Zufallsvariablen mit unbekanntem Erwartungswert exakt: Y ∼ N(µ, σ 2 ), µ ∈ R unbekannt, σ 2 ∈ R++ unbekannt X1 , . . . , Xn einfache Stichprobe zu Y Verteilung (H0 ) (−∞, −tn−1;1−α ) Zusammenfassung: χ2 -Test für die Varianz Anwendungsvoraussetzungen H0 : σ 2 = σ02 H1 : σ 2 6= σ02 Teststatistik Schließende Statistik (WS 2013/14) 8 Anpassungs- und Unabhängigkeitstests exakt: Y ∼ N(µ, σ 2 ), µ ∈ R bekannt, σ 2 ∈ R++ unbekannt X1 , . . . , Xn einfache Stichprobe zu Y Anwendungsvoraussetzungen Nullhypothese Gegenhypothese H0 : µ ≥ µ0 H1 : µ < µ0 t für µ = µ0 (näherungsweise) t(n − 1)-verteilt n 1X X = Xi n v v i=1 ! u u n n X u 1 u 1 X 2 S =t (Xi − X )2 = t X 2 − nX n − 1 i=1 n − 1 i=1 i p-Wert Schließende Statistik (WS 2013/14) 7 Tests für Mittelwert und Varianz H0 : µ ≤ µ0 H1 : µ > µ0 H0 : µ = µ0 H1 : µ 6= µ0 Verteilung (H0 ) (−∞, −N1−α ) Chi-Quadrat-Test für die Varianz 7.4 bei unbekannter Varianz Teststatistik (N1−α , ∞) 7 Tests für Mittelwert und Varianz Zusammenfassung: χ2 -Test für die Varianz Nullhypothese Gegenhypothese √ b p − p0 N= p n p0 · (1 − p0 ) N für p = p0 näherungsweise N(0, 1)-verteilt n 1X b p= Xi n i=1 (−∞, −N1− α2 ) ∪(N1− α2 , ∞) t-Test für den Mittelwert 7.3 Zusammenfassung: t-Test für den Mittelwert Anwendungsvoraussetzungen approximativ: Y ∼ B(1, p) mit p ∈ [0, 1] unbekannt X1 , . . . , Xn einfache Stichprobe zu Y Nullhypothese Gegenhypothese Teststatistik X − µ0 √ n σ N für µ = µ0 (näherungsweise) N(0, 1)-verteilt n 1X Xi X = n i=1 (−∞, −N1− α2 ) ∪(N1− α2 , ∞) Anwendungsvoraussetzungen 7 Tests für Mittelwert und Varianz p-Wert t= t für β1 = β10 2 · (1 − Ft(n−2) (|t|)) Nullhypothese Gegenhypothese βb1 − β10 σ bβb1 iid exakt: yi = β1 + β2 · xi + ui mit ui ∼ N(0, σ 2 ) für i ∈ {1, . . . , n}, σ 2 unbekannt, x1 , . . . , xn deterministisch und bekannt, Realisation y1 , . . . , yn beobachtet H0 : β2 = β20 H1 : β2 6= β20 H0 : β2 ≤ β20 H1 : β2 > β20 Teststatistik t(n − 2)-verteilt s (sY2 − βb2 · sX ,Y ) · x 2 (n − 2) · sX2 sX ,Y βb2 = 2 , βb1 = y − βb2 · x, σ bβb1 = sX (−∞, −tn−2;1− α2 ) ∪(tn−2;1− α2 , ∞) H0 : β1 ≥ β10 H1 : β1 < β10 Anwendungsvoraussetzungen t= β20 Verteilung (H0 ) Benötigte Größen (tn−2;1−α , ∞) (−∞, −tn−2;1−α ) 1 − Ft(n−2) (t) Ft(n−2) (t) Kritischer Bereich zum Niveau α p-Wert sX ,Y βb2 = 2 , σ bβb2 = sX H0 : β2 ≥ β20 H1 : β2 < β20 βb2 − β20 σ bβb2 t für β2 = t(n − 2)-verteilt s sY2 − βb2 · sX ,Y (n − 2) · sX2 (−∞, −tn−2;1− α2 ) ∪(tn−2;1− α2 , ∞) 2 · (1 − Ft(n−2) (|t|)) (tn−2;1−α , ∞) (−∞, −tn−2;1−α ) 1 − Ft(n−2) (t) Ft(n−2) (t) 1 − FF (k−1,n−k) (F ) Folie 210 Schließende Statistik (WS 2013/14) Folie 246 Schließende Statistik (WS 2013/14) Folie 247