W. Timischl, Angewandte Statistik - Formeln (22.2.03) 1 1 Parameterschätzung 1.1 Mittelwert und Varianz Zufallsstichprobe der metrischen Variablen X vom Umfang n : X 1 , X 2 ,..., X n (Arithmetischer) Mittelwert: X = 1 n ∑ Xi n i =1 Varianz: S2 = 1 n (X i − X )2 ∑ n − 1 i =1 Standardabweichung: 1 n 2 S= ∑ (X i − X ) n − 1 i =1 (1-α)-Konfidenzintervall für den Mittelwert µ: [X − tn −1,1−α / 2 SE , X + tn −1,1−α / 2 SE ] SE = S / n Approximation für großes n: [X − z 1−α / 2 SE , X + z1−α / 2 SE ] Planung des Stichprobenumfanges (Approximation für großes n): Notwendiger Stichprobenumfang für Mittelwertschätzung mit Genauigkeit d und Sicherheit 1 - α: σ z n ≈ 1−α / 2 d 2 (1-α)-Konfidenzintervall für die Varianz σ2: (n − 1) S 2 (n − 1) S 2 , 2 2 χ n −1,1−α / 2 χ n −1,α / 2 StatFormeln03 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) 2 1.2 Robuste Mittelwertschätzer Zufallsstichprobe der metrischen Variablen X vom Umfang n: X 1 , X 2 ,..., X n Nach aufsteigender Größe geordnete Stichprobe: X (1) , X ( 2) ,..., X ( n ) γ-getrimmter Mittelwert (z.B.: γ = 0.1 oder 0.2; g=[nγ]): Xt = X ( g +1) + X ( g + 2) + L + X ( n − g ) n − 2g (1-α)-Konfidenzintervall für den γ-getrimmten Mittelwert µτ: [X t − tn − 2 g −1,1−α / 2 SE ( X t ), SE ( X t ) = X t + t n − 2 g −1,1−α / 2 SE ( X t ) ] sw (1 − 2γ ) n sw ist die Standardabweichung der "γ-winsorierten" Stichprobe W1, W2, ..., Wn mit X ( g +1) Wi = X i X (n − g ) Median: X (( n +1) / 2 ) ~ X 0.5 = 1 2 X ( n / 2 ) + X (( n +1) / 2) ( StatFormeln03 für X i ≤ X ( g +1) für X ( g +1) < X i < X ( n − g ) für X i ≥ X ( n − g ) für gerades n ) für ungerades n 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) 3 1.3 Wahrscheinlichkeit Zufallsstichprobe der dichotomen (0/1-skalierten) Variablen X vom Umfang n : X 1 , X 2 ,..., X n m = absolute Häufigkeit der Ausprägung 1 (Anzahl der Untersuchungseinheiten mit der Ausprägung 1) Exaktes (1-α)-Konfidenzintervall [pu, po] für die Wahrscheinlichkeit p: pu = mF2 m, 2( n − m +1),α / 2 n − m + 1 + mF2 m, 2( n − m +1),α / 2 , po = (m + 1) F2( m +1),2( n − m ),1−α / 2 n − m + (m + 1) F2( m +1),2( n − m ),1−α / 2 (pu, po = unterer bzw. oberer Pearson-Clopper-Wert) Approximatives (1-α)-Konfidenzintervall für die Wahrscheinlichkeit p: Voraussetzung: n > 20 und 10 ≤ m ≤ n-10 h(1 − h) h(1 − h) − + h z , h z 1 −α / 2 1 −α / 2 n n ( h = m/n = Anteil der Untersuchungseinheiten mit der Ausprägung 1) Planung des Stichprobenumfanges: Notwendiger Stichprobenumfang zur Schätzung von p mit Genauigkeit d und Sicherheit 1 - α: z n ≈ 1−α / 2 2d StatFormeln03 2 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) 4 2 Testen von Hypothesen Die Entscheidungsalternativen (Hypothesen) z.B. über den Mittelwert µ einer Verteilung: 2-seitiger Test auf Abweichung: H0 : µ =µo versus H1: µ ≠ µo (Fall I) 1-seitiger Test auf Überschreitung: H0 : µ ≤µo versus H1: µ > µo (Fall IIa) 1-seitiger Test auf Unterschreitung: H0 : µ ≥µo versus H1: µ < µo (Fall IIb) Das Entscheidungsproblem Wahrer Sachverhalt H0 ist richtig H1 ist richtig Entscheidung für H0 (gegen H1) richtige Entscheidung Fehlentscheidung (Fehler 2. Art) Entscheidung für H1 (gegen H0) Fehlentscheidung (Fehler 1. Art) richtige Entscheidung Die Fehlerrisken 1. Fehler 1. Art (α-Fehler): irrtümliche Ablehnung von H0 ; Testentscheidung so, dass P(Entscheidung für H1 | Ho ist richtig) ≤ α. 2. Fehler 2. Art (β-Fehler): irrtümliche Nichtablehnung von H0; P(keine Entscheidung für H1 | H1 ist richtig) ≤ β, u.a. vom Verteilungsparameter µ abhängig. Zusammenfassung beider Fehlerrisken in der Gütefunktion (power): G(µ) = P(Ablehnung von H0 | µ) = Wahrscheinlichkeit, auf Grund einer Zufallsstichprobe gegen H0 zu entscheiden. Logik der Testentscheidung Entscheidung erfolgt mit einer (für den jeweiligen Test typischen) Testgröße TG; Zufallsstichprobe Æ Realisierung TGs. Entscheidung gegen Ho, wenn Realisierung TGs (oder gegenüber Ho noch extremerer Wert) unter der Voraussetzung der Gültigkeit von Ho "sehr unwahrscheinlich" (d.h. kleiner als α) ist. Menge der "sehr unwahrscheinlichen" TGs-Werte bildet den sog. Ablehnungsbereich. Die bei der Ablehnung von Ho zur Anwendung kommende logische Schlussfigur folgt dem Schema: Wenn Ho gilt, dann ist ein TGs im Ablehnungsbereich "sehr unwahrscheinlich"; aus einer Zufallsstichprobe ergibt sich ein TGs im Ablehnungsbereich. ⇒ Ho ist sehr unwahrscheinlich. H0, H1? Power ≥ 1−β H0 StatFormeln03 P≥α P<α H0, H1? H1 Power < 1−β H0, H1? 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) 5 2.1 Einstichprobenvergleiche Einstichprobenvergleiche Untersuchungsmerkmal metrisch Untersuchungsmerkmal zweistufig Untersuchungsmerkmal mehrstufig Vergleich eines MIttelwerts mit einem Sollwert Vergleich einer Wahrscheinlichkeit mit einem Sollwert Vergleich von Wahrscheinlichkeiten auf gegebenes Verhältnis Binomialtest Chiquadrattest t-Test 1-Stichproben-t-Test Hypothesen und Testgröße: (I) H0: µ = µ0, H1: µ ≠ µ0 (IIa) H0: µ ≤ µ0, H1: µ > µ0 (IIb) H0: µ ≥ µ0, H1: µ < µ0 X − µ0 n S Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn |TGs| > tn-1,1-α/2 (Fall I) bzw. TGs > tn-1,1- α (Fall IIa) bzw. TGs < tn-1,α (Fall IIb) TG = Planung des Stichprobenumfanges: Notwendiger Stichprobenumfang, um auf Niveau α mit Sicherheit 1-ß eine Entscheidung für H1 herbeizuführen, wenn µ von µ0 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht (die Formeln liefern ab n=20 brauchbare Näherungswerte): σ 2 n ≈ 2 ∆ σ 2 (z1−α / 2 + z1− β )2 (Fall I) bzw. n ≈ 2 ∆ StatFormeln03 (z1−α + z1− β )2 (Fälle IIa, b) 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) 6 Binomialtest für große Stichproben Hypothesen und Testgröße: (I) H0: p = p0, H1: p ≠ p0 (IIa) H0: p ≤ p0, H1: p > p0 (IIb) H0: p ≥ p0, H1: p < p0 TG = Y − p0 p 0 (1 − p 0 ) / n Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn |TGs| > z1-α/2 (Fall I) bzw. TGs > z1- α (Fall IIa) bzw. TGs < zα (Fall IIb) Planung des Stichprobenumfanges: Notwendiger Stichprobenumfang, um auf Niveau α mit Sicherheit 1-ß eine Entscheidung für H1 herbeizuführen, wenn p von p0 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht: 1 1 2 2 n ≈ 2 (z1−α / 2 + z1− β ) (Fall I) bzw. n ≈ 2 (z1−α + z1− β ) (Fälle IIa, b) 4∆ 4∆ χ2 - Anpassungstest für diskrete Verteilungen Hypothesen und Testgröße: H0: pi = p0i (i=1,2, ..., k), H1: pi ≠ p0i für wenigstens ein i (Oi − E i ) 2 TG = GF = ∑ Ei i =1 k Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn TGs >χ2k-1,1-α . StatFormeln03 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) 7 2. 2 Zweistichprobenvergleiche bei metrischen Merkmalen Zweistichprobenvergleiche bei metrischen Merkmalen Vergleich von Mittelwerten unabhängige Stichproben Varianzen homogen Varianzen inhomogen 2-Stichproben t-Test Welchtest Nichtparametrische Alternativen U-Test Vergleich von Varianzen abhängige Stichproben unabhängige Stichproben Differenzent-Test F-Test Wilcoxon-Test Vorzeichen-Test 2-Stichproben-t-Test (Parallelversuch) Hypothesen und Testgröße: (I) H0: µ1 = µ2, H1: µ1 ≠ µ2 (IIa) H0: µ1 ≤ µ2, H1: µ1 > µ2 (IIb) H0: µ1 ≥ µ2, H1: µ1 < µ2 TG = X1 − X 2 S2 n1 n 2 n1 + n 2 (n1 − 1) S 12 + (n 2 − 1) S 22 mit S = n1 + n 2 − 2 2 Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn |TGs| > tn1+ n2 - 2,1-α/2 (Fall I) bzw. TGs > tn1 + n2 - 2,1- α (Fall IIa) bzw. TGs < tn1 + n2 - 2, α (Fall IIb) Planung des Stichprobenumfanges: Notwendiger Stichprobenumfang, um auf Niveau α mit Sicherheit 1-ß eine Entscheidung für H1 herbeizuführen, wenn µ1 von µ2 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht (die Formeln gelten für n1 = n2 =n und liefern ab n=20 brauchbare Näherungswerte): σ 2 n ≈ 2 2 ∆ σ 2 (z1−α / 2 + z1− β )2 (Fall I) bzw. n ≈ 2 2 ∆ StatFormeln03 (z1−α + z1− β )2 (Fälle IIa, b) 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) 8 Welch-Test (Parallelversuch) Hypothesen: siehe 2-Stichproben-t-Test. Testgröße: TG = X1 − X 2 S 12 / n1 + S 22 / n 2 Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn |TGs| > tf, 1-α/2 (Fall I) bzw. TGs > tf, 1- α (Fall IIa) bzw. TGs < tf, α (Fall IIb) mit f ≈ ( s12 / n1 + s 22 / n 2 ) 2 ( s12 / n1 ) 2 /(n1 − 1) + ( s 22 / n 2 ) 2 /(n 2 − 1) U-Test (Parallelversuch) Hypothesen und Testgröße: (I) H0: Θ = 0, H1: Θ ≠ 0 (X1 stoch. ≠ X2) (IIa) H0: Θ ≤ 0, H1: Θ > 0 (X1 stoch.> X2) (IIb) H0: Θ ≥ 0, H1: Θ < 0 (X1 stoch.< X2) TG = U = n1n2 + n1 (n1 + 1) / 2 − R1 (R1 = Rangsumme für die X1-Stichprobe) Entscheidung: H0 auf Signifikanzniveau α = 5% ablehnen, wenn TGs ≤ Un1,n2, 0.025 oder TGs ≥ Un1,n2, 0.975 (Fall I) bzw. TGs ≥ Un1,n2, 0.95 (Fall IIa) bzw. TGs ≤ Un1,n2, 0.05 (Fall IIb) Approximation für große Stichproben (n1>20 oder n2>20): TG = U − n1n2 / 2 n1n2 (n1 + n2 + 1) / 12 ∝ N (0,1) unter H 0 : Θ = 0 t-Test für abhängige Stichproben (Paarvergleich) Rückführung auf 1-Stichproben-t-Test. Wilcoxon-Test für abhängige Stichproben (Paarvergleich) Hypothesen und Testgröße: (I) H0: ζ = 0, H1: ζ ≠ 0 (IIa) H0: ζ ≤ 0, H1: ζ > 0 (IIb) H0: ζ ≥ 0, H1: ζ < 0 (ζ = Median der Differenz D = X1 - X2) StatFormeln03 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) 9 TG = T + (T+ = Summe der Ränge der positiven Paardifferenzen; Rangskalierung der Differenzstichprobe: Absolutbeträge der Paardifferenzen werden der Größe nach aufsteigend angeordnet, Bindungskorrektur über Mittelwerte der Platznummern, verschwindende Paardifferenzen bleiben unberücksichtigt - entsprechend verkleinert sich der Stichrobenumfang) Entscheidung: H0 auf Signifikanzniveau α = 5% ablehnen, wenn TGs ≤ wn, 0.025 oder TGs ≥ wn, 0.975 (Fall I) bzw. TGs ≥ wn, 0.95 (Fall IIa) bzw. TGs ≤ wn, 0.05 (Fall IIb) Approximation für große Stichproben (n>20): TG = T + − n(n + 1) / 4 n(n + 1)(2n + 1) / 24 ∝ N (0,1) unter H 0 : ς = 0 Vorzeichen-Test für abhängige Stichproben (Paarvergleich) Hypothesen und Testgröße: (I) H0: P(X1>X2) = 0.5, H1: P(X1>X2) ≠ 0.5 (IIa) H0: P(X1>X2) ≤ 0.5, H1: P(X1>X2) >0.5 (IIb) H0: P(X1>X2) ≥ 0.5, H1: P(X1>X2) <0.5 TG = Anteil der Paare ( X 1 , X 2 ) mit X 1 > X 2 Entscheidung: siehe Binomialtest F - Test (Parallelversuch) Hypothesen und Testgröße: (I) H0: σ12 = σ22, H1: σ12 ≠ σ22 (IIa) H0: σ12 ≤ σ22, H1: σ12 > σ22 (IIb) H0: σ12 ≥ σ22, H1: σ12 < σ22 TG = S 12 S 22 Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn TGs <Fn1-1,n2-1,α/2 oder TGs >Fn1-1,n2-1,1-α/2 (Fall I) bzw. TGs >Fn1-1,n2-1,1-α (Fall IIa ) bzw. TGs <Fn1-1,n2-1,α (Fall IIb). StatFormeln03 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) 10 2. 3 Zweistichprobenvergleiche bei 2-stufigen Merkmalen Zweistichprobenvergleiche bei 2-stufigen Merkmalen Vergleich von Wahrscheinlichkeiten unabhängige Stichproben abhängige Stichproben ChiquadratTest McNemarTest Vergleich zweier Wahrscheinlichkeiten (unabhängige Stichproben) Hypothesen und Testgröße: (I) H0: p1 = p2, H1: p1 ≠ p2 (IIa) H0: p1 ≤ p2, H1: p1 > p2 (IIb) H0: p1 ≥ p2, H1: p1 < p2 TG = n.. (n11 n 22 − n12 n 21 ) n1. n 2. n.1 n.2 Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn |TGs| > z1-α/2 (Fall I) bzw. TGs > z1- α (Fall IIa) bzw. TGs < zα (Fall IIb) Planung des Stichprobenumfanges: Notwendiger Stichprobenumfang, um auf Niveau α mit Sicherheit 1-ß eine Entscheidung für H1 herbeizuführen, wenn p1 von p2 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht: n≈ 1 (z1−α / 2 + z1− β )2 (Fall I) bzw. n ≈ 1 2 (z1−α + z1− β )2 (Fälle IIa, b) 2 2∆ 2∆ McNemar-Test zum Vergleich von Wahrscheinlichkeiten (abhängige Stichproben) Hypothesen und Testgröße: H0: p+− = 1/2, H1: p+− ≠ 1/2 TG = StatFormeln03 ( b − c − 1) 2 b+c 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) 11 Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn TGs > χ²1,1-α (näherungsweise ab b+c ≥20). Planung des Stichprobenumfanges: Notwendiger Stichprobenumfang, um auf Niveau α mit Sicherheit 1-ß eine Entscheidung für H1 herbeizuführen, wenn p+− von 1/2 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht: n =b+c ≈ StatFormeln03 1 (z1−α / 2 + z1− β )2 2 4∆ 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) 12 2.4 Abhängigkeit (Zusammenhang) zwischen Merkmalen Zusammenhang zwischen zwei Merkmalen abhängige Stichproben Metrische Merkmale k-stufige Merkmale Abhängigkeitsprüfung über ρ (t-Test) Abhängigkeitsprüfung mit χ2-Statistik Abhängigkeitsprüfung mit der Produktmomentkorrelation Hypothesen und Testgröße: (I) H0: ρXY = 0, H1: ρXY ≠ 0 (IIa) H0: ρXY ≤ 0, H1: ρXY > 0 (IIb) H0: ρXY ≥ 0, H1: ρXY < 0 TG = rxy n − 2 1 − rxy2 rxy = mit s xy sx s y Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn |TGs| > tn -2,1-α/2 (Fall I) bzw. TGs > tn - 2,1- α (Fall IIa) bzw. TGs < tn - 2, α (Fall IIb) χ²-Test (Abhängigkeitsprüfung bei diskreten Merkmalen) Hypothese und Testgröße: H0: X und Y sind unabhängig, H1: X und Y sind abhängig TG = GF = ∑ alleZellen (n − eij ) 2 ij eij mit eij = ni. n. j n Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn TGs > χ²(k-1)(m-1),1-α (k, m = Anzahl der Zeilen bzw. Spalten der Kontingenztafel). Kontingenzindex von Cramer: StatFormeln03 V= GF n[min(k , m) − 1] 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) 13 2.5 Einfaktorielle Varianzanalyse k-Stichprobenvergleiche (1-faktorielle ANOVA) Vergleich der Mittelwerte einer metrischen Zielvariablen unter k >2 Bedingungen (=Faktorstufen) unabhängige Stichproben Varianzhomogenität Globaltest (F-Test) Multiple Mittelwertvergleiche: a posteriori (Scheffe) Globaltest zum Vergleich von k (k > 2) Mittelwerten Hypothesen: H0: µ1 = µ2 = ... = µk, H1: wenigstens zwei Mittelwerte verschieden Testgröße: TG = k k SQA /(k − 1) mit SQA = ∑ n j ( y j − y ) 2 und SQE = ∑ (n j − 1) s 2j SQE /( N − k ) j =1 j =1 Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn TGs > Fk-1, N-k,1-α . Scheffe-Test (a posteriori - Mittelwertvergleiche) Hypothesen: H0: L = 0, H1: L ≠ 0 mit L = c1 µ1 + c2 µ2 + ... + ck µk = 0, c1 + c2 + ... + ck = 0 Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn StatFormeln03 22.02.03 W. Timischl, Angewandte Statistik - Formeln (22.2.03) L > (k − 1) Fk −1, N − k ,1−α SQE N −k k c 2j ∑n j =1 14 j Levene-Test (Untersuchung der Varianzhomogenität) Hypothesen: H0: σ1² = σ2² = ... = σk², H1: wenigstens zwei Varianzen verschieden Testgröße: TG = k k SQA( z ) /(k − 1) mit z ij = y ij − y j , SQA = ∑ n j ( z j − z ) 2 und SQE = ∑ (n j − 1) s 2j ( z ) SQE ( z ) /( N − k ) j =1 j =1 Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn TGs > Fk-1, N-k,1-α . StatFormeln03 22.02.03