Signifikanzprüfung: Kurzfassung

Werbung
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
1
1 Parameterschätzung
1.1 Mittelwert und Varianz
Zufallsstichprobe der metrischen Variablen X vom Umfang n :
X 1 , X 2 ,..., X n
(Arithmetischer) Mittelwert:
X =
1 n
∑ Xi
n i =1
Varianz:
S2 =
1 n
(X i − X )2
∑
n − 1 i =1
Standardabweichung:
1 n
2
S=
∑ (X i − X )
n − 1 i =1
(1-α)-Konfidenzintervall für den Mittelwert µ:
[X − tn −1,1−α / 2 SE , X + tn −1,1−α / 2 SE ]
SE = S / n
Approximation für großes n:
[X − z
1−α / 2
SE , X + z1−α / 2 SE ]
Planung des Stichprobenumfanges (Approximation für großes n):
Notwendiger Stichprobenumfang für Mittelwertschätzung mit Genauigkeit d und Sicherheit 1 - α:
σ
z
n ≈  1−α / 2 
 d 
2
(1-α)-Konfidenzintervall für die Varianz σ2:
 (n − 1) S 2 (n − 1) S 2 
, 2
 2

 χ n −1,1−α / 2 χ n −1,α / 2 
StatFormeln03
22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
2
1.2 Robuste Mittelwertschätzer
Zufallsstichprobe der metrischen Variablen X vom Umfang n:
X 1 , X 2 ,..., X n
Nach aufsteigender Größe geordnete Stichprobe:
X (1) , X ( 2) ,..., X ( n )
γ-getrimmter Mittelwert (z.B.: γ = 0.1 oder 0.2; g=[nγ]):
Xt =
X ( g +1) + X ( g + 2) + L + X ( n − g )
n − 2g
(1-α)-Konfidenzintervall für den γ-getrimmten Mittelwert µτ:
[X t − tn − 2 g −1,1−α / 2 SE ( X t ),
SE ( X t ) =
X t + t n − 2 g −1,1−α / 2 SE ( X t )
]
sw
(1 − 2γ ) n
sw ist die Standardabweichung der "γ-winsorierten" Stichprobe W1, W2, ..., Wn mit
 X ( g +1)

Wi =  X i
X
 (n − g )
Median:
X (( n +1) / 2 )

~

X 0.5 =  1
 2 X ( n / 2 ) + X (( n +1) / 2)
(
StatFormeln03
für X i ≤ X ( g +1)
für X ( g +1) < X i < X ( n − g )
für X i ≥ X ( n − g )
für gerades n
)
für ungerades n
22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
3
1.3 Wahrscheinlichkeit
Zufallsstichprobe der dichotomen (0/1-skalierten) Variablen X vom Umfang n :
X 1 , X 2 ,..., X n
m = absolute Häufigkeit der Ausprägung 1 (Anzahl der Untersuchungseinheiten mit der
Ausprägung 1)
Exaktes (1-α)-Konfidenzintervall [pu, po] für die Wahrscheinlichkeit p:
pu =
mF2 m, 2( n − m +1),α / 2
n − m + 1 + mF2 m, 2( n − m +1),α / 2
, po =
(m + 1) F2( m +1),2( n − m ),1−α / 2
n − m + (m + 1) F2( m +1),2( n − m ),1−α / 2
(pu, po = unterer bzw. oberer Pearson-Clopper-Wert)
Approximatives (1-α)-Konfidenzintervall für die Wahrscheinlichkeit p:
Voraussetzung: n > 20 und 10 ≤ m ≤ n-10

h(1 − h)
h(1 − h) 
−
+
h
z
,
h
z


1 −α / 2
1 −α / 2
n
n 

( h = m/n = Anteil der Untersuchungseinheiten mit der Ausprägung 1)
Planung des Stichprobenumfanges:
Notwendiger Stichprobenumfang zur Schätzung von p mit Genauigkeit d und Sicherheit 1 - α:
z

n ≈  1−α / 2 
 2d 
StatFormeln03
2
22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
4
2 Testen von Hypothesen
Die Entscheidungsalternativen (Hypothesen)
z.B. über den Mittelwert µ einer Verteilung:
2-seitiger Test auf Abweichung: H0 : µ =µo versus H1: µ ≠ µo (Fall I)
1-seitiger Test auf Überschreitung: H0 : µ ≤µo versus H1: µ > µo (Fall IIa)
1-seitiger Test auf Unterschreitung: H0 : µ ≥µo versus H1: µ < µo (Fall IIb)
Das Entscheidungsproblem
Wahrer Sachverhalt
H0 ist richtig
H1 ist richtig
Entscheidung
für H0 (gegen H1)
richtige Entscheidung
Fehlentscheidung
(Fehler 2. Art)
Entscheidung
für H1 (gegen H0)
Fehlentscheidung
(Fehler 1. Art)
richtige Entscheidung
Die Fehlerrisken
1. Fehler 1. Art (α-Fehler): irrtümliche Ablehnung von H0 ; Testentscheidung so, dass
P(Entscheidung für H1 | Ho ist richtig) ≤ α.
2. Fehler 2. Art (β-Fehler): irrtümliche Nichtablehnung von H0; P(keine Entscheidung für H1 | H1
ist richtig) ≤ β, u.a. vom Verteilungsparameter µ abhängig.
Zusammenfassung beider Fehlerrisken in der Gütefunktion (power):
G(µ) = P(Ablehnung von H0 | µ)
= Wahrscheinlichkeit, auf Grund einer Zufallsstichprobe gegen H0 zu entscheiden.
Logik der Testentscheidung
Entscheidung erfolgt mit einer (für den jeweiligen Test typischen) Testgröße TG;
Zufallsstichprobe Æ Realisierung TGs. Entscheidung gegen Ho, wenn Realisierung TGs (oder
gegenüber Ho noch extremerer Wert) unter der Voraussetzung der Gültigkeit von Ho "sehr
unwahrscheinlich" (d.h. kleiner als α) ist. Menge der "sehr unwahrscheinlichen" TGs-Werte bildet
den sog. Ablehnungsbereich. Die bei der Ablehnung von Ho zur Anwendung kommende logische
Schlussfigur folgt dem Schema:
Wenn Ho gilt, dann ist ein TGs im Ablehnungsbereich "sehr unwahrscheinlich";
aus einer Zufallsstichprobe ergibt sich ein TGs im Ablehnungsbereich.
⇒ Ho ist sehr unwahrscheinlich.
H0, H1?
Power ≥ 1−β
H0
StatFormeln03
P≥α
P<α
H0, H1?
H1
Power < 1−β
H0, H1?
22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
5
2.1 Einstichprobenvergleiche
Einstichprobenvergleiche
Untersuchungsmerkmal
metrisch
Untersuchungsmerkmal
zweistufig
Untersuchungsmerkmal
mehrstufig
Vergleich eines MIttelwerts
mit einem Sollwert
Vergleich einer
Wahrscheinlichkeit mit
einem Sollwert
Vergleich von
Wahrscheinlichkeiten auf
gegebenes Verhältnis
Binomialtest
Chiquadrattest
t-Test
1-Stichproben-t-Test
Hypothesen und Testgröße:
(I)
H0: µ = µ0, H1: µ ≠ µ0
(IIa) H0: µ ≤ µ0, H1: µ > µ0
(IIb) H0: µ ≥ µ0, H1: µ < µ0
X − µ0
n
S
Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn
|TGs| > tn-1,1-α/2 (Fall I) bzw. TGs > tn-1,1- α (Fall IIa) bzw. TGs < tn-1,α (Fall IIb)
TG =
Planung des Stichprobenumfanges:
Notwendiger Stichprobenumfang, um auf Niveau α mit Sicherheit 1-ß eine Entscheidung für H1
herbeizuführen, wenn µ von µ0 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht (die Formeln
liefern ab n=20 brauchbare Näherungswerte):
σ 2
n ≈  2
∆

σ 2
(z1−α / 2 + z1− β )2 (Fall I) bzw. n ≈  2

∆
StatFormeln03

(z1−α + z1− β )2 (Fälle IIa, b)

22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
6
Binomialtest für große Stichproben
Hypothesen und Testgröße:
(I)
H0: p = p0, H1: p ≠ p0
(IIa) H0: p ≤ p0, H1: p > p0
(IIb) H0: p ≥ p0, H1: p < p0
TG =
Y − p0
p 0 (1 − p 0 ) / n
Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn
|TGs| > z1-α/2 (Fall I) bzw. TGs > z1- α (Fall IIa) bzw. TGs < zα (Fall IIb)
Planung des Stichprobenumfanges:
Notwendiger Stichprobenumfang, um auf Niveau α mit Sicherheit 1-ß eine Entscheidung für H1
herbeizuführen, wenn p von p0 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht:
 1 
 1 
2
2
n ≈  2 (z1−α / 2 + z1− β ) (Fall I) bzw. n ≈  2 (z1−α + z1− β ) (Fälle IIa, b)
 4∆ 
 4∆ 
χ2 - Anpassungstest für diskrete Verteilungen
Hypothesen und Testgröße:
H0: pi = p0i (i=1,2, ..., k), H1: pi ≠ p0i für wenigstens ein i
(Oi − E i ) 2
TG = GF = ∑
Ei
i =1
k
Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn TGs >χ2k-1,1-α .
StatFormeln03
22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
7
2. 2 Zweistichprobenvergleiche bei metrischen Merkmalen
Zweistichprobenvergleiche
bei metrischen Merkmalen
Vergleich von
Mittelwerten
unabhängige
Stichproben
Varianzen
homogen
Varianzen
inhomogen
2-Stichproben t-Test
Welchtest
Nichtparametrische Alternativen
U-Test
Vergleich von
Varianzen
abhängige
Stichproben
unabhängige
Stichproben
Differenzent-Test
F-Test
Wilcoxon-Test
Vorzeichen-Test
2-Stichproben-t-Test (Parallelversuch)
Hypothesen und Testgröße:
(I)
H0: µ1 = µ2, H1: µ1 ≠ µ2
(IIa) H0: µ1 ≤ µ2, H1: µ1 > µ2
(IIb) H0: µ1 ≥ µ2, H1: µ1 < µ2
TG =
X1 − X 2
S2
n1 n 2
n1 + n 2
(n1 − 1) S 12 + (n 2 − 1) S 22
mit S =
n1 + n 2 − 2
2
Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn
|TGs| > tn1+ n2 - 2,1-α/2 (Fall I) bzw. TGs > tn1 + n2 - 2,1- α (Fall IIa) bzw. TGs < tn1 + n2
- 2, α
(Fall IIb)
Planung des Stichprobenumfanges:
Notwendiger Stichprobenumfang, um auf Niveau α mit Sicherheit 1-ß eine Entscheidung für H1
herbeizuführen, wenn µ1 von µ2 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht (die Formeln
gelten für n1 = n2 =n und liefern ab n=20 brauchbare Näherungswerte):
σ 2
n ≈ 2 2
∆

σ 2
(z1−α / 2 + z1− β )2 (Fall I) bzw. n ≈ 2 2

∆
StatFormeln03

(z1−α + z1− β )2 (Fälle IIa, b)

22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
8
Welch-Test (Parallelversuch)
Hypothesen: siehe 2-Stichproben-t-Test.
Testgröße:
TG =
X1 − X 2
S 12 / n1 + S 22 / n 2
Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn
|TGs| > tf, 1-α/2 (Fall I) bzw. TGs > tf, 1- α (Fall IIa) bzw. TGs < tf, α (Fall IIb) mit
f ≈
( s12 / n1 + s 22 / n 2 ) 2
( s12 / n1 ) 2 /(n1 − 1) + ( s 22 / n 2 ) 2 /(n 2 − 1)
U-Test (Parallelversuch)
Hypothesen und Testgröße:
(I)
H0: Θ = 0, H1: Θ ≠ 0 (X1 stoch. ≠ X2)
(IIa) H0: Θ ≤ 0, H1: Θ > 0 (X1 stoch.> X2)
(IIb) H0: Θ ≥ 0, H1: Θ < 0 (X1 stoch.< X2)
TG = U = n1n2 + n1 (n1 + 1) / 2 − R1
(R1 = Rangsumme für die X1-Stichprobe)
Entscheidung: H0 auf Signifikanzniveau α = 5% ablehnen, wenn
TGs ≤ Un1,n2, 0.025 oder TGs ≥ Un1,n2, 0.975 (Fall I) bzw. TGs ≥ Un1,n2, 0.95 (Fall IIa) bzw.
TGs ≤ Un1,n2, 0.05 (Fall IIb)
Approximation für große Stichproben (n1>20 oder n2>20):
TG =
U − n1n2 / 2
n1n2 (n1 + n2 + 1) / 12
∝ N (0,1) unter H 0 : Θ = 0
t-Test für abhängige Stichproben (Paarvergleich)
Rückführung auf 1-Stichproben-t-Test.
Wilcoxon-Test für abhängige Stichproben (Paarvergleich)
Hypothesen und Testgröße:
(I)
H0: ζ = 0, H1: ζ ≠ 0
(IIa) H0: ζ ≤ 0, H1: ζ > 0
(IIb) H0: ζ ≥ 0, H1: ζ < 0
(ζ = Median der Differenz D = X1 - X2)
StatFormeln03
22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
9
TG = T +
(T+ = Summe der Ränge der positiven Paardifferenzen; Rangskalierung der Differenzstichprobe:
Absolutbeträge der Paardifferenzen werden der Größe nach aufsteigend angeordnet,
Bindungskorrektur über Mittelwerte der Platznummern, verschwindende Paardifferenzen bleiben
unberücksichtigt - entsprechend verkleinert sich der Stichrobenumfang)
Entscheidung: H0 auf Signifikanzniveau α = 5% ablehnen, wenn
TGs ≤ wn, 0.025 oder TGs ≥ wn, 0.975 (Fall I) bzw. TGs ≥ wn, 0.95 (Fall IIa) bzw.
TGs ≤ wn, 0.05 (Fall IIb)
Approximation für große Stichproben (n>20):
TG =
T + − n(n + 1) / 4
n(n + 1)(2n + 1) / 24
∝ N (0,1) unter H 0 : ς = 0
Vorzeichen-Test für abhängige Stichproben (Paarvergleich)
Hypothesen und Testgröße:
(I)
H0: P(X1>X2) = 0.5, H1: P(X1>X2) ≠ 0.5
(IIa) H0: P(X1>X2) ≤ 0.5, H1: P(X1>X2) >0.5
(IIb) H0: P(X1>X2) ≥ 0.5, H1: P(X1>X2) <0.5
TG = Anteil der Paare ( X 1 , X 2 ) mit X 1 > X 2
Entscheidung: siehe Binomialtest
F - Test (Parallelversuch)
Hypothesen und Testgröße:
(I)
H0: σ12 = σ22, H1: σ12 ≠ σ22
(IIa) H0: σ12 ≤ σ22, H1: σ12 > σ22
(IIb) H0: σ12 ≥ σ22, H1: σ12 < σ22
TG =
S 12
S 22
Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn
TGs <Fn1-1,n2-1,α/2 oder TGs >Fn1-1,n2-1,1-α/2 (Fall I) bzw. TGs >Fn1-1,n2-1,1-α  (Fall IIa ) bzw.
TGs <Fn1-1,n2-1,α (Fall IIb).
StatFormeln03
22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
10
2. 3 Zweistichprobenvergleiche bei 2-stufigen Merkmalen
Zweistichprobenvergleiche
bei 2-stufigen Merkmalen
Vergleich von
Wahrscheinlichkeiten
unabhängige
Stichproben
abhängige
Stichproben
ChiquadratTest
McNemarTest
Vergleich zweier Wahrscheinlichkeiten (unabhängige Stichproben)
Hypothesen und Testgröße:
(I)
H0: p1 = p2, H1: p1 ≠ p2
(IIa) H0: p1 ≤ p2, H1: p1 > p2
(IIb) H0: p1 ≥ p2, H1: p1 < p2
TG =
n.. (n11 n 22 − n12 n 21 )
n1. n 2. n.1 n.2
Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn
|TGs| > z1-α/2 (Fall I) bzw. TGs > z1- α (Fall IIa) bzw. TGs < zα (Fall IIb)
Planung des Stichprobenumfanges:
Notwendiger Stichprobenumfang, um auf Niveau α mit Sicherheit 1-ß eine Entscheidung für H1
herbeizuführen, wenn p1 von p2 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht:
n≈
1
(z1−α / 2 + z1− β )2 (Fall I) bzw. n ≈ 1 2 (z1−α + z1− β )2 (Fälle IIa, b)
2
2∆
2∆
McNemar-Test zum Vergleich von Wahrscheinlichkeiten (abhängige Stichproben)
Hypothesen und Testgröße:
H0: p+− = 1/2, H1: p+− ≠ 1/2
TG =
StatFormeln03
( b − c − 1)
2
b+c
22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
11
Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn TGs > χ²1,1-α
(näherungsweise ab b+c ≥20).
Planung des Stichprobenumfanges:
Notwendiger Stichprobenumfang, um auf Niveau α mit Sicherheit 1-ß eine Entscheidung für H1
herbeizuführen, wenn p+− von 1/2 um ∆ ≠ 0 im Sinne der Alternativhypothese abweicht:
n =b+c ≈
StatFormeln03
1
(z1−α / 2 + z1− β )2
2
4∆
22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
12
2.4 Abhängigkeit (Zusammenhang) zwischen Merkmalen
Zusammenhang zwischen
zwei Merkmalen
abhängige Stichproben
Metrische Merkmale
k-stufige Merkmale
Abhängigkeitsprüfung
über ρ (t-Test)
Abhängigkeitsprüfung
mit χ2-Statistik
Abhängigkeitsprüfung mit der Produktmomentkorrelation
Hypothesen und Testgröße:
(I)
H0: ρXY = 0, H1: ρXY ≠ 0
(IIa) H0: ρXY ≤ 0, H1: ρXY > 0
(IIb) H0: ρXY ≥ 0, H1: ρXY < 0
TG =
rxy n − 2
1 − rxy2
rxy =
mit
s xy
sx s y
Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn
|TGs| > tn -2,1-α/2 (Fall I) bzw. TGs > tn - 2,1- α (Fall IIa) bzw. TGs < tn - 2, α (Fall IIb)
χ²-Test (Abhängigkeitsprüfung bei diskreten Merkmalen)
Hypothese und Testgröße: H0: X und Y sind unabhängig, H1: X und Y sind abhängig
TG = GF =
∑
alleZellen
(n
− eij )
2
ij
eij
mit eij =
ni. n. j
n
Entscheidung:
H0 auf Signifikanzniveau α ablehnen, wenn TGs > χ²(k-1)(m-1),1-α (k, m = Anzahl der Zeilen bzw.
Spalten der Kontingenztafel).
Kontingenzindex von Cramer:
StatFormeln03
V=
GF
n[min(k , m) − 1]
22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
13
2.5 Einfaktorielle Varianzanalyse
k-Stichprobenvergleiche
(1-faktorielle ANOVA)
Vergleich der Mittelwerte
einer metrischen Zielvariablen
unter k >2 Bedingungen
(=Faktorstufen)
unabhängige Stichproben
Varianzhomogenität
Globaltest (F-Test)
Multiple
Mittelwertvergleiche:
a posteriori (Scheffe)
Globaltest zum Vergleich von k (k > 2) Mittelwerten
Hypothesen: H0: µ1 = µ2 = ... = µk, H1: wenigstens zwei Mittelwerte verschieden
Testgröße:
TG =
k
k
SQA /(k − 1)
mit SQA = ∑ n j ( y j − y ) 2 und SQE = ∑ (n j − 1) s 2j
SQE /( N − k )
j =1
j =1
Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn TGs > Fk-1, N-k,1-α .
Scheffe-Test (a posteriori - Mittelwertvergleiche)
Hypothesen:
H0: L = 0, H1: L ≠ 0 mit
L = c1 µ1 + c2 µ2 + ... + ck µk = 0, c1 + c2 + ... + ck = 0
Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn
StatFormeln03
22.02.03
W. Timischl, Angewandte Statistik - Formeln (22.2.03)
L > (k − 1) Fk −1, N − k ,1−α
SQE
N −k
k
c 2j
∑n
j =1
14
j
Levene-Test (Untersuchung der Varianzhomogenität)
Hypothesen:
H0: σ1² = σ2² = ... = σk², H1: wenigstens zwei Varianzen verschieden
Testgröße:
TG =
k
k
SQA( z ) /(k − 1)
mit z ij = y ij − y j , SQA = ∑ n j ( z j − z ) 2 und SQE = ∑ (n j − 1) s 2j ( z )
SQE ( z ) /( N − k )
j =1
j =1
Entscheidung: H0 auf Signifikanzniveau α ablehnen, wenn TGs > Fk-1, N-k,1-α .
StatFormeln03
22.02.03
Herunterladen