Biostatistik, Winter 2011/12 - Vergleich zweier - staff.uni

Biostatistik, Winter 2011/12
Vergleich zweier Stichproben, nichtparametrische Tests
Prof. Dr. Achim Klenke
http://www.aklenke.de
11. Vorlesung: 27.01.2012
1/86
Inhalt
1
Tests
t-Test
2
Vergleich zweier Stichproben
Gepaarter t-Test
Ungepaarter t-Test
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch
Test
Vergleich: Gepaarter vs ungepaarter t-Test
3
Nichtparametrische Lagetests
Der Mediantest
Wilcoxon Rangsummentest
4
χ2 -Test
χ2 -Test
2/86
Tests
t-Test
t-Test, Problemstellung
Merkmal (Messgröße) zufällig und normalverteilt.
Erwartungswert µ ∈ R unbekannt.
Varianz σ 2 > 0 unbekannt.
Hypothese H0 = {µ0 } für ein µ0 ∈ R (Lehrmeinung).
Alternative H1 .
H1 : µ < µ0 linksseitig,
H1 : µ > µ0 rechtsseitig,
H1 : µ 6= µ0 beidseitig.
Problem
Entwickle Test zum Niveau α ∈ (0, 1).
3/86
Vergleich mit Gaußtest
Gemeinsam
Messwerte normalverteilt, µ unbekannt.
Stichprobe x1 , . . . , xn
H0 verwerfen, wenn Teststatistik T (x) groß (rechtsseitige
Alternative).
Anders bei t-Test
Varianz σ 2 unbekannt, schätzen durch
n
1 X
2
sn−1
=
(xi − x)2
n−1
i=1
x − µ0
√ .
sn−1 / n
t-Quantile tn−1;1−α statt Normal-Quantile zα .
Keine Fallzahlplanung möglich, da σ 2 unbekannt.
Teststatistik T (x) =
Tests
t-Test
Linksseitige Alternative
Verwerfungsregel
Alternative H1 ⊂ (−∞, µ0 ).
Stichprobe x1 , . . . , xn .Teststatistik
T (x) =
x − µ0
√ .
sn−1 / n
Verwirf H0 zugunsten von H1 , falls T (x) ≤ −tn−1;1−α .
p-Wert
p(x) = tn−1 (T (x)) = 1 − tn−1 (−T (x)).
tn−1 Verteilungsfunktion der tn−1 -Verteilung (Tabelle A.4).
5/86
Tests
t-Test
Rechtsseitige Alternative
Verwerfungsregel
Alternative H1 ⊂ (µ0 , ∞).
Stichprobe x1 , . . . , xn . Teststatistik
T (x) =
x − µ0
√ .
sn−1 / n
Verwirf H0 zugunsten von H1 , falls T (x) ≥ tn−1;1−α .
p-Wert
p(x) = tn−1 (−T (x)) = 1 − tn−1 (T (x)).
tn−1 Verteilungsfunktion der tn−1 -Verteilung (Tabelle A.4).
6/86
Tests
t-Test
Beidseitige Alternative
Verwerfungsregel
Alternative H1 ⊂ R \ {µ0 }.
Stichprobe x1 , . . . , xn . Teststatistik
T (x) =
x − µ0
√ .
sn−1 / n
Verwirf H0 zugunsten von H1 , falls |T (x)| ≥ tn−1;1−α/2 .
p-Wert
p(x) = 2(1 − tn−1 (|T (x)|)).
tn−1 Verteilungsfunktion der tn−1 -Verteilung (Tabelle A.4).
7/86
Tests
t-Test
Beispiel: Straußeneier
Straußeneier, Gewicht µ
unbekannt, normalverteilt.
Konservative Hypothese:
µ = µ0 = 110.
Alternative H1 : µ 6= 110.
Beidseitiger t-Test zum Niveau α = 0.05 mit Stichprobengröße n
verwirft H0 , falls
x − 110 √ ≥ t9;1−α/2 = t9; 0.975 = 2.2622.
|T (x)| = sn−1 / 10 8/86
Tests
t-Test
Test verwirft H0 , falls
x − 110 s /√10 ≥ t9; 0.975 = 2.2622.
n−1
Gesammelte Daten
i
1
2
3
4
5
6
xi 106 110 100 103 109 101
7
8
9
10
97 103 111
99
Wir berechnen x = 103.9, sn−1 = 4.886 und
T (x) =
103.9 − 110
√
= −3.9476.
4.886/ 10
Fazit Wegen |T (x)| = 3.9476 > 2.2622 verwirft der Test H0
gegen H1 zum Niveau 5%
9/86
Tests
t-Test
Straußeneier, p-Wert
Allgemeine Formel
p(x) = 2(1 − tn−1 (|T (x)|)).
Hier T (x) = −3.9476
Tabelle:
t9 (3.9) = 0.99819.
p-Wert ist
p(x) = 2(1 − t9 (|T (x)|)) = 2(1 − t9 (3.90)) = 0.00362 = 0.362%.
Der beidseitige t-Test verwirft zu jedem Niveau α > 0.362%.
10/86
Tests
t-Test
Anstieg des Niveaus beim Ersetzen tn−1
durch z
Für große n können die Quantile von tn−1 durch die von N0,1
ersetzt werden. Fehler im Niveau:
n
5
10
20
30
40
50
100
200
Fehler einseitiger Test
0.04
0.016
0.008
0.006
0.004
0.004
0.002
0.001
Fehler zweiseitiger Test
0.08
0.032
0.016
0.011
0.008
0.007
0.004
0.002
11/86
Vergleich zweier Stichproben
Gepaarter t-Test
Grundproblem
Bei n Individuen soll eine Messgröße x unter zwei
Versuchsbedingungen gemessen werden.
Unterscheiden sich die Mittelwerte der Messungen?
12/86
Vergleich zweier Stichproben
Gepaarter t-Test
Modellierung
(1)
(1)
Unter Versuchsbedingung 1 sind die Messwerte x1 , . . . , xn
unabhängig mit Erwartungswerte µ1 .
(2)
(2)
Unter Versuchsbedingung 2 sind die Messwerte x1 , . . . , xn
unabhängig mit Erwartungswerte µ2 .
Annahme (Hoffnung!!!): Die Differenzen
(1)
(2)
(1)
(2)
x1 − x1 , . . . , xn − xn sind (ungefähr) normalverteilt mit
unbekannter Varianz σ 2 (und Erwartungswert µ2 − µ1 ).
Nullhypothese (H0 ): µ1 = µ2 .
Alternative (H1 ):
µ1 =
6 µ2
µ1 < µ2
µ1 > µ2
(beidseitig)
(rechtsseitig)
(linksseitig).
13/86
Vergleich zweier Stichproben
Gepaarter t-Test
Verfahren
(2)
(1)
Unter der Nullhypothese sind die Differenzen xk = xk − xk
unabhängig normalverteilt mit unbekannter Varianz σ 2 und
Erwartungswert µ = µ2 − µ1 = 0.
Also verfahren wir jetzt wie im bekannten t-Test: Teststatistik
T (x) =
wobei
x
√ ,
sn−1 / n
n
n
k=1
k=1
1X
1 X (2)
(1)
x=
xk =
(xk − xk )
n
n
ist und
n
2
sn−1
1 X
=
(xi − x)2 .
n−1
k=1
14/86
Vergleich zweier Stichproben
Gepaarter t-Test
Linksseitige Alternative
Verwerfungsregel
Nullhypothese (H0 ): µ2 = µ1
Alternative (H1 ):
µ2 < µ1 .
Verwirf H0 zugunsten von H1 , falls T (x) ≤ −tn−1;1−α .
p-Wert
p(x) = tn−1 (T (x)) = 1 − tn−1 (−T (x)).
tn−1 Verteilungsfunktion der tn−1 -Verteilung (Tabelle A.4).
15/86
Vergleich zweier Stichproben
Gepaarter t-Test
Rechtsseitige Alternative
Verwerfungsregel
Nullhypothese (H0 ): µ2 = µ1
Alternative (H1 ):
µ2 > µ1 .
Verwirf H0 zugunsten von H1 , falls T (x) ≥ tn−1;1−α .
p-Wert
p(x) = tn−1 (−T (x)) = 1 − tn−1 (T (x)).
tn−1 Verteilungsfunktion der tn−1 -Verteilung (Tabelle A.4).
16/86
Vergleich zweier Stichproben
Gepaarter t-Test
Beidseitige Alternative
Verwerfungsregel
Nullhypothese (H0 ): µ2 = µ1
Alternative (H1 ):
µ2 =
6 µ1 .
Verwirf H0 zugunsten von H1 , falls |T (x)| ≥ tn−1;1−α/2 .
p-Wert
p(x) = 2(1 − tn−1 (|T (x)|)).
tn−1 Verteilungsfunktion der tn−1 -Verteilung (Tabelle A.4).
17/86
Vergleich zweier Stichproben
Gepaarter t-Test
Beispiel: Orientierung von Zugvögeln
Zugvögel werden einer Beleuchtung mit bestimmter Farbe (grün
oder blau) ausgesetzt.
Ist das Orientierungsverhalten (magnetischer Kompass)
abhängig von der Farbe?
18/86
Vergleich zweier Stichproben
Gepaarter t-Test
Beispiel: Orientierung von Zugvögeln
Zugvögel werden einer Beleuchtung mit bestimmter Farbe (grün
oder blau) ausgesetzt.
Ist die Genauigkeit der Orientierung (magnetischer Kompass)
abhängig von der Farbe?
Nullhypothese: Nein.
Alternative: Doch.
19/86
Vergleich zweier Stichproben
Gepaarter t-Test
Beispiel: Orientierung von Zugvögeln
Versuchsanordnung
Es werden n = 17 Trauerschnäpper in
Käfigen einer Beleuchtung mit blauem
Licht ausgesetzt (Versuchsbedingung 1)
und jeweils in mehreren Durchgängen
ihre Flugrichtung ermittelt.
Die Flugrichtung wird als Punkt auf einem Kreis dargestellt. Aus
allen Punkten auf dem Kreis wird der Schwerpunktvektor
ermittelt.
Danach der gleiche Versuch mit grünem Licht (Bedingung 2).
20/86
Vergleich zweier Stichproben
Gepaarter t-Test
Beispiel: Orientierung von Zugvögeln
Bestimmung des Schwerpunktvektors
Je variabler die Richtungen, desto
kürzer der Pfeil!
21/86
Vergleich zweier Stichproben
Gepaarter t-Test
Beispiel: Orientierung von Zugvögeln
Ansatz des Tests
(1)
Für jeden Vogel i = 1, . . . , 17 bezeichnen wir mit xi die Länge
(2)
des Schwerpunktvektors bei blauem Licht und mit xi die Länge
des Schwerpunktvektors bei grünem Licht.
(2)
xi = xi
(1)
− xi .
Festlegung des Niveaus: α = 5%.
Schwerpunktvektoren sind Mittelwerte vieler zufälliger
Beobachtungen, also etwa normalverteilt (zentraler
Grenzwertsatz). Also: Gepaarter t-Test mit beidseitiger
Alternative und Niveau 5%.
Verwerfe H0 , falls
|T (x)| > tn−1;1−α/2 = t16;0.975 = 2.12.
22/86
Vergleich zweier Stichproben
Gepaarter t-Test
Beispiel: Orientierung von Zugvögeln
Daten und Durchführung
Differenzen xi :
−0.05
0.00
0.05
0.10
0.15
0.20
Mittelwert und Streuung:
x = 0.0518
sn−1 = 0.0912.
x
0.0518
√ =
√ ≈ 2.34.
sn−1 / n
0.0912/ 17
Also ist |T (x)| = 2.34 > 2.12 = t16;0.975 .
p-Wert:
t-Statistik T (x) =
p(x) = 2(1−tn−1 (|T (x)|)) = 2(1−t16 (2.34)) = 2(1−0.983) = 0.034.
23/86
Vergleich zweier Stichproben
Gepaarter t-Test
Beispiel: Orientierung von Zugvögeln
Fazit
Wir können die Hypothese, dass die Farbe des Lichtes keine
Rolle für die Orientierungsgenauigkeit der Trauerschnäpper
spielt, zum Niveau 5% verwerfen.
24/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Beispiel: Backenzähne von Hipparions
(c): public domain
25/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Beispiel: Backenzähne von Hipparions
Die Daten
77 Backenzähne
gefunden in den Chiwondo Beds, Malawi,
jetzt in den Sammlungen des
Hessischen Landesmuseums, Darmstadt
26/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Beispiel: Backenzähne von Hipparions
Zuordnung
Die Zähne wurden zwei Arten zugeordnet:
Hipparion africanum
≈ 4 Mio. Jahre,
39 Zähne
Hipparion libycum
≈ 2,5 Mio. Jahre,
38 Zähne
27/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Beispiel: Backenzähne von Hipparions
Geologischer Hintergrund
Vor 2,8 Mio. Jahren kühlte sich das Klima weltweit ab.
Das Klima in Ostafrika:
warm-feucht −→ kühl-trocken
Hipparion:
Laubfresser −→ Grasfresser
28/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Beispiel: Backenzähne von Hipparions
Frage
Hipparion:
Laubfresser −→ Grasfresser
andere Nahrung −→ andere Zähne?
Messungen: mesiodistale Länge
Lässt sich die Nullhypothese, dass die Zähne gleich sind, zum
Niveau 1% verwerfen?
29/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Die Theorie
Annahme: Wir haben zwei unabhängige Stichproben
x1,1 , . . . , x1,n1 und x2,1 , . . . , x2,n2 .
Die x1,i stammen aus einer Normalverteilung mit (unbekanntem)
Mittelwert µ1 und unbekannter Varianz σ 2 > 0, die x2,i aus einer
Normalverteilung mit (unbekanntem) Mittelwert µ2 und
derselben Varianz σ 2 .
30/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Die Theorie
Seien
n1
n2
1 X
1 X
x1 =
x1,i , x2 =
x2,i
n1
n2
i=1
i=1
die jeweiligen Stichprobenmittelwerte,
v
u
n1
u 1 X
t
(x1,i − x1 )2 ,
s1 =
n1 − 1
i=1
v
u
n2
u 1 X
s2 = t
(x2,i − x2 )2 ,
n2 − 1
i=1
die (korrigierten) Stichprobenstreuungen.
31/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Die Theorie
Wir möchten die Hypothese H0 : µ1 = µ2“ prüfen.
”
Wenn µ1 = µ2 gilt, so sollte x1 = x2 bis auf
”
Zufallsschwankungen“ gelten, denn E[x1 ] = µ1 , E[x2 ] = µ2 .
Was ist die Skala der typischen
Schwankungen von x2 − x1 ?
Var(x1 − x2 ) = σ 2 n11 + n12
Problem (wie bereits im ein-Stichproben-Fall): Wir kennen σ 2 nicht.
Wir schätzen es im zwei-Stichproben-Fall durch die gepoolte
Stichprobenvarianz
(n1 − 1)s12 + (n2 − 1)s22
n1 + n2 − 2
und bilden die Teststatistik
x2 − x1
T (x) = q
.
s n11 + n12
s2 =
32/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Die Theorie
Es gilt dann: Wenn µ1 = µ2 gilt, so ist
x2 − x1
T (x) = q
.
s n11 + n12
t-verteilt mit n1 + n2 − 2 Freiheitsgraden.
33/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Die Theorie
Linksseitige Alternative
Verwerfungsregel
Nullhypothese (H0 ): µ2 = µ1
Alternative (H1 ):
µ2 < µ1 .
Verwirf H0 zugunsten von H1 , falls T (x) ≤ −tn1 +n2 −2;1−α .
p-Wert
p(x) = tn1 +n2 −2 (T (x)) = 1 − tn1 +n2 −2 (−T (x)).
tn1 +n2 −2 Verteilungsfunktion der tn1 +n2 −2 -Verteilung (Tabelle A.4).
34/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Die Theorie
Rechtsseitige Alternative
Verwerfungsregel
Nullhypothese (H0 ): µ2 = µ1
Alternative (H1 ):
µ2 > µ1 .
Verwirf H0 zugunsten von H1 , falls T (x) ≥ tn1 +n2 −2;1−α .
p-Wert
p(x) = tn1 +n2 −2 (−T (x)) = 1 − tn1 +n2 −2 (T (x)).
tn1 +n2 −2 Verteilungsfunktion der tn1 +n2 −2 -Verteilung (Tabelle A.4).
35/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Die Theorie
Beidseitige Alternative
Verwerfungsregel
Nullhypothese (H0 ): µ2 = µ1
Alternative (H1 ):
µ2 =
6 µ1 .
Verwirf H0 zugunsten von H1 , falls |T (x)| ≥ tn1 +n2 −2;1−α/2 .
p-Wert
p(x) = 2(1 − tn1 +n2 −2 (|T (x)|)).
tn1 +n2 −2 Verteilungsfunktion der tn1 +n2 −2 -Verteilung (Tabelle A.4).
36/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Beispiel: Backenzähne von Hipparions
H. libycum
H. africanum
Die Daten
xA = 25.9, sA = 2.2
xA − sA
xA + sA
xL = 28.4, sL = 4.3
xL − sL
xL + sL
25
30
35
40
mesiodistale Länge [mm]
37/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Beispiel: Backenzähne von Hipparions
Die Daten
nA = 39,
xA = 25.9,
sA = 2.2
nL = 38,
xL = 28.4,
sL = 4.3
Gepoolte Stichprobenstreuung
s
(nA − 1)sA2 + (nL − 1)sL2
s=
nA + nL − 2
r
38 × 2.22 + 37 × 4.32
=
= 3.402.
39 + 38 − 2
Es folgt
xL − xA
28.4 − 25.9
p
T (x) = q
=
= 3.22.
3.402 × 1/39 + 1/38
s 1 + 1
nA
nL
38/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Beispiel: Backenzähne von Hipparions
Durchführung des Tests
Nullhypothese µ1 = µ2 , Alternative µ1 6= µ2 (beidseitig).
Test verwirft zum Niveau α = 1%, wenn
|T (x)| > tnA +nL −2;1−α/2 = t75;0.995 ≈ 2.65.
Tatsächliche Daten: |T (x)| = |3.22| > 2.65.
p-Wert
p(x) = 2(1 − tnA +nL −2 (|T (x)|)) = 2(1 − t75 (3.22))
= 2(1 − 0.998) = 0.002.
Diesen p-Wert sollte man nicht glauben, weil die
Modellanahmen zu optimistisch waren.
39/86
Vergleich zweier Stichproben
Ungepaarter t-Test
Beispiel: Backenzähne von Hipparions
Fazit
Der ungepaarte Zweistichproben-t-Test verwirft die
Nullhypothese, dass die mesiodistale Länge der Backenzähne
bei Hipparion africanum und Hipparion libycum gleich
Erwartungswert hätten, zu Gunsten der zweiseitigen Alternative
zum Niveau 1%.
40/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Die Theorie (Welch Test)
Annahme: Wir haben zwei unabhängige Stichproben
x1,1 , . . . , x1,n1 und x2,1 , . . . , x2,n2 .
Die x1,i stammen aus einer Normalverteilung mit (unbekanntem)
Mittelwert µ1 und unbekannter Varianz σ12 > 0, die x2,i aus einer
Normalverteilung mit (unbekanntem) Mittelwert µ2 und
möglicherweise anderer Varianz σ22 .
41/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Die Theorie (Welch Test)
Seien
v
u
u
s1 = t
n
1
1 X
(x1,i − x1 )2 ,
n1 − 1
i=1
v
u
u
s2 = t
n
2
1 X
(x2,i − x2 )2 ,
n2 − 1
i=1
die (korrigierten) Stichprobenstreuungen.
42/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Die Theorie (Welch Test)
Unter der Hypothese µ1 = µ2 ist die Teststatistik
x2 − x1
T (x) = q 2
s1
s2
+ n22
n1
ungefähr t-verteilt mit f Freiheitsgraden, wobei f aus den Daten
geschätzt wird:
2
2
s22
s1
+ n2
n1
f =
.
s14
s24
+
2
2
n (n −1)
n (n −1)
1
1
2
2
43/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Die Theorie (Welch Test)
Linksseitige Alternative
Verwerfungsregel
Nullhypothese (H0 ): µ2 = µ1
Alternative (H1 ):
µ2 < µ1 .
Verwirf H0 zugunsten von H1 , falls T (x) ≤ −tf ;1−α .
p-Wert
p(x) = tf (T (x)) = 1 − tf (−T (x)).
tf Verteilungsfunktion der tf -Verteilung (Tabelle A.4).
44/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Die Theorie (Welch Test)
Rechtsseitige Alternative
Verwerfungsregel
Nullhypothese (H0 ): µ2 = µ1
Alternative (H1 ):
µ2 > µ1 .
Verwirf H0 zugunsten von H1 , falls T (x) ≥ tf ;1−α .
p-Wert
p(x) = tf (−T (x)) = 1 − tf (T (x)).
tf Verteilungsfunktion der tf -Verteilung (Tabelle A.4).
45/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Die Theorie (Welch Test)
Beidseitige Alternative
Verwerfungsregel
Nullhypothese (H0 ): µ2 = µ1
Alternative (H1 ):
µ2 =
6 µ1 .
Verwirf H0 zugunsten von H1 , falls |T (x)| ≥ tf ;1−α/2 .
p-Wert
p(x) = 2(1 − tf (|T (x)|)).
tf Verteilungsfunktion der tf -Verteilung (Tabelle A.4).
46/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
Versuchsaufbau im Pflanzenphysiologischen Praktikum
In vier Petrischalen werden jeweils exakt 100 Samen
Gartenkresse ausgebracht. Gewässert wird mit
(A) Aqua dest. (zur Kontrolle)
(B) ABS Lösung
(C) Saccharose-Lösung
(D) Saccharose-ABS-Lösung
Nach zwei Tagen wird gezählt, wie viele Samen gekeimt haben.
47/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
Im Praktikum wird jeder Versuch dreimal durchgeführt.
0 20
60
100
Versuch A B C D
Keime Schale 1 90 85 45 25
Keime Schale 2 88 87 44 27
Keime Schale 3 91 75 45 29
A
B
C
D
48/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
100
Beispiel: Versuch zur Keimhemmung
0 20
60
(A)
(B)
(C)
(D)
A
B
C
D
Aqua dest.
ABS
Saccharose
SaccharoseABS
Fragen
Ist die Hemmung bei B schon vorhanden?
Hemmt Saccharose (C)?
Hemmt Saccharose mit ABS (D) stärker als Saccharose?
Ist die Wirkung von Saccharose und ABS gleich?
49/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
Vergleich C gegen D
Vermutung: Hemmung bei ABS+Saccharose (D) stärker als bei
Saccharose (C).
Test zum Niveau α = 1% soll Klarheit schaffen.
Nullhypothese: (D) genauso wie (C)
Alternative: (D) hemmt stärker.
50/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
Vergleich C gegen D, Welch Test
Daten
xC,1 = 45,
xC,2 = 44,
xC,3 = 45
xD,1 = 25,
xD,2 = 27,
xD,3 = 29
Idee: Daten etwa normalverteilt mit unbekannten Mittelwerten
µC und µD und unbekannten Varianzen σC2 , σD2 .
Nullhypothese (H0 ) µC = µD
Alternative (H1 ) µC > µD .
Linksseitiger Zwei-Stichproben t-Test mit unterschiedlichen
Varianzen (Welch Test).
51/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
Vergleich C gegen D, Welch Test
xC,1 = 45,
xC,2 = 44,
xC,3 = 45
xD,1 = 25,
xD,2 = 27,
xD,3 = 29
xC = 44.67, xD = 27.
v
u 3
u1 X
sC = t
(xC,i − xC )2
2
i=1
r
1
=
((45 − 44.67)2 + (44 − 44.67)2 + (45 − 44.67)2 )
2
= 0.57735.
52/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
Vergleich C gegen D, Welch Test
xC,1 = 45,
xC,2 = 44,
xC,3 = 45
xD,1 = 25,
xD,2 = 27,
xD,3 = 29
xC = 44.67, xD = 27.
v
u 3
u1 X
sD = t
(xD,i − xD )2
2
i=1
r
1
=
((25 − 27)2 + (27 − 27)2 + (29 − 27)2 ) = 2.
2
53/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
Vergleich C gegen D, Welch Test
xC = 44.67,
xD = 27.
sC = 0.57735,
sD = 2.
t-Statistik
xD − xC
27 − 44.67
q
T (x) = q 2
=
= −14.7.
2
sC
sD
0.57352
22
+ 3
+ nD
3
nC
Freiheitsgrade
f =
2
sC
nC
4
sC
2 (n −1)
nC
C
+
+
2
sD
nD
2
4
sD
2 (n −1)
nD
D
= . . . = 2.331.
54/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
Vergleich C gegen D, Welch Test
t-Statistik
T (x) = −14.7.
Freiheitsgrade
f = 2.331.
Der linksseitige Test zum Niveau α = 0.01 verwirft H0 , falls
T (x) < −tf ,1−α = −t2.331;0.99 ≈ −5.77.
(Alternativ: Tabellenwert t2;0.99 = 6.96)
Wegen T (x) = −14.7 < −5.77 verwirft der Test zum Niveau 1%
die Nullhypothese.
p-Wert
p(x) = t2.331 (−14.7) = 0.0012.
Alternativ: Tabellenwert p(x) ≤ t2 (−14.7) = 0.0023.
55/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
Vergleich C gegen D, Ergebnis
Mit Hilfe eines ungepaarten einseitigen t-Tests bei
unterschiedlichen Varianzen (Welch Test) wird die
Nullhypothese (Saccharose hemmt die Keimung gleich gut wie
ein Lösung mit Saccharose und ABS) auf dem Niveau 1% gegen
die Alternative (S hemmt nicht so gut wie S+ABS) verworfen.
Der p-Wert beträgt p ≤ 0.0023 (bzw. p = 0.0012, wenn man
exakt mit dem Computer rechnet, statt den p-Wert nach der
Tabelle der t2 -Verteilung anzunähern).
56/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
Vergleich C gegen B
Hemmt Saccharose (C) genauso gut wie ABS (B)?
Zweiseitiger ungepaarter t-Test bei unterschiedlichen Varianzen
(Welch Test) zum Niveau α = 1%.
57/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
Vergleich C gegen B, Daten
xC = 44.67,
sC = 0.57735,
t-Statistik
xB = 82.333.
sB = 6.4291.
xC − xB
T (x) = q 2
= −10.1.
sC
sB2
+ nB
nC
Freiheitsgrade
f = 2.032.
Beidseitiger Test verwirft, falls
|T (x)| > t2.032;0.995 ≈ t2;0.995 = 9.92.
Wegen |T (x)| = 10.1 verwirft der Test zum Niveau 1%.
p-Wert 2(1 − t2.032 (10.1)) ≈ 2(1 − t2 (10.1)) = 0.0097 ≈ 0.01.
58/86
Vergleich zweier Stichproben
Ungepaarter t-Test bei unterschiedlicher Varianz, Welch Test
Beispiel: Versuch zur Keimhemmung
Vergleich C gegen B, Ergebnis
Der zweiseitige ungepaarte t-Test bei unterschiedlicher Varianz
(Welch Test) verwirft die Nullhypothese (Saccharose hemmt
Keimung gleich gut wie ABS) gegen die beidseitige Alternative
zum Niveau 1%. Der p-Wert ist etwa 0.01.
59/86
Vergleich zweier Stichproben
Vergleich: Gepaarter vs ungepaarter t-Test
Vergleich: Gepaarter vs ungepaarter t-Test
Wenn die Stichprobenlänge unterschiedlich ist,
ergibt gepaart“ keinen Sinn.
”
Wenn die Stichprobenlänge gleich ist:
Sind die Stichproben unabhängig voneinander?
Falls ja, dann ungepaart testen. Ein gepaarter Test würde
sinnlose Abhängigkeiten unterstellen und hätte auch eine
geringere Schärfe.
Sind die Stichproben voneinander abhängig?
(z.B. Messungen von denselben Individuen bzw. Objekten)
Falls ja, dann ist ein gepaarter Test sinnvoll. Bei starker
Abhängigkeitsstruktur hat der gepaarte t-Test größere
Schärfe (da der Test von Variabilität zwischen den
Individuen bereinigt ist)
60/86
Nichtparametrische Lagetests
Der Mediantest
Beispiel: Medikamententest
Bei der Behandlung mit dem etablierten Herzmedikament XY“
”
lebt die Hälfte der Patienten noch acht Jahre oder länger.
Bei einem neuen Medikament wurde in einer Langzeitstudie an
20 Patienten festgestellt, wie lange die Patienten noch leben:
Patient Nr.
1 2 3 4 5 6 7 8 9 10
Lebensdauer xi 45 0 8 28 4 2 6 23 35 7
Patient Nr.
11 12 13 14 15 16 17 18 19 20
Lebensdauer xi 27 1 4 12 2 24 10 3 27 24
Ist das neue Medikament besser als das etablierte?
61/86
Nichtparametrische Lagetests
Der Mediantest
Beispiel: Medikamententest
Nullhypothese H0 : Beide gleich gut.
Alternative H1 :
Neues Medikament besser.
Formal:
Nullhypothese H0 :
Alternative H1 :
Lebensdauer des neuen Medikaments hat einen Median von
höchstens 8 Jahren.
Lebensdauer des neuen Medikaments hat einen Median von mehr
als 8 Jahren.
62/86
Nichtparametrische Lagetests
Der Mediantest
Beispiel: Medikamenentest
Sei T (x) die Anzahl der Werte xi mit xi ≥ 8. Unter H0 ist für
jedes i:
1
P[xi ≥ 8] = .
2
Also ist T (x) ∼ b20,0.5 .
Gilt H1 , so ist T (x) ∼ b20,p mit p > 0.5.
Große Werte von T (x) stützen H1 . Der p-Wert ist
20
X
p=
b20,0.5 (k).
k=T (x)
63/86
Nichtparametrische Lagetests
Der Mediantest
Beispiel: Medikamententest
Patient Nr.
1 2 3 4 5 6 7 8 9 10
Lebensdauer xi 45 0 8 28 4 2 6 23 35 7
Patient Nr.
11 12 13 14 15 16 17 18 19 20
Lebensdauer xi 27 1 4 12 2 24 10 3 27 24
Wir haben also
T (x) = 11
und
p=
20
X
b20,0.5 (k ) = 0.411.
k=11
Die Ergebnisse geben also keinen Hinweis darauf, dass das
neue Medikament besser als das etablierte wäre.
64/86
Nichtparametrische Lagetests
Der Mediantest
Theorie: Mediantest
Formale Problemstellung
Sei mP der bekannte Median einer gewissen Verteilung P (altes
Medikament) und mQ der Median der Verteilung Q (neues
Medikament).
Daten: x1 , . . . , xn gezogen nach der Verteilung Q.
T (x) =Anzahl der Werte xi mit xi > mP .
Nullhypothese H0 : mP = mQ
Alternative H1 :
mP > mQ (linksseitig)
mP < mQ (rechtsseitig)
mP 6= mQ (beidseitig).
65/86
Nichtparametrische Lagetests
Der Mediantest
Theorie: Mediantest
Linksseitige Alternative mP > mQ
p-Wert
T (x)
p=
X
k=0
bn,0.5 (k) ≈ 1 − Φ
n−1
2
− T (x)
p
n/4
!
.
Verwerfungsregel
H0 wird zum Niveau α verworfen, falls p ≤ α.
66/86
Nichtparametrische Lagetests
Der Mediantest
Theorie: Mediantest
Rechtsseitige Alternative: mP < mQ
p-Wert
p=
n
X
bn,0.5 (k) ≈ 1 − Φ
k=T (x)
T (x) − n+1
2
p
n/4
!
.
Verwerfungsregel
H0 wird zum Niveau α verworfen, falls p ≤ α.
67/86
Nichtparametrische Lagetests
Der Mediantest
Theorie: Mediantest
Beidseitige Alternative: mP 6= mQ
p-Wert
T (x)
p=2
X
bn,0.5 (k)
falls T (x) < n/2
k=0
und
p=2
n
X
bn,0.5 (k) falls T (x) > n/2.
k=T (x)
"
In beiden Fällen gilt p ≈ 2 1 − Φ
!#
T (x) − n − 1
2
p 2
.
n/4
Verwerfungsregel
H0 wird zum Niveau α verworfen, falls p ≤ α.
68/86
Nichtparametrische Lagetests
Wilcoxon Rangsummentest
Beispiel: Hipparion Reloaded
Niemand sagt Ihnen, dass die Größen der Backenzähne
normalverteilt sind.
Was kann man ohne diese Annahme noch rechnen?
69/86
Nichtparametrische Lagetests
Wilcoxon Rangsummentest
Rangsummen
Gegeben zwei Stichproben x1 , x2 , . . . , xm und y1 , y2 , . . . , yn .
Setze
Ui = Rang von xi in den y1 , . . . , yn
= Anzahl der j mit yj < xi
und definiere die Rangsumme U(x, y ) =
m
X
Ui .
i=1
Beispiel mit m = 4 und n = 7
xi 4 1.3 5.1 2
yj 11 3 5 4.2 6.1 2.5 14
Wert
1.3 2 2.5 3 4 4.2 5 5.1 6.1 11 14
Rang Ui 0
0
2
4
Rangsumme U(x, y) = 0 + 0 + 2 + 4 = 6.
70/86
Nichtparametrische Lagetests
Wilcoxon Rangsummentest
Rangsummen
Idee
Entstammen die xi und yj der gleichen Verteilung (H0 ), so sollte
Ui ≈ n/2 sein und U ≈ mn
.
2
U(x, y) groß zeigt an, dass (xi ) tendenziell größer ist als (yj ).
U(x, y) klein zeigt an, dass (xi ) tendenziell kleiner ist als (yj ).
71/86
Nichtparametrische Lagetests
Wilcoxon Rangsummentest
Rangsummen
Die Verteilung Um,n von U(x, y) unter H0 ist tabelliert und heißt
Wilcoxon-U-Verteilung mit Parametern m und n. Für große m, n
ist
U(x, y) − mn
2
q
∼approx. N0,1 .
mn(m+n+1)
12
Also können wir das Quantil um,n;α durch das Quantil zα
approximativ ausrechnen:
r
mn
mn(m + n + 1)
um,n;α ≈
+
zα .
2
12
72/86
Nichtparametrische Lagetests
Wilcoxon Rangsummentest
Wilcoxon Rangsummentest
Die Theorie
Formale Problemstellung
Die Werte der Stichprobe x1 , . . . , xm sind unabhängig und nach
der Verteilung P gezogen.
Die Werte der Stichprobe y1 , . . . , yn sind unabhängig und nach
der Verteilung Q gezogen.
Nullhypothese H0 : P = Q
Alternative H1 :
P tendenziell größer als Q (linksseitig)
P tendenziell kleiner als Q (rechtsseitig)
P 6= Q (beidseitig)
73/86
Nichtparametrische Lagetests
Wilcoxon Rangsummentest
Wilcoxon Rangsummentest
Linksseitige Alternative: P größer als Q
Verwerfungsregel
Verwirf H0 zugunsten von H1 , falls
U(x, y) > um,n;1−α
mn
≈
+
2
r
mn(m + n + 1)
z1−α .
12
p-Wert

U(x, y) −
p ≈ 1 − Φ q
mn
2
mn(m+n+1)
12

.
74/86
Nichtparametrische Lagetests
Wilcoxon Rangsummentest
Wilcoxon Rangsummentest
Rechtsseitige Alternative: P kleiner als Q
Verwerfungsregel
Verwirf H0 zugunsten von H1 , falls
U(x, y) < um,n;α
mn
≈
+
2
r
mn(m + n + 1)
zα .
12
p-Wert

U(x, y) −
p ≈ 1 − Φ − q
mn
2
mn(m+n+1)
12

.
75/86
Nichtparametrische Lagetests
Wilcoxon Rangsummentest
Wilcoxon Rangsummentest
Beidseitige Alternative: P 6= Q
Verwerfungsregel
Verwirf H0 zugunsten von H1 , falls
r
mn
mn(m + n + 1)
U(x, y ) > um,n;1−α/2 ≈
+
z1−α/2 .
2
12
r
mn
mn(m + n + 1)
oder U(x, y ) < um,n;α/2 ≈
+
zα/2 .
2
12
p-Wert


U(x, y) − mn
2 


p ≈2 1−Φ q
.
mn(m+n+1) 
12
76/86
Nichtparametrische Lagetests
Wilcoxon Rangsummentest
Beispiel: Hipparion Reloaded
Die Daten
Libycum
23
25
24
22
25
27
32.5
26
30
26
25
37
26
26
26
25.5
28.5
40
27
29
28.5
32
30
30.5
25.5
33
36
26.5
24
30
25
27
35
26
34
23
35
29
26
27
25
28.5
23
27
23
31
23
27
23.5
28
23
27
24
31
29
27
25
27.5
29
25
27
24
26.5
24.5
25
25
24
26
24
Africanum
30
24.5
27
26.5
24
23
26
24
77/86
Nichtparametrische Lagetests
Wilcoxon Rangsummentest
Beispiel: Hipparion Reloaded
Die Daten, U-Statistik
Libycum: m = 38 Zähne, Africanum: n = 39 Zähne.
Durch mühseliges Ausrechnen von Hand (oder mit dem
Computer) erhält man
U(Lib, Afr ) = 990.
Wir verwerfen die Nullhypothese Libycum=Africanum“ zum
”
Niveau 1% zugunsten der beidseitigen Alternative, falls
U > u38,39;0.995 = 992 oder U < u38,39;0.005 = 490 (Tabelle: A.8).
Beides ist nicht der Fall, also wird die Nullhypothese zum
Niveau 1% nicht verworfen.
78/86
Nichtparametrische Lagetests
Wilcoxon Rangsummentest
Beispiel: Hipparion Reloaded
Die Daten, U-Statistik
m = 38, n = 39, U(Lib, Afr ) = 990.
p-Wert:



U(Lib, Afr ) − mn
2 


p ≈2 1−Φ q
mn(m+n+1)
12
990 − 741
√
=2 1−Φ
9633
= 2(1 − Φ(2.537)) ≈ 2(1 − 0.9943) = 0.0114.
79/86
Nichtparametrische Lagetests
Wilcoxon Rangsummentest
Beispiel: Hipparion Reloaded
Fazit
Der zweiseitige Wilcoxon Rangsummentest verwirft die
Hypothese, dass Hipparion Africanum und Libycum
unterschiedliche mesiodistale Zahnlänge haben zum Niveau 1%
nicht. Der p-Wert beträgt p = 0.0114
80/86
χ2 -Test
χ2 -Test
χ2-Test
Das Grundproblem
Wir beobachten ein Merkmal in endlich vielen Ausprägungen
i = 1, . . . , k mit Häufigkeiten x1 , . . . , xk .
Gesamtzahl n = x1 + . . . + xk .
Nach einer Theorie sollte der Anteil von Typ i gleich pi sein, also
die absolute Häufigkeit etwa Ei = pi n.
Es soll ein Test zum Niveau α entwickelt werden, der diese
Theorie prüft.
81/86
χ2 -Test
χ2 -Test
χ2-Test
Teststatistik
Beobachtungen x1 , . . . , xk . Gesamtzahl n = x1 + . . . + xk .
Erwartete Häufigkeiten Ei = pi n.
Gewichtete quadratische Abweichungen als Teststatistik
k
X
(xi − Ei )2
T (x) =
.
Ei
i=1
Ist χ2 (x) zu groß, so wird die Hypothese verworfen.
82/86
χ2 -Test
χ2 -Test
χ2-Test
Verwerfungsregel
Unter H0 ist T (x) chiquadrat-verteilt (χ2f ) mit f = k − 1
Freiheitsgraden.
Ist T (x) > χ2f ;1−α , so wird die Nullhypothese zum Niveau α
verworfen.
Der p-Wert ist
p = 1 − χ2f (T (x)).
83/86
χ2 -Test
χ2 -Test
Beispiel: Hardy-Weinberg Gesetz
Fragestellung
In einer sehr großen Population tritt an einem Locus das Gen A
mit Wahrscheinlichkeit p = 0.53 auf, das Gen a mit
Wahrscheinlichkeit 1 − p = 0.47. Nach dem Hardy-Weinberg
Gesetz sind die Anteile
AA
2
Aa
aa
2
p = 0.2809 2p(1 − p) = 0.4982 (1 − p) = 0.2209
In einer Teilpopulation der Größe n soll die Gültigkeit des
Hardy-Weinberg Gesetzes geprüft werden.
84/86
χ2 -Test
χ2 -Test
Beispiel: Hardy-Weinberg Gesetz
Der Test
Die Hypothese HW Gesetz gilt“ soll zum Niveau 1% geprüft
”
werden.
Es werden die Daten xAA , xAa und xaa mit Gesamtumfang
n = 10 000 erhoben. Teststatistik
T (x) =
(xAA − 2809 n)2 (xAa − 4982)2 (xaa − 2209)2
+
+
.
28092
49822
22092
Der Test verwirft, falls T (x) > χ2;0.99 = 9.21 (Tabelle A.5).
85/86
χ2 -Test
χ2 -Test
Beispiel: Hardy-Weinberg Gesetz
Der Test, Daten und Durchführung
AA
Aa
aa
2701 4852 2447
Teststatistik
(2701 − 2809 n)2 (4852 − 4982)2 (2447 − 2209)2
+
+
28092
49822
22092
= 33.187.
T (x) =
Der Test verwirft die Nullhypothese zum Niveau 1%, weil
T (x) = 33.187 > χ2;0.99 = 9.21.
p-Wert
p(x) = 1 − χ22 (33.187) = 6.2 10−8 .
86/86

Zugehörige Unterlagen

= Tests zur statistischen Überprüfung von Hypothesen Studentsche t

Biostatistik, Winter 2011/12 - Vergleich zweier - staff.uni

Zugehörige Unterlagen

Produkte

Unterstützung

Biostatistik, Winter 2011/12 - Vergleich zweier - staff.uni

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können