Vergleich von Gruppen I - t-Test und einfache Varianzanalyse (One

Werbung
Vergleich von Gruppen I
t-Test und einfache Varianzanalyse (One Way ANOVA)
Werner Brannath
VO Biostatistik im WS 2006/2007
Inhalt
Der unverbundene t-Test mit homogener Varianz
Beispiel
Modell
Teststatistik und p-Wert
Nullverteilung
Einfache Varianzanalyse (One Way ANOVA)
Vom t-Test zur ANOVA
One Way ANOVA für drei Gruppen
One Way ANOVA für k Gruppen
Der unverbundene t-Test für homogene Varianzen
I
Zum Vergleich zweier unverbundener Stichproben
bezüglich eines metrischen Merkmals.
I
Testet ob die Mittelwerte der Grundgesamtheit
(Erwartungswerte) verschieden sind.
I
Setzt voraus, dass die arithmetischen Mittelwerte in jeder
Gruppe normalverteilt sind.
I
Setzt voraus, dass die Varianzen der Beobachtungen
in beiden Gruppen gleich gross sind, d.h. die Varianzen
homogen sind.
Beispiel für t-Test für zwei unverbundene Stichproben
Geburtsgewicht von 50 Kindern mit schwerem „idiopathic
respiratory distress syndrom”
1.130
2.600
1.410
2.570
Überlebende Kinder (n1 = 23)
1.575 1.680 1.760 1.930 2.015
2.700 2.950 3.160 3.400 3.640
1.715 1.720 2.040 2.200 2.400
3.005
2.090
2.830
2.550
1.050
1.750
1.225
1.940
Verstorbene Kinder (n2 = 27)
1.175 1.230 1.310 1.500 1.600
1.770 2.275 2.500 1.030 1.100
1.262 1.295 1.300 1.550 1.820
2.200 2.270 2.440 2.560 2.730
1.720
1.185
1.890
1.0
1.5
2.0
2.5
Geburtsgewicht (kg)
3.0
3.5
Boxplots
Baby verstorben
Baby lebt
Mittelwerte und Standardabweichungen
Überlebende Kinder (n1 = 23):
Pn1
Mittelwert
ȳ1 =
j=1 y1j
n1
= 2.307
rP
Standardabweichung
n1
2
j=1 (y1j −ȳ1 )
s1 =
n1 −1
= 0.665
Verstorbene Kinder (n2 = 27):
Pn2
Mittelwert
ȳ2 =
j=1 y2j
n1
= 1.692
rP
Standardabweichung
s2 =
n2
2
j=1 (y2j −ȳ2 )
n2 −1
= 0.518
Fragestellung im Beispiel
Sind die Unterschiede im mittleren Geburtsgewicht durch
reinen Zufall erklärbar, d.h. gilt . . .
H0 : Die beiden Gruppen haben (in Wirklichkeit) ein identisches
mittleres Geburtsgewicht.
oder sind die Unterschiede nicht alleine durch Zufall erklärbar,
d.h. gilt . . .
H1 : Die beiden Gruppen unterscheiden sich in ihrem mittleren
Geburtsgewicht.
Vergleich der Gruppen
I
Differenz der Mittelwerte: ȳ1 − ȳ2 = 0.615
I
Gemeinsame Varianz
s2 =
22 · 0.6652 + 26 · 0.5182
= 0.348
48
√
Gemeinsame Standardabweichung: s = s2 = 0.590
=
I
(n1 − 1) · s12 + (n2 − 1) · s22
n1 + n2 − 2
Zweiseitiger unverbundener t-Test mit homogenen
Varianzen (Software R)
>
t.test(sirdsa,sirdsd,var.equal=T)
Two Sample t-test
data: sirdsa and sirdsd
t = 3.6797, df = 48, p-value = 0.0005902
alternative hypothesis: true difference
in means is not equal to 0
sample estimates:
mean of x mean of y
2.307391 1.691741
0.8
Modell = Annahmen über Grundgesamtheit
0.2
µ1
σ
0.0
Erwartungswert (Mittelwert)
Standardabweichung
Dichte
Geburtsgewicht normalverteilt
0.4
0.6
Überlebende Kinder:
0
1
2
3
4
3
4
0.8
Gewicht (kg)
Dichte
µ2
σ
0.0
Erwartungswert (Mittelwert)
Standardabweichung
0.2
Geburtsgewicht normalverteilt
0.4
0.6
Verstorbene Kinder:
0
Geburtsgewichte unabhängig
1
2
Gewicht (kg)
versch. Mittelwerte
−2
0
4
0.2
0.0
0.1
Dichte
0.3
0.4
Dichten der Normalverteilung
0
5
10
0
5
10
0.5
1
1.5
0.4
0.2
0.0
Dichte
−5
versch. Standardabw.
0.6
0.8
−10
−10
−5
Teststatistik t
n1 , n2 Stichprobenumfänge; ȳ1 , ȳ2 die Mittelwerte
s die gemeinsame Standardabweichung
Teststatistik des unverbundenen t-Tests
t=q
1
1
n1
+
1
n2
· (ȳ1 − ȳ2 )/s
Je grösser der Absolutwert von t desto unplausibler H0 .
Der p-Wert als Plausibilitätswert für H0
Man denke an zweite unabhängige Studie ebenfalls mit
zwei Stichproben der Größe n1 = 23 und n2 = 27,
Stichproben aus einer Grundgesamtheit in der
I
die Nullhypothese H0 : µ1 = µ2 gilt,
I
ansonsten alles wie in der Grundgesamtheit
unserer Studie ist, d.h.:
die Geburtsgewichte normalverteilt sind und
die Varianz σ 2 wie in unserer Studie ist.
Der p-Wert als Plausibilitätswert für H0
Bezeichnen mit t∗ die t-Teststatistik der zweiten Studie.
Defintion des p-Werts
Mit welcher Wahrscheinlichkeit ist der Absolutwert von t ∗
grösser als der Absolutwert von t?
p − Wert = P(t∗2 > t 2 )
Welche Verteilung hat t∗2 ?
Bestimmung der H0 -Verteilung von t 2
Quadrat der t-Teststatistik
t2 =
=
(ȳ1 − ȳ2 )2
1
1
2
+
n1
n2 · s
(ȳ1 − ȳ2 )2
σ 2 · n11 + n12
= Zähler/Nenner
s2
σ2
Verteilung vom Zähler
ȳ1 − y¯2 normalverteilt mit E(ȳ1 − y¯2 ) = µ1 − µ2
und Var (ȳ1 − y¯2 ) = Var (ȳ1 ) + Var (y¯2 ) =
σ2
n1
+
σ2
n2 .
Falls H0 : µ1 = µ2 , dann
√
ȳ1 − ȳ2
Zähler = q
σ2
σ2
n1 + n2
∼
N(0, 1)
Damit ist auch die H0 -Verteilung vom Zähler bekannt!
Definition der χ2k -Verteilung
Definition
Z1 , Z2 , . . . , Zk unabhäng und N(0, 1)-verteilt
Man nennt die Verteilung der Zufallsvariablen
X 2 = Z12 + Z22 + . . . + Zk2
die χ2 -Verteilung mit k Freiheitsgraden, kurz X 2 ∼ χ2k
Beispiel
Wenn H0 : µ1 = µ2 dann
Zähler ∼ χ21
0.20
0.25
Dichten der χ2k -Verteilungen
Freiheitsgrade
0.10
0.05
0.00
Dichte
0.15
1
2
48
0
5
10
15
Summeneigenschaft
Summeneigenschaft der χ2 -Verteilungen
Wenn
X12 ∼ χ2k1
und
X22 ∼ χ2k2
und X12 und X22 sind unabhängig, dann ist
X12 + X22
∼
χ2k1 +k2
Beispiel
X12 ∼ χ222 und X22 ∼ χ226 , dann X12 + X22 ∼ χ248
Verteilung vom Nenner
Nenner:
s2
(n1 − 1) · σ12 + (n2 − 1) ·
s2
=
n1 + n2 − 2
σ2
s22
σ2
Es ist bekannt, dass
(n1 − 1) ·
s12
∼ χ2n1 −1
σ2
und (n2 − 1) ·
Ausserdem sind s1 und s2 unabhängig.
s22
∼ χ2n2 −1
σ2
Verteilung vom Nenner
Wegen der Summeneigenschaft der χ2 -Verteilung
X 2 = (n1 − 1) ·
s22
s12
+
(n
−
1)
·
2
σ2
σ2
∼
χ2n1 +n2 −2
Somit ist die Verteilung von
Nenner = {(n1 − 1) ·
s12
s22
+
(n
−
1)
·
}/(n1 + n2 − 2)
2
σ2
σ2
die χ2 -Verteilung mit n1 + n2 − 2 Freiheitsgraden geteilt durch
n1 + n2 − 2
Symbolisch:
Nenner ∼ χ2n1 +n2 −2 /(n1 + n2 − 2).
Verteilung von t 2
t 2 = Zähler/Nenner
I
Zähler ∼ χ21
I
Nenner ∼ χ2n1 +n2 −2 /(n1 + n2 − 2),
I
Zähler und Nenner sind unabhängig.
Die Verteilung von t 2 heißt
F -Verteilung mit 1 und n1 + n2 − 2 Freiheitsgraden.
ANOVA für Geburtsgewichte
> summary(aov(sirds ∼ Gruppe))
Gruppe
Residuals
Df
1
48
Sum Sq
4.71
16.69
Mean Sq
4.71
0.35
F value
13.5
Pr(>F)
0.0006
ANOVA für zwei Gruppen ist equivalent zum t-Test:
F value . . . ist identisch zu t 2 = 3.862
Pr(>F) . . . ist identisch zum p-Wert des t-Tests
Erkläre als nächstes Mean Sq
und Sum Sq !
Definition von Mean Sq
t
2
(ȳ1 − ȳ2 )2
=
=
.
( n11 +
1
n2 )
{(n1 − 1) · s12 + (n2 − 1) · s22 }/(n1 + n2 − 2)
Mean Sq Gruppe
4.71
=
= 13.5
Mean Sq Residuals
0.35
Defintion von Sum Sq Residual
Sum Sq Residuals
Sum Sq Residuals = (n1 − 1) · s12 + (n2 − 1) · s22
=
n1
X
j=1
2
(y1j − ȳ1 ) +
n2
X
(y2j − ȳ2 )2
j=1
I
. . . ist Summe der Abweichungsquadrate der individuellen
Beobachtungen vom jeweiligen Gruppenmittelwert;
I
. . . wird auch Quadratsumme innerhalb der Gruppen (sum
of squares within groups) genannt.
Sum Sq Gruppe bei zwei Gruppen
Betrachten den Gesamtmittelwert:
Pn1
ȳ =
j=1 y1j
+
Pn2
j=1 y2j
n1 + n2
=
n1
n2
· ȳ1j +
· ȳ2j
n1 + n2
n1 + n2
Man kann ausrechnen, dass
2
Sum Sq Gruppe = (ȳ1 − ȳ2 )
(
1
1
+ )
n1 n2
= n1 · (ȳ1 − ȳ )2 + n2 · (ȳ2 − ȳ )2
Definition Sum Sq Gruppe
Sum Sq Gruppe
Sum Sq Gruppe = n1 · (ȳ1 − ȳ )2 + n2 · (ȳ2 − ȳ )2
I
. . . ist Summe der Abweichungsquadrate der zwei
Gruppenmittelwerte zum Gesamtmittelwert;
I
. . . wird Quadratsumme zwischen den Gruppen (sum of
squares between groups) genannt.
Beziehung zwischen Sum Sq und Mean Sq
Mean Sq Gruppe =
Mean Sq Residuals =
F Statistic =
Sum Sq Gruppe
1
Sum Sq Residuals
(n1 + n2 − 2)
Mean Sq Gruppe
Mean Sq Residual
Verteilungen unter H0 : µ1 = µ2
Mean Sq Gruppe ∼ χ21 /1
Mean Sq Residuals ∼ χ2n1 +n2 −2 /(n1 + n2 − 2)
F Statistic ∼
χ2n1 +n2 −2 /(n1 + n2 − 2)
χ21 /1
= F1,n1 +n2 −2
Vergleich von drei Gruppen - Beispiel
22 Patienten mit künstlicher Beatmung wurden
drei Beatmungsgruppen per Zufall zugeteilt (randomisiert)
I
Gruppe A: 50% Stickoxid und 50% Sauerstoffgemisch für
24 Stunden.
I
Gruppe B: 50% Stickoxid und 50% Sauerstoffgemisch nur
wärend der Operation.
I
Gruppe C: kein Stickoxid, 35-50% Sauerstoff für 24
Stunden.
Endpunkt: Die Wirkung der Beatmung wird durch die
Blutplättchenzahl nach 24 stündiger Beatmung beurteilt.
Beispiel: Fragestellung
Unterscheiden sich die drei Methoden in
ihrer Wirkung auf die Bluttplättchenzahl?
Beispiel: Blutplättchenzahl
arithm. Mittel
Standardabw.
Gruppe A
n=8
Gruppe B
n=9
Gruppe B
n=5
243
251
275
291
347
354
380
392
206
210
226
249
255
273
285
295
309
241
258
270
293
328
316.6
58.7
256.4
37.1
278.0
33.8
300
250
200
Blutplättchenzahl
350
Beispiel: Boxplots der Blutblättchenzahl
A
B
Gruppe
C
Beispiel: Vergleich der Mittelwerte
Sind die Unterschiede in der mittleren Blutplättchenzahl durch
reinen Zufall erklärbar, d.h. gilt . . .
H0 : Die drei Beatmungsmethoden wirken (in Wirklichkeit)
gleich auf die durchschnittliche Blutplättchenzahl.
oder sind die Unterschiede nicht alleine durch Zufall erklärbar,
d.h. gilt . . .
H1 : Die Beatmungsmethoden unterscheiden sich in ihrer
Wirkung auf die durchschnittliche Blutplättchenzahl.
ANOVA für Blutplättchenzahl
> summary(aov(Foliate Group,data=redcell))
Group
Residuals
Df
2
19
Sum Sq
15516
39716
Mean Sq
7758
2090
F value
3.7113
Im folgenden betrachten wir:
I
I
I
Sum Sq Group und Sum Sq Group
Mean Sq Group und Mean Sq Group
F value und seine Verteilung.
Pr(>F)
0.04359
Defintion der Qudratsummen
Quadratsumme zwischen den Gruppen
Sum Sq Gruppe = n1 · (ȳ1 − ȳ )2 + n2 · (ȳ2 − ȳ )2 + n3 · (ȳ3 − ȳ )2
Quadratsumme innerhalb der Gruppen
Sum Sq Residuals =
= (n1 − 1) · s12 + (n2 − 1) · s22 + (n3 − 1) · s32
=
n1
X
j=1
2
(y1j − ȳ1 ) +
n2
X
j=1
2
(y2j − ȳ2 ) +
n3
X
j=1
(y3j − ȳ3 )2
Mittlere Qudratsummen
Mean Sq Gruppe =
Mean Sq Residuals =
F Statistic =
Sum Sq Gruppe
2
Sum Sq Residuals
(n1 + n2 + n3 − 3)
Mean Sq Gruppe
Mean Sq Residual
Verteilungen unter H0 : µ1 = µ2 = µ3
Mean Sq Gruppe ∼ χ22 /2
Mean Sq Residuals ∼ χ2n1 +n2 +n3 −3 /(n1 + n2 + n3 − 3)
F Statistic ∼ F2,n1 +n2 +n3 −3
ANOVA mit k Gruppen
k . . . Gruppen
ni . . . Stichprobengrösse der Gruppe i (i = 1, . . . , k )
P
N = ki=1 ni . . . Gesamtzahl der Beobachtungseinheiten
µi . . . Mittelwert der Grundegesamtheit in Gruppe i
σ 2 . . . gemeinsame Varianz in der Grundgesamtheit
Modell
yij = µi + εij ,
εij ∼ N(0, σ 2 ) unabhängig
Hypothesen
H0 : µ1 = · · · = µk ,
H1 : µi 6= µj für mind. eine i und j
Defintion der Qudratsummen bei k Gruppen
Quadratsumme zwischen Gruppen (between groups)
Sum Sq Gruppe =
k
X
ni · (ȳi − ȳ )2
i=1
Quadratsumme innerhalb der Gruppen (within groups)
Sum Sq Residuals =
k
X
i1
(ni − 1) · si2 =
ni
k X
X
i=1 j=1
(yij − ȳi )2
Mittlere Qudratsummen
Mean Sq Gruppe =
Mean Sq Residuals =
F Statistic =
Sum Sq Gruppe
k −1
Sum Sq Residuals
(N − k )
Mean Sq Gruppe
Mean Sq Residual
Verteilungen unter H0 : µ1 = µ2 = . . . = µk
Mean Sq Gruppe ∼ χ2k −1 /k − 1
Mean Sq Residuals ∼ χ2N−k /(N − k )
F Statistic ∼ Fk −1,N−k
Zugehörige Unterlagen
Herunterladen