Einfaktorielle Varianzanalyse

Werbung
Einfaktorielle Varianzanalyse
… Vergleich mehrerer Mittelwerte
Berghold, IMI, MUG
Beispiel
Es wurden die anorganischen Phosphatwerte im Serum
(mg/dl) eine Stunde nach einem Glukosetoleranztest bei
übergewichtigen Personen mit Hyperinsulinämie, nichtHyperinsulinämie und Kontrollen gemessen.
Gibt es Unterschiede zwischen den 3 Gruppen?
Berghold, IMI, MUG
Hypothesen
• Nullhypothese:
H0: μ1 = μ2 = μ3 = … = μk
• Alternativhypothese:
H1: wenigstens ein μi unterscheidet sich von den
anderen
Globaltest
Berghold, IMI, MUG
Voraussetzungen
• Voraussetzungen:
• Daten aller Stichproben entstammen normalverteilten
Grundgesamtheiten
• Varianzhomogenität
(Faustregel: Verhältnis größter zu kleinster Standardabweichung
muss kleiner 2:1 sein; Levene-Test, …)
• Die Messwerte bzw. Faktorstufen sind voneinander unabhängig
Berghold, IMI, MUG
Modellbetrachtung
yij = μ + α i + ε ij
yij ist die jte Beobachtung (j=1,2,…,ni) in Gruppe i (i=1,2,…,k)
µ ist das Gesamtmittel
αi ist die Differenz zwischen Mittelwert von Gruppe i und dem
Gesamtmittel
εij ist der Fehlerterm
Berghold, IMI, MUG
Varianzanalyse
Vergleicht die Variation zwischen den Gruppen mit der
Variation innerhalb der Gruppen.
• Gesamtvariabilität wird in 2 Komponenten aufgeteilt:
• Variabilität “zwischen” Gruppen, und
• Variabilität “innerhalb” Gruppen
• Varianzanalysetafel (ANOVA Tafel)
Berghold, IMI, MUG
Quadratsummen
∑∑ (y − y ) =∑∑ ( y − y ) + ∑∑ (y − y )
2
i
j
SST
ij
..
2
i
j
i.
SSB
..
2
i
j
ij
i.
SSW
SST:
Gesamt-Quadratsumme
SSB:
Quadratsumme der Behandlungen
SSW:
Fehler-Quadratsumme
Berghold, IMI, MUG
Varianzanalyse
ONEWAY ANOVA
y
Between groups
Within groups
Total
Sum of
Squares
56,000
6,000
62,000
df
2
9
11
Mean
Square
28,000
,667
F
42,000
Significan
ce
,000
Wir können die Nullhypothese verwerfen.
Berghold, IMI, MUG
Varianzanalyse
• df = (n – 1) = (n – k) + (k – 1)
• SS / df = mittlere Quadrate (MQ)
• Entstammen alle Gruppen derselben Grundgesamtheit, dann
sollten die Varianzen, also die Mittleren Quadrate, MQzwischen
und MQinnerhalb, gleich groß sein.
MQzwischen
1 k
2
(
)
=
n
y
−
y
∑
i
i.
..
k − 1 i =1
MQinnerhalb
1 k ni
2
(
)
=
y
−
y
∑∑
ij
i.
k − 1 i =1 j =1
Berghold, IMI, MUG
Varianzanalyse
• Sind diese nicht gleich groß, d.h. ist der Quotient aus MQzwischen
und MQinnerhalb größer als der kritische Wert der F-Verteilung
(bestimmt durch df1, df2 und α), so wird die Nullhypothese
verworfen.
Fˆ > F(k −1;n −k ;α ) → H0 verwerfen
• df1 = k – 1; df2 = n - k
• D.h. Es gibt Gruppen mit unterschiedlichen Mittelwerten,
mindestens zwei µi sind voneinander verschieden.
Berghold, IMI, MUG
Post-hoc Tests
Durchführung von paarweisen Vergleichen, um die
signifikanten Unterschiede zwischen den Gruppen zu erkennen.
Einhaltung der family-wise error rate (FWER)
(FWER =PR(V>=1) = 0,05)
Wirklichkeit
Testentscheidung
Gesamt
H0 wahr
H0 falsch
Signifikant
V
S
R
Nicht signifikant
U
T
M-R
M0
M-M0
M
Gesamt
Berghold, IMI, MUG
Multiples Testen
• Durchführung von lediglich 2 Tests auf dem 5%
Signifikanzniveau und Annahme, dass zwischen den beiden
Behandlungen A und B kein Unterschied besteht.
• Dann beträgt bei 2 unabhängigen Merkmalen die
Wahrscheinlichkeit dafür, dass beide Tests eine richtignegative Entscheidung liefern 0.95 x 0.95 = 0.9025.
Daraus folgt, dass die Wahrscheinlichkeit für mindestens eine
falsch-positive Entscheidung 1 – 0.9025 = 0.0975 beträgt.
• Je mehr Tests durchgeführt werden, desto ausgeprägter wird
dieser Effekt. Bei 20 Tests ist die Wahrscheinlichkeit zumindest
ein signifikantes Ergebnis zu erhalten 1 – (0,95)20 = 0,64.
Berghold, IMI, MUG
Post-hoc Tests
Multiple Vergleiche, p-Werte müssen korrigiert werden.
• Bonferroni
Die Unsicherheit (Irrtumswahrscheinlichkeit α=0,05) wird zu gleichen
Teilen auf alle Paarvergleiche aufgeteilt. Bei 4 Gruppen gibt es
3+2+1=6 Vergleiche; jeder dieser Tests wird mit α/6 durchgeführt.
Die Bonferroni-Korrektur ist konservativ, d.h. sie hält lange an der
Nullhypothese fest
Alternativen
• Bonferroni-Holm-Korrektur
• LSD – Least-Signifikant-Difference
• HSD – Honest-Significant-Difference (Tukey)
• SNK – Student-Newman-Keuls …
Berghold, IMI, MUG
Beispiel – randomisiertes Blockexperiment
Untersucht wurde die Gerinnungszeit von Plasma, das mit vier
verschiedenen Methoden behandelt wurde. Von 8 zufällig
ausgewählten Patienten einer Population werden je 4
Blutproben genommen und zufällig den 4
Behandlungsmethoden zugeteilt. Die Gerinnungszeiten (min)
von diesen 8x4 Plasmen wurden bestimmt.
Gibt es Unterschiede zwischen den Behandlungen.
Berghold, IMI, MUG
Daten – randomisiertes Blockexperiment
Subject
1
2
3
4
5
6
7
8
treat1
8,4
12,8
9,6
9,8
8,4
8,6
8,9
7,9
treat2
9,4
15,2
9,1
8,8
8,2
9,9
9
8,1
treat3
9,8
12,9
11,2
9,9
8,5
9,8
9,2
8,2
treat4
12,2
14,4
9,8
12
8,5
10,9
10,4
10
Berghold, IMI, MUG
Analyse – randomisiertes Blockexperiment
Tests der Zwischensubjekteffekte
Abhängige Variable: clot_time
Quelle
Korrigiertes Modell
Konstanter Term
subjects
treatments
Fehler
Gesamt
Korrigierte
Gesamtvariation
Quadratsum
me vom Typ III
92,005a
3196,001
78,989
13,016
13,774
3301,780
105,779
df
10
1
7
3
21
32
Mittel der
Quadrate
9,201
3196,001
11,284
4,339
,656
F
14,027
4872,749
17,204
6,615
Signifikanz
,000
,000
,000
,003
31
a. R-Quadrat = ,870 (korrigiertes R-Quadrat = ,808)
Berghold, IMI, MUG
Nichtparametrische Methoden
• Kruskal Wallis Test
• Friedman Test
Berghold, IMI, MUG
Weiterführende Methoden
• Zweifaktorielle ANOVA (die Varianz wird zwei Faktoren und
Wechselwirkung zugeschrieben)
• Mehrfaktorielle ANOVA (MANOVA)
• ANOVA mit Messwiederholungen (Repeated Measurement –
mehrere Messungen am gleichen Objekt, häufig ein zeitlicher
Verlauf)
• GLM, ANCOVA, GEE, Mixed Models,…..
Berghold, IMI, MUG
Herunterladen