t-Test

Werbung
Fortbildung I
Analyse stetiger Daten
Ein- bzw. Zwei-Gruppenvergleich
- 09.03.2005 -
Dipl.-Stat. C. Nicolay
Institut für Medizinische Biometrie, Informatik und Epidemiologie
der Universität Bonn
Sigmund-Freud-Str. 25
53105 Bonn
[email protected]
Bioinformatik
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
Themen:
• Daten
Überprüfen der Daten
Deskriptive Darstellung, Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs. nicht-parametrische Verfahren
• Verbundene vs. unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon
• Unverbundene Testsituation
parametrisch: t-Test (gleiche Varianzen)
t-Test (ungleiche Varianzen)
nicht-parametrisch: U-Test von Mann-Whitney
Fortbildung I Anästhesie 9.3.2005
Bioinformatik
Folie 2 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Überprüfen der Daten
• Eingabefehler
• Inkonsistenzen -> Plausibilitäts-Checks
• Ausreisser
• Fehlende Werte
Deskriptive Darstellung
• Anzahl der Werte
• Mittelwert, Standardabweichung
• 95%-Konfidenzintervall
• Minimum, Median, Maximum
Graphische Darstellung
• Histogramm
• Box-Plot
• Normal Plot
Bioinformatik
Fortbildung I Anästhesie 9.3.2005
Folie 3 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
Beispiel (D. Altman, S. 23 ff.)
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Fortbildung I Anästhesie 9.3.2005
Univariate Statistiken
IgM [g/l]
Gültig
,1
,2
,3
,4
,5
,6
,7
,8
,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
2,0
2,1
2,2
2,5
2,7
4,5
Gesamt
Häufigkeit
3
7
19
27
32
35
38
38
22
16
16
6
7
9
6
2
3
3
3
2
1
1
1
1
298
Prozent
1,0
2,3
6,4
9,1
10,7
11,7
12,8
12,8
7,4
5,4
5,4
2,0
2,3
3,0
2,0
,7
1,0
1,0
1,0
,7
,3
,3
,3
,3
100,0
IgM [g/l]
Mittelwert
95% Konfidenzintervall
des Mittelwerts
Untergrenze
Obergrenze
Statistik
,803
,749
5% getrimmtes Mittel
Median
Varianz
Standardabweichung
Minimum
Maximum
Spannweite
Interquartilbereich
Standardfehler
,857
,760
,700
,220
,4695
,1
4,5
4,4
,5
,0272
Histogramm
40
30
Häufigkeit
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
20
10
0
0,0
1,0
2,0
3,0
4,0
5,0
IgM [g/l]
Folie 4 / 24
Bioinformatik
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
Beispiel (D. Altman, S. 23 ff., Fortsetzung)
Box-Plot
5,0
Maximum
Extremwerte: Mehr als 3 Boxhöhen
(Q3-Q1)von oberem bzw. unteren
Quartil entfernt
4,0
• Verbundene vs.
unverbundene Testsituation
3,0
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Ausreisser: Mehr als 1½ Boxhöhen
(Q3-Q1)von oberem bzw. unteren
Quartil entfernt
2,0
oberes Quartil (Q3)
1,0
Median
Minimum
0,0
Fortbildung I Anästhesie 9.3.2005
unteres Quartil (Q1)
IgM [g/l]
Bioinformatik
Folie 5 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
Beispiel (D. Altman, S. 23 ff., Fortsetzung)
IgM [g/l]: Normalplot
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
Erwarteter Normalwert
3
2
1
0
-1
-2
-3
-1
0
1
2
3
4
Beobachteter Wert
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
5
Der W-Test von Shapiro-Wilk ist
eine Möglichkeit zu testen, ob die
vorliegenden Daten normalverteilt
sind. Man sollte sich aber nicht
allein auf das Test-Ergebnis
verlassen, sondern immer die
dazugehörigen deskriptiven
Statistiken, Histogramm oder BoxPlot und den Normalplot in die
Entscheidung mit einbeziehen.
Bei den vorliegenden Daten braucht
man eigentlich das Test-Ergebnis
nicht, um zu dem Schluss zu
kommen, dass die Daten nicht
normalverteilt sind.
Tests auf Normalverteilung
a
IgM [g/l]
Kolmogorov-Smirnov
Statistik
df
Signifikanz
,170
298
,000
Shapiro-Wilk
Statistik
df
Signifikanz
,823
298
,000
a. Signifikanzkorrektur nach Lilliefors
Bioinformatik
Fortbildung I Anästhesie 9.3.2005
Folie 6 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
Transformation
Viele Variablen (z.B. Labordaten) sind exponentialverteilt, wie die Daten aus
dem Beispiel. Solche Daten kann man durch eine Transformation in eine
Normalverteilung überführen.
Vorteile:
• Erfüllung der Voraussetzung für viele parametrische Verfahren
• Angleichung der Varianz für verschiedene Gruppen. Dies funktioniert v.a.
dann gut, wenn das Verhältnis von Standardabweichung zu Mittelwert in
den verschiedenen Gruppen ähnlich ist.
• Reduktion des Einflusses von Ausreißern
Mögliche Transformationen:
• log10(x) oder loge(x)
• x
• 1/x
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Beispiel (D. Altman, S. 23 ff., Fortsetzung)
Die Daten können durch logarithmieren (hier: zur Basis e) in eine
Normalverteilung überführt werden
Bioinformatik
Fortbildung I Anästhesie 9.3.2005
Folie 7 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
Beispiel (D. Altman, S. 23 ff., Fortsetzung)
Univariate Statistiken
ln(IgM) [g/l]: Normalplot
ln(IgM) [g/l]
• Parametrische vs.
nicht-parametrische
Verfahren
Mittelwert
95% Konfidenzintervall
des Mittelwerts
Untergrenze
Obergrenze
5% getrimmtes Mittel
Median
Varianz
Standardabweichung
Minimum
Maximum
Spannweite
Interquartilbereich
Standardfehler
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
3
-,30082
-,35502
-,35667
,299
,546895
-2,303
1,504
3,807
,693
,03168
2
1
0
-1
-2
-3
-2
-1
0
a
Häufigkeit
2
Tests auf Normalverteilung
Kolmogorov-Smirnov
40
1
Beobachteter Wert
Histogramm
Statistik
ln(IgM) [g/l] ,098
df
298
Shapiro-Wilk
Signifikanz Statistik
,000
,976
df
298
Signifikanz
,000
a. Signifikanzkorrektur nach Lilliefors
30
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Statistik
-,36316
-,42551
Erwarteter Normalwert
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
20
10
0
-2,000
0,000
2,000
Cave: Aufgrund des großen Stichprobenumfanges findet der W-Test auch kleine,
nicht normalverteilte Datenmengen, die
aber eigentlich unwichtig sind.
Bioinformatik
ln(IgM) [g/l]
Fortbildung I Anästhesie 9.3.2005
Folie 8 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Fortbildung I Anästhesie 9.3.2005
Parametrische vs. nicht-parametrische Verfahren
Viele statistische Methoden basieren auf der Annahme, dass die
beobachteten Daten eine Stichprobe aus einer Grundgesamtheit darstellen mit einer Verteilung (in dieser Grundgesamtheit),
die man theoretisch (mathematisch) beschreiben kann.
Wenn diese Annahme vernünftig ist, dann sind die o.g.
statistischen Analyse-Methoden einfach zu benutzen und
besitzen eine große Bandbreite.
Wenn die Verteilungs-Annahmen jedoch nicht begründet sind,
und dennoch parametrische Methoden benutzt werden, so
kann dies zu falschen und somit ungültigen Schlussfolgerungen
führen.
Bei der Analyse von Daten wählt man demnach zwischen
- parametrischen Methoden (es werden konkrete Verteilungsannahmen der Daten vorausgesetzt) und
- nicht-parametrischen Methoden (es werden keine
Verteilungsannahmen vorausgesetzt).
Folie 9 / 24
Bioinformatik
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Verbundene vs. unverbundene Testsituation
In einer verbundenen Testsituation werden zwei oder mehrere
Beobachtungen an einer Untersuchungseinheit (Individuen, Tiere,
Laborversuchsansatz, etc.) durchgeführt (gepaarte oder
abhängige Daten).
Daraus folgt logischerweise, dass der Stichprobenumfang in beiden
Gruppen gleich ist.
Auch Studien, bei denen Patientengruppen individuell gematcht
sind, fallen in diese Kategorie.
Beispiel:
Blutdruck während und nach der Schwangerschaft bei einer Gruppe
von n Frauen
In einer unverbundenen Testsituation gehören die Beobachtungen
zu zwei unabhängigen Gruppen von Individuen (Tieren etc.).
Die Stichprobenumfänge müssen nicht gleich groß sein. Manchmal
ist das auch gar nicht möglich, z.B. bei seltenen Erkrankungen.
Beispiel:
Geburtsgewicht von Jungen vs. Geburtsgewicht von Mädchen
Bioinformatik
Fortbildung I Anästhesie 9.3.2005
Folie 10 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
Verbundene Testsituation: t-Test (Theorie)
Testproblem (Beispiel):
Eine stetige Variable wurde zu zwei verschiedenen Zeitpunkten in derselben
Gruppe von n Individuen gemessen. Aufgrund der verbundenen Testsituation
kann die Analyse vereinfacht werden, indem man die intraindividuellen
Differenzen berechnet und diese analysiert. Hier spielt die Variabilität
innerhalb der Individuen eine tragende Rolle.
Voraussetzungen:
Die intraindividuellen Differenzen di (i=1, ..., n) müssen aus einer
normalverteilten Grundgesamtheit stammen.
H0: Erwartungswert(di) = 0
H1: Erwartungswert(di) ≠ 0
Die dazugehörige Test-Statistik t =
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Fortbildung I Anästhesie 9.3.2005
d
verbindet den Mittelwert der
se(d )
beobachteten, intraindividuellen Differenzen mit dem dazugehörigen
Standardfehler.
se( d ) =
s
n
(s = Standardabweichung)
Bioinformatik
Folie 11 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Fortbildung I Anästhesie 9.3.2005
Verbundene Testsituation: t-Test (Beispiel)
Mean daily dietary intake over 10 pre-menstrual and 10 post-menstrual days
(Altman, S. 190 ff.)
Dietary intake (kJ)
#
pre
post Diff.
---------------------------------1
5260 3910 1350
2
5470 4220 1250
3
5640 3885 1755
4
6180 5160 1020
5
6390 5645
745
6
6515 4680 1835
7
6805 5265 1540
8
7515 5975 1540
9
7515 6790
725
10
8230 6900 1330
11
8770 7335 1435
Univariate Statistiken
Pre-menstrual
Post-menstrual
Difference (pre-post)
Mittelwert
Standardabweichung
Standardfehler
Mittelwert
Standardabweichung
Standardfehler
Mittelwert
Standardabweichung
Standardfehler
Statistik
6753,64
1142,12
344,36
5433,18
1216,83
366,89
1320,45
366,75
110,58
Test bei gepaarten Stichproben
Mittelwert
Pre-menstrual Post-menstrual
1320,455
Standardabweichung
366,746
Standardfehler des
Mittelwertes
110,578
T
11,941
df
Sig. (2-seitig)
10
,000
Bioinformatik
Folie 12 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Fortbildung I Anästhesie 9.3.2005
Verbundene Testsituation: Vorzeichen-Rang-Test
von Wilcoxon (Theorie)
Testproblem (Beispiel):
Eine stetige Variable wurde zu zwei verschiedenen Zeitpunkten in derselben
Gruppe von n Individuen gemessen. Die intraindividuellen Differenzen
entstammen wahrscheinlich keiner Normalverteilung.
Voraussetzungen:
Die intraindividuellen Differenzen di (i=1, ..., n) stammen aus einer
Grundgesamtheit mit einer symmetrischen Verteilung.
-> auch hier kann eine Transformation der Daten helfen.
Man geht in drei Schritten vor:
(1) Berechnen der intraindividuellen Differenzen
(2) Ordnen der intraind. Differenzen ohne Beachtung des Vorzeichens
(3) Berechnen der Rangsumme aller negativen bzw. positiven Ränge
(R- bzw. R+, ohne Null-Differenzen)
Die Test-Statistik W = min(|R-|, |R+|)
Eine Alternative hierzu ist der Vorzeichen-Test.
Bioinformatik
Folie 13 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Fortbildung I Anästhesie 9.3.2005
Verbundene Testsituation: Vorzeichen-Rang-Test
von Wilcoxon (Beispiel)
Daily energy intake of 11 healthy women with rank order of differences
(ignoring their signs) from the recommended intake of 7725 kJ (Altman,
S. 188 ff.)
Daily
Diff. to Rank of
#
intake 7725 kJ differences
------------------------------------------------1
5260
2465
11
2
5470
2255
10
3
5640
2085
9
4
6180
1545
8
5
6390
1335
7
6
6515
1210
6
7
6805
920
4
8
7515
210
1.5
9
7515
210
1.5
10
8230
- 505
3
11
8770
-1045
5
Ränge
Recommended
daily intake [kJ]
- Pre-menstrual
Negative Ränge
N
2a
Mittlerer
Rang
4,00
Rangsumme
8,00
Positive Ränge
9b
6,44
58,00
Bindungen
0c
Gesamt
11
a. Recommended daily intake [kJ] < Pre-menstrual
b. Recommended daily intake [kJ] > Pre-menstrual
c. Recommended daily intake [kJ] = Pre-menstrual
Statistik für Wilcoxon-Test
Z
Asymptotische
Signifikanz (2-seitig)
Recommended
daily intake [kJ] Pre-menstrual
-2,224a
,026
a. Basiert auf negativen Rängen.
Bioinformatik
Folie 14 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
Unverbundene Testsituation: t-Test (gleiche Varianzen)
Testproblem (Beispiel):
Eine stetige Variable wurde in zwei verschiedenen Gruppen gemessen. Die
Stichprobenumfänge müssen nicht gleich sein. Wir interessieren uns für den
mittleren Unterschied zwischen beiden Gruppen. In dieser Situation wird die
Variabilität zwischen den Individuen wichtig.
Voraussetzungen:
Beide Stichproben stammen jeweils aus einer normalverteilten Grundgesamtheit, und die Varianzen in beiden Stichproben sind gleich.
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
H0: Erwartungswert(Gruppe 1) = Erwartungswert(Gruppe 2)
H1: Erwartungswert(Gruppe 1) ≠ Erwartungswert(Gruppe 2)
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
verbindet wie beim gepaarten t-Test den Mittelwert der beobachteten
Differenzen mit dem dazugehörigen Standardfehler. Hier wird der
Standardfehler aus den einzelnen Standardabweichungen berechnet.
Die dazugehörige Test-Statistik
Fortbildung I Anästhesie 9.3.2005
x1 − x 2
se( x1 − x 2 )
( n1 − 1) s1 + (n 2 − 1) s 2
1
1
⋅
+
n1 + n2 − 2
n1 n 2
2
se( x1 − x 2 ) =
t=
2
Bioinformatik
Folie 15 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
Unverbundene Testsituation: t-Test (gleiche Varianzen)
Lean
Obese
#
(n=13)
(n=9)
-------------------------------1
6.13
8.79
2
7.05
9.19
3
7.48
9.21
4
7.48
9.68
5
7.53
9.69
6
7.58
9.97
7
7.90
11.51
8
8.08
11.85
9
8.09
12.79
10
8.11
11
8.40
12
10.15
13
10.88
Beispiel:
24 hour total energy expenditure (MJ/day) in
groups of lean and obese women
(Altman, S. 193 ff.)
Gruppenstatistiken
Gruppe
Lean
Obese
N
13
9
Mittelwert
8,0662
10,2978
Standardabweichung
1,23808
1,39787
Standardfehler des
Mittelwertes
,34338
,46596
Test bei unabhängigen Stichproben
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
T-Test für die Mittelwertgleichheit
T
-3,946
df
20
Sig. (2-seitig)
,001
Mittlere
Differenz
-2,23162
Standardfehler der
Differenz
,56560
95% Konfidenzintervall
der Differenz
Untere
Obere
-3,41145
-1,05180
Bioinformatik
Fortbildung I Anästhesie 9.3.2005
Folie 16 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Unverbundene Testsituation: t-Test (ungleiche Varianzen)
Testproblem (Beispiel):
Wie beim t-Test (gleiche Varianzen)
Manchmal liegen Daten vor, die aus normalverteilten Grundgesamtheiten
stammen, aber bei denen sich die Variabilität in den beiden Gruppen stark
unterscheidet.
(1) Wie groß muss dieser Unterschied sein, bevor er zu groß ist?
(2) Was tut man in diesem Fall?
Zu (1):
Zur Überprüfung kann man F-Test heranziehen (standardmäßig in SPSS).
Zu (2):
Kann man davon ausgehen, dass die Daten aus normalverteilten Grundgesamtheiten stammen, aber mit verschiedenen Varianzen, dann kann man einen etwas
modifizierten t-Test für die Analyse benutzen. Die Modifikation bezieht sich auf
die Berechung des Standardfehlers der Differenzen.
2
se( x1 − x 2 ) =
Fortbildung I Anästhesie 9.3.2005
2
s1
s
+ 2
n1
n2
Bioinformatik
Folie 17 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
Unverbundene Testsituation: t-Test (ungleiche Varianzen)
No/Slight
Marked
symptoms symptoms
#
(n=9)
(n=7)
-------------------------------1
34
5
2
45
8
3
49
18
4
55
24
5
58
60
6
59
84
7
60
8
62
9
86
Beispiel:
Serum thyroxine level (nmol/l) in 16 hypothyroid
infants by severity of symptoms (Altman, S. 198 ff.)
Gruppenstatistiken
Symptoms
No/slight
Marked
9
7
Mittelwert
56,44
42,14
Standardfehler des
Mittelwertes
4,741
14,166
Test bei unabhängigen Stichproben
Levene-Test der
Varianzgleichheit
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
N
Standardabweichung
14,222
37,481
Varianzen sind
gleich
Varianzen sind
nicht gleich
T-Test für die Mittelwertgleichheit
df
Sig.
(2-seitig)
Mittlere
Differenz
Standardfehler der
Differenz
1,059
14
,307
14,302
,957
7,35
,369
14,302
F
Signifikanz
T
15,573
,001
95% Konfidenzintervall
der Differenz
Untere
Obere
13,500
-14,654
43,257
14,939
-20,684
49,288
Bioinformatik
Fortbildung I Anästhesie 9.3.2005
Folie 18 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Fortbildung I Anästhesie 9.3.2005
Unverbundene Testsituation: U-Test von Mann-Whitney
(Theorie)
Testproblem (Beispiel):
Wie beim t-Test für unverbundene Stichproben. Die Werte entstammen aber
wahrscheinlich keinen normalverteilten Grundgesamtheiten.
Voraussetzungen:
Die Daten sind ordinal skaliert.
Man geht in drei Schritten vor:
(1) Alle n=n1+n2 Beobachtungen werden der Reihe nach geordnet
(2) Die Rangsummen für jede der beiden Gruppen wird berechnet.
(T1 bzw. T2)
(3) Test-Statistik U = n1n2 + ½ n1(n1+1) – T1, bzw.
U‘= n1n2 + ½ n2(n2+1) – T2
U ist die Anzahl aller möglichen Paare (x,y) von Beobachtungen mit x aus
Gruppe 1 und y aus Gruppe 2 für die gilt: x < y (Rangplatzüberschreitung),
U‘ ist die Anzahl der Rangplatzunterschreitungen (U+U‘ = n1n2).
U bzw. U‘ werden mit dem unter der Nullhypothese erwarteten
U-Wert μU =
n1 ⋅ n2
2
verglichen.
Bioinformatik
Folie 19 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
• Daten
Überprüfen der Daten
Deskriptive Darstellung
Graphische Darstellung
Check auf Normalverteilung
Transformation von Daten
Unverbundene Testsituation: U-Test von Mann-Whitney
(Beispiel)
24 hour total energy expenditure (MJ/day) in groups of lean and obese
women (Altman, S. 193 ff.)
• Parametrische vs.
nicht-parametrische
Verfahren
• Verbundene vs.
unverbundene Testsituation
• Verbundene Testsituation
parametrisch: t-Test
nicht-parametrisch:
Vorzeichen-Rang-Test
von Wilcoxon
• Unverbundene Testsituation
parametrisch: t-Test
(gleiche Varianzen)
t-Test
(ungleiche Varianzen)
nicht-parametrisch:
U-Test von Mann-Whitney
Lean
Obese
#
(n=13)
(n=9)
-------------------------------1
6.13
8.79
2
7.05
9.19
3
7.48
9.21
4
7.48
9.68
5
7.53
9.69
6
7.58
9.97
7
7.90
11.51
8
8.08
11.85
9
8.09
12.79
10
8.11
11
8.40
12
10.15
13
10.88
Ränge
Gruppe
Lean
Obese
Gesamt
N
13
9
22
Mittlerer Rang
7,92
16,67
Rangsumme
103,00
150,00
U-Test von Mann-Whitney
Mann-Whitney-U
Z
Asymptotische
Signifikanz (2-seitig)
24h total
energy
(MJ/day)
12,000
-3,106
,002
Bioinformatik
Fortbildung I Anästhesie 9.3.2005
Folie 20 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
Daten
(1 oder 2 Gruppen)
Überprüfung durch
• deskript. Statistik (Ausreißer ?)
• Histogramm/Boxplot/Normalplot
• W-Test Shapiro-Wilk
normalverteilt?
nein
ja
ja
Unverbundene
Testsituation
t-Test
für unabhängige
Stichproben
• Kontrolle der Varianzen
• evtl. lieber nicht-parametrische Verfahren)
Fortbildung I Anästhesie 9.3.2005
Transformation
hilfreich?
Verbundene
Testsituation
t-Test
für abhängige
Stichproben
nein
Unverbundene
Testsituation
U-Test von
Mann-Whitney
Verbundene
Testsituation
Vorzeichen-Rang-Test
von Wilcoxon oder
Vorzeichen-Test
Folie 21 / 24
Bioinformatik
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
Wichtiges zum Schluß (I):
• Verschiedene Tests geben nicht unbedingt dieselbe Antwort, wenn sie
auf dieselben Daten angewandt werden. Sie verlangen nicht dieselben
Voraussetzungen und berücksichtigen verschiedene Aspekte der Daten.
Generell gilt jedoch, dass zwei valide Methode zu ähnlichen Ergebnissen
führen.
• In kleinen Stichproben haben (wenn eine parametrische Situation
vorliegt) nicht-parametrische Verfahren weniger Power als parametrische
Verfahren.
• In der Praxis wird eine Analyse der Daten durchgeführt, wobei man sich
zwischen nicht-parametrischen und parametrischen Verfahren
entscheidet.
• Normalerweise werden parametrische Verfahren benutzt, solange nicht
ein klarer Hinweis darauf besteht, dass die dazu benötigten Voraussetzungen nicht gegeben sind.
Bioinformatik
Fortbildung I Anästhesie 9.3.2005
Folie 22 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
Wichtiges zum Schluß (II):
•
•
•
•
•
Planung ist das A und O
Erst planen, dann Daten erheben, dann auswerten
Vor der Auswertung sollten die Daten ‚sauber‘ sein
Man sollte seine Daten genau kennen
Lieber einmal zu oft fragen als einmal zu wenig
Kostenlose Beratung:
Institut für Medizinische Biometrie, Informatik und Epidemiologie
Tel.: 287 - 5400 (Frau Oldach vermittelt Sie gerne weiter)
Bioinformatik
Fortbildung I Anästhesie 9.3.2005
Folie 23 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich
Literatur:
• Altman DG. Practical Statistics for Medical Research (1991).
Chapman & Hall
• Altman DG, Machin D, Bryant TN, Gardner MJ (eds.). Statistics with
confidence (2000, 2nd ed.). British Medical Journal Books
• Armitage P. Statistical Methods in Medical Research (1973).
Blackwell Scientific Publications
• Rasch B, Friese M, Hofmann W, Naumann E. Quantitative Methoden
(Band 1 + 2, 2004). Springer Verlag Berlin Heidelberg New York
Software:
SPSS 12.0G for Windows (version 12.0.1)
Links:
http://www.akademie.ruhr-uni-bochum.de (Weiterbildung)
http://www.hrz.uni-bonn.de (Hochschulrechenzentrum, SPSS-Lizenzen)
Bioinformatik
Fortbildung I Anästhesie 9.3.2005
Folie 24 / 24
Biometrie
Genetische
Epidemiologie
IMBIE
Herunterladen