Fortbildung I Analyse stetiger Daten Ein- bzw. Zwei-Gruppenvergleich - 09.03.2005 - Dipl.-Stat. C. Nicolay Institut für Medizinische Biometrie, Informatik und Epidemiologie der Universität Bonn Sigmund-Freud-Str. 25 53105 Bonn [email protected] Bioinformatik Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich Themen: • Daten Überprüfen der Daten Deskriptive Darstellung, Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Fortbildung I Anästhesie 9.3.2005 Bioinformatik Folie 2 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Überprüfen der Daten • Eingabefehler • Inkonsistenzen -> Plausibilitäts-Checks • Ausreisser • Fehlende Werte Deskriptive Darstellung • Anzahl der Werte • Mittelwert, Standardabweichung • 95%-Konfidenzintervall • Minimum, Median, Maximum Graphische Darstellung • Histogramm • Box-Plot • Normal Plot Bioinformatik Fortbildung I Anästhesie 9.3.2005 Folie 3 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich Beispiel (D. Altman, S. 23 ff.) • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Fortbildung I Anästhesie 9.3.2005 Univariate Statistiken IgM [g/l] Gültig ,1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 2,0 2,1 2,2 2,5 2,7 4,5 Gesamt Häufigkeit 3 7 19 27 32 35 38 38 22 16 16 6 7 9 6 2 3 3 3 2 1 1 1 1 298 Prozent 1,0 2,3 6,4 9,1 10,7 11,7 12,8 12,8 7,4 5,4 5,4 2,0 2,3 3,0 2,0 ,7 1,0 1,0 1,0 ,7 ,3 ,3 ,3 ,3 100,0 IgM [g/l] Mittelwert 95% Konfidenzintervall des Mittelwerts Untergrenze Obergrenze Statistik ,803 ,749 5% getrimmtes Mittel Median Varianz Standardabweichung Minimum Maximum Spannweite Interquartilbereich Standardfehler ,857 ,760 ,700 ,220 ,4695 ,1 4,5 4,4 ,5 ,0272 Histogramm 40 30 Häufigkeit • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten 20 10 0 0,0 1,0 2,0 3,0 4,0 5,0 IgM [g/l] Folie 4 / 24 Bioinformatik Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren Beispiel (D. Altman, S. 23 ff., Fortsetzung) Box-Plot 5,0 Maximum Extremwerte: Mehr als 3 Boxhöhen (Q3-Q1)von oberem bzw. unteren Quartil entfernt 4,0 • Verbundene vs. unverbundene Testsituation 3,0 • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Ausreisser: Mehr als 1½ Boxhöhen (Q3-Q1)von oberem bzw. unteren Quartil entfernt 2,0 oberes Quartil (Q3) 1,0 Median Minimum 0,0 Fortbildung I Anästhesie 9.3.2005 unteres Quartil (Q1) IgM [g/l] Bioinformatik Folie 5 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten Beispiel (D. Altman, S. 23 ff., Fortsetzung) IgM [g/l]: Normalplot • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon Erwarteter Normalwert 3 2 1 0 -1 -2 -3 -1 0 1 2 3 4 Beobachteter Wert • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney 5 Der W-Test von Shapiro-Wilk ist eine Möglichkeit zu testen, ob die vorliegenden Daten normalverteilt sind. Man sollte sich aber nicht allein auf das Test-Ergebnis verlassen, sondern immer die dazugehörigen deskriptiven Statistiken, Histogramm oder BoxPlot und den Normalplot in die Entscheidung mit einbeziehen. Bei den vorliegenden Daten braucht man eigentlich das Test-Ergebnis nicht, um zu dem Schluss zu kommen, dass die Daten nicht normalverteilt sind. Tests auf Normalverteilung a IgM [g/l] Kolmogorov-Smirnov Statistik df Signifikanz ,170 298 ,000 Shapiro-Wilk Statistik df Signifikanz ,823 298 ,000 a. Signifikanzkorrektur nach Lilliefors Bioinformatik Fortbildung I Anästhesie 9.3.2005 Folie 6 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon Transformation Viele Variablen (z.B. Labordaten) sind exponentialverteilt, wie die Daten aus dem Beispiel. Solche Daten kann man durch eine Transformation in eine Normalverteilung überführen. Vorteile: • Erfüllung der Voraussetzung für viele parametrische Verfahren • Angleichung der Varianz für verschiedene Gruppen. Dies funktioniert v.a. dann gut, wenn das Verhältnis von Standardabweichung zu Mittelwert in den verschiedenen Gruppen ähnlich ist. • Reduktion des Einflusses von Ausreißern Mögliche Transformationen: • log10(x) oder loge(x) • x • 1/x • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Beispiel (D. Altman, S. 23 ff., Fortsetzung) Die Daten können durch logarithmieren (hier: zur Basis e) in eine Normalverteilung überführt werden Bioinformatik Fortbildung I Anästhesie 9.3.2005 Folie 7 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich Beispiel (D. Altman, S. 23 ff., Fortsetzung) Univariate Statistiken ln(IgM) [g/l]: Normalplot ln(IgM) [g/l] • Parametrische vs. nicht-parametrische Verfahren Mittelwert 95% Konfidenzintervall des Mittelwerts Untergrenze Obergrenze 5% getrimmtes Mittel Median Varianz Standardabweichung Minimum Maximum Spannweite Interquartilbereich Standardfehler • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon 3 -,30082 -,35502 -,35667 ,299 ,546895 -2,303 1,504 3,807 ,693 ,03168 2 1 0 -1 -2 -3 -2 -1 0 a Häufigkeit 2 Tests auf Normalverteilung Kolmogorov-Smirnov 40 1 Beobachteter Wert Histogramm Statistik ln(IgM) [g/l] ,098 df 298 Shapiro-Wilk Signifikanz Statistik ,000 ,976 df 298 Signifikanz ,000 a. Signifikanzkorrektur nach Lilliefors 30 • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Statistik -,36316 -,42551 Erwarteter Normalwert • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten 20 10 0 -2,000 0,000 2,000 Cave: Aufgrund des großen Stichprobenumfanges findet der W-Test auch kleine, nicht normalverteilte Datenmengen, die aber eigentlich unwichtig sind. Bioinformatik ln(IgM) [g/l] Fortbildung I Anästhesie 9.3.2005 Folie 8 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Fortbildung I Anästhesie 9.3.2005 Parametrische vs. nicht-parametrische Verfahren Viele statistische Methoden basieren auf der Annahme, dass die beobachteten Daten eine Stichprobe aus einer Grundgesamtheit darstellen mit einer Verteilung (in dieser Grundgesamtheit), die man theoretisch (mathematisch) beschreiben kann. Wenn diese Annahme vernünftig ist, dann sind die o.g. statistischen Analyse-Methoden einfach zu benutzen und besitzen eine große Bandbreite. Wenn die Verteilungs-Annahmen jedoch nicht begründet sind, und dennoch parametrische Methoden benutzt werden, so kann dies zu falschen und somit ungültigen Schlussfolgerungen führen. Bei der Analyse von Daten wählt man demnach zwischen - parametrischen Methoden (es werden konkrete Verteilungsannahmen der Daten vorausgesetzt) und - nicht-parametrischen Methoden (es werden keine Verteilungsannahmen vorausgesetzt). Folie 9 / 24 Bioinformatik Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Verbundene vs. unverbundene Testsituation In einer verbundenen Testsituation werden zwei oder mehrere Beobachtungen an einer Untersuchungseinheit (Individuen, Tiere, Laborversuchsansatz, etc.) durchgeführt (gepaarte oder abhängige Daten). Daraus folgt logischerweise, dass der Stichprobenumfang in beiden Gruppen gleich ist. Auch Studien, bei denen Patientengruppen individuell gematcht sind, fallen in diese Kategorie. Beispiel: Blutdruck während und nach der Schwangerschaft bei einer Gruppe von n Frauen In einer unverbundenen Testsituation gehören die Beobachtungen zu zwei unabhängigen Gruppen von Individuen (Tieren etc.). Die Stichprobenumfänge müssen nicht gleich groß sein. Manchmal ist das auch gar nicht möglich, z.B. bei seltenen Erkrankungen. Beispiel: Geburtsgewicht von Jungen vs. Geburtsgewicht von Mädchen Bioinformatik Fortbildung I Anästhesie 9.3.2005 Folie 10 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon Verbundene Testsituation: t-Test (Theorie) Testproblem (Beispiel): Eine stetige Variable wurde zu zwei verschiedenen Zeitpunkten in derselben Gruppe von n Individuen gemessen. Aufgrund der verbundenen Testsituation kann die Analyse vereinfacht werden, indem man die intraindividuellen Differenzen berechnet und diese analysiert. Hier spielt die Variabilität innerhalb der Individuen eine tragende Rolle. Voraussetzungen: Die intraindividuellen Differenzen di (i=1, ..., n) müssen aus einer normalverteilten Grundgesamtheit stammen. H0: Erwartungswert(di) = 0 H1: Erwartungswert(di) ≠ 0 Die dazugehörige Test-Statistik t = • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Fortbildung I Anästhesie 9.3.2005 d verbindet den Mittelwert der se(d ) beobachteten, intraindividuellen Differenzen mit dem dazugehörigen Standardfehler. se( d ) = s n (s = Standardabweichung) Bioinformatik Folie 11 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Fortbildung I Anästhesie 9.3.2005 Verbundene Testsituation: t-Test (Beispiel) Mean daily dietary intake over 10 pre-menstrual and 10 post-menstrual days (Altman, S. 190 ff.) Dietary intake (kJ) # pre post Diff. ---------------------------------1 5260 3910 1350 2 5470 4220 1250 3 5640 3885 1755 4 6180 5160 1020 5 6390 5645 745 6 6515 4680 1835 7 6805 5265 1540 8 7515 5975 1540 9 7515 6790 725 10 8230 6900 1330 11 8770 7335 1435 Univariate Statistiken Pre-menstrual Post-menstrual Difference (pre-post) Mittelwert Standardabweichung Standardfehler Mittelwert Standardabweichung Standardfehler Mittelwert Standardabweichung Standardfehler Statistik 6753,64 1142,12 344,36 5433,18 1216,83 366,89 1320,45 366,75 110,58 Test bei gepaarten Stichproben Mittelwert Pre-menstrual Post-menstrual 1320,455 Standardabweichung 366,746 Standardfehler des Mittelwertes 110,578 T 11,941 df Sig. (2-seitig) 10 ,000 Bioinformatik Folie 12 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Fortbildung I Anästhesie 9.3.2005 Verbundene Testsituation: Vorzeichen-Rang-Test von Wilcoxon (Theorie) Testproblem (Beispiel): Eine stetige Variable wurde zu zwei verschiedenen Zeitpunkten in derselben Gruppe von n Individuen gemessen. Die intraindividuellen Differenzen entstammen wahrscheinlich keiner Normalverteilung. Voraussetzungen: Die intraindividuellen Differenzen di (i=1, ..., n) stammen aus einer Grundgesamtheit mit einer symmetrischen Verteilung. -> auch hier kann eine Transformation der Daten helfen. Man geht in drei Schritten vor: (1) Berechnen der intraindividuellen Differenzen (2) Ordnen der intraind. Differenzen ohne Beachtung des Vorzeichens (3) Berechnen der Rangsumme aller negativen bzw. positiven Ränge (R- bzw. R+, ohne Null-Differenzen) Die Test-Statistik W = min(|R-|, |R+|) Eine Alternative hierzu ist der Vorzeichen-Test. Bioinformatik Folie 13 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Fortbildung I Anästhesie 9.3.2005 Verbundene Testsituation: Vorzeichen-Rang-Test von Wilcoxon (Beispiel) Daily energy intake of 11 healthy women with rank order of differences (ignoring their signs) from the recommended intake of 7725 kJ (Altman, S. 188 ff.) Daily Diff. to Rank of # intake 7725 kJ differences ------------------------------------------------1 5260 2465 11 2 5470 2255 10 3 5640 2085 9 4 6180 1545 8 5 6390 1335 7 6 6515 1210 6 7 6805 920 4 8 7515 210 1.5 9 7515 210 1.5 10 8230 - 505 3 11 8770 -1045 5 Ränge Recommended daily intake [kJ] - Pre-menstrual Negative Ränge N 2a Mittlerer Rang 4,00 Rangsumme 8,00 Positive Ränge 9b 6,44 58,00 Bindungen 0c Gesamt 11 a. Recommended daily intake [kJ] < Pre-menstrual b. Recommended daily intake [kJ] > Pre-menstrual c. Recommended daily intake [kJ] = Pre-menstrual Statistik für Wilcoxon-Test Z Asymptotische Signifikanz (2-seitig) Recommended daily intake [kJ] Pre-menstrual -2,224a ,026 a. Basiert auf negativen Rängen. Bioinformatik Folie 14 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation Unverbundene Testsituation: t-Test (gleiche Varianzen) Testproblem (Beispiel): Eine stetige Variable wurde in zwei verschiedenen Gruppen gemessen. Die Stichprobenumfänge müssen nicht gleich sein. Wir interessieren uns für den mittleren Unterschied zwischen beiden Gruppen. In dieser Situation wird die Variabilität zwischen den Individuen wichtig. Voraussetzungen: Beide Stichproben stammen jeweils aus einer normalverteilten Grundgesamtheit, und die Varianzen in beiden Stichproben sind gleich. • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon H0: Erwartungswert(Gruppe 1) = Erwartungswert(Gruppe 2) H1: Erwartungswert(Gruppe 1) ≠ Erwartungswert(Gruppe 2) • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney verbindet wie beim gepaarten t-Test den Mittelwert der beobachteten Differenzen mit dem dazugehörigen Standardfehler. Hier wird der Standardfehler aus den einzelnen Standardabweichungen berechnet. Die dazugehörige Test-Statistik Fortbildung I Anästhesie 9.3.2005 x1 − x 2 se( x1 − x 2 ) ( n1 − 1) s1 + (n 2 − 1) s 2 1 1 ⋅ + n1 + n2 − 2 n1 n 2 2 se( x1 − x 2 ) = t= 2 Bioinformatik Folie 15 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon Unverbundene Testsituation: t-Test (gleiche Varianzen) Lean Obese # (n=13) (n=9) -------------------------------1 6.13 8.79 2 7.05 9.19 3 7.48 9.21 4 7.48 9.68 5 7.53 9.69 6 7.58 9.97 7 7.90 11.51 8 8.08 11.85 9 8.09 12.79 10 8.11 11 8.40 12 10.15 13 10.88 Beispiel: 24 hour total energy expenditure (MJ/day) in groups of lean and obese women (Altman, S. 193 ff.) Gruppenstatistiken Gruppe Lean Obese N 13 9 Mittelwert 8,0662 10,2978 Standardabweichung 1,23808 1,39787 Standardfehler des Mittelwertes ,34338 ,46596 Test bei unabhängigen Stichproben • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney T-Test für die Mittelwertgleichheit T -3,946 df 20 Sig. (2-seitig) ,001 Mittlere Differenz -2,23162 Standardfehler der Differenz ,56560 95% Konfidenzintervall der Differenz Untere Obere -3,41145 -1,05180 Bioinformatik Fortbildung I Anästhesie 9.3.2005 Folie 16 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Unverbundene Testsituation: t-Test (ungleiche Varianzen) Testproblem (Beispiel): Wie beim t-Test (gleiche Varianzen) Manchmal liegen Daten vor, die aus normalverteilten Grundgesamtheiten stammen, aber bei denen sich die Variabilität in den beiden Gruppen stark unterscheidet. (1) Wie groß muss dieser Unterschied sein, bevor er zu groß ist? (2) Was tut man in diesem Fall? Zu (1): Zur Überprüfung kann man F-Test heranziehen (standardmäßig in SPSS). Zu (2): Kann man davon ausgehen, dass die Daten aus normalverteilten Grundgesamtheiten stammen, aber mit verschiedenen Varianzen, dann kann man einen etwas modifizierten t-Test für die Analyse benutzen. Die Modifikation bezieht sich auf die Berechung des Standardfehlers der Differenzen. 2 se( x1 − x 2 ) = Fortbildung I Anästhesie 9.3.2005 2 s1 s + 2 n1 n2 Bioinformatik Folie 17 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon Unverbundene Testsituation: t-Test (ungleiche Varianzen) No/Slight Marked symptoms symptoms # (n=9) (n=7) -------------------------------1 34 5 2 45 8 3 49 18 4 55 24 5 58 60 6 59 84 7 60 8 62 9 86 Beispiel: Serum thyroxine level (nmol/l) in 16 hypothyroid infants by severity of symptoms (Altman, S. 198 ff.) Gruppenstatistiken Symptoms No/slight Marked 9 7 Mittelwert 56,44 42,14 Standardfehler des Mittelwertes 4,741 14,166 Test bei unabhängigen Stichproben Levene-Test der Varianzgleichheit • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney N Standardabweichung 14,222 37,481 Varianzen sind gleich Varianzen sind nicht gleich T-Test für die Mittelwertgleichheit df Sig. (2-seitig) Mittlere Differenz Standardfehler der Differenz 1,059 14 ,307 14,302 ,957 7,35 ,369 14,302 F Signifikanz T 15,573 ,001 95% Konfidenzintervall der Differenz Untere Obere 13,500 -14,654 43,257 14,939 -20,684 49,288 Bioinformatik Fortbildung I Anästhesie 9.3.2005 Folie 18 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Fortbildung I Anästhesie 9.3.2005 Unverbundene Testsituation: U-Test von Mann-Whitney (Theorie) Testproblem (Beispiel): Wie beim t-Test für unverbundene Stichproben. Die Werte entstammen aber wahrscheinlich keinen normalverteilten Grundgesamtheiten. Voraussetzungen: Die Daten sind ordinal skaliert. Man geht in drei Schritten vor: (1) Alle n=n1+n2 Beobachtungen werden der Reihe nach geordnet (2) Die Rangsummen für jede der beiden Gruppen wird berechnet. (T1 bzw. T2) (3) Test-Statistik U = n1n2 + ½ n1(n1+1) – T1, bzw. U‘= n1n2 + ½ n2(n2+1) – T2 U ist die Anzahl aller möglichen Paare (x,y) von Beobachtungen mit x aus Gruppe 1 und y aus Gruppe 2 für die gilt: x < y (Rangplatzüberschreitung), U‘ ist die Anzahl der Rangplatzunterschreitungen (U+U‘ = n1n2). U bzw. U‘ werden mit dem unter der Nullhypothese erwarteten U-Wert μU = n1 ⋅ n2 2 verglichen. Bioinformatik Folie 19 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich • Daten Überprüfen der Daten Deskriptive Darstellung Graphische Darstellung Check auf Normalverteilung Transformation von Daten Unverbundene Testsituation: U-Test von Mann-Whitney (Beispiel) 24 hour total energy expenditure (MJ/day) in groups of lean and obese women (Altman, S. 193 ff.) • Parametrische vs. nicht-parametrische Verfahren • Verbundene vs. unverbundene Testsituation • Verbundene Testsituation parametrisch: t-Test nicht-parametrisch: Vorzeichen-Rang-Test von Wilcoxon • Unverbundene Testsituation parametrisch: t-Test (gleiche Varianzen) t-Test (ungleiche Varianzen) nicht-parametrisch: U-Test von Mann-Whitney Lean Obese # (n=13) (n=9) -------------------------------1 6.13 8.79 2 7.05 9.19 3 7.48 9.21 4 7.48 9.68 5 7.53 9.69 6 7.58 9.97 7 7.90 11.51 8 8.08 11.85 9 8.09 12.79 10 8.11 11 8.40 12 10.15 13 10.88 Ränge Gruppe Lean Obese Gesamt N 13 9 22 Mittlerer Rang 7,92 16,67 Rangsumme 103,00 150,00 U-Test von Mann-Whitney Mann-Whitney-U Z Asymptotische Signifikanz (2-seitig) 24h total energy (MJ/day) 12,000 -3,106 ,002 Bioinformatik Fortbildung I Anästhesie 9.3.2005 Folie 20 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich Daten (1 oder 2 Gruppen) Überprüfung durch • deskript. Statistik (Ausreißer ?) • Histogramm/Boxplot/Normalplot • W-Test Shapiro-Wilk normalverteilt? nein ja ja Unverbundene Testsituation t-Test für unabhängige Stichproben • Kontrolle der Varianzen • evtl. lieber nicht-parametrische Verfahren) Fortbildung I Anästhesie 9.3.2005 Transformation hilfreich? Verbundene Testsituation t-Test für abhängige Stichproben nein Unverbundene Testsituation U-Test von Mann-Whitney Verbundene Testsituation Vorzeichen-Rang-Test von Wilcoxon oder Vorzeichen-Test Folie 21 / 24 Bioinformatik Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich Wichtiges zum Schluß (I): • Verschiedene Tests geben nicht unbedingt dieselbe Antwort, wenn sie auf dieselben Daten angewandt werden. Sie verlangen nicht dieselben Voraussetzungen und berücksichtigen verschiedene Aspekte der Daten. Generell gilt jedoch, dass zwei valide Methode zu ähnlichen Ergebnissen führen. • In kleinen Stichproben haben (wenn eine parametrische Situation vorliegt) nicht-parametrische Verfahren weniger Power als parametrische Verfahren. • In der Praxis wird eine Analyse der Daten durchgeführt, wobei man sich zwischen nicht-parametrischen und parametrischen Verfahren entscheidet. • Normalerweise werden parametrische Verfahren benutzt, solange nicht ein klarer Hinweis darauf besteht, dass die dazu benötigten Voraussetzungen nicht gegeben sind. Bioinformatik Fortbildung I Anästhesie 9.3.2005 Folie 22 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich Wichtiges zum Schluß (II): • • • • • Planung ist das A und O Erst planen, dann Daten erheben, dann auswerten Vor der Auswertung sollten die Daten ‚sauber‘ sein Man sollte seine Daten genau kennen Lieber einmal zu oft fragen als einmal zu wenig Kostenlose Beratung: Institut für Medizinische Biometrie, Informatik und Epidemiologie Tel.: 287 - 5400 (Frau Oldach vermittelt Sie gerne weiter) Bioinformatik Fortbildung I Anästhesie 9.3.2005 Folie 23 / 24 Biometrie Genetische Epidemiologie IMBIE Fortbildung I: Analyse stetiger Daten – Ein- bzw. Zwei-Gruppenvergleich Literatur: • Altman DG. Practical Statistics for Medical Research (1991). Chapman & Hall • Altman DG, Machin D, Bryant TN, Gardner MJ (eds.). Statistics with confidence (2000, 2nd ed.). British Medical Journal Books • Armitage P. Statistical Methods in Medical Research (1973). Blackwell Scientific Publications • Rasch B, Friese M, Hofmann W, Naumann E. Quantitative Methoden (Band 1 + 2, 2004). Springer Verlag Berlin Heidelberg New York Software: SPSS 12.0G for Windows (version 12.0.1) Links: http://www.akademie.ruhr-uni-bochum.de (Weiterbildung) http://www.hrz.uni-bonn.de (Hochschulrechenzentrum, SPSS-Lizenzen) Bioinformatik Fortbildung I Anästhesie 9.3.2005 Folie 24 / 24 Biometrie Genetische Epidemiologie IMBIE