Einfaktorielle Varianzanalyse … Vergleich mehrerer Mittelwerte Berghold, IMI, MUG Beispiel Es wurden die anorganischen Phosphatwerte im Serum (mg/dl) eine Stunde nach einem Glukosetoleranztest bei übergewichtigen Personen mit Hyperinsulinämie, nichtHyperinsulinämie und Kontrollen gemessen. Gibt es Unterschiede zwischen den 3 Gruppen? Berghold, IMI, MUG Hypothesen • Nullhypothese: H0: μ1 = μ2 = μ3 = … = μk • Alternativhypothese: H1: wenigstens ein μi unterscheidet sich von den anderen Globaltest Berghold, IMI, MUG Voraussetzungen • Voraussetzungen: • Daten aller Stichproben entstammen normalverteilten Grundgesamtheiten • Varianzhomogenität (Faustregel: Verhältnis größter zu kleinster Standardabweichung muss kleiner 2:1 sein; Levene-Test, …) • Die Messwerte bzw. Faktorstufen sind voneinander unabhängig Berghold, IMI, MUG Modellbetrachtung yij = μ + α i + ε ij yij ist die jte Beobachtung (j=1,2,…,ni) in Gruppe i (i=1,2,…,k) µ ist das Gesamtmittel αi ist die Differenz zwischen Mittelwert von Gruppe i und dem Gesamtmittel εij ist der Fehlerterm Berghold, IMI, MUG Varianzanalyse Vergleicht die Variation zwischen den Gruppen mit der Variation innerhalb der Gruppen. • Gesamtvariabilität wird in 2 Komponenten aufgeteilt: • Variabilität “zwischen” Gruppen, und • Variabilität “innerhalb” Gruppen • Varianzanalysetafel (ANOVA Tafel) Berghold, IMI, MUG Quadratsummen ∑∑ (y − y ) =∑∑ ( y − y ) + ∑∑ (y − y ) 2 i j SST ij .. 2 i j i. SSB .. 2 i j ij i. SSW SST: Gesamt-Quadratsumme SSB: Quadratsumme der Behandlungen SSW: Fehler-Quadratsumme Berghold, IMI, MUG Varianzanalyse ONEWAY ANOVA y Between groups Within groups Total Sum of Squares 56,000 6,000 62,000 df 2 9 11 Mean Square 28,000 ,667 F 42,000 Significan ce ,000 Wir können die Nullhypothese verwerfen. Berghold, IMI, MUG Varianzanalyse • df = (n – 1) = (n – k) + (k – 1) • SS / df = mittlere Quadrate (MQ) • Entstammen alle Gruppen derselben Grundgesamtheit, dann sollten die Varianzen, also die Mittleren Quadrate, MQzwischen und MQinnerhalb, gleich groß sein. MQzwischen 1 k 2 ( ) = n y − y ∑ i i. .. k − 1 i =1 MQinnerhalb 1 k ni 2 ( ) = y − y ∑∑ ij i. k − 1 i =1 j =1 Berghold, IMI, MUG Varianzanalyse • Sind diese nicht gleich groß, d.h. ist der Quotient aus MQzwischen und MQinnerhalb größer als der kritische Wert der F-Verteilung (bestimmt durch df1, df2 und α), so wird die Nullhypothese verworfen. Fˆ > F(k −1;n −k ;α ) → H0 verwerfen • df1 = k – 1; df2 = n - k • D.h. Es gibt Gruppen mit unterschiedlichen Mittelwerten, mindestens zwei µi sind voneinander verschieden. Berghold, IMI, MUG Post-hoc Tests Multiple Vergleiche, p-Werte müssen korrigiert werden. • Bonferroni Die Unsicherheit (Irrtumswahrscheinlichkeit α=0,05) wird zu gleichen Teilen auf alle Paarvergleiche aufgeteilt. Bei 4 Gruppen gibt es 3+2+1=6 Vergleiche; jeder dieser Tests wird mit α/6 durchgeführt. Die Bonferroni-Korrektur ist konservativ, d.h. sie hält lange an der Nullhypothese fest Alternativen • Bonferroni-Holm-Korrektur • LSD – Least-Signifikant-Difference • HSD – Honest-Significant-Difference (Tukey) • SNK – Student-Newman-Keuls … Berghold, IMI, MUG Beispiel – randomisiertes Blockexperiment Untersucht wurde die Gerinnungszeit von Plasma, das mit vier verschiedenen Methoden behandelt wurde. Von 8 zufällig ausgewählten Patienten einer Population werden je 4 Blutproben genommen und zufällig den 4 Behandlungsmethoden zugeteilt. Die Gerinnungszeiten (min) von diesen 8x4 Plasmen wurden bestimmt. Gibt es Unterschiede zwischen den Behandlungen. Berghold, IMI, MUG Daten – randomisiertes Blockexperiment Subject 1 2 3 4 5 6 7 8 treat1 8,4 12,8 9,6 9,8 8,4 8,6 8,9 7,9 treat2 9,4 15,2 9,1 8,8 8,2 9,9 9 8,1 treat3 9,8 12,9 11,2 9,9 8,5 9,8 9,2 8,2 treat4 12,2 14,4 9,8 12 8,5 10,9 10,4 10 Berghold, IMI, MUG Analyse – randomisiertes Blockexperiment Tests der Zwischensubjekteffekte Abhängige Variable: clot_time Quelle Korrigiertes Modell Konstanter Term subjects treatments Fehler Gesamt Korrigierte Gesamtvariation Quadratsum me vom Typ III 92,005a 3196,001 78,989 13,016 13,774 3301,780 105,779 df 10 1 7 3 21 32 Mittel der Quadrate 9,201 3196,001 11,284 4,339 ,656 F 14,027 4872,749 17,204 6,615 Signifikanz ,000 ,000 ,000 ,003 31 a. R-Quadrat = ,870 (korrigiertes R-Quadrat = ,808) Berghold, IMI, MUG Nichtparametrische Methoden • Kruskal Wallis Test • Friedman Test Berghold, IMI, MUG Weiterführende Methoden • Zweifaktorielle ANOVA (die Varianz wird zwei Faktoren und Wechselwirkung zugeschrieben) • Mehrfaktorielle ANOVA (MANOVA) • ANOVA mit Messwiederholungen (Repeated Measurement – mehrere Messungen am gleichen Objekt, häufig ein zeitlicher Verlauf) • GLM, ANCOVA, GEE, Mixed Models,….. Berghold, IMI, MUG