Thema der Stunde Varianzanalyse (ANOVA) 1. Apriori und aposteriori Kontraste 2. Fixed und random factor Modelle 3. Einzelvergleiche in der 2 faktoriellen ANOVA 1 A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: A1 A2 A3 Fall 1 2 3 4 5 6 7 8 9 10 Summe Mittel Var 0PM 05PM 1PM 17 20 16 16 18 21 23 24 20 23 11 11 13 14 13 20 19 18 16 22 8 16 12 13 14 7 8 7 5 1 D x1- 2 = A1 - A2 oder 198 157 91 19.80 7.96 15.70 13.61 9.10 18.89 æA1 + A2 ÷ ö ç ÷- A3 D x1,2- 3 = ç ÷ çè 2 ÷ ø 2 A-Priori Kontraste: t-Test Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen aus den p Faktorstufen: Dx t= sˆ D x mit df = p (n - 1) Standardfehler einer Differenz von 2 Mittelwerten: sˆ D x = 2 sˆ Fehler × 2 n Ein t-Test in der ANOVA hat bei p > 2 mehr Freiheitsgrade als ein einfacher paarweiser Test und ist daher trennschärfer. Der Standardfehler bestimmt sich aus der Fehlervarianz, die ja die gepoolte Varianz aus allen Stichproben ist. 3 A-Priori Kontraste: F-Test t- Test und F-Test sind wegen der Beziehung 2 df t = F(1,df ) äquivalent. (Die quadrierte t- Verteilung mit df Freiheitsgraden entspricht genau der F- Verteilung mit einem Zähler- und df Nennerfreiheitsgraden) 2 F= (D x ) s 2 Dx mit Zähler: df = 1 und Nenner: df = p (n - 1) ist äquivalente Prüfung des Mittelwerteunterschieds. 4 Allgemeine Form des Mittelwertevergleichs Varianz der Mittelwertedifferenz ö 2 1æ ÷ 2 Var (D ) = çççå c j ÷ s Fehler ÷ ÷ n çè j ø F-Test D2 F= Var (D ) Kontrastbedingung D= å = c j ×x j j mit å j j mit: cj = 0 æ çç ççèå n ×D 2 ö 2 2÷ cj ÷ ×s Fehler ÷ ÷ ø df Zähler = 1 df Nenner = df Fehler 5 A-Posteriori Mittelwertevergleiche Geläufigste: Scheffe‘ Tests Berechnung einer kritischen Differenz für alle paarweisen Tests Diff crit = 2 2 ×( p - 1)×s Fehler ×F(df A ,df Fehler ,1- a ) n Der kritische F-Wert hat also df Zähler = p - 1 df Nenner = df Fehler Ist also irgendeine Mittelwertedifferenz größer als Diffcrit, so ist sie signifikant. 6 Fixed und random factor Modelle Fixed Factor Modell: Alle im Experiment realisierten Stufen eines Faktores beschreiben die unabhängige Variable vollständig (kategorial geschlossen). (Geschlecht, Parteizugehörigkeit etc.) Das Experiment gibt die Wirkung des Faktors über alle möglichen Realisierungen von ihm an. Random Factor Modell: Alle im Experiment realisierten Stufen eines Faktors stellen nur eine willkürliche Auswahl aus vielen anderen möglichen dar (Dosis eines Medikamentes, Umgebungseinflüsse etc.). Das Experiment liefert nur eine Probe aus dem gesamten Wirkspektrums des Faktors. 7 Fixed und random factor Modelle Praktische Konsequenz: Die Effekte der Faktoren müssen an jeweils anderen Prüfvarianzen getestet werden, je nachdem, ob sie fixed oder random sind. Dasselbe gilt für die Einzelvergleiche innerhalb von fixed oder random factors. 8 Einzelvergleiche: 2 faktorielle ANOVA Faktor A 2 sˆ D2 (A) = æ ö ç n ×q ×çå ci ×Ai ÷ ÷ ÷ çè i ø å F- Test F= 2 i c sˆ D2 (A) 2 sˆ test i 2 B sˆ D2 (B) = æ ö ÷ n ×p ×çççå c j ×B j ÷ ÷ çè ø÷ j å c 2j F= sˆ D2 (B) 2 sˆ test j Hierin ist die Testvarianz in der Prüfvarianztabelle gegeben. 9 Einzelvergleiche: Scheffe‘ Tests Faktor A B Zellen Diffcrit = Diff crit = Diff crit = 2 2 ×( p - 1)×sˆ test ×F(df A ,dftest ,1- a ) n ×q 2 2 ×(q - 1)×sˆ test ×F(df B ,dftest ,1- a ) n ×p 2 2 ×( p ×q - 1)×sˆ Fehler ×F( p×q- 1, p×q×(n- 1),1- a ) n Testvarianz ist wieder in der Prüfvarianztabelle gegeben. 10 Bedingte Einzelvergleiche Vergleich von Zellmittelwerten unter A für eine feste Stufe des anderen Hauptfaktors B 2 QSi( j) = æ ö ÷ ç n ×çå ci( j) ×AB ij ÷ ÷ çè i ø å df = 1 ci2 i s 2 i( j ) = QSi( j) df = QSi( j) F= s i2( j) sˆ 2 Fehler = QSi( j) 2 sˆ Fehler Der F- Wert ist signifikant, wenn er größer als der folgende S- Wert ist: Si( j) = éë( p - 1)+ ( p - 1)(q - 1)ù û×F(df A+ df A´ B ,df Fehler ,1- a ) 11 Bedingte Einzelvergleiche Vergleich von Zellmittelwerten unter B für eine feste Stufe des anderen Hauptfaktors A 2 QS j(i) = æ ö ÷ ç n ×ççå c j(i) ×AB ij ÷ ÷ ÷ çè ø df = 1 j å c 2j j s 2 j(i ) = QS j(i) df = QS j(i) F= s 2j(i) sˆ 2 Fehler = QS j(i) 2 sˆ Fehler Der F- Wert ist signifikant, wenn er größer als der folgende S- Wert ist: S j(i) = éë(q - 1)+ ( p - 1)(q - 1)ù û×F(df B + df A´ B ,df Fehler ,1- a ) 12 Voraussetzungen 1. Normalverteilung der Fehlerkomponenten (gilt als erfüllt, wenn die Zellresiduen normalverteilt sind) 2. Unabhängigkeit von Treatmenteffekten und Messfehlern (Zellmittelwerte und Varianzen sollten unkorreliert sein) 3. Varianzhomogenität der Fehlervarianzen aller Zellen (Prüfung mit speziellen Tests: Bartlett / Levene /Fmax) [Statistica] 13 Bartlett-Test Prüft die Annahme der Varianzhomogenität (Variation innerhalb der Stichproben muss für alle Stichproben gleich sein) æ ö 2.303 æ 2 ç ç ˆ c = ×ççå ni - p÷ × log s ÷ ( 10 Fehler )÷ ç ç C èè i ø 2 å i (ni - 1)×log10 (sˆ 2 Fehler ( i ) ö ÷ )÷÷÷ ø df = p - 1 æ çç 1 1 ç C = 1+ ×çå ç 3×( p - 1) ç i ni - 1 çè å i ö ÷ ÷ 1 ÷ ÷ (ni - 1)÷÷÷÷ ø Es sollte a = 0.25 gewählt werden, da man an der Beibehaltung der H0 interessiert ist. Der Test ist nur reliabel für normalverteilte Daten. 14 Bartlett-Test (zweifaktoriell) Prüft die Annahme der Varianzhomogenität (Variation innerhalb der Stichproben muss für alle Stichproben gleich sein) æ 2.303 æ ç c = ×çççççå C çèçè j 2 å i ö 2 (nij - 1)÷÷÷÷×log10 (sˆ Fehler )ø å å (n ij j - 1)×log10 (sˆ 2 Fehler ( ij ) i df = pq - 1 æ çç 1 C = 1+ ×çççå 3×( pq - 1) çç j çè å i 1 nij - 1 å å j i ö ÷ ÷ 1 ÷ ÷ ÷ (nij - 1)÷÷÷÷ ø Es sollte a = 0.25 gewählt werden, da man an der Beibehaltung der H0 interessiert ist. Der Test ist nur reliabel für normalverteilte Daten. 15 ö )÷÷÷÷÷ ø Fmax -Test Prüft die Annahme der Varianzhomogenität (Variation innerhalb der Stichproben muss für alle Stichproben gleich sein) Fmax 2 sˆ Fehler = 2 (max) sˆ Fehler (min) Die Verteilung von Fmax hängt von der Anzahl der Treatmentstufen p und den Freiheitsgraden (n-1) einer einzelnen Fehlervarianz ab. Fmax ist in einer gesonderten Tabelle austabelliert. Der test ist gröber als der Bartlett - Test, aber unempfindlich gegen Verletzungen der Normalverteilungsannahme. 16