Gepaarter und ungepaarter t-Test Statistik (Biol./Pharm./HST) – Herbst 2013 Wdh: t-Test für eine Stichprobe 1. Modell: Xi ist eine kontinuierliche MessgrÄ osse; 2 X1 ; : : : ; Xn iid N (¹; ¾X ); ¾X wird durch ¾c atzt X geschÄ 2. Nullhypothese: H0 : ¹ = ¹0 , Alternative: HA : ¹ 6= ¹0 (oder \<" oder \>") 3. Teststatistik: p (X n ¡ ¹0 ) n(X n ¡ ¹0 ) beobachtet ¡ erwartet T = = = : ¾d ¾ c geschÄ a tzter Standardfehler X Xn Verteilung der Teststatistik unter H0 : T » tn¡1 4. Signi¯kanzniveau: ® 5. Verwerfungsbereich fr die Teststatistik: K = (¡1; ¡tn¡1;1¡ ®2 ] [ [tn¡1;1¡ ®2 ; 1) bei HA : ¹ 6= ¹0 ; K = (¡1; ¡tn¡1;1¡® ] bei HA : ¹ < ¹0 ; K = [tn¡1;1¡® ; 1) bei HA : ¹ > ¹0 : Ä 6. Testentscheid: UberprÄ ufe, ob der beobachtete Wert der Teststatistik im Verwerfungsbereich liegt. 1 Mr. X Krebs Zwei Krebstypen 1 Typ 1: Mild Chemotherapie nicht nötig 2 Typ 2: Schwer Chemotherapie nötig Problem: Typ erst nach langer Zeit erkennbar ? 1 ? 2 Jetzt Chemotherapie oder nicht? Wie kann man verschiedene Arten von Krebs frühzeitig unterscheiden? Typ 1 Typ 2 Vergleiche Krebszellen Idee: Vergleiche Aktivität innerhalb der Zelle Zentrales Dogma der Molekularbiologie Zelle GEN DNA mRNA Protein Entnehme mRNA Entnehme mRNA Nehme einen Microarray Microarray: Zoom In mRNA auf Microarray mRNA auf Microarray Auf dem Microarray Voila: Ein Feuerwerk! Helligkeit = Aktivität des Gens Gen 5 sehr aktiv Helligkeit = Aktivität des Gens Gen 6 nicht aktiv Für jeden Patienten ein Microarray Typ 1 Typ 2 Microarray: Aktivität aller Gene in der Zelle Typ 1 Typ 2 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 Pat. 5 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 1 2.1 1.3 1.9 1.2 1.4 1 1.9 2.5 2.4 2.9 2 2.4 2.3 2.5 2.1 2.0 2 2.3 2.2 2.4 2.1 … … 50000 50000 Microarray: Aktivität aller Gene in der Zelle Typ 1 Typ 2 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 Pat. 5 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 1 2.1 1.3 1.9 1.2 1.4 1 1.9 2.5 2.4 2.9 2 2.4 2.3 2.5 2.1 2.0 2 2.3 2.2 2.4 2.1 … … 50000 50000 Microarray: Aktivität aller Gene in der Zelle Typ 1 Typ 2 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 Pat. 5 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 1 2.1 1.3 1.9 1.2 1.4 1 1.9 2.5 2.4 2.9 2 2.4 2.3 2.5 2.1 2.0 2 2.3 2.2 2.4 2.1 … … 50000 50000 Ist Gen 1 bei Typ 2-Tumorzellen signifikant aktiver? Falls ja: Gen 1 kann Typ1-Tumor und Typ-2 Tumor unterscheiden! Falls ja: Gen 1 nicht aktiv Typ 1 Chemotherapie Gen 1 aktiv Typ 2 Chemotherapie Microarray: Aktivität aller Gene in der Zelle Typ 1 Typ 2 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 Pat. 5 Gen Pat. 1 Pat. 2 Pat. 3 Pat. 4 1 2.1 1.3 1.9 1.2 1.4 1 1.9 2.5 2.4 2.9 2 2.4 2.3 2.5 2.1 2.0 2 2.3 2.2 2.4 2.1 … … 50000 50000 Ist Gen 1 bei Typ 2-Tumorzellen signifikant aktiver? Ungepaarter t-Test Ungepaarter t-Test: 1/3 1. Modell: X1 ; : : : ; Xn iid » N (¹X ; ¾ 2 ); Y1 ; : : : ; Ym iid » N (¹Y ; ¾ 2 ): 2. Nullhypothese: H0 : ¹X = ¹Y : Alternative: HA : ¹X 6= ¹Y (zweiseitig) oder HA : ¹X > ¹Y (einseitig) oder HA : ¹X < ¹Y (einseitig) 25 Ungepaarter t-Test: 2/3 π₯= 3. Teststatistik: T = wobei 2 Spool = = 1 n+m¡2 1 ∑π₯ π π Xn ¡ Y m p Spool 1=n + 1=m à n ! m X X 2 (Xi ¡ X n ) + (Yi ¡ Y m )2 = i=1 i=1 ¡ ¢ 1 2 2 (n ¡ 1)^ ¾x + (m ¡ 1)^ ¾y : n+m¡2 Verteilung der Teststatistik unter H0 : T » tn+m¡2 . 1 ∑ π₯π − π₯ π−1 2 26 Ungepaarter t-Test: 3/3 4. Signi¯kanzniveau: ® 5. Verwerfungsbereich fÄ ur die Teststatistik: (¡1; ¡tn+m¡2;1¡®=2 ] [ [tn+m¡2;1¡®=2 ; 1) bei Alternative HA : ¹X 6= ¹Y ; [tn+m¡2;1¡® ; 1) (¡1; ¡tn+m¡2;1¡® ] bei Alternative HA : ¹X > ¹Y ; bei Alternative HA : ¹X < ¹Y : 6. Testentscheid: Entscheide, ob der beobachtete Wert der Teststatistik im Verwerfungsbereich der Teststatistik liegt. 27 Happy End ! Happy End ! Gepaart vs. Ungepaart ο§ Bsp: Augeninnendruck; ein Auge behandelt, das andere nicht (gepaarter Test ist angebracht) ο§ Gemäss Vorraussetzungen dürfte auch ein ungepaarter Test angewendet werden Ungepaart: Augendruck Intuition Teststatistik: π = π−π ππ π»0 : ππ = ππ Gepaart: Differenz π·π = ππ − ππ Teststatistik π = links rechts π· ππ· 30 Gepaart vs. Ungepaart: Simulationsstudie ο§ π»0 : ππ· = 0 bzw. π»0 : ππ = ππ ; n=m=10 ο§ π~π 100, ππ2 , π·~π 2, 1 , π = π + π· gepaarte Situation gepaart ο§ Der gepaarte t-Test hat mehr Macht, wenn die Daten verrauscht sind. ungepaart 31 t-Test falls Varianz in Gruppen unterschiedlich (aka Welch-Test) ο§ Grundidee identisch ο§ Teststatistik und Verteilung falls π»0 stimmt ist komplizierter ο§ Computer: Dieser Test ist meist der default t-Test ο§ Praxis: Man sollte immer annehmen, dass die Varianz der Gruppen unterschiedlich ist; d.h., Welch-Test verwenden ο§ Prüfung: Um einfacher rechnen zu können, werden wir beim t-Test gleiche Varianzen in den beiden Gruppen annehmen 32 0.3 0.0 Wa.dichte Mann-Whitney U-Test (aka Wilcoxon Rank-sum Test) ο§ Falls Daten nicht normalverteilt ο§ ππ ~πΉ, π = 1, … , π; ππ ~πΊ, π = 1, … , π π»0 : πΉ = πΊ π»π΄ : πΉ = πΊ + πΏ (πΏ ≠ 0) (oder einseitig) -2 0 2 4 x (d.h., Verteilungen sind verschoben, haben aber gleiche From) ο§ Teststatistik: - Bilde Ränge über beide Gruppen hinweg - Falls Gruppen gleich gross sind, sollten Rangsummen etwa gleich sein - Falls Gruppen ungleich, sollten Rangsummen in einem gewissen Verhältnis stehen 33 Bsp: Mann-Whitney U-Test ο§ ο§ ο§ ο§ ο§ Behandlung (B) und Kontrolle (K) je 2 Patienten Beobachtung: B: 1.2, 3.1; K: 5.9, 4.4 Gesamtrang: B: 1, 2; K: 4, 3 Rangsumme R in K: 4 + 3 = 7 Falls π»0 stimmt sind alle Ränge in K gleich wahrscheinlich Ränge 1,2 1,3 1,4 2,3 2,4 3,4 R 4 5 5 6 7 3 ο§ Z.B. für einseitigen Test: P-Wert 1 π π ≥ 7 = π π = 7 = ≈ 0.167 6 ο§ π»0 kann auf dem 5% Niveau nicht verworfen werden ο§ Praxis: Computer verwenden 34 Übersicht: Tests für ungepaarte Stichproben Test Annahmen ππ = ππ ππ ~π ππ ~π t (ππ = ππ ) x t (ππ ≠ ππ ) MW U-Test x Macht für ein Beispiel (1) πΉ, πΊ haben gleiche Form iid pro Gruppe x x 2 57 % x 2 56 % x 4 53 % x x ππππ (falls π = π) bei πΆ = π. ππ x (1): X i ~N ππ , π 2 , ππ ~π ππ , π 2 , π = π = 10; π»0 : ππ = ππ ; π»π΄ : ππ ≠ ππ ; πΌ = 0.05 Macht berechnet für konkrete Alternative: ππ ~π 0,1 , ππ ~π(1,1) 35 Multiples Testen ο§ Microarray Test mit m=1000 Genen ο§ 1000 t-Tests auf dem 5% Sign.niveau ο§ Angenommen, kein Gen hat einen Effekt: Ca. 50 Tests (5% von 1000) werden trotzdem ein signifikantes Ergebnis liefern ! 50 Gene werden als “wichtig” angegeben, obwohl sie gar nicht “wichtig” sind. ο§ Wie erzeugt man eine Liste von “wirklich wichtigen” Genen? 36 Multiples Testen: Bonferroni Korrektur ο§ Wollen eine “konservative” Liste mit der Eigenschaft: P(mind. ein Fehler 1. Art) ≤ πΌ ο§ Bonferroni Korrektur: Teste jedes Gen mit Sign.niveau statt πΌ; π ist die Anzahl Gene ο§ Begründung: πΉπ : Fehler 1. Art bei Gen I π π F1 F3 π πΉπ ≤ π=1 F2 “union bound”: Gesamtfläche ist sicher kleiner als Summe der Einzelflächen π π πΉπ = π=1 πΌ , π π=1 πΌ =πΌ π ο§ Nachteil: Liste ist evtl. “extrem” konservativ (z.B. gar kein Gen enthalten) 37