Bremer Institut für Präventionsforschung und Sozialmedizin Biometrie im Antrag: Biometrische Planung von Tierversuchen Iris Pigeot 2. Fortbildungsveranstaltung der GV-SOLAS für Tierschutzbeauftragte Berlin, 27. Mai 2009 Bremer Institut für Präventionsforschung und Sozialmedizin Überblick 1. Das Studienprotokoll 2. Das Studiendesign 3. Bestimmung der erforderlichen Tierzahl Bremer Institut für Präventionsforschung und Sozialmedizin 1. Das Studienprotokoll Bremer Institut für Präventionsforschung und Sozialmedizin Zweck eines Studienprotokolls unverzichtbar in Planungsphase ↓ • verbindliche Festlegung aller im Versuch zu beachtenden Aspekte (inkl. stat. Auswertung) • Regelung der Verantwortlichkeiten organisatorische Vorteile verhindert ungeplante datenabh. Entscheidungen Bremer Institut für Präventionsforschung und Sozialmedizin umfasst im Wesentlichen drei Bereiche • Welches Ziel wird mit dem Versuch verfolgt? • Wie kann dieses Ziel erreicht werden? • Welche stat. Methoden sind geeignet, um die erzielten Resultate statistisch zu manifestieren? Insgesamt: Vermeidung von nicht interpretationsfähigen und somit überflüssigen Tierversuchen Bremer Institut für Präventionsforschung und Sozialmedizin Präzisierung des Versuchsziels Fragestellung einfach eindeutig möglichst wenige Zielgrößen Festlegung von Hauptzielkriterium Nebenzielkriterien Bremer Institut für Präventionsforschung und Sozialmedizin Hauptzielkriterium häufig: medizinische Hypothese bzgl. Wirksamkeit Beispiel: Wirkung eines blutdrucksenkenden Präparats dazu nötig: Festlegung der biologischen Relevanz Nebenzielkriterien häufig: Nebenwirkungen Beispiel: Nierenschädigung Bremer Institut für Präventionsforschung und Sozialmedizin Erreichung dieses Ziels a. Festlegung der Versuchstierart • Tiermodell • Homogenität Inzuchtstämme Bremer Institut für Präventionsforschung und Sozialmedizin b. Festlegung des Auswahlverfahrens • Zufallsauswahl aus Grundgesamtheit nicht systematische Verteilung zusätzl. Einflussgrößen • bei bekannten Einfluss-/ Störgrößen auch effektivere Verfahren • zufällige Zuweisung von Behandlungen Bremer Institut für Präventionsforschung und Sozialmedizin c. Festlegung der Versuchstieranzahl • nicht zu viele Tiere • nicht zu wenig Tiere Behandlungseffekt u.U. nicht erkennbar • statistische Verfahren heranziehen • Größe des zu entdeckenden Unterschieds Bremer Institut für Präventionsforschung und Sozialmedizin d. Festlegung der 1. Einschlusskriterien Charakterisierung der einzusetzenden Tiere Angabe von Tierart, Auszuchtstamm, Alter, Geschlecht, z.B. männl. erwachsene Wistar-Ratten 2. Ausschlusskriterien tierindividuelle Eigenschaften bestimmte Krankheiten 3. Abbruchkriterien Gründe für vorzeitige Entnahme unzumutbare Belastung Bremer Institut für Präventionsforschung und Sozialmedizin e. Festlegung der Behandlung • Behandlungsart – Menge des Präparats – Darreichungsform/ -zeitpunkt – Versuchszeitraum • Begleitbehandlung – Käfighaltung – Ernährung – klimatische Bedingungen Bremer Institut für Präventionsforschung und Sozialmedizin f. Festlegung der Messverfahren • zu messende Parameter • Messtechnik • technische Hilfsmittel • fähiges, eingewiesenes Personal: möglichst nicht auswechseln, nicht eine Person für eine Gruppe • mögliche Beeinflussung des Messwerts durch Messzeitpunkt, klimatische/räumliche Bedingungen Bremer Institut für Präventionsforschung und Sozialmedizin Konstante Bedingungen während des gesamten Versuchs besonders wichtig: absolute Gleichbehandlung von zu vergleichenden Gruppen sonst auftretende Effekte nicht allein auf die erfolgte Behandlung zurückzuführen Beispiel: Keine Gruppe anders ernähren Bremer Institut für Präventionsforschung und Sozialmedizin Beispiel: Untersuchung von 20 männlichen Wistar-Ratten pro Behandlungs- und Vergleichsgruppe: Messung des arteriellen Blutdrucks unblutig mittels Schwanzplethysmographie in Äther-Narkose an 10 aufeinanderfolgenden Tagen zwischen 9.00 und 9.30 sowie 18.00 und 18.30 Bremer Institut für Präventionsforschung und Sozialmedizin Wahl der statistischen Methodik a. Festlegung des statistischen Testproblems b. Festlegung der stat. Auswertungsstrategie • Verteilungstyp • statistische Präzision Vorsicht bei multiplen Testproblemen • biometrisches Verfahren Wechsel des Verfahrens während des Versuchs nicht zulässig Bremer Institut für Präventionsforschung und Sozialmedizin Bemerkungen • Abweichungen vom Studienprotokoll unbedingt vermeiden; falls trotzdem nötig dokumentieren • Evtl. Überprüfung des Versuchsplans durch Pilotstudie möglich Bremer Institut für Präventionsforschung und Sozialmedizin 2. Das Studiendesign Bremer Institut für Präventionsforschung und Sozialmedizin Gründe für Verzerrungen Messungen sind in der Regel mit Fehlern behaftet. Man unterscheidet: systematische Fehler - system. Messfehler - Ungleichbeh. von Gruppen - Nicht-Konstanthaltung der Rahmenbedingungen zufällige Fehler - zufällige Messfehler - biol. Variabilität Bremer Institut für Präventionsforschung und Sozialmedizin Biologische Variabilität Tierzahl Variabilität des statistischen Verfahrens Reduzierung bzw. Kontrolle der biologischen Variabilität ↓ Senkung der Variabilität des stat. Verfahrens ↓ Geringere Tierzahl bei gleicher Präzision Bremer Institut für Präventionsforschung und Sozialmedizin Reduzierung der biologischen Variabilität möglich durch Homogenisierung • Typisch: Inzuchtstämme • Weiterführend: Geschlecht, Wurf, Altersklasse, etc. Probleme: • Kleine Anzahl potentiell geeigneter Tiere • Kleine Induktionsbasis Bremer Institut für Präventionsforschung und Sozialmedizin … Berücksichtigung von Basiswerten Gruppe A Endwert Basiswert Differenz Gruppe B Bremer Institut für Präventionsforschung und Sozialmedizin Kontrolle der biol. Variabilität möglich durch Berücksichtigung bek. Störgrößen: Blockbildung Bisher: 100 Randomisierung 50 Gruppe A 50 Gruppe B Bremer Institut für Präventionsforschung und Sozialmedizin Jetzt: 20 20 20 20 20 10 10 10 10 10 10 10 10 10 10 Gruppe A Gruppe B Sinnvoll bei: Homogenität “innerhalb” Blöcke Heterogenität “zwischen” Blöcken Bremer Institut für Präventionsforschung und Sozialmedizin Beispiel: (Mead & Curnow, 1983, S. 294f) • Vgl. zweier Futtermittel A & B • Zielgröße: Gewichtszunahme • Tierkollektiv: Je 4 Schweine aus 3 Würfen • Vollständige Randomisierung Tier W 1 2 3 4 u 1 B 20 A 22 A 21 B 22 r 2 A 18 B 17 A 16 B 13 f 3 B 17 A 22 B 18 A17 Bremer Institut für Präventionsforschung und Sozialmedizin Berücksichtigung der Würfe als Blöcke Futter mittel W A B u 1 21.5 21.0 r 2 17.0 15.0 f 3 19.5 17.5 A-B 0.5 2.0 2.0 Ergebnisse: Differenz Std.-Fehler Vollst. Randomisierung 1.5 kg 1.65 Blockbildung 1.5 kg 1.06 Bremer Institut für Präventionsforschung und Sozialmedizin Kontrolle der biol. Variabilität möglich durch Berücksichtigung bek. Störgrößen: Matching Extreme Form der Blockbildung Vorgehen: 1. Bildung von Gruppen mit mind. 2 möglichst ähnlichen Tieren 2. Randomisierung: ein Tier zur „Behandlungsgruppe“ ein Tier zur „Kontrollgruppe“ 1:1 Matching: Individuelles Matching 1:M Matching: Multiples Matching Bremer Institut für Präventionsforschung und Sozialmedizin Beispiel: (Fortführung) • Weitere Störgröße: Anfangsgewicht • GK1: Schweine 1 und 2, GK2: Schweine 3 und 4 je Wurf Paar 1 2 3 4 5 6 A 22 21 18 16 22 17 B 20 22 17 13 17 18 A-B +2 -1 +1 +3 +5 -1 Ergebnisse: Differenz Std.-Fehler Voll. Randomisierung 1.5 kg 1.65 Blockbildung 1.5 kg 1.06 Matching 1.5 kg 0.96 Bremer Institut für Präventionsforschung und Sozialmedizin Kontrolle der biol. Variabilität möglich durch Crossover-Versuche Vergleich von 2 Behandlungen, falls keine bleibenden Veränderungen der Tiere auftreten: Jedes Tier ist eigene Kontrolle Schema 1: Beh.-Phase 1 Schema 2: Reg.-Phase Beh.-Phase 2 Periode 1 Periode 2 Beh. A Gruppe 1 Gruppe 2 Beh. B Gruppe 2 Gruppe 1 Bremer Institut für Präventionsforschung und Sozialmedizin Geringere Tieranzahl, falls • keine bleibenden Veränderungen und • Variabilität „innerhalb“ der Tiere wesentlich geringer als im Kollektiv Nachteile: • Prüfung aller Modellvoraussetzungen sehr aufwändig • beschränkte Einsetzbarkeit Bremer Institut für Präventionsforschung und Sozialmedizin Zusammenfassung: Zentral: Biologische Variabilität Unbekannte Ursache: Randomisierung Bekannte Ursachen: Berücksichtigung bereits bei Versuchsplanung durch – Homogenisierung – Blockbildung – Matching Festlegung vor Versuchsbeginn notwendig Bremer Institut für Präventionsforschung und Sozialmedizin 3. Bestimmung der erforderlichen Tierzahl Bremer Institut für Präventionsforschung und Sozialmedizin Häufig: Absicherung der Ergebnisse durch statistischen Test Verteilungsmodell Stärke des zu entdeckenden Effekts Wahrscheinlichkeiten für Fehlentscheidungen erforderliche Tierzahl Bremer Institut für Präventionsforschung und Sozialmedizin Wichtig für Auswahl eines „besten“ stat. Tests: Verteilungsmodell hängt ab vom Skalenniveau und Wertebereich der Ausprägungen der interessierenden Größe Beispiele: 1. Binäres Merkmal: Erfolg Misserfolg (Rückbildung von Tumoren: Anz. tumorfreier Tiere binomialverteilt) 2. Stetiges Merkmal: häufig Ann. einer Normalvtlg. gerechtfertigt Bremer Institut für Präventionsforschung und Sozialmedizin Notwendig für Anwendung eines stat. Tests: Formulierung wissenschaftlicher Fragestellung als statistisches Testproblem statistische Hypothese statistische Alternative Beispiel: 2 Präparate A und B zur Blutdrucksenkung Wiss. Fragestellung: „B besser als A“ Stat. Testproblem: H0: „A gleich gut wie B“ (Hypothese) H1: „B besser als A“ (Alternative) Bremer Institut für Präventionsforschung und Sozialmedizin Aber: „besser muss präzisiert werden“ Wann ist Unterschied biologisch relevant? Vorsicht: Je kleiner der zu entdeckende Unterschied, desto mehr Tiere erforderlich! Bremer Institut für Präventionsforschung und Sozialmedizin Möglich bei Durchführung eines stat. Tests: Zwei Arten von Fehlentscheidungen Abbildung: Entscheidungen bei stat. Tests Hypothese wahr nicht wahr lehnt ab Test lehnt nicht ab Fehler 1. Art (α-Fehler) richtig richtig Fehler 2. Art (β-Fehler) Bremer Institut für Präventionsforschung und Sozialmedizin • Wahrscheinlichkeit für Fehler 1. Art: α (vor Durchführung des Tests festlegen!) • Wahrscheinlichkeit für Fehler 2. Art: β (hängt von gewählter Alternative ab) Ziel: α und β möglichst klein („null“ nicht möglich) Vorsicht: Je kleiner α und/oder β, desto mehr Tiere erforderlich Bremer Institut für Präventionsforschung und Sozialmedizin Beachte: Stat. Signifikanz nicht immer gleich biol. Relevanz Abbildung: Stat. Signifikanz und biol. Relevanz Stat. Signifikanz Biol. Relevanz ja nein ja + - nein - + Wichtig: Inhaltliche Interpretierbarkeit der Ergebnisse Bremer Institut für Präventionsforschung und Sozialmedizin Beispiel: Präparat zur Rückbildung von Tumoren Dabei: • Weiterentwicklung des Präparats, wenn in mind. 40% der Fälle Rückbildung erreicht wird • Stop der Entwicklung, wenn in höchstens 30% der Fälle Rückbildung erreicht wird Formulierung als stat. Testproblem über Erfolgsw´keiten p1 und p2 : H0: p=p0=30% vs. H1: p=p1=40% Bremer Institut für Präventionsforschung und Sozialmedizin Hier: • Verteilungsmodell: Binomialvtlg, da binäres Merkmal • Zu entdeckender Unterschied: 10 Prozentpunkte • α festlegen • Schätzung des Anteils zurückgebildeter Tumore p̂ • Festlegung eines geeign. Tests; hier: „approximativer Test“ Lehne H0 ab, falls ˆ N p − p1 ≥ uα pˆ (1 − pˆ ) • Damit folgende Formel zur Bestimmung von N (erforderliche Tierzahl): N ≥ (uα + u β ) 2 uα , u β p2 (1 − p2 ) ( p1 − p2 ) 2 Quantile der Standardnormalverteilung Bremer Institut für Präventionsforschung und Sozialmedizin β=0.1, p1=0.3, p2=0.4 N 500 400 300 200 100 0 0 0.02 0.04 0.06 α 0.08 0.1 Bremer Institut für Präventionsforschung und Sozialmedizin α=0.05, β=0.1, p1=0.3 N 100000 10000 1000 100 10 0.3 0.35 0.4 p2 0.45 0.5 Bremer Institut für Präventionsforschung und Sozialmedizin Wichtig: Erforderliche Tierzahl ist in jedem Einzelfall neu zu bestimmen und zu begründen, also: allgemeingültige Angaben von erforderlichen Tierzahlen nicht sinnvoll Bremer Institut für Präventionsforschung und Sozialmedizin Ein Mensch, der von Statistik hört, denkt dabei nur an Mittelwert. Er glaubt nicht daran und ist dagegen, ein Beispiel soll es gleich belegen. Ein Jäger auf der Entenjagd hat einen ersten Schuss gewagt. Der Schuss, zu hastig aus dem Rohr, Lag eine gute Handbreit vor. Der zweite Schuss mit lautem Krach lag eine gute Handbreit nach. Der Jäger spricht ganz unbeschwert voll Glauben an den Mittelwert: statistisch ist die Ente tot. Doch wär‘ er klug und nähme Schrot - dies sei gesagt, ihn zu bekehren – Er würde seine Chance mehren: Der Schuss geht ab, die Ente stürzt, weil Streuung ihr das Leben kürzt. - P. H. List - Bremer Institut für Präventionsforschung und Sozialmedizin Danke!