1 Wahlpflichtfach im Klinischen Studienabschnitt zum Thema „Schmerz“ WS 2007/08 Anmeldung: Sekretariat des Instituts für Medizinische Psychologie, Bunsenstr. 3, 35037 Marburg Tel. 28-66250, Fax 28-64881, e-mail: [email protected] Leistungsnachweis: Der Leistungsnachweis erfolgt über eine Hausarbeit in einem Fachgebiet nach Wahl. 1. Akutschmerz und postoperative Schmerztherapie(0,5 SWS) 1.1. Einführung – Bedarf, Nutzen, Risiken der postoperativen Schmerztherapie 1.2. Patienteninformation und –aufklärung 1.3. Schmerzmessung und Dokumentation 1.4. Differenzialdiagnose von postoperativen Schmerzen 1.5. Systemische Schmerztherapie (Opioide, Nicht-Opioide, Ko-Analgetika und Applikationswege) 1.6. Regionalanästhesie (Rückenmarksnahe Verfahren und periphere Nervenblockaden) 1.7. Organisation des Akut-Schmerzdienstes Der Kurs gliedert sich in ein Seminar und eine Hospitation beim postoperativen Akutschmerzdienst. Im Seminar wird die Bedeutung und Problematik des Akutschmerzes erarbeitet und das perioperative Schmerztherapie-Konzept der Klinik für Anästhesie vorgestellt. Verfahren der Regionalanästhesie werden multimedial erläutert und die ultraschallgestützte Lokalisation von peripheren Nerven durch die Studierenden selbst ist möglich. Die Hospitation beim Akutschmerzdienst bedeutet Teilnahme an der klinischen Visite bei den postoperativen Patienten des Klinikums, die mit Regionalanästhesieverfahren behandelt werden. Lehrender: Dr. G. Dinges , Klinik für Anästhesie und Intensivtherapie (e-mail: [email protected]) Termin: Vorbesprechung und Terminfestlegung am 22.10.2007, 16.30 h im Besprechungsraum Anästhesie (Nullebene/Raum 0/2126). 2. Biologische Mechanismen der Chronifizierung (0,5 SWS) 2.1. Neurobiologische Grundlagen des Schmerzes 2.2. Das Hinterhorn des Rückenmarks 2.3. Neurotransmitter-und Neuromodulatorsysteme 2.4. Mechanismen der strukturellen und funktionellen Plastizität Lehrender: Prof. Dr. E. Weihe, Institut für Anatomie und Zellbiologie ([email protected]) Termine: Termin erfragen unter Tel. 28-66247 Ort: Seminarraum 1 des Instituts für Anatomie und Zellbiologie 3. Schmerzdiagnostik und psycho-soziale Mechanismen der Chronifizierung mit Fallvorstellung (0,5 SWS) 3.1. Das bio-psycho-soziale Schmerzmodell 3.2. Differenzierung akuter-chronischer Schmerz (ICIDH- und ICF-Konzept der WHO) 3.3. Schmerzmessung (VRS, NRS, VAS) und psychometrische Verfahren 3.4. Lebensaltersbezogene Probleme der Diagnostik und Therapie chronischer Schmerzen 3.5. Diagnostik der Chronifizierung (Stadienkonzepte) 3.6. Lerntheoretische Modelle der Chronifizierung (Modelllernen, operantes und respondentes Modell) 3.7. Komplexe und syndrom-spezifische Modelle (Diathese-Stress, Fear-Avoidance, yellow flags, etc.) 3.8. Psychologische Therapieverfahren und Schmerzmanagement 3.9. Medikamentenabhängigkeit und Entzug 3.10. Interdisziplinäre Kooperation Lehrender: Prof. Dr. Dr. H.D. Basler, Institut für Medizinische Psychologie Termin: Samstag, den 10.11., 2007, 9:00 Uhr – 16:00 Uhr, Unterrichtsraum des Instituts für Medizinische Psychologie, Bunsenstr. 3, III. Etage 4. Diagnostik und Therapie chronischer Rücken- und muskuloskelettaler Schmerzsyndrome mit Fallvorstellungen und praktischen Übungen (0,5 SWS) 3.1. Besonderheiten der Pathophysiologie und Ätiopathogenese 3.2. Symptomatik und Differenzialdiagnostik radikulärer und nichtradikulärer Schmerzen) 3.3. qualitätsgesicherte Schmerztherapie des chronischen Rückenschmerzes -Interdisziplinärer Kooperation 3.4. entzündliche rheumatische Erkrankungen 3.5. degenerative Gelenkerkrankungen 3.6. weichteilrheumatische Erkrankungen 3.7. myofaszialer Schmerz 1 2 Lehrender: PD Dr. H. Konder, Schmerzklinik des Katholischen Krankenhauses Hagen Termin: Samstag, den 19. Januar, 2008, Unterrichtsraum des Instituts für Medizinische Psychologie, Bunsenstr. 3, III. Etage (bitte Sportkleidung mitbringen wg. der praktischen Übungen) 5. Diagnostik und Therapie chronischer Kopf- und Gesichtschmerzsyndrome sowie neuropathischer Schmerzsyndrome mit Fallvorstellungen (0,5 SWS) 3.8. Migräne 3.9. Kopfschmerz vom Spannungstyp 3.10. Clusterkopfschmerz 3.11. Medikamenten-induzierter Kopfschmerz 3.12. Trigeminusneuralgie 3.13. Mono- und Polyneuropathien 3.14. zentraler Schmerz 3.15. Komplexes regionales Schmerzsyndrom 3.16. Interdisziplinäre Kooperation Lehrende: Dr. M. Teepker (verantwortlich), PD Dr. K. Schepelmann, Prof. Dr. Braune Termin: Vier Termine freitags innerhalb des Semesters, 17:00 bis 18:30 Uhr, jeweils nach der Schmerzkonferenz in der dritten Woche des Monats, Konferenzraum des Zentrums für Nervenheilkunde 6. Neurochirurgische Verfahren in der Schmerztherapie mit Fallvorstellungen (0,5 SWS) a. Indikationsbereich neurochirurgischer Verfahren b. Läsionsverfahren c. Elektrostimulationsverfahren d. Dekomprimierende Verfahren e. Interdisziplinäre Kooperation Lehrender: Prof. Dr. Dieter Hellwig, Klinik für Neurochirurgie Termin: Drei Termine Mittwoch, 16:00 Uhr bis 18:00 Uhr (oder nach Vereinbarung). Die Veranstaltung findet statt im Raum No. 3130 Ebene + 1 (Seminarraum NCH) am Klinikum. 7. Tumorschmerz und Palliativmedizin mit Fallvorstellungen (0,5 SWS) a. Schmerzursachen und Symptomatik b. Therapie einschließlich WHO-Stufenschema c. Ziele und Inhalte der Palliativmedizin d. Organisation palliativmedizinischer Versorgung Lehrender: Prof. Dr. Andreas Lübbe, Cecilien-Klinik, Bad Lippspringe Termin: Dienstag, den 6. November, 9:00 – 12:30 Uhr und Dienstag, den 4. Dezember, 9:00 – 12:30 Uhr, Bibliothek der Informatik, Bunsenstr. 3, 1. Stock 8. Somatoforme Schmerzstörung: Wie kann man Somatisierung verstehen – wie erhebt man die Anamnese? Mit Fallbesprechungen (0,5 SWS) 8.1. Was sind somatoforme (Schmerz-)Störungen? 8.2 Wie kann man ihre Entstehung konzeptuell fassen? 8.3. Was sind mögliche auslösende Faktoren? 8.4. Wie erhebt man die Anamnese und wie gestaltet man die Beziehung? Lehrender: Dr. G. Bolm, Institut für Medizinische Psychologie Termin: Samstag, den 17. November, 2007, 10 – 13 h, 14:30-17:30 h, Institut für Medizinische Psychologie, Unterrichtsraum 9. Interdisziplinäre Schmerzkonferenz (0,5 SWS) Für die Teilnahme an vier Schmerzkonferenzen werden 0,5 SWS angerechnet. Die Schmerzkonferenz findet an jedem 3. Freitag im Monat in der Zeit von 15:00 Uhr bis 17:00 Uhr im Unterrichtsraum in der ersten Etage des Zentrums für Nervenheilkunde, Rudolf-Bultmann-Straße 8, statt. 2 3 Leistungsnachweis im Wahlpflichtfach „Schmerz“ Der Leistungsnachweis erfolgt über eine Hausarbeit. Die Studierenden können wählen, in welchem Teilgebiet sie eine Hausarbeit schreiben wollen. Das Thema muss mit dem für das Teilgebiet zuständigen Dozenten abgesprochen werden. Kriterien für die Ausgabe und Benotung der Hausarbeit (1) Das Thema soll den angebotenen Lehrstoff vertiefen. (2) Das Thema soll durch eine Datenbank gestützte Literatursuche zu bearbeiten sein. In Frage kommen sowohl Originalarbeiten als auch Review-Artikel oder Meta-Analysen. Eine ausschließliche Wiedergabe des Inhalts von Lehrbüchern ist nicht zu akzeptieren. (3) Der Umfang der Hausarbeit soll die Länge eines Originalartikels nicht überschreiten. Als Richtwert gilt ein Seitenumfang von 10 - 15 Manuskriptseiten einschließlich Zusammenfassung und Literaturverzeichnis, Schriftgröße 12, 1 ½ zeilig geschrieben. (4) Folgende Kriterien werden der Benotung zu Grunde gelegt: a) Qualität der vorausgestellten Zusammenfassung b) Darlegung der Fragestellung c) Methodik der Datenbank-Recherche, Auswahlkriterien für die in der Hausarbeit dargestellten Artikel d) Darstellung der Ergebnisse unter inhaltlichen und methodischen Gesichtspunkten (zur Methodik siehe das Skript zu „Evidence Based Medicine“ auf den Folgeseiten) e) Kommentierung, in welchem Ausmaß die Ausgangsfrage durch das Literaturstudium beantwortet werden konnte f) Formale Gestaltung (Quellenangaben, Zitate, Gliederung, etc.) 3 4 Einführung in die Evidenz Basierte Medizin (EBM) Prof. Dr. Dr. H.D. Basler, Institut für Medizinische Psychologie 1. Was ist Evidenz Basierte Medizin? Meine Studenten fühlen sich unbehaglich, wenn ich ihnen sage: „Die Hälfte dessen, was Ihnen als Medizinstudenten beigebracht wird, wird sich in 10 Jahren als falsch erweisen. Und das Problem besteht darin, dass keiner Ihrer Lehrer Ihnen derzeit sagen kann, was zu dieser Hälfte gehört.“ (Dr. Sydney Burwell, ehemaliger Dekan der Harvard Medical School, zit. nach Sackett et al., 2000). Diese Aussage Dr. Burwells liegt fast 50 Jahre zurück. Die Halbwertszeit des medizinischen Wissens hat sich inzwischen weiterhin verkürzt. Es ist abzusehen, dass nur noch die Hälfte dessen, was Studierende zu Beginn ihrer klinischen Ausbildung lernen, auch am Ende dieser Ausbildung Gültigkeit haben wird. Aus dieser Erkenntnis wurde folgende Schlussfolgerung gezogen: Wichtiger als Gegenstandskataloge einzelner Fachgebiete zu lernen ist es für angehende Ärzte, sich mit den Methoden vertraut zu machen, die ihnen helfen, sich in kurzer Zeit auf den neuesten Stand des medizinischen Wissens zu bringen und diesen bei der klinischen Entscheidungsfindung zu berücksichtigen. Genau dieses ist das Ziel der Evidenz Basierten Medizin (EBM=evidence based medicine), wobei unter Evidenz Belege und rationale Begründungen für Entscheidungen verstanden werden. Nach Sackett et al. (1996) ist EBM „der gewissenhafte, ausdrückliche und vernünftige Gebrauch der gegenwärtig besten externen, wissenschaftlichen Belege (evidence) für Entscheidungen in der medizinischen Versorgung individueller Patienten“. EBM impliziert somit eine strenge Ausrichtung klinischer Entscheidungen an den neuesten Ergebnissen klinischer medizinischer Forschung. Erst wenn solche Ergebnisse nicht vorliegen, soll auf das Erfahrungswissen des einzelnen Arztes zurück gegriffen werden. Obwohl das Bemühen um eine wissenschaftliche Fundierung klinischer Entscheidungen in der Medizin nicht neu ist, gab es bis vor wenigen Jahren massive Barrieren sowohl für die Verbreitung als auch für die Umsetzung klinisch relevanter Forschungsergebnisse in der Versorgungspraxis. Das führte zu einer häufig jahrelangen Verzögerung von wissenschaftlich begründeten Veränderungen in der Patientenversorgung. Heute ermöglichen die modernen elektronischen Kommunikationsmedien jedem Arzt, sich über die nach neuestem Wissen beste Versorgung seiner Patienten zu informieren. Der Begriff EBM wurde erst 1992 an der McMaster University in Kanada geprägt. Trotz dieser kurzen Geschichte kann sich heute kein klinisch tätiger Arzt der Diskussion um EBM entziehen, und sei es aufgrund der Forderung, die Therapie bestimmter Krankheiten nach Evidenz basierten Leitlinien durchzuführen. Die von der Bundesregierung favorisierten Disease Management Programme (z.B. für Diabetes, Asthma und Brustkrebs) fordern von den beteiligten Ärzten, sich in der Patientenversorgung an Leitlinien zu orientieren, die auf der Basis von EBM erstellt wurden. Nach Sackett et al. (2000) umfasst das Evidenz basierte Vorgehen des in der Patientenversorgung tätigen Arztes fünf Schritte, die hier jedoch nicht alle ausführlich erklärt werden: Schritt 1: Formulierung einer beantwortbaren Frage, die sich auf die beste Lösung für ein Problem bezieht, das von einem Patienten präsentiert wird. Hierbei kann es sich um Fragen der Prävention, der Diagnose, der Prognose, der Therapie oder der Ursache für eine Erkrankung handeln. 4 5 Schritt 2: Suche nach der besten Evidenz, um diese Frage zu beantworten. Hierbei kommen je nach Fragestellung und vorhandenem Wissen verschiedene Informationsquellen in Betracht: eigene klinische Erfahrung, die Meinung von medizinischen Autoritäten, Lehrbücher oder die Ergebnisse der in Datenbanken gespeicherten wissenschaftlichen Untersuchungen. Schritt 3: Kritische Bewertung der vorhandenen Evidenz. Die Bewertung soll sich darauf beziehen, wie nahe die Evidenz der Wahrheit kommt (wie valide sie ist), wie stark sie ausgeprägt ist (Effektstärke = size of the effect) und in welchem Ausmaße das erzielte Ergebnis in der eigenen klinischen Praxis anwendbar ist. Schritt 4: Abgleichung der durch die bisherigen Schritte gefundenen Evidenz mit den uns aufgrund unserer Ressourcen und der speziellen Individualität des Patienten gegebenen Möglichkeiten Schritt 5: Kritische Evaluation unserer eigenen Kompetenz in der Durchführung Evidenz basierter Analysen und deren Umsetzung in die Praxis mit der Zielsetzung einer ständigen Qualitätsverbesserung Dieses Skript konzentriert sich auf den dritten Schritt, insbesondere auf die kritische Bewertung der vorhandenen Evidenz. Die Bewertungskriterien der Evidenz richten sich nach dem Inhalt der klinischen Forschungsgebiete: Ursachenforschung, Therapieforschung und Diagnoseforschung. 2. Forschungsgebiete in der klinischen Medizin Ursachenforschung Ursachenstudien in der klinischen Medizin untersuchen, ob eine bestimmte Erkrankung auf eine zeitlich vorausgehende Bedingung zurückzuführen ist1. Bei dieser Bedingung kann es sich um eine möglicherweise schädliche Substanz (z.B. ein Umweltgift bei einer Krebserkrankung), um ein Verhalten (z.B. Rauchen bei Lungenkrebs), um eine genetische Disposition (z.B. Trisomie 21 bei Down-Syndrom) oder um eine physiologische (Dys-) Regulation (z.B. essentielle Hypertonie bei Herzinfarkt) handeln. Bevorzugte Studiendesigns bestehen in Kohortenstudien oder Fall-Kontroll-Studien. Therapieforschung In Therapiestudien geht es darum, die Wirksamkeit therapeutischer Interventionen zu erforschen. Hierbei kann es sich um medikamentöse Therapien, chirurgische Interventionen, Patientenschulungen, Psychotherapie oder alternative Heilverfahren handeln. Das bevorzugte Studiendesign ist die randomisierte kontrollierte Studie. 1 Kritisch muss angemerkt werden, dass die Forschung in der klinischen Medizin zwar zu Erkenntnissen über Krankheitsursachen beitragen, Beweise für ursächliche Zusammenhänge allerdings nicht erbringen kann. Ursachenforschung ist die Domäne des Experiments. Experimente mit Menschen sind aus ethischen Gründen nicht durchführbar. Statt von „Ursache“ sollte daher besser von „Assoziation“ gesprochen werden. Klinische Forschung kann feststellen, dass bestimmte Erkrankungen mit bestimmten Bedingungen assoziiert sind. Es ist zutreffender, diese Bedingungen als „Risikofaktor für die Erkrankung“, nicht aber als deren Ursache zu bezeichnen. In Laborexperimenten kann anschließend, z.B. im Rahmen von Tierversuchen, überprüft werden, ob die beobachtete Assoziation tatsächlich kausal zu interpretieren ist. In der Ursachenforschung sind klinische und laborexperimentelle Forschung wechselseitig voneinander abhängig. 5 6 Diagnoseforschung In Diagnosestudien geht es darum, die Objektivität, Zuverlässigkeit (Reliabilität) und Gültigkeit (Validität) diagnostischer Tests zu untersuchen. Zur Überprüfung der Validität ist ein Außenkriterium erforderlich, das den „Goldstandard“ darstellt. Diagnostische Tests sind dann nützlich, wenn sie ökonomischer anzuwenden sind als der Goldstandard. Der Goldstandard zur Diagnostik eines Tumors im Bauchraum ist z.B. die Computertomografie (CT). Nachteil dieser Methode sind die hohen hierdurch verursachten Kosten und die hohe Strahlenbelastung. Billiger ist es, eine Ultraschalluntersuchung durchzuführen. Die Diagnostik mit dem Ultraschall-Gerät ist nur so weit valide, wie die hierdurch erzielten Ergebnisse mit denen des CT übereinstimmen. Die Ergebnisse des diagnostischen Tests (Ultraschall) und des Goldstandards (CT) werden zeitgleich erhoben und miteinander verglichen. Bevorzugtes Design ist daher die Querschnittsstudie (cross sectional study)2. 3. Hierarchie der Evidenzkriterien bei Ursachen- und Therapiestudien Wenn Ärzte danach streben, die beste wissenschaftliche Evidenz zu berücksichtigen, müssen ihnen Kriterien an die Hand gegeben werden, diese zu beurteilen. EBM stellt für diesen Zweck eine Hierarchie von Kriterien auf, die sich an der Aussagekraft wissenschaftlicher Erkenntnismethoden orientieren. Die Evidenzhierarchie systematische Reviews und Meta-Analysen randomisiert-kontrollierte Studien Kohortenstudien Fall-Kontroll-Studien Querschnittsstudien Fallberichte Expertenurteil klinische Erfahrung Klinische Erfahrung, Expertenurteil und Fallberichte stehen deshalb an unterster Stufe, weil hierbei die Wahrscheinlichkeit systematischer Fehler („bias“, s.u.) am höchsten ist. Das erworbene Wissen beruht in diesen Fällen nicht auf einem kontrollierten methodischen Vorgehen, sondern auf bei verschiedenen Ärzten häufig unterschiedlichen persönlichen Erfahrungen. Diese können auch auf falsche Interpretationen von Sachverhalten zurück zu führen sein. Wenn z.B. ein Patient nach einer Therapie nicht wieder in die Sprechstunde kommt, so kann das daran liegen, dass er geheilt ist, aber auch daran, dass er aus Enttäuschung über die wirkungslose Behandlung einen anderen Arzt 2 Eine Sonderform der Diagnosestudie ist die Screeningstudie. Screenings dienen zum Nachweis von Erkrankungen in einem präsymptomatischen Stadium und richten sich auf die Bevölkerung. Bekannt ist z.B. das Diabetes-Screening durch einen Urinzucker-Teststreifen. Der Goldstandard in der Diabetesdiagnostik ist der Glukose-Toleranztest. Der Einsatz des Teststreifens ist zu rechtfertigen, wenn dessen Ergebnisse mit denen des Goldstandards übereinstimmen. Der Teststreifen- soll möglichst alle Personen erfassen, die auch durch den Glukose-Toleranztest als Fälle identifiziert worden wären (das ist eine Frage der Sensitivität des Screening-Tests) und - er soll möglichst alle Personen ausschließen, die gesund sind (das ist eine Frage der Spezifität des Screening-Tests). Die Validitätsparameter Sensitivität und Spezifität bestimmen neben der Messgenauigkeit (Reliabilität) die Güte eines diagnostischen Tests. 6 7 aufgesucht hat. Selbst wenn sicher gestellt werden kann, dass die Behandlung erfolgreich war, kann der Erfolg nicht direkt auf die Therapie zurückgeführt werden. Der Behandlungserfolg kann eingetreten sein, weil der Patient sich z.B. zusätzlich mit Hausmitteln therapiert hat, oder es kann sich um eine Spontanheilung gehandelt haben. Möglicherweise wären zudem andere Behandlungsmethoden bei diesem Patienten wirksamer gewesen. 4. Studiendesigns klinischer Studien Der Fallbericht Fallberichte beschreiben die medizinische Geschichte eines einzelnen Patienten in narrativer Form. Sie werden häufig als Fallserien publiziert, in denen die Patientengeschichten dazu dienen, Vermutungen zu besonderen Aspekten einer Krankheit, einer Behandlung oder - das findet man heute am häufigsten - einer Nebenwirkung zu veranschaulichen. Besonders in der letztgenannten Form können sie große Bedeutung erlangen. Es soll in diesem Zusammenhang in die Publikation von McBride aus dem Jahre 1961 in der Zeitschrift Lancet erinnert werden. Der Arzt hatte bemerkt, dass zwei Neugeborenen in seiner Klinik die Gliedmaßen fehlten. Die Anamnese hatte ergeben, dass beide Mütter während der Frühschwangerschaft ein neues Medikament gegen Schlafstörungen (Thalidomid, Handelsname in Deutschland: Contergan) eingenommen hatten. Er wollte nun so schnell wie möglich seine Kollegen auf die von ihm vermuteten Nebenwirkungen des Medikaments durch die Publikation aufmerksam machen. Aus diesem Beispiel wird deutlich, dass durch aktuelle, anschauliche Fallberichte Hypothesen generiert werden können, die nachfolgend durch systematische Studien überprüfbar werden. Sie können das Anfangsglied einer Kette von Studien darstellen, die eine zunehmende Evidenz ermöglichen. Die Querschnittsstudie zur Überprüfung der Assoziation von Variablen In Querschnittstudien werden mindestens zwei Variablen zum gleichen Zeitpunkt erhoben. Sie dienen dazu, eine vermutete Assoziation zwischen diesen Variablen zu überprüfen. Es gibt zahlreiche klinische Fragestellungen, bei denen der Arzt an der Assoziation von Variablen interessiert ist. Beispielsweise kann es von Bedeutung sein, Körpergröße und Lebensalter von Kindern in der Bevölkerung zu erheben, um Nomogramme zu erstellen, mit deren Hilfe der Wachstumsverlauf eines individuellen Kindes beurteilt werden kann. Oder es wird der Frage nachgegangen, ob sich körperlich aktive Diabetiker gesünder fühlen als nicht-aktive, indem eine Stichprobe von Personen mit dieser Diagnose gleichzeitig nach ihrem Bewegungsverhalten und nach der Einschätzung ihres Gesundheitszustands befragt wird. Die Vermutung, dass Diabetes in der Bevölkerung unterdiagnostiziert ist, könnte mit einer Untersuchung überprüft werden, in der jede Person aus einer Bevölkerung einem Glukose-Toleranztest unterzogen wird und das Ergebnis dieses Tests mit der Aussage verglichen wird, ob dieses Ergebnis der Person schon vorher bekannt war oder nicht. Durch reine Querschnittsstudien kann der Forscher Ursachen oder Therapieeffekte nicht ermitteln. Nehmen wir an, ein Doktorand hätte die Vermutung, dass chronische Schmerzen zu depressiven Verstimmungen führen. Er lässt alle Patienten, die die Schmerzambulanz des Klinikums besuchen, einen Depressionstest ausfüllen und entnimmt aus den Krankenakten Angaben zu dem Ausmaß der Chronizität. Er stellt fest, dass erwartungsgemäß die am stärksten chronifizierten Patienten die höchsten Werte im Depressionstest haben. Ist damit die Vermutung bestätigt worden? Nein, denn die beobachteten Assoziationen dürfen niemals kausal interpretiert werden. Die Ergebnisse könnten nämlich auch darauf hinweisen, dass nicht etwa chronischer Schmerz die Ursache depressiver Verstimmungen ist, sondern dass 7 8 umgekehrt depressive Verstimmungen die Chronifizierung des Schmerzes fördern. Es sind allerdings Zweifel nicht nur an der möglichen Interpretation der Ergebnisse angebracht, darüber hinaus könnten die Ergebnisse bereits durch die Auswahl der Probanden verfälscht worden sein. Möglicherweise suchen die Schmerzambulanz vorzugsweise solche Patienten mit stark chronifizierten Schmerzen auf, die gleichzeitig eine depressive Verstimmung aufweisen. Nicht depressive Patienten könnten mit der Therapie durch den Primärarzt eher zufrieden sein und daher keinen Anlass sehen, sich einer Spezialambulanz anzuvertrauen. Ein „Selektionsbias“ könnte daher die Ergebnisse verzerrt haben. Dieser Selektionsbias kann durch das Design nicht kontrolliert werden. Ein weiterer Doktorand möchte die Wirksamkeit einer für die Patienten kostenlosen Patientenbroschüre über gesunde Ernährung für Diabetiker überprüfen. Er hat beobachtet, dass einige Patienten diese Broschüre nach der Diagnostik der Erkrankung in der Klinik mit nach Hause genommen haben, andere nicht. Er hat die Idee, mit allen Patienten bei der nächsten Konsultation einen Wissenstest durchzuführen und sie gleichzeitig zu fragen, ob sie die Broschüre gelesen haben. Er stellt fest, dass der Test häufiger von Patienten bestanden wird, die angeben, die Broschüre gelesen zu haben. Somit kann eine Assoziation zwischen dem Lesen der Broschüre und dem Wissen aufgezeigt werden. Bitte erläutern Sie dem Doktoranden, warum er durch das Design der Querschnittstudie die Wirksamkeit der Intervention nicht überprüfen kann. Ein Problem besteht darin, dass der Wissensstand der beiden Gruppen vor dem Mitnehmen der Broschüre nicht bekannt ist. Möglicherweise wusste die Gruppe, welche die Broschüre eingesteckt hat, bereits zu diesem Zeitpunkt mehr über Ernährung als die andere Gruppe. Zum anderen kann es sein, dass sich die beiden Gruppen nicht nur in ihrem Vorwissen unterscheiden, sondern auch in anderen Variablen, die Einfluss auf das Ergebnis des Tests nehmen können. Hierzu könnte z.B. die Schulbildung gehören oder die Bereitschaft zur Mitarbeit in der Therapie (Compliance). Schulbildung und Compliance könnten sogar zu der Entscheidung beigetragen haben, die Broschüre zu lesen. Dann wäre der entscheidende Wirkfaktor nicht das Lesen der Broschüre, sondern eine dritte oder vierte Bedingung, die unkontrolliert in das Ergebnis einginge. Solche dritten Bedingungen werden als konfundierende Variablen (confounder) bezeichnet. Wenn sie zu Beginn einer Studie nicht bekannt sind, können sie nur durch eine randomisierte Zuweisung der Patienten auf eine Versuchs- und eine Kontrollgruppe in ihren Auswirkungen auf die Zielgröße oder den Endpunkt der Studie (auch „abhängige Variable“ genannt, in diesem Fall das Wissen) in Schach gehalten werden. Damit ist allerdings der Rahmen einer Querschnittstudie gesprengt. Die Fall-Kontroll-Studie als Studie mit retrospektivem Design In einer Fall-Kontroll-Studie werden Patienten mit einer bestimmten Erkrankung (Fälle) identifiziert und diese je nach Fragestellung entweder mit Patienten einer anderen Erkrankung, mit gesunden Personen aus der Bevölkerung oder mit Verwandten (Kontrollen) hinsichtlich eines oder mehrerer Merkmale retrospektiv (rückschauend) verglichen. Das Verfahren, nach dem die Versuchsgruppe (die Fälle) und die Kontrollgruppe (die Nicht-Fälle) zusammen gestellt werden, nennt man Matching. Fall-Kontroll-Studien werden im Regelfall im Kontext der Ursachenforschung durchgeführt. Sie eignen sich insbesondere für die Erforschung der Ätiologie seltener Erkrankungen. Wenn ich z.B. daran interessiert bin, ob Säuglinge, die in Bauchlage schlafen, häufiger einen plötzlichen Kindestod erleiden, werde ich alle Fälle von plötzlichem Kindestod in einer Versuchsgruppe sammeln und für jeden Fall eine lebende Vergleichsperson suchen. Ich werde mich bei den Eltern beider Gruppen nach der Schlafposition der Säuglinge erkundigen und die Häufigkeit der Bauchlagen in beiden Gruppen miteinander vergleichen. 8 9 Das große Problem der Fall-Kontroll-Studien besteht darin, adäquate Kontrollpersonen zu finden, da das Ergebnis wesentlich durch die Auswahl der Kontrollen bestimmt wird. Ich muss sehr sorgfältig überlegen, welche Variablen außer der Schlafposition Einfluss auf den Kindestod nehmen und damit als Confounder wirken könnten. Das könnten z.B. das Geschlecht sein, das Lebensalter, die Anzahl der Geschwister oder bestimmte Vorerkrankungen. Den Einfluss dieser Confounder versuche ich durch das Matching zu kontrollieren, indem ich die Bedingungen, die als Confounder wirken könnten, in Versuchs- und Kontrollgruppe konstant halte. Wer aber garantiert mir, dass ich nicht zu Beginn der Studie mögliche Confounder übersehe, die dann unkontrolliert Einfluss auf meinen Studienendpunkt3 (den Kindestod) nehmen? Ein weiteres Problem besteht in der eindeutigen Zuordnung dessen, was als Fall bezeichnet wird. Das, was unter plötzlichem Kindestod verstanden werden soll, muss eindeutig definiert sein und eine Abgrenzung von anderen frühkindlichen Todesursachen ermöglichen. Für Fälle müssen klare Ein- und Ausschlusskriterien definiert sein. Ein drittes Problem schließlich entsteht durch die rückwirkende Erhebung der Daten, wobei Verzerrungen der Erinnerung selten auszuschließen sind. Werden die Eltern im obigen Beispiel wirklich in der Lage sein, zuverlässig Auskunft über die Schlafpositionen ihrer Kinder zu geben? Dieses Problem stellt sich umso mehr, je länger das zu beobachtende Ereignis zurück liegt. Die Kohortenstudie In einer Kohortenstudie werden zwei (oder mehrere) Personengruppen ausgewählt, die sich in ihrer Exposition gegenüber einer kritischen Variablen unterscheiden. Im Gegensatz zur Fall-KontrollStudie handelt es sich im Regelfall (aber nicht ausschließlich) um ein prospektives Design. Das heißt beide Personengruppen werden über einen zuvor definierten Zeitraum darauf hin beobachtet, ob sich in der exponierten Gruppe häufiger eine Erkrankung oder eine andere interessierende Veränderung zeigt als in der nicht exponierten Gruppe. Die kritische Variable kann z.B. eine Noxe sein, ein Verhalten oder (patho-) physiologischer Zustand. Wie Fall-Kontroll-Studien gehen Kohortenstudien im Regelfall ätiologischen Fragestellungen nach. Eine der bekanntesten Kohortenstudien ist die von Hill, Doll und Peto im Jahre 1951 begonnene Studie an 40 000 britischen Ärzten mit einer Nachbeobachtungszeit von 40 Jahren. Die Ärzte wurden zu Beginn der Studie in folgende vier Kohorten eingeteilt: Nichtraucher, leichte, mittlere und starke Raucher. Als Endpunkte der Studie wurden Gesamtmortalität (alle Todesfälle) und ursachenspezifische Mortalität (Tod infolge einer bestimmten Erkrankung) untersucht. Die Ergebnisse zeigten einen erheblichen Anstieg der durch Lungenkrebs bedingten Todesfälle wie auch der Todesfälle insgesamt bei den Rauchern, wobei eine Dosis-Wirkungs-Beziehung beobachtet wurde: Je mehr geraucht wurde, desto wahrscheinlicher war es, an einem Bronchialkarzinom zu erkranken. Gegenüber Fall-Kontroll-Studien haben Kohortenstudien mit einem prospektiven Design den Vorteil, dass Erinnerungsverfälschungen keine Relevanz besitzen. Wie bei den Fall-KontrollStudien gehört allerdings auch bei diesem Studientyp die Auswahl einer zum Vergleich geeigneten Kontrollgruppe zu den schwierigsten Aufgaben des Forschers. Welche Confounder könnten neben der kritischen Variablen Einfluss auf den interessierenden Endpunkt nehmen? Gelingt es wirklich, alle möglichen Confounder so zu kontrollieren, dass sie in Versuchs- und Kontrollgruppe gleich verteilt sind? Andere Bezeichnungen für „Studienendpunkt“ sind „Erfolgskriterium“ oder „abhängige Variable“. Es handelt sich um die Variable, an welcher der Erfolg einer Intervention gemessen wird. 9 3 10 Um diese Probleme zu demonstrieren, sollen die Ergebnisse von Kohortenstudien zu Alkoholkonsum und Mortalität geschildert werden, nach denen eine J-förmige Beziehung zwischen den beiden Variablen besteht. Das beste Ergebnis (in Bezug auf die Vermeidung eines frühzeitigen Todes) erzielte die Gruppe der moderaten Trinker. Konsequente Abstinenzler hingegen, so scheint es, sterben signifikant häufiger in jungen Jahren. Würden Sie aufgrund dieser Studienergebnisse Abstinenzlern raten, regelmäßig täglich ein Glas Rotwein zu trinken? Könnten diese Ergebnisse möglicherweise durch den nicht kontrollierten Einfluss eines Confounders zu erklären sein? Was könnte das für ein Confounder sein? Mit hoher Wahrscheinlichkeit ist dieses Ergebnis dadurch zu erklären, dass der Gesundheitszustand als möglicher Confounder nicht kontrolliert wurde. Abstinenzler sind häufig nicht aus Überzeugung, sondern aus Notwendigkeit abstinent - dann nämlich, wenn bei ihnen eine (chronische) Krankheit vorliegt, die von ihnen den Alkoholverzicht fordert, gleichzeitig aber das Mortalitäsrisiko erhöht. Weiterhin könnte auch ein Zusammenhang zwischen religiösen Überzeugungen und Mortalität bestehen. Die Trinkgewohnheiten von Moslems oder anderen ethnischen Gruppen könnten in diesem Fall zu einer Verzerrung des Studienendpunktes beigetragen haben.4 Die randomisiert-kontrollierte Studie als klinisches Äquivalent des Laborexperimentes In einer randomisiert-kontrollierten Studie (RCT= randomized controlled trial) werden die Teilnehmer nach dem Zufallsprinzip einer Interventionsgruppe und einer Kontrollgruppe zugeordnet. Entscheidend ist, dass jede Person vor Beginn der Intervention die gleiche Wahrscheinlichkeit besitzt, der einen oder der anderen Gruppe zugewiesen zu werden. Prototyp eines solchen Zufallsverfahrens ist der Münzwurf. Beide Gruppen werden über einen zu Beginn der Studie festgelegten Zeitraum und in Hinblick auf zu Beginn der Studie festgelegte Endpunkte analysiert, wobei angenommen wird, dass die Intervention den Ausprägungsgrad der Endpunkte beeinflusst. Die randomisiert-kontrollierte Studie stellt das klinische Äquivalent des Laborexperimentes dar. Sie erlaubt es, die Ausprägung der Endpunkte ursächlich auf die durchgeführte Intervention zurück zu führen. RCT-Designs erheben den Anspruch, Confounder vollständig kontrollieren zu können. Voraussetzung ist, dass jede mögliche Confounder-Variable zu Beginn der Studie in gleicher Ausprägung in Versuchs- und Kontrollgruppe vorhanden ist. Dieses zu gewährleisten, ist der eigentliche Zweck der Randomisierung. Bei einer genügend großen Anzahl von Probanden ist davon auszugehen, dass die bei dem einzelnen Probanden vorliegenden Kombinationen von Confoundern durch das Ergebnis des Münzwurfs in gleicher Weise den beiden Gruppen zugewiesen werden. In diesem Fall unterscheiden sich die beiden Gruppen ausschließlich durch die Intervention, so dass Unterschiede zwischen den untersuchten Endpunkten eindeutig als Wirkung der Intervention interpretiert werden können.5 4 Trotz dieser Überlegungen gilt die Hypothese von der J-förmigen Beziehung zwischen Alkoholkonsum und Mortalität nicht als widerlegt. 5 Wenn bereits bei der Studienplanung bekannt ist, welche Confounder Einfluss auf die Endpunkte nehmen könnten, wird empfohlen, bei der Randomisierung eine gleiche Verteilung der Confounder auf Versuchsund Kontrollgruppe vorzunehmen. Dieses Verfahren bezeichnet man als „Stratifizierung“. Man schließt dadurch aus, dass die Confounder durch Zufall in Versuchs- und Kontrollgruppe ungleich verteilt sein könnten. Z.B. ist bekannt, dass Patienten mit langer Krankheitsdauer und hohem Ausmaß an Chronifizierung auf jede Art von Therapie schlechter ansprechen als erst vor kurzem erkrankte Patienten. Man würde bei der Studienplanung in diesem Fall darauf achten, dass sich gleich viele Personen mit langer wie mit kurzer Krankheitsdauer in den Studiengruppen befinden. 10 11 Mögliche Confounder sind nicht nur zu Beginn einer Studie bei der Zusammenstellung der Gruppen, sondern auch während der Durchführung der Studie zu kontrollieren. Confounder können zu verschiedenen Zeitpunkten der Durchführung einer Studie wirksam werden und die Studienergebnisse verfälschen. In diesem Fall wird von einem Bias gesprochen. Nach Greenhalgh (2003) sind verschiedene Formen des Bias zu unterscheiden: der Selektionsbias, der PerformanceBias, der Attrition-Bias und der Detektionsbias. Es ist für die Interpretation einer RCT bedeutsam, die möglichen Auswirkungen der unterschiedlichen Formen eines Bias zu erkennen. Mögliche Biasquellen in randomisiert-kontrollierten Studien Zielpopulation der Studie Selektionsbias Performance-Bias Randomisierung auf Interventionsgruppe Randomisierung auf Kontrollgruppe Interventionsbehandlung Kontrollbehandlung Nachbeobachtung Nachbeobachtung Messung der Endpunkte Messung der Endpunkte Attrition-Bias Detektionsbias Der Selektionsbias entsteht, wenn eine Randomisierung nicht wirklich nach dem Zufallsprinzip erfolgt, sondern wenn eine Methode angewendet wird, welche dem Arzt im voraus verrät, welcher Gruppe ein Patient zugeteilt wird. Es hat sich nämlich gezeigt, dass in einem solchen Fall der Arzt dazu neigt, einen Patienten eher in die Studie aufzunehmen, wenn er glaubt, dass dieser eine Verum-Behandlung erhält. Insbesondere könnten Patienten mit einer schwereren Erkrankung unbewusst vom Placeboarm der Studie ferngehalten werden. Zu den nicht akzeptablen Methoden gehören die Randomisierung nach der letzten Ziffer des Gebutsdatums (ungerade Zahlen in Gruppe A, gerade in Gruppe B), nach dem Münzwurf des behandelnden Arztes, eine sequentielle Zuordnung (Patient A in Gruppe 1, Patient B in Gruppe 2, etc.) und nach dem Datum des Klinikbesuchs (alle Patienten der einen Woche in Gruppe 1, alle der zweiten Woche in Gruppe 2, etc.). In all diesen Fällen steigt die Wahrscheinlichkeit einer ungleichen Verteilung von Confounder-Variablen. Das Zufallsprinzip ist hingegen gewährleistet, wenn durchgehend nummerierte verschlossene Umschläge innen eine vom Computer zufällig ausgewählte Zahl für die Gruppenzuweisung enthalten und hierdurch die Patienten nach Einschluss in die Studie einer Gruppe zugewiesen werden. In diesem Fall spricht man von einem „concealed assignment“. Der Performance-Bias bezieht sich auf die Zeit der Behandlung. Idealerweise muss die Intensität der Behandlung der Patienten in Versuchs- und Kontrollgruppe identisch sein mit dem einzigen Unterschied der Art der Intervention. Die Erfahrung zeigt, dass behandelnde Ärzte, wenn sie nicht verblindet hinsichtlich der Gruppenzuordnung sind, den Patienten der Versuchsgruppe mehr Aufmerksamkeit (längere Kontaktzeiten, anderes non-verbales Verhalten, stärkere Zuwendung) schenken als denen der Kontrollgruppe. In einem solchen Fall könnte ein beobachteter Unterschied in der Ausprägung des Endpunktes nicht mehr allein auf die Intervention, sondern er müsste auch auf die unterschiedliche Zuwendung zurück geführt werden. Der Attrition-Bias bezieht sich auf die Zeit der Nachbeobachtung nach der Intervention und hier insbesondere auf die Studienabbrecher (drop outs). Eine hohe Zahl von Studienabbrechern kann es unmöglich machen, aus den nur bei den verbliebenen Patienten beobachteten Endpunkten auf die 11 12 Wirksamkeit der Intervention zu schließen. Es hat sich nämlich gezeigt, dass Studienabbrecher sich von den Nicht-Abbrechern in deren Ausprägung des Endpunktes der Studie unterscheiden. Abbrecher sind z.B. weniger compliant in Bezug auf die Einhaltung der Intervention (z.B. die Einnahme der Medikamente oder die Durchführung einer Übungsbehandlung) als Nicht-Abbrecher. Sie klagen häufiger über unerwünschte Wirkungen der Intervention, versäumen häufiger Kontrolltermine und sind unzufriedener. Wird jeder Teilnehmer, der eine Studie vorzeitig beendet, bei der Auswertung der Ergebnisse einfach ignoriert, führt dies zu einer systematischen Verzerrung der Ergebnisse - fast immer zugunsten der Intervention. Aus diesem Grund gelten Studien mit einer geringen Nachbeobachtungsrate (z.B. < 70 %) oder mit deutlich unterschiedlichen Nachbeobachtungsraten in Versuchs- und Kontrollgruppe nicht als beweiskräftig. Um den Attrition-Bias zu kontrollieren, gehört es inzwischen zum Standard, die Ergebnisse von Vergleichsstudien auf einer Intention-to-treat Basis zu analysieren. Hierbei werden die Daten sämtlicher Patienten, unabhängig davon, ob sie die Studie beendet haben oder nicht, in die Auswertung einbezogen. Da von den Abbrechern zum Zeitpunkt der Nachbeobachtung (Follow-up) keine Daten mehr vorliegen, werden häufig Daten dieser Personen aus vorhergehenden Messungen verwendet. Der härteste Test besteht darin, anzunehmen, dass alle Abbrecher Behandlungsmisserfolge sind. In diesem Fall wäre es am sinnvollsten, den bei Eingang in der Studie gemessenen Wert des Endpunkts in der Follow-up-Analyse zu verwenden (initial value carried forward). Wenn selbst unter diesen Bedingungen sich weiterhin eine Überlegenheit der Interventionsgruppe über die Kontrollgruppe zeigt, kann der Gültigkeit der erhaltenen Ergebnisse Vertrauen geschenkt werden. Der Detektionsbias bezieht sich auf mögliche systematische Unterschiede in der Bewertung der Endpunkte bei Personen der Versuchsgruppe und der Kontrollgruppe. Wenn Ärzte, die den Behandlungserfolg zu beurteilen haben, wissen, welche Personen die Verum- und welche die Kontrollintervention bekommen haben, so lassen sie ihr Urteil durch dieses Wissen (unbewusst) beeinflussen. Von Sackett et al. (1991) wurde der Beweis erbracht, dass die Beurteilung klinischer Symptome und die Auswertung diagnostischer Tests (z.B. eines Röntgenbildes oder eines EKG) auch bei erfahrenen Ärzten alles andere als objektiv ist und durch Erwartungen der Ärzte über das Ergebnis bestimmt wird. Wenn ein Arzt z.B. weiß, dass ein Patient in eine Gruppe randomisiert wurde, die blutdrucksenkende Medikamente erhielt, könnte er geneigt sein, die Blutdruckmessung zu wiederholen, wenn die erste Messung unerwartet hoch ausgefallen ist. Möglicherweise ist nun die zweite Messung niedriger und der Patient wird nicht mehr als Fall (Hypertoniker) entdeckt (detected). Der Detektionsbias ist ebenso wie der Performance-Bias durch eine Verblindung zu kontrollieren. Der Arzt, der die Follow-up-Untersuchung durchführt, darf nicht über die Gruppenzuordnung des Patienten informiert sein. Das Bundesgesundheitsamt fordert als Wirksamkeitsnachweis vor der Zulassung von Medikamenten die Durchführung einer RCT. Hierbei wird der Versuchsgruppe ein Verum-Präparat verabreicht, der Kontrollgruppe ein Placebo. Da bekannt ist, dass Erwartungen über die Wirksamkeit einer Intervention sowohl auf Seiten des Arztes als auch des Patienten die tatsächliche Wirksamkeit beeinflussen (und somit Confounder sind, vgl. Rosenthal-Effekt), darf weder Arzt noch Patient wissen, welcher Intervention ein Patient zugewiesen wurde. Ist diese Bedingung realisiert, spricht man von einer Doppel-Blind-Studie. Das systematische Review und die Meta-Analyse Die bisher geschilderte Methodik bezieht sich ausschließlich auf Primär- oder Originalarbeiten. Systematische Reviews und Meta-Analysen als Sekundärarbeiten haben das Ziel, Primärstudien zu 12 13 gleichen Fragestellungen zusammen zu fassen. Sie bedienen sich dabei einer explizit in der jeweiligen Publikation aufgeführten und reproduzierbaren Methodik, die den Vergleich verschiedener Originalarbeiten ermöglicht. Eine Meta-Analyse geht insofern über ein sytematisches Review der Literatur hinaus als hier eine statistische Synthese der nummerischen Ergebnisse mehrerer Studien zur gleichen Thematik vorgenommen wird. Die Wirksamkeit einer Intervention kann mit einer statistischen Maßzahl beschrieben werden, der, da sie sich auf die Ergebnisse mehrerer Studien bezieht, eine größere Sicherheit zukommt als der jeder einzelnen Studie. Dies ist der Grund, warum Meta-Analysen auf der höchsten Stufe der Evidenzleiter angesiedelt sind. Für den in der Versorgung tätigen Arzt haben systematische Reviews und Meta-Analysen verschiedene Vorteile im Vergleich zu Originalarbeiten: 1. Ärzte können die große Informationsflut anhand von systematischen Reviews besser als durch das Studium von vielen Einzelarbeiten bewältigen. 2. Festgelegte Anleitungen für die Reviewer zur Auswahl der analysierten Originalarbeiten verringern systematische Fehler in Bezug auf den Einschluss und Ausschluss von Studien. Die Anleitungen beziehen sich z.B. explizit auf die Quellen, die berücksichtigt werden sollen (z.B. nicht nur in medizinischen Datenbanken enthaltene Literatur, sondern auch „graue“ Literatur zur Kontrolle des Publikationsbias6). 3. Die Resultate verschiedener Studien können miteinander verglichen werden, und auf diese Weise werden Aussagen über die Konsistenz oder Heterogenität der Ergebnisse möglich. Die Schlussfolgerungen sind daher zuverlässiger und genauer als bei Einzelstudien. 4. Quantitative systematische Reviews (Meta-Analysen) erhöhen die Präzision der Gesamtergebnisse. Die Qualität eines systematischen Reviews oder einer Meta-Analyse hängt davon ab, ob die zuvor in diesem Text beschriebenen Kriterien zur Beurteilung der methodischen Qualität von Originalarbeiten rigoros angewendet werden. Die Arbeit, die der sich mit der Originalliteratur auseinander setzende Arzt in die Beurteilung der methodischen Güte der Einzelarbeiten investieren muss, wird ihm von den Reviewern bereits abgenommen. So findet sich in den Reviews neben der Auflistung der einbezogenen Studien auch eine Beurteilung der methodischen Qualität der Studien. Die in den Studien erzielten Ergebnisse werden anschließend auf dem Hintergrund der Güte der Methodik bewertet. 5. Fragen zur Beurteilung der methodischen Qualität von Studien Entscheiden Sie zunächst, ob es sich um eine Primärstudie (Originalarbeit) oder um eine Sekundärstudie (systematisches Review, Meta-Analyse) handelt. Bei Sekundärstudien stellen Sie folgende Fragen: 1. Wie haben die Autoren sicher gestellt, dass tatsächlich alle relevanten Originalarbeiten in die Untersuchung aufgenommen wurden? Welche Quellen wurden außer medizinischen Datenbanken berücksichtigt? 2. Wie wurde die methodische Qualität der Originalarbeiten beurteilt, und wurden die Studien angemessen hinsichtlich ihrer methodischen Qualität gewichtet? 3. Wurden die erzielten Ergebnisse angemessen interpretiert? Können Sie die Schlussfolgerungen nachvollziehen? 6 Der Publikationsbias besteht darin, dass nachgewiesenermaßen Studien, die erwartungswidrige Ergebnisse zeigen, seltener publiziert werden als solche mit erwartungskonformen Ergebnissen. Diese Tatsache führt dazu, dass die Wirksamkeit von Interventionen überschätzt wird, wenn nur auf publizierte Studien zurück gegriffen wird. 13 14 4. Bei Meta-Analysen sollte auch die eingesetzte statistische Methodik beurteilt werden. Hierfür sind allerdings Spezialkenntnisse erforderlich. Handelt es sich um eine Originalarbeit, konzentrieren Sie sich zunächst auf das Design, ordnen Sie dieses einem der o.g. Studien-Typen zu und fragen Sie sich, ob das Design der Fragestellung angemessen ist. Um welchen Forschungsbereich geht es? Ursachenstudien verwenden im Regelfall ein Fall-Kontroll-Design oder ein Kohorten-Design. Therapiestudien verwenden ein randomisiert-kontrolliertes Design. Bei einem Querschnitts-Design stellen Sie die folgenden Fragen: 1. Ist die gewählte Stichprobe geeignet, die vermutete Assoziation zwischen zwei Variablen zu überprüfen? Oder gibt es Hinweise darauf, dass beobachtete oder nicht auffindbare Assoziationen sich als Stichproben abhängig erweisen könnten? 2. Wird in der Arbeit diskutiert, durch welche Drittvariablen (Confounder) die gefundene oder nicht gefundene Assoziation erklärt werden könnte? 3. In welcher Weise werden gefundene Assoziationen interpretiert? Werden kausale Interpretationen ausgeschlossen? Bei einem Fall-Kontroll-Design stellen Sie die folgenden Fragen: 1. Hat ein Matching statt gefunden? 2. Welche Variablen wurden in das Matching einbezogen? Sind alle möglichen Counfounder kontrolliert worden? Welche nicht kontrollierten Confounder könnten die Ergebnisse beeinflusst haben? Wird hierauf in der Diskussion der Ergebnisse eingegangen? 3. Sind die Kriterien für die Definition eines Falles deutlich durch Ein- und Ausschlusskriterien beschrieben worden? Wurde sicher gestellt, dass diese Kriterien befolgt wurden? 4. Ist die retrospektive Erhebung der Daten zuverlässig? Wie wurde kontrolliert, ob z.B. Erinnerungsverfälschungen die Datenerhebung beeinflusst haben? Bei einem Kohorten-Design stellen Sie folgende Fragen: 1. Welche Begründung geben die Autoren für die Wahl der Vergleichsgruppe? 2. Welche möglichen Confounder berücksichtigen die Autoren? 3. Gibt es möglicherweise noch weitere, nicht kontrollierte Confounder? Gehen die Autoren in der Diskussion hierauf ein? 4. Welche Bias-Quellen, die im Zusammenhang mit randomisiert-kontrollierten Studien besprochen worden sind, wurden von den Autoren kontrolliert? Bei einem randomisiert-kontrollierten Design stellen Sie die folgenden Fragen: 1. Sind die Ein- und Ausschlusskriterien deutlich dargestellt worden? Ist damit klar, was als „Fall“ zu definieren ist, um den es in dieser Studie geht? 2. Nach welcher Methode erfolgte die Randomisierung? Wird hierdurch sicher gestellt, dass die Gruppenzuweisung ausschließlich nach Zufallsprinzipien erfolgt, oder konnte jemand möglicherweise Einfluss auf die Zuweisung nehmen? 3. War die Person, welche die Probanden einschloss, zu diesem Zeitpunkt blind gegenüber der Gruppenzuweisung der Probanden? Oder ist ein Selektionsbias nicht auszuschließen? 4. Wird über mögliche Confounder-Variablen berichtet? Falls ja, wie wird mit diesen in der Studie umgegangen? 5. Haben die Probanden beider Gruppen außer der unterschiedlichen Intervention ansonsten eine völlig gleiche Behandlung erfahren? War sicher gestellt, dass das Wissen um die Gruppenzuweisung nicht Einfluss nehmen konnte auf die Behandlung selbst? Ist somit der Performance-Bias kontrolliert worden? 14 15 6. Wie viele drop-outs gab es in Versuchs- und Kontrollgruppe? Gibt es Aussagen über die Ursachen des drop-outs? 7. Ist die Anzahl der drop-outs akzeptabel? Wie wurde mit der Tatsache von drop-outs umgegangen? Gab es z.B. eine „Intention-to-treat“-Analyse? 8. Wie wird der Erfolg der Intervention gemessen? Was ist der primäre Endpunkt der Studie? 9. Ist sicher gestellt, dass der Erfolg der Intervention objektiv überprüft wurde? Wie weit sind die Endpunkte abhängig von den Meinungen und Erwartungen derjenigen, welche die Endpunkte gemessen haben? Konnte deren Erwartungshaltung in das Ergebnis eingehen? Oder waren die Untersucher blind gegenüber der Gruppenzuweisung der Probanden? Abschließende Bemerkung Evidenz Basierte Medizin bezieht sich auf die jeweils beste verfügbare Evidenz zur Lösung eines durch einen Patienten präsentierten Problems. Auch wenn randomisiert-kontrollierten Studien die größte Beweiskraft zugeschrieben wird, sehen wir uns in der Versorgungspraxis jedoch häufig mit dem Problem konfrontiert, dass Studien mit hohem methodischen Niveau als Informationsquellen nicht zur Verfügung stehen. Trotzdem muss für und mit dem Patienten eine Entscheidung getroffen werden. Auch in diesem Fall ist nach der besten Evidenz zu suchen. Sie kann sich aus der Konsultation des nächsten erreichbaren Experten ergeben oder, wenn auch dieses nicht möglich ist, auf die eigene klinische Erfahrung stützen. Auch in diesen Fällen handelt der Arzt Evidenz basiert, vorausgesetzt er hat zuvor vergeblich nach methodisch höherwertigen Informationsquellen gesucht. Empfohlene Literatur Zur Einführung geeignet: Greenhalgh, T. (2003). Einführung in die Evidence-based Medicine. Kritische Beurteilung klinischer Studien als Basis einer rationalen Medizin. Verlag Hans Huber, Bern. Sackett, D.L., Strauss, S.E., Richardson, W.S., Rosenberg, W., Haynes, R.B. (2000). EvidenceBased Medicine - How to practice and teach EBM. Churchill Livingstone, Edinburgh. Weitere zitierte Literatur: Sackett, D.L., Haynes, R.B., Guyatt, G.H., et al. (1991). Clinical epidemiology - a basic science for clinical medicine. Little Brown, London. Sackett, D.L., Rosenberg, W., Gray, J.A. et al. (1996). Evidence based medicine: What it is and what it isn’t. British Medical Journal, 312, 71-72. 15