4330 a-t im Internet: www.arznei-telegramm.de Glossar Die Information für Ärzte und Apotheker Neutral, unabhängig und anzeigenfrei arznei-telegramm Stand Februar 2014 Fakten und Vergleiche für die rationale Therapie absolute Risikoreduktion Die absolute Risikoreduktion (ARR) gibt die Differenz der Ereignisraten von zwei Vergleichsgruppen an. Sie ist das wichtigste Maß für den Nutzen (oder Schaden) einer Behandlung in klinischen Interventionsstudien. Sie wird bei kontrollierten Studien aus der Differenz zwischen der Ereignisrate unter Plazebo (bzw. einer Vergleichsintervention) und der Ereignisrate unter der geprüften Behandlung errechnet: Berechnung: Verdeutlicht am Beispiel der Gesamtsterblichkeit in der 4S-Studie mit Simvastatin: Mortalität unter Plazebo (= Kontrollgruppe) 11,5%, in der Prüfgruppe mit Simvastatin 8,2%, Differenz (= absolute Risikoreduktion) 3,3%. Der Kehrwert der ARR (1/ARR) ergibt die Number needed to treat. Ein weiteres Beispiel: In einer plazebokontrollierten Studie nimmt die eine Hälfte der Patienten das orale Antikoagulans Phenprocoumon ein, die andere Hälfte der Patienten ein Scheinmedikament (Plazebogruppe). Überprüft wird, wie häufig in beiden Gruppen Thrombosen auftreten. Nach einem festgelegten Beobachtungszeitraum von einem Jahr sind in der Plazebogruppe bei 5% der Patienten Thrombosen aufgetreten, bei den antikoagulierten Patienten nur bei 2%. Die absolute Risikoreduktion berechnet sich aus der Differenz zwischen der Ereignisrate in der Plazebogruppe und der Ereignisrate in der Verumgruppe, also 5% minus 2% = 3%. Für den Fall einer Verschlechterung der Prognose durch eine Intervention wird manchmal von der „absoluten Risikoerhöhung” (Absolute Risk Increase) = ARI gesprochen, die nach dem gleichen Prinzip errechnet wird. Die absolute Risikoreduktion eignet sich im Gegensatz zur relativen Risikoreduktion (RRR) zur realistischen Einschätzung der Auswirkung einer Intervention. Aus ihr kann direkt die Number needed to treat (NNT) berechnet werden. Äquivalenzstudie Äquivalenzstudien untersuchen, ob sich der Nutzen therapeutischer Maßnahmen so wenig unterscheidet, dass dieser Unterschied ohne klinische Bedeutung bleibt. Ein Bereich, für den Gleichwertigkeit angenommen wird, muss hierfür prospektiv definiert werden. Die Interventionen gelten als gleichwertig, wenn der beobachtete Unterschied, einschließlich statistischer Unsicherheit, innerhalb dieses Bereichs liegt. ausschließen. Je umfangreicher diese Kriterien sind, desto problematischer ist die Übertragbarkeit („externe Validität”) der gewonnenen Resultate: Das Nutzen-Schaden-Verhältnis kann sich in der Praxis deutlich verschieben. So treten mitunter schwere Störwirkungen neuer Arzneimittel erst nach der Zulassung auf, wenn z.B. Patienten das Mittel einnehmen, die aufgrund ihrer Begleiterkrankungen in den Zulassungsstudien nicht repräsentiert sind. Bias Bias („Verzerrung”) ist ein systematischer Fehler in klinischen Studien, der dazu führt, dass die erhaltenen Ergebnisse von den tatsächlichen Werten abweichen können. Es handelt sich also nicht um eine durch allgemeine Fehler verursachte zufällige Abweichung, sondern um eine systematische Überbzw. Unterschätzung des Ergebnisses, verursacht durch Fehler im Design oder in der Durchführung der Studie. Durch Bias verfälschte Ergebnisse lassen sich nicht mittels biometrischer Methoden korrigieren. Studien mit einer geringen Gefahr für einen Bias gelten als „intern valide” (Validität), also vertrauenswürdig. Beispiel: Standardisierte Verfahren bei der Studiendurchführung dienen dazu, die Gefahr für Bias zu verringern. Bei Therapiestudien gilt die Randomisation, also die streng zufällige Zuteilung der Patienten, als eine der wichtigsten Maßnahmen den so genannten Selektionsbias zu verhindern. Die willkürliche Zuordnung „geeigneter” Studienteilnehmer in bestimmte Behandlungsgruppen mit dem Ziel einer Ergebnisschönung wird verhindert oder zumindest erschwert. Bei Metaanalysen ist eine ausgiebige Literaturrecherche erforderlich, um nach Möglichkeit alle vorhandenen Daten – auch unpublizierte, aber möglicherweise relevante Studien zu erfassen und in die Analyse mit einzuschließen. Hierdurch soll der Einfluss des Publikationsbias, also der verzerrende Effekt durch bevorzugtes Veröffentlichen positiver Studienergebnisse verringert werden. Eine klinische Studie ohne jeden Bias gibt es nicht. Es gilt bei der Beurteilung zu bewerten, ob die Methodik geeignet ist, Bias zu minimieren und dadurch die interne Validität der Studie zu stützen. Confounder ARR absolute Risikoreduktion Ausschlusskriterien In klinischen Studien werden im Prüfplan Eigenschaften (z.B. Alter, Begleiterkrankungen und Begleitmedikation) festgelegt, die potenzielle Probanden von der Studienteilnahme Confounder bezeichnet einen Störfaktor in Studien, der zu einer Verzerrung der Ergebnisse führt, da er sowohl mit der geprüften Exposition als auch mit dem Zielkriterium assoziiert ist. So kann z.B. in Beobachtungsstudien Alkohol scheinbar das Risiko für Lungenkrebs erhöhen, wenn nicht berücksichtigt wird, dass Rauchen (Confounder) sowohl mit exzessivem Alkoholgenuss als auch mit Lungenkrebs einhergeht. Die verblindete, zufällige Zuteilung der Patienten in randomisierten © arznei-telegramm® 2014 ® 2 arznei-telegramm®-Glossar kontrollierten Studien soll dafür sorgen, dass – zum Teil unbekannte – Störfaktoren auf die verschiedenen Gruppen insgesamt gleich verteilt werden und somit keinen Einfluss auf das Ergebnis haben. Interventionen benötigt, als wenn diese in Einzelstudien untersucht werden. Hazard Ratio Confounding by indication Die Ermittlung von Behandlungseffekten in Beobachtungsstudien ist problematisch, da die Symptome und prognostischen Faktoren, die in der Praxis die Therapieentscheidungen beeinflussen, auch auf die Ergebnisse Einfluss haben. So wurde in epidemiologischen Studien ein Zusammenhang zwischen der Einnahme von H2-Blockern und Magenkarzinom vorgetäuscht, da die von einem zunächst nicht erkannten Magenkarzinom verursachten Beschwerden zu häufigerer Einnahme der Mittel führten. Design, faktorielles faktorielles Design Hazard bestimmt die Wahrscheinlichkeit in einem Kollektiv für das Auftreten eines Ereignisses (z.B. Erkrankung oder Heilung) über einen bestimmten Zeitraum. Die Hazard Ratio (HR) gibt das Verhältnis zweier Hazards an. Ist die Hazard Ratio größer oder kleiner als 1, bedeutet dies, dass die Wahrscheinlichkeit für das Ereignis in der beobachteten Gruppe über den gewählten Zeitraum größer bzw. kleiner ist als in der Vergleichsgruppe. Die statistische Signifikanz wird mithilfe von Konfidenzintervallen geprüft, die vollständig ober- oder unterhalb der 1 liegen müssen. Hazard ratios werden aus Überlebenszeitkurven errechnet. In sie geht die Zeit ein, die Patienten unter Beobachtung standen. Heterogenität Doppelblindstudie In einer Doppelblindstudie wissen weder die Patienten/Probanden noch die Behandelnden, welche Intervention (Verum, Plazebo) der jeweilige Patient/Proband erhält. Weiteres siehe Verblindung. Endpunkt (primärer, sekundärer) In der Planungsphase vor Beginn einer Studie müssen (mindestens) ein primärer (erstrangiger) und gegebenenfalls sekundäre (zweitrangige) Endpunkte festgelegt werden. Diese sollen relevant im Sinne der Fragestellung sein. In Phase-IIIStudien sollten klinische Endpunkte (Morbidität, Mortalität, Lebensqualität) dabei Vorrang vor Laborparametern haben. Verbindliche Aussagen lassen sich aus einer Studie in erster Linie aus den Ergebnissen zum primären Endpunkt ableiten, da das Design der Untersuchung auf diesen Endpunkt angelegt wird (Fallzahlkalkulation, Randomisierungsverfahren usw.). Ergebnisse aus sekundären Endpunkten sind mit größerer Wahrscheinlichkeit zufällig und dienen daher häufig nur der Generierung von Hypothesen, die ggf. in entsprechend angelegten weiteren Studien bestätigt werden müssen. Unterscheiden sich die Einzelergebnisse von Studien, die gemeinsam in einer Metaanalyse ausgewertet werden, deutlich in ihren Effekten voneinander, spricht man von Heterogenität. Heterogenität kann durch Unterschiede der Patientenpopulationen, unterschiedliche Begleitinterventionen, unterschiedlich gemessene Endpunkte oder qualitative Unterschiede der Studien bedingt sein. Es ist grundsätzlich problematisch, heterogene Studien gemeinsam in einer Metaanalyse zusammenzuführen. Dies muss diskutiert und klinisch begründet werden. HR Hazard Ratio Intention-to-treat-Analyse Während im deutschen Sprachraum der Begriff Evidenz „Augenfälliges”, „auf der Hand Liegendes” beschreibt, wird die Bezeichnung evidenzbasierte Medizin aus dem Englischen abgeleitet (evidence based medicine). Hier ist mit Evidenz Nachweis oder Beweis gemeint und bezieht sich in erster Linie auf Belege, die aus klinischen Studien abgeleitet werden können. Die Intention-to-treat-Analyse (ITT) ist das für Überlegenheitsstudien geforderte Analyseverfahren, bei dem alle Teilnehmer in ihrer Gruppe ausgewertet werden und eingehen, unabhängig von Protokollverletzungen, Compliance oder verfrühtem Abbruch der Studienteilnahme. Auch bei versehentlichem oder beabsichtigtem Therapiewechsel (z.B.: ein Patient soll Plazebo erhalten, nimmt jedoch tatsächlich Verum ein) erfolgt die Auswertung in der ursprünglich zugeteilten Behandlungsgruppe. ITT ergibt eine realistische, konservative Einschätzung des Behandlungseffektes und spiegelt die therapeutische Realität im praktischen Alltag mit suboptimaler Compliance und Verordnungs- oder Einnahmefehlern wider. Zudem wird eine Verzerrung der Ergebnisse verhindert, die z.B. durch ungleiche Abbruchraten in den verschiedenen Behandlungsgruppen entstehen kann. Im Gegensatz zur Intention-to-treat-Analyse gehen in die Per-Protokoll-Analyse nur diejenigen Probanden ein, die vollständig nach dem Prüfplan behandelt wurden. faktorielles Design Inzidenz In randomisierten Studien mit faktoriellem Design werden zwei oder mehr Interventionen gleichzeitig gegenüber einer Kontrolle (z.B. Plazebo) geprüft. Beispiel: In einer Studie mit zwei gegenüber Plazebo (P) geprüften Interventionen (A, B) erhalten die in vier Gruppen randomisierten Probanden: 1. A + P, 2. B + P, 3. A + B, 4. nur P. Unter der Voraussetzung, dass keine Interaktionen zwischen A + B bestehen, die bei Kombination zu überadditiver oder abgeschwächter Wirkung führen, kann ein paarweiser Vergleich durchgeführt werden (für A: Gruppen 1 + 3 versus 2 + 4; für B: Gruppen 2 + 3 versus 1 + 4). Der Vorteil besteht darin, dass man weniger Probanden für die Prüfung mehrerer Anzahl der innerhalb eines definierten Zeitraums (z.B. Studiendauer) aufgetretenen Krankheitsfälle innerhalb einer Population (z.B. Studienteilnehmer). ITT Intention-to-treat-Analyse evidenzbasierte Medizin Kohortenstudie Beobachtungsstudie, in der der Einfluss einer Intervention oder einer Exposition zum Beispiel auf das Auftreten einer Erkrankung oder die Sterblichkeit in einer Personengruppe (Kohorte) gegen Nichtexposition überprüft wird. © arznei-telegramm® 2014 3 arznei-telegramm®-Glossar Aufgrund der fehlenden Randomisierung können Einflussfaktoren, die in den Vergleichsgruppen ungleich verteilt sind, das Ergebnis verzerren. Nicht alle Störgrößen sind bekannt, sodass eine vollständige Adjustierung nicht möglich ist. Daher sind Kohortenstudien bei der Beurteilung therapeutischer Interventionen weniger valide als randomisierte kontrollierte Studien. Konfidenzintervall Das Konfidenzintervall (Vertrauensbereich) gibt den Bereich an, in dem der wahre Wert einer Messung (z.B. Therapieeffekt) mit einer dazu angegebenen Wahrscheinlichkeit (oft 95% oder 99%) angenommen wird. Die Breite des Konfidenzintervalls hängt unter anderem von der Anzahl der eingeschlossenen Patienten und der Ereignisrate ab. Es lässt auf einen Blick erkennen, ob ein Ergebnis statistisch signifikant ist (Beispiel: Relatives Risiko: 0,85; 95% Konfidenzintervall: 0,7-0,9; statistisch signifikant, da das gesamte Intervall unterhalb der 1 [„line of no effect”] liegt). Es ist darüber hinaus ein Maß für die Genauigkeit des Ergebnisses: Je schmaler das Intervall ist, umso exakter wird die Schätzung. Metaanalyse Statistisches Verfahren, oft Bestandteil systematischer Übersichten, mit dem Ergebnisse ähnlicher Studien zu einer Fragestellung gemeinsam ausgewertet werden. Ziel ist, durch die gegenüber Einzelstudien höheren Patientenzahlen zu zusammenfassenden („gepoolten”) und präziseren Ergebnissen zu kommen. Vorteil ist bei guter Methodik die systematische Auswertung der Gesamtdatenlage. Mögliche Nachteile sind die Vermengung heterogener Daten (Heterogenität), Nichtberücksichtigung unveröffentlichter Negativdaten sowie die Aufnahme schlechter Studien, die durch die Berücksichtigung in der Metaanalyse zu anscheinend hochgradiger Evidenz aufgewertet werden. Nichtunterlegenheitsstudie Mit einer Nichtunterlegenheitsstudie soll gezeigt werden, dass eine Intervention gegenüber einem etablierten Standard „nicht unterlegen” ist. Nichtunterlegenheit wird angenommen, wenn die neue Intervention allenfalls in gewissen, vor Studienbeginn definierten Grenzen schlechter abschneidet als der Standard. Liegen der Punktschätzer und das 95%ige Konfidenzintervall des Effekts der Intervention innerhalb vorgegebener Grenzen, gilt das Kriterium für Nichtunterlegenheit als erfüllt. In der Praxis werden die tolerierten Grenzen jedoch zum Teil so weit gewählt, dass trotz klinisch relevanter Nachteile formal „Nichtunterlegenheit” ermittelt wird. Nichtunterlegenheitsstudien werden – ethisch oft fragwürdig – auch als Zulassungsstudien durchgeführt statt der dringend gebotenen Überlegenheitsstudien, um „Me-too”-Präparate ohne relevante Vorteile zu vermarkten. NNT Number needed to treat Nullhypothese p-Wert verhindern oder ein positives Ereignis (z.B. Heilung) zu bewirken. Sie wird als Kehrwert der absoluten Risikoreduktion (ARR) errechnet: NNT = 1/ARR. Analog lässt sich bei schädigender Intervention eine Number needed to harm (NNH) errechnen. Odds Odds („Chance”) ist die Häufigkeit eines Ereignisses dividiert durch die Häufigkeit der dazu komplementären Ereignisse. Beispiel: Die Odds, eine 6 zu würfeln, beträgt 1/5, also 0,2. Sie unterscheidet sich von der Wahrscheinlichkeit (Anzahl von Ereignissen dividiert durch die Gesamtzahl der möglichen Ereignisse). Diese beträgt in diesem Fall 1/6, also 0,167. Je unwahrscheinlicher ein Ereignis ist, umso mehr nähert sich aber die Odds der Wahrscheinlichkeit an (Bsp. "Lotterie": 1 Los von 1.000.000 gewinnt. Wahrscheinlichkeit = 1/1.000.000; Odds = 1/999.999). Odds Ratio Die Odds Ratio (OR) für das Auftreten eines Ereignisses erhält man durch Division der beiden Odds zweier Vergleichsgruppen. Odds Ratios sind die üblicherweise angewandten Effektmaße in Fallkontrollstudien. Analog zu Odds und Wahrscheinlichkeit nähert sich bei seltenen Ereignissen die Odds Ratio dem relativen Risiko an. OR Odds Ratio Per-Protokoll-Analyse Die Per-Protokoll-Analyse ist eine Auswertungsmethode für randomisierte klinische Studien, bei der – im Gegensatz zur Intention-to-treat-Analyse – nur die Probanden in die Analyse eingehen, die vollständig gemäß Prüfplan behandelt wurden. Das Ergebnis einer solchen Analyse beschreibt den Effekt einer Intervention unter optimalen Bedingungen. Es spiegelt jedoch nicht den realen Nutzen der Maßnahme wider, da zum Beispiel Studienabbrecher aufgrund von Störwirkungen nicht in die Analyse eingehen und somit das Prinzip der zufälligen Zuteilung (Randomisierung) gebrochen wird. Die Folge kann eine Verzerrung (Bias) der Resultate zu Gunsten der Intervention sein. Power Die Trennschärfe oder Power einer Interventionsstudie bezeichnet ihr Vermögen, einen existierenden Unterschied zwischen den Versuchsarmen der Untersuchung zu erkennen. Wird bei einer Power von 80% kein statistisch signifikanter Vorteil für den Interventions- oder den Kontrollarm errechnet, besteht eine 20%ige Wahrscheinlichkeit, dass ein Unterschied übersehen wird. Der so genannte „Betafehler” oder Fehler 2. Art beträgt entsprechend 20%. Die Power hängt – nach Festlegung des erwarteten Unterschieds – von der Zahl der eingeschlossenen Patienten ab, die daher vor Beginn der Studie in einer Fallzahlplanung berechnet werden muss. Number needed to treat Prävalenz Die Number needed to treat (NNT) ist ein in Vergleichsstudien ermitteltes Effektmaß für den Nutzen von Interventionen. Die NNT gibt die Zahl der Patienten an, die behandelt werden müssen, um im Beobachtungszeitraum im Vergleich zur Kontrollbehandlung ein negatives Ereignis (z.B. Tod) zu Anteil Erkrankter in einer definierten Population zu einem festgelegten Zeitpunkt. primärer Endpunkt Endpunkt © arznei-telegramm® 2014 4 arznei-telegramm®-Glossar Publikationsbias Interventionsstudien, die keinen Nutzen der geprüften Intervention nachweisen („Negativstudien”), werden seltener und dann oft später publiziert als Positivstudien. Die Folge ist eine Verschiebung der veröffentlichten (nachprüfbaren) Daten ins Positive. In Metaanalysen kann ein Publikationsbias das Endergebnis verzerren. Es existieren statistische Methoden zur Ermittlung eines Publikationsbias, die jedoch eine begrenzte Power haben und versagen können, insbesondere wenn nur wenige Studien zu einer Fragestellung vorliegen. Punktschätzer In Studien werden Ergebnisse in der Regel mit einer einzelnen Zahl angegeben, zum Beispiel der absoluten oder relativen Risikoreduktion (ARR oder RRR). Diese Zahl ist jedoch, da aus einer Stichprobe (= Studienpopulation) erhoben, lediglich eine Abschätzung (Punktschätzer) für den „wahren” Wert, dem man sich durch die statistische Auswertung der Studie nähert. Wie präzise dieser Punktschätzer den „wahren” Wert widerspiegelt, lässt sich am Konfidenzintervall („Vertrauensbereich”; oft ausgedrückt als 95%iges Intervall) ablesen, das die Grenzwerte angibt, zwischen denen der „wahre” Effekt mit statistisch ausreichender Sicherheit liegt. Je schmaler das Konfidenzintervall, umso exakter ist der Punktschätzer einzustufen. p-Wert Der p-Wert einer Studie gibt die Wahrscheinlichkeit an, mit der ein gefundener Unterschied zwischen den Vergleichsgruppen zufällig ist. Der in der Regel angewandte Grenzwert von p < 0,05, ab welchem die Nullhypothese („kein Unterschied”) abgelehnt wird („Signifikanzniveau”), beruht auf einer Konvention, nach der eine unter 5%ige Wahrscheinlichkeit für fälschlicherweise angenommene Unterschiede ausreichend gering erscheint. p-Werte beschreiben nur die statistische Signifikanz z.B. eines Therapieeffektes, ermöglichen jedoch keine Aussage über die Bedeutung des therapeutischen Zusatznutzens. Dieser muss nach klinischem Sachverstand beurteilt werden. p-Werte erlauben zudem keine Aussage über die Präzision des ermittelten Unterschieds. Hierfür ist die Errechnung von Konfidenzintervallen notwendig. randomisierte kontrollierte Studie Prospektive Studie zur Ermittlung eines Kausalzusammenhanges zwischen einer Intervention und einem Effekt mit mindestens zwei Vergleichsgruppen, denen die Teilnehmer randomisiert, d.h. per Zufallsprinzip, zugeteilt werden. Die Zufallsverteilung soll gewährleisten, dass sich bekannte und unbekannte Faktoren, die das interessierende Ergebnis beeinflussen können, insgesamt gleichmäßig auf die Gruppen verteilen. Wenn sich – bei Einhalten weiterer methodischer Standards – zu Studienschluss ein Unterschied zwischen den Gruppen ergibt, kann dieser dann der Intervention zugerechnet werden. Randomisierte kontrollierte Studien (RCT) eignen sich am besten dazu, einen Therapieeffekt zu überprüfen. Die Gefahr von Bias („Verzerrungen”) ist bei dieser Studienform besonders gering. Durch die zufällige Zuteilung der Patienten haben diese Studien „experimentellen” Charakter. Wichtige Kriterien bei der Beurteilung: Je mehr der nachfolgend genannten Kriterien aus den Studien nicht hervorgehen, desto schlechter ist die Qualität der Studie und desto weniger zuverlässig sind die Ergebnisse. Vorab festgelegtes und idealerweise nachvollziehbares (veröffentlichtes) Protokoll wird eingehalten. Ein- und Ausschlusskriterien, nach denen die Studienteilnehmer ausgewählt werden, sind beschrieben. Für die verdeckte zufällige Zuteilung (concealment of allocation) der Teilnehmer zu den Behandlungsgruppen wird ein geeignetes Verfahren verwendet und dieses beschrieben. Studienärzte und Patienten sind verblindet, sodass beide über die zugeteilte Behandlungsform nicht informiert sind (Doppelblindstudie). Die Nachbeobachtung ist dokumentiert und der Patientenfluss (wie viele Patienten beenden die Intervention vorzeitig oder gehen verloren etc.) beschrieben. Die Endpunkte sind klar definiert und von klinischer Relevanz. Die verwendeten statistischen Methoden sind beschrieben. Methodik und Durchführung der Studie müssen sorgfältig sein, damit die Ergebnisse vertrauenswürdig sind (interne Validität). Die Selektion der Patienten definiert die Übertragbarkeit der Ereignisse in den Alltag (externe Validität). RCT randomisierte kontrollierte Studie relative Risikoreduktion Mit der relativen Risikoreduktion (RRR) wird in klinischen Studien das Ausmaß eines Effektes beschrieben. Die RRR gibt an, wie stark die Ereignisrate durch eine Intervention vermindert wird im Verhältnis zur Ereignisrate in der Kontrollgruppe. Berechnung: Ereignisrate in Kontrollgruppe minus Ereignisrate in Therapiegruppe geteilt durch Ereignisrate in Kontrollgruppe. Bei Verwendung der verbreiteten englischen Abkürzungen lautet die Formel: RRR = (CER - EER): CER CER: Control Event Rate EER: Experimental Event Rate Beispiel: In einer plazebokontrollierten Studie nimmt die eine Hälfte der Patienten das orale Antikoagulans Phenprocoumon ein, die andere Hälfte der Patienten ein Scheinmedikament (Plazebogruppe). Überprüft wird, wie häufig in beiden Gruppen Thrombosen auftreten. Nach einem festgelegten Beobachtungszeitraum von einem Jahr sind in der Plazebogruppe bei 5% der Patienten Thrombosen aufgetreten, bei den antikoagulierten Patienten nur bei 2%. Zur Berechnung des relativen Risikos wird die Ereignisrate in der Therapiegruppe (2%) von der Ereignisrate in der Kontrollgruppe (5%) abgezogen (5% - 2% = 3%; der so ermittelte Wert ist die absolute Risikoreduktion) und durch die Ereignisrate in der Kontrollgruppe (5%) geteilt (3% : 5% = 0,6). Um Prozentangaben zu erhalten, wird der ermittelte Wert mit 100% multipliziert (0,6 x 100% = 60%). Die relative Risikoreduktion beträgt in diesem Beispiel also 60%. RRR = (5% - 2%) : 5% = 0,6 0,6 x 100% = 60% Die Ergebnisse einer klinischen Studie werden oft als RRR dargestellt, weil dadurch der Therapieeffekt besonders eindrucksvoll und günstig erscheint. Der Therapieerfolg wird jedoch durch die Darstellung als relativer Wert „aufgeblasen”. So bedeutet die RRR der Beispielrechnung von 60%, dass das Risiko absolut nur um 3% (von 5% auf 2%) gesunken ist (absolute Risikoreduktion). relatives Risiko Das relative Risiko (RR) ist ein Effektmaß in Vergleichsstudien, welches das Verhältnis eines Risikos (z.B. für ein un- © arznei-telegramm® 2014 5 arznei-telegramm®-Glossar günstiges Ereignis wie Herzinfarkt) in zwei Gruppen beschreibt. Ein RR von 1 bedeutet, dass zwischen den beiden Vergleichsgruppen kein Unterschied besteht. Bei Werten über 1 besteht ein erhöhtes, bei Werten unter 1 ein erniedrigtes Risiko für die geprüfte Intervention bzw. Exposition. Beispiel: Ein RR von 1,4 bedeutet eine relative Risikoerhöhung um 40%, ein RR von 0,9 eine relative Risikoreduktion (RRR) um 10%. RR relatives Risiko RRR relative Risikoreduktion sekundärer Endpunkt Endpunkt Signifikanzniveau p-Wert Subgruppenanalysen Hierbei wird der Effekt einer Intervention in einzelnen Untergruppen der Studienpopulation überprüft, zum Beispiel Männer, Frauen, Diabetiker, Raucher usw. Ergebnisse aus Subgruppenanalysen sind häufig unzuverlässig, da die Fragestellung nicht primär auf die jeweilige Untergruppe angelegt ist und die zufällige Verteilung durch Randomisierung in Untergruppen oftmals nicht gewährleistet ist. Zudem können zufällig signifikante Ergebnisse aufgrund der Mehrfachtestung entstehen, aber auch nichtsignifikante Ergebnisse wegen zu geringer Power. Daten aus Subgruppenanalysen sollen daher in der Regel nur zur Hypothesengenerierung herangezogen werden. Besonders kritisch sind Ergebnisse aus nachträglichen („post hoc”) Analysen zu werten, da die Gefahr der Manipulation mit nachträglicher Selektion günstiger Ergebnisse besteht. Verblindung Wird in Studien Patienten und/oder Prüfärzten sowie weiteren an der Studie beteiligten Personen (Pflegepersonal, Befundauswerter) die Zuordnung der Teilnehmer zur Interventions- oder Kontrollgruppe verheimlicht, spricht man von Verblindung. Dies soll verhindern, dass ein Wissen um die aktuelle Behandlung das Verhalten der Patienten, der Behandelnden oder die Auswertung von Befunden bewusst oder unbewusst beeinflusst. Wissen lediglich die Patienten nicht über ihre reale Therapie Bescheid, spricht man von „einfach-blindem” Design. Kennen weder Patient noch behandelnde Ärzte die Zuordnung, handelt es sich um ein „doppelblindes” Design (Doppelblindstudie). Eine Verblindung kann schwierig durchzuführen sein (zum Beispiel: Behandlung mit Antikoagulanzien mit der Notwendigkeit von Laborkontrollen, Prüfung chirurgischer Verfahren), und „Entblindung” ist zum Teil nicht zu vermeiden (zum Beispiel: Betablocker senken die Herzfrequenz, Studienteilnehmer in Lipidsenkerstudien lassen die Laborwerte außerhalb der Studie kontrollieren). Der Grad der „realen” Verblindung lässt sich beispielsweise durch Befragung der Patienten am Ende der Studie abschätzen. Vertrauensbereich Konfidenzintervall Surrogatparameter Surrogatparameter sind als Endpunkte erhobene Messwerte (z.B. Blutdruck, Blutzucker), die mit klinisch relevanten Ereignissen assoziiert sind. Sie sollen als Ersatz für diese (z.B. Insult, Herzinfarkt) dienen, um den Nutzen einer Intervention zu belegen. Surrogatparameter sind zwar oft rascher und billiger zu erheben als klinische Endpunkte. Da sich Interventionen jedoch auch negativ auswirken können, lassen Ersatzparameter keinen Rückschluss auf den realen Nutzen zu. Beispielsweise war in CAST (Cardiac Arrhythmia Suppression Trial) die Mortalität unter Antiarrhythmika erhöht, während der Surrogatparameter „Häufigkeit von Extrasystolen im EKG” erniedrigt war. Trennschärfe Power Validität Die Validität bezeichnet die Gültigkeit oder Belastbarkeit einer wissenschaftlichen Aussage bzw. eines Studienergebnisses. Validität wird an der Wahrscheinlichkeit für systematische Fehler festgemacht. Die „interne” Validität einer Studie wird dabei durch die Qualität der Durchführung bestimmt: Studienplanung, korrekt durchgeführte Randomisierung, Verblindung, prädefinierte Endpunkte, geeignete statistische Methode usw. Die „externe” Validität (= Generalisierbarkeit) bezeichnet die Möglichkeit der Übertragung eines Studienergebnisses auf Patienten außerhalb der Studienbedingungen. Enge Ein- und breite Ausschlusskriterien (z.B. Lebensalter, Begleiterkrankungen, Geschlecht) schränken die Übertragbarkeit stark ein. arznei-telegramm® (Institut für Arzneimittelinformation), Bergstr. 38 A, Wasserturm, D-12169 Berlin, Telefax: (0 30) 79 49 02 20, E-Mail: [email protected] und [email protected] Im Internet: http://www.arznei-telegramm.de Herausgeber: A.T.I. Arzneimittelinformation Berlin GmbH, HRB 24207B Amtsgericht Berlin-Charlottenburg Redaktion: W. BECKER-BRÜSER, Arzt und Apotheker (verantw.), U. BUCHHEISTER, Ärztin, J. HALBEKATH, Ärztin, Dr. med. A. JUCHE, Prof. Dr. med. M. M. KOCHEN, Dr. med. A. von MAXEN, Prof. Dr. med. I. MÜHLHAUSER, Dr. med. M. POHLMANN, Prof. Dr. med. K. QUIRING, S. SCHENK, Ärztin, R. SIEWCZYNSKI, Arzt, Dr. med. H. WILLE, Dr. rer. physiol. B. WIRTH Erklärung zu potenziellen Interessenkonflikten siehe Impressum im Internet. Das arznei-telegramm® (a-t) erscheint monatlich, Bezug im Jahresabonnement, Kündigung drei Monate zum Jahresende. Das a-t wird ausschließlich über die Abonnements finanziert. Jahresbezugspreis für Einzelpersonen (Ärzte, Apotheker u.a.) print: 52,80 €, digital: 50,30 €, Kombiabo (print plus digital): 60 €; für Studenten (Nachweis erforderl.) print: 37,20 €, digital: 34,60 €, Kombiabo (print plus digital) 44,50 €. Für Institutionen mit Mehrfachlesern print: 105,60 €, Preise digital und kombi auf Anfrage. Ausland: zzgl. 8 € Versand (Print-, Kombi-Abo) Bitte Zahlungen gebührenfrei für Empfänger vornehmen. © 2014, A.T.I. Arzneimittelinformation Berlin GmbH