arznei-telegramm

Werbung
4330
a-t im Internet: www.arznei-telegramm.de

Glossar
Die Information für Ärzte und Apotheker
Neutral, unabhängig und anzeigenfrei
arznei-telegramm
Stand Februar 2014
Fakten und Vergleiche für die rationale Therapie
absolute Risikoreduktion
Die absolute Risikoreduktion (ARR) gibt die Differenz der
Ereignisraten von zwei Vergleichsgruppen an. Sie ist das wichtigste Maß für den Nutzen (oder Schaden) einer Behandlung
in klinischen Interventionsstudien. Sie wird bei kontrollierten
Studien aus der Differenz zwischen der Ereignisrate unter Plazebo (bzw. einer Vergleichsintervention) und der Ereignisrate
unter der geprüften Behandlung errechnet:
Berechnung: Verdeutlicht am Beispiel der Gesamtsterblichkeit in der 4S-Studie mit Simvastatin: Mortalität unter Plazebo (= Kontrollgruppe) 11,5%, in der Prüfgruppe mit Simvastatin 8,2%, Differenz (= absolute Risikoreduktion) 3,3%. Der
Kehrwert der ARR (1/ARR) ergibt die Number needed to
treat.
Ein weiteres Beispiel: In einer plazebokontrollierten Studie nimmt die eine Hälfte der Patienten das orale Antikoagulans Phenprocoumon ein, die andere Hälfte der Patienten ein
Scheinmedikament (Plazebogruppe). Überprüft wird, wie
häufig in beiden Gruppen Thrombosen auftreten. Nach einem
festgelegten Beobachtungszeitraum von einem Jahr sind in der
Plazebogruppe bei 5% der Patienten Thrombosen aufgetreten,
bei den antikoagulierten Patienten nur bei 2%. Die absolute
Risikoreduktion berechnet sich aus der Differenz zwischen der
Ereignisrate in der Plazebogruppe und der Ereignisrate in der
Verumgruppe, also 5% minus 2% = 3%. Für den Fall einer
Verschlechterung der Prognose durch eine Intervention wird
manchmal von der „absoluten Risikoerhöhung” (Absolute
Risk Increase) = ARI gesprochen, die nach dem gleichen Prinzip errechnet wird.
Die absolute Risikoreduktion eignet sich im Gegensatz zur
relativen Risikoreduktion (RRR) zur realistischen Einschätzung der Auswirkung einer Intervention. Aus ihr kann direkt
die Number needed to treat (NNT) berechnet werden.
Äquivalenzstudie
Äquivalenzstudien untersuchen, ob sich der Nutzen therapeutischer Maßnahmen so wenig unterscheidet, dass dieser
Unterschied ohne klinische Bedeutung bleibt. Ein Bereich, für
den Gleichwertigkeit angenommen wird, muss hierfür prospektiv definiert werden. Die Interventionen gelten als gleichwertig, wenn der beobachtete Unterschied, einschließlich statistischer Unsicherheit, innerhalb dieses Bereichs liegt.
ausschließen. Je umfangreicher diese Kriterien sind, desto problematischer ist die Übertragbarkeit („externe Validität”)
der gewonnenen Resultate: Das Nutzen-Schaden-Verhältnis
kann sich in der Praxis deutlich verschieben. So treten mitunter schwere Störwirkungen neuer Arzneimittel erst nach der
Zulassung auf, wenn z.B. Patienten das Mittel einnehmen, die
aufgrund ihrer Begleiterkrankungen in den Zulassungsstudien
nicht repräsentiert sind.
Bias
Bias („Verzerrung”) ist ein systematischer Fehler in klinischen Studien, der dazu führt, dass die erhaltenen Ergebnisse
von den tatsächlichen Werten abweichen können. Es handelt
sich also nicht um eine durch allgemeine Fehler verursachte
zufällige Abweichung, sondern um eine systematische Überbzw. Unterschätzung des Ergebnisses, verursacht durch Fehler
im Design oder in der Durchführung der Studie. Durch Bias
verfälschte Ergebnisse lassen sich nicht mittels biometrischer
Methoden korrigieren.
Studien mit einer geringen Gefahr für einen Bias gelten als
„intern valide” (Validität), also vertrauenswürdig.
Beispiel: Standardisierte Verfahren bei der Studiendurchführung dienen dazu, die Gefahr für Bias zu verringern. Bei
Therapiestudien gilt die Randomisation, also die streng zufällige Zuteilung der Patienten, als eine der wichtigsten Maßnahmen den so genannten Selektionsbias zu verhindern. Die willkürliche Zuordnung „geeigneter” Studienteilnehmer in bestimmte Behandlungsgruppen mit dem Ziel einer Ergebnisschönung wird verhindert oder zumindest erschwert.
Bei Metaanalysen ist eine ausgiebige Literaturrecherche
erforderlich, um nach Möglichkeit alle vorhandenen Daten –
auch unpublizierte, aber möglicherweise relevante Studien zu
erfassen und in die Analyse mit einzuschließen. Hierdurch soll
der Einfluss des Publikationsbias, also der verzerrende Effekt
durch bevorzugtes Veröffentlichen positiver Studienergebnisse
verringert werden.
Eine klinische Studie ohne jeden Bias gibt es nicht. Es gilt
bei der Beurteilung zu bewerten, ob die Methodik geeignet ist,
Bias zu minimieren und dadurch die interne Validität der
Studie zu stützen.
Confounder
ARR  absolute Risikoreduktion
Ausschlusskriterien
In klinischen Studien werden im Prüfplan Eigenschaften
(z.B. Alter, Begleiterkrankungen und Begleitmedikation) festgelegt, die potenzielle Probanden von der Studienteilnahme
Confounder bezeichnet einen Störfaktor in Studien, der zu
einer Verzerrung der Ergebnisse führt, da er sowohl mit der
geprüften Exposition als auch mit dem Zielkriterium assoziiert
ist. So kann z.B. in Beobachtungsstudien Alkohol scheinbar
das Risiko für Lungenkrebs erhöhen, wenn nicht berücksichtigt wird, dass Rauchen (Confounder) sowohl mit exzessivem
Alkoholgenuss als auch mit Lungenkrebs einhergeht. Die verblindete, zufällige Zuteilung der Patienten in randomisierten
© arznei-telegramm® 2014
®
2
arznei-telegramm®-Glossar
kontrollierten Studien soll dafür sorgen, dass – zum Teil unbekannte – Störfaktoren auf die verschiedenen Gruppen insgesamt gleich verteilt werden und somit keinen Einfluss auf das
Ergebnis haben.
Interventionen benötigt, als wenn diese in Einzelstudien untersucht werden.
Hazard Ratio
Confounding by indication
Die Ermittlung von Behandlungseffekten in Beobachtungsstudien ist problematisch, da die Symptome und prognostischen Faktoren, die in der Praxis die Therapieentscheidungen beeinflussen, auch auf die Ergebnisse Einfluss haben.
So wurde in epidemiologischen Studien ein Zusammenhang
zwischen der Einnahme von H2-Blockern und Magenkarzinom vorgetäuscht, da die von einem zunächst nicht erkannten
Magenkarzinom verursachten Beschwerden zu häufigerer Einnahme der Mittel führten.
Design, faktorielles  faktorielles Design
Hazard bestimmt die Wahrscheinlichkeit in einem Kollektiv für das Auftreten eines Ereignisses (z.B. Erkrankung oder
Heilung) über einen bestimmten Zeitraum. Die Hazard Ratio
(HR) gibt das Verhältnis zweier Hazards an. Ist die Hazard
Ratio größer oder kleiner als 1, bedeutet dies, dass die Wahrscheinlichkeit für das Ereignis in der beobachteten Gruppe
über den gewählten Zeitraum größer bzw. kleiner ist als in der
Vergleichsgruppe. Die statistische Signifikanz wird mithilfe
von Konfidenzintervallen geprüft, die vollständig ober- oder
unterhalb der 1 liegen müssen. Hazard ratios werden aus
Überlebenszeitkurven errechnet. In sie geht die Zeit ein, die
Patienten unter Beobachtung standen.
Heterogenität
Doppelblindstudie
In einer Doppelblindstudie wissen weder die Patienten/Probanden noch die Behandelnden, welche Intervention (Verum,
Plazebo) der jeweilige Patient/Proband erhält. Weiteres siehe
Verblindung.
Endpunkt (primärer, sekundärer)
In der Planungsphase vor Beginn einer Studie müssen
(mindestens) ein primärer (erstrangiger) und gegebenenfalls
sekundäre (zweitrangige) Endpunkte festgelegt werden. Diese
sollen relevant im Sinne der Fragestellung sein. In Phase-IIIStudien sollten klinische Endpunkte (Morbidität, Mortalität,
Lebensqualität) dabei Vorrang vor Laborparametern haben.
Verbindliche Aussagen lassen sich aus einer Studie in erster Linie aus den Ergebnissen zum primären Endpunkt ableiten, da
das Design der Untersuchung auf diesen Endpunkt angelegt
wird (Fallzahlkalkulation, Randomisierungsverfahren usw.).
Ergebnisse aus sekundären Endpunkten sind mit größerer
Wahrscheinlichkeit zufällig und dienen daher häufig nur der
Generierung von Hypothesen, die ggf. in entsprechend angelegten weiteren Studien bestätigt werden müssen.
Unterscheiden sich die Einzelergebnisse von Studien, die
gemeinsam in einer Metaanalyse ausgewertet werden, deutlich in ihren Effekten voneinander, spricht man von Heterogenität. Heterogenität kann durch Unterschiede der Patientenpopulationen, unterschiedliche Begleitinterventionen, unterschiedlich gemessene Endpunkte oder qualitative Unterschiede der Studien bedingt sein. Es ist grundsätzlich problematisch, heterogene Studien gemeinsam in einer Metaanalyse zusammenzuführen. Dies muss diskutiert und klinisch begründet werden.
HR  Hazard Ratio
Intention-to-treat-Analyse
Während im deutschen Sprachraum der Begriff Evidenz
„Augenfälliges”, „auf der Hand Liegendes” beschreibt, wird
die Bezeichnung evidenzbasierte Medizin aus dem Englischen
abgeleitet (evidence based medicine). Hier ist mit Evidenz
Nachweis oder Beweis gemeint und bezieht sich in erster Linie
auf Belege, die aus klinischen Studien abgeleitet werden können.
Die Intention-to-treat-Analyse (ITT) ist das für Überlegenheitsstudien geforderte Analyseverfahren, bei dem alle Teilnehmer in ihrer Gruppe ausgewertet werden und eingehen,
unabhängig von Protokollverletzungen, Compliance oder verfrühtem Abbruch der Studienteilnahme. Auch bei versehentlichem oder beabsichtigtem Therapiewechsel (z.B.: ein Patient
soll Plazebo erhalten, nimmt jedoch tatsächlich Verum ein)
erfolgt die Auswertung in der ursprünglich zugeteilten Behandlungsgruppe. ITT ergibt eine realistische, konservative
Einschätzung des Behandlungseffektes und spiegelt die therapeutische Realität im praktischen Alltag mit suboptimaler
Compliance und Verordnungs- oder Einnahmefehlern wider.
Zudem wird eine Verzerrung der Ergebnisse verhindert, die
z.B. durch ungleiche Abbruchraten in den verschiedenen Behandlungsgruppen entstehen kann. Im Gegensatz zur Intention-to-treat-Analyse gehen in die Per-Protokoll-Analyse nur
diejenigen Probanden ein, die vollständig nach dem Prüfplan
behandelt wurden.
faktorielles Design
Inzidenz
In randomisierten Studien mit faktoriellem Design werden
zwei oder mehr Interventionen gleichzeitig gegenüber einer
Kontrolle (z.B. Plazebo) geprüft.
Beispiel: In einer Studie mit zwei gegenüber Plazebo (P)
geprüften Interventionen (A, B) erhalten die in vier Gruppen
randomisierten Probanden: 1. A + P, 2. B + P, 3. A + B, 4. nur
P. Unter der Voraussetzung, dass keine Interaktionen zwischen A + B bestehen, die bei Kombination zu überadditiver
oder abgeschwächter Wirkung führen, kann ein paarweiser
Vergleich durchgeführt werden (für A: Gruppen 1 + 3 versus
2 + 4; für B: Gruppen 2 + 3 versus 1 + 4). Der Vorteil besteht
darin, dass man weniger Probanden für die Prüfung mehrerer
Anzahl der innerhalb eines definierten Zeitraums (z.B.
Studiendauer) aufgetretenen Krankheitsfälle innerhalb einer
Population (z.B. Studienteilnehmer).
ITT  Intention-to-treat-Analyse
evidenzbasierte Medizin
Kohortenstudie
Beobachtungsstudie, in der der Einfluss einer Intervention
oder einer Exposition zum Beispiel auf das Auftreten einer Erkrankung oder die Sterblichkeit in einer Personengruppe (Kohorte) gegen Nichtexposition überprüft wird.
© arznei-telegramm® 2014
3
arznei-telegramm®-Glossar
Aufgrund der fehlenden Randomisierung können Einflussfaktoren, die in den Vergleichsgruppen ungleich verteilt sind,
das Ergebnis verzerren. Nicht alle Störgrößen sind bekannt,
sodass eine vollständige Adjustierung nicht möglich ist. Daher
sind Kohortenstudien bei der Beurteilung therapeutischer Interventionen weniger valide als randomisierte kontrollierte
Studien.
Konfidenzintervall
Das Konfidenzintervall (Vertrauensbereich) gibt den Bereich an, in dem der wahre Wert einer Messung (z.B. Therapieeffekt) mit einer dazu angegebenen Wahrscheinlichkeit (oft
95% oder 99%) angenommen wird. Die Breite des Konfidenzintervalls hängt unter anderem von der Anzahl der eingeschlossenen Patienten und der Ereignisrate ab. Es lässt auf einen Blick erkennen, ob ein Ergebnis statistisch signifikant ist
(Beispiel: Relatives Risiko: 0,85; 95% Konfidenzintervall:
0,7-0,9; statistisch signifikant, da das gesamte Intervall unterhalb der 1 [„line of no effect”] liegt). Es ist darüber hinaus ein
Maß für die Genauigkeit des Ergebnisses: Je schmaler das Intervall ist, umso exakter wird die Schätzung.
Metaanalyse
Statistisches Verfahren, oft Bestandteil systematischer
Übersichten, mit dem Ergebnisse ähnlicher Studien zu einer
Fragestellung gemeinsam ausgewertet werden. Ziel ist, durch
die gegenüber Einzelstudien höheren Patientenzahlen zu zusammenfassenden („gepoolten”) und präziseren Ergebnissen
zu kommen. Vorteil ist bei guter Methodik die systematische
Auswertung der Gesamtdatenlage. Mögliche Nachteile sind
die Vermengung heterogener Daten (Heterogenität), Nichtberücksichtigung unveröffentlichter Negativdaten sowie die
Aufnahme schlechter Studien, die durch die Berücksichtigung
in der Metaanalyse zu anscheinend hochgradiger Evidenz aufgewertet werden.
Nichtunterlegenheitsstudie
Mit einer Nichtunterlegenheitsstudie soll gezeigt werden,
dass eine Intervention gegenüber einem etablierten Standard
„nicht unterlegen” ist. Nichtunterlegenheit wird angenommen, wenn die neue Intervention allenfalls in gewissen, vor
Studienbeginn definierten Grenzen schlechter abschneidet als
der Standard. Liegen der Punktschätzer und das 95%ige
Konfidenzintervall des Effekts der Intervention innerhalb
vorgegebener Grenzen, gilt das Kriterium für Nichtunterlegenheit als erfüllt. In der Praxis werden die tolerierten Grenzen jedoch zum Teil so weit gewählt, dass trotz klinisch relevanter Nachteile formal „Nichtunterlegenheit” ermittelt wird.
Nichtunterlegenheitsstudien werden – ethisch oft fragwürdig –
auch als Zulassungsstudien durchgeführt statt der dringend
gebotenen Überlegenheitsstudien, um „Me-too”-Präparate
ohne relevante Vorteile zu vermarkten.
NNT  Number needed to treat
Nullhypothese  p-Wert
verhindern oder ein positives Ereignis (z.B. Heilung) zu bewirken. Sie wird als Kehrwert der absoluten Risikoreduktion
(ARR) errechnet: NNT = 1/ARR. Analog lässt sich bei schädigender Intervention eine Number needed to harm (NNH) errechnen.
Odds
Odds („Chance”) ist die Häufigkeit eines Ereignisses dividiert durch die Häufigkeit der dazu komplementären Ereignisse. Beispiel: Die Odds, eine 6 zu würfeln, beträgt 1/5, also 0,2.
Sie unterscheidet sich von der Wahrscheinlichkeit (Anzahl
von Ereignissen dividiert durch die Gesamtzahl der möglichen
Ereignisse). Diese beträgt in diesem Fall 1/6, also 0,167. Je unwahrscheinlicher ein Ereignis ist, umso mehr nähert sich aber
die Odds der Wahrscheinlichkeit an (Bsp. "Lotterie": 1 Los von
1.000.000 gewinnt. Wahrscheinlichkeit = 1/1.000.000; Odds =
1/999.999).
Odds Ratio
Die Odds Ratio (OR) für das Auftreten eines Ereignisses erhält man durch Division der beiden Odds zweier Vergleichsgruppen. Odds Ratios sind die üblicherweise angewandten Effektmaße in Fallkontrollstudien. Analog zu Odds und Wahrscheinlichkeit nähert sich bei seltenen Ereignissen die Odds
Ratio dem relativen Risiko an.
OR  Odds Ratio
Per-Protokoll-Analyse
Die Per-Protokoll-Analyse ist eine Auswertungsmethode für
randomisierte klinische Studien, bei der – im Gegensatz zur
Intention-to-treat-Analyse – nur die Probanden in die Analyse eingehen, die vollständig gemäß Prüfplan behandelt wurden. Das Ergebnis einer solchen Analyse beschreibt den Effekt
einer Intervention unter optimalen Bedingungen. Es spiegelt
jedoch nicht den realen Nutzen der Maßnahme wider, da zum
Beispiel Studienabbrecher aufgrund von Störwirkungen nicht
in die Analyse eingehen und somit das Prinzip der zufälligen
Zuteilung (Randomisierung) gebrochen wird. Die Folge kann
eine Verzerrung (Bias) der Resultate zu Gunsten der Intervention sein.
Power
Die Trennschärfe oder Power einer Interventionsstudie bezeichnet ihr Vermögen, einen existierenden Unterschied zwischen den Versuchsarmen der Untersuchung zu erkennen.
Wird bei einer Power von 80% kein statistisch signifikanter
Vorteil für den Interventions- oder den Kontrollarm errechnet, besteht eine 20%ige Wahrscheinlichkeit, dass ein Unterschied übersehen wird. Der so genannte „Betafehler” oder
Fehler 2. Art beträgt entsprechend 20%. Die Power hängt –
nach Festlegung des erwarteten Unterschieds – von der Zahl
der eingeschlossenen Patienten ab, die daher vor Beginn der
Studie in einer Fallzahlplanung berechnet werden muss.
Number needed to treat
Prävalenz
Die Number needed to treat (NNT) ist ein in Vergleichsstudien ermitteltes Effektmaß für den Nutzen von Interventionen. Die NNT gibt die Zahl der Patienten an, die behandelt
werden müssen, um im Beobachtungszeitraum im Vergleich
zur Kontrollbehandlung ein negatives Ereignis (z.B. Tod) zu
Anteil Erkrankter in einer definierten Population zu einem
festgelegten Zeitpunkt.
primärer Endpunkt  Endpunkt
© arznei-telegramm® 2014
4
arznei-telegramm®-Glossar
Publikationsbias
Interventionsstudien, die keinen Nutzen der geprüften Intervention nachweisen („Negativstudien”), werden seltener
und dann oft später publiziert als Positivstudien. Die Folge ist
eine Verschiebung der veröffentlichten (nachprüfbaren) Daten ins Positive. In Metaanalysen kann ein Publikationsbias
das Endergebnis verzerren. Es existieren statistische Methoden
zur Ermittlung eines Publikationsbias, die jedoch eine begrenzte Power haben und versagen können, insbesondere wenn
nur wenige Studien zu einer Fragestellung vorliegen.
Punktschätzer
In Studien werden Ergebnisse in der Regel mit einer einzelnen Zahl angegeben, zum Beispiel der absoluten oder relativen Risikoreduktion (ARR oder RRR). Diese Zahl ist jedoch,
da aus einer Stichprobe (= Studienpopulation) erhoben, lediglich eine Abschätzung (Punktschätzer) für den „wahren” Wert,
dem man sich durch die statistische Auswertung der Studie
nähert. Wie präzise dieser Punktschätzer den „wahren” Wert
widerspiegelt, lässt sich am Konfidenzintervall („Vertrauensbereich”; oft ausgedrückt als 95%iges Intervall) ablesen, das
die Grenzwerte angibt, zwischen denen der „wahre” Effekt mit
statistisch ausreichender Sicherheit liegt. Je schmaler das
Konfidenzintervall, umso exakter ist der Punktschätzer einzustufen.
p-Wert
Der p-Wert einer Studie gibt die Wahrscheinlichkeit an,
mit der ein gefundener Unterschied zwischen den Vergleichsgruppen zufällig ist. Der in der Regel angewandte Grenzwert
von p < 0,05, ab welchem die Nullhypothese („kein Unterschied”) abgelehnt wird („Signifikanzniveau”), beruht auf einer Konvention, nach der eine unter 5%ige Wahrscheinlichkeit für fälschlicherweise angenommene Unterschiede ausreichend gering erscheint. p-Werte beschreiben nur die statistische Signifikanz z.B. eines Therapieeffektes, ermöglichen jedoch keine Aussage über die Bedeutung des therapeutischen
Zusatznutzens. Dieser muss nach klinischem Sachverstand beurteilt werden. p-Werte erlauben zudem keine Aussage über
die Präzision des ermittelten Unterschieds. Hierfür ist die Errechnung von Konfidenzintervallen notwendig.
randomisierte kontrollierte Studie
Prospektive Studie zur Ermittlung eines Kausalzusammenhanges zwischen einer Intervention und einem Effekt mit
mindestens zwei Vergleichsgruppen, denen die Teilnehmer
randomisiert, d.h. per Zufallsprinzip, zugeteilt werden. Die
Zufallsverteilung soll gewährleisten, dass sich bekannte und
unbekannte Faktoren, die das interessierende Ergebnis beeinflussen können, insgesamt gleichmäßig auf die Gruppen verteilen. Wenn sich – bei Einhalten weiterer methodischer Standards – zu Studienschluss ein Unterschied zwischen den
Gruppen ergibt, kann dieser dann der Intervention zugerechnet werden.
Randomisierte kontrollierte Studien (RCT) eignen sich am
besten dazu, einen Therapieeffekt zu überprüfen. Die Gefahr
von Bias („Verzerrungen”) ist bei dieser Studienform
besonders gering. Durch die zufällige Zuteilung der Patienten
haben diese Studien „experimentellen” Charakter.
Wichtige Kriterien bei der Beurteilung: Je mehr der nachfolgend genannten Kriterien aus den Studien nicht hervorgehen, desto schlechter ist die Qualität der Studie und desto
weniger zuverlässig sind die Ergebnisse.
 Vorab festgelegtes und idealerweise nachvollziehbares
(veröffentlichtes) Protokoll wird eingehalten.
 Ein- und Ausschlusskriterien, nach denen die Studienteilnehmer ausgewählt werden, sind beschrieben.
 Für die verdeckte zufällige Zuteilung (concealment of allocation) der Teilnehmer zu den Behandlungsgruppen wird
ein geeignetes Verfahren verwendet und dieses beschrieben.
 Studienärzte und Patienten sind verblindet, sodass beide
über die zugeteilte Behandlungsform nicht informiert sind
(Doppelblindstudie).
 Die Nachbeobachtung ist dokumentiert und der Patientenfluss (wie viele Patienten beenden die Intervention vorzeitig oder gehen verloren etc.) beschrieben.
 Die Endpunkte sind klar definiert und von klinischer Relevanz.
 Die verwendeten statistischen Methoden sind beschrieben.
 Methodik und Durchführung der Studie müssen sorgfältig
sein, damit die Ergebnisse vertrauenswürdig sind (interne
Validität). Die Selektion der Patienten definiert die
Übertragbarkeit der Ereignisse in den Alltag (externe Validität).
RCT  randomisierte kontrollierte Studie
relative Risikoreduktion
Mit der relativen Risikoreduktion (RRR) wird in klinischen
Studien das Ausmaß eines Effektes beschrieben. Die RRR gibt
an, wie stark die Ereignisrate durch eine Intervention vermindert wird im Verhältnis zur Ereignisrate in der Kontrollgruppe.
Berechnung: Ereignisrate in Kontrollgruppe minus Ereignisrate in Therapiegruppe geteilt durch Ereignisrate in Kontrollgruppe.
Bei Verwendung der verbreiteten englischen Abkürzungen
lautet die Formel:
RRR = (CER - EER): CER
CER: Control Event Rate
EER: Experimental Event Rate
Beispiel: In einer plazebokontrollierten Studie nimmt die
eine Hälfte der Patienten das orale Antikoagulans Phenprocoumon ein, die andere Hälfte der Patienten ein Scheinmedikament (Plazebogruppe). Überprüft wird, wie häufig in beiden Gruppen Thrombosen auftreten. Nach einem festgelegten
Beobachtungszeitraum von einem Jahr sind in der Plazebogruppe bei 5% der Patienten Thrombosen aufgetreten, bei den
antikoagulierten Patienten nur bei 2%. Zur Berechnung des
relativen Risikos wird die Ereignisrate in der Therapiegruppe
(2%) von der Ereignisrate in der Kontrollgruppe (5%) abgezogen (5% - 2% = 3%; der so ermittelte Wert ist die absolute
Risikoreduktion) und durch die Ereignisrate in der Kontrollgruppe (5%) geteilt (3% : 5% = 0,6). Um Prozentangaben zu
erhalten, wird der ermittelte Wert mit 100% multipliziert
(0,6 x 100% = 60%). Die relative Risikoreduktion beträgt in
diesem Beispiel also 60%.
RRR = (5% - 2%) : 5% = 0,6
0,6 x 100% = 60%
Die Ergebnisse einer klinischen Studie werden oft als RRR
dargestellt, weil dadurch der Therapieeffekt besonders eindrucksvoll und günstig erscheint. Der Therapieerfolg wird jedoch durch die Darstellung als relativer Wert „aufgeblasen”.
So bedeutet die RRR der Beispielrechnung von 60%, dass das
Risiko absolut nur um 3% (von 5% auf 2%) gesunken ist
(absolute Risikoreduktion).
relatives Risiko
Das relative Risiko (RR) ist ein Effektmaß in Vergleichsstudien, welches das Verhältnis eines Risikos (z.B. für ein un-
© arznei-telegramm® 2014
5
arznei-telegramm®-Glossar
günstiges Ereignis wie Herzinfarkt) in zwei Gruppen beschreibt. Ein RR von 1 bedeutet, dass zwischen den beiden
Vergleichsgruppen kein Unterschied besteht. Bei Werten über
1 besteht ein erhöhtes, bei Werten unter 1 ein erniedrigtes Risiko für die geprüfte Intervention bzw. Exposition. Beispiel:
Ein RR von 1,4 bedeutet eine relative Risikoerhöhung um
40%, ein RR von 0,9 eine relative Risikoreduktion (RRR) um
10%.
RR  relatives Risiko
RRR  relative Risikoreduktion
sekundärer Endpunkt  Endpunkt
Signifikanzniveau  p-Wert
Subgruppenanalysen
Hierbei wird der Effekt einer Intervention in einzelnen
Untergruppen der Studienpopulation überprüft, zum Beispiel
Männer, Frauen, Diabetiker, Raucher usw. Ergebnisse aus
Subgruppenanalysen sind häufig unzuverlässig, da die Fragestellung nicht primär auf die jeweilige Untergruppe angelegt
ist und die zufällige Verteilung durch Randomisierung in Untergruppen oftmals nicht gewährleistet ist. Zudem können zufällig signifikante Ergebnisse aufgrund der Mehrfachtestung
entstehen, aber auch nichtsignifikante Ergebnisse wegen zu geringer Power. Daten aus Subgruppenanalysen sollen daher in
der Regel nur zur Hypothesengenerierung herangezogen werden. Besonders kritisch sind Ergebnisse aus nachträglichen
(„post hoc”) Analysen zu werten, da die Gefahr der Manipulation mit nachträglicher Selektion günstiger Ergebnisse besteht.
Verblindung
Wird in Studien Patienten und/oder Prüfärzten sowie weiteren an der Studie beteiligten Personen (Pflegepersonal, Befundauswerter) die Zuordnung der Teilnehmer zur Interventions- oder Kontrollgruppe verheimlicht, spricht man von
Verblindung. Dies soll verhindern, dass ein Wissen um die aktuelle Behandlung das Verhalten der Patienten, der Behandelnden oder die Auswertung von Befunden bewusst oder unbewusst beeinflusst. Wissen lediglich die Patienten nicht über
ihre reale Therapie Bescheid, spricht man von „einfach-blindem” Design. Kennen weder Patient noch behandelnde Ärzte
die Zuordnung, handelt es sich um ein „doppelblindes” Design (Doppelblindstudie).
Eine Verblindung kann schwierig durchzuführen sein (zum
Beispiel: Behandlung mit Antikoagulanzien mit der Notwendigkeit von Laborkontrollen, Prüfung chirurgischer Verfahren), und „Entblindung” ist zum Teil nicht zu vermeiden
(zum Beispiel: Betablocker senken die Herzfrequenz, Studienteilnehmer in Lipidsenkerstudien lassen die Laborwerte außerhalb der Studie kontrollieren). Der Grad der „realen” Verblindung lässt sich beispielsweise durch Befragung der Patienten
am Ende der Studie abschätzen.
Vertrauensbereich  Konfidenzintervall
Surrogatparameter
Surrogatparameter sind als Endpunkte erhobene Messwerte (z.B. Blutdruck, Blutzucker), die mit klinisch relevanten
Ereignissen assoziiert sind. Sie sollen als Ersatz für diese (z.B.
Insult, Herzinfarkt) dienen, um den Nutzen einer Intervention zu belegen. Surrogatparameter sind zwar oft rascher und
billiger zu erheben als klinische Endpunkte. Da sich Interventionen jedoch auch negativ auswirken können, lassen Ersatzparameter keinen Rückschluss auf den realen Nutzen zu.
Beispielsweise war in CAST (Cardiac Arrhythmia Suppression
Trial) die Mortalität unter Antiarrhythmika erhöht, während
der Surrogatparameter „Häufigkeit von Extrasystolen im EKG”
erniedrigt war.
Trennschärfe  Power
Validität
Die Validität bezeichnet die Gültigkeit oder Belastbarkeit
einer wissenschaftlichen Aussage bzw. eines Studienergebnisses. Validität wird an der Wahrscheinlichkeit für systematische
Fehler festgemacht. Die „interne” Validität einer Studie wird
dabei durch die Qualität der Durchführung bestimmt: Studienplanung, korrekt durchgeführte Randomisierung, Verblindung, prädefinierte Endpunkte, geeignete statistische Methode usw. Die „externe” Validität (= Generalisierbarkeit) bezeichnet die Möglichkeit der Übertragung eines Studienergebnisses auf Patienten außerhalb der Studienbedingungen. Enge
Ein- und breite Ausschlusskriterien (z.B. Lebensalter, Begleiterkrankungen, Geschlecht) schränken die Übertragbarkeit
stark ein.
arznei-telegramm® (Institut für Arzneimittelinformation),
Bergstr. 38 A, Wasserturm, D-12169 Berlin, Telefax: (0 30) 79 49 02 20,
E-Mail: [email protected] und [email protected]
Im Internet: http://www.arznei-telegramm.de
Herausgeber: A.T.I. Arzneimittelinformation Berlin GmbH,
HRB 24207B Amtsgericht Berlin-Charlottenburg
Redaktion: W. BECKER-BRÜSER, Arzt und Apotheker (verantw.),
U. BUCHHEISTER, Ärztin, J. HALBEKATH, Ärztin, Dr. med. A. JUCHE,
Prof. Dr. med. M. M. KOCHEN, Dr. med. A. von MAXEN,
Prof. Dr. med. I. MÜHLHAUSER, Dr. med. M. POHLMANN,
Prof. Dr. med. K. QUIRING, S. SCHENK, Ärztin, R. SIEWCZYNSKI, Arzt,
Dr. med. H. WILLE, Dr. rer. physiol. B. WIRTH
Erklärung zu potenziellen Interessenkonflikten siehe Impressum im Internet.
Das arznei-telegramm® (a-t) erscheint monatlich, Bezug im Jahresabonnement, Kündigung drei Monate zum Jahresende.
Das a-t wird ausschließlich über die Abonnements finanziert.
Jahresbezugspreis für Einzelpersonen (Ärzte, Apotheker u.a.) print: 52,80 €,
digital: 50,30 €, Kombiabo (print plus digital): 60 €; für Studenten (Nachweis
erforderl.) print: 37,20 €, digital: 34,60 €, Kombiabo (print plus digital) 44,50 €.
Für Institutionen mit Mehrfachlesern print: 105,60 €, Preise digital und kombi
auf Anfrage. Ausland: zzgl. 8 € Versand (Print-, Kombi-Abo)
Bitte Zahlungen gebührenfrei für Empfänger vornehmen.
© 2014, A.T.I. Arzneimittelinformation Berlin GmbH
Herunterladen