Beim Plazebo wirkt mehr als die «Pille» allein

CURRICULUM
Schweiz Med Forum 2007;7:318–324
318
Beim Plazebo wirkt mehr
als die «Pille» allein
Gedanken zur Studienmethodik anlässlich von zwei Schlafuntersuchungen
Markus Gnädinger, Franz Marty
Die Autoren sind Research Fellows der Einheit für Hausarztmedizin (EHAM) der Universität Zürich.
Quintessenz
쎲 Anhand von zwei Schlafstudien besprechen die Autoren verschiedene
Aspekte der Plazebowirkung.
쎲 In wissenschaftlichen Studien dürfte diese vorwiegend aus plazebofremden
Faktoren zustande kommen, wie «Hawthorne-Effekt» (psychologische Faktoren
des Studieneinschlusses an sich) oder «Regression zum Mittelwert» (statistischer Begleiteffekt von Einschlusskriterien).
쎲 Das Plazebo per se dürfte nur eine schwache Wirkung entfalten.
Summary
In the placebo effect more than just the “pill” is at work
쎲 Thoughts on scientific trial methods on the basis of two sleep studies
쎲 Various aspects of the placebo effect are discussed on the basis of two
sleep studies. In scientific trials this effect may often be due to the “Hawthorne
effect” (psychological factors relating to study participation) or “regression
toward the mean” (a mere statistical side effect of the trial inclusion criteria).
쎲 To take, or not to take, a placebo per se should make little difference.
Vorbemerkung
Wenn Sie beim Lesen dieses Essays bisweilen
den Eindruck haben, die Autoren würden Sie auf
einen mittelalterlichen Jahrmarkt entführen,
auffordern, mit Gauklern und Possenreissern,
die Sie mit ihren Spottgedichten und Kapriolen
unterhalten, geistig das Rad zu schlagen, so ist
dies ebenso erwünscht wie der eine oder andere
«Schmunzler» Ihrerseits. Unser Ziel haben wir
aber erst erreicht, wenn Sie bei der ganzen
Lektüre, einem Minnesang gleich, auch unsere
Liebe zur kritischen Analyse von Forschungsergebnissen spüren.
Es ist wie bei den Paläontologen: Der Abfall, die
versteinerten Exkremente der prähistorischen
Tiere geben oft mehr Informationen her als
deren Knochen selbst. So ging es auch der
Gruppe um James K. Walsh, Rochester, NY. Er
veröffentlichte im Jahr 2000 eine plazebokontrollierte Studie über die intermittierende Einnahme von Zolpidem (Stilnox® oder Generika)
bei primärer Insomnie (n = 163) [1]. Im Jahr
2004 erschienen die Daten einer zweiten, etwas
CME zu diesem Artikel finden Sie auf S. 313 oder im Internet unter www.smf-cme.ch.
grösseren (n = 199) und längeren Studie (12 statt
8 Wochen) mit ansonsten identischem Protokoll
[2]. Eine im Jahr 2005 publizierte Arbeit der
gleichen Forschungsgruppe analysierte in einer
Post-hoc-Analyse die Plazebogruppe von letzterer Studie [3] und fand mit diesen «Abfalldaten»
mehr Beachtung als mit den Zolpidemstudien
selber.
Das lateinische Wort «Plazebo» bedeutet «ich
werde gefallen». Es stammt aus dem Psalm
114.9. Bei der Übersetzung vom Hebräischen
ins Lateinische wurde der Satz: «Ich werde
mit dem Herrn wandeln im Lande der Lebenden» fehlübersetzt zu «Plazebo domino in regione vivorum», also: «Ich werde dem Herren
gefällig sein im Lande der Lebenden». Der
Text wurde im Mittelalter als Kehrreim der
Totenvesper verwendet und war deswegen
allgemein bekannt. Da schon damals galt:
«De mortuis nil [dices] nisi bene», «Über die
Verstorbenen soll man sich nicht kritisch äussern», gerieten die Totenandachten wohl öfters zu Lobhudeleien über die Verstorbenen.
«Plazebo-Singen» war also synonym mit der
(lobenden) Würdigung des Verschiedenen.
Später wurde der Begriff eher für ein «Einseifen» gegenüber bei höher gestellten Persönlichkeiten verwendet. Die «Mietmäuler», die
den Fürsten nach dem Munde redeten, gab es
also schon im Mittelalter; sie sind demnach
keine Erfindung moderner Ärztekongresse!
Erst ab Ende des 18. Jahrhundert fand der
Begriff Plazebo in der heutigen Bedeutung
als Scheinmedikament Eingang in die medizinische Terminologie.
Erster Gedanke
Was bewirken plazebounabhängige Mechanismen
wie «Regression zum Mittelwert», «HawthorneEffekt»?
Wie bei allen Studien geht es um die Frage,
welche Effekte durch die getestete Intervention
erklärt werden können und welche Wirkung der
Einschluss in eine wissenschaftliche Studie per
se aufweist.
CURRICULUM
Die unten stehende Abbildung (Abb. 1 x) zeigt
die subjektiv wahrgenommene Schlafdauer der
Plazebo- und Verum-Gruppe an Tagen mit oder
ohne Medikamenteneinnahme. In beiden Gruppen konnte eine Verlängerung der Schlafdauer
dokumentiert werden, obwohl nur bei der obersten Kurve mit Wirksubstanz behandelt worden
war. Zolpidem hat die Schlafzeit von 320 (Ausgangswert) auf 420 Minuten gesteigert – ohne
Wirkstoff stieg sie von 320 auf ca. 360 Minuten
an. Diese Verbesserung ist deswegen einer anderen Ursache als dem getesteten Medikament
(dem Plazeboeffekt?) zuzurechnen.
Totale Schlafdauer
Studienverlauf
Studienwochen
Abbildung 1
Verlauf der subjektiven totalen Schlafzeit [1]. Legende: zol = Zolpidemgruppe,
pla = Plazebogruppe, + = Tage mit und – = Tage ohne Tabletteneinnahme.
Schweiz Med Forum 2007;7:318–324
319
Regression zum Mittelwert
An dieser nicht medikamentös bedingten Verbesserung des Studienparameters ist zum Teil
das statistische Phänomen «Regression zum Mittelwert» (engl. «regression to» oder genauer:
«toward the mean») schuld. Damit jemand in
eine (Interventions-)Studie eingeschlossen wird,
muss ein bestimmter Parameter eine definierte
Schwelle über- oder unterschreiten. Dieses Einschlusskriterium für die Zolpidemstudien war:
(1) Erfüllung der Kriterien für primäre Insomnie
nach DSM IV, (2) Einschlaflatenz von mehr als
44 Minuten ODER totale Schlafzeit von weniger
als 6,5 Stunden und Beschwerden tagsüber
wegen Unausgeschlafenheit, sowie (3) «im Bett»Zeit von 6,5 bis 9,0 Stunden.
Der Mittelwert aller gemessenen Werte des Studienparameters wird bei späteren Messungen
tiefer liegen als beim Studieneinschluss, da irrtümlich in die Studie eingeschlossene «Gesunde»
sich im Verlauf der Studie Richtung Normalwert
bewegen (µ0 3 µ1) (Abb. 2 x).
Letztlich bedeutet der «Regression zum Mittelwert»-Effekt, dass wir uns beim Studieneinschluss
aufgrund des Auswahlverfahrens ein falsches Bild
über den Krankheitszustand der Studienpopulation gemacht haben. Im Verlauf der Studie ändert
sich – da keine neuen Selektionen stattfinden –
das Bild Richtung tatsächliche Werte des Krankheitsparameters. Diese Veränderung hat nichts
mit einer Änderung des Gesundheitszustandes der
Patienten in der Studie zu tun, sondern ist ein rein
statistisches Phänomen. In dieser Zeitschrift hat
P. Kleist diesen Effekt kürzlich anschaulich beschrieben [4].
Hawthorne-Effekt
«Einschluss»
1. Nachmessung
2. Nachmessung
Krankheitsparameter
µ0
µ1
Einschlusskriterium
Gesamt-Stichprobe (alle):
– Umfang
– Mittelwert
Abbildung 2
Regression zum Mittelwert, Verlauf unter Plazebo.
Studienpopulation (Kranke):
– Umfang
– Mittelwert
– eingeschl. «Gesunde»
Unter dem Hawthorne-Effekt versteht man das
(psychologische) Phänomen, dass Versuchspersonen im Rahmen von Studien ihr Verhalten ändern können und aus diesem Grund individuelle
Verbesserungen des Ausgangszustandes auftreten, z.B. indem gewisse Verhaltensänderungen
vorgenommen werden, die ihrerseits die gemessenen Parameter beeinflussen (Stichwort hier:
Schlafhygiene). Auch gibt es z.B. eine Tendenz,
Leute in Studien einzuschliessen, die zum Zeitpunkt ihrer Rekrutierung mit ihrem Problem
oder der bisherigen Behandlung besonders unzufrieden waren, so dass sie offen sind für Interventionen. Schliesslich werden Bewältigungsstrategien instruiert: Man lernt mit dem Problem zu leben (engl. «coping») und sich zu arrangieren. Der Hawthorne-Effekt stellt somit eine
mögliche Bedrohung der externen Validität dar
(Verallgemeinerung von Resultaten aus einer
Studie auf die Anwendung in der Praxis). Auch
der Hawthorne-Effekt ist von P. Kleist unlängst
im Swiss Medical Forum erörtert worden [4].
CURRICULUM
Wahrscheinlich spielen ein statistischer Selektionseffekt und psychologische Faktoren auch bei der
täglichen Arbeit in der Praxis eine gewisse Rolle.
Wenn bei einem Patienten mit Blutdruckwerten um
150/95 mm Hg eine statistische Schwankung nach
oben auftritt, ist es wahrscheinlicher, dass Sie die
bisherige antihypertensive Zweier- zu einer Dreiertherapie ausbauen, als wenn die Veränderung
der Werte Richtung Zielwert gezeigt hätte. Und
wenn Sie bei einem anderen Patienten ein Medikament zur Behandlung seiner Erektionsschwäche
einsetzen, werden Sie mitunter psychologisch recht
viel in Bewegung setzen. Trotzdem sind diese Faktoren in der doch recht speziellen Situation einer
wissenschaftlichen Studie wohl ausgeprägter als in
der täglichen Praxis. Der Gesamteffekt einer Intervention setzt sich aus der eigentlichen Wirkung
sowie den Plazebofaktoren zusammen. Letztere
sind in der Praxis generell schwächer ausgeprägt,
so dass die Wirkung einer bestimmten Therapiemassnahme in einer Studie normalerweise stärker
ausfallen wird als in der Praxis. Somit dürfte die
Wirksamkeit von Interventionen in Studien – gemessen am zu erwartenden Resultat in der Praxis
– meist überschätzt werden.
Fazit
Statistische Selektionseffekte (Regression zum
Mittelwert) und psychologische Faktoren (Hawthorne-Effekt) lassen uns die Wirksamkeit von
Interventionen in klinischen Studien in der Regel
überschätzen.
Zweiter Gedanke
Ist nur vorhanden, was statistisch signifikant ist?
Das Besondere an den Zolpidem-Studien war,
dass die Probanden frei entscheiden konnten, ob
sie das Studienmedikament an einem bestimm-
Tabletten pro 2 Wochen
Medikamenteneinahme
Studienwochen
Abbildung 3
Tabletteneinnahme über die Studie [2].
Schweiz Med Forum 2007;7:318–324
320
ten Abend einnehmen wollten oder nicht. Allerdings bestand die Auflage darin, mindestens
3 und maximal 5 Tabletten pro Woche einzunehmen, damit sowohl die «pill days»‚ als auch die
«no-pill-days» statistisch ausgewertet werden
konnten.
Die nächste Grafik (aus der zweiten ZolpidemStudie) (Abb. 3 x) zeigt die durchschnittliche
Tabletteneinnahme pro zwei Wochen. Mit dieser
Grafik begründet Walsh seine Meinung, Zolpidem sei nicht suchterregend. Hinter diese Aussage möchten wir einige Fragezeichen setzen.
Möglicherweise war die Studienmethodik nicht
geeignet, Zeichen der Abhängigkeit zu entdekken, da die diesbezüglich gefährdeten Versuchsteilnehmer wohl schon ab der ersten Woche mit
5 Tabletten am «oberen Anschlag» waren und
die Dosis gar nicht mehr steigern konnten. Einfachblinde Plazebophasen für beide Versuchsgruppen zu Beginn und am Schluss der Studie
wären deswegen eher geeignet gewesen, zu unterscheiden, ob die Leute mit Verum einfach
«schluckfreudiger» waren oder ob das besser
«einfahrende» Verum zu verstärkter Einnahme
führte (positive Rückkopplung) – leider hat das
Studiendesign dies nicht vorgesehen.
Als statistische Analyse werden eine 6 x 2-PunkteVarianzanalyse (ANOVA) und ein Duncan-t-Test
erwähnt (verzagen Sie nicht, wenn Sie diese Ausführungen nicht verstehen, uns geht es genauso!).
Dieser Test gibt einen «Gruppeneffekt» mit einem
p <0,0005 und einen «Verlaufseffekt» mit p =
0,0319 an sowie eine negative «Interaktion» zwischen den Gruppen. Diese Werte werden von den
Autoren wie folgt interpretiert: «Der Gruppeneffekt bedeutet, dass die Verumgruppe mehr Medikamente geschluckt hat als die Plazebogruppe,
der Verlaufseffekt, dass beide Gruppen zur DosisEskalation tendierten, und die negative Interaktion, dass dieser Trend in der Verum- und Plazebogruppe nicht verschieden war.» Und in der
Studienzusammenfassung: «Es gab keine Hinweise auf eine Entzugs-Insomnie an den zolpidemfreien Tagen oder auf eine gesteigerte Medikamenteneinnahme während der Studie».
Aufgrund dieser Informationen kann man zwar
nicht behaupten, dass Zolpidem generell süchtig
mache – andererseits aber auch nicht sicher widerlegen, dass einige Versuchsteilnehmer eben
doch Abhängigkeitsprobleme erfahren haben
könnten. Leider gibt Walsh uns auch keine
Standardabweichungen an, so dass wir nicht
wissen, ob z.B. gegen Ende des Versuches in der
Verumgruppe die Streuung zugenommen haben
könnte, was dafür spräche, dass die Zunahme
der Tabletteneinnahme nur durch einige wenige
(gefährdete) Versuchsteilnehmer zustande gekommen wäre. Auch die Tatsache, dass in Abbildung 1 die Zolpidem-Verumgruppe an den «no
pill days» am schlechtesten abschneidet, trägt
nicht gerade zu unserer Beruhigung bei. Unsere
tägliche Erfahrung zeigt, dass Zolpidem eben
CURRICULUM
doch Probleme verursachen kann. Wir erkennen
dies in der Praxis immer wieder daran, dass
bestimmte Patienten ultimativ die Abgabe dieses
Mittels verlangen und dass das Intervall, bis
sie die nächste Packung holen, zu schrumpfen
beginnt. In anderen Worten: Auch wenn die
beschriebene Nebenwirkung (Entwicklung von
Abhängigkeitsmerkmalen) nicht signifikant unterschiedlich ist, könnte sie unter Therapie mit
Verum trotzdem häufiger auftreten als unter
Plazebo. Die affirmative Aussage, dass sich zwei
Interventionen nicht unterscheiden (Äquivalenzstudie), bedarf zur Untermauerung einer ausgeklügelten Statistik [5], die im Falle der WalshStudien sicherlich gefehlt hat.
Falls Zolpidem süchtig machen sollte und
Walsh dies hier übersehen hätte, würde man
dies auf «Statistisch» als Typ-II- oder «betaFehler» bezeichnen. Dies bedeutet, dass ein
tatsächlich vorhandener Effekt übersehen
wird, z.B. weil die Studienpower ungenügend
(zu kurz, zu schwach, zu wenige Probanden
usw.) war. Der andere Fall, dass das Studiendesign zur Beantwortung einer bestimmten
Frage methodisch grundsätzlich ungeeignet
sein könnte, wird in der Poweranalyse oder
mit dem Betafehler nicht berücksichtigt, d.h.
der Betafehler drückt nur die Wahrscheinlichkeit aus, mit der trotz optimaler Methodik
ein Zusammenhang verpasst wird. Normalerweise akzeptiert man einen Betafehler von
10 bis 20%. Umgekehrt berechnet man die
Studienpower nach der Formel: 1 – b.
Dazu ein Witz: Dällenbach Kari kriecht nachts
am Bahnhof Bern zwischen den Tram- und
Bushaltestellen am Boden herum. Der Polizist fragt: «Was machsch du am Bodä?».
«I suech mi Füfliiber». «Weisch du wo ne ver-
Totale Schlafzeit
Schweiz Med Forum 2007;7:318–324
321
loore häsch?». «Jo, a dr Nideggbrügg unge!».
«Warum suechsch dänn nüd dert?» «Wills dert
so finschter isch!». Die Geschichte sagt im Kern,
dass man «wahre» Erkenntnisse nur dort finden kann, wo sie sind, und wenn die Suchmethode auch noch so ausgefeilt ist. Und andererseits, dass man, obwohl es eigentlich wissenschaftlich interessante neue Erkenntnisse zu
entdecken gäbe, trotzdem nichts findet, wenn
die Methode nicht taugt. Und schliesslich: Traue
keiner Statistik, die du nicht verstehst!
Fazit
«Absence of evidence of a difference is not evidence of absence of a difference» [5]. Eine fehlende Signifikanz zwischen zwei Interventionen
sagt nichts darüber aus, ob sich deren Auswirkungen, zumal im Einzelfall, nicht doch in relevanter Weise unterscheiden könnten.
Dritter Gedanke
Wie wahrscheinlich ist es, dass ein statistisch
signifikantes Resultat auch stimmt?
Schliesslich zur Plazebopublikation von Walsh
[3]: In Abbildung 4 x werden die Tage mit Einnahme einer Plazebotablette mit jenen Tagen, an
denen das Scheinmedikament nicht genommen
wurde, verglichen (gezeigt wird die totale Schlafzeit).
Erneut beobachtet man im Verlauf der Studie
eine Verbesserung von ca. 320 auf ungefähr
360 Minuten pro Nacht. Die Werte wurden mittels ANOVA analysiert. Für den Unterschied:
«pill+»- and «pill–»-Tage insgesamt errechnet
die Software ein p = 0,014. Für den Zeitverlauf
einen signifikanten Unterschied von p = 0,001.
Die Interaktion von Pilleneinnahme und Zeit
wird für die Wochen 3/4 und 9/10 als signifikant
ausgegeben (p-Wert nicht genannt). Da die Wirkung hinsichtlich vier verschiedenen Parametern ausgewertet wurde (neben der Schlafzeit
auch: Einschlaflatenz, Anzahl Aufwachepisoden,
Wachheitsdauer nach dem ersten Einschlafen),
wäre bei der Berechnung der Signifikanz wurde
eigentlich eine Korrektur indiziert gewesen1, da
die bescheidene Wirkung sonst ebenso gut ein
rein zufälliges Resultat darstellen kann.
Die von uns heiss geliebten p-Werte drücken
aus, wie wahrscheinlich ein rein zufälliges
Zustandekommen der Studienresultate aus
statistischer Sicht ist. Für diesen Typ-I- oder
Abbildung 4
Schlafzeit (Standard error of mean, SEM) mit (blau) oder ohne (rot) Plazeboeinnahme [3].
1 Bonferoni-Transformation (Die ausgewiesene
Signifikanz wird nach Massgabe der gleichzeitig
untersuchten Parameter verringert):
pBonferoni = p x Anzahl getestete Parameter
x Anzahl getesteter Messpunkte.
CURRICULUM
«Alphafehler» werden in wissenschaftlichen
Studien in der Regel Wahrscheinlichkeiten
von 5% oder weniger akzeptiert. Somit dürfte
deswegen im Schnitt jedes 20. signifikante
statistische Analysenresultat nur zufällig zustande kommen.
John P. A. Ioannidis kommt in einem Essay [6]
zum Ergebnis, dass aus statistischen und methodischen Gründen die meisten publizierten Effekte gar nicht stimmen können. Abhängig von
der Vorstudienwahrscheinlichkeit des geprüften
Effektes, der Methodik und Power der Studie
können bestenfalls Wahrscheinlichkeiten von
85% erwartet werden, dass der beschriebene
Zusammenhang auch zutrifft, obwohl die ausgewiesene Signifikanz ja p <0,05 beträgt, d.h.
die Wahrscheinlichkeit eines Irrtums somit nur
5% betragen sollte. Ein wichtiger Schritt war
und ist sicher die doppelblinde Ausführung wissenschaftlicher Versuche, um die Befangenheit
von Versuchsteilnehmern und -leitern zu neutralisieren.
Die Tabelle 1 p listet sonstige wichtige Umstände auf, welche die Gültigkeit der gemachten
Aussagen sinken lassen, im Extrem bis auf
Werte um 1/10 000. Sie werden schnell merken,
dass neben der Einschätzung der Vorstudienwahrscheinlichkeit der schwierigste Punkt die
(Selbst-)Erkenntnis vorgefasster Meinungen ist.
Wie war es damals mit den gross angelegten
Studien zur Hormonsubstitution bei postmenopausalen Frauen zur Verhütung von Arteriosklerose und Alzheimer? Viele hielten solche
Studien aus dem herrschenden Zeitgeist heraus für unethisch. Man dürfe den Frauen die
segensreichen Hormone doch nicht vorenthalten! Und heute ist der Bösewicht jener, der geplagten Frauen vorschnell kombinierte Östrogene gibt.
Fazit
Die Post-Studien-Wahrscheinlichkeit, dass ein
publizierter Effekt auch tatsächlich stimmt, beträgt bestenfalls 85%, und wenn der p-Wert
auch noch so viele Nullen nach dem Komma ausweist.
Tabelle 1. Negative Einflussfaktoren auf die Gültigkeit
von in Studien gemachten Aussagen [6].
1. Geringe Vorstudienwahrscheinlichkeit
Schweiz Med Forum 2007;7:318–324
322
Vierter Gedanke
Was ist ein Nozebo?
Nebenwirkungen werden in den zwei Zolpidemstudien nur fragmentarisch beschrieben. In der
ersten Studie erfahren wir lediglich, dass ein Patient unter Zolpidem die Studie abgebrochen
hatte, allerdings geben die Autoren den Grund
dafür nicht bekannt. In der zweiten, längeren
Studie werden die folgenden Stundenabbrüche
wegen Nebenwirkungen angegeben: 7 Patienten
in der Zolpidemgruppe (1. starke Schläfrigkeit;
2. Kopfweh und Schwindel; 3. Stimmungsschwankungen und Angstgefühle; 4. Schlappheit; 5. Halluzinationen, 6. Kopfweh, 7. Halluzinationen)
und 3 in der Plazebogruppe (1. Erkältung, 2. Alpträume, 3. Hautausschlag). Über Nebenwirkungen, die nicht zum Abbruch der Studie führten,
erfahren wir leider nichts, ebenso wenig ist erwähnt, ob Nebenwirkungen systematisch erfragt
wurden.
Erinnern Sie sich noch an die Messgrössen der
evidenzbasierten Medizin (EBM)? Die «Number
needed to treat» (NNT) ist der Kehrwert der absoluten Risikoreduktion (ARR) und benennt diejenige Zahl von Patienten, die man gemäss einer
definierten Studienanordnung (gleiche Dosis,
gleiche Zeitdauer usw.) behandeln muss, um ein
bestimmtes Ereignis zu verhindern. Das gilt
dann auch für die unerwünschten Arzneimittelwirkungen (UAW). Dann spricht man von der
Number needed to harm (oder besser: «number
needed to treat to cause harm») (NNH). Diese Effekte gibt es natürlich auch bei einer Behandlung
mit Plazebo, und man verwendet dort das Wort
«Nozebo»2 [7].
Die Arbeitsgruppe um Winfried Rief von der Universität Marburg hat kürzlich nachgewiesen,
dass die Häufigkeit bestimmter Medikamentennebenwirkungen in den Plazebogruppen verschiedener wissenschaftlicher Studien bis 13mal
unterschiedlich beschrieben wird [8]. Aus prinzipiellen Gründen sollten UAW in Untersuchungen mit wohlverträglichen Mitteln unter Plazebo
etwa gleich häufig vorkommen wie unter Verum.
Die Häufigkeit spezifischer UAW ergibt sich dann
aus der Gruppendifferenz. Der Umgang mit UAW
ist somit ein Qualitätskriterium wissenschaftlicher Studien. Schon 1955 konstatierte Henry K.
Beecher [9] die Notwendigkeit, UAW in wissenschaftlichen Studien systematisch zu erfassen.
51 Jahre später stellt Winfried Rief die gleiche
Forderung! Wie wäre es, wenn die WHO ein welt-
2. Kleine Stichprobengrösse
3. Kleine Grösse des erwarteten Effekts (<33%)
4. Viele getestete Parameter, Messpunkte und/oder
Subgruppen
5. Ungenau definierte Methodik
6. Interessenkonflikte und vorgefasste Meinungen
7. «Heisses» Thema (viele Gruppen mit ähnlicher
Thematik befasst)
2 In Analogie zum Begriff «Plazebo» (ich werde [dir]
gefallen, siehe oben) wurde das Wort «Nozebo»
(ich werde [dir] schaden) geschaffen. Sie kennen das
Wort «nocēre» möglicherweise aus dem Leitsatz des
hippokratischen Eides: «primum [est] nil nocere»,
also: «Oberstes (Ziel der ärztlichen Kunst ist, dem
Kranken mit therapeutischen Massnahmen) keinen
Schaden zuzufügen.»
CURRICULUM
weites Register schaffen würde, in dem die Plazebodaten jeglicher Studien abgelegt werden
können? Dies wäre doch ein wunderbarer Fundus, aus dem die Plausibilität von Studiendaten
beurteilt werden könnte!
Es kann auch in der hausärztlichen Praxis sinnvoll sein, Plazebos einzusetzen, um Nebenwirkungen zu untersuchen. Der Erstautor sah sich
einmal genötigt, bei einer Gefässpatientin mit
Cholesterinwerten von über 8 mmol/l, die auf
jedes eingesetzte Statin unspezifische Nebenwirkungen zeigte, einen «n = 1»-Versuch3 durchzuführen. Die Patientin, die mit diesem Vorgehen
einverstanden war, erhielt einfachblind 14 Tage
lang Plazebo, dann 28 Tage Simvastatin 20 mg,
und schliesslich wieder 14 Tage lang Plazebo. Da
die von ihr beklagten Nebenwirkungen unter
Plazebo ebenso häufig und gleich stark ausgeprägt waren wie unter Verum, liess sie sich überzeugen, das Medikament wieder einzunehmen.
Das tut sie nun nach 5 Jahren noch immer, und
das Gefäss ist glücklicherweise offen geblieben.
Fazit
UAW sind in vielen Studien schlecht dokumentiert, müssten aber bei wohlverträglichen
Mitteln prinzipiell unter Plazebo praktisch
ebenso häufig verzeichnet werden wie unter
aktiven Therapien.
Fünfter Gedanke
Worin besteht eine Plazebowirkung im engeren
Sinne?
Eine neuere Arbeit beschreibt vier mögliche
Mechanismen der Plazebowirkung [7]:
– Erwartungshaltung (via Endophin-Freisetzung);
– klassische Konditionierung;
– bewusst vermittelte Reaktion;
– Belohnungssystem.
Offenbar gibt es Medikamente, die reproduzierbar zur Wirkung einen Plazeboeffekt benötigen.
Der Cholecystokinin-Antagonist Proglumid (Endorphin-Facilitator) wirkt nicht, wenn er den
Probanden versteckt verabreicht wird; der
Patient muss wissen, dass er ein Schmerzmedikament erhält, sonst bewirkt das Medikament
nichts. Dieser Effekt ist deutlich stärker als der
Plazeboeffekt allein und kann mit dem OpiatAntagonisten Naloxon blockiert werden.
Diese Berichte passen gut zur Beobachtung von
Henry K. Beecher [9], der schon 1955 feststellte,
dass Leute, die zuverlässig auf Plazebos ansprachen, häufig auch gut auf Opiate reagierten,
während jene mit unzuverlässiger oder fehlender Reaktion auf das Scheinmedikament auch
mehr Opiate für eine bestimmte analgetische
Wirkung benötigten. Die globale Wirkung, welche Plazebos in wissenschaftlichen Studien auf
Schweiz Med Forum 2007;7:318–324
323
die Symptome verschiedenster Erkrankungen
erzielen können (Schmerzen, Husten, Depressionen, Angina pectoris, Kopfweh, Reisekrankheit,
Angsterkrankung, Erkältung), bezifferte er auf
ca. 35%, von denen die oben erwähnten Störfaktoren (Regression zum Mittelwert, HawthorneEffekt) allerdings wohl den grössten Teil ausmachen.
In den Studien von Walsh und Mitautoren sind
die Ergebnisse hinsichtlich Schlafqualität an
Tagen mit oder ohne Plazeboeinnahme nicht verschieden. Als Limitation der Zolpidem-Studien
beschreiben die Autoren, dass die Probanden
möglicherweise die Pillen an Abenden eingenommen haben, an denen sie erwarteten, «besonders schlecht» zu schlafen, was einen möglicherweise doch vorhandenen Plazebo-Effekt
verwischt haben könnte, indem die Versuchsteilnehmer die Tabletten immer dann einnahmen,
wenn sie sich besonders ruhelos und «kribbelig»
fühlten. Immerhin reflektiert das «Einnehmen
bei Bedarf» recht gut das Verhalten unserer Patienten in der Realität, so dass diese Resultate
praktische Bedeutung haben könnten.
Arzneimittelwirkungen werden oftmals überschätzt. Das Setting von Interventionen nützt oftmals mehr als die Intervention selber. Beobachtete Plazebo- und Nozebo-Effekte beruhen auf
verschiedenen Phänomenen. Sie sind teilweise
bedingt durch statistische Selektionseffekte oder
psychologische Faktoren im Rahmen des Studieneinschlusses. Die Einnahme von Plazebo (die
Kapsel mit Laktosepulver!) an sich nützt kaum
etwas; es ist deswegen vor den «ut-aliquid»4Therapien zu warnen. Andererseits ist es durchaus auch so, dass an sich wirkungslose Prozeduren «heil machen» können, wenn das Drum
und Dran stimmt, so beobachtet bei Azulonliquidum-«Rollkuren» oder Kalzium/Vitamin-Ci.v.-Injektionen! Gesehen in der Praxis des Vorgängers und Lehrmeisters des Erstautors.
Fazit
Die in Studien ausgewiesenen Plazeboeffekte von
ca. 35% dürfen nicht ungeschaut auf die Praxis
übertragen werden. Wie viel das «Heilmittel
Arzt» (und damit das Plazebo) per se taugt, müssen weitere Untersuchungen zeigen.
Zum Schluss
Wir hoffen, dass wir Ihnen helfen konnten, etwas
Rüstzeug zu beschaffen für Ihren nächsten Kontakt mit «gefärbter» Information, um die seriösen Handelsreisenden unter den Marktfahrern
3 Ein «n = 1»-Versuch ist eine Studie mit einem
einzigen Teilnehmer.
4 Genauer: «ut aliquid fieri videtur», zu Deutsch:
«Um den Anschein zu erwecken, es geschehe etwas».
CURRICULUM
von den «Plazebo-Sängern» zu unterscheiden –
und dass wir Sie mit unseren Ausführungen nebenbei auch etwas haben unterhalten können.
Dank
Ein herzlicher Dank gebührt Prof. Dr. med. Norbert Donner-Banzhoff, Abteilung für Allgemeinmedizin, präventive und rehabilitative Medizin,
Schweiz Med Forum 2007;7:318–324
324
Prof. Dr. Winfried Rief, Fachbereich Psychologie,
Philipps-Universität Marburg, und Dr. med. Etzel
Gysling, Wil, für die kritische Durchsicht des
Manuskriptes und Prof. N. Donner zudem für die
Überlassung der Idee zur Abbildung 2.
Literatur5
Korrespondenz:
Markus Gnädinger
Birkenweg 8
CH-9323 Steinach
[email protected]
1 Walsh JK, Roth T, Randazzo MA, Erman M, Jamieson A, et
al. Eight weeks of non-nightly use of zolpidem for primary
insomnia. Sleep. 2000;23:1087–96.
2 Perlis ML, MaCall WV, Krystal AD, Walsh JK. Long-term, nonnightly administration of zolpidem in the treatment of
patients with primary insomnia. J Clin Psychiatry. 2004;65:
1128–37.
3 McCall WV, Perlis ML, Tu X, Groman AE, Krystal AD, Walsh
JK. A comparison of placebo and no-treatment during a hypnotic trial. Int J Clin Pharmacol Ther. 2005;43:355–9.
4 Kleist P. Vier Effekte, Phänomene und Paradoxe in der
Medizin. SMF. 2006;6:1023–7. Available from: www.medicalforum.ch/pdf/pdf_d/2006/2006-46/2006-46-194.pdf.
5 Kleist P. Zehn Anforderungen an therapeutische Äquivalenzstudien. SMF. 2006;6:814–9. Available from: www.medicalforum.ch/pdf/pdf_d/2006/2006-37/2006-37-119.pdf.
6 Ioannidis JPA. Why most published research findings are
false. PloS Med. 2005;2:696–701. Avilable from: http://medicine.plosjournals.org
7 Colloca L, Benedetti F. Placebos and painkillers: Is mind as
real as matter? Nat Rev Neurosci. 2005;6:545–52.
8 Rief W, Avorn J, Barsky AJ. Medication-attributed adverse effects in placebo groups. Arch Intern Med. 2006;166:155–60.
9 Beecher HK. The powerful placebo. JAMA. 1955;159:1602–6.
5 Die im Internet nicht frei zugänglichen Referenzen
können auf Wunsch via E-Mail beim Erstautor als
pdf-File bezogen werden.