CURRICULUM Schweiz Med Forum 2007;7:318–324 318 Beim Plazebo wirkt mehr als die «Pille» allein Gedanken zur Studienmethodik anlässlich von zwei Schlafuntersuchungen Markus Gnädinger, Franz Marty Die Autoren sind Research Fellows der Einheit für Hausarztmedizin (EHAM) der Universität Zürich. Quintessenz 쎲 Anhand von zwei Schlafstudien besprechen die Autoren verschiedene Aspekte der Plazebowirkung. 쎲 In wissenschaftlichen Studien dürfte diese vorwiegend aus plazebofremden Faktoren zustande kommen, wie «Hawthorne-Effekt» (psychologische Faktoren des Studieneinschlusses an sich) oder «Regression zum Mittelwert» (statistischer Begleiteffekt von Einschlusskriterien). 쎲 Das Plazebo per se dürfte nur eine schwache Wirkung entfalten. Summary In the placebo effect more than just the “pill” is at work 쎲 Thoughts on scientific trial methods on the basis of two sleep studies 쎲 Various aspects of the placebo effect are discussed on the basis of two sleep studies. In scientific trials this effect may often be due to the “Hawthorne effect” (psychological factors relating to study participation) or “regression toward the mean” (a mere statistical side effect of the trial inclusion criteria). 쎲 To take, or not to take, a placebo per se should make little difference. Vorbemerkung Wenn Sie beim Lesen dieses Essays bisweilen den Eindruck haben, die Autoren würden Sie auf einen mittelalterlichen Jahrmarkt entführen, auffordern, mit Gauklern und Possenreissern, die Sie mit ihren Spottgedichten und Kapriolen unterhalten, geistig das Rad zu schlagen, so ist dies ebenso erwünscht wie der eine oder andere «Schmunzler» Ihrerseits. Unser Ziel haben wir aber erst erreicht, wenn Sie bei der ganzen Lektüre, einem Minnesang gleich, auch unsere Liebe zur kritischen Analyse von Forschungsergebnissen spüren. Es ist wie bei den Paläontologen: Der Abfall, die versteinerten Exkremente der prähistorischen Tiere geben oft mehr Informationen her als deren Knochen selbst. So ging es auch der Gruppe um James K. Walsh, Rochester, NY. Er veröffentlichte im Jahr 2000 eine plazebokontrollierte Studie über die intermittierende Einnahme von Zolpidem (Stilnox® oder Generika) bei primärer Insomnie (n = 163) [1]. Im Jahr 2004 erschienen die Daten einer zweiten, etwas CME zu diesem Artikel finden Sie auf S. 313 oder im Internet unter www.smf-cme.ch. grösseren (n = 199) und längeren Studie (12 statt 8 Wochen) mit ansonsten identischem Protokoll [2]. Eine im Jahr 2005 publizierte Arbeit der gleichen Forschungsgruppe analysierte in einer Post-hoc-Analyse die Plazebogruppe von letzterer Studie [3] und fand mit diesen «Abfalldaten» mehr Beachtung als mit den Zolpidemstudien selber. Das lateinische Wort «Plazebo» bedeutet «ich werde gefallen». Es stammt aus dem Psalm 114.9. Bei der Übersetzung vom Hebräischen ins Lateinische wurde der Satz: «Ich werde mit dem Herrn wandeln im Lande der Lebenden» fehlübersetzt zu «Plazebo domino in regione vivorum», also: «Ich werde dem Herren gefällig sein im Lande der Lebenden». Der Text wurde im Mittelalter als Kehrreim der Totenvesper verwendet und war deswegen allgemein bekannt. Da schon damals galt: «De mortuis nil [dices] nisi bene», «Über die Verstorbenen soll man sich nicht kritisch äussern», gerieten die Totenandachten wohl öfters zu Lobhudeleien über die Verstorbenen. «Plazebo-Singen» war also synonym mit der (lobenden) Würdigung des Verschiedenen. Später wurde der Begriff eher für ein «Einseifen» gegenüber bei höher gestellten Persönlichkeiten verwendet. Die «Mietmäuler», die den Fürsten nach dem Munde redeten, gab es also schon im Mittelalter; sie sind demnach keine Erfindung moderner Ärztekongresse! Erst ab Ende des 18. Jahrhundert fand der Begriff Plazebo in der heutigen Bedeutung als Scheinmedikament Eingang in die medizinische Terminologie. Erster Gedanke Was bewirken plazebounabhängige Mechanismen wie «Regression zum Mittelwert», «HawthorneEffekt»? Wie bei allen Studien geht es um die Frage, welche Effekte durch die getestete Intervention erklärt werden können und welche Wirkung der Einschluss in eine wissenschaftliche Studie per se aufweist. CURRICULUM Die unten stehende Abbildung (Abb. 1 x) zeigt die subjektiv wahrgenommene Schlafdauer der Plazebo- und Verum-Gruppe an Tagen mit oder ohne Medikamenteneinnahme. In beiden Gruppen konnte eine Verlängerung der Schlafdauer dokumentiert werden, obwohl nur bei der obersten Kurve mit Wirksubstanz behandelt worden war. Zolpidem hat die Schlafzeit von 320 (Ausgangswert) auf 420 Minuten gesteigert – ohne Wirkstoff stieg sie von 320 auf ca. 360 Minuten an. Diese Verbesserung ist deswegen einer anderen Ursache als dem getesteten Medikament (dem Plazeboeffekt?) zuzurechnen. Totale Schlafdauer Studienverlauf Studienwochen Abbildung 1 Verlauf der subjektiven totalen Schlafzeit [1]. Legende: zol = Zolpidemgruppe, pla = Plazebogruppe, + = Tage mit und – = Tage ohne Tabletteneinnahme. Schweiz Med Forum 2007;7:318–324 319 Regression zum Mittelwert An dieser nicht medikamentös bedingten Verbesserung des Studienparameters ist zum Teil das statistische Phänomen «Regression zum Mittelwert» (engl. «regression to» oder genauer: «toward the mean») schuld. Damit jemand in eine (Interventions-)Studie eingeschlossen wird, muss ein bestimmter Parameter eine definierte Schwelle über- oder unterschreiten. Dieses Einschlusskriterium für die Zolpidemstudien war: (1) Erfüllung der Kriterien für primäre Insomnie nach DSM IV, (2) Einschlaflatenz von mehr als 44 Minuten ODER totale Schlafzeit von weniger als 6,5 Stunden und Beschwerden tagsüber wegen Unausgeschlafenheit, sowie (3) «im Bett»Zeit von 6,5 bis 9,0 Stunden. Der Mittelwert aller gemessenen Werte des Studienparameters wird bei späteren Messungen tiefer liegen als beim Studieneinschluss, da irrtümlich in die Studie eingeschlossene «Gesunde» sich im Verlauf der Studie Richtung Normalwert bewegen (µ0 3 µ1) (Abb. 2 x). Letztlich bedeutet der «Regression zum Mittelwert»-Effekt, dass wir uns beim Studieneinschluss aufgrund des Auswahlverfahrens ein falsches Bild über den Krankheitszustand der Studienpopulation gemacht haben. Im Verlauf der Studie ändert sich – da keine neuen Selektionen stattfinden – das Bild Richtung tatsächliche Werte des Krankheitsparameters. Diese Veränderung hat nichts mit einer Änderung des Gesundheitszustandes der Patienten in der Studie zu tun, sondern ist ein rein statistisches Phänomen. In dieser Zeitschrift hat P. Kleist diesen Effekt kürzlich anschaulich beschrieben [4]. Hawthorne-Effekt «Einschluss» 1. Nachmessung 2. Nachmessung Krankheitsparameter µ0 µ1 Einschlusskriterium Gesamt-Stichprobe (alle): – Umfang – Mittelwert Abbildung 2 Regression zum Mittelwert, Verlauf unter Plazebo. Studienpopulation (Kranke): – Umfang – Mittelwert – eingeschl. «Gesunde» Unter dem Hawthorne-Effekt versteht man das (psychologische) Phänomen, dass Versuchspersonen im Rahmen von Studien ihr Verhalten ändern können und aus diesem Grund individuelle Verbesserungen des Ausgangszustandes auftreten, z.B. indem gewisse Verhaltensänderungen vorgenommen werden, die ihrerseits die gemessenen Parameter beeinflussen (Stichwort hier: Schlafhygiene). Auch gibt es z.B. eine Tendenz, Leute in Studien einzuschliessen, die zum Zeitpunkt ihrer Rekrutierung mit ihrem Problem oder der bisherigen Behandlung besonders unzufrieden waren, so dass sie offen sind für Interventionen. Schliesslich werden Bewältigungsstrategien instruiert: Man lernt mit dem Problem zu leben (engl. «coping») und sich zu arrangieren. Der Hawthorne-Effekt stellt somit eine mögliche Bedrohung der externen Validität dar (Verallgemeinerung von Resultaten aus einer Studie auf die Anwendung in der Praxis). Auch der Hawthorne-Effekt ist von P. Kleist unlängst im Swiss Medical Forum erörtert worden [4]. CURRICULUM Wahrscheinlich spielen ein statistischer Selektionseffekt und psychologische Faktoren auch bei der täglichen Arbeit in der Praxis eine gewisse Rolle. Wenn bei einem Patienten mit Blutdruckwerten um 150/95 mm Hg eine statistische Schwankung nach oben auftritt, ist es wahrscheinlicher, dass Sie die bisherige antihypertensive Zweier- zu einer Dreiertherapie ausbauen, als wenn die Veränderung der Werte Richtung Zielwert gezeigt hätte. Und wenn Sie bei einem anderen Patienten ein Medikament zur Behandlung seiner Erektionsschwäche einsetzen, werden Sie mitunter psychologisch recht viel in Bewegung setzen. Trotzdem sind diese Faktoren in der doch recht speziellen Situation einer wissenschaftlichen Studie wohl ausgeprägter als in der täglichen Praxis. Der Gesamteffekt einer Intervention setzt sich aus der eigentlichen Wirkung sowie den Plazebofaktoren zusammen. Letztere sind in der Praxis generell schwächer ausgeprägt, so dass die Wirkung einer bestimmten Therapiemassnahme in einer Studie normalerweise stärker ausfallen wird als in der Praxis. Somit dürfte die Wirksamkeit von Interventionen in Studien – gemessen am zu erwartenden Resultat in der Praxis – meist überschätzt werden. Fazit Statistische Selektionseffekte (Regression zum Mittelwert) und psychologische Faktoren (Hawthorne-Effekt) lassen uns die Wirksamkeit von Interventionen in klinischen Studien in der Regel überschätzen. Zweiter Gedanke Ist nur vorhanden, was statistisch signifikant ist? Das Besondere an den Zolpidem-Studien war, dass die Probanden frei entscheiden konnten, ob sie das Studienmedikament an einem bestimm- Tabletten pro 2 Wochen Medikamenteneinahme Studienwochen Abbildung 3 Tabletteneinnahme über die Studie [2]. Schweiz Med Forum 2007;7:318–324 320 ten Abend einnehmen wollten oder nicht. Allerdings bestand die Auflage darin, mindestens 3 und maximal 5 Tabletten pro Woche einzunehmen, damit sowohl die «pill days»‚ als auch die «no-pill-days» statistisch ausgewertet werden konnten. Die nächste Grafik (aus der zweiten ZolpidemStudie) (Abb. 3 x) zeigt die durchschnittliche Tabletteneinnahme pro zwei Wochen. Mit dieser Grafik begründet Walsh seine Meinung, Zolpidem sei nicht suchterregend. Hinter diese Aussage möchten wir einige Fragezeichen setzen. Möglicherweise war die Studienmethodik nicht geeignet, Zeichen der Abhängigkeit zu entdekken, da die diesbezüglich gefährdeten Versuchsteilnehmer wohl schon ab der ersten Woche mit 5 Tabletten am «oberen Anschlag» waren und die Dosis gar nicht mehr steigern konnten. Einfachblinde Plazebophasen für beide Versuchsgruppen zu Beginn und am Schluss der Studie wären deswegen eher geeignet gewesen, zu unterscheiden, ob die Leute mit Verum einfach «schluckfreudiger» waren oder ob das besser «einfahrende» Verum zu verstärkter Einnahme führte (positive Rückkopplung) – leider hat das Studiendesign dies nicht vorgesehen. Als statistische Analyse werden eine 6 x 2-PunkteVarianzanalyse (ANOVA) und ein Duncan-t-Test erwähnt (verzagen Sie nicht, wenn Sie diese Ausführungen nicht verstehen, uns geht es genauso!). Dieser Test gibt einen «Gruppeneffekt» mit einem p <0,0005 und einen «Verlaufseffekt» mit p = 0,0319 an sowie eine negative «Interaktion» zwischen den Gruppen. Diese Werte werden von den Autoren wie folgt interpretiert: «Der Gruppeneffekt bedeutet, dass die Verumgruppe mehr Medikamente geschluckt hat als die Plazebogruppe, der Verlaufseffekt, dass beide Gruppen zur DosisEskalation tendierten, und die negative Interaktion, dass dieser Trend in der Verum- und Plazebogruppe nicht verschieden war.» Und in der Studienzusammenfassung: «Es gab keine Hinweise auf eine Entzugs-Insomnie an den zolpidemfreien Tagen oder auf eine gesteigerte Medikamenteneinnahme während der Studie». Aufgrund dieser Informationen kann man zwar nicht behaupten, dass Zolpidem generell süchtig mache – andererseits aber auch nicht sicher widerlegen, dass einige Versuchsteilnehmer eben doch Abhängigkeitsprobleme erfahren haben könnten. Leider gibt Walsh uns auch keine Standardabweichungen an, so dass wir nicht wissen, ob z.B. gegen Ende des Versuches in der Verumgruppe die Streuung zugenommen haben könnte, was dafür spräche, dass die Zunahme der Tabletteneinnahme nur durch einige wenige (gefährdete) Versuchsteilnehmer zustande gekommen wäre. Auch die Tatsache, dass in Abbildung 1 die Zolpidem-Verumgruppe an den «no pill days» am schlechtesten abschneidet, trägt nicht gerade zu unserer Beruhigung bei. Unsere tägliche Erfahrung zeigt, dass Zolpidem eben CURRICULUM doch Probleme verursachen kann. Wir erkennen dies in der Praxis immer wieder daran, dass bestimmte Patienten ultimativ die Abgabe dieses Mittels verlangen und dass das Intervall, bis sie die nächste Packung holen, zu schrumpfen beginnt. In anderen Worten: Auch wenn die beschriebene Nebenwirkung (Entwicklung von Abhängigkeitsmerkmalen) nicht signifikant unterschiedlich ist, könnte sie unter Therapie mit Verum trotzdem häufiger auftreten als unter Plazebo. Die affirmative Aussage, dass sich zwei Interventionen nicht unterscheiden (Äquivalenzstudie), bedarf zur Untermauerung einer ausgeklügelten Statistik [5], die im Falle der WalshStudien sicherlich gefehlt hat. Falls Zolpidem süchtig machen sollte und Walsh dies hier übersehen hätte, würde man dies auf «Statistisch» als Typ-II- oder «betaFehler» bezeichnen. Dies bedeutet, dass ein tatsächlich vorhandener Effekt übersehen wird, z.B. weil die Studienpower ungenügend (zu kurz, zu schwach, zu wenige Probanden usw.) war. Der andere Fall, dass das Studiendesign zur Beantwortung einer bestimmten Frage methodisch grundsätzlich ungeeignet sein könnte, wird in der Poweranalyse oder mit dem Betafehler nicht berücksichtigt, d.h. der Betafehler drückt nur die Wahrscheinlichkeit aus, mit der trotz optimaler Methodik ein Zusammenhang verpasst wird. Normalerweise akzeptiert man einen Betafehler von 10 bis 20%. Umgekehrt berechnet man die Studienpower nach der Formel: 1 – b. Dazu ein Witz: Dällenbach Kari kriecht nachts am Bahnhof Bern zwischen den Tram- und Bushaltestellen am Boden herum. Der Polizist fragt: «Was machsch du am Bodä?». «I suech mi Füfliiber». «Weisch du wo ne ver- Totale Schlafzeit Schweiz Med Forum 2007;7:318–324 321 loore häsch?». «Jo, a dr Nideggbrügg unge!». «Warum suechsch dänn nüd dert?» «Wills dert so finschter isch!». Die Geschichte sagt im Kern, dass man «wahre» Erkenntnisse nur dort finden kann, wo sie sind, und wenn die Suchmethode auch noch so ausgefeilt ist. Und andererseits, dass man, obwohl es eigentlich wissenschaftlich interessante neue Erkenntnisse zu entdecken gäbe, trotzdem nichts findet, wenn die Methode nicht taugt. Und schliesslich: Traue keiner Statistik, die du nicht verstehst! Fazit «Absence of evidence of a difference is not evidence of absence of a difference» [5]. Eine fehlende Signifikanz zwischen zwei Interventionen sagt nichts darüber aus, ob sich deren Auswirkungen, zumal im Einzelfall, nicht doch in relevanter Weise unterscheiden könnten. Dritter Gedanke Wie wahrscheinlich ist es, dass ein statistisch signifikantes Resultat auch stimmt? Schliesslich zur Plazebopublikation von Walsh [3]: In Abbildung 4 x werden die Tage mit Einnahme einer Plazebotablette mit jenen Tagen, an denen das Scheinmedikament nicht genommen wurde, verglichen (gezeigt wird die totale Schlafzeit). Erneut beobachtet man im Verlauf der Studie eine Verbesserung von ca. 320 auf ungefähr 360 Minuten pro Nacht. Die Werte wurden mittels ANOVA analysiert. Für den Unterschied: «pill+»- and «pill–»-Tage insgesamt errechnet die Software ein p = 0,014. Für den Zeitverlauf einen signifikanten Unterschied von p = 0,001. Die Interaktion von Pilleneinnahme und Zeit wird für die Wochen 3/4 und 9/10 als signifikant ausgegeben (p-Wert nicht genannt). Da die Wirkung hinsichtlich vier verschiedenen Parametern ausgewertet wurde (neben der Schlafzeit auch: Einschlaflatenz, Anzahl Aufwachepisoden, Wachheitsdauer nach dem ersten Einschlafen), wäre bei der Berechnung der Signifikanz wurde eigentlich eine Korrektur indiziert gewesen1, da die bescheidene Wirkung sonst ebenso gut ein rein zufälliges Resultat darstellen kann. Die von uns heiss geliebten p-Werte drücken aus, wie wahrscheinlich ein rein zufälliges Zustandekommen der Studienresultate aus statistischer Sicht ist. Für diesen Typ-I- oder Abbildung 4 Schlafzeit (Standard error of mean, SEM) mit (blau) oder ohne (rot) Plazeboeinnahme [3]. 1 Bonferoni-Transformation (Die ausgewiesene Signifikanz wird nach Massgabe der gleichzeitig untersuchten Parameter verringert): pBonferoni = p x Anzahl getestete Parameter x Anzahl getesteter Messpunkte. CURRICULUM «Alphafehler» werden in wissenschaftlichen Studien in der Regel Wahrscheinlichkeiten von 5% oder weniger akzeptiert. Somit dürfte deswegen im Schnitt jedes 20. signifikante statistische Analysenresultat nur zufällig zustande kommen. John P. A. Ioannidis kommt in einem Essay [6] zum Ergebnis, dass aus statistischen und methodischen Gründen die meisten publizierten Effekte gar nicht stimmen können. Abhängig von der Vorstudienwahrscheinlichkeit des geprüften Effektes, der Methodik und Power der Studie können bestenfalls Wahrscheinlichkeiten von 85% erwartet werden, dass der beschriebene Zusammenhang auch zutrifft, obwohl die ausgewiesene Signifikanz ja p <0,05 beträgt, d.h. die Wahrscheinlichkeit eines Irrtums somit nur 5% betragen sollte. Ein wichtiger Schritt war und ist sicher die doppelblinde Ausführung wissenschaftlicher Versuche, um die Befangenheit von Versuchsteilnehmern und -leitern zu neutralisieren. Die Tabelle 1 p listet sonstige wichtige Umstände auf, welche die Gültigkeit der gemachten Aussagen sinken lassen, im Extrem bis auf Werte um 1/10 000. Sie werden schnell merken, dass neben der Einschätzung der Vorstudienwahrscheinlichkeit der schwierigste Punkt die (Selbst-)Erkenntnis vorgefasster Meinungen ist. Wie war es damals mit den gross angelegten Studien zur Hormonsubstitution bei postmenopausalen Frauen zur Verhütung von Arteriosklerose und Alzheimer? Viele hielten solche Studien aus dem herrschenden Zeitgeist heraus für unethisch. Man dürfe den Frauen die segensreichen Hormone doch nicht vorenthalten! Und heute ist der Bösewicht jener, der geplagten Frauen vorschnell kombinierte Östrogene gibt. Fazit Die Post-Studien-Wahrscheinlichkeit, dass ein publizierter Effekt auch tatsächlich stimmt, beträgt bestenfalls 85%, und wenn der p-Wert auch noch so viele Nullen nach dem Komma ausweist. Tabelle 1. Negative Einflussfaktoren auf die Gültigkeit von in Studien gemachten Aussagen [6]. 1. Geringe Vorstudienwahrscheinlichkeit Schweiz Med Forum 2007;7:318–324 322 Vierter Gedanke Was ist ein Nozebo? Nebenwirkungen werden in den zwei Zolpidemstudien nur fragmentarisch beschrieben. In der ersten Studie erfahren wir lediglich, dass ein Patient unter Zolpidem die Studie abgebrochen hatte, allerdings geben die Autoren den Grund dafür nicht bekannt. In der zweiten, längeren Studie werden die folgenden Stundenabbrüche wegen Nebenwirkungen angegeben: 7 Patienten in der Zolpidemgruppe (1. starke Schläfrigkeit; 2. Kopfweh und Schwindel; 3. Stimmungsschwankungen und Angstgefühle; 4. Schlappheit; 5. Halluzinationen, 6. Kopfweh, 7. Halluzinationen) und 3 in der Plazebogruppe (1. Erkältung, 2. Alpträume, 3. Hautausschlag). Über Nebenwirkungen, die nicht zum Abbruch der Studie führten, erfahren wir leider nichts, ebenso wenig ist erwähnt, ob Nebenwirkungen systematisch erfragt wurden. Erinnern Sie sich noch an die Messgrössen der evidenzbasierten Medizin (EBM)? Die «Number needed to treat» (NNT) ist der Kehrwert der absoluten Risikoreduktion (ARR) und benennt diejenige Zahl von Patienten, die man gemäss einer definierten Studienanordnung (gleiche Dosis, gleiche Zeitdauer usw.) behandeln muss, um ein bestimmtes Ereignis zu verhindern. Das gilt dann auch für die unerwünschten Arzneimittelwirkungen (UAW). Dann spricht man von der Number needed to harm (oder besser: «number needed to treat to cause harm») (NNH). Diese Effekte gibt es natürlich auch bei einer Behandlung mit Plazebo, und man verwendet dort das Wort «Nozebo»2 [7]. Die Arbeitsgruppe um Winfried Rief von der Universität Marburg hat kürzlich nachgewiesen, dass die Häufigkeit bestimmter Medikamentennebenwirkungen in den Plazebogruppen verschiedener wissenschaftlicher Studien bis 13mal unterschiedlich beschrieben wird [8]. Aus prinzipiellen Gründen sollten UAW in Untersuchungen mit wohlverträglichen Mitteln unter Plazebo etwa gleich häufig vorkommen wie unter Verum. Die Häufigkeit spezifischer UAW ergibt sich dann aus der Gruppendifferenz. Der Umgang mit UAW ist somit ein Qualitätskriterium wissenschaftlicher Studien. Schon 1955 konstatierte Henry K. Beecher [9] die Notwendigkeit, UAW in wissenschaftlichen Studien systematisch zu erfassen. 51 Jahre später stellt Winfried Rief die gleiche Forderung! Wie wäre es, wenn die WHO ein welt- 2. Kleine Stichprobengrösse 3. Kleine Grösse des erwarteten Effekts (<33%) 4. Viele getestete Parameter, Messpunkte und/oder Subgruppen 5. Ungenau definierte Methodik 6. Interessenkonflikte und vorgefasste Meinungen 7. «Heisses» Thema (viele Gruppen mit ähnlicher Thematik befasst) 2 In Analogie zum Begriff «Plazebo» (ich werde [dir] gefallen, siehe oben) wurde das Wort «Nozebo» (ich werde [dir] schaden) geschaffen. Sie kennen das Wort «nocēre» möglicherweise aus dem Leitsatz des hippokratischen Eides: «primum [est] nil nocere», also: «Oberstes (Ziel der ärztlichen Kunst ist, dem Kranken mit therapeutischen Massnahmen) keinen Schaden zuzufügen.» CURRICULUM weites Register schaffen würde, in dem die Plazebodaten jeglicher Studien abgelegt werden können? Dies wäre doch ein wunderbarer Fundus, aus dem die Plausibilität von Studiendaten beurteilt werden könnte! Es kann auch in der hausärztlichen Praxis sinnvoll sein, Plazebos einzusetzen, um Nebenwirkungen zu untersuchen. Der Erstautor sah sich einmal genötigt, bei einer Gefässpatientin mit Cholesterinwerten von über 8 mmol/l, die auf jedes eingesetzte Statin unspezifische Nebenwirkungen zeigte, einen «n = 1»-Versuch3 durchzuführen. Die Patientin, die mit diesem Vorgehen einverstanden war, erhielt einfachblind 14 Tage lang Plazebo, dann 28 Tage Simvastatin 20 mg, und schliesslich wieder 14 Tage lang Plazebo. Da die von ihr beklagten Nebenwirkungen unter Plazebo ebenso häufig und gleich stark ausgeprägt waren wie unter Verum, liess sie sich überzeugen, das Medikament wieder einzunehmen. Das tut sie nun nach 5 Jahren noch immer, und das Gefäss ist glücklicherweise offen geblieben. Fazit UAW sind in vielen Studien schlecht dokumentiert, müssten aber bei wohlverträglichen Mitteln prinzipiell unter Plazebo praktisch ebenso häufig verzeichnet werden wie unter aktiven Therapien. Fünfter Gedanke Worin besteht eine Plazebowirkung im engeren Sinne? Eine neuere Arbeit beschreibt vier mögliche Mechanismen der Plazebowirkung [7]: – Erwartungshaltung (via Endophin-Freisetzung); – klassische Konditionierung; – bewusst vermittelte Reaktion; – Belohnungssystem. Offenbar gibt es Medikamente, die reproduzierbar zur Wirkung einen Plazeboeffekt benötigen. Der Cholecystokinin-Antagonist Proglumid (Endorphin-Facilitator) wirkt nicht, wenn er den Probanden versteckt verabreicht wird; der Patient muss wissen, dass er ein Schmerzmedikament erhält, sonst bewirkt das Medikament nichts. Dieser Effekt ist deutlich stärker als der Plazeboeffekt allein und kann mit dem OpiatAntagonisten Naloxon blockiert werden. Diese Berichte passen gut zur Beobachtung von Henry K. Beecher [9], der schon 1955 feststellte, dass Leute, die zuverlässig auf Plazebos ansprachen, häufig auch gut auf Opiate reagierten, während jene mit unzuverlässiger oder fehlender Reaktion auf das Scheinmedikament auch mehr Opiate für eine bestimmte analgetische Wirkung benötigten. Die globale Wirkung, welche Plazebos in wissenschaftlichen Studien auf Schweiz Med Forum 2007;7:318–324 323 die Symptome verschiedenster Erkrankungen erzielen können (Schmerzen, Husten, Depressionen, Angina pectoris, Kopfweh, Reisekrankheit, Angsterkrankung, Erkältung), bezifferte er auf ca. 35%, von denen die oben erwähnten Störfaktoren (Regression zum Mittelwert, HawthorneEffekt) allerdings wohl den grössten Teil ausmachen. In den Studien von Walsh und Mitautoren sind die Ergebnisse hinsichtlich Schlafqualität an Tagen mit oder ohne Plazeboeinnahme nicht verschieden. Als Limitation der Zolpidem-Studien beschreiben die Autoren, dass die Probanden möglicherweise die Pillen an Abenden eingenommen haben, an denen sie erwarteten, «besonders schlecht» zu schlafen, was einen möglicherweise doch vorhandenen Plazebo-Effekt verwischt haben könnte, indem die Versuchsteilnehmer die Tabletten immer dann einnahmen, wenn sie sich besonders ruhelos und «kribbelig» fühlten. Immerhin reflektiert das «Einnehmen bei Bedarf» recht gut das Verhalten unserer Patienten in der Realität, so dass diese Resultate praktische Bedeutung haben könnten. Arzneimittelwirkungen werden oftmals überschätzt. Das Setting von Interventionen nützt oftmals mehr als die Intervention selber. Beobachtete Plazebo- und Nozebo-Effekte beruhen auf verschiedenen Phänomenen. Sie sind teilweise bedingt durch statistische Selektionseffekte oder psychologische Faktoren im Rahmen des Studieneinschlusses. Die Einnahme von Plazebo (die Kapsel mit Laktosepulver!) an sich nützt kaum etwas; es ist deswegen vor den «ut-aliquid»4Therapien zu warnen. Andererseits ist es durchaus auch so, dass an sich wirkungslose Prozeduren «heil machen» können, wenn das Drum und Dran stimmt, so beobachtet bei Azulonliquidum-«Rollkuren» oder Kalzium/Vitamin-Ci.v.-Injektionen! Gesehen in der Praxis des Vorgängers und Lehrmeisters des Erstautors. Fazit Die in Studien ausgewiesenen Plazeboeffekte von ca. 35% dürfen nicht ungeschaut auf die Praxis übertragen werden. Wie viel das «Heilmittel Arzt» (und damit das Plazebo) per se taugt, müssen weitere Untersuchungen zeigen. Zum Schluss Wir hoffen, dass wir Ihnen helfen konnten, etwas Rüstzeug zu beschaffen für Ihren nächsten Kontakt mit «gefärbter» Information, um die seriösen Handelsreisenden unter den Marktfahrern 3 Ein «n = 1»-Versuch ist eine Studie mit einem einzigen Teilnehmer. 4 Genauer: «ut aliquid fieri videtur», zu Deutsch: «Um den Anschein zu erwecken, es geschehe etwas». CURRICULUM von den «Plazebo-Sängern» zu unterscheiden – und dass wir Sie mit unseren Ausführungen nebenbei auch etwas haben unterhalten können. Dank Ein herzlicher Dank gebührt Prof. Dr. med. Norbert Donner-Banzhoff, Abteilung für Allgemeinmedizin, präventive und rehabilitative Medizin, Schweiz Med Forum 2007;7:318–324 324 Prof. Dr. Winfried Rief, Fachbereich Psychologie, Philipps-Universität Marburg, und Dr. med. Etzel Gysling, Wil, für die kritische Durchsicht des Manuskriptes und Prof. N. Donner zudem für die Überlassung der Idee zur Abbildung 2. Literatur5 Korrespondenz: Markus Gnädinger Birkenweg 8 CH-9323 Steinach [email protected] 1 Walsh JK, Roth T, Randazzo MA, Erman M, Jamieson A, et al. Eight weeks of non-nightly use of zolpidem for primary insomnia. Sleep. 2000;23:1087–96. 2 Perlis ML, MaCall WV, Krystal AD, Walsh JK. Long-term, nonnightly administration of zolpidem in the treatment of patients with primary insomnia. J Clin Psychiatry. 2004;65: 1128–37. 3 McCall WV, Perlis ML, Tu X, Groman AE, Krystal AD, Walsh JK. A comparison of placebo and no-treatment during a hypnotic trial. Int J Clin Pharmacol Ther. 2005;43:355–9. 4 Kleist P. Vier Effekte, Phänomene und Paradoxe in der Medizin. SMF. 2006;6:1023–7. Available from: www.medicalforum.ch/pdf/pdf_d/2006/2006-46/2006-46-194.pdf. 5 Kleist P. Zehn Anforderungen an therapeutische Äquivalenzstudien. SMF. 2006;6:814–9. Available from: www.medicalforum.ch/pdf/pdf_d/2006/2006-37/2006-37-119.pdf. 6 Ioannidis JPA. Why most published research findings are false. PloS Med. 2005;2:696–701. Avilable from: http://medicine.plosjournals.org 7 Colloca L, Benedetti F. Placebos and painkillers: Is mind as real as matter? Nat Rev Neurosci. 2005;6:545–52. 8 Rief W, Avorn J, Barsky AJ. Medication-attributed adverse effects in placebo groups. Arch Intern Med. 2006;166:155–60. 9 Beecher HK. The powerful placebo. JAMA. 1955;159:1602–6. 5 Die im Internet nicht frei zugänglichen Referenzen können auf Wunsch via E-Mail beim Erstautor als pdf-File bezogen werden.