Datadiwan - Monophasische Prospektive Einzelfallstudie - Sind Wirksamkeitsnachweise in Anwendungsbeobachtungen unmöglich

Das Online-Magazin des DATADIWAN

Ausgabe Nr. 2 / November 1998 - ISSN 1435-1560

Sind Wirksamkeitsnachweise in Anwendungsbeobachtungen unmöglich?


Autor:	Dr. Helmut Kiene
Keywords:	Methodologie, Methodology, monophasische prospektive Einzelfallstudie, single-case studies, Wirksamkeitsnachweis, Naturheilkunde, Naturopathy, unkonventionelle Therapierichtungen, randomisierte placebokontrollierte Doppelblindstudie, Anwendungsbeobachtung,
Abstract:	Es werden in dieser elektronischen Publikation die Ergebnisse des Kreativsymposiums vom 15. und 16. Juni 1996 in Rosenfeld vorgestellt. Der Inhalt besteht aus vier einführenden Vorträgen zu Einzelfallstudien und der Wirksamkeitsbeurteilung; einer Diskussion, 14 Statements, vier methodologischen Grundlagenartikel zu Einzelfallstudien, dem "Joachim-Hornung-Forum. Zur Methodologie der Evaluation medizinischer Therapien" und weiteren Adressen und Internet Links zur Methodologie.
Copyright:	Patienteninformation für Naturheilkunde e.V., Berlin 1998



	Datadiwan Netzwerk

Startseite Symposium Rosenfeld

Definition der Anwendungsbeobachtung
Zweckbestimmung der Anwendungsbeobachtung
Wirksamkeitsbeurteilung, Wirksamkeitsbegründung,
Die Paradigmen der herrschenden Methodologie
Wie werden Kausalzusammenhänge erkannt?
Therapeutisches Kausalerkennen

Das Placeboargument
Das Verallgemeinerungsargument
Stellenwert des Wirksamkeitsnachweises
Sind Wirksamkeitsnachweise in Anwendungsbeochtungen möglich?
Literatur

Definition der Anwendungsbeobachtung
Im Arzneimittelgesetz und in den Arzneimittelprüfrichtlinien gibt es nur eine Stelle, an der das Wort „Anwendungsbeobachtung„ explizit genannt ist: Abschnitt 5 Nr.1 der Arzneimittelprüfrichtlinien [1]. Hier erfährt die Anwendungsbeobachtung eine implizite Begriffsbestimmung gemäß der klassischen Regel "definitio fit per genus proximum et differentiam specificam", d.h. ein Begriff wird definiert durch Einordung unter den jeweiligen Oberbegriff (genus proximum) und durch Unterscheidung gegenüber den gleichrangigen Nebenbegriffen (differentia specifica).
Der Oberbegriff ist der Begriff des "wissenschaftlichen Erkenntnismaterials", das "eine Beurteilung der therapeutischen Wirksamkeit und Unbedenklichkeit eines Arzneimittel in der angegebenen Dosierung unter Berücksichtigung der vorgesehenen Anwendungsbedingungen ermöglichen" soll, und zwar als "toxikologische, pharmakologische und klinische Unterlagen" [1].
Die Nebenbegriffe sind laut Arzneimittelprüfrichtlinie:

kontrollierte Studie;
nicht kontrollierte Studie;
Sammlung von Einzelfallberichten, die eine wissenschaftliche Auswertung ermöglichen;
nach wissenschaftlichen Methoden aufbereitetes medizi-nisches Erfahrungsmaterial.

Die Anwendungsbeobachtung (AWB) ist von diesen anderen Typen des wissenschaftlichen Erkenntnismaterials zu unterscheiden :

Die AWB ist erstens (im Gegensatz zur kontrollierten oder nicht-kontrollierten Studie) eine Therapiebeobachtung, die nicht in die alltägliche Behandlung des Arztes störend oder intervenierend eingreift; sie erfolgt ohne künstlich konstruierte Studiensituation.
Die AWB ist zweitens (im Gegensatz zur Sammlung von Einzelfallberichten) eine Beobachtung einer Kohorte von Patienten.
Die AWB ist drittens (im Gegensatz zu dem nach wissenschaftlichen Methoden nachträglich aufbereiteten Erkenntnismaterial) eine prospektiv dokumentierte Beobachtung.

Zusammenfassend läßt sich also die Anwendungsbeobachtung als eine zwar prospektiv geplante und strukturierte, jedoch nicht intervenierende Therapiebeobachtung an einer vorab definierten Kohorte von Patienten charakterisieren. (Siehe auch „Merkblatt für Anwendungsbeobachtungen„ des BPI.) [2,3]

Zweckbestimmung der Anwendungsbeobachtung
In Abschnitt 5 Nr. 1 der Arzneimittelprüfrichtlinie wird die Anwendungsbeobachtung als "wissenschaftliches Erkenntnismaterial" bezeichnet, das "eine Beurteilung der therapeutischen Wirksamkeit und Unbedenklichkeit eines Arzneimittel in der angegebenen Dosierung unter Berücksichtigung der vorgesehenen Anwendungsbedingungen ermöglichen" soll.
Da der Zweck der Prüfrichtlinie die Arzneimittelzulassung ist, scheint die primäre Zweckbestimmung der Anwendungsbeobachtung die Zulassung von Arzneimitteln zu sein. Andererseits aber kann eine Anwendungsbeobachtung natürlich nur mit bereits zugelassenen Arzneimitteln durchgeführt werden, weswegen auch in § 67 Abs. 6 AMG – worauf sich Abschnitt 5 Nr.1 der Arzneimittelprüfrichtlinien ausdrücklich bezieht – von Untersuchungen an zugelassenen oder registrierten Arzneimitteln die Rede ist. Dies ist ein scheinbarer Widerspruch, in dem sich aber eben die Situation der Arzneimitteladministration spiegelt, die man in Deutschland bei der Nachzulassung vorfindet: Es gibt eine Vielzahl von Arzneimitteln, die einerseits („fiktiv„) zugelassen, andererseits aber (definitiv) noch nicht zugelassen sind. Für diese (fiktiv zugelassenen) Arzneimittel kann tatsächlich die Anwendungsbeobachtung, formal gesehen, beides zugleich sein: ein Erkenntnisinstrument der Post Marketing Surveillance und ein Instrument der „Beurteilung der therapeutischen Wirksamkeit und Unbedenklichkeit„ in Hinblick auf eine (definitive) Zulassung.

Wirksamkeitsbeurteilung, Wirksamkeitsbegründung, Wirksamkeitsnachweis
Da die Anwendungsbeobachtung in den Arzneimittelprüfrichtlinien als ein Erkenntnisinstrument bestimmt ist, das auch der Beurteilung der therapeutischen Wirksamkeit dienen soll, stellt sich eine wichtige Frage: Kann diese Zweckbestimmung von einem nicht intervenierenden Beobachtungsverfahren erfüllt werden?
Zu berücksichtigen ist, daß in Gesetzestexten, Richtlinien und Stellungnahmen oft von unterschiedlichen Erkenntnisniveaus oder –orientierungen die Rede ist: Während in Abschnitt 5 Nr.1 der Arzneimittelprüfrichtlinien von einer Wirksamkeitsbeurteilung gesprochen wird, fordert das Arzneimittelgesetz in § 25 Abs. 2 Satz 1 Nr. 4 sowie in § 105 Abs. 4c für die Zulassung von Arzneimitteln eine Wirksamkeitsbegründung, und in Verbindung mit § 25 Abs. 2 Satz 3 von einem Wirksamkeitsnachweis. Darüber hinaus wurde, mit Blick auf die Anwendungsbeobachtung, in einer Stellungnahme des BPI zwischen einem konfirmativen und einem empirischen Nachweis unterschieden [4].
Gleichgültig aber, ob es sich um eine Beurteilung, eine Begründung oder um einen wie auch immer beschaffenen Nachweis einer Wirksamkeit handelt, es geht um therapeutisches Kausalerkennen: ob beurteilt (begründet, nachgewiesen) werden kann, daß zwischen der Arzneimittelapplikation und einer nachfolgenden Änderung des Krankheits- oder Symptomverlaufs ein Ursache-Wirkung-Zusammenhang besteht.
Die Frage ist: Kann eine solche Beurteilung (oder eine solche Begründung oder ein solcher Nachweis) mit einer Anwendungsbeobachtung geleistet werden?
Die nachfolgenden Ausführungen geben eine positive Antwort. Um diese Antwort zu begründen, müssen die Paradigmen des heute herrschenden Stands der medizinischen Methodenlehre und deren historische Entstehung kurz dargelegt werden.

Die Paradigmen der herrschenden Methodologie
Theorie und Praxis des heutigen Wirksamkeitsnachweises sind eingebunden in den Hintergrund der vorherrschenden Methodologie des Kausalerkennens. Diese Methodologie kann auf vier zugrundeliegende Paradigmen zurückgeführt werden:

Wissenschaftliches Kausalerkennen beruht auf experimentellem Forschen, d.h. nicht nur auf passivem Beobachten, sondern auf aktivem, intervenierendem, manipulierendem Beobachten (= Paradigma des Experiments - begründet durch Francis Bacon, 17. Jahrhundert [5]).
Wissenschaftliches Kausalerkennen beruht auf wiederholten Beobachtungen (= Paradigma der großen Beobachtungszahl - begründet durch David Hume, 18. Jahrhundert [6]).
Wissenschaftliches Kausalerkennen beruht auf Beobachtungen mit Vergleichsbeobachtungen (= Paradigma des Vergleichs bzw. der Differenzmethode - begründet durch John Stewart Mill, 19. Jahrhundert [7]).
Wissenschaftliches Kausalerkennen beruht nicht nur auf wiederholten Beobachtungen (siehe 2.) und nicht nur auf zusätzlichen Vergleichsbeobachtungen (siehe 3.), sondern darüber hinaus auf einer zumindest durchschnittlichen Vergleichbarkeit der beobachteten und verglichenen Objekte bzw. Probanden. Diese durchschnittliche Vergleichbarkeit (= Strukturgleichheit) könne nur durch Zufallszuteilung der Objekte bzw. Probanden auf die Vergleichsgruppen gewährleistet werden (= Paradigma der Randomisation – begründet durch Ronald Fisher, 20. Jahrhunderts [8]).

Auf die klinische Forschung übertragen, führen diese vier Paradigmen zu der Überzeugung, daß sicheres therapeutisches Kausalerkennen nur unter experimentellen Bedingungen (Studie), nur anhand wiederholter Beobachtungen (Kohortenstudie), nur durch Vergleichen (vergleichende Kohortenstudien) und nur bei genauer Vergleichbarkeit (randomisierte vergleichende Kohortenstudie) möglich sei.
Die genannte Entwicklung - von Bacon bis zu Fisher - fand ihren Kulminationspunkt in Ronald Fisher’s „The Design of Experiments„, mit dem er 1935 das Paradigma der randomisierten Studie schuf [8]. Diese Methodik der randomisierten Studie wurde zu einer professionellen Erkenntnistechnologie entwickelt. Gegenüber dieser Erkenntnistechnologie gerieten allerdings die Fragen der Erkenntnistheorie ins Hintertreffen. Es wurde nicht ausreichend abgeklärt, ob und wie ein Kausalerkennen auch außerhalb dieser Paradigmen möglich sei.

Wie werden Kausalzusammenhänge erkannt?
Die Paradigmen der herkömmlichen Methodologie legen nahe, daß verläßliches Kausalerkennen, insbesondere bei therapeutischen Maßnahmen, nicht ohne randomisierte Studie, zumindest nicht ohne Vergleichskontrolle und ohne wiederholte Beobachtung möglich ist. Die Literatur ist voll von entsprechenden dogmatischen Monopolansprüchen.
Der alleinige Gültigkeitsanspruch der herkömmlichen Methodenlehre war jedoch 1935, im Erscheinungsjahr von Fisher’s „The Design of Experiments„, bereits widerlegt durch Karl Dunckers "Zur Psychologie des produktiven Denkens", das u.a. die Methodik des Kausalerkennens untersucht [9]. Dunckers Ausgangsgedanke war, daß sich ein Kausalzusammenhang oft daran erkennen läßt, daß sich die Gestalt oder Struktur oder Qualität einer Ursache in der Gestalt oder Struktur oder Qualität der betreffenden Wirkung wiederfindet: der Rhythmus der Fingerbewegung im Rhythmus der Klopfgeräusche, die Nässe des Regens in der Nässe der Straße, das Profil des Reifens in der Reifenspur auf dem Feld. Man muß nicht erst einen Vergleich zwischen dem befahrenen Feld und einem unberührten Feld vornehmen und die Differenz zwischen beiden feststellen, nämlich die Reifenspur, um den Kausalzusammenhang zu erkennen. Weder benötigt man einen Vergleich, noch eine Vielzahl von Vergleichen, noch eine Randomisation. Es handelt sich um ein Kausalerkennen am Einzelfall, ein singuläres Kausalerkennen, das sich statt auf statistische Korrelation auf abbildende Korrespondenz gründet.
So wie eine statistische Korrelation, so ist auch eine abbildende Korrespondenz ein verläßlicher Indikator eines Kausalzusammenhangs, sofern diese Korrespondenz durch aktive Manipulation seitens des Wissenschaftlers oder des Wissenschaftlerteams erzeugt oder veranlaßt wird. Je komplexer hierbei die abgebildete Struktur, desto deutlicher hebt sich der Abbildungs-zusammenhang gegenüber den sonstigen Strukturen des jeweiligen Wahrnehmungsfeldes ab, und desto sicherer kann der betreffende Kausalzusammenhang als solcher erkannt werden. Es ist genau umgekehrt wie bei der statistisch-experimentellen Methode: Während beim statistischen Experiment die Ergebnisse desto verläßlicher sind, je einfacher der Zusammenhang zwischen Einflußfaktoren und Zielparametern ist (wenn möglich sollte nur ein einziger Einflußfaktor primär berücksichtigt werden), steigt beim abbildenden Experiment die Erkenntnissicherheit mit der Komplexität der Abbildung.
Die randomisierte Studie ist nichts anderes als eine Sonderform des abbildungsorientierten Kausalerkennens. Auch das randomisierte Experiment beruht letztlich auf dem Prinzip des Abbildens, wobei die abzubildende Struktur äußerst einfach ist. Die einfache Fragestellung ist, ob der bloße Unterschied zwischen der Behandlung des einen Kollektivs (z.B. Therapie A) und des anderen Kollektivs (z.B. Therapie Nicht-A) sich als ein (statistisch signifikanter) Unterschied zwischen den untersuchten Zielgrößen (z.B. therapeutischer Response) der beiden Kollektive abbildet. Da aber nur ein bloßer Unterschied abgebildet werden soll, und zwar wenn möglich nur ein einziger Unterschied, ergeben sich die Schwierigkeiten bei der Interpretation eines solchen Experiments. Denn natürlich gibt es im Umfeld der beiden Objektgruppen beliebig viele weitere Unterschiede zwischen irgendwelchen Faktoren. Deshalb können, zumindest theoretisch, alle diese Faktoren einen Unterschied der Zielparameter bewirken, und deshalb kann, streng genommen, ein Unterschied der Zielparameter nur dann als kausales Abbild des Unterschieds der Behandlungen interpretiert werden, wenn die Kautelen einer kontrollierten Studie erfüllt sind: wenn also erstens der Behandlungsunterschied vom jeweiligen Wissenschaftler oder Wissenschaftlerteam unter selbstgewählten Bedingungen selbst veranlaßt wird, und wenn zweitens der mögliche Einfluß aller sonstigen Faktoren gleichgeschal-tet ist. Für diese Gleichschaltung ist, sofern keine Hindernisse bestehen, die Randomisation das Verfahren der Wahl.
Die randomisierte Studie (die auf statistischer Korrelation beruht) ist also eine Sonderform der allgemeinen Methodik des Kausalerkennens (die auf abbildender Korrespondenz beruht); sie ist aber nicht die allgemeine Methode. Ronald Fishers Aussage in „The Design of Experiments„, daß mit dem Konzept der randomisierten Studie die allgemeinen Prinzipien des Experimentierens dargelegt seien – „the principles which are common to all experimentation„ – war falsch. In Wahrheit sind die Möglichkeiten sowohl des Experimentierens als auch des Kausalerkennens weiter gefaßt, als es in der konventionellen Methodologie veranlagt ist.

Therapeutisches Kausalerkennen
Die Methode des singulären, abbildungsorientierten Kausalerkennens findet auch in der Medizin vielfältigen Einsatz (z.B. bei Operationen von Darmstenosen, bei Verschraubungen, Schienungen, etc.), wenn die Gestalt der Verursachung (operati-ve Beseitigung der Stenose) sich in der Struktur der Wirkung (der Durchgängigkeit) unmittelbar beobachten läßt. Auch bei medikamentöser Therapie können verschiedenste struktu-relle Beziehungen auftreten, die sichere Wirksamkeitsbeurteilungen am Einzelfall erlauben, z.B. beim Auslaßversuch, bei intermittierender Behandlung, bei topischer Wirkung in einem einge-grenzt behandelten Areal (z.B. Dermatologie), bei Dosis-Wirkungs-Beziehung (z.B. Hochdruck-therapien, Schmerztherapien, verschiedene psychiatrische Therapien usw.), oder wenn sich beispielsweise bei der Leitungsanaesthesie das analgesierte Areal mit dem morphologischen Ausbreitungsgebiet der behandelten Nerven deckt. Es gibt eine Vielzahl solcher Möglichkeiten der validen Wirksamkeitsbeurteilung am Einzelfall, vor allem auch im Bereich der Besonderen Therapierichtungen [10]. Diese Methoden der Wirksamkeitsbeurteilung werden von den Praktikern seit jeher benutzt, sie wurden aber in der Methodologie nicht ausreichend reflektiert.
Manche Formen des singulären Kausalerkennens können in ihrer Aussagekraft gesteigert werden, wenn mehrmals beobachtet wird. Dies kann für das Feststellen von Dosis-Wirkungs-Beziehungen gelten, oder auch wenn man sich bei der Therapiebeurteilung auf das Verhältnis des Zeitverlaufs der behandelten Symptomatik oder Erkrankung vor und nach Einsetzen der Be-handlung stützt: Wenn die Zeitdauer der Symptomatik vor Behandlungsbeginn vergleichsweise sehr lange war im Vergleich zu der Zeitdauer nach Behandlungsbeginn (z.B. mehrere Monate im Vergleich zu einigen Tagen) hat man beim einzelnen Patienten einen starken Hinweis auf Wirksamkeit der Behandlung. Wenn aber solche Beobachtun-gen bei mehreren konsekutiv behandelten Patienten gemacht werden, erhält diese Wirksamkeitsbeurteilung geradezu Beweiskraft [11]. (Voraussetzungen: Es müssen alle behandelten Patienten dokumentiert werden, damit kein selection bias entsteht; es muß ausreichend eindeutig erkennbar sein, ob bzw. in welchem Maße das behandelte Symptom vorliegt, damit kein observer bias erzeugt wird; und es müssen die Zeitpunkte von Behandlungsbeginn und Besserungsbeginn bei den verschiedenen Patienten desynchron sein.) Um mit solchen Methoden therapeutische Kausalzusammenhänge zu erfassen, muß man Beobachtungen an mehreren Patienten anstellen, benötigt aber keine Kontrollgruppe. Verschiedenste Formen statistischer Auswertung sind hierfür denkbar.
Sobald man durchschaut, daß therapeutisches Kausalerkennen auf der Grundlage des Prinzips der abbildenden Korrespondenz auch ohne Vergleichskontrolle und sogar am Einzelfall möglich sein kann, eröffnet sich ein weites Feld für methodologische Kreativität.
Prinzipiell gibt es vier verschiedene Ansätze für therapeutisches Kausalerkennen: erstens am Einzelpatient ohne Vergleichskontrolle (wie oben beschrieben), zweitens am Einzelpatient mit Vergleichskontrolle (wobei der Einzelpatient als Phasenkollektiv erfaßt wird, z.B. im „N-of-1 randomized trial„), drittens am Kollektiv ohne Vergleichskontrolle (wie soeben beschrieben), und viertens am Kollektiv mit Vergleichskontrolle (wie z.B. in der randomisierten Studie).
Jene Formen des therapeutischen Kausalerkennens, die ohne Vergleichskontrolle möglich sind – sei es am Einzelpatienten oder am Kollektiv - können natürlich auch im Rahmen von Anwendungsbeobachtungen zum Tragen kommen. Es ist deshalb klar, daß Wirksamkeitsnachweise in Anwendungsbeobachtungen möglich sind.
Man mag vielleicht argumentieren, daß am Einzelpatient oder am Kollektiv ohne Vergleichskontrolle zwar kurzfristige Wirkungen, aber nicht heilende Wirksamkeit beobachtet werden könne. Es gibt jedoch viele Wirkungen, die selbst bereits die erwünschte Wirksamkeit umfassen, z.B. die Schmerzreduktion. Die Unterscheidung von Wirkung und Wirksamkeit ist kein pauschal gültiges Argument gegen mögliche Wirksamkeitsnachweise in Anwendungsbeobachtungen.
Andere Argumente, wie das Placebo- und das Verallgemeinerungsargument, seien nun noch eingehender berücksichtigt.

Das Placeboargument
Ein wichtiges Argument gegen die Verläßlichkeit von Wirksamkeitsnachweisen am Einzelfall oder in Anwendungsbeobachtungen ist das Placeboargument. Seit Henry K. Beecher 1955 seine berühmte Arbeit "The Powerful Placebo" [12] publizierte, gilt es als wissenschaftliches Faktum, daß man bei einem Drittel und mehr aller Patienten, und zwar bei verschiedensten Erkrankungen, allein mittels Placebogabe einen zufriedenstellenden therapeutischen Effekt auslösen könne. Das Placeboargument besagt, daß - wegen der Häufigkeit der Placeboeffekte - der Arzt am individuellen Patienten prinzipiell nicht wissen könne, ob ein Therapieerfolg das Ergebnis der spezifischen Therapiebemühung ist oder nur ein Placeboeffekt. Infolgedessen sei eine verläßliche Wirksamkeitsbeurteilung nur in Blindstudien möglich, keinesfalls aber unter offenen Alltagsbedingungen.
In Wirklichkeit aber ist die Sache umgekehrt: Nicht die Ärzte urteilen hier im allgemeinen falsch, sondern die Wissenschaftler. Es gibt wohl keine zweite Sparte der medizinischen Literatur, in der sich falsches Zitieren, methodische Sorglosigkeit und Leichtgläubigkeit in einem ähnlich überwältigenden Maße findet wie in der Placeboliteratur. Die vielfältig publizierten Behauptungen über Häufigkeit und Ausmaß des Placeboeffekts sind maßlos übertrieben. In unserer eigenen Arbeitgruppe [13,14] wurden über 800 Publikationen der Placeboliteratur kritisch durchgesehen hinsichtlich der Frage, ob in den betreffenden Studien tatsächlich, wie allgemein behauptet, ein therapeutischer Placeboeffekt nachgewiesen sei. Die Analyse der Literatur zeigte, daß, im Gegensatz zu den weitverbreiteten Behauptungen, außer beim Asthma bronchiale, nicht in einer einzigen Studie ein therapeutischer Placeboeffekt überzeugend demonstriert wurde. Für die meisten Untersuchungen zum Placeboeffekt kann bei sorgfältiger Analyse sogar der Umkehrschluß geleistet werden: daß nämlich mit großer Plausibilität kein therapeutischer Placeobeffekt aufgetreten war. Es läßt sich eine Vielzahl von Faktoren zeigen, die einen Placeboeffekt vortäuschen können, wie Spontanverlauf der Erkrankung, regression to the mean, begleitende Therapiemaßnahmen, Gefälligkeitsauskünfte, experimentelle Unterordnung, gravierende methodologische Mängel der Studien, falsches Zitieren usw. ([Für Details siehe 13,14]). Das Placeboargument gegen die Wirksamkeitsbeurteilung am Einzelfall ist jedenfalls nicht stichhaltig. Seine Dominanz in der methodologischen Diskussion ist nicht berechtigt.

Das Verallgemeinerungsargument
Wenn ein therapeutischer Kausalzusammenhang an einem einzelnen Patienten erfaßt wird, dann ist dieser Kausalzusammenhang nur einmal dargestellt. Dasselbe gilt allerdings auch für eine randomisierte Studie. Die randomisierte Studie wird gerade deshalb oft pauschal gefordert, weil ein Kausalerkennen am Einzelfall angeblich prinzipiell nicht möglich sei. Unter dieser Voraussetzung aber kommt innerhalb einer randomisierten Studie eine Kausalerkenntnis an den einzelnen Prüfobjekten (z.B. Patienten) nicht in Betracht. Demnach kann man, sogar wenn eine randomisierte Prüfung ein positives Ergebnis erbringt, nicht wissen, bei welchen einzelnen Studienpatienten das Prüfmittel wirksam war. Folglich kann man - wenn man die herrschende Methodenlehre ernst nimmt - auch nicht wissen, bei wie vielen Patienten dieser Studie das Arzneimittel wirksam war. Deshalb bietet z.B. eine Studie mit je 50 Patienten in Prüf- und Kontrollgruppe nicht mehrere (z.B. 50), sondern nur einen einzigen Beleg der Arzneimittelwirksamkeit. Sogar wenn Tausende von Probanden in einer randomisierten Studie enthalten sind, ist damit noch nichts reproduziert. Es wird oft übersehen, daß die Vielzahl der Probanden in einer solchen Studie nicht benötigt wird, um zu reproduzieren, sondern um den therapeutischen Kausalzusammenhang einmal darzustellen.
Das Verallgemeinerungsargument kann also nicht speziell gegen die Verläßlichkeit der Wirksamkeitsbeurteilung an einzelnen Patienten ins Feld geführt werden, weil es sonst in gleicher Weise auch gegen die randomisierte Studie vorgebracht werden müßte. Wenn man sagt, Therapiererfolge an einzelnen Patienten würden nichts für künftige Patienten besagen, so kann man mit gleicher Berechtigung sagen, daß ein randomisierter Wirksamkeitsnachweis nichts für künftige Paitentenkollektive bedeute (und erst recht nicht für zukünftige einzelne Patienten).

Stellenwert des Wirksamkeitsnachweises
Im Gesamtzusammenhang der therapeutischen Erkenntnisgewinnung und –begründung lassen sich drei verschiedene Funktionen des Wirksamkeitsnachweises festmachen:
1. Ein Wirksamkeitsnachweis kann das Konstatieren eines therapeutischen Ursache-Wirkung-Zusammenhangs sein.
Das Konstatieren einer therapeutischen Kausalität kann, wie gesagt, am Einzelpatient oder am Patientenkollektiv erfolgen, und zwar mit oder ohne Vergleichskontrolle. Welche Form des Wirksamkeitsnachweises im einzelnen möglich und angemessen ist, muß im konkreten Fall entschieden werden.
2. Ein Wirksamkeitsnachweis kann das Reproduzieren eines früher bereits erfolgten Wirksamkeitsnachweises sein.
Während das Reproduzieren eines Wirksamkeitsnachweises durch randomisierte Studien rasch auf ethische Barrieren stößt [15, 16], bestehen solche Grenzen nicht für Wirksamkeitsnachweise ohne Vergleichskontrollen. Vor allem Anwendungsbeobachtungen sind dafür geeignet, um Aussagen über die Häufigkeit von Therapieerfolgen zu treffen („Effektivitätsforschung„).
3. Ein Wirksamkeitsnachweis kann als Grundlage für die Abschätzung zu erwartender Therapieerfolge bei künftigen Patienten dienen. Abschätzungen künftiger Therapieerfolge sind auf der Basis empirischer Untersuchungen immer mit Ungewißheiten belastet: Es stellen sich Fragen der externen Validität, der Umsetzbarkeit der Untersuchungsergebnisse für die speziellen Behandlungsbedingungen und –fähigkeiten des jeweiligen Arztes und für die individuelle Situation des Einzelpatienten. Während aber der einzelne Arzt in seiner täglichen Praxis die Ergebnisse einer kontrollierten Studie im Prinzip nicht überprüfen kann, kann er singuläre Wirksamkeitsnachweise oder Aussagen zur Behandlungseffektivität durchaus überprüfen, nämlich entweder durch subjektive Erfahrungsbildung oder durch explizite Dokumentation in Form einer Anwendungsbeobachtung.

Sind Wirksamkeitsnachweise in Anwendungsbeobachtungen unmöglich?
Möglichkeiten und Aussagekraft einer Anwendungsbeobachtung sind abhängig von den methodologischen Vorzeichen. Zwar sind aus Sicht der konventionellen Methodenlehre in Anwendungsbeobachtungen keine Wirksamkeitsnachweise möglich, es kommt aber den zugrundeliegenden Paradigmen dieser Methodologie keine ausschließliche Gültigkeit zu. Demgegenüber eröffnen die grundlegenden Prinzipien des Kausalerkennens, wie sie in Anlehung an die Gestalttheorie entwickelt werden können, gänzlich neue Perspektiven für Anwendungsbeobachtungen. Es zeigt sich, daß Wirksamkeitsnachweise in Anwendungsbeobachtungen durchaus möglich sein können.
Für die Zukunft der Anwendungsbeobachtung könnte die hier aufgezeigte Perspektive verstärkt genutzt und ausgebaut werden.
Wirksamkeitsnachweise an einzelnen Patienten – basierend auf der Methode der abbildenden Korrespondenz – könnten exemplarisch in Anwendungsbeobachtungen einbezogen sein. Eine andere Möglichkeit wäre z.B., vorab definierte Untergruppen der betreffenden Patienten nach der o.g. Methode des Vergleichs der Symptomdauer oder Auftretenshäufigkeit vor und nach Behandlungsbeginn auszuwerten. Besonders zu beachten ist, daß unterschiedliche Formen der Wirksamkeitsbeurteilung innerhalb einer einzigen Anwendungsbeobachtung kombiniert werden können, um die Aussagekraft zu steigern. Nicht zuletzt wird es auch eine Frage der methodologischen Intelligenz und Phantasie sein, ob und in welchem Maße für eine bestimmte therapeutische Maßnahme sich Wirksamkeitsnachweise im Rahmen von Anwendungsbeobachtungen realisieren lassen. Anwendungsbeobachtungen könnten auf diese Weise jedenfalls eine zunehmend gewichtigere Bedeutung für die Medizin erhalten.
Ein kürzliches Rundschreiben des BPI sagte, es sei „von größtem Interesse, die Erkenntnisse aus Anwendungsbeobachtungen zur Wirksamkeit präziser zu formulieren und die Möglichkeiten eines empirischen Wirksamkeitsnachweises darzustellen„. Diese Aussage ist mit Nachdruck zu bekräftigen. Indem jene Forderung des BPI mit dem Hinweis auf einen „Unterschied zwischen konfirmatorischem und empirischem Nachweis„ verbunden war, wurden zu Recht die bislang unterentwickelten Möglichkeiten von Wirksamkeitsnachweisen außerhalb kontrollierter Studien betont. Sollte jedoch die Zukunft, wovon auszugehen ist, entsprechende methodologische Neuentwicklungen bringen, dann werden allerdings auch die terminologischen Kategorien (wie „empirisch„, „explorativ„, „konfirmativ„ etc.) in Bewegung geraten.

Abschließend sei festgehalten, daß Anwendungsbeobachtungen – wegen ihres nicht intervenierenden Charakters – für die vielfältigen Fragestellungen des Post Marketing Surveillance geeignet sind [17] und, im Prinzip, auch Wirksamkeitsnachweise enthalten können. In dieser Hinsicht ist die Anwendungsbeobachtung von Bedeutung vor allem für die Nachzulassung, denn hierfür sind kontrollierte Studien aus vielfältigen Gründen kaum durchführbar [18]. In welchem Maße es in der einzelnen Anwendungsbeobachtung gelingt, einen Wirksamkeitsnachweis, eine Wirksamkeitsbegründung oder einen Beitrag zu einer Wirksamkeitsbeurteilung zu liefern, ist von Fall zu Fall jeweils neu zu klären.

Literatur

Bundesanzeiger Nr.244 1994; Allgemeine Verwaltungsvorschrift zur Änderung der allgemeinen Verwaltungsvorschrift zur Anwendung von Arzneimittelprüfrichtlinien vom 29.12.1994
Sickmüller B, Kleist H. Merkblatt für Anwendungsbeobachtungen. Pharm.Ind. 1991;53(6):529-.
Sander A, Sickmüller B. Merkblatt für Anwendungsbeobachtungen. Pharm.Ind. 1997;59(1):1-22-1/23.
Sickmüller, B. and Becker S. Bundesverband der Pharmazeutischen Industrie: Stellungnahme zu der geplanten Publikation "Empfehlungen zur Planung und Durchführung von "Anwendungsbeobachtungen" der Ad-hoc-Kommission "AWB" des Präsidiums der GMDS (Stand 18.12.96). 1997;
Bacon F. Novum Organon. London, England: 1620.
Hume D. An Enquiry Concerning Human Understanding. 1758.
Mill J. A System of Logic, Ratiocinative and Inductive. 1843.
Fisher R. The Design of Experiments. Edinburgh, Scotland: Oliver&Boyd; 1935.
Duncker K. Zur Psychologie des produktiven Denkens. Berlin: Springer Verlag; 1935.
Kiene H, Schön-Angerer T. Single case causality assessment as a basis of clinical judgement. Alt.Ther.Med.Health 1998;4(1):41-47.
Kiene H. Eine Methode zur Wirksamkeitsbeurteilung bei kleinen Patientenzahlen. Der Merkurstab 1996;49(4):277-9.
Beecher HK. The powerful placebo. J.A.M.A. 1955;159:1602-6.
Kienle GS, Kiene H. Placeboeffekt und Placebokonzept - eine kritische methodologische und konzeptionelle Analyse von Angaben zum Ausmaß des Placeboeffekts. Forsch.Komplementärmed. 1996;3:121-38.
Kienle GS, Kiene H. The Powerful Placebo Effect: Fact or Fiction. Journal of Clinical Epidemiologie 1997;50(12):1311-1318.
Burkhardt R, Kienle G. Kienle G, Burkhardt R, editors.Der Wirksamkeitsnachweis für Arzneimittel. Analyse einer Illusion. Stuttgart: Urachhaus; 1983; Kontrollierte Versuche und ärztliche Ethik.
Kiene H. Ärztliche Individualethik und randomisierte Studien. [Editorial]. Therapeutikon 1993;7(7/8):283-.
Bethge H. Arzneimittelforschung nach der Zulassung. Welchen Stellenwert hat die Anwendungsbeobachtung? Therapiewoche 1991;36:2240-50.
Kiene H, Kalisch M. Wissenschaftliche Dogmen bei der Nachzulassung von Arzneimitteln in der Bundesrepublik Deutschland. Dtsch. Apothek. Z. 1996;136(28):2365-70.

Anm.:
Dieser Text erschien als Beitrag für FÄPI-intern Heft 2/1998 (gekürzt nach Pharm. Ind. 59, Nr. 9, 1997, S. 737 – 741).

Startseite Symposium Rosenfeld

Layout: Datadiwan eMail: webmeister@datadiwan.de