gms | German Medical Science

GMS Zeitschrift für Hebammenwissenschaft

Deutsche Gesellschaft für Hebammenwissenschaft e.V. (DGHWi)

ISSN 2366-5076

Eine neue Methode als Entscheidungshilfe bei unklarer wissenschaftlicher Evidenz: Test-Implementierung und Simulation

Originalarbeit

Suche in Medline nach

  • corresponding author Christine Loytved - Institut für Hebammen, Department Gesundheit, Zürcher Hochschule für Angewandte Wissenschaften, Winterthur, Schweiz
  • Rebecca Erdin - Institut für Hebammen, Department Gesundheit, Zürcher Hochschule für Angewandte Wissenschaften, Winterthur, Schweiz

GMS Z Hebammenwiss 2018;5:Doc01

doi: 10.3205/zhwi000011, urn:nbn:de:0183-zhwi0000111

Dieses ist die deutsche Version des Artikels.
Die englische Version finden Sie unter: http://www.egms.de/en/journals/zhwi/2018-5/zhwi000011.shtml

Eingereicht: 20. September 2017
Angenommen: 16. April 2018
Veröffentlicht: 28. Dezember 2018

© 2018 Loytved et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Hintergrund: Viele Gesundheitsfachpersonen kennen Ergebnisse von Reviews wie etwa die der Cochrane Collaboration. Manche Ergebnisse dieser Reviews zeigen, dass (noch) kein Vorteil für eine von zwei vielversprechenden Interventionen erkannt wird. In diesem Fall schlagen Beck-Bornholdt und Dubben den Algorithmus einer modifizierten never-change-a-winning-team Strategie vor. Ähnliche Methoden werden für die Gruppenzuteilung in Studien oder für die Anpassung des Studiendesigns im Verlauf einer Studie genutzt.

Forschungsfrage: Ist die von Beck-Bornholdt und Dubben (2003) vorgeschlagene Methode für den Praxisalltag der Hebammen tauglich, bei der Wahl zwischen zwei in der Literatur als gleichwertig erscheinenden Interventionen eine sinnvolle Entscheidungshilfe zu bieten?

Methodik: Die Anwendung des Algorithmus wird für eine mögliche Anwendung durch Gesundheitsfachpersonen simuliert. Er bezieht alle Erfahrungen ein, die mit den beiden zu vergleichenden Interventionen gemacht werden, um die Intervention für die nächste zu behandelnde Person festzulegen.

Ergebnisse: Für verschiedene Szenarien mit unterschiedlichen Erfolgswahrscheinlichkeiten der beiden Interventionen wurden Simulationen durchgeführt. Die durchschnittliche Erfolgsrate ist dabei in allen Szenarien bereits ab der zweiten zu behandelnden Person besser als die mittlere Erfolgsrate der beiden Interventionen.

Schlussfolgerung: Die vorliegenden Ergebnisse sollen als Diskussionsgrundlage für die Anwendbarkeit der vorgeschlagenen Methode dienen. Bei unklarer wissenschaftlicher Evidenz aus Metaanalysen kann der Algorithmus die Entscheidung von Gesundheitsfachpersonen für eine von zwei Behandlungsmöglichkeiten gewinnbringend unterstützen. Der Subjektivität des eigenen Settings (Klientel, Durchführungsweise der Behandlung) wird dabei stets Rechnung getragen.

Schlüsselwörter: Algorithmus, Intervention, Hebammenforschung


Hintergrund

In der Hebammenarbeit rückt die Frage der Evidenzbasierung immer weiter in den Vordergrund. Die Berücksichtigung der drei Säulen (wissenschaftliche Evidenz, Erfahrung der Hebamme und Einstellung der Klientinnen) wird von den Hebammen selbst gefordert und von dritter Seite verlangt – sei es von Seiten anderer Berufsgruppen oder von Seiten der Klientinnen. Doch gibt es zu manchen Themen, wie beispielsweise Sodbrennen in der Schwangerschaft, keine klare Aussage zur wissenschaftlichen Evidenz, die eine einzige Intervention, welche aus einem Handeln oder auch aus einem Nicht-Handeln bestehen kann, favorisiert. Evidenzbasierte Leitlinien wie etwa die des National Institute for Health and Care Excellence (NICE) oder systematische Übersichtsarbeiten wie die der Cochrane Collaboration bieten zu manchen Themenfeldern Empfehlungen, die unterschiedliche Interventionen in einer bestimmten Situation zulassen. Dies ist insbesondere dann der Fall, wenn aufgrund der Studienlage für keine der getesteten Interventionen eine Überlegenheit zu erkennen ist. So ist bei Sodbrennen in der Schwangerschaft ungeklärt, ob Akupunktur hilft oder eine Umstellung der Ernährungsgewohnheiten anzuraten ist [8]. Gerade bei Themen, die keine schwerwiegende Intervention wie eine Oxytocingabe bei Geburtseinleitung, sondern weniger invasive Maßnahmen betreffen, ist auch nicht zu erwarten, dass sich die Studienlage zeitnah verbessern wird. In solchen Fällen, in denen Reviews bzw. Leitlinien zum Schluss kommen, dass das eine wie das andere Verfahren zum Erfolg führen kann, sollten Hebammen ein Hilfsmittel an die Hand bekommen, welches ihnen die Entscheidung für eine der Interventionen in ihrem Arbeitsalltag erleichtert. Da die Studienlage in solchen Fällen nur eine eingeschränkte Entscheidungshilfe bietet, ist es angeraten, die in der eigenen bisherigen Praxis erfahrene, interne Evidenz für die Entscheidung zu nutzen. Das heißt, die Erfolge und Misserfolge, die im Zusammenhang mit einer Intervention erlebt werden, sollten für zukünftige Entscheidungen sinnvoll mit einbezogen werden.

Beck-Bornholdt und Dubben [2] schlagen als mögliche Lösung einen Algorithmus vor, eine abgewandelte „never-change-a-winning-team“ Strategie. Die Idee dieses Algorithmus ist es, die Entscheidung, welche Intervention bei der nächsten Klientin mit einer betreffenden Diagnose angewendet werden soll, nach einem bestimmten Schema zu treffen: Es soll jeweils aufgrund aller bisher (mit den beiden zur Wahl stehenden Interventionen) gemachten Erfahrungen entschieden werden. Diese Idee, auch bezeichnet als „play-the-winner rule“, bezieht sich auf Werke von Bayes [1] und Wold [11], wobei ähnliche Vorgehensweisen bereits früher beschrieben worden sind [12]. Das Theorem von Bayes wurde für folgende Anwendungen vorgeschlagen:

1.
für die Erstellung einer Regel für den Fall, dass es bei einer Zwischenergebnislage ethisch erforderlich ist, eine randomisiert kontrollierte Studie zu stoppen;
2.
für die Ermittlung der geeigneten Medikamentendosen für eine randomisiert kontrollierte Studie sowie
3.
für die Interpretation der Evidenz aus der Studienlage [10].

Ähnliche Vorgehensweisen werden für die Gruppenzuordnung von Studienteilnehmer/innen [6], die Anpassung des Studiendesigns im Verlauf einer Studie [4] und für Evaluationen im Gesundheitswesen diskutiert [10]. Beck-Bornholdt und Dubben [2] nutzen das Theorem von Bayes, indem sie die bisher beobachteten Erfolge und Misserfolge als Entscheidungshilfe bei der Wahl zwischen zwei als gleichwertig erachteten Interventionen miteinbeziehen. Eine solche Anwendung als Entscheidungshilfe in der Praxis der Gesundheitsberufe ist bislang nicht bekannt. Die Anwendung des Algorithmus für die abgewandelte „play-the-winner rule“ sollte so benutzerfreundlich wie möglich gestaltet werden. Zu denken wäre an die Entwicklung einer App, in die nur die jeweiligen Interventionen und deren Erfolge eingetragen werden müssten. Ihre Anwendung sollte jedoch nicht starr sein und keinesfalls das Selbstbestimmungsrecht der Klientin einschränken. Sie könnte lediglich ein wirksames Mittel sein, den von der Hebamme sonst ohne systematische Verarbeitung gewonnenen Erfahrungsschatz auf manchen Gebieten schneller und effektiver zu erzeugen.


Ziel und Fragestellung

Wenn aufgrund von systematischen Übersichtsarbeiten und evidenzbasierten Leitlinien die Aussage abzuleiten ist, dass zwei Interventionen gleichwertig vielversprechend sein könnten, sollen Hebammen (und andere Berufe im Gesundheitswesen) eine Entscheidungshilfe nach dem aktuellsten Wissensstand erhalten, um ihrer Klientel die bestmögliche Betreuung zu bieten. Das Selbstbestimmungsrecht der Klientin soll dabei nicht angetastet werden. Auch die individuelle Situation der Klientin soll berücksichtigt werden. Wenn nach Abwägung aller Faktoren keine eindeutige Entscheidung für die eine Intervention und gegen die andere gefällt wurde, soll die Hebamme eine Hilfestellung erhalten. Es geht demnach darum, welche Empfehlung die Hebamme im Rahmen der gemeinsamen, informierten Entscheidung („informed shared decision making“) abgibt. Wird diese Empfehlung umgesetzt, gewinnt die Hebamme wieder eine Erfahrung für ihre zukünftigen Empfehlungen hinzu.

Die Fragestellung der vorliegenden Arbeit lautet daher: Ist die von Beck-Bornholdt und Dubben [2] vorgeschlagene Methode für den Praxisalltag der Hebammen tauglich, bei der Wahl zwischen zwei in der Literatur als gleichwertig erscheinenden Interventionen eine sinnvolle Entscheidungshilfe zu bieten?


Methode

Der Algorithmus für die abgewandelte „play-the-winner rule“ geht folgendermaßen für die Wahl der anzuwendenden Intervention vor:

1.
Bei der ersten Klientin wird eine der beiden Interventionen zufällig als Startintervention bestimmt (bspw. Münzwurf). Diese sei hier IS genannt.
2.
Solange IS erfolgreich ist, wird sie für die jeweils nächste Klientin beibehalten.
3.
Bei erstmaligem Misserfolg von IS wird zur anderen Intervention gewechselt. Diese sei hier IA genannt.
4.
IA wird wiederum für die jeweils nächste Klientin beibehalten, solange sie erfolgreich ist.
5.
Ab dem erstmaligen Misserfolg von IA wird für jede weitere Klientin die Wahlwahrscheinlichkeit α für eine der beiden Interventionen berechnet, hier wiederum αS und αA genannt.

Formel 1

mit

Formel 2

wobei w die Anzahl Wechsel zwischen den beiden Methoden sei und sich die Erfolgsrate (Success rate) der einzelnen Interventionen folgendermaßen berechnet (Anzahl der Erfolge geteilt durch Anzahl der Anwendungen):

Formel 3a Formel 3b

Mithilfe einer Zufallszahl zwischen 0 und 1, hier z genannt, und einer der beiden Wahlwahrscheinlichkeiten αS und αA wird dann die diesmal zu wählende Intervention bestimmt. Wir erläutern hier die Vorgehensweise anhand von αS; genauso gut könnte αA verwendet werden (da immer gilt: αA=1αS entspricht αS=1–αA):

if z≤αS → select IS for next client

if z>αS → select IA for next client

In Worte gefasst bedeutet dies also: Zunächst einmal sammelt der Algorithmus mit beiden Interventionen erste Erfahrungen. Sobald Informationen über die Erfolgswahrscheinlichkeiten der beiden Methoden vorliegen, werden diese sich vermehrenden Informationen für jede nächste Entscheidung mit einbezogen. Je erfolgreicher sich eine Intervention in den gemachten Erfahrungen im Vergleich zur anderen Intervention gezeigt hat, desto häufiger wird sie gewählt. Und diese Präferenz wird mit zunehmenden Erfahrungen mit den beiden Methoden (Anzahl Wechsel) verstärkt. Dank der Vorgehensweise mit der Zufallszahl für die Wahl der Intervention wird jedoch auch die bisher weniger erfolgreiche Intervention ab und zu wieder einmal zum Zug kommen. Dieses Verhalten ist wichtig, da es durchaus vorkommen kann, dass die eigentlich erfolgreichere Intervention sich bei den ersten Erfahrungen zufälligerweise als weniger erfolgreich zeigt. Durch die wiederholten Anwendungen beider Interventionen werden sich die beobachteten Erfolgsraten im Verlauf der Zeitreihe immer mehr den wahren Erfolgsraten annähern. Für eine sinnvolle Anwendung dieses Algorithmus müssen folgende Bedingungen erfüllt sein:

  • Es ist unklar, welche der beiden Interventionen in der betreffenden Situation vorzuziehen ist; es gibt keine wissenschaftliche Evidenz dafür, dass die eine der beiden Interventionen besser geeignet sein könnte als die andere.
  • Alle Klientinnen haben nach der Beurteilung der Hebamme die gleiche Ausgangslage, die sich für die Durchführung der ausgewählten Interventionen eignen würde. Sie zeigen in der Regel dieselben im Voraus definierten Symptome.
  • Der Erfolg/Misserfolg der Intervention muss klar benennbar sein und immer nach denselben, von der Hebamme im Voraus definierten Kriterien bestimmt werden. Hier fließen subjektive Faktoren sowohl von Seiten der Klientin als auch von Seiten der Hebamme mit ein. Diese sind jedoch Teil der Methode, denn es geht um die Frage: Welche Intervention ist in meiner Praxis erfolgversprechend?
  • Die Klientinnen kommen zeitlich nacheinander und der Erfolg/Misserfolg der vorhergehenden Klientin ist bei der nächsten Klientin bereits bekannt.

Selbstverständlich kann es sich bei den beiden zu vergleichenden Interventionen auch um eine Intervention versus eine Nicht-Intervention (beispielsweise bei Sodbrennen in der Schwangerschaft: Akupunktur versus keine Behandlung) handeln, oder um dieselbe Intervention in verschiedenen Dosierungen (beispielsweise verschiedene Beratungsinhalte zum Kaffeekonsum in der Schwangerschaft [5]).

Für die Simulation in der vorliegenden Arbeit wird die Entscheidung zwischen Quark und Kohl bei verstärkter initialer Brustdrüsenschwellung in der Stillzeit als Beispielszenario verwendet. Die Sicherheit in der Diagnosestellung wird dabei vorausgesetzt. In der entsprechenden Leitlinie [3] wird konsentiert:

„Aufgrund langjähriger Erfahrungen aus der Praxis können Auflagen in Form von Kühlkissen, Kohlblättern oder Quark sowie die Anwendung einer Tiefdruckmassage zur symptomatischen Behandlung eingesetzt werden.“

Ein Cochrane Review [7] bezieht sich ebenfalls auf verschiedene Maßnahmen bei Brustdrüsenschwellung, darunter auch unterschiedliche Kohlapplikationen: Bei Vergleichen von Kohl in Raumtemperatur versus gekühlten Kohlblättern, von gekühlten Kohlblättern versus kalten Packungen und von Kohlcreme versus Placebocreme wurden keine Unterschiede festgestellt. Alle Maßnahmen erzielten eine gewisse Linderung. Zu Quark wurde keine Studie eingeschlossen.

Um die Funktionsweise des Algorithmus simulieren zu können, nehmen wir an, dass wir die wahren Erfolgsraten von Quark und Kohl kennen würden und bestimmen willkürlich, dass Quark die erfolgreichere Methode sei. Der Erfolg sei für unser Simulationsbeispiel als vollständiger Rückgang der Rötung und Schwellung nach 24 Stunden Behandlung festgelegt. Wir testen sechs unterschiedliche Szenarien mit je einer erfolgreicheren (Quark) und einer weniger erfolgreichen Intervention (Kohl). Die gewählten Erfolgsraten (siehe Tabelle 1 [Tab. 1]) werden auf verschiedenen Niveaus angesiedelt (im unteren, mittleren und oberen Prozentbereich) und die Differenz in der Erfolgsrate je einmal mit 5 und einmal mit 17 Prozentpunkten angesetzt. Die verwendeten Erfolgsraten haben nichts mit den tatsächlichen (unseren Wissens nach bislang unbekannten) Erfolgsraten von Quark und Kohl bei verstärkter initialer Brustdrüsenschwellung in der Stillzeit zu tun, sondern sind frei erfunden für die Veranschaulichung des Algorithmus.

Für jedes der sechs Simulationsszenarien mit den vorgegebenen Erfolgsraten wurden 10.000 Simulationen für eine Reihe von 300 aufeinanderfolgenden Klientinnen gestartet: Für jede Klientin wurde als Behandlungserfolg eine Zufallszahl ausgegeben („gewürfelt“), wobei die Wahrscheinlichkeit, mit der ein Erfolg verbucht werden konnte, der vorgegebenen Erfolgsrate entsprach.

Alle Simulationen und Analysen in dieser Studie wurden mit der Statistik Software R durchgeführt [9].


Ergebnisse

In den folgenden beiden Abschnitten werden die Ergebnisse der Simulation von Klientinnenreihen mit dem Algorithmus beschrieben. Im ersten Abschnitt zeigen wir drei Beispiele von simulierten Reihen, im zweiten Abschnitt werden die mittleren Erfolgsraten aus allen 10.000 Simulationen für die sechs verschiedenen Szenarien präsentiert und verglichen.

Beispiele von Simulationsreihen

Abbildung 1 [Abb. 1] zeigt ein Beispiel einer Simulation mit dem Algorithmus für die ersten 100 Klientinnen. Es ist eine der 10.000 gerechneten Simulationen für das Szenario mit den mittleren Erfolgsraten und dem größeren Unterschied zwischen den Erfolgsraten der beiden Interventionen, in dem die Erfolgsrate für Quark bei 57% und diejenige für Kohl bei 40% angesetzt ist.

In diesem ersten Beispiel wurde mit der Zufallsauswahl (Schritt 1 des Algorithmus, vgl. Abschnitt Methode) Quark als Startintervention gewählt. Die Quarkanwendung führte bei der ersten fiktiven Klientin zum Erfolg, bei der zweiten nicht, weshalb für die dritte Klientin zu Kohl gewechselt wurde (Schritt 3 des Algorithmus, vgl. Abschnitt Methode). Auch bei Kohl zeigt sich zunächst ein Erfolg, danach bei der vierten fiktiven Klientin ein Misserfolg. Ab der fünften Klientin wurde also jede weitere Entscheidung aufgrund der jeweiligen aktuellen Wahlwahrscheinlichkeiten α für die beiden Interventionen Quark und Kohl und einer Zufallszahl gefällt (Schritt 5 des Algorithmus, vgl. Abschnitt Methode). Kohl hatte unter den ersten vier Anwendungen nur einmal einen Erfolg gezeigt, Quark hingegen zwei Mal. Quark wird deshalb in der Folge viel öfter gewählt als Kohl. Aber auch Kohl kommt im Laufe der Reihe noch zwei Mal zum Zug, was dem Mechanismus mit der Zufallszahl zu verdanken ist.

Die simulierten Reihen – wie auch tatsächliche Anwendungen eines solchen Algorithmus – sehen durch die Natur des Zufalls jedes Mal anders aus. Für Abbildung 2 [Abb. 2] haben wir zwei weitere Reihen desselben Simulationsszenarios wie in Abbildung 1 [Abb. 1] (fiktive Erfolgsraten für Quark 0.57 und für Kohl 0.40) aus den 10.000 Simulationen gewählt zur Darstellung dieser Unterschiedlichkeit. Bei beiden wurde Kohl als Startintervention gewählt und bei beiden zeigte dieser einen Erfolg, gefolgt von einem Misserfolg. Die darauffolgende Quark-Anwendung zeigte in beiden Fällen keinen Erfolg, worauf in beiden Reihen Kohl wieder zum Zug kommt und einen Misserfolg zeigt. Trotz dieser gleichen Ausgangssituation unterscheiden sich die Reihen ab der fünften Klientin beträchtlich. In der Simulationsreihe von Abbildung 2 [Abb. 2] zeigt Kohl per Zufall am Anfang viele Erfolge und wird deswegen bis etwa zur 60. Klientin vorwiegend gewählt. Hier zeigt sich die Wichtigkeit des Mechanismus mit der Zufallszahl, der dazu führt, dass trotz der vermeintlichen Überlegenheit von Kohl auch Quark hin und wieder gewählt wird. Dadurch kann sich – früher oder später, in diesem Beispiel nach ca. 60 Anwendungen – die tatsächliche Überlegenheit von Quark zeigen und der Algorithmus entscheidet auf lange Frist trotz dieser ersten Erfahrungen vorwiegend für Quark. In der Simulation auf dem unteren Diagramm von Abbildung 2 [Abb. 2] hingegen zeigt Kohl gerade andersherum per Zufall viele Misserfolge in den ersten Anwendungen und wird deshalb schon nach wenigen Klientinnen nur noch in Ausnahmefällen gewählt.

Mittlere Erfolgsraten in den Simulationsszenarien

Die Beispiele im vorhergehenden Abschnitt sollen illustrieren, wie einzelne Anwendungen des Algorithmus aussehen und wie verschieden Anwendungsreihen des gleichen Szenarios (gleiche wahre Erfolgsraten) sein können. Um etwas über die Güte des Algorithmus aussagen zu können, betrachten wir nun in diesem Abschnitt nicht mehr einzelne Simulationen, sondern die mittleren Erfolgsraten über 10.000 Simulationen desselben Szenarios.

Abbildung 3 [Abb. 3] zeigt die mittlere Erfolgsrate des Algorithmus für das bereits im vorhergehenden Abschnitt verwendete Szenario mit den Erfolgsraten der beiden Interventionen im mittleren Bereich. Die grünen horizontalen Linien markieren die zugrundegelegten fiktiven Erfolgsraten der beiden Interventionen: 0.57 für Quark und 0.40 für Kohl. Die blaue Linie bei 0.485 entspricht der mittleren Erfolgsrate, wenn man die Hälfte der Klientinnen mit der einen, die andere Hälfte mit der anderen Intervention behandeln, also z.B. abwechselnd Quark und Kohl verwenden würde. Die maximal erreichbare mittlere Erfolgsrate entspricht in diesem Szenario 0.57, der Erfolgsrate von Quark. Die Punkte in Abbildung 3 [Abb. 3] zeigen die tatsächlich beobachteten Erfolgsraten für die erste bis dreihundertste Klientin gemittelt über die 10.000 durchgeführten Simulationen. Für die erste Klientin liegt diese mittlere Erfolgsrate per Definition auf der blauen Linie, bei 0.485, da ja in der Hälfte der Fälle Quark und in der anderen Hälfte der Fälle Kohl als Startintervention gewählt wird. Bereits ab der zweiten Klientin liegt die mittlere Erfolgsrate jedoch über dieser durchschnittlichen Erfolgsrate der beiden Interventionen. Die beobachteten mittleren Erfolgsraten in diesem Simulationsszenario streuen um eine stetig steigende Kurve, die sich auf lange Sicht dem Optimum von 0.57 annähert. Der Anstieg ist anfangs steil und wird dann immer flacher. Die Streuung entsteht durch Zufallsschwankungen, weil hier „nur“ 10.000 Simulationen durchgeführt wurden. Je mehr Simulationen man verwenden würde, desto kleiner würde diese Streuung werden.
In andere Worte gefasst: Bereits ab der zweiten Klientin kann der Algorithmus die Erfahrung, die man mit der ersten Klientin gemacht hat, gewinnbringend einsetzen. Und mit jeder weiteren Klientin lernt der Algorithmus weiter, so dass die Erfolgschance für jede weitere Klientin etwas weiter ansteigt.

In gleicher Weise wie in Abbildung 3 [Abb. 3] sind in Abbildung 4 [Abb. 4] für alle sechs Simulationsszenarien (siehe Tabelle 1 [Tab. 1]) die mittleren Erfolgsraten aus den 10.000 Simulationen pro Szenario berechnet und für eine Reihe von 300 Klientinnen dargestellt.

Die Diagramme oben in Abbildung 4 [Abb. 4] zeigen die beiden Szenarien mit den kleinen Erfolgsraten für beide Interventionen, die mittleren Diagramme die Szenarien mit den mittleren Erfolgsraten und die unteren beiden Diagramme die Szenarien mit den hohen Erfolgsraten. In den Diagrammen auf der linken Seite sind die drei Szenarien mit dem größeren Unterschied von 17 Prozentpunkten, in den Diagrammen auf der rechten Seite diejenigen mit dem kleineren Unterschied von 5 Prozentpunkten zwischen den Erfolgsraten der beiden Interventionen dargestellt. Der Lerneffekt des Algorithmus bereits ab der zweiten Klientin und der stete Anstieg der mittleren Erfolgsrate mit Annäherung an das Optimum sind bei allen Szenarien zu beobachten. Der Vergleich der linken mit den rechten Diagrammen in Abbildung 4 [Abb. 4] zeigt, dass bei den Szenarien mit nur kleinem Unterschied zwischen den Erfolgsraten der beiden Interventionen die Streuung deutlich stärker ist. Vor allem im Szenario mit den mittleren Erfolgsraten ist sie so groß, dass die eigentliche Kurve nur noch undeutlich erkennbar ist. Außerdem zeigt der Vergleich auch, dass der Algorithmus bei den Szenarien mit den größeren Unterschieden in der Erfolgsrate deutlich schneller lernt als bei denjenigen mit den kleineren Unterschieden. Dies ist auch intuitiv einleuchtend: Wenn Quark in Wirklichkeit sehr viel erfolgreicher ist als Kohl, ist das schneller feststellbar, als wenn Quark nur ein bisschen erfolgreicher ist als Kohl.

Der Vergleich zwischen den Szenarien mit den kleinen, mittleren und hohen Erfolgsraten der beiden Interventionen (Abbildung 4 [Abb. 4]) zeigt, dass der Lerneffekt in den Szenarien mit den kleinen und hohen Erfolgsraten schneller ist als in denjenigen mit den mittleren. Das kommt daher, dass bei Unterschieden in festen Prozentpunkten, wie wir sie für die Szenarien gewählt haben, der relative Unterschied im mittleren Prozentbereich am kleinsten ist. Bei kleinen Erfolgsraten ist er groß, bezogen auf die Erfolge; bei großen Erfolgsraten bezogen auf die Misserfolge. Und diese vergleichsweise großen relativen Unterschiede in den Erfolgsraten bei den Szenarien im tiefen und hohen Prozentbereich führen dazu, dass der Algorithmus schneller lernen kann, welche der beiden Interventionen die erfolgreichere ist.


Diskussion

Die Frage danach, ob es eine für den Praxisalltag der Hebammen taugliche Methode gibt, die zwischen zwei als gleichwertig erscheinenden Interventionen Entscheidungshilfe bietet, kann positiv beantwortet werden.

Es wird immer Themen geben, für die Reviews und Leitlinien (noch) keinen eindeutigen Vorteil einer Maßnahme gegenüber einer anderen möglichen Intervention darstellen können und sie als gleichwertig empfehlen. Wahrscheinlichkeitsberechnungen wie der hier vorgestellte Algorithmus könnten Hebammen in solchen Situationen eine sinnvolle Entscheidungshilfe bieten. Der Subjektivität des eigenen Settings (Klientel, Durchführungsweise der Behandlung) wird dabei stets Rechnung getragen. Die gemeinsame, informierte Entscheidung wird dadurch nicht beeinträchtigt, sondern eher dadurch bereichert, dass die Hebamme die von ihr gemachten Erfahrungen in Zahlen fassen kann.

Interventionsalternativen mit großen Unterschieden sind nicht zu erwarten, denn sie wären bereits in einer Metaanalyse aufgefallen und in die wissenschaftliche Evidenz eingegangen. Je nach Anzahl der Fälle und damit der gemachten Erfahrungen, aber auch je nach Überlegenheit einer Intervention wird den ratsuchenden Frauen etwas später oder etwas früher vorwiegend die überlegene Intervention angeboten. Wie erwähnt, bevorzugt der Algorithmus bereits ab der zweiten Anwendung häufiger die erfolgreichere Intervention. Eine Hebamme benötigt daher in ihrer eigenen Praxis nicht so viele Fälle wie in den gezeigten Simulationen.

Zu den Vorteilen dieses Algorithmus gehört es, dass er durch das laufende Einbeziehen aller verfügbaren Erfahrungen seinen Vorschlag zur Intervention wählt. Es kann allerdings nicht dargelegt werden, bei welchen Interventionen in welchen Zielgruppen wie viele Fälle benötigt werden, um festzulegen, welche Intervention durchgängig empfohlen werden sollte. Wie erläutert, werden sich die beobachteten Reihen von Entscheidungen für die eine oder andere Intervention und von Erfolgen und Misserfolgen bei jeder Anwendung unterscheiden. Dies liegt zum einen in der Natur des Zufalls, da jedes Mal wieder andere Klientinnen mit anderen Voraussetzungen nacheinander beobachtet werden, zum anderen in der Art der Anwendung durch verschiedene Hebammen. Diese Aspekte können als Limitationen der Methode verstanden werden.

Ein solches Vorgehen eignet sich auch nicht für alle Fragen in der Geburtshilfe, denn Erfolg bzw. Misserfolg der Intervention müssen eindeutig zu beurteilen sein und zwar relativ zeitnah, bevor die nächste Klientin mit vergleichbarem Behandlungsbedarf erscheint. Als vorteilhaft einzustufen ist es, dass dieses Vorgehen auch bei Maßnahmen geeignet ist, die nur kleine Erfolgsraten aufweisen.


Schlussfolgerungen

Im Sinne der allgemeinen Bemühungen, evidenzbasiert zu arbeiten, könnte eine solche Methode für die eigene Praxis eine sinnvolle Ergänzung zu den vorhandenen Leitlinien, Reviews und Studienergebnissen darstellen, wenn in Metaanalysen Interventionsalternativen als wirksam beschrieben werden. Sie hilft bei der Auswahl der Alternative, welche in der Praxis der Hebamme die größere Wirksamkeit hat. Die Hebamme wird nie mit letzter Sicherheit sagen können, dass Intervention A, die in manchen Fällen auch die gekonnte Nichtintervention bedeuten kann, grundsätzlich wirksamer ist als Intervention B, aber ihr Vorgehen beruht immer auf den bisherigen Erkenntnissen. Diese Anwendung könnte auch auf ganze Hebammen- oder Klinikteams übertragen werden. Mit diesem Vorgehen würde eine Entscheidungsgrundlage in der Praxis geschaffen werden, die jedoch nicht als statisch anzusehen ist, sondern sich laufend an die Empfehlungen aktueller Leitlinien und Reviews anpassen soll. Für Hebammen und andere Berufe im Gesundheitswesen, die ihre eigenen Erfahrungen strukturiert erfassen und systematisch umsetzen wollen, könnte dies ein geeignetes Hilfsmittel sein. Die Methode wurde allerdings bislang noch nicht in der Praxis erprobt. Reaktionen der Leserschaft auf diesen Artikel werden daher von den Autorinnen mit besonderem Interesse aufgenommen.


Anmerkungen

Anmerkung der Herausgeberin

Auf Anregung beider Reviewerinnen wurde Herr Dubben angeschrieben und gebeten, einen Kommentar zum Einsatz der von ihm und Herrn Beck-Bornholdt vorgestellten Methode zu verfassen. Leider konnte der Kommentar bis zum Zeitpunkt der Publikation nicht eingeholt werden.

Interessenkonflikt

Die Autorinnen erklären, dass keine Interessenkonflikte vorliegen.


Literatur

1.
Bayes M, Price M. An Essay towards Solving a Problem in the Doctrine of Chances. By the Late Rev. Mr. Bayes, F.R.S. Communicated by Mr. Price, in a Letter to John Canton, A.M.F.R.S. Philosophical Transactions. 1763;53:370–418. DOI: 10.1098/rstl.1763.0053 Externer Link
2.
Beck-Bornholdt HP, Dubben HH. Der Schein der Weisen: Irrtümer und Fehlurteile im täglichen Denken. 7th ed. Reinbeck: Rowohlt Taschenbuch Verlag; 2003. German.
3.
Deutsche Gesellschaft für Gynaekologie und Geburtshilfe (DGGG). S3 Leitlinie: Therapie entzündlicher Brusterkrankungen in der Stillzeit; 2013. [Zugriff/access Jun 2018] Verfügbar unter/available from: http://www.awmf.org/uploads/tx_szleitlinien/015-071l_S3_Therapie_entz%C3%BCndlicher_Brustentz%C3%BCndungen_Stillzeit_2__2013-02_01.pdf. German. Externer Link
4.
Huskins WC, Fowler VG, Evans S. Adaptive Designs for Clinical Trials: Application to Healthcare Epidemiology Research. Clin Infect Dis. 2018;66(7):1140–6. DOI: 10.1093/cid/cix907 Externer Link
5.
Jahanfar S, Jaafar SH. Effects of restricted caffeine intake by mother on fetal, neonatal and pregnancy outcomes. Cochrane database Syst Rev. 2015;(6):CD006965. DOI: 10.1002/14651858.CD006965.pub4 Externer Link
6.
Liang Y, Carriere KC. Stratified and randomized play-the-winner rule. Stat Methods Med Res. 2008;17(6):581–93. DOI: 10.1177/0962280207081606 Externer Link
7.
Mangesi L, Zakarija-Grkovic I. Treatments for breast engorgement during lactation. Cochrane database Syst Rev. 2016;(6):CD006946. DOI: 10.1002/14651858.CD006946.pub3 Externer Link
8.
Phupong V, Hanprasertpong T. Interventions for heartburn in pregnancy. Cochrane database Syst Rev. 2015;(9):CD011379. DOI: 10.1002/14651858.CD011379.pub2 Externer Link
9.
R Core Team. R - A language and environment for statistical computing. Vienna: R Foundation for Statistical Computing; 2014 [Zugriff/access Jun 2018]. Verfügbar unter/available from: http://www.R-project.org/ Externer Link
10.
Spiegelhalter DJ. Incorporating Bayesian Ideas into Health-Care Evaluation. Statistical Science. 2004;19(1):156–74.
11.
Wold HOA. A study in the analysis of stationary time series. Stockholm: Almqvist & Wiksell; 1938.
12.
Zelen M. Play the Winner Rule and the Controlled Clinical Trial. Journal of the American Statistical Association 1969;64(325):131–46. DOI: 10.1080/01621459.1969.10500959 Externer Link