gms | German Medical Science

64. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

08. - 11.09.2019, Dortmund

Maschinelles Lernen in der innovativen Patientenberatung: Klassifikation und Vorhersage von menstrualen Blutungsmustern für Anwenderinnen eines intrauterinen Wirkstofffreisetzungssystems

Meeting Abstract

  • Ann-Kathrin Frenz - Bayer Pharma AG, Wuppertal, Germany
  • Christiane Ahlers - Bayer Pharma AG, Wuppertal, Germany
  • Vita Beckert - Bayer Pharma AG, Berlin, Germany
  • Christoph Gerlinger - Bayer Pharma AG, Berlin, Germany
  • Tim Friede - Universitätsmedizin Göttingen, Göttingen, Germany

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 64. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Dortmund, 08.-11.09.2019. Düsseldorf: German Medical Science GMS Publishing House; 2019. DocAbstr. 185

doi: 10.3205/19gmds020, urn:nbn:de:0183-19gmds0204

Veröffentlicht: 6. September 2019
Veröffentlicht mit Erratum: 8. Oktober 2019

© 2019 Frenz et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Eine Methode zur langfristigen Schwangerschaftsverhütung ist die Hormonspirale, auch intrauterines System genannt. Nach dem Einsetzen der Spirale in die Gebärmutter kann es durch das freigesetzte Hormon Levonorgestrel zu Veränderungen des individuellen menstrualen Blutungsmusters kommen. Besonders in den ersten Wochen der Anwendung besteht das Potential einer höheren Intensität und Unregelmäßigkeit der Menstruationsblutung, was zu einer Verunsicherung der Anwenderin führen kann. Eine unzureichende Aufklärung kann die Zufriedenheit mit der Verhütungsmethode, deren Akzeptanz und Gebrauch beeinträchtigen.

Somit ist es von Interesse zu diesem Zeitpunkt Informationen über die voraussichtliche weitere Entwicklung des Blutungsmusters weiterzugeben um der Anwenderin die Möglichkeit einer aufgeklärten Einschätzung zu geben. Da die Auswirkungen des Hormons auf die Menstruationszyklen stark zwischen den Nutzenrinnen variieren kann jedoch keine pauschal gültige Aussage bezüglich der Entwicklung des zukünftigen Blutungsmusters getätigt werden. Es besteht somit der Bedarf einer individualisierten Information der zu erwartenden Entwicklung des Blutungsmusters. Für diesen Zweck wurde ein Random Forest erstellt, welcher eine individuelle Vorhersage des zukünftigen Blutungsmusters trifft.

Für die Analyse werden Daten von 1351 Anwenderinnen aus zwei randomisierten, klinischen Studien verwendet. Zusätzlich zu den Informationen tagesgenauer Blutungstagebücher über 365 Tage werden demographische und anamnestische Informationen verwendet.

Zunächst werden Gruppen von Anwenderinnen mit ähnlichem Blutungsverhalten in den Anwendungsmonaten 4-9 identifiziert, welche im Folgenden als Zielvariablen in der Erstellung eines Klassifikationsverfahrens dienen. Dieses wird entwickelt, um basierend auf den Baselinedaten, also den verfügbaren Informationen bis zum dritten Behandlungsmonat, eine der Blutungsmustergruppen vorhersagen. Die Ähnlichkeit des Blutungsverhaltens in den Monaten 4-9 wird anhand von Blutungshäufigkeiten und Regularität festgelegt. Bezüglich der Blutungshäufigkeit werden für Anwenderinnen relevante Trennstellen identifiziert; die komplexe Bestimmung der Zyklusregularität einer Anwenderin basiert auf einem Zeitreihenmodell.

Aufgrund der Vielzahl an möglichen Einflussfaktoren wurde auf Methoden des maschinellen Lernens zurückgegriffen. Zur Auswahl eines geeigneten Vorhersagemodells werden verschiedene Methoden miteinander verglichen. Dazu zählen Ansätze wie k-nearest Neighbor, Support Vector Maschinen und Naive Bayes, deren Performance anhand einer 3-fachen Kreuzvalidierung gemessen wird.

Da der Random Forest Ansatz mit einer korrekten Klassifikation von über 70% die besten Ergebnisse hervorbringt, wird er im weiteren Verlauf der Analyse verwendet, um basierend auf Baselinevariablen sowie abgeleiteten Parametern aus den vorhandenen Blutungstagebüchern die zukünftigen Blutungsmuster vorherzusagen. Zur Validierung der Performance-Rate wird das berechnete Modell außerdem auf weiteren unabhängigen Daten geprüft. Die Daten von zusätzlichen 1516 Probandinnen stammen ebenfalls aus klinischen Studien zu Hormonspiralen des gleichen Hormons, jedoch mit anderen Dosierungen. Die Performance erweist sich mit ca. 70% als konsistent. Die Implementierung der erstellten Modelle ist als Smartphone App geplant, sodass die Ergebnisse in der Praxis Anwenderinnen und Ärzten zur Verfügung stehen. Dies hätte den Vorteil einer individualisierten Patientenberatung und kann gegebenenfalls Verunsicherungen der Anwenderinnen mindern und eine verbesserte Beratung schaffen. Als Nachteil des angewandten Verfahrens sei zu nennen, dass aus dem finalen Modell keine Aussage über das Gewicht der verschiedenen Einflussfaktoren getroffen werden kann. Nichtsdestotrotz stellt der Random Forest aufgrund der Vielzahl der Einflussfaktoren und der guten Performance eine geeignete Modellwahl dar.

AKF, CA, VB und CG sind Vollzeitangestellte der Bayer AG. Die Bayer AG bzw. deren Tochterunternehmen stellen Levonorgestrel-beladene Spiralen (Hormonspiralen) her. TF ist Berater von Bayer (u.a. als Mitglied von Data Monitoring Committees), aber außerhalb der hier betrachteten Indikation.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Erratum

Angaben zu Interessenkonflikten wurden ergänzt.