gms | German Medical Science

66. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS), 12. Jahreskongress der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e. V. (TMF)

26. - 30.09.2021, online

Clustering von chronisch entzündlichen Darmerkrankungen bei Kindern durch Methoden des maschinellen Lernens anhand des Registers CEDATA

Meeting Abstract

  • Nicolas Schneider - Justus-Liebig-Universität Gießen, Gießen, Germany
  • Klaus-Peter Zimmer - Justus-Liebig-Universität Gießen, Gießen, Germany
  • Keywan Sohrabi - Technische Hochschule Mittelhessen Gießen, Gießen, Germany
  • Ilse Broekaert - Universitätsklinikum Köln, Köln, Germany
  • Jan De Laffolie - Justus-Liebig-Universität Gießen, Gießen, Germany

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 66. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS), 12. Jahreskongress der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e.V. (TMF). sine loco [digital], 26.-30.09.2021. Düsseldorf: German Medical Science GMS Publishing House; 2021. DocAbstr. 156

doi: 10.3205/21gmds040, urn:nbn:de:0183-21gmds0403

Veröffentlicht: 24. September 2021

© 2021 Schneider et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Einleitung: Die zunehmende Inzidenz und die schwierige Versorgungssituation chronisch entzündlicher Darmerkrankungen (CED) bei Kindern und Jugendlichen führen zu wachsender Beachtung dieser Erkrankungs- und Patientengruppe in der medizinischen Versorgungsforschung. Im Rahmen des CED-KQN Projekts sollen, basierend auf dem digitalen klinischen Register CEDATA, intelligente Algorithmen konzipiert werden, die eine automatisierte oder Algorithmen unterstützte Differenzierung der Erkrankungen ermöglichen und dabei helfen, Diagnostik und Behandlung zu optimieren.

Methodik: Eingebracht in das Projekt wurde das bestehende CEDATA GPGE Register, dessen Daten zur Umsetzung der Studie durch Preprocessing sowie logische Prüfung aufbereitet und gefiltert wurden. Dabei wurden Daten von allen Entzündungslokalisationen zum Zeitpunkt der Erstdiagnose und während der Verlaufsuntersuchungen einzeln betrachtet und häufig verfügbare Laborwerte mit einbezogen. Es wurden verschiedene Methoden des „unsupervised learnings“ angewendet, mit dem Ziel Modelle zu erstellen, welche selbstständig Muster in den Daten finden und die einzelnen Beobachtungen in Gruppen einsortieren. Zudem wurde eine hierarchische Clusteranalyse durchgeführt, mit dem Ziel Abhängigkeiten einzelner identifizierter Gruppen zueinander zu identifizieren. Weitere Methoden umfassten eine Vektorquantisierung, t-verteilte stochastische Nachbareinbettung und dichtebasierte räumliche Clusteranalyse mit Rauschen. Zur zweidimensionalen Visualisierung wurde, wenn notwendig, eine Hauptkomponentenanalyse durchgeführt.

Ergebnisse: Es wurden vier unterschiedliche Methoden des unüberwachten Maschinellen Lernens auf alle Datensets angewendet. Während die Vektorquantifizierung zu einer räumlich gut visualisierbaren Trennung von Clustern kommt, so stimmt diese Unterteilung nicht mit den tatsächlichen Diagnosen überein. Sowohl die Nachbareinbettung als auch das dichtebasierte Clusterverfahren teilen die Daten in nicht klar differenzierte Gruppen auf, die in keinem erkennbaren Zusammenhang zu Diagnose stehen. Die hierarchische Clusteranalyse wurde in ein Dendrogramm visualisiert. Daraus lässt sich die Gliederung der Datensätze in drei größere Hauptgruppen nach dem dritten Vereinigungspunkt erkennen, ab welchem die Distanzen zum nächsten Punkt deutlich kleiner werden.

Diskussion: Die implementierten unüberwachten Modelle zeigen die Schwierigkeiten einer klaren Differenzierung von Diagnosen von Chronisch entzündlichen Darmerkrankungen anhand allgemein verfügbarer Parameter und ohne die zusätzliche Erhebung seltener Laborwerte. Die Algorithmen bilden Cluster, die im Fall der Vektorquantifizierung und der hierarchischen Clusteranalyse deutliche Abgrenzungen zwischen den Daten finden. Dies deutet auf weiter Möglichkeiten der Unterteilung von Chronisch entzündlichen Darmerkrankungen hin.

Schlussfolgerung: Unter Verwendung unüberwachten Maschinellen Lernens ist eine Differenzierung chronisch entzündlicher Darmerkrankungen mit den Daten des Registers CEDATA durchgeführt worden. Die Ergebnisse lassen auf die Existenz von Intra- und Interdiagnosegruppen schließen und auf weitere Verfeinerung der Modellierung und damit spezifischerer Diagnose- und Therapiemöglichkeiten hoffen.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass ein positives Ethikvotum vorliegt.