gms | German Medical Science

67. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS), 13. Jahreskongress der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e. V. (TMF)

21.08. - 25.08.2022, online

Untersuchung der Zusammenführbarkeit von Metadaten der klinischen Versorgung zur Entwicklung einer standardisierten Transformation zwischen verschiedenen Formaten

Meeting Abstract

  • Caroline Bönisch - Universitätsmedizin Göttingen, Göttingen, Germany
  • Tibor Kesztyues - University Medical Center Göttingen, Göttingen, Germany
  • Dorothea Kesztyüs - Universitätsmedizin Göttingen, Göttingen, Germany

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 67. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS), 13. Jahreskongress der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e.V. (TMF). sine loco [digital], 21.-25.08.2022. Düsseldorf: German Medical Science GMS Publishing House; 2022. DocAbstr. 4

doi: 10.3205/22gmds028, urn:nbn:de:0183-22gmds0281

Published: August 19, 2022

© 2022 Bönisch et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Im Zuge der umfangreichen Erhebung von Daten in der klinischen Versorgung haben auch die zugehörigen Metadaten an Bedeutung gewonnen. Daten zusammen mit ihren Metadaten bilden die Grundlage für personalisierte Medizin und medizinische Forschung sowie Versorgungsforschung. Metadaten dienen als Hilfsmittel, Daten auffindbar, zugänglich, interoperabel und nachnutzbar (FAIR) zu gestalten. Innerhalb der klinischen Versorgung werden jedoch diverse Datenformate mit entsprechend heterogenen Metadatenschemata in den vielfältigen Primärsystemen verwendet. Ziel des hier vorgestellten Vorhabens ist es zu prüfen, inwieweit die heterogenen Metadatenformate ineinander überführt werden können. Um diese Überführbarkeit zu erfassen ist eine Gegenüberstellung der Metadatenformate notwendig. Damit kann die Grundlage geschaffen werden, um sowohl Forschern, als auch Klinikern, den Zugang zu Informationen verschiedener Formate zu ermöglichen und verknüpfte Daten verwenden bzw. auswerten zu können.

Methodik: Methodisch wird das Vorhaben ergänzt durch eine systematische Literaturrecherche in Pubmed unter Verwendung der MeSH Terms „metadata“, „data warehousing“, „health information interoperability/standards“, „health information exchange/standards“, „information storage and retrieval/methods”, „medical records systems, computerized“ und der freien Suchwörtern „standard*“, „open standard*“, „metadata repository“, „data integration“, „open EHR“, „CDISC“, „FHIR“, „OMOP“. Diese Suche wurde nach entsprechender Anpassung der Suchbegriffe auch in Embase via Ovid durchgeführt.

Zusätzlich wurden wissenschaftliche Abhandlungen via Google Scholar zum Mapping von Metadaten in die Literaturrecherche einbezogen. Nach erfolgter Literaturrecherche und Sichtung der gefundenen Referenzen wurden die identifizierten Datenmodelle mit ihren Metadatenfeldern vergleichend beurteilt und im Vier-Augen-Prinzip geprüft. Die Auswahl der Datenformate erfolgte auf Basis der häufig verwendeten Datenformate im deutschen Gesundheitswesen und am Standort der Universitätsmedizin Göttingen. Ein weiteres Kriterium für die Auswahl der Datenformate ist die Verfügbarkeit im Rahmen freier Software bzw. Open Source.

Ergebnis: Ausgehend von den identifizierten Datenformaten wurde eine Anforderungsanalyse durchgeführt und eine Matrix erstellt, die die Metadatenfelder der Datenformate einander gegenüberstellt. Dabei zeigte sich, dass sich die häufig genutzten Datenformate openEHR, FHIR, IHE, CDISC und OMOP in ihren Metadatenfeldern gleichen und partiell ineinander überführen lassen. Die Abdeckungsrate beträgt ca. 20%. Es gibt jedoch Metadatenelemente, die nicht unmittelbar in andere Formate transformiert werden können, da sie entweder inhaltlich ähnlich aber datenformatspezifisch sind oder keine Entsprechung in anderen Datenformaten haben.

Diskussion: Es konnte gezeigt werden, dass eine Überführung diverser Metadatenfelder der Datenformate untereinander grundsätzlich möglich ist. Jedoch gibt es beispielsweise Metadatenelemente, die bei der Transformation aufgesplittet oder zusammengeführt werden müssen, sodass die jeweilige Bedeutung modifiziert oder eingeschränkt wird, was zu einem Verlust von Information führt. Um diesen Transformationsverlust zu verhindern bzw. das Risiko zu minimieren, muss ein entsprechender Algorithmus entwickelt werden, der dieses Szenario dediziert aufgreift. Dabei könnten entsprechenden Datenformate in ein Zwischenformat überführt werden, auf dessen Grundlage die gewünschte Transformation in die Zieldatenformate erfolgt. Eine Automatisierung der Transformation soll im nächsten Schritt im Rahmen dieses Forschungsvorhabens konzeptionell entwickelt und implementiert werden.

Schlussfolgerung: Die Nachnutzung klinischer Routinedaten ist ein wichtiger Aspekt von patientenzentrierter Medizin und Versorgungsforschung. Um Daten aus den verschiedensten Bereichen zusammenzuführen und nutzbar zu machen, muss eine Strategie entwickelt werden, mit der die spezifischen Metadatenformate der einzelnen Bereiche automatisiert transformiert werden können. Die vorliegende Forschungsarbeit leistet dazu einen wichtigen Beitrag.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.