gms | German Medical Science

Gesundheit – gemeinsam. Kooperationstagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS), Deutschen Gesellschaft für Sozialmedizin und Prävention (DGSMP), Deutschen Gesellschaft für Epidemiologie (DGEpi), Deutschen Gesellschaft für Medizinische Soziologie (DGMS) und der Deutschen Gesellschaft für Public Health (DGPH)

08.09. - 13.09.2024, Dresden

Implementierung eines FAIRen Metadatenmanagements am Greifswalder Datenintegrationszentrum durch den Einsatz von CentraXX-Komponenten mit Tiefenintegration zum KIS und mit MII-FHIR-Ausleitung

Meeting Abstract

  • Robert Gött - Core Unit Datenintegrationszentrum, Universitätsmedizin Greifswald, Greifswald, Germany
  • Sebastian Berthe - Core Unit Datenintegrationszentrum, Universitätsmedizin Greifswald, Greifswald, Germany
  • Kai Fitzer - Core Unit Datenintegrationszentrum, Universitätsmedizin Greifswald, Greifswald, Germany
  • Markus Mandalka - Core Unit Datenintegrationszentrum, Universitätsmedizin Greifswald, Greifswald, Germany
  • Joe Kranzusch - Core Unit Datenintegrationszentrum, Universitätsmedizin Greifswald, Greifswald, Germany
  • Erfan Matbouei - Core Unit Datenintegrationszentrum, Universitätsmedizin Greifswald, Greifswald, Germany
  • Dagmar Waltemath - Core Unit Datenintegrationszentrum, Universitätsmedizin Greifswald, Greifswald, Germany

Gesundheit – gemeinsam. Kooperationstagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS), Deutschen Gesellschaft für Sozialmedizin und Prävention (DGSMP), Deutschen Gesellschaft für Epidemiologie (DGEpi), Deutschen Gesellschaft für Medizinische Soziologie (DGMS) und der Deutschen Gesellschaft für Public Health (DGPH). Dresden, 08.-13.09.2024. Düsseldorf: German Medical Science GMS Publishing House; 2024. DocAbstr. 870

doi: 10.3205/24gmds045, urn:nbn:de:0183-24gmds0454

Published: September 6, 2024

© 2024 Gött et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Das Datenintegrationszentrum (DIZ) der Universitätsmedizin Greifswald verwendet für ihre grundlegende Infrastruktur das Produkt M-KIS der Firma Meierhofer AG und die Produkte CentraXX, CentraXX-MDR (CentraXX Metadata Repository) und CentraXX-RDA (CentraXX Rawdata Archiv) der Firma Kairos. Im Rahmen einer Ausschreibung 2015 wurde ein tiefenintegriertes Forschungs-KAS (KAS+) erstmalig entwickelt und im Rahmen der Entwicklungen der Medizininformatik-Initiative sukzessive angepasst und mit weiteren Software-Komponenten verknüpft.

Die Forschungsunterstützung wird durch die Kopplung eines klinischen Data Warehouse mit einem Research Data Warehouse realisiert – beides umgesetzt mit CentraXX – und mit den Werkzeugen der Unabhängigen Treuhandstelle gekoppelt [1]. Die Gesamtarchitektur bedient die Anforderungen an das lokale Forschungsdatenmanagement gemäß FAIR-Prinzipien [2].

In diesem Beitrag beschreiben wir die Umsetzung der FAIR guiding principles [2] für die Metadaten der Forschungsinfrastruktur des Datenintegrationszentrums mit Fokus auf die Bereitstellung FAIRer Metadaten durch das CentraXX MDR.

Methoden: Das CentraXX-MDR ist die zentrale Instanz der Greifswalder Forschungsdateninfrastruktur für die Verwaltung von beschreibenden Metadaten [3]. Metadaten werden per Dateiimport oder REST-Schnittstelle angeliefert und damit in der Systemumgebung bekannt gemacht. Diese Daten sind dann per Dateiexport oder REST-Schnittstelle weiteren technischen Komponenten zugänglich. Hersteller von Datenquellen, wie M-KIS und CentraXX, wurden verpflichtet, bspw. Formularbeschreibungen in Form von Metadaten an der Schnittstelle des MDR anzuliefern. Dort können Datenelementbeschreibungen annotiert und durch semantische Relationen verbunden werden, um bspw. Gleichheit, Ähnlichkeit oder Umrechenbarkeit von Datenelementen anzuzeigen.

Das CentraXX-RDA speichert unstrukturierte Daten und Originalnachrichten strukturierter Daten, die jeder Zeit erneut oder mit Verfahren des Natural Language Processing verarbeitet werden können. Sie werden dabei umfangreich automatisch annotiert.

Ergebnisse: Das am Datenintegrationszentrum der UMG eingeführte CentraXX MDR bietet umfängliche Möglichkeiten zur Arbeit mit Metadaten. Der Aufbau eines solchen Werkzeugs folgte seit Projektstart Vorgaben guten Datenmanagements, die sich heute in der Philosophie der FAIR-Prinzipien wiederfinden. Das CentraXX-MDR, das CentraXX-RDA und das CentraXX selbst wurden daher um Suchfunktionen erweitert, die es ermöglichen, medizinische, beschreibenden Metadaten und Provenance-Daten wiederzufinden. Wo sich diese Datenkategorien jeweils befinden und wieder auffindbar sind, ist klar definiert. Zu allen Versorgungsdaten liegen auch Metadaten vor.

Im Ergebnis unterstützt CentraXX de Arbeit mit Forschungsdaten aus der klinischen Versorgung, beispielsweise eine verbesserte Patientensuche, um Konstellationen von medizinischen Daten zu finden. Daten werden durch CentraXX im Streaming-Verfahren entgegengenommen, was das Polling von dezentralen Datenquellen verhindert und eine zeitnahe Qualitätsprüfung medizinischer Daten sicherstellt.·Die Bereitstellung der Daten aus CentraXX, z.B. in Richtung FDPG, ist MII-FHIR-kompatibel. Neben der FHIR-Ausleitung können Daten in verschiedener Formate, STATA, SPSS etc., exportiert werden. Die Gesundheitsdaten haben einen hohen Strukturierungsgrad, da Einfluss auf das Design der Versorgungsformulare genommen wurde.

Diskussion: Das Greifswalder DIZ arbeitet gemäß der in den FAIR-Prinzipien spezifizierten Anforderungen an gutes Forschungsdatenmanagement. Eine wichtige Kernkomponente auf dem Weg zur einem FAIRen DIZ (siehe auch [4]) ist die Bereitstellung und Arbeit mit standardisierten Metadaten. Hierzu wurde gemeinsam mit der Firma Kairos das CentraXX MDR in die Forschungsinfrastruktur des DIZ integriert.

Die Tiefenintegration erfordert jedoch eine hohe Verfügbarkeit aller beteiligten technischen Komponenten. Ausfälle unterbrechen den Datenfluss und erfordern schnelles Handeln. Darum ist ein präzises Monitoring notwendig, um solche Ausfälle schnellstmöglich zu bemerken.

All das ist es wert, um Forschenden umfangreiche medizinische Daten aus dem Versorgungsbereich, verbunden mit beschreibenden Metadaten als auch Provenance-Daten, zur Verfügung stellen zu können.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Bialke M, Penndorf P, Wegner T, et al. A workflow-driven approach to integrate generic software modules in a Trusted Third Party. J Transl Med. 2015;13:176. DOI: 10.1186/s12967-015-0545-6 External link
2.
Wilkinson M, Dumontier M, Aalbersberg I, et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data. 2016;3:160018. DOI: 10.1038/sdata.2016.18 External link
3.
Ulrich H, Kock-Schoppenhauer AK, et al. Understanding the Nature of Metadata – A Systematic Review. J Med Internet Res. 2022;24(1):e25440. DOI: 10.2196/25440 External link
4.
Parciak M, Suhr M, Schmidt C, et al. FAIRness through automation: development of an automated medical data integration infrastructure for FAIR health data in a maximum care university hospital. BMC Med Inform Decis Mak. 2023;23:94. DOI: 10.1186/s12911-023-02195-3 External link
5.
Gierend K, Wodke J, et al. Defining standard provenance information for clinical research data and workflows - Obstacles and opportunities. In: WWW '23 Companion: Companion Proceedings of the ACM Web Conference 2023. ACM Digital Library; 2023. p. 1551-1554. DOI: 10.1145/3543873.3587562 External link