Artikel
Implementierung eines FAIRen Metadatenmanagements am Greifswalder Datenintegrationszentrum durch den Einsatz von CentraXX-Komponenten mit Tiefenintegration zum KIS und mit MII-FHIR-Ausleitung
Suche in Medline nach
Autoren
| Veröffentlicht: | 6. September 2024 |
|---|
Gliederung
Text
Einleitung: Das Datenintegrationszentrum (DIZ) der Universitätsmedizin Greifswald verwendet für ihre grundlegende Infrastruktur das Produkt M-KIS der Firma Meierhofer AG und die Produkte CentraXX, CentraXX-MDR (CentraXX Metadata Repository) und CentraXX-RDA (CentraXX Rawdata Archiv) der Firma Kairos. Im Rahmen einer Ausschreibung 2015 wurde ein tiefenintegriertes Forschungs-KAS (KAS+) erstmalig entwickelt und im Rahmen der Entwicklungen der Medizininformatik-Initiative sukzessive angepasst und mit weiteren Software-Komponenten verknüpft.
Die Forschungsunterstützung wird durch die Kopplung eines klinischen Data Warehouse mit einem Research Data Warehouse realisiert – beides umgesetzt mit CentraXX – und mit den Werkzeugen der Unabhängigen Treuhandstelle gekoppelt [1]. Die Gesamtarchitektur bedient die Anforderungen an das lokale Forschungsdatenmanagement gemäß FAIR-Prinzipien [2].
In diesem Beitrag beschreiben wir die Umsetzung der FAIR guiding principles [2] für die Metadaten der Forschungsinfrastruktur des Datenintegrationszentrums mit Fokus auf die Bereitstellung FAIRer Metadaten durch das CentraXX MDR.
Methoden: Das CentraXX-MDR ist die zentrale Instanz der Greifswalder Forschungsdateninfrastruktur für die Verwaltung von beschreibenden Metadaten [3]. Metadaten werden per Dateiimport oder REST-Schnittstelle angeliefert und damit in der Systemumgebung bekannt gemacht. Diese Daten sind dann per Dateiexport oder REST-Schnittstelle weiteren technischen Komponenten zugänglich. Hersteller von Datenquellen, wie M-KIS und CentraXX, wurden verpflichtet, bspw. Formularbeschreibungen in Form von Metadaten an der Schnittstelle des MDR anzuliefern. Dort können Datenelementbeschreibungen annotiert und durch semantische Relationen verbunden werden, um bspw. Gleichheit, Ähnlichkeit oder Umrechenbarkeit von Datenelementen anzuzeigen.
Das CentraXX-RDA speichert unstrukturierte Daten und Originalnachrichten strukturierter Daten, die jeder Zeit erneut oder mit Verfahren des Natural Language Processing verarbeitet werden können. Sie werden dabei umfangreich automatisch annotiert.
Ergebnisse: Das am Datenintegrationszentrum der UMG eingeführte CentraXX MDR bietet umfängliche Möglichkeiten zur Arbeit mit Metadaten. Der Aufbau eines solchen Werkzeugs folgte seit Projektstart Vorgaben guten Datenmanagements, die sich heute in der Philosophie der FAIR-Prinzipien wiederfinden. Das CentraXX-MDR, das CentraXX-RDA und das CentraXX selbst wurden daher um Suchfunktionen erweitert, die es ermöglichen, medizinische, beschreibenden Metadaten und Provenance-Daten wiederzufinden. Wo sich diese Datenkategorien jeweils befinden und wieder auffindbar sind, ist klar definiert. Zu allen Versorgungsdaten liegen auch Metadaten vor.
Im Ergebnis unterstützt CentraXX de Arbeit mit Forschungsdaten aus der klinischen Versorgung, beispielsweise eine verbesserte Patientensuche, um Konstellationen von medizinischen Daten zu finden. Daten werden durch CentraXX im Streaming-Verfahren entgegengenommen, was das Polling von dezentralen Datenquellen verhindert und eine zeitnahe Qualitätsprüfung medizinischer Daten sicherstellt.·Die Bereitstellung der Daten aus CentraXX, z.B. in Richtung FDPG, ist MII-FHIR-kompatibel. Neben der FHIR-Ausleitung können Daten in verschiedener Formate, STATA, SPSS etc., exportiert werden. Die Gesundheitsdaten haben einen hohen Strukturierungsgrad, da Einfluss auf das Design der Versorgungsformulare genommen wurde.
Diskussion: Das Greifswalder DIZ arbeitet gemäß der in den FAIR-Prinzipien spezifizierten Anforderungen an gutes Forschungsdatenmanagement. Eine wichtige Kernkomponente auf dem Weg zur einem FAIRen DIZ (siehe auch [4]) ist die Bereitstellung und Arbeit mit standardisierten Metadaten. Hierzu wurde gemeinsam mit der Firma Kairos das CentraXX MDR in die Forschungsinfrastruktur des DIZ integriert.
Die Tiefenintegration erfordert jedoch eine hohe Verfügbarkeit aller beteiligten technischen Komponenten. Ausfälle unterbrechen den Datenfluss und erfordern schnelles Handeln. Darum ist ein präzises Monitoring notwendig, um solche Ausfälle schnellstmöglich zu bemerken.
All das ist es wert, um Forschenden umfangreiche medizinische Daten aus dem Versorgungsbereich, verbunden mit beschreibenden Metadaten als auch Provenance-Daten, zur Verfügung stellen zu können.
Die Autoren geben an, dass kein Interessenkonflikt besteht.
Die Autoren geben an, dass kein Ethikvotum erforderlich ist.
Literatur
- 1.
- Bialke M, Penndorf P, Wegner T, et al. A workflow-driven approach to integrate generic software modules in a Trusted Third Party. J Transl Med. 2015;13:176. DOI: 10.1186/s12967-015-0545-6
- 2.
- Wilkinson M, Dumontier M, Aalbersberg I, et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data. 2016;3:160018. DOI: 10.1038/sdata.2016.18
- 3.
- Ulrich H, Kock-Schoppenhauer AK, et al. Understanding the Nature of Metadata – A Systematic Review. J Med Internet Res. 2022;24(1):e25440. DOI: 10.2196/25440
- 4.
- Parciak M, Suhr M, Schmidt C, et al. FAIRness through automation: development of an automated medical data integration infrastructure for FAIR health data in a maximum care university hospital. BMC Med Inform Decis Mak. 2023;23:94. DOI: 10.1186/s12911-023-02195-3
- 5.
- Gierend K, Wodke J, et al. Defining standard provenance information for clinical research data and workflows - Obstacles and opportunities. In: WWW '23 Companion: Companion Proceedings of the ACM Web Conference 2023. ACM Digital Library; 2023. p. 1551-1554. DOI: 10.1145/3543873.3587562
