gms | German Medical Science

68. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

17.09. - 21.09.23, Heilbronn

Extraktion von Intensivdaten aus einem Patientendatenmanagementsystem für Forschungszwecke

Meeting Abstract

  • Elyas Hussein - Institut für Medizinische Informatik, Universitätsklinikum Heidelberg, Heidelberg, Germany
  • Christian Niklas - Institut für Medizinische Informatik, Universität Heidelberg, Heidelberg, Germany
  • Martin Dugas - Universitätsklinikum Heidelberg, Heidelberg, Germany
  • Fleur Fritz-Kebede - Institut für Medizinische Informatik, Universität Heidelberg, Heidelberg, Germany

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 68. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS). Heilbronn, 17.-21.09.2023. Düsseldorf: German Medical Science GMS Publishing House; 2023. DocAbstr. 144

doi: 10.3205/23gmds106, urn:nbn:de:0183-23gmds1065

Published: September 15, 2023

© 2023 Hussein et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Intensivdaten spielen eine immer größere Rolle, da sie umfangreiche und detaillierte Informationen über den Patientenzustand liefern. Aufgrund des Umfangs der vielfältigen Daten aus Untersuchungen, Überwachung, Gesundheitsakten, Medikation und Freitextdokumentation fehlt es häufig an einer Standardstruktur, sodass komplexe Datenintegrationsprozesse für eine aussagekräftige Analyse erforderlich sind ?[1]. Ein ETL-Prozess (Extract, Transform, Load) ist eine solche Verarbeitungskette zur Datenintegration aus verschiedenen Quellen in eine zentrale Datenbank ?[2]. Dieser Artikel beschreibt eine Datenpipeline (ETL-Strecke), die Intensivdaten aus dem Patientendatenmanagementsystem (PDMS) COPRA ?[3] in eine relationale Datenbank importiert, um sie für wissenschaftliche Forschungszwecke nutzbar zu machen.

Methodik: Zum Import von Intensivdaten aus dem COPRA-System von einem Microsoft SQL-Server (Quellsystem) in eine relationale Postgres SQL-Datenbank (Zielsystem) wurde eine ETL-Strecke mit Talend ?[4] entwickelt. Der Datenabruf und -import erfolgt auf Basis des Datenschutzkonzepts zwischen dem medizinischen Datenintegrationszentrum (MeDIC) und dem Universitätsklinikum Heidelberg, indem eine Verbindung zwischen Quell- und Zielsystem für alle Patienten der Intensivstationen aus 18 verschiedenen Fachabteilungen des Universitätsklinikums hergestellt wird. Der Datenabruf aus dem COPRA-System wird anhand Fall- und Bewegungsdaten aus dem ISHmed-System für den einzelnen Fall definiert, um die Intensivdaten eines bestimmten Zeitraums zu extrahieren. Die importierten Datenelemente werden im COPRA-Schema des Zielsystems entsprechend ihrem Datentyp und Informationsgehalt in mehrere Tabellen umstrukturiert: DataDrugs, DataNumeric, DataString, DataScores und ImportTracking. Diese Tabellen enthalten Arzneimittel, Vitalparameter, Scores und Dokumentationsdaten mit genauen Zeitstempeln. Die ImportTracking-Tabelle dokumentiert detailliert, welche Dokumente wann und mit welchem Ergebnis verarbeitet wurden.

Ergebnisse: Die ETL-Strecke ermöglicht, retrospektive Intensivdaten seit 2015 aus dem COPRA-System in eine relationale Datenbank zu importieren. Die Datenbank wird täglich mit neuen Intensivdaten vom Vortag aktualisiert. Bis Ende März 2023 umfasste der importierte Datensatz über 50 Millionen Einträge für alle unterschiedlichen Datenelemente (64 Scores, 5 Strings, 11 Numeric und über 23.000 verschiedene Medikamentenmischungen mit variablen Dosierungen). Die Datenverarbeitung in einer relationalen Datenbank ist leicht durchsuchbar und konnte für die Analyse im Forschungsprojekt SurgOmics ?[5] eingesetzt werden.

Diskussion: Ein ETL-Prozess ist erforderlich, um Daten aus dem COPRA-System abzurufen und in einer relationalen Datenbank zu organisieren. Die Datenverwaltung in einer relationalen Datenbank bietet lokale Optionen, komplexe Daten aus dem Intensivkontext zu strukturieren und qualitative Analysen zu ermöglichen. Die Herausforderung der Datenqualitätssicherung hängt von vielen Faktoren wie Datenkomplexität, Quell- und Zielsystem sowie der Implementierung der ETL-Strecke ab. Zur Validierung des Datenaustauschs im Rahmen der Datenqualitätssicherung wird die ImportTracking-Tabelle verwendet, um die Rückverfolgbarkeit der Verarbeitungsschritte zu dokumentieren. ??????

Dieser Ansatz bildet den ersten Schritt zur Weiterverarbeitung der Intensivdaten für die semantische und syntaktische Interoperabilität (z.B. internationale Codesysteme und Standards wie FHIR, OMOP, OpenEHR). Weiterhin erfordert die Transformation aller vorliegenden Datenelemente in FHIR eine Erweiterung der FHIR-Ressourcen im Modul Intensivmedizin des Kerndatensatzes der Medizininformatik-Initiative. Zukünftige Arbeiten werden sich darauf konzentrieren, große Datenmengen durch automatisierte Testverfahren auf Plausibilität und Vollständigkeit zu prüfen sowie in Zusammenarbeit mit dem MeDIC Intensivdaten institutionsübergreifend als Erweiterungsmodule des Kerndatensatzes für verschiedene Forschungszwecke zur Verfügung zu stellen.

Schlussfolgerung: Die Implementierung einer ETL-Strecke zur Verarbeitung der PDMS-Daten in einer relationalen Datenbank überführt die Daten aus dem Quellsystem in eine restrukturierte Datenbank. Durch diesen ersten Schritt können Intensivdaten effektiv für die Wissenschaft nutzbar gemacht werden.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Sanchez-Pinto LN, Luo Y, Churpek MM. Big Data and Data Science in Critical Care. Chest. 2018;154(5):1239–48. DOI: 10.1016/j.chest.2018.04.037 External link
2.
Cheng KY, Pazmino S, Schreiweis B. ETL Processes for Integrating Healthcare Data - Tools and Architecture Patterns. Stud Health Technol Inform. 2022;299:151–6. DOI: 10.3233/SHTI220974 . External link
3.
COPRA System GmbH. COPRA-System. 2023 [Zugriff: 30.03.2023]. Verfügbar unter: https://copra-system.de/ External link
4.
Talend. Talend Studio. 2023 [Zugriff: 30.03.2023]. Verfügbar unter: https://www.talend.com/de/ External link
5.
Bundesministerium für Gesundheit. Personalisierte Prädiktion lebensbedrohlicher Komplikationen in der Chirurgie durch maschinelles Lernen aus multimodalen Prozessdaten (SurgOmics). [Zugriff: 11.04.2023]. Verfügbar unter: https://www.bundesgesundheitsministerium.de/ministerium/ressortforschung-1/handlungsfelder/forschungsschwerpunkte/digitale-innovation/modul-3-smarte-algorithmen-und-expertensysteme/surgomics.html External link