gms | German Medical Science

Gesundheit – gemeinsam. Kooperationstagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS), Deutschen Gesellschaft für Sozialmedizin und Prävention (DGSMP), Deutschen Gesellschaft für Epidemiologie (DGEpi), Deutschen Gesellschaft für Medizinische Soziologie (DGMS) und der Deutschen Gesellschaft für Public Health (DGPH)

08.09. - 13.09.2024, Dresden

Workflow zur Validierung von FHIR-kodierten Daten des MII-Kerndatensatzes unter Einsatz von Open-Source-Software

Meeting Abstract

  • Markus Mandalka - Core Unit Datenintegrationszentrum, Universitätsmedizin Greifswald, Greifswald, Germany
  • Reza Mazloman - Core Unit Datenintegrationszentrum, Universitätsmedizin Greifswald, Greifswald, Germany
  • Dagmar Waltemath - Core Unit Datenintegrationszentrum, Universitätsmedizin Greifswald, Greifswald, Germany
  • Sebastian Berthe - Core Unit Datenintegrationszentrum, Universitätsmedizin Greifswald, Greifswald, Germany

Gesundheit – gemeinsam. Kooperationstagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS), Deutschen Gesellschaft für Sozialmedizin und Prävention (DGSMP), Deutschen Gesellschaft für Epidemiologie (DGEpi), Deutschen Gesellschaft für Medizinische Soziologie (DGMS) und der Deutschen Gesellschaft für Public Health (DGPH). Dresden, 08.-13.09.2024. Düsseldorf: German Medical Science GMS Publishing House; 2024. DocAbstr. 1095

doi: 10.3205/24gmds012, urn:nbn:de:0183-24gmds0128

Veröffentlicht: 6. September 2024

© 2024 Mandalka et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Einleitung: Der Standard Fast Healthcare Interoperability Resources (FHIR, https://www.hl7.org/fhir/) unterstützt den Datenaustausch zwischen Softwaresystemen im Gesundheitswesen. Die universitätsmedizinischen Standorte haben sich im Rahmen der Medizininformatik-Initiative auf einen FHIR-basierten Kerndatensatz (KDS) geeinigt, in dem festgelegt ist, welche Datensätze die Datenintegrationszentren der MII mindestens vorhalten sollen [1].

Eine über die Syntaxprüfung hinausgehende Validierung von FHIR-Daten hilft dabei die FHIR-Konformität von selbst erzeugten FHIR-Daten(strukturen) zu prüfen. Um eine Vielzahl von Validierungsmeldungen aus großen Datensätzen geeignet interpretieren zu können, kann eine Aggregation der Fehlermeldungen helfen, die Validierung über einzelne FHIR-Ressourcen oder kleine Stichproben hinaus auf umfänglichere Datensätze auszuweiten, Problemklassen zu definieren und den Nutzer*innen Fehler übersichtlicher zu kommunizieren. Dies ergänzt bestehende Maßnahmen zur Sicherung und Verbesserung der Datenqualität.

Die Verwendung von Open-Source-Software und die Integration in die bestehende Infrastruktur eines Datenintegrationszentrums ermöglichen den Einsatz des Workflows an weiteren Datenintegrationszentren.

Konzept: Der Workflow unterstützt ETL-Entwickler*innen bei der Sichtung einer hohen Anzahl von Validatormeldungen, die durch Validieren einer Vielzahl von FHIR-Resources gesammelt werden. Er stellt neben der Validierung von FHIR-Daten ein Werkzeug zur Aggregation von Issues bereit und erleichtert somit die Handhabung der zahlreichen Validatormeldungen.

Durch eine containerisierte REST-basierte Architektur und die Nutzung von FHIR-Standardschnittstellen kann eine Validierung unabhängig von den für die Transformation nach FHIR verwendeten Programmiersprachen erfolgen.

Implementierung: Ein FHIR-Validator wird mit maschinenlesbaren Konformanz-Informationen wie z.B. Strukturdefinitionen (z.B. FHIR-Profile), Wertelisten usw. konfiguriert.

Mit diesem werden aus einem bestehenden FHIR-Server abgefragte Daten validiert und dabei festgestellte Issues gesammelt.

Die Datenabfrage erfolgt per FHIR Search Standard und seinen Filtermöglichkeiten.

Damit extrahierte FHIR-Ressourcen werden per FHIR Operation (https://www.hl7.org/fhir/validation.html#op) validiert. Ein mit FHIR-Packages der KDS-Module konfigurierter HAPI FHIR (https://hapifhir.io/hapi-fhir/docs/validation/introduction.html) bietet eine entsprechende REST-API.

Zur Analyse der gesammelten Ergebnisse und um übersichtliche Fehlerklassen zu bilden, erfolgen Auswertung, Filterung und Aggregation der vom Validator gemeldeten Issues mit Hilfe der Python Datenanalyse-Bibliothek Pandas (https://pandas.pydata.org/). Für die Präsentation und Exploration der Ergebnisse können Werkzeuge genutzt werden, die deren Dataframe Schnittstelle bedienen, beispielsweise Jupyter Lab.

Aggregationen auch auf Codesystem-Ebene ermöglichen das Gruppieren von Fehlermeldungen derselben Klasse, welche in verschiedenen FHIR-Ressourcen mit unterschiedlichen Codes auftreten können. Dies hilft insbesondere bei Codesystemen, die in den Daten viele unterschiedliche Werte enthalten (Beispiel: ICD10-Katalog) mit einer übersichtlichen Analyse wie „10000 resources: invalid codes (1000 different codes) (codesystem ICD10GM) in element Condition.code.coding[x]“ als Gruppierung 1000 unterschiedlicher (bereits aus allen überprüften Condition-Resources aggregierten) Meldungen wie „50 resources: invalid code anInvalidCode (codesystem ICD10GM) in Element Condition.code.coding[0]“, „30 resources: invalid code anotherInvalidCode (codesystem ICD10GM) in Element Condition.code.coding[0]“ usw. usf.

Gewonnene Erkenntnisse: Eine automatisierte und zusammenfassende Bulk-FHIR-Validierung erleichtert umfassendere Validierungen und das Debugging von Transformationen nach FHIR.

Durch größere validierte Datenmengen werden bei selteneren Datenkonstellationen vorhandene Probleme erfasst und durch Aggregationen in der Gesamtmenge der Validatormeldungen leichter sichtbar.

Da FHIR-Validierungen rechenintensiv sein können und u.U. in der beim Debuggen von ETL erwünschten Zeit und Iterationsfrequenz nicht für den gesamten Datenbestand praktikabel sind, kann eine Filterung gezielter Stichproben daraus mittels FHIR Search Filter die Performanz der Qualitätssicherung steigern.

Open-Source-Komponenten und FAIRe Konformanzinformationen ermöglichen tiefere Einblicke und Eingriffe in die Validierungsumgebung.

Der Workflow wird am DIZ der Universitätsmedizin Greifswald zur Qualitätssicherung von Transformationen der MII-Daten nach FHIR eingesetzt.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Medizininformatik-Initiative. Kerndatensatz der Medizininformatik-Initiative. [cited 2024 Apr 30]. Available from: https://www.medizininformatik-initiative.de/de/der-kerndatensatz-der-medizininformatik-initiative Externer Link