Article
Integration und Standardisierung von Verschreibungsdaten aus heterogenen Medikationssystemen
Search Medline for
Authors
| Published: | September 6, 2024 |
|---|
Outline
Text
Einleitung: Eine wichtige Voraussetzung für die Sekundärnutzung medizinischer Datensätze ist es Interoperabilitätsprobleme verschiedener Systeme zu überwinden. Die Implementierung standardisierter Datenpraktiken ist hierfür entscheidend [1]. Wir beschreiben das Design und die Umsetzung der Standardisierung von Verschreibungsdaten in einer Multi-Domänen Datenplattform innerhalb der Helios Kliniken. Ziel ist es Datenqualität zu verbessern und eine konsistente Basis für weitere Analysen und Anwendungen zu schaffen, selbst wenn Rohdaten unvollständig oder heterogen sind.
Stand der Technik: FHIR (Fast Healthcare Interoperability Resources) ist ein von HL7 entwickelter Standard für den elektronischen Austausch von Gesundheitsinformationen. Verschreibungsdaten werden in FHIR durch die Ressourcen MedicationStatement, MedicationRequest und MedicationAdministration abgebildet.
Die große Community, Skalierbarkeit und die Anpassung an moderne Technologien machen FHIR zur bevorzugten Wahl für Interoperabilitätsinitiativen, wie der Medizininformatik-Initiative [2].
Jedoch wird FHIR trotz aller Vorteile nicht überall als Standard verwendet, wodurch Medikationsinformationen in unterschiedlichen Formaten von semi-strukturiert bis hin zu Freitexten vorliegen. Freitexte stellen eine bekannte Herausforderung bei der Integration von Daten dar, da natürliche Sprache inhärent mehrdeutig und variabel ist [3].
Konzept: Medikationsdaten umfassen eine Vielzahl von Informationen über die Verordnung, Verabreichung und Verwendung von Medikamenten. Die Verordnungsdaten werden in zwei FHIR-Resourcen, die Medikationsinformation (MedicationStatement) sowie die Dosierungsanweisung (Dosageinstruction) transformiert. Die Medikationsinformation enthält Namen, Pharmazentralnummern, Wirkstoffe und Stärken der Medikamente. Die Dosierungsanweisung enthält Informationen über die Verabreichungsform, Dauer, Dosierung sowie die Frequenz der Verabreichung. Ziel ist es, Medikationsdaten aus verschiedenen Quellen unabhängig von Format und Vollständigkeit in das einheitliche Format zu überführen.
Implementierung: Aus pseudonymisierten Rohdaten der Medikationssysteme ID-Medics und den Medikationsmodulen aus Medico, Orbis und IMedOne werden in einer PySpark-Transformation nach dem Best-Effort-Prinzip alle verfügbaren Informationen extrahiert. Die Daten liegen teilweise im FHIR Format, als strukturierte, semi-strukturierte oder als Freitext vor. Text-Parsing kommt zum Einsatz wo Informationen nur als un- oder semistrukturierte Daten repräsentiert sind [4], [5]. Hierbei wurden Informationen teilweise über vorhandene Datenfelder vorklassifiziert und durch regulärer Ausdrücke relevante Informationen extrahiert und auf mehrere Datenfelder aufgeteilt. Um kurzfristig Daten verschiedener Systeme bereitzustellen wurde auf manuelle Annotation zugunsten von Pipeline basierter Einteilung verzichtet. Fehlende Referenzdaten werden aus öffentlichen Quellen oder Daten anderer Medikationssysteme angereichert.
Ein Beispiel ist die Ergänzung von Codes (ATC) basierend auf vorhandenen Pharmazentralnummern (PZN) oder die Extraktion atomarer Dosierungsinformationen aus (semi)-strukturierten Strings (bspw. Einnahmezeitpunkte aus 1-1-1). Zubereitungen (Infusionen) wurden anhand ihrer Wirkstoff-Kombinationen in einzelne Verschreibungen aufgetrennt.
Gewonnene Erkenntnisse: Die Vielfalt der Datenquellen, bedingt durch unterschiedliche Quellsysteme, erwies sich als herausfordernd für die Standardisierung, da sie verschiedene Datenformate, Terminologien und Strukturen aufweisen. Die Qualität der Daten variiert zwischen den Quellen, was zusätzliche Anpassungen und umfangreiche Datenbereinigungsprozesse erforderlich machte. Darüber hinaus stellte die Komplexität der Medikamenteninformationen, insbesondere in semistrukturierten Formaten, eine weitere Herausforderung dar, da sie vielschichtig und multidimensional waren. Die gewonnenen Erkenntnisse unterstreichen die Bedeutung einer sorgfältigen Planung, Koordination und Zusammenarbeit bei der Standardisierung von Medikamentendaten, um eine konsistente und zuverlässige Datengrundlage zu gewährleisten.
Durch die Standardisierung sind Angaben über Pharmazentralnummer, Medikamentenstärke, ATC-Angaben sowie Dosierangaben bei 92% bzw. 99 % aller Medikationsdaten vorhanden. Darüber hinaus konnten wir durch die Kombination aller Datenquellen einen einheitlichen Medikationskatalog erstellen der unseren Anwendern stabile Referenzdaten von hoher Qualität zur Verfügung stellt.
Die Autoren geben an, dass kein Interessenkonflikt besteht.
Die Autoren geben an, dass kein Ethikvotum erforderlich ist.
Literatur
- 1.
- Sinaci AA, et al. From Raw Data to FAIR Data: The FAIRification Workflow for Health Research. Methods of information in medicine. 2020;59(S 01):e21-e32. DOI: 10.1055/s-0040-1713684
- 2.
- Medizin Informatik Initiative. MII Implementation Guide Medikation v2. Firely; 2024 [acessed 2024-06-24]. Available from: https://simplifier.net/guide/mii-ig-medikation-v2/ImplementationGuide-2.x-BeschreibungModul-2.x
- 3.
- Ulrich H, Behrend P, Wiedekopf J, Drenkhahn C, Kock-Schoppenhauer AK, Ingenerf J. Hands on the Medical Informatics Initiative Core Data Set — Lessons Learned from Converting the MIMIC-IV. In: Röhrig R, et al, editors. German Medical Data Sciences 2021: Digital Medicine: Recognize – Understand. IOS Press; 2021. p. 119–126. DOI: 10.3233/SHTI210549
- 4.
- Starlinger J, Kittner M, Blankenstein O, Leser U. How to improve information extraction from German medical records. it - Information Technology. 2017;59(4):171-179. DOI: 10.1515/itit-2016-0027
- 5.
- Daumke P, Heitmann KU, Heckmann S, Martinez-Costa C, Schulz S. Clinical Text Mining on FHIR. Studies in health technology and informatics. 2019;264:83-87. DOI: 10.3233/SHTI190188
