gms | German Medical Science

68. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

17.09. - 21.09.23, Heilbronn

Erweiterung der ETL-Strecke FHIR-to-OMOP für Seltene Erkrankungen

Meeting Abstract

  • Michele Zoch - Institut für Medizinische Informatik und Biometrie, Medizinische Fakultät Carl Gustav Carus der Technischen Universität Dresden, Dresden, Germany
  • Ines Reinecke - Institut für Medizinische Informatik und Biometrie, Medizinische Fakultät Carl Gustav Carus der Technischen Universität Dresden, Dresden, Germany
  • Yuan Peng - Institut für Medizinische Informatik und Biometrie, Medizinische Fakultät Carl Gustav Carus der Technischen Universität Dresden, Dresden, Germany
  • Martin Sedlmayr - Institut für Medizinische Informatik und Biometrie, Medizinische Fakultät Carl Gustav Carus der Technischen Universität Dresden, Dresden, Germany
  • Elisa Henke - Institut für Medizinische Informatik und Biometrie, Medizinische Fakultät Carl Gustav Carus der Technischen Universität Dresden, Dresden, Germany

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 68. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS). Heilbronn, 17.-21.09.2023. Düsseldorf: German Medical Science GMS Publishing House; 2023. DocAbstr. 242

doi: 10.3205/23gmds158, urn:nbn:de:0183-23gmds1582

Published: September 15, 2023

© 2023 Zoch et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: In der EU gilt eine Erkrankung als selten, wenn weniger als 5 von 10.000 Menschen betroffen sind; da es 5.000 – 8.000 unterschiedliche Seltene Erkrankungen (SE) gibt, sind weltweit bis zu 446 Millionen Menschen erkrankt [1]. Nicht nur die Diagnosestellung und Therapie sind erschwert, sondern auch die Diagnosedokumentation stellt eine Hürde dar. Weil die Kodierung mit der International Statistical Classification of Diseases and Related Health Problems (ICD-10) unzureichend ist, werden alternative Klassifikationen wie OrphaCode und Alpha-ID-SE für eine eindeutige Benennung genutzt [2].

Der Kerndatensatz der Medizininformatik Initiative (MII-KDS) definiert die durch die Datenintegrationszentren bereitzustellenden Patient:innendaten und verweist im Basismodul "Diagnose" [3] bereits auf die optionalen SE-Kodiersysteme. Nachfolgend wird die Umsetzung innerhalb der Extraktion-Transformation-Laden-Strecke (ETL-Strecke) – von HL7 Fast Healthcare Interoperability Resources (FHIR) zum international etablierten Research Data Repository der Open-Science-Community OHDSI nach Observational Medical Outcomes Partnership Common Data Model (OMOP CDM) – beschrieben.

Methodik: Ein interdisziplinäres Team spezifizierte Anforderungen an die ETL-Strecke, die sich aus der FHIR-Spezifikation des MII-KDS und lokalen Dokumentationsgewohnheiten ergaben:

1.
Nutzung des OrphaCodes für SE-Diagnose,
2.
Speicherung der SE-Diagnose und beschreibender Informationen (z. B. Diagnosesicherheit) unabhängig von weiteren Erkrankungen,
3.
Referenz zum Patienten und nicht zum medizinischen Fall.

Die Erweiterung der bestehenden ETL-Strecke [4] umfasste sowohl das semantische Mapping als auch die technische Implementierung mit Java.

Ergebnisse: Die Überführung der OrphaCode-Diagnose vom MII-KDS nach OMOP wird als Erweiterung der bisherigen ETL-Strecke auf GitHub zur Verfügung gestellt: https://github.com/OHDSI/ETL-German-FHIR-Core

Die Anforderungen an die ETL-Strecke konnten erfüllt werden.

1.
Der OrphaCode der Quelle wird als condition_occurrence.condition_source_value im Ziel abgebildet. Für die OMOP-konforme Darstellung als Konzept ist ein Mapping auf SNOMED CT nötig, weil OrphaCodes bisher kein Bestandteil des OMOP-Vokabulars sind. Daher wird auf das OrphaCode-SNOMED-Mapping von OrphaData (https://www.orphadata.com/) zurückgegriffen, das innerhalb der sogenannten Transition Database ausgelagert und im OMOP CDM als Mapping-Tabelle hinterlegt ist (vgl. [5]).
2.
Der OrphaCode kann unabhängig von weiteren Diagnosen als condition_occurrence gespeichert werden. Dabei können zusätzliche Informationen wie z. B. Diagnosestatus (condition_occurrence.condition_status_concept_id) abgebildet werden.
3.
Die SE-Diagnose kann unabhängig vom medizinischen Fall dargestellt werden, da die condition_occurrence.visit_occurrence_id nicht verpflichtend ist.

Diskussion: Aufgrund des modularen Aufbaus der ETL-Strecke war die Erweiterung um SE-Diagnosen möglich. Diese ist bisher auf OrphaCodes beschränkt, da die Modellierung mit Alpha-ID-SE erschwert ist. Im Basismodul "Diagnose" des MII-KDS kann maximal eine Alpha-ID-SE angegeben werden. Solang diese nicht im Primärsystem dokumentiert wird, muss auf Mapping-Tabellen zurückgegriffen werden, die hauptsächlich n-zu-1-Mappings von Alpha-ID-SE zu OrphaCodes oder ICD-10-GM enthalten.

Für die Zukunft ist eine Evaluation der Mappings zwischen OrphaCodes und Alpha-ID-SE, SNOMED, ICD-10 geplant. Dies bietet die Basis für die Einführung der OrphaCodes als OMOP-Vokabular.

Für die Abbildung von undiagnostizierten und unklaren SE ist neben der Diagnose die Dokumentation von Symptomen beispielsweise mit der Human Phenotype Ontology (HPO) wichtig. Eine Erweiterung der ETL-Strecke um Phänotypen wird erfolgen, sobald das dazugehörige Erweiterungsmodul des MII-KDS finalisiert ist.

Schlussfolgerung: Durch die Erweiterung werden alle deutschen Universitätskliniken befähigt SE-Diagnosen mit OrphaCodes nach OMOP zu überführen. Besonders im SE-Kontext ist die Stärkung der internationalen Sekundärdatenforschung von besonderer Bedeutung, da die Patient:innenkohorten klein und die Expert:innen geografisch stark verteilt sind.

The authors declare that they have no competing interests.

The authors declare that an ethics committee vote is not required.


References

1.
Shourick J, Wack M, Jannot AS. Assessing rare diseases prevalence using literature quantification. Orphanet J Rare Dis. 2021;16:139.
2.
Robinson PN, Graessner H. Datenstandards für Seltene Erkrankungen. Bundesgesundheitsblatt - Gesundheitsforschung - Gesundheitsschutz. 2022 Sep 23;65:1126–1132. DOI: 10.1007/s00103-022-03591-2 External link
3.
Medizininformatik Initiative. Modul Diagnose - ImplementationGuide [Internet]. 2023 [zitiert 25. April 2023]. Verfügbar unter: https://www.medizininformatik-initiative.de/Kerndatensatz/Modul_Diagnose/UML.html External link
4.
Peng Y, Henke E, Reinecke I, Zoch M, Sedlmayr M, Bathelt F. An ETL-process design for data harmonization to participate in international research with German real-worlddata based on FHIR and OMOP CDM. Int J Med Inf. 2023 Jan 1;169:104925.
5.
Zoch M, Gierschner C, Peng Y, Gruhl M, Leutner LA, Sedlmayr M, et al. Adaption of the OMOP CDM for Rare Diseases. Stud Health Technol Inform. 2021;281:138–42.