gms | German Medical Science

Gesundheit – gemeinsam. Kooperationstagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS), Deutschen Gesellschaft für Sozialmedizin und Prävention (DGSMP), Deutschen Gesellschaft für Epidemiologie (DGEpi), Deutschen Gesellschaft für Medizinische Soziologie (DGMS) und der Deutschen Gesellschaft für Public Health (DGPH)

08.09. - 13.09.2024, Dresden

Eignung des OMOP-Datenmodells für die Abbildung von Datensätzen medizinischer Forschungsstudien am Beispiel eines multizentrischen Registers

Meeting Abstract

Search Medline for

  • Milla Kurtz - Institut für Medizinische Informatik, Statistik und Epidemiologie, Universität Leipzig, Leipzig, Germany
  • Alfred Winter - Universität Leipzig, Leipzig, Germany
  • Matthias Löbe - Institut für Medizinische Informatik, Statistik und Epidemiologie, Universität Leipzig, Leipzig, Germany

Gesundheit – gemeinsam. Kooperationstagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS), Deutschen Gesellschaft für Sozialmedizin und Prävention (DGSMP), Deutschen Gesellschaft für Epidemiologie (DGEpi), Deutschen Gesellschaft für Medizinische Soziologie (DGMS) und der Deutschen Gesellschaft für Public Health (DGPH). Dresden, 08.-13.09.2024. Düsseldorf: German Medical Science GMS Publishing House; 2024. DocAbstr. 659

doi: 10.3205/24gmds174, urn:nbn:de:0183-24gmds1741

Published: September 6, 2024

© 2024 Kurtz et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Um Integrationsprobleme zu lösen, die bei der Sekundärnutzung von Gesundheitsdaten entstehen, werden Common Data Models (CDM) entwickelt. Das OMOP (Observational Medical Outcome Partnership) CDM ist ein solches Modell, das als Mechanismus zur Standardisierung der Struktur, des Inhalts und der Semantik von Gesundheitsdaten dient [1]. Das Modell wird von der OHDSI-Community betreut und entwickelt. Die Machbarkeit der Abbildung deutscher Versorgungsdaten auf das Modell wurde bereits in früheren Arbeiten gezeigt [2], [3], [4]. Die folgende Arbeit soll zeigen, ob ein beispielhaftes Mapping eines multizentrischen Registers mit Forschungsdaten auf das OMOP CDM möglich ist.

Methodik: Als Quelldatensatz für dieses Vorhaben dient ein Register zur Dokumentation der Akuten Myeloischen Leukämie, welches aus verschiedenen Events besteht, deren Dokumentation mittels elektronischer Case Report Forms erfolgt. Um das Mapping durchzuführen, wurde zunächst ein Extract-Transform-Load-Prozess (ETL) entworfen. Die Daten wurden mit White-Rabbit gescannt und ein Design für den ETL-Prozess wurde mit Hilfe von Rabbit-In-A-Hat entworfen [5]. Die Mappings der Konzept-Codes wurden mit Hilfe des Online-Repositories Athena und dem OHDSI-Tool Usagi erstellt. Schließlich wurde der ETL-Prozess mit Talend Open Studio for Data Integration implementiert und die Daten wurden in eine PostgreSQL-Datenbank geladen. Die Qualität der abgebildeten Daten wurde mit dem Data Quality Dashboard überprüft und das Mapping wurde quantitativ ausgewertet. Abschließend wurden die Erfahrungen mit den Tools und dem Modell dargestellt.

Ergebnisse: Es konnten 14 OMOP-Tabellen und 51.9% der Felder im Modell befüllt werden. Alle Pflichtfelder konnten befüllt werden mit Ausnahme der Felder „Race“ und „Ethnicity“, da die Quelldaten keine Informationen zu diesen Feldern beinhalten. Für diese Felder wurde die Konzept-ID 0 („no matching concept“) genutzt. Die Tabelle OBSERVATION wurde auch für nicht-klinische Beobachtungen und „Ereignis-ergänzende“ Felder für einige Quellfelder genutzt. Drei Datenfelder konnten aus Datenschutz-Gründen nicht abgebildet werden: Vorname, Nachname, Klinik-interne ID. 61,6% der Werte konnten einem eindeutigen Konzept zugeordnet werden, für 3% der Werte musste „Uphill-Mapping“ genutzt werden und 11,5% der Werte mussten auf 0 („no matching concept“) abgebildet werden. Außerdem konnten 3,9% der Werte nicht gemappt werden, da das Nicht-Eintreten von Ereignissen in OMOP nicht gespeichert werden kann. Das Data Quality Dashboard zeigte eine Qualität von 98%, stellt aber auch „Fails“ im Mapping dar. Die OHDSI-Tools und das OMOP CDM waren einfach zu verstehen und nutzen.

Diskussion: Es konnte gezeigt werden, dass ein exemplarisches Mapping in begrenztem Umfang möglich ist. Die fehlende Möglichkeit, Ereignisse im OMOP CDM zu speichern, die nicht eingetreten sind, führte zu einem Informationsverlust. Für einige genetische Veränderungen fehlten passende Konzepte. Das Mapping von Freitextfeldern wurde aus Ressourcengründen nicht durchgeführt. Die Zeichenbeschränkung einiger Felder im Modell führte ebenfalls zu einem Informationsverlust. Die endgültigen Abbildungen konnten mangels medizinischer Kenntnisse nicht auf ihre Korrektheit überprüft werden, daher sollten für zukünftige Mapping-Projekte medizinische und terminologische Experten zusammenarbeiten. Die Werkzeuge unterstützten den ETL-Designprozess, aber es gibt kein ETL-Tool, so dass der Mapping-Prozess technisches Wissen erfordert.

Schlussfolgerung: Das OMOP CDM eignet sich, um einen exemplarischen Forschungsdatensatz abzubilden. In weiteren Schritten sollten die Daten über das Modell abgefragt und die Eignung für typische Analysen von Registerdaten geprüft werden.

The authors declare that they have no competing interests.

The authors declare that an ethics committee vote is not required.


References

1.
OHDSI. The Book of OHDSI: Observational Health Data Sciences and Informatics. 2021.
2.
Maier C, Lang L, Storf H, Vormstein P, Bieber R, Bernarding J, Hermann T, Haverkamp C. Towards implementation of OMOP in a German university hospital consortium. Applied Clinical Informatics. 2018 Jan;0(1):54-61. DOI: 10.1055/s-0037-1617452 External link
3.
Lang LJ. Mapping eines deutschen, klinischen Datensatzes nach OMOP Common Data Model [Dissertation]. Friedrich-Alexander-Universität Erlangen-Nürnberg; 2020.
4.
Peng Y, Henke E, Reinecke I, Zoch M, Sedlmayr M, Bathelt F: An ETL-process design for data harmonization to participate in international research with German real-world data based on FHIR and OMOP CDM. International Journal of Medical Informatics. 2023 Jan;169:104925. DOI: 10.1016/j.ijmedinf.2022.104925 External link
5.
OHDSI. OHDSI White Rabbit [Internet]. [cited 2023 Aug 23]. Available from: http://ohdsi.github.io/WhiteRabbit/ External link