gms | German Medical Science

67. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS), 13. Jahreskongress der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e. V. (TMF)

21.08. - 25.08.2022, online

Aufbau einer niedersächsischen Forschungsdatenplattform für COVID-19-Studien: Von der Modellierung in openEHR über Datenimport bis zur Datenfilterung und -herausgabe

Meeting Abstract

  • Philip Hufeland - Department of Medical Informatics, University Medical Center Göttingen (UMG), Göttingen, Göttingen, Germany
  • Mareike Joseph - Peter L. Reichertz Institut für Medizinische Informatik der Technischen Universität Braunschweig und der Medizinischen Hochschule Hannover, Hannover, Germany
  • Sabine Hanß - Department of Medical Informatics, University Medical Center Göttingen (UMG), Göttingen, Göttingen, Germany
  • Michael Marschollek - Peter L. Reichertz Institut für Medizinische Informatik der Technischen Universität Braunschweig und der Medizinischen Hochschule Hannover, Hannover, Germany
  • Dagmar Krefting - Department of Medical Informatics, University Medical Center Göttingen (UMG), Göttingen, Göttingen, Germany

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 67. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS), 13. Jahreskongress der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e.V. (TMF). sine loco [digital], 21.-25.08.2022. Düsseldorf: German Medical Science GMS Publishing House; 2022. DocAbstr. 206

doi: 10.3205/22gmds072, urn:nbn:de:0183-22gmds0728

Published: August 19, 2022

© 2022 Hufeland et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Im Rahmen des COVID-19 Forschungsnetzwerks Niedersachsen (COFONI, https://www.umg.eu/forschung/corona-forschung/cofoni/) wird eine zentrale Forschungsdatenplattform durch die Universitätskliniken MHH und UMG aufgebaut. Das Ziel ist die standardisierte Bereitstellung der Forschungsdaten aus den COFONI-geförderten Projekten. Damit wird sowohl inhaltlich als auch strukturell durch eine breitere Nutzung und bessere Verknüpfung der Daten zur Bewältigung der Corona-Pandemie beigetragen. Über die Forschungsdatenplattform können Forscher*innen die vorhandenen Datensätze filtern, eigene Kohorten zusammenstellen und für diese einen Datennutzungsantrag stellen. Dabei wurden existierende Tools wiederverwendet, um den nachhaltigen Betrieb zu vereinfachen und von gemeinsamer Entwicklung zu profitieren.

Stand der Technik: Im CODEX-Projekt [1], [2] wurde durch das Netzwerk Universitätsmedizin (NUM) eine bundesweite COVID-19 Plattform zur Verarbeitung des GECCO-Datensatzes [3] geschaffen. Im COFONI-Projekt wird darauf aufbauend eine Forschungsdatenplattform etabliert, die es ermöglicht, pseudonymisierte Daten zur Verfügung zu stellen und über den GECCO-Datensatz hinausgehende Daten abfragbar zu machen. Wie im CODEX-Projekt wird auf die Verwendung frei nutzbarer Komponenten (EHRbase) und offener Standards (openEHR) unter Berücksichtigung der FAIR-Kriterien [4] gesetzt.

Die Datenmodelle werden in enger Abstimmung mit den Forscher*innen in Anlehnung an das HiGHmed-Daten-Governance-Modell [5] konsentiert, implementiert und gepflegt um eine Harmonisierung der Datenbestände zu erreichen.

Konzept: In der Plattform werden nur pseudonymisierte Daten gespeichert. Die personenidentifizierenden Daten verbleiben bei den Datengeber*innen. Die rechtskonforme Nutzung der Daten wird dabei durch Einbindung eines Use & Access-Komitees, sowie durch ein Datenschutzkonzept, eine Datennutzungsordnung und einen Datennutzungsvertrag gewährleistet.

Technische Grundlage der Plattform sind die Open-Source-Projekte num-portal (https://github.com/NUM-Forschungsdatenplattform/num-portal) und num-portal-webapp (https://github.com/NUM-Forschungsdatenplattform/num-portal-webapp) des NUM. Diese werden an die projektspezifischen Anforderungen von COFONI mit dem Ziel, verschiedenste openEHR-Modelle verarbeiten und filtern zu können, angepasst. Für die Umsetzung der Forschungsdatenplattform werden darüber hinaus weitere Komponenten aufgesetzt und bei Bedarf angepasst: PostgreSQL-Cluster für die Speicherung der Daten, Keycloak für die Authentifizierung in der Benutzeroberfläche, EHRbase für die Speicherung und Ausgabe der Daten, Backend für die Datenverarbeitung und Weitergabe an das Frontend und eine WebApp zur Datenfilterung, Antragstellung und zum Datenexport.

Implementierung: Für die Umsetzung erfolgte, sofern noch nicht verfügbar, eine Containerisierung der Komponenten, um im Kubernetes-Cluster einsetzbar zu sein. Kubernetes wird dabei für die Bereitstellung, Verwaltung und Skalierung der einzelnen Container eingesetzt. Für ein einfaches Deployment in dem Kubernetes-Cluster ist ein Helm Chart definiert worden. Dieses Vorgehen vereinfacht ein erneutes Aufsetzen der Komponenten sowie den DevOps-Betrieb. Für eine schnelle und agile Entwicklung des Portals wurde eine CI/CD-Pipeline implementiert.

Für die COFONI-spezifischen Anforderungen ist das Portal um eine Filterung für die Nutzung der Daten im EU-Ausland erweitert worden, die Benutzerrollen wurden angepasst und eine Möglichkeit zum Filtern und Anfragen der Daten auf Projektebene und nach klinischen Konzepten wurde umgesetzt.

Gewonnene Erkenntnisse: Das CODEX-Projekt bietet eine gute Grundlage zur Bereitstellung und Filterung von openEHR-Daten, die sich auf andere Projekte ausweiten lässt. In Abhängigkeit der Komplexität der Ansprüche ist es jedoch nicht mehr möglich die eigenen Änderungen als Add-on zu den CODEX-Komponenten zu gestalten.

Die Dokumentation hinsichtlich der Implementierung und Funktionalität der CODEX-Komponenten ist bisher noch nicht detailliert genug, um ein schnelles Anfangen und Aufsetzen zu ermöglichen. Die Hemmschwelle zur Nutzung soll durch zusätzliche Dokumentation im COFONI-Projekt perspektivisch gesenkt und Möglichkeiten der Plattformerweiterung aufgezeigt werden.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
CODEX Netzwerk Universitätsmedizin [Internet]. [cited 2022 Apr 14]. Available from: https://www.netzwerk-universitaetsmedizin.de/projekte/codex External link
2.
Prokosch U, Bahls T, Bialke M, et al. The COVID-19 Data Exchange Platform of the German University Medicine. In: 32nd Medical Informatics Europe Conference (MIE 2022). Accepted.
3.
Sass J, Bartschke A, Lehne M, Essenwanger A, Rinaldi E, Rudolph S, et al. The German Corona Consensus Dataset (GECCO): a standardized dataset for COVID-19 research in university medicine and beyond. BMC Medical Informatics and Decision Making. 2020 Dec 21;20(1):341.
4.
Wilkinson MD, Dumontier M, Aalbersberg IJ, Appleton G, Axton M, Baak A, et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data. 2016 Mar 15;3(1):160018.
5.
Wulff A, Haarbrandt B, Marschollek M. Clinical Knowledge Governance Framework for Nationwide Data Infrastructure Projects. Stud Health Technol Inform. 2018;248:196–203.