gms | German Medical Science

Gesundheit – gemeinsam. Kooperationstagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS), Deutschen Gesellschaft für Sozialmedizin und Prävention (DGSMP), Deutschen Gesellschaft für Epidemiologie (DGEpi), Deutschen Gesellschaft für Medizinische Soziologie (DGMS) und der Deutschen Gesellschaft für Public Health (DGPH)

08.09. - 13.09.2024, Dresden

THS-MED: Skalierbare Treuhänderservices für die Medizinische Forschung

Meeting Abstract

  • Armin Müller - Medical Informatics Group, Center of Health Data Science, Berlin Institute of Health at Charité - Universitätsmedizin Berlin, Berlin, Germany
  • Eric Wündisch - Core Unit Treuhandstelle, Berlin Institute of Health at Charité - Universitätsmedizin Berlin, Berlin, Germany
  • Hammam Abu Attieh - Medical Informatics Group, Center of Health Data Science, Berlin Institute of Health at Charité - Universitätsmedizin Berlin, Berlin, Germany
  • Marcus Kopp - Core Unit Treuhandstelle, Berlin Institute of Health at Charité - Universitätsmedizin Berlin, Berlin, Germany
  • Sophie Meier zu Ummeln - Core Unit Treuhandstelle, Berlin Institute of Health at Charité - Universitätsmedizin Berlin, Berlin, Germany
  • Sarah Träger - Core Unit Treuhandstelle, Berlin Institute of Health at Charité - Universitätsmedizin Berlin, Berlin, Germany
  • Joachim Weber - Core Unit Treuhandstelle, Berlin Institute of Health at Charité - Universitätsmedizin Berlin, Berlin, Germany; Center for Stroke Research Berlin, Charité - Universitätsmedizin Berlin, Berlin, Germany; German Centre for Cardiovascular Research (DZHK), Berlin, Germany
  • Fabian Prasser - Medical Informatics Group, Center of Health Data Science, Berlin Institute of Health at Charité - Universitätsmedizin Berlin, Berlin, Germany

Gesundheit – gemeinsam. Kooperationstagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS), Deutschen Gesellschaft für Sozialmedizin und Prävention (DGSMP), Deutschen Gesellschaft für Epidemiologie (DGEpi), Deutschen Gesellschaft für Medizinische Soziologie (DGMS) und der Deutschen Gesellschaft für Public Health (DGPH). Dresden, 08.-13.09.2024. Düsseldorf: German Medical Science GMS Publishing House; 2024. DocAbstr. 1064

doi: 10.3205/24gmds154, urn:nbn:de:0183-24gmds1545

Published: September 6, 2024

© 2024 Müller et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Das Projekt THS-MED: Skalierbare Treuhänderservices für die Medizinische Forschung hat zum Ziel, Nicht-Identifizierbarkeit von Patienten, Probanden und Bürgern in datenintensiven medizinischen Forschungsprojekten durch den Einsatz verbesserter Verfahren zur Pseudonymisierung sicherzustellen. Dazu sollen hochskalierbare Treuhandservices entwickelt werden, die sowohl in klassischen medizinischen Studien als auch in datengetriebenen medizinischen Big Data-Projekten eingesetzt werden können.

Stand der Technik: Verfügbare Community-Lösungen für Treuhandservices in der Medizin sind zahlenmäßig nur begrenzt verfügbar. Ziel von THS-MED ist es, die Landschaft der verfügbaren Treuhandservices um Pseudonymisierungs- und Identitätsmanagement-Lösungen zu erweitern, die mit den Funktionalitäten von zum Beispiel der Mainzelliste der Universitätsmedizin Mainz [1] und gPAS bzw. E-PIX der Universitätsmedizin Greifswald [2] vergleichbar sind, aber auf Hochdurchsatzszenarien beispielsweise in den Datenintegrationszentren der Medizininformatik-Initiative [3], optimiert sind.

Konzept: In THS-MED werden zwei wesentliche Komponenten entwickelt: (i) eine Registrierungskomponente zur Verwaltung von Objekten (bspw. Patienten, Proben, Bilder) und (ii) ein Pseudonymisierungsservice, der zur Pseudonymisierung von jeglichen Identifikatoren in der Medizin gängige Algorithmen und weitere Funktionen beinhaltet. Neben entsprechenden Backends für eine programmatische Nutzung in Datenverarbeitungspipelines, werden intuitive User Interfaces für eine einfache Bedienung durch z.B. Studienpersonal bereitgestellt. Alle technischen Komponenten werden unter Nutzung international anerkannter medizinischer Interoperabilitätsstandards entwickelt. Der Nachweis der Praxistauglichkeit wird durch einen realen Einsatz an der Treuhandstelle einer großen Universitätsklinik geführt. Anschließend sollen die Services unter Berücksichtigung der FAIR-Prinzipien als Open Source-Komponenten zugängig gemacht werden, um so ein einfaches Deployment an Institutionen und die Bildung einer Community zu ermöglichen.

Implementierung: Bei der Implementierung der Services werden gängige Open-Source Enterprise-Software-Stacks eingesetzt (Java, Spring Boot). Auch für das Frontend werden moderne, Entwicklungstechnologien und Frameworks genutzt. Als Datenbank wird PostgreSQL eingesetzt, da es Transaktionsgarantien und gute Skalierbarkeit bietet. Beide Komponenten unterstützen eine Segmentierung der Namensräume von Pseudonymen und registrierten Identitäten in verschiedene Domänen sowie eine Zugriffssteuerung mittels eines granularen Berechtigungskonzepts. Für die Authentifizierung und Autorisierung wird Keycloak eingesetzt, sodass auch eine Anbindung an gängige Identitätsmanagementinfrastrukturen von Gesundheitseinrichtungen ermöglicht wird. Wichtige funktionale Anforderungen umfassen skalierbare Record Linkage-Funktionen, unterschiedliche Pseudonymisierungsalgorithmen, u.a. für händische Eingaben mit Fehlerkorrektur, sowie ein Audit-Trail, der Änderungen und Abrufe vollständig nachvollziehbar macht. Ein Container-basiertes Deployment (bspw. mittels Docker) und horizontale Skalierbarkeit sind wichtige nicht-funktionale Eigenschaften.

Gewonnene Erkenntnisse: Der Pseudonymisierungsservice ACE (Advanced Confidentiality Engine) wird auf Basis modernster Technologien entwickelt und verfügt über ein ausgeklügeltes flexibles Domänenkonzept inklusiver eines Vererbungsmechanismus, welcher eine Nutzung ohne Notwendigkeit einer umfangreichen Konfiguration erlaubt. Der Großteil des Verhaltens des Service kann jedoch auf Wunsch detailliert konfiguriert werden. Durch den Vererbungsmechanismus können Konfigurationen dann an andere Domänen weitergegeben werden. Angesprochen werden kann der Service über eine REST-API, welche über klar definierte Endpunkte die Interaktion mit den Pseudonymen erlaubt und zum Beispiel von automatisierten Systemen genutzt werden kann, oder auch über eine derzeit in Entwicklung befindliche GUI, die eine klar strukturierte Oberfläche für die manuelle Interaktion definiert.

Die Erweiterung des Funktionalitätsumfangs sowie eine detaillierte Evaluation der Performance werden derzeit durchgeführt und in einer zukünftigen Publikation veröffentlicht. Einige Evaluationsergebnisse werden wir auf der GMDS-Jahrestagung vorstellen.

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Lablans M, Borg A, Ückert F. A RESTful interface to pseudonymization services in modern web applications. BMC Med Inform Decis Mak. 2015 Dec;15(1):2.
2.
Bialke M, Bahls T, Havemann C, Piegsa J, Weitmann K, Wegner T, et al. MOSAIC – A Modular Approach to Data Management in Epidemiological Studies. Methods Inf Med. 2015 Jul;54(04):364–71.
3.
Semler S, Wissing F, Heyder R. German Medical Informatics Initiative: A National Approach to Integrating Health Data from Patient Care and Medical Research. Methods Inf Med. 2018 Jul;57(S 01):e50–6.