Article
Konzeption und Entwicklung einer generischen Architektur zur Integration heterogener klinischer Daten in eine zentrale Forschungsdatenbank im Rahmen des Projektes GANI_MED (Greifswald Approach to Individualized Medicine)
Search Medline for
Authors
Published: | September 20, 2011 |
---|
Outline
Text
Einleitung: Im Rahmen des GANI_MED Projektes werden Daten aus Diagnostik- und Behandlungsverlauf der Patienten, deren Einverständnis vorliegt, qualitätsgesichert in einer zentralen Forschungsdatenbank gespeichert, um sie Wissenschaftlern für die weitere Entwicklung einer individualisierten Medizin zur Verfügung zu stellen [1]. In der Realität besteht ein Klinisches-Informations-System (KIS) aus einer Vielzahl von Systemen, welche über verschiedene Protokolle kommunizieren und deren Daten in unterschiedlichen Formaten sowohl strukturiert als auch unstrukturiert vorliegen. Zudem müssen für Speicherung und Verwendung der Daten zu Forschungszwecken umfangreiche Datenschutzanforderungen erfüllt werden [2].
Material und Methoden: Es wurde eine serviceorientierte Architektur (SOA), bestehend aus drei Hauptschichten entwickelt, die die Integration der Daten in ein zentrales Datawarehouse ermöglicht und die datenschutzrechtlichen Anforderungen unabhängig von der Struktur der zu integrierenden Daten realisiert. Die erste Schicht, der Extraction Layer, ist für die Anbindung der verschiedenen Quellsysteme und die einheitliche Umsetzung der Datenschutzanforderungen verantwortlich.
Hierzu werden im ersten Schritt die verschiedenen Datenformate in eine gemeinsame, generische Datenstruktur überführt, welche von den spezifischen Daten abstrahiert und einen einheitlichen Verarbeitungsprozess ermöglicht. Verantwortlich hierfür ist eine Transformationsschicht, die für das Mapping des patientenidentifizerenden Anteils der spezifischen Eingabedaten in diese verantwortlich ist. Die medizinischen Daten bleiben innerhalb dieser Schicht unberücksichtigt und werden datenschutzgerecht separat weiterverarbeitet.
Eine speziell abgesicherte Treuhandstelle beinhaltet einen Master Patient Index (MPI) der für Zuordnung der identifizierenden Daten zu einem Patienten und deren Speicherung sowie Vergabe eines eindeutigen Identifikators verantwortlich ist. Weiterhin befindet sich darin der Consent Manager, der die Einverständniserklärungen der Patienten verwaltet. Die Abfrage des Einverständnisses durch den Extraction Layer ist Grundvorausetzung für die Weiterleitung der medizinischen Daten an die Persistenzschicht. Ein Pseudonymisierungsdienst übernimmt die treuhänderisch verwaltete Generierung eines Pseudonyms und dessen Zuordnung zum vom MPI generierten Identifikators. Orientiert wurde sich hierbei an Softwareinstrumenten der TMF [3], [4].
Innerhalb der dritten Schicht, dem Persistenzlayer, befindet sich das Datawarehouse in dem klinische Daten pseudonymisiert gespeichert werden.
Eine weitere Transformationschicht übernimmt hier die qualitätsgesicherte Überführung der spezifischen medizinischen Eingabedaten unter Verwendung von Metadaten in eine definierte Zielstruktur.
Ergebnisse: Die entwickelte Architektur ermöglicht die Anbindung von Systemen mit unterschiedlichen Protokollen und Datenformaten, die durch die heterogene KIS-Infrastruktur gegeben sind. Im ersten Transformationsschritt wird der identifizierende Anteil der spezifischen Datenformate in eine einheitliche Datenstruktur überführt, was eine einheitliche Umsetzung der Datenschutzanforderungen ermöglicht. Im zweiten Transformationsschritt werden medizinische Daten in die vorgegebene Zielstruktur überführt.
Diskussion: Diese generische Architektur ist erweiterbar, skalierbar und an die sich permanent wandelnde KIS-Infrastruktur anpassbar, wodurch ein hohes Potential zur Wiederverwendung besteht und der Einsatz eines auf der Architektur basierenden Softwaresystems in ähnlichen Projekten sinnvoll erscheint.
Literatur
- 1.
- Schack C, Birkle M, Havemann C, Heinze O, Krafczyk J, Ostrzinski S, Reinecke P, Bergh B, Hoffmann W. Konzeption einer Forschungsplattform zur integrierten Datenauswertung klinischer und laboranalytischer Daten von diagnosebezogenen Patientenkohorten im Bereich der individualisierten Medizin. In: Abstractband der 55. GMDS-Jahrestagung, Mannheim, 2010. p. 488-489.
- 2.
- Reng CM, Debold P, Specker Ch, Pommerening K. Generische Lösungen zum Datenschutz für die Forschungsnetze in der Medizin. Berlin: MWV Medizinisch Wissenschaftliche Verlagsgesellschaft; 2006.
- 3.
- PID-Generator der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e. V. (TMF). Available from: http://www.tmf-ev.de/Themen/Projekte/V015_01_PID_Generator.aspx. Letzter Zugriff: 15.04.2011
- 4.
- Pseudonymisierungsdienst der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e. V. (TMF). Available from: http://www.tmf-ev.de/Themen/Projekte/V000_01_PSD.aspx Letzter Zugriff: 15.04.2011