gms | German Medical Science

GMDS 2012: 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

16. - 20.09.2012, Braunschweig

Medizinische Forschungsdatenbanken als Baustein des Forschungsdatenmanagements an der Universität Leipzig

Meeting Abstract

Suche in Medline nach

  • Frank Meineke - Universitätsmedizin Leipzig, IFB AdipositasErkrankungen, Leipzig, Deutschland
  • Sebastian Stäubert - Universitätsmedizin Leipzig, IFB AdipositasErkrankungen, Leipzig, Deutschland
  • Toralf Kirsten - Universität Leipzig, LIFE – Leipziger Forschungszentrum für Zivilisationserkrankungen, Leipzig, Deutschland

GMDS 2012. 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Braunschweig, 16.-20.09.2012. Düsseldorf: German Medical Science GMS Publishing House; 2012. Doc12gmds033

doi: 10.3205/12gmds033, urn:nbn:de:0183-12gmds0339

Veröffentlicht: 13. September 2012

© 2012 Meineke et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung: Das Management von Forschungsdaten (Primärdaten, Rohdaten) über den gesamten Datenlebenszyklus – von der Erzeugung, Sammlung, Pflege, Nachnutzung bis zur Archivierung – ist komplex [1], [2]. Die Monopolisierung oder exklusive Einmal-Nutzung von Daten ist nicht effektiv und widerspricht den Empfehlungen öffentlicher Förderer [3]. Gutes Forschungsdatenmanagement erlaubt langfristige Re- und Meta-Analysen durch einen wohldefinierten Informationsaustausch (Data Sharing). Dies ist in der Medizin noch immer die Ausnahme – dem entgegenzuwirken, bedarf es einer Infrastruktur zum Forschungsdatenmanagement, die den besonderen technischen, rechtlichen und organisatorischen Rahmenbedingungen gerecht wird.

In der Universitätsmedizin Leipzig (UML) erheben die Forschungszentren IFB AdipositasErkrankungen [4] – in Zusammenarbeit mit dem Zentrum für klinische Studien Leipzig – und LIFE [5] medizinische Forschungsdaten in großem Umfang. Während im IFB AdipositasErkrankungen klinische Studien und die Integration strukturierter, erkrankungsspezifischer Versorgungsdaten des Universitätsklinikums im Vordergrund stehen, werden im Projekt LIFE phäno- und genotypische Daten einer umfangreichen Bevölkerungsstichprobe über kohortenspezifische Untersuchungen erhoben. In vielfältigen Projekten werden diese Daten ausgewertet, je nach Fragestellung auch übergreifend.

Material und Methoden: Es wird eine gemeinsame Forschungsdatenbank aufgebaut, die eine Plattform für die Übernahme der Daten bildet. Die Versionierung der Forschungsdaten, einheitliche Zugänge, Langzeitverfügbarkeit und Exportarchivierung werden ebenso unterstützt wie Vorverarbeitungen für die Auswertung der Daten. Dem Umstand, dass die Daten der Quellsysteme nicht in Standardformaten, im Falle der diagnostischen Geräte teilweise undokumentiert und unversioniert, vorliegen, wird über spezifische ETL-Prozesse begegnet. Die Daten werden technisch einheitlich strukturiert, um Metadaten (Probandenpseudonym, Quelle, Version und Zeitstempel) angereichert und in einem relationalen Datenmodell abgelegt. Die Berücksichtigung der TMF-Datenschutzkonzepte und Werkzeuge für das ID-Management [6] ermöglichen dabei eine datenschutzgerechte, Probanden-spezifische Datenzusammenführung.

Ergebnisse: Das technische Zentrum der Forschungsdatenbank folgt dem Data-Warehouse-Ansatz und besteht aus einer relationalen Datenbank, in der die Daten aus diversen Datenquellen zusammengeführt werden. Sie wird von verschiedenen Software-Applikationen flankiert, die der Datenübertragung und -transformation (ETL-Prozesse), der Metadatenverwaltung sowie dem Reporting und der Datenexploration dienen. Die semantische Integration wird mit Hilfe semi-automatisch generierter Metadaten-Mappings (Schema-Mappings) [7] herbeigeführt. Die Infrastruktur wird in einer ersten Version zur Verfügung gestellt. Die phänotypischen Daten der LIFE-Kohorten werden regelmäßig in diese Plattform übertragen.

Projektspezifische und übergreifende Datenzugriffe werden über begutachtete Projektvereinbarungen autorisiert. Auswertungen werden derzeit als Dienstleistung mit dem Zugriff auf die Staging-Bereiche durchgeführt. Nutzerseitige Direktzugriffe sind nach Anschluss weiterer Zugriffs- und Analysemodule möglich. Die Unterstützung der Datenharmonisierung durch ontologisch unterstützte Metadaten-Repositories [8], die Anbindung von Reporting-Tools, Analysewerkzeugen und klinischen DataWarehouses (z.B. i2b2) ist in Vorbereitung.

Diskussion: Vorgestellt wird der technische Kern eines umfassenden, modular und stufenweise aufgebauten Forschungsdatenmanagements. Die Leipziger Situation bietet in Vielfalt und Größe der Forschungsvorhaben eine Basis für ein ausbaufähiges, nachhaltig aufgestelltes, zentrales medizinisches Forschungsdatenzentrum. Der nachhaltige Erfolg ist jedoch neben den technischen Aspekten von Maßnahmen abhängig, die das Vertrauen der klinischen Forscher durch größtmögliche Transparenz gewinnen und weitere Anreize für den Datenaustausch schaffen.

Diese Arbeiten werden vom Bundesministerium für Bildung und Forschung (BMBF), FKZ:01E01001, sowie von LIFE – Leipziger Forschungszentrum für Zivilisationserkrankungen gefördert. LIFE wird finanziert aus Mitteln der Europäischen Union durch den Europäischen Fonds für regionale Entwicklung (EFRE) und aus Mitteln des Freistaates Sachsen im Rahmen der Landesexzellenzinitiative.


Literatur

1.
Büttner S, Hobohm HC, Müller L, editors. Handbuch Forschungsdatenmanagement. Bad Honnef: Bock + Herchen; 2011.
2.
Higgins S. The DCC Curation Lifecycle Model. The International Journal of Digital Curation. 2008;3(1):134-40.
3.
Deutsche Forschungsgemeinschaft. Empfehlungen zur gesicherten Aufbewahrung und Bereitstellung digitaler Forschungsprimärdaten. 2009. Available from: http://www.dfg.de/download/pdf/foerderung/programme/lis/ua_inf_empfehlungen_200901.pdf [cited 19.04.2012] Externer Link
4.
Integriertes Forschungs- und Behandlungszentrum AdipositasErkrankungen [Internet]. Available from: http://www.ifb-adipositas.de [cited 19.04.2012]. Externer Link
5.
Leipziger Forschungszentrum für Zivilisationserkrankungen [Internet]. Available from: http://www.uni-leipzig-life.de [cited 19.04.2012]. Externer Link
6.
Faldum A, Pommerening K. An optimal code for patient identifiers. Comput Methods Programs Biomed. 2005;79(1):81-8. DOI: 10.1016/j.cmpb.2005.03.004 Externer Link
7.
Rahm E, Bernstein. A Survey of Approaches to Automatic Schema Matching. VLDB J. 2001;10(4):334-50.
8.
Stausberg J, Löbe M, Verplancke P, Drepper J, Herre H, Löffler M. Foundations of a metadata repository for databases of registers and trials. Stud Health Tech Inform. 2009;150:409-13.