gms | German Medical Science

GMDS 2013: 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

01. - 05.09.2013, Lübeck

Forschungsdaten- und Probanden-Management in LIFE

Meeting Abstract

  • Toralf Kirsten - LIFE -Leipziger Forschungszentrum für Zivilisationserkrankungen, Leipzig, DE; Interdisziplinäres Zentrum für Bioinformatik, Universität Leipzig, Leipzig, DE
  • Alexander Kiel - LIFE -Leipziger Forschungszentrum für Zivilisationserkrankungen, Leipzig, DE
  • Michael Kleinert - LIFE -Leipziger Forschungszentrum für Zivilisationserkrankungen, Leipzig, DE
  • Ronald Speer - LIFE -Leipziger Forschungszentrum für Zivilisationserkrankungen, Leipzig, DE
  • Christoph Engel - LIFE -Leipziger Forschungszentrum für Zivilisationserkrankungen, Leipzig, DE; Institut für Medizinische Informatik, Statistik und Epidemiologie, Universität Leipzig, Leipzig, DE
  • Markus Löffler - LIFE -Leipziger Forschungszentrum für Zivilisationserkrankungen, Leipzig, DE; Interdisziplinäres Zentrum für Bioinformatik, Universität Leipzig, Leipzig, DE; Institut für Medizinische Informatik, Statistik und Epidemiologie, Universität Leipzig, Leipzig, DE

GMDS 2013. 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Lübeck, 01.-05.09.2013. Düsseldorf: German Medical Science GMS Publishing House; 2013. DocAbstr.345

doi: 10.3205/13gmds283, urn:nbn:de:0183-13gmds2836

Veröffentlicht: 27. August 2013

© 2013 Kirsten et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung: Große epidemiologische Forschungsvorhaben bieten die Möglichkeit, eine große Menge an Teilnehmern mit einem vorbereiteten Untersuchungsprogramm zu konfrontieren, um vorab spezifizierten Fragestellungen und Hypothesen nachzugehen oder zu untermauern bzw. zu widerlegen. Typischerweise sind diese Forschungsvorhaben sehr komplex organisiert; an ihnen sind einerseits multiple Institutionen mit jeweils eigenen Zielen und mglw. Themenkomplexen beteiligt. Andererseits gehen diese Vorhaben mit einem großen und - in Abhängigkeit von der Vielfalt an bearbeiteten Themenkomplexen - sehr heterogenen Untersuchungsprogramm einher. Die Komplexität dieser Forschungsvorhaben kann nur mit einer geeigneten IT-Forschungsinfrastruktur [1] begegnet werden, die sowohl alle Prozesse der Rekrutierung von Studienteilnehmern, im operativen Ambulanz-Management, der Datenakquisition als auch von Zwischenauswertungen und publikationsrelevanten Analysen unterstützt.

Methoden: LIFE [2] ist eine epidemiologische Studie im obigen Kontext, mit der an einer großen Stichprobe der Leipziger Bevölkerung die Bedingungen, Grundlagen und Zusammenhänge von ausgewählten Zivilisationserkrankungen wie Adipositas, Allergien, Demenz und Depression eruiert werden. Die Teilnehmer werden sowohl chargenbasiert über das zuständige Einwohnermeldeamt wie auch in diversen beteiligten Kliniken rekrutiert. Für Ersteres bedarf es eines abgestuften Einladungs-Management der Teilnehmer, mit dem nicht nur Einladungen ausgesprochen sondern auch kontrolliert, Termine vereinbart und in Abhängigkeit der verfügbaren Ressourcen an Räumen, Personal und med. Geräten über verschiedene Institutionen hinweg koordiniert werden können. Bereits an dieser Stelle kommt dem Datenschutz eine hohe Bedeutung zu, sind doch informationstechnisch die identifizierenden Teilnehmerdaten von den Terminvereinbarungen zum Zwecke der Teilnahme am Untersuchungsprogramm zu separieren. Die Verbindung gelingt über ein Teilnehmerpseudonym, das ausgehend von den Teilnehmerdaten in einem zweistufigen Pseudonymisierungsprozess erzeugt wird. Das erzeugte Teilnehmerpseudonym ist Grundlage für alle Formen der nachfolgenden Datenakquisition. Dazu zählen diverse Interviews, Fragebögen und Untersuchungen (zusammengefasst als Instrumente) mit und ohne Verwendung medizinischer Geräte; in LIFE sind derzeit mehr als 400 verschiedene Instrumente im Einsatz. Jedes dieser Instrumente wird mit spezifischen Eingabemasken und durch Weiterentwicklung und Fehlerbereinigung in verschiedenen Versionen und Varianten auf wiederum unterschiedlichen Eingabesystemen zur Verfügung gestellt. Die mit der daraus resultierenden Menge an Eingabemasken erhobenen Daten bedürfen nachfolgend einer Harmonisierung, so dass eine instrumentbezogene Auswertung vorgenommen werden kann. Dies gelingt in LIFE mit der instrumentspezifischen, semi-automatischen Abbildung [3], [4] von Instrument-Items. Diese Abbildungen sind die Voraussetzung für die Aufnahme der Daten in die zentrale Forschungsdatenbank. Mit ihnen wird nicht nur die Harmonisierung unterschiedlicher Versionen und Varianten vorgenommen, sondern ebenso die regelbasierte Anpassung und Transformation von Daten, wie z.B. Datentypkonvertierungen, Umrechnungen etc. Auf dieser Grundlage wird die Qualität der Daten iterativ überprüft. Ggfs. werden Anpassungen der im Mapping gewählten Transformationsregeln oder eine explizite Datenkuration vorgenommen.

Ergebnisse: Die zentrale Forschungsdatenbank ist aufgebaut und wird produktiv eingesetzt. Bislang wurden mehr als 1000 verschiedene Versionen von mehr als 400 Instrumenten und Gerätedaten mit Hilfe der regelbasierten Abbildung harmonisiert, auf deren Basis die Daten nächtlich in die Forschungsdatenbank überführt werden. Auf dieser Grundlage wurden bereits mehr 100 zum Teil sehr umfangreiche Auswertungsprojekte mit Datenbereitstellungen und Analysen unterstützt.

Acknowledgment: LIFE wird finanziert aus Mitteln der Europäischen Union durch den Europäischen Fonds für regionale Entwicklung (EFRE) und aus Mitteln des Freistaates Sachsen im Rahmen der Landesexzellenzinitiative.


Literatur

1.
Meineke F, Stäubert S, Kirsten T. Medizinische Forschungsdatenbanken als Baustein des Forschungsdatenmanagements an der Universität Leipzig. Proc. of GMDS; 2012.
2.
Life Uni Leipzig. http://life.uni-leipzig.de Externer Link
3.
Rahm E, Bernstein P. A survey of approaches to automatic schema matching. VLDB Journal. 2001;10 (4).
4.
Bellahsene Z, Bonifati A, Rahm E. Schema Matching and Mapping. Springer-Verlag; 2011.