gms | German Medical Science

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

26. - 29.09.2011 in Mainz

Datenmanagement für die Nationale Kohorte: Herausforderungen – Konzepte – Aktueller Stand

Meeting Abstract

  • Daniel Kraft - Deutsches Krebsforschungszentrum, Heidelberg
  • Stefan Ostrzinski - Universitätsmedizin, Greifswald
  • Rudolf Kaaks - Deutsches Krebsforschungszentrum, Heidelberg
  • Wolfgang Hoffmann - Universitätsmedizin, Greifswald

Mainz//2011. 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi). Mainz, 26.-29.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11gmds427

DOI: 10.3205/11gmds427, URN: urn:nbn:de:0183-11gmds4270

Published: September 20, 2011

© 2011 Kraft et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Die "Nationale Kohorte" ist eine bevölkerungsbasierte longitudinale Kohortenstudie mit angestrebten 200.000 Probanden aus ganz Deutschland, die von Helmholtz-Einrichtungen, Universitäten, Leibniz-Instituten und dem Robert-Koch-Institut gemeinsam geplant wird. Das Studienprotokoll umfasst eine Erstuntersuchung in einem von 18 Studienzentren, eine Folgeuntersuchung nach 5 Jahren sowie langfristige Nachbeobachtung (Nachbefragungen, Registerbeobachtung, Sekundärdatenabgleich) über einen Zeitraum von bis zu 30 Jahren. Subkohorten erhalten ein intensiviertes Protokoll mit aufwändigeren Untersuchungen (N=40000) sowie MRT-Untersuchungen (N=40000). Ziel des Vorhabens ist die Schaffung eines umfangreichen Datenbestandes als "Infrastruktur" für die epidemiologische Forschung in Deutschland. Gegenstand des Datenmanagements der Nationalen Kohorte ist die informationstechnische Unterstützung der gesamten Studie, von der Probandengewinnung und -verwaltung über die Erhebung, Speicherung, Weiterverarbeitung und Standardisierung von Studiendaten bis hin zur Aufbereitung für wissenschaftliche Analysen. Dabei muss das Datenmanagement einer Reihe von Herausforderungen gerecht werden:

  • Die große Zahl beteiligter Institutionen sowie Umfang und Komplexität der erhobenen Daten sind organisatorisch und technisch zu bewältigen.
  • Die lange Laufzeit des Projekts und der mit der Zeit zunehmende wissenschaftliche Wert der erhobenen Daten erfordern ein vorausschauend und zuverlässig organisiertes Management.
  • Dezentrale Erhebung, zentrale Verarbeitung und kooperative Nutzung der Studiendaten lassen sich nur durch effiziente Integration, transparente Regelungen und verbindliche Prozesse realisieren.
  • Für das institutionsübergreifende Qualitätsmanagement sind geeignete Strukturen zu schaffen.
  • Ethische und datenschutzrechtliche Anforderungen sind systematisch und konzeptionell zu erfüllen.

Ausgehend von diesen Herausforderungen analysieren wir die Anforderungen an das Datenmanagement der Nationalen Kohorte in den Bereichen Datenqualität und Standardisierung, Informationssicherheit und Datenschutz. Basierend darauf stellen wir ein Organisationsmodell für das Datenmanagement vor, das auch die Grundlage für die Implementierung der Datenverarbeitungsprozesse und Datenflüsse bildet. Im Kern beinhaltet dieses Modell drei Arten von Organisationseinheiten:

1) 18 Studienzentren (Rekrutierung, Untersuchungen, Interviews, Probengewinnung, lokales Qualitätsmanagement),

2) 2 Integrationszentren (Integration aller Studiendaten, automatisierte Qualitätssicherungsprozeduren, Datensicherung und -archivierung, zentrale Koordinierungs- und Unterstützungsaufgaben),

3) mehrere Kompetenzeinheiten (institutionsübergreifende Aufgaben der Anreicherung, Standardisierung und Qualitätssicherung jeweils für spezifische Teile des Gesamtdatenbestandes).

Ferner sieht das Konzept separate zentrale Einrichtungen vor für die Verarbeitung personenbezogener Daten und für den Datentransfer für wissenschaftliche Analysen durch interne und externe Wissenschaftler. Für die Umsetzung der Kernprozesse des Datenmanagements werden Lösungsansätze vorgestellt. Dies betrifft insbesondere die Datenerfassung mit elektronischen und Papierformularen, die Übernahme von Daten aus diagnostischen Geräten, die Aufbereitung und Interpretation "komplexer" Daten, die Integration aller erhobenen Studiendaten zu einem gemeinsamen standardisierten Datenbestand sowie die Bereitstellung von Daten für Forschungsprojekte. Abschließend gehen wir auf den aktuellen Stand der Planungen ein und stellen erste Erfahrungen und Ergebnisse aus den laufenden Machbarkeitsstudien vor.