gms | German Medical Science

64. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

08. - 11.09.2019, Dortmund

Forschungsdaten-IT für ein MI-I Datenintegrationszentrum - Ein Konzept für das effizientere Auswerten und Verwalten von Medizinischen Forschungsdaten

Meeting Abstract

  • Tim Herrmann - Otto-von-Guericke-Universität Magdeburg/IBMI, Magdeburg, Germany
  • Christian Bruns - Otto-von-Guericke-Universität Magdeburg/IBMI, Magdeburg, Germany
  • Sebastian Schindler - Otto-von-Guericke-Universität Magdeburg/IBMI, Magdeburg, Germany
  • Ralf Lützkendorf - Otto-von-Guericke-Universität Magdeburg/IBMI, Magdeburg, Germany
  • Frederike Euchner - Otto-von-Guericke-Universität Magdeburg/IBMI, Magdeburg, Germany
  • Stefan Krötki - Otto-von-Guericke-Universität Magdeburg/IBMI, Magdeburg, Germany
  • Jan Maluche - Otto-von-Guericke-Universität Magdeburg/IBMI, Magdeburg, Germany
  • Rüdiger Lehmann - Otto-von-Guericke-Universität Magdeburg/IBMI, Magdeburg, Germany
  • Markus Plaumann - Otto-von-Guericke-Universität Magdeburg/IBMI, Magdeburg, Germany
  • Hermann-Josef Rothkötter - Otto-von-Guericke-Universität Magdeburg, IANA, Magdeburg, Germany
  • Johannes Bernarding - Otto-von-Guericke-Universität Magdeburg, IBMI, Magdeburg, Germany

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 64. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Dortmund, 08.-11.09.2019. Düsseldorf: German Medical Science GMS Publishing House; 2019. DocAbstr. 240

doi: 10.3205/19gmds167, urn:nbn:de:0183-19gmds1672

Published: September 6, 2019

© 2019 Herrmann et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Im Rahmen des MIRACUM-Konsortiums als Teil der deutschlandweiten Medizininformatik-Initiative, werden sogenannte Datenintegrationszentren bis 2021 etabliert [1]. Diese Datenintegrationszentren haben auch die Aufgabe das Forschungsdatenmanagement der jeweiligen Universitätsmedizin neu mit zu strukturieren. Diese Aufgabe stellt aus unserer Sicht die vorhandene IT der lokalen Uniklinik IT-Zentren, deren Hauptaufgabe der Betrieb der Versorgungssysteme mit der IT ist, vor neue Herausforderungen. Im Rahmen eines BMBF-Vorläuferprojekts (EDUHF-LAB MRI) wurde bereits das Konzept eines sogenannten „Big Data Show Room“, eine virtuelle Forschungsdatenumgebung, entwickelt und erprobt, ohne die Daten direkt zwischen Partnerstandorten transferieren zu müssen [2]. Hieraus entwickelte sich ein Konzept, welches ermöglicht, durch mehrere Säulen eine IT so zu strukturieren, dass diese die Auswertung von medizinischen Forschungsdaten beinhaltet und durch Verwaltung und Archivierung nachhaltig macht.

Methoden: Das derzeit verbreitetste Virtualisierungskonzept an IT-Zentren der Unikliniken nutzt die proprietäre Software Dell Technologies VMware, um virtuelle Maschinen (VM) auf Typ I Hypervisoren bereitzustellen. Der Speicher liegt meist dezentral als Netzwerkspeicher (SAN - 1 bis 40Gbit Bandbreite) vor. Die Kosten für diese Software mit der zertifizierten Hardware sind beträchtlich und bilden meist ein sehr enges "Korsett" im Bezug auf den effizienten Einsatz von Zukunftstechnologien, wie der immer stärker werdende Nutzungsbedarf von Containern (CT) wie z.B. Linux Container (LXC) und Docker. Wir glauben, dass sich die IT für das Bereitstellen von Forschungsdaten flexibler und transparenter aufstellen muss. Aus diesem Grund wurde am Standort Magdeburg für das neu aufgebaute Datenintegrationszentrum ein anderes IT-Konzept entwickelt, welches vollständig auf Open Source Software basiert und auf einer heterogenen Hardwareinfrastruktur hochverfügbar betrieben wird. Dieses Konzept nutzt als Basis sogenannte Applikations- und Speicherserver, welche Speicher und Virtualisierung auf Basis von Typ II Hypervisoren (KVM/QEMU) bereitstellen. Die Virtualisierungsumgebung wird auf Basis der Open Source Software Proxmox realisiert, die viele notwendige Funktionen über die reine Virtualisierung hinaus beinhaltet. Der entscheidende Punkt liegt in der Nutzbarkeit des seit über 10 Jahren etablierten Dateisystems ZFS als modernes Speicherkonzept in Verbindung mit VMs und CTs. Hierdurch ist es möglich, schnellen, revisionierbaren, komprimierbaren (LZ4-Kompressionsverfahren) und verschlüsselbaren Speicher für Forschungsdaten, welche über eine VM oder CT ausgewertet werden, aber nicht darin verbleiben sollen, über lokale NVMe- und SAS-Schnittstellen mit Bandbreiten von bis zu 160-Gbit bereitzustellen. Auch Hochleistungssimulationen mit CPUs und Grafikbeschleunigerkarten als sogenanntes GPU-Computing für Machine Learning und andere Use Cases stehen im Fokus dieses Konzeptes.

Ergebnisse: Es wurden bis dato mehrere Projekte mit Forschungsdaten durchgeführt, welche Bilddaten, BioEM-Simulationsdaten, Omics-Daten oder datenbankkonforme Daten umfassten. Die ausgewerteten Forschungsdaten wurden den Wissenschaftlern über einen personalisierten Zugriff (Remote Access Client, CLI) zur Verfügung gestellt. Die Performance dieses Konzepts ist sehr zufriedenstellend und konnte alle gestellten Anforderungen inklusive der Hochverfügbarkeit bedienen. Das Bereitstellen von revisionierbarem Speicher für Forschungsdaten mit personalisiertem Zugriff erfüllt die bisherigen Use Cases vollständig. Auch eine Langzeitarchivierung mit Verschlüsselung wird damit gewährleistet.

Diskussion: Eine IT für Forschungsdaten auf Basis von Applikations- und Speicherservern, in Verbindung mit der KVM/QEMU Open Source Virtualisierungssoftware Proxmox, zeigte sich performant und kosteneffizient. Gerade bei neu aufzubauenden Strukturen, wie einem Datenintegrationszentrum und begrenzten IT-Ressourcen kann mit diesem Ansatz eine große Bandbreite von Datenauswertung bis Datenbereitstellung abgedeckt werden.

Förderung: MIRACUM BMBF (FKZ 01ZZ1801H).

Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Prokosch HU, Acker T, Bernarding J, Binder H, Boeker M, Boerries M, Daumke P, Ganslandt T, Hesser J, Höning G, Neumaier M, Marquardt K, Renz H, Rothkötter HJ, Schade-Brittinger C, Schmücker P, Schüttler J, Sedlmayr M, Serve H, Sohrabi K, Storf H. MIRACUM: medical informatics in research and care in University medicine. Methods of information in medicine. 2018 Jul;57(S 01):e82-91.
2.
Herrmann T, Bruns C, Lützkendorf R, Euchner F, Plaumann M, Bernarding J. Big Data Showroom – ein Konzept für standortübergreifende Kooperationen. In: Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie, Hrsg. 63. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Osnabrück, 02.-06.09.2018. Düsseldorf: German Medical Science GMS Publishing House; 2018. DocAbstr. 175.