gms | German Medical Science

62. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

17.09. - 21.09.2017, Oldenburg

Die Publikation von medizinischen Forschungsdaten als Form des Data Sharings – Publikationsprozess im Fachrepositorium Lebenswissenschaften

Meeting Abstract

Search Medline for

  • Birte Lindstädt - ZB MED – Informationszentrum Lebenswissenschaften, Köln, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 62. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Oldenburg, 17.-21.09.2017. Düsseldorf: German Medical Science GMS Publishing House; 2017. DocAbstr. 195

doi: 10.3205/17gmds092, urn:nbn:de:0183-17gmds0920

Published: August 29, 2017

© 2017 Lindstädt.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Als Teil der Medical Data Science leistet eine Publikation von Forschungsdaten einen Beitrag zur Dissemination, Reproduzierbarkeit und Nachnutzbarkeit von Forschungsergebnissen.

Es besteht eine große Heterogenität hinsichtlich der Art und Weise, wie und auf welchen Wegen Forschungsdaten in der Praxis für die Nutzung durch Dritte veröffentlicht werden. So werden Daten etwa in fachlichen oder überfachlichen Forschungsdatenrepositorien veröffentlicht, im Zuge der Veröffentlichung eines Fachartikels als „supplementary material“ zur Verfügung gestellt oder es wird im Rahmen eines “data papers” auf sie verwiesen. Dabei variieren die verschiedenen Wege hinsichtlich einer Vielzahl von Faktoren, u.a. der erforderlichen Dokumentation, der Validierung und Qualitätssicherung (bspw. durch Peer-Review), Versionierung, Vergabe von persistenten Identifikatoren sowie der Unterstützung von Datenzitationen.

Während für medizinische Forschungsdaten aus großen Forschungsprojekten und sog. Big Data bereits öffentlich zugängliche Datenbanken, Biobanken, etc. existieren, besteht für kleinere Datenmengen des sog. Long Tail noch eine Lücke, die mit einem Publikationsangebot über ein lebenswissenschaftliches Fachrepositorium gefüllt werden soll.

Methoden: Um medizinische Forschungsdaten publizieren zu können, bedarf es entsprechender Informationsinfrastrukturen, die inhaltlich – zum Beispiel durch ein passendes Metadatenschema – und technisch den Anforderungen der vorliegenden Daten entsprechen.

Dabei sind die Grundsätze von Open Data zu beachten. Von Open Data spricht man, wenn folgende Kriterien erfüllt sind:

  • Veröffentlichung im Internet,
  • Maschinenlesbarkeit,
  • Lizenzierung, die jedem die Nutzung und das Teilen der Daten erlaubt.

ZB MED bietet in diesem Aufgabenspektrum Informationen, Beratung und technische Publikationsinfrastruktur. Forschungsdaten können im Zusammenhang mit einer Textpublikation oder auch singulär im Fachrepositorium Lebenswissenschaften veröffentlicht und dauerhaft gespeichert werden. Dazu wurde ein geeignetes Metadatenschema entwickelt, das auf dem generischen Schema des Konsortiums DataCite basiert und um fachbezogene Kriterien ergänzt wurde. Je nach Anforderungen der zu publizierenden Forschungsdaten kann es weiterentwickelt werden.

Im Publikationsprozess werden zunächst alle urheberrechtlichen Rahmenbedingungen durch eine entsprechende Vereinbarung mit dem Autor geklärt. Nach der Einreichung der publikationsfähigen Daten durchläuft jeder Datensatz eine Qualitätsprüfung durch ZB MED im Hinblick auf Aspekte wie Dokumentation der Metadaten oder Erfüllung des Datenschutz. Als Grundlage der Auffindbarkeit, Zitierfähigkeit und Referenzierbarkeit von Forschungsdaten vergibt ZB MED Digital Object Identifier (DOI) für die Forschungsdatensätze.

Ergebnisse: Als Ergebnis bietet das Fachrepositorium Lebenswissenschaften eine Publikationsmöglichkeit für medizinische Daten, die nicht in projektbezogenen öffentlich zugänglichen Datenbanken nachgewiesen sind und den sog. Long Tail von Forschungsdaten darstellen, d.h. kleinere, eher unstrukturierte Datenmengen.

Diskussion: Die Publikation von Forschungsdaten ist Teil des Forschungsdatenmanagements, das sich wiederum am Lebenszyklus von Forschungsdaten orientiert, der verschiedene Schritte umfasst. Diese reichen von der Antrags- und Planungsphase sowie Erhebung der Forschungsdaten über die Auswahl der aufzubewahrenden Daten, ihre Speicherung und Publikation bis hin zur Sicherung des Zugriffs und der Nutzung. Übergreifende Aufgaben entlang dieses Lebenszyklus betreffen Fragen nach den Kosten für die Speicherung und Erhaltungsmaßnahmen und wer sie trägt, welche Metadaten erfasst werden müssen, um nach ihnen suchen und sie erschließen zu können, oder wie man die Daten durch persistente Identifikatoren dauerhaft auffindbar und zitierfähig macht.

In medizinische Forschungsprojekte sollte ein konsequentes Forschungsdatenmanagement betrieben werden, um letztlich zu publikationsfähigen und -würdigen Daten zu kommen.



Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.