gms | German Medical Science

HEC 2016: Health — Exploring Complexity
2016 Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

28.08. - 02.09.2016, München

Samply.MDR – Ein Open-Source-Metadaten-Repository

Meeting Abstract

  • Dennis Kadioglu - Universitätsmedizin Mainz, Mainz, Deutschland
  • Paul Weingardt - Universitätsmedizin Mainz, Mainz, Deutschland
  • Frank Ückert - DKFZ Heidelberg, Heidelberg, Deutschland
  • Thomas Wagner - Universitätsklinikum Frankfurt, Frankfurt am Main, Deutschland

HEC 2016: Health – Exploring Complexity. Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI. München, 28.08.-02.09.2016. Düsseldorf: German Medical Science GMS Publishing House; 2016. DocAbstr. 425

doi: 10.3205/16gmds149, urn:nbn:de:0183-16gmds1498

Veröffentlicht: 8. August 2016

© 2016 Kadioglu et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Hintergrund: In der medizinischen Forschung ist es je nach Fragestellung erforderlich, die benötigten Daten institutionsuübergreifend zu sammeln, z.B. aufgrund von kleinen Fallzahlen im Bereich der Seltenen Erkrankungen. Üblicherweise unterscheiden sich aber die gesammelten Datensätze in Format und Struktur – einerseits aufgrund einer lokal variierenden Dokumentationspraxis und andererseits aufgrund dessen, dass diese mit ursprü̈nglich unterschiedlichen Zielsetzungen erhoben worden sind – und müssen so transformiert werden, dass diese miteinander vergleichbar und damit gesamtheitlich analysierbar sind. Dies ist jedoch nur möglich, wenn ausreichend Informationen darüber vorliegen, wie die Daten korrekt zu interpretieren sind. Häufig ist eben diese Information jedoch nicht öffentlich einsehbar, z.T. sogar ü̈berhaupt nicht verfü̈gbar [1].

Methoden: Diese Informationen werden unter dem Begriff Metadaten zusammengefasst und in einem sogenannten Metadaten-Repository (MDR) bereitgestellt, bestenfalls an einer zentralen, öffentlich zugä̈nglichen und institutionsübergreifenden Stelle. Der ISO-Standard 11179 [2], im Besonderen Teil 3 in der Version 3, skizziert, unabhängig von einer konkreten Anwendungsdomä̈ne, Aufbau und Funktionsweise eines MDRs sowie das Format und die Struktur der darin verwalteten Metadaten. Die grundlegende Idee dabei ist, mö̈glichst umfassend zu spezifizieren, wie sich ein Attribut oder auch Datenelement charakterisieren und interpretieren lässt.

Ergebnisse: Bei der Entwicklung des Samply.MDR stand zunächst der möglichst ö̈ffentliche Zugriff auf Datenelementspezifikationen im Vordergrund. Entsprechend ISO 11179 umfassen diese u.a. die folgenden Metadatenattribute: Bezeichnung und ausfü̈hrliche Definition, den Datentyp sowie den zulässigen Wertebereich.

Da bereits andere MDR-Lösungen existierten und es das Ziel war, die Anwender zur Wiederverwendung von Datenelementspezifikationen zu motivieren – anstatt diese immer wieder neu zu definieren – wurde von vornherein berü̈cksichtigt, ü̈ber einen Adapter weitere MDRs anbinden zu kö̈nnen. So standen bereits zu Beginn viele Datenelementspezifikationen zur Verfügung, die in diesem Sinne von den Benutzern wiederverwendet werden konnten. Der in der bisherigen Implementierung umgesetzte Adapter für das caDSR des National Cancer Institutes [3] erlaubt es, aus dem Samply.MDR heraus dort nach Datenelementen zu suchen, ein mö̈glicherweise passendes von dort zu importieren – dabei wird ein Verweis auf das ursprüngliche Datenelement angelegt – und die Metadaten dabei noch anzureichern, z.B. durch eine Übersetzung ins Deutsche.

Der Zugriff auf die im MDR hinterlegten Metadaten kann einerseits ü̈ber eine grafische Benutzungsoberflä̈che und andererseits über eine REST-Schnittstelle erfolgen. Eine entsprechende Integration erfolgt in der CCP-IT des DKTK [4] und dem OSSE-Registerbaukasten [5]. Die Dokumentationen zur REST-Schnittstelle sowie zur Installation einer MDR-Instanz finden sich unter [6]. Ende 2015 ist der Quellcode des Samply.MDR unter der AGPL-Lizenz [7] als Open Source verö̈ffentlicht worden und kann unter [8] abgerufen werden. Dort ist es ebenfalls mö̈glich und auch gewünscht, etwaige Fehler zu melden und Codebeiträ̈ge einzureichen, um die Weiterentwicklung des MDRs praxis- und communitygetrieben voranzutreiben.

Zusammenfassung: Der aktuelle Stand der Implementierung kann es den Verantwortlichen erleichtern, die von Dritten erhaltenen Daten mit den eigenen oder denjenigen von weiteren Dritten zu integrieren, um diese gesamtheitlich auswerten zu können. Dabei handelt es sich aber um einen manuellen Prozess. Die dabei definierten Abbildungsvorschriften zwischen Datenelementen sollen zukünftig jedoch auch im MDR gespeichert werden, um eine zumindest teilautomatisierte Datenintegration zu ermö̈glichen: Neben einer passenden Entsprechung für ein Datenelement könnte auch eine Transformationsregel (z.B. Umrechnung zwischen Maßeinheiten) abrufbar sein.


Literatur

1.
Dugas M, Jöckel KH, Friede T, Gefeller O, Kieser M, Marschollek M, Ammenwerth E, Röhrig R, Knaup-Gregori P, Prokosch HU. Memorandum "Open Metadata". Open Access to Documentation Forms and Item Catalogs in Healthcare. Methods Inf Med. 2015;54(4):376-8. DOI: 10.3414/ME15-05-0007 Externer Link
2.
ISO/IEC 11179, Information Technology – Metadata registries (MDR). http://metadata-standards.org/11179/. Letzter Zugriff 08.03.2016. Externer Link
3.
Komatsoulis GA, Warzel DB, Hartel FW, Shanbhag K, Chilukuri R, Fragoso G, Coronado Sd, Reeves DM, Hadfield JB, Ludet C, Covitz PA. caCORE version 3: Implementation of a model driven, service-oriented architecture for semantic interoperability. J Biomed Inform. 2008 Feb;41(1):106-23. DOI: 10.1016/j.jbi.2007.03.009 Externer Link
4.
Lablans M, Kadioglu D, Muscholl M, Ückert F. Exploiting Distributed, Heterogeneous and Sensitive Data Stocks while Maintaining the Owner's Data Sovereignty. Methods Inf Med. 2015;54(4):346-52. DOI: 10.3414/ME14-01-0137 Externer Link
5.
Muscholl M, et al. OSSE – open source registry software solution. Orphanet J Rare Dis. 2014;9 Suppl 1:O9. DOI: 10.1186/1750-1172-9-s1-o9 Externer Link
6.
The Samply Metadata Repository. https://doc.samply.de/mdr/. Letzter Zugriff 08.03.2016. Externer Link
7.
GNU Affero General Public License. https://www.gnu.org/licenses/agpl-3.0.html. Letzter Zugriff 08.03.2016. Externer Link
8.
Source Code Repository of the Samply.MDR. https://code.samply.de/mdr. Letzter Zugriff 08.03.2016. Externer Link