gms | German Medical Science

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

26. - 29.09.2011 in Mainz

Aufbau einer auf Routinedaten basierenden, standortübergreifenden Forschungsplattform für das Deutsche Prostatakarzinom-Konsortium e.V.

Meeting Abstract

  • Sebastian Mate - Lehrstuhl für Medizinische Informatik, Friedrich-Alexander-Universität Erlangen-Nürnberg, Erlangen
  • Felix Köpcke - Lehrstuhl für Medizinische Informatik, Friedrich-Alexander-Universität Erlangen-Nürnberg, Erlangen
  • Bernd Wullich - Urologische Klinik, Universitätsklinikum Erlangen, Erlangen
  • Bernhard Breil - Institut für Medizinische Informatik, Westfälische Wilhelms-Universität Münster, Münster
  • Martin Dugas - Institut für Medizinische Informatik, Westfälische Wilhelms-Universität Münster, Münster
  • Thomas Bürkle - Lehrstuhl für Medizinische Informatik, Friedrich-Alexander-Universität Erlangen-Nürnberg, Erlangen
  • Hans-Ulrich Prokosch - Lehrstuhl für Medizinische Informatik, Friedrich-Alexander-Universität Erlangen-Nürnberg, Erlangen
  • Thomas Ganslandt - Medizinisches IK-Zentrum, Universitätsklinikum Erlangen, Erlangen

Mainz//2011. 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi). Mainz, 26.-29.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11gmds480

DOI: 10.3205/11gmds480, URN: urn:nbn:de:0183-11gmds4800

Published: September 20, 2011

© 2011 Mate et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung: Das Deutsche Prostatakarzinom-Konsortium e.V. (DPKK) beabsichtigt den Aufbau einer gemeinsamen Datenbank mit Daten von Prostatakarzinompatienten zur standort-übergreifenden Recherche nach Patientenkollektiven, um die Initiierung gemeinsamer Forschungsprojekte zu unterstützen [1]. Eine bereits existierende webbasierte Datenbank des DPKKs erwies sich aufgrund des zusätzlichen Dokumentationsaufwandes als wenig praktikabel und hinsichtlich des abbildbaren Datensatzes als nur schwierig erweiterbar. Im Rahmen eines Pilotprojekts an den Universitätskliniken Erlangen und Münster wurde eine prototypische föderierte Forschungsplattform entwickelt, in der Daten aus der jeweiligen elektronischen Krankenakte wiederverwendet werden können.

Methoden: Mit der in den USA entwickelten und für den Einsatz in deutschen Forschungsnetzen evaluierten Open-Source-Software i2b2 steht ein etabliertes Data-Warehouse mit frei parametrierbarem Datenschema zur Verfügung, um Patientenkollektive benutzerfreundlich ermitteln zu können [2], [3]. Zur semantisch korrekten Abbildung der heterogenen Quelldaten auf den DPKK-Datensatz wurde ein Verfahren entwickelt, mit dem die entsprechenden Datenelemente der Quellsysteme (Soarian in Erlangen und ORBIS in Münster), der DPKK-Zieldatensatz in i2b2 und die dazwischenliegenden Mapping-, Transformations- und Filterregeln deklarativ in OWL-Ontologien [4] beschrieben und anschließend in SQL-Exportskripte übersetzt werden. Hinsichtlich des Rechercheportals wurde aus Datenschutzgründen ein zweistufiger Aufbau gewählt. Jeder DPKK-Mitgliedsstandort erhält eine lokale i2b2-Instanz. Diese ermöglicht standortspezifische Patientenrecherchen auf pseudonymisierten Daten und die Anonymisierung und Übermittlung des Datenbestandes in eine zentrale, gemeinsame i2b2-Instanz. In dieser können Recherchen nach Patientenpopulationen durch alle DPKK-Mitglieder erfolgen. Das Rechercheergebnis zeigt an, wie viele passende Patienten von welchem DPKK-Partner dokumentiert wurden. Mittels des i2b2-Query-Definition-Communicators, einer Erlanger i2b2-Ergänzung, können die entsprechenden Abfragekriterien an die betroffenen standortspezifischen i2b2-Instanzen weitergeleitet werden. Durch Ausführen der Query auf den lokalen i2b2-Instanzen können anschließend die Patienten am jeweiligen Standort identifiziert werden.

Ergebnisse: Die aktuelle Pilotierung basiert auf zwei lokalen und einer zentralen i2b2-Instanz. Von den 166 im DPKK-Datensatz definierten Datenelementen konnten 148 Datenelemente der Erlanger Prostata-Ca-Routinedokumentation in Soarian und 128 Datenelemente aus ORBIS erfolgreich gemappt werden; die restlichen Datenelemente sind in den Quellsystemen noch nicht dokumentiert. Das Mapping-Verfahren wurde in Erlangen mit Echtdaten aus 15 vollständigen Prostata-Ca-Dokumentationsbögen und in Münster mit künstlichen Testdaten evaluiert.

Diskussion: Auf Basis der i2b2-Plattform konnte ein Ansatz für eine institutionsübergreifende Forschungsdatenbank entwickelt werden, der sowohl eine datenschutzkonforme Datenintegration auf der Basis eines Single-Source-Ansatzes sowie die Bereitstellung eines Rechercheportals abdeckt. Die Datenintegration erlaubt derzeit eine nahezu vollständige Extraktion des DPKK-Datensatzes aus den jeweiligen Quellsystemen. Im nächsten Schritt werden weitere DPKK-Mitglieder mit einbezogen und der Ausbau um deren jeweils lokale i2b2-Instanzen durchgeführt. Durch die Erweiterung von i2b2 zur Kommunikation von Query Definitionen ist es möglich, lokal mit pseudonymisierten Daten und zentral auf einem gemeinsamen, anonymisierten Datenbestand zu arbeiten.


Literatur

1.
Wullich B, Wernert N, Unteregger G. 6. Interdisziplinärer Workshop des Deutschen Prostatakarzinom-Konsortiums (DPKK) e.V. Der Urologe. 2009;48:299.
2.
Deshmukh VG, Meystre SM, Mitchell JA. Evaluating the informatics for integrating biology and the bedside system for clinical research. BMC Med Res Methodol. 2009;9:70.
3.
Ganslandt T, Mate S, Helbing K, Sax U, Prokosch HU. Unlocking Data for Clinical Research –– The German i2b2 Experience. Applied Clinical Informatics. 2011;2:116-27.
4.
Ruttenberg A, Clark T, Bug W, Samwald M, Bodenreider O, Chen H, Doherty D, Forsberg K, Gao Y, Kashyap V, Kinoshita J, Luciano J, Marshall MS, Ogbuji C, Rees J, Stephens S, Wong GT, Wu E, Zaccagnini D, Hongsermeier T, Neumann E, Herman I, Cheung KH. Advancing translational research with the Semantic Web. BMC Bioinformatics. 2007;8(Suppl 3):2.