Artikel
Forschungsinfrastruktur, ETL und Data Warehouse
Suche in Medline nach
Autoren
Veröffentlicht: | 27. August 2013 |
---|
Gliederung
Text
Einleitung: Die Verfügbarkeit qualitativ hochwertiger Phänotypdaten stellt eine wesentliche Forschungsgrundlage für die personalisierte Medizin dar. Neben der gezielten, prospektiven Erhebung im Rahmen von Studien nimmt dabei die Wiederverwendung von Daten aus der klinischen Routineversorgung unter der Bezeichnung "Secondary Use" einen zunehmenden Stellenwert ein [1]. Während bisher die technische Erschließung von Datenquellen im Kontext von Clinical Data Warehouse-Lösungen im Vordergrund stand, rücken nunmehr Aspekte der semantischen Interoperabilität sowie der Qualität und Eignung der verfügbaren Daten in den Vordergrund [2]. Wie können unabhängig voneinander erhobene und unterschiedlich codierte Datenelemente für Auswertungen semantisch korrekt zusammengeführt werden? Kann die Eignung von Daten, die im Versorgungsprozess erhoben wurden, für Forschungsfragestellungen objektiv beurteilt werden?
Ergebnisse: In diesem Workshopbeitrag sollen IT-Infrastrukturkomponenten zur Erhebung von Phänotypinformationen (Electronic Data Capture), dem Biobanking sowie der strukturierten Aufbereitung (Extraction, Transformation and Loading) der so generierten Daten vorgestellt werden. Wesentliche Herausforderungen im Sinne der semantischen Integration von Daten aus verschiedenen Quellen sowie der Ableitung qualitativ hochwertiger Phänotypdaten aus der Routineversorgung sollen herausgearbeitet und Lösungswege skizziert werden.