gms | German Medical Science

GMDS 2014: 59. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

07. - 10.09.2014, Göttingen

Einbindung von openEHR Archetypen in den ETL-Prozess eines klinischen Data Warehouse

Meeting Abstract

Suche in Medline nach

  • B. Haarbrandt - Peter L. Reichertz Institut für Medizinische Informatik der Technischen Universität Braunschweig und der Medizinischen Hochschule Hannover, Braunschweig
  • S. Gerbel - Zentrum für Informationsmanagement der Medizinischen Hochschule Hannover, Hannover
  • M. Marschollek - Medizinische Hochschule Hannover, Hannover

GMDS 2014. 59. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Göttingen, 07.-10.09.2014. Düsseldorf: German Medical Science GMS Publishing House; 2014. DocAbstr. 230

doi: 10.3205/14gmds227, urn:nbn:de:0183-14gmds2272

Veröffentlicht: 4. September 2014

© 2014 Haarbrandt et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung und Fragestellung: Die Zweitverwendung klinischer Routinedaten zur Unterstützung der Forschung stellt hohe Anforderungen an Datenqualität und Interoperabilität. Die Integration und Standardisierung heterogener Datenbestände sind hierfür Voraussetzung. Ein etablierter Ansatz zur zentralen Datenintegration und Standardisierung innerhalb einer Organisation ist der Aufbau eines Data Warehouse (DWH). Die hohe Komplexität medizinischer Dokumentation und ihre sich fortlaufend ändernden Anforderungen müssen jedoch bei der Konzipierung eines klinischen Data Warehouse Berücksichtigung finden. Als eine Methode zur Unterstützung der Datenintegration und Pflege medizinischer Daten werden detaillierte klinische Modelle (DCM) beschrieben [1]. DCM sind formale, maschinenlesbare Modelle klinischer Konzepte, die zwischen Menschen und/oder System ausgetauscht werden können [1]. Im Bereich des klinischen Data Warehousing wurden bereits erste DCM-basierte Ansätze beschrieben, die klinische Daten auf Grundlage des HL7 Reference Information Model (RIM) lokal integrieren [2]. Im Rahmen des Ausbaus des klinischen Data Warehouse der Medizinischen Hochschule Hannover (MHH) erproben wir den Einsatz von openEHR Archetypen zur Etablierung einer Standard-basierten Datenintegration. Dieser Beitrag stellt unseren Ansatz zur Einbindung von openEHR Archetypen in den ETL-Prozess eines bestehenden Data Warehouse vor.

Material und Methoden: Das klinische DWH der MHH umfasst in einem relationalen Datenmodell gespeicherte Patienten-Stammdaten, Diagnosen und Labordaten. Es basiert auf der Inmon-Architektur [3], das heißt, dass Daten zunächst in einer konsolidierten Schicht zusammengeführt („single version of the truth“) und auf der anschließend fachspezifische Sichten auf die Datenbestände gebildet werden (Data Marts). Für die Datenintegration finden Werkzeuge von Microsoft Verwendung, insbesondere SQL Server Integration Services (SSIS) zur Unterstützung des ETL-Prozesses (Extract, Transform, Load). Zurzeit sind Daten von 1,6 Millionen Patienten im DWH gespeichert.

Als Quell- und Testsystem zur Datenintegration dient das Patientendatenmanagementsystem (PDMS) der intensivmedizinischen Abteilungen namens „m.life“. Zur beispielhaften Umsetzung der Datenintegration dient eine Untermenge der Vitalparameter-Daten (Blutdruck, Herzfrequenz, Temperatur) aus m.life, die auf entsprechende Archetypen aus dem internationalen openEHR Repositorium abgebildet werden [4]. openEHR Archetypen sind eine Methode, um maschinenlesbare Modelle klinischer Konzepte zu erstellen. Sie basieren auf einem Informationsmodell (auch genannt Referenzmodell), das Objekte zur Modellierung klinischer Konzepte definiert [5].

Als Integrationsstrategie findet der Template Document Schema (TDS) Ansatz Verwendung [6]. Zunächst werden die Archetypen in ein Template (Repräsentation eines klinischen Dokumentes) eingebettet, das anschließend durch eine XML-Transformation in ein XML Schema überführt wird. Die klinischen Daten aus den Quellsystemen werden auf das jeweilige Schema abgebildet. Das Ergebnis ist ein Template Data Document (TDD); ein mit Daten befülltes XML-Dokument nach Vorlage des TDS. Nach einer Validierung des TDD gegen das zugehörige TDS überführt eine XML-Transformation das TDD in openEHR XML, dem XML-Standard zur Repräsentation archetypisierter Daten.

Ergebnisse: Eine Archetypen-basierte Integration von intensivmedizinischen Vitalparameter-Daten in das klinische Data Warehouse der MHH aus der Intensivmedizin wurde umgesetzt. Jedes der erstellten Templates erhält eine Art von Vitalparametern eines Patienten für 24 Stunden. Der TDS Ansatz lässt sich durch die Verwendung von XML-Technologien in die bestehende Integrationsumgebung des Data Warehouse integrieren, wobei Altova Mapforce 2014 genutzt wird, um den Code für das Mapping der Quelldaten auf die TDS-Dateien zu erzeugen. Die Speicherung der Templates und Archetypen erfolgt im Data Warehouse mittels einer Instanz des Microsoft SQL Servers 2012 und nutzt ein kombiniertes Datenmodell bestehend aus Relationen und XML-Dokumenten. Hierzu werden die mit klinischen Daten gefüllten Templates im openEHR XML-Format mittels eines Skriptes durchlaufen, die enthaltenen Archetypen extrahiert und durch Zuweisung von IDs und Schlüsseln unter Erhalt der hierarchischen Beziehungen in XML-Datenfeldern abgelegt. Mittels T-SQL und Selektiver XML-Indices ist der Zugriff auf die im XML-Format gespeicherten Daten möglich.

Diskussion: Die vorgestellte Methode stellt eine Möglichkeit dar, um eine Archetypen-basierten Datenintegration im Kontext eines bestehenden klinischen DWH umzusetzen. Der TDS Ansatz zeigt sich aufgrund der Verwendung von XML-Technologien als praktikabel, da entsprechende Werkzeuge zur Einbindung in die ETL-Prozesse verfügbar sind. Nächste Schritte sind die Einbindung eines openEHR Servers zur formalen Datenvalidierung sowie eine tiefere Evaluation der angewandten Persistierungsstrategie. Darauf aufbauend sollen Vorteile und Herausforderungen durch die Archetypen-basierte Datenintegration im Kontext des klinischen Data Warehousing erforscht werden. Publikationen über die Verwendung von Archetypen in diesem Anwendungsgebiet waren den Autoren zum Zeitpunkt der Erstellung dieses Beitrags nicht bekannt.


Literatur

1.
Goossen W, Goossen-Baremans A, van der Zel M. Detailed clinical models: a review. Healthc Inform Res. 2010 Dec;16(4):201-14.
2.
Lowe HJ, Ferris TA, Hernandez PM, Weber SC. STRIDE - An integrated standards-based translational research informatics platform. AMIA Annu Symp Proc. 2009 Nov 14;2009:391-5.
3.
Inmon WH. Building The Data Warehouse. Vierte Aufl. Indianapolis: Wiley; 2005.
4.
openEHR Clinical Knowledge Manager [Internet]. 2014 [zitiert am 30.03.2014]. URL: http://www.openehr.org/ckm/ Externer Link
5.
Beale T. Archetypes, constraint-based domain models for future-proof information systems. Seattle, Washington, USA: Northeastern University, Boston; 2002. pp. 16–32. (Eleventh OOPSLA workshop on behavioral semantics: serving the customer: 2002).
6.
Frankel H. HL7 Working Group Meeting - Using Archetypes with HL7 Messages and Clinical Documents [PowerPoint Präsentation]. 2011 [zitiert am 30.03.2014]. URL: http://www.mz.gov.si/fileadmin/mz.gov.si/pageuploads/eZdravje/Novice/gradiva_predstavitve_dogodkov/Open_EHR/7_integration.pdf Externer Link