gms | German Medical Science

GMDS 2015: 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

06.09. - 09.09.2015, Krefeld

Erschließung eines Anästhesie-Informationssystems im Kontext des Secondary Use

Meeting Abstract

  • Caroline Drescher - Lehrstuhl für medizinische Informatik der Friedrich-Alexander-Universität Erlangen/Nürnberg, Deutschland
  • Andreas Ackermann - Anästhesiologische Klinik des Universitätsklinikums Erlangen, Deutschland
  • Dennis Toddenroth - Lehrstuhl für medizinische Informatik der Friedrich-Alexander-Universität Erlangen/Nürnberg, Deutschland
  • Tino Münster - Anästhesiologische Klinik des Universitätsklinikums Erlangen, Deutschland
  • Jürgen Schüttler - Anästhesiologische Klinik des Universitätsklinikums Erlangen, Deutschland
  • Hans-Ulrich Prokosch - Lehrstuhl für medizinische Informatik der Friedrich-Alexander-Universität Erlangen/Nürnberg, Deutschland
  • Thomas Ganslandt - Medizinische Zentrum für Informations- & Kommunikationstechnik des Universitätsklinikums Erlangen, Deutschland

GMDS 2015. 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Krefeld, 06.-09.09.2015. Düsseldorf: German Medical Science GMS Publishing House; 2015. DocAbstr. 203

doi: 10.3205/15gmds078, urn:nbn:de:0183-15gmds0780

Published: August 27, 2015

© 2015 Drescher et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Daten aus klinischen Behandlungsprozessen werden zunehmend im Rahmen von clinical Data Warehouse-Systemen (cDWH) für weitergehende Nutzungen erschlossen. Dieser "Secondary Use" umfasst nicht nur die Integration und Präsentation von Daten für Managementzwecke (z.B. Controlling, Qualitätssicherung), sondern auch die Unterstützung von Forschungsprozessen (z.B. Hypothesengenerierung, Fallzahlabschätzung, Rekrutierungsunterstützung, retrospektive Beobachtungsstudien) [1]. Für die Realisierung dieser Anwendungsfälle stehen sowohl kommerzielle Werkzeuge (z.B. IBM CognosTM) als auch etablierte Open Source-Lösungen mit breiter Anwendercommunity (z.B. i2b2 [2], tranSMART [3]) zur Verfügung. Ein wesentliches Feature dieser wissenschaftlich orientierten Abfrageplattformen besteht im flexiblen und iterativen Zusammenstellen von ad-hoc-Abfragen mit Ein- und Ausschlusskriterien zur Definition von Kollektiven und Vergleichsgruppen. Als Selektionskriterien stehen hierbei in der Regel strukturierte Merkmale der elektronischen Krankenakte wie z.B. Alter, Geschlecht oder Hauptdiagnose zur Verfügung. Die Erschließung von Freitexten (z.B. Arztbrief) ist dagegen noch Gegenstand intensiver Forschungsbemühungen des Natural Language Processing und konnte noch nicht routinemäßig etabliert werden [4]. Ein weiterer, bisher nur unzureichend erschlossener Datentyp besteht in zeitgestempelten Messwertserien (time-series data), die in Anästhesie-Informations- & Managementsystemen (AIMS) und Patientendatenmanagementsystemen (PDMS) auf Intensivstationen in großem Umfang generiert werden.

In der vorliegenden Arbeit soll die Erschließung und Einbindung des AIMS NarkoDataTM (IMESO GmbH) in das cDWH des Universitätsklinikums Erlangen beschrieben werden. Hierbei sollen die im AIMS verfügbaren Datenelemente katalogisiert und die Eignung der verfügbaren Werkzeuge für ihre Aufbereitung und Auswertung untersucht werden.

Material und Methoden: In Zusammenarbeit mit der Anästhesiologischen Klinik wurde ein Zugang zur Auswertungsdatenbank (Oracle 11gTM) des NarkoData-Systems eingerichtet und eine Auswahl der für Auswertungsanforderungen der Klinik priorisierten Datentabellen zusammengestellt. Hierzu erfolgte auch eine Sichtung der Dokumentationsmasken des Systems. Der Zugang wurde während der Entwicklungsphase auf einen repräsentativen Teildatenbestand des AIMS von insgesamt 5.015 Narkosen beschränkt. Zur Überführung der Tabellen in das cDWH wurde eine ETL-Strecke (Extraktion, Transformation, Laden) mit Hilfe des am Standort bereits eingesetzten Werkzeugs IBM Cognos DataManagerTM etabliert. Anschließend erfolgte die Modellierung von Fakten- und Dimensionstabellen nach dem im Data Warehouse-Umfeld etablierten Star-Schema. Die modellierten Datenelemente wurden gruppiert und in die Kategorien "strukturiert codiert", "strukturiert numerisch", "unstrukturiert" und "time-series data" eingeteilt. Bei zeitgestempelten Daten wurden relative Zeitangaben in Minuten nach Narkosebeginn abgeleitet, um zeitbezogene Auswertungen über mehrere Narkosen hinweg zu erleichtern. Die Dimensions- und Faktentabellen wurden mit Hilfe des DataManager in die ETL-Strecke aufgenommen. Hierbei wurden abgeleitete Kennzahlen zum perioperativen Prozessablauf (z.B. Schnitt-/Naht-Zeiten) aus den im AIMS vorhandenen Zeitstempeln berechnet. Die Benennung und Berechnung der Zeitpunkte und Intervalle erfolgte nach der Vorgabe des Glossars perioperativer Prozesszeiten und Kennzahlen der anästhesiologischen und operativen Fachgesellschaften [5].

Ergebnisse: Es wurde eine ETL-Strecke für die folgenden Tabellen implementiert und mit Daten der 5.015 verfügbaren Narkosen befüllt:

  • Narkose-Stammdaten (3 strukturiert-numerische Attribute; 0,2% des Datenvolumens)
  • Präoperativer Zustand (4 strukturiert-codierte & 2 unstrukturierte Attribute, 0,9%)
  • Medikation (6 strukturiert-codierte & 10 strukturiert-numerische Attribute; 21,2%)
  • Vitalparameter (time-series data mit 3 abhängigen strukturiert-codierten und 3 strukturiert-numerischen Attributen; 68,2%)
  • Intubation (5 strukturiert-codierte & 3 strukturiert-numerische Attribute; 0,1%)
  • Beatmung (time-series data mit 8 abhängigen strukturiert-codierten, 7 strukturiert-numerischen und 1 unstrukturierten Attributen; 6,6%)
  • Punktionen (1 strukturiert-codiertes und 3 strukturiert-numerische Attribute; <0.1%)
  • Kernprozesszeiten (18 strukturiert-numerische Attribute; 0,2%)
  • Gesamtprozesszeiten (1 strukturiert-codiertes und 3 strukturiert-numerische Attribute; 2,5%)

Diskussion: Die Extraktion, Transformation und Überführung der priorisierten Rohdaten aus dem AIMS in das cDWH konnte vollständig mit Hilfe des am Standort etablierten ETL-Werkzeugs umgesetzt werden. Durch die Integration in das cDWH konnten die Narkosedaten fallnummernbezogen mit dem dort bereits vorhandenen Datenbestand anderer zentraler und Abteilungs-Systeme verknüpft und somit für übergreifende Auswertungen erschlossen werden. Gegenüber dem originären Datenbestand des AIMS wurden im ETL-Prozess zusätzliche, abgeleitete Kennzahlen zum perioperativen Prozessablauf als eigenständige Datenelemente ergänzt, so dass diese unmittelbar für die Nutzung in Abfragen und Berichten zur Verfügung stehen. Die Ergänzung relativer Zeitangaben in Bezug auf den Narkosebeginn erleichtert die Erstellung von Abfragen und Visualisierungen über größere Mengen von Narkosen. Die Erstellung von Auswertungen und Berichten kann mit dem Berichtsfrontend des cDWH durch eine größere Anwendergruppe eigenständig durchgeführt werden. Die Integration des AIMS in das cDWH trägt somit zur Erweiterung der Auswertungsmöglichkeiten sowie zur Reduktion des Abfrageaufwands bei.

Beim überwiegenden Teil der aus dem AIMS übernommenen Datenelemente handelt es sich um strukturiert-codierte Attribute, die uneingeschränkt als Selektionskriterien in Abfragewerkzeugen wie i2b2 eingesetzt werden können. Die Ausprägungen orientieren sich dabei nicht an Standardterminologien (z.B. HL7 Administrative Gender Valueset für das Geschlecht), sondern folgen Festlegungen des Herstellers bzw. der lokalen Parametrierung. Diese Vorgehensweise ist für kommerzielle klinische Informationssysteme üblich, kann aber zu erhöhten Aufwänden oder Informationsverlusten bei der Zusammenführung mit Daten anderer Quellsystemen im Data Warehouse führen. Problematisch stellt sich dieser Aspekt insbesondere bei den Medikationsdaten dar, die eine Vielzahl von Wirkstoffen als Freitextbezeichnungen enthalten. Für eine sinnvolle Nutzung im cDWH soll daher ein Mapping auf die verbreitete WHO ATC-Klassifikation erstellt werden, das jedoch laufend überprüft und fortgeschrieben werden muss.

Die strukturiert-numerischen Datenelemente können ebenfalls uneingeschränkt für Abfragen genutzt werden. Nur eine vernachlässigbare Menge von 3 Datenelementen fällt in die Kategorie unstrukturierter Freitexte.

Nur 2 Tabellen mit 22 abhängigen Attributen fallen in die Kategorie time-series data, jedoch machen diese mit 75% den größten Teil des aus dem AIMS importierten Datenvolumens aus. Dies ergibt sich aus der automatisierten Übernahme z.B. von Vitalparametern in das AIMS. Als Selektionskriterien sind diese Attribute nur eingeschränkt verwendbar, da sie im Narkoseverlauf starken Schwankungen unterliegen können. Einfache Filterkriterien wie "Sauerstoffsättigung < 90%" können zwar definiert werden, beziehen sich aber nur auf einzelne Datenpunkte und ignorieren so die Dauer von Ereignissen. Komplexe Kriterien wie "Sauerstoffsättigung < x% über mindestens y Minuten" oder "Blutdruckabfall innerhalb von n Minuten nach Medikamentengabe" können dagegen mit Abfragewerkzeugen wie i2b2 zurzeit noch nicht definiert werden. Als Workaround könnte die Analyse relevanter Konstellationen in den ETL-Prozess vorverlagert werden, um diese als explizite Datenelemente für Abfragen verfügbar zu machen. Eine dynamische Anpassung der Kriterien zur Laufzeit durch den Anwender wäre so jedoch nicht möglich. Es besteht daher Bedarf an erweiterten Abfragewerkzeugen für time-series data.

Mögliche Einschränkungen des vorgestellten Ansatzes bestehen in der Selektion auswertungsrelevanter Tabellen, die ggf. zu Verschiebungen bei Ausdehnung auf den vollen Datenumfang des AIMS führen kann.

Die nächsten Schritte bestehen in der Bereitstellung der erschlossenen Daten in der Abfrageplattform i2b2 sowie der Einbindung des Statistikpakets R zur Vorverarbeitung und Visualisierung von time-series data.


Literatur

1.
Prokosch HU, Ganslandt T. Perspectives for medical informatics. Reusing the electronic medical record for clinical research. Methods of information in medicine. 2009; 48(1):38–44
2.
Murphy SN, Weber G, Mendis M, Gainer V, Chueh HC, Churchill S, Kohane I. Serving the enterprise and beyond with informatics for integrating biology and the bedside (i2b2). Journal of the American Medical Informatics Association : JAMIA. 2010; 17(2):124–130
3.
Athey BD, Braxenthaler M, Haas M, Guo Y. tranSMART: An Open Source and Community-Driven Informatics and Data Sharing Platform for Clinical and Translational Research. AMIA Joint Summits on Translational Science proceedings AMIA Summit on Translational Science. 2013:6–8.
4.
Griffon N, Charlet J, Darmoni SJ. Managing free text for secondary use of health data. Yearbook of medical informatics. 2014; 9(1):167–169
5.
Bauer M, Diemer M, Ansorg J, Schleppers A, Bauer K, Bomplitz M, Tsekos E, Hanss R, Schuster M. Glossar perioperativer Prozesszeiten und Kennzahlen. Eine gemeinsame Empfehlung von DGAI, BDA, BDC und VOPM. Anästh Intensivmed. 2008; 49:S93-S105.