gms | German Medical Science

49. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
19. Jahrestagung der Schweizerischen Gesellschaft für Medizinische Informatik (SGMI)
Jahrestagung 2004 des Arbeitskreises Medizinische Informatik (ÖAKMI)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Schweizerische Gesellschaft für Medizinische Informatik (SGMI)

26. bis 30.09.2004, Innsbruck/Tirol

Erweiterung klassischer maschineller Lernverfahren um kombinatorische Methoden der Zeitreihenanalyse in der Intensivmedizin

Meeting Abstract (gmds2004)

Search Medline for

  • corresponding author presenting/speaker Muhsin Kayralci - ZAIT/KI-LABOR, Universität Bremen, Bremen, Deutschland
  • Manfred B. Wischnewsky - ZAIT/KI-LABOR, Universität Bremen, Bremen, Deutschland

Kooperative Versorgung - Vernetzte Forschung - Ubiquitäre Information. 49. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 19. Jahrestagung der Schweizerischen Gesellschaft für Medizinische Informatik (SGMI) und Jahrestagung 2004 des Arbeitskreises Medizinische Informatik (ÖAKMI) der Österreichischen Computer Gesellschaft (OCG) und der Österreichischen Gesellschaft für Biomedizinische Technik (ÖGBMT). Innsbruck, 26.-30.09.2004. Düsseldorf, Köln: German Medical Science; 2004. Doc04gmds343

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/meetings/gmds2004/04gmds343.shtml

Published: September 14, 2004

© 2004 Kayralci et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Hintergrund

In klinischen Informationssystemen können leicht 2000 verschiedene Variablen überwacht und im Minutenrhythmus gespeichert werden. Dadurch kommen schnell mehrere Gigabyte an Daten zusammen, wodurch die Analyse dieser Daten für das Personal schwer oder kaum durchführbar ist. Die gemessenen Daten dienen als Entscheidungsgrundlage für das therapeutische Vorgehen des Pflegepersonals und können durch entsprechende Auswertung der Daten den aktuellen und zukünftigen Zustand des Patienten ermitteln. Zusätzlich zur reinen Masse an Daten erschweren die sehr unterschiedlichen Arten der Variablen die Analyse [1], [2]:

• kontinuierlich erhobene, stetige Daten wie z.B. Sauerstoffkonzentration und Blutdruck,

• kontinuierlich erhobene, diskrete Daten wie z.B. Auffälligkeiten im EKG,

• unregelmäßig erhobene Daten wie z.B. Laboruntersuchungen,

• berechnete Daten wie z.B. verschiedene medizinische Indizes und

• unstrukturierte Daten wie z.B. die medizinische Vorgeschichte des Patienten

Die Herausforderung, in der Intensivmedizin wichtige Informationen aus einer großen Menge von Daten herauszusuchen, ist ein typisches Beispiel für einen Wissensentdeckungsprozess (Knowledge Discovery in Databases - KDD). Knowledge Discovery in Databases ist der gesamte Prozess der Modellbildung von der Datenauswahl, Datentransformation bis zur Modellbildung (Data Mining) und der Dateninterpretation [3]. Zur Minimierung oder sogar Beseitigung dieser Probleme ist die adäquate Unterstützung vom Zeitreihen mit entsprechenden Analysefunktionen auf der Datenverarbeitungsebene zwingend notwendig. Für die angestrebte Anwendung maschineller Lernverfahren in der Intensivmedizin sind einerseits die klassischen Verfahren auf Zeitreihen zu erweitern, andererseits aber auch die Vorteile der unterschiedlichen Methoden der Zeitreihenanalyse kombinatorisch zu nutzen.

Methode

Die in klassischen KDD-Verfahren verwendeten Abstandsmaße zur Ermittlung des Informationsgehaltes eines Parameters können nicht auf Zeitreihen angewendet werden. Um diese Daten in bekannten KDD-Verfahren anwenden zu können, werden für jeden Datentyp folgende Schritte durchlaufen [4], [5], [6]:

1. Auswahl des besten Reduktionsverfahrens (Verschiebung, Skalierung, Zeit-Skalierung, Dynamic Time Warping)

2. Auswahl eines geeigneten Transformationsalgorithmus für die Zeitreihenanalyse (Diskrete Foruier Transformation, Singular Wert Dekomposition, Diskrete Wavelet Transformation, …)

Der Prozess für die Auswahl des besten Reduktionsverfahrens ist in Abb. 1 [Abb. 1] beschrieben.

In Abbildung 2 [Abb. 2] ist der Prozess für die Auswahl der geeigneten Transformationsverfahren für die Zeitreihenanalyse beschrieben.

Bei dieser Vorgehensweise wird nicht lediglich eine Methode der Zeitreihenanalyse für den gesamten Datensatz verwendet, sondern eine Kombination von Methoden für Zeitreihenanalyse. Klassische maschinelle Lernverfahren (z.B. ID3 bzw. C4.5) werden mit Hilfe dieser Technik erweitert, um eine optimale Wissensextraktion aus vorhandenen Daten aus der Intensivmedizin zu ermöglichen. Der Abstandsmaß ist hierbei eine fundamentale Größe für die Erstellung des Entscheidungsbaumes. Für jeden Parameter wird hierfür im Rahmen der Vorverarbeitung neben seinem Datentyp zusätzlich der Parametertyp gemäß der Zeitreihenklassifizierung als weiteres Attribut mitgeführt. Mit Hilfe dieser Information wird dann bei der Erstellung des Entscheidungsbaumes dynamisch das entsprechende Verfahren zur Abstandsmessung verwendet.

Ergebnisse

Das oben beschriebene Konzept erlaubt es mit allen in der Intensivmedizin vorkommenden Parametertypen adäquat umzugehen. Es werden verschiedene Methoden der Zeitreihenanalyse kombinatorisch angewendet, um optimale Ergebnisse im Rahmen der maschinellen Lernverfahren (z.B. ID3 bzw. C4.5) für den Bereich der Intensivmedizin zu erlangen.

Die Ergebnisse dieser Arbeit werden im Rahmen des MONICA-Systems [7] evaluiert, um sie später in der Routine zu integriert. MONICA ist ein intelligentes Meßdatenerfassungs- und Interpretationssystem zur Unterstützung von Diagnose, Therapie und Pflege von Intensivpatienten mit den Schwerpunkten Qualitätssicherung, Diseasemanagement und Kosten/Nutzen-Analyse.


Literatur

1.
Marino PL, Das ICU-Buch. Praktische Intensivmedizin, Urban & Fischer, 2002.
2.
T.Penzel, U.Brandenburg, J.-H.Peter, Langzeitregistrierung und Zeitreihenanalyse in der Inneren Medizin, Springer verlag 1997.
3.
Ester M., Sander J., Knowledge Discovery in Databases, springer-Verlag Heidelberg, 2000
4.
Witten H. and Eibe F., Data Mining Practical machine Learning Tools and Techniques with Java Implementations, Academic Press, 2000
5.
Donald J. Bernd and Cames Clifford: Using dynamic time warping to find patterns in time series, Preceding of KDD-94.
6.
Lütkepohl H, Introduction to Multiple Time Series Analysis, 2nd Edition, Springer Verlag, 1998.
7.
http://monica.zait.uni-bremen.de