gms | German Medical Science

GMDS 2013: 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

01. - 05.09.2013, Lübeck

Vorhersagemodell zur Identifikation von Hospitalisierungen

Meeting Abstract

Search Medline for

  • Tim Peter - eonum AG, Bern, CH
  • Simon Hölzer - Universität Giessen, Giessen, DE

GMDS 2013. 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Lübeck, 01.-05.09.2013. Düsseldorf: German Medical Science GMS Publishing House; 2013. DocAbstr.182

doi: 10.3205/13gmds151, urn:nbn:de:0183-13gmds1512

Published: August 27, 2013

© 2013 Peter et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung und Fragestellung: Dargestellt wird ein automatisiertes Verfahren zur Identifikation von Patienten mit hoher Wahrscheinlichkeit einer Hospitalisierung im nächsten Jahr. Anhand historischer Daten eines Patienten wie vergangene Spitalaufenthalte oder Arztbesuche der letzten Jahre soll ein Risikomodel errechnet werden, welches die Wahrscheinlichkeit einer Hospitalisation im nächsten Jahr abbildet. Ziel des Algorithmus ist es, Patienten zu identifizieren, welche proaktiv untersucht und behandelt werden sollen bevor es zu einer Hospitalisation kommt. Einerseits kann so die Qualität und somit die Gesundheit des Patienten durch frühzeitiges Handeln erhöht werden, andererseits werden kostspielige Spitalaufenthalte vermieden.

Material und Methoden: Das vorgeschlagene Verfahren ist ein künstliches rekurrentes neuronales Netzwerk, welches besser als andere statistische Verfahren geeignet ist, Zeitserien variabler Länge abzubilden. Im Gegensatz zu einem herrkömmlichen Fast Forward Neural Network, haben rekurrente Netze einen Zustand, welcher sich über die Zeit ändern kann. Konkret wird ein Long Short Term Memory Neural Network (LSTM) verwendet [1]. Das eingesetzte LSTM ist eine Entwicklung der eonum AG [2] und basiert auf Java-Technologie. Ein LSTM kann Informationen über lange Zeitspannen speichern und bei Bedarf abrufen ohne die Aufnahme von neuen Informationen zu behindern. Für diesen Zweck besteht das Netz aus Speicherzellen mit mehreren Speicherplätzen und Eingabe- und Ausgabepforten, welche den Informationsfluss steuern. Zu jedem Zeitpunkt erhält eine Speicherzelle Informationen vom aktuellen Input als auch vom Zustand anderer Zellen und sich selbst. Ein Arztbesuch oder ein Spitalaufenthalt entspricht einem Punkt in der Zeitserie. Aufenthaltsdauer, Schweregrad, Diagnose und Behandlung werden so codiert und normiert, dass diese numerisch verarbeitet werden können. Da die Anzahl der Aufenthalte bei jedem Patienten verschieden ist, können herrkömmliche statistische Verfahren die Daten nicht direkt verwenden. Das heisst diie Aufenthalte müssen erst noch zu einem einzigen Datenpunkt aggregiert werden. Je nach Aggregation (Durchschnitt, Summe, Momentum, Maximalwerte usw.) geht aber viel Information über die zeitliche Dynamik verloren. Hier liegt die Stärke eines rekurrenten neuronalen Netzwerkes, welches diese Dynamik direkt abbilden kann.

Ergebnisse: Das Verfahren wurde mit Daten des Heritage Health Provider Network, einer Krankenhauskette aus Kalifornien, im Rahmen des Heritage Health Prize [3] erfolgreich getestet. Das neuronale Netz wurde mit rund 100’000 anonymisierten Patientendatensätzen trainiert und anschliessend mit ca. 70’000 weiteren getestet. Am Wettbewerb haben über 1600 Teams teilgenommen. Die hier vorgestellte Lösung erreichte als wichtigster Bestandteil eines Gesamtsystems eine Top 10 Rangierung. Der Gewinner und die Ränge der Top 10 werden am 3./4. Juni an der Health Datapalooza IV in Washington DC bekannt gegeben.

Diskussion: Das Verfahren ist verglichen mit anderen Ansätzen sehr genau. Die Komplexität ist überschaubar. Andere Lösungen kombinieren meist eine grosse Anzahl verschiedener statistischer Modelle, um eine vergleichbare Stabilität zu erreichen. Dies macht jedoch die Implementierung eines Produktivsystems extrem komplex.Die Datenqualität und insbesondere die durch die Anonymisierung geringe Detailtiefe der verwendeten Daten setzen dem Model derzeit noch Grenzen. Eine Evaluation mit genaueren Daten ist der nächste Schritt. Dies muss jedoch aus Datenschutzgründen in einem geschlossenen Rahmen erfolgen und kann nicht in einem öffentlichen Wettbewerb ausgeschrieben werden. Ein ausgereiftes System sollte zudem auch Hinweise auf die Ursache einer hohen Hospitalisierungswahrscheinlichkeit geben können.


Literatur

1.
Long Short Term Memory, Neural Computation 9(8): 1735 - 1780, 1997 J. Schmidhuber, S. Hochreiter
2.
eonum.ch. Bern: eonum AG. [updated April 15, 3013, cited April 15, 2013] http://ww.eonum.ch External link
3.
heritagehealthprize.com. Heritage Provider Network Northridge, CA, Inc. Powered by Kaggle, Inc. [updated April 15, 3013, cited April 15, 2013] http://www.heritagehealthprize.com External link