gms | German Medical Science

Vorhersage der Verweildauer auf der ITS

Meeting Abstract

Suche in Medline nach

  • Lars Hempel - Abteilung Medical Data Science, Universitätsklinikum Leipzig, Germany; Institut für Medizinische Informatik, Statistik und Epidemiologie, Universität Leipzig, Germany; Fakultät für angewandte Computer- und Biowissenschaften, Hochschule Mittweida, Germany
  • Sina Sadeghi - Abteilung Medical Data Science, Universitätsklinikum Leipzig, Germany; Institut für Medizinische Informatik, Statistik und Epidemiologie, Universität Leipzig, Germany
  • Toralf Kirsten - Abteilung Medical Data Science, Universitätsklinikum Leipzig, Germany; Institut für Medizinische Informatik, Statistik und Epidemiologie, Universität Leipzig, Germany; Fakultät für angewandte Computer- und Biowissenschaften, Hochschule Mittweida, Germany

SMITH Science Day 2022. Aachen, 23.-23.11.2022. Düsseldorf: German Medical Science GMS Publishing House; 2023. DocP7

doi: 10.3205/22smith19, urn:nbn:de:0183-22smith192

Veröffentlicht: 31. Januar 2023

© 2023 Hempel et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Einleitung/Motivation: Das Ressourcenmanagement ist ein entscheidendes Kriterium für die Effizienz eines Krankenhauses. Die Belegungsdauer von Betten in der stationären Versorgung ist ein Faktor für die Bewertung der Effizienz. Die Belegungsdauer ist abhängig von der Anzahl an Patienten, deren Symptomatik ihrer Erkrankung sowie der fortwährend zu erbringenden medizinischen Leistungen und der gesundheitlichen Reaktion der Patienten darauf. Eine genaue Vorhersage der Aufenthaltsdauer eines Patienten kann die Effizienz verbessern. Die Intensivstation (ITS) ist ein medizinischer Bereich im Krankenhaus, der besonders im Fokus steht, da jedes Bett mit einem immensen Gerätepark einhergeht, deren Betrieb besonders hohe Kosten mit sich bringt. Demgegenüber werden auf einer ITS zahlreiche Parameter kontinuierlich ermittelt [1], die Grundlage der Prädiktion von Aufenthaltsdauer von Patienten sein können.

Das Ziel dieser Arbeit ist die Prädiktion der Aufenthaltsdauer auf der Grundlage von ITS-Daten. Dazu zählen allgemeine demographische Daten und generelle Labor- und Prozessdaten. Wir untersuchen die Einflussfaktoren der jeweiligen Parameter auf die Vorhersagegenauigkeit.

Methoden: Die Analyse basiert auf dem populären MIMIC IV Datensatz. Aus diesem Datensatz werden alle Patienten in die Analyse einbezogen, für die ein ITS-Aufenthalt dokumentiert ist (n=65.794 Aufenthalte). Dieser Datensatz wurde um solche Patientenaufenthalte bereinigt, die fehlende Werte beinhalten; es verbleiben n=33.174 Aufenthalte. Darüber hinaus wurden Patienten unter 18 Jahre entfernt; Kinder und Jugendliche sind nur vermindert im Datensatz verfügbar und würden das Analyseergebnis verzerren. Weiterhin wurden Patientenaufenthalte entfernt, die ein Gewicht außerhalb des konservativen Intervalls [40, 300] kg sowie eine Körpergröße außerhalb des Intervalls [140, 240] cm aufweisen. Zur Validität dieser Angaben wurde der Body-Maß-Index (BMI) berechnet und alle Aufenthalte mit einem BMI außerhalb des Intervalls [10, 50] entfernt; letztlich verblieben n=31.139 Patientenaufenthalte. Die Diagnosen wurden nach ICD-10 Codierung überführt; die Diagnose mit Rang 1 repräsentiert die Hauptdiagnose.

Neben den Aufenthalten ist der Datensatz von den Merkmalen determiniert. Diese Merkmale (auch Features genannt) werden zum Training von Modellen herangezogen, gleich ob es sich um Regressions-, Machine-Learning- oder Deep-Learning-Modelle handelt. Die folgenden Merkmale kennzeichnen den finalen Datensatz: Aufenthaltsdauer (LoS), Alter, Geschlecht, erste Versorgungsstation, Aufnahmeort, Größe, Gewicht, Aufnahmestunde, Glasgow coma Score (als eyes, motor und verbal), ICD Code, Bikarbonate-, Chlorid-, Laktat-, Natrium-, Magnesium-, Kalium-, Kreatin-, Glukose-Konzentration, Harnstoff-Stickstoff und die Anzahl der weißen Blutkörperchen. Außer Harnstoff-Stickstoff wurden alle Laborparameter aus dem Blut entnommen. Da die Aufenthaltsdauer zu Beginn des Aufenthaltes bestimmt werden soll, werden ausschließlich die zuerst gemessenen Messwerte für die Analyse berücksichtigt.

Für die Vorhersage der Aufenthaltsdauer wurden verschiedene Methoden der Statistik und des maschinellen Lernens angewendet. Dazu zählen Lineare Regression (LR), Decision Tree (DT), Support Vector Maschine (SVM) und Random Forest (RF). Die Evaluation der erzielten Ergebnisse erfolgt über die Metriken RMSD, MAD, MAPE und R2. In jeden Lauf wurden die Daten zufällig in 80% Trainings- und 20% Testdaten unterteilt; es werden 10 Läufe verwendet. Für die Auswertung ist der Durchschnitt jeder Metrik zu dem jeweiligen Modell berechnet worden.

Ergebnis: Die Ergebnisse sind in der Tabelle 1 [Abb. 1] zusammengefasst. RF übertrifft die anderen Methoden in drei Evaluationsmetriken (RMSD, MAD und R2). Nur für die Evaluationsmetrik MAPE kann der SVM-Algorithmus ein besseres Ergebnis erzielen.

Während die durchschnittliche Aufenthaltsdauer bei 3,85 Tagen (median: 2,63 Tage) liegt, haben 66% aller Aufenthalte eine Dauer im Intervall [0,5; 4]. Diese linksschiefe Verteilung der Daten beeinflusst die Qualität der Prädiktionsmodelle und führt zu einem Fehler, der größer wird, je höher die vorherzusagende Aufenthaltsdauer (LoS > 10) ist (siehe Abbildung 1 [Abb. 1]).

Alle Modelle besitzen diesen Fehler und die einbezogenen Merkmale haben unterschiedlichen Einfluss auf die Vorhersage der LoS; ebenso zeigen sie eine unterschiedliche Korrelation zum LoS. Die höchste Korrelation zeigt die GCS, wobei alle drei verschiedenen Teile (verbal, motorisch und visuell) wie auch der zusammengesetzte GCS einen unterschiedlichen Einfluss besitzen. Der zusammengesetzte GCS weist eine geringere Korrelation auf als die verbale Beeinträchtigung, jedoch eine höhere Korrelation als die visuelle und motorische Beeinflussung. Die eingeschlossenen Laborparameter haben eine sehr geringe bis keine Korrelation (0 < = r < 0,12) auf die LoS.

Diskussion: Es wurden vier unterschiedliche Methoden zur Prädiktion der LoS angewendet, deren Ergebnisse sich nur geringfügig unterscheiden. Insbesondere zeigt sich, dass der Fehler mit steigender LoS (LoS > 7) größer wird. Dies liegt an der geringer werdenden Datenmenge, je größer die LoS wird. Somit ist ein Overfitting insbesondere für Kurzaufenthalte zu beobachten. Der Einfluss der Merkmale auf die Prädiktionsgüte, hauptsächlich des GCS, kann zur Erklärung herangezogen werden. Personen mit einem niedrigen GCS sind in einem schlechteren Zustand und verweilen dementsprechend länger auf der ITS. Analog dazu kann die Versorgungsstation, von der der Patient auf die ITS verlegt wurde, zur Erklärung des Ergebnisses herangezogen werden. Ein Patient von einer chirurgischen Station wird eine kurze postoperative Behandlung benötigen als Patienten von einer anderen Station. Ein Vergleich zu verwandten Arbeiten in der Literatur scheitert oftmals an der mangelnden Vergleichbarkeit der Ergebnisse; oftmals unterscheiden sich die Arbeiten schon in den verwendeten Daten. Im Vergleich zu [2] kann der RF einen besseren R2 aufweisen; in Bezug auf die MAD ist die Differenz nicht signifikant.


Literatur

1.
Bacchi S, Tan Y, Oakden-Rayner L, Jannes J, Kleinig T, Koblar S. Machine learning in the prediction of medical inpatient length of stay. Intern Med J. 2022 Feb;52(2):176-85. DOI: 10.1111/imj.14962 Externer Link
2.
Rocheteau E, Pietro L, Hylan S. Temporal pointwise convolutional networks for length of stay prediction in the intensive care unit. In: CHIL '21: Proceedings of the Conference on Health, Inference, and Learning. ACM CHIL '21: ACM Conference on Health, Inference, and Learning Virtual Event; 2021 Apr-10; USA. New York, NY, USA: Association for Computing Machinery. p. 58–68. DOI: 10.1145/3450439.3451860 Externer Link
3.
Saly D, Yang A, Triebwasser C, Oh J, Sun Q, Testani J, Parikh CR, Bia J, Biswas A, Stetson C, Chaisanguanthum K, Wilson FP. Approaches to predicting outcomes in patients with acute kidney injury. PLoS One. 2017 Jan 25;12(1):e0169305. DOI: 10.1371/journal.pone.0169305 Externer Link