gms | German Medical Science

High-Performance Computing für die algorithmische Erkennung von ARDS

Meeting Abstract

  • Chadi Barakat - Jülich Supercomputing Centre, Forschungszentrum Jülich, Germany; School of Engineering and Natural Sciences, University of Iceland, Reykjavík, Iceland
  • Konstantin Sharafutdinov - Joint Research Centre for Computational Biomedicine, Universitätsklinikum Aachen, Germany
  • Andreas Schuppert - Joint Research Centre for Computational Biomedicine, Universitätsklinikum Aachen, Germany
  • Sebastian Fritsch - Jülich Supercomputing Centre, Forschungszentrum Jülich, Germany; Klinik für Operative Intensivmedizin und Intermediate Care, Universitätsklinikum Aachen, Germany
  • Morris Riedel - Jülich Supercomputing Centre, Forschungszentrum Jülich, Germany; School of Engineering and Natural Sciences, University of Iceland, Reykjavík, Iceland

SMITH Science Day 2022. Aachen, 23.-23.11.2022. Düsseldorf: German Medical Science GMS Publishing House; 2023. DocP6

doi: 10.3205/22smith18, urn:nbn:de:0183-22smith183

Veröffentlicht: 31. Januar 2023

© 2023 Barakat et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Einleitung: Das akute Lungenversagen (engl. Acute Respiratory Distress Syndrome, ARDS), ein heterogenes Krankheitsbild, das erstmals 1967 von Ashbaugh et al. empirisch beschrieben wurde [1], betrifft viele Patienten auf der Intensivstation (ICU) und hat lebensbedrohliche Folgen. Die frühzeitige Erkennung dieses Zustands wurde mit einem besseren Behandlungsergebnis für die Patienten in Verbindung gebracht [2], [3], was die Notwendigkeit einer frühzeitigen Diagnose unterstreicht und einen fruchtbaren Boden für die Forschung im Bereich der künstlichen Intelligenz (KI) für medizinische Anwendungen bietet. Unsere Arbeit nutzt modulare High-Performance Computing (HPC)-Ressourcen, Techniken des maschinellen Lernens (ML) und des Deep Learning (DL), skalierbare Methoden zur Abstimmung von Hyperparametern [4], empirisch verifizierte mechanistische Modelle [5], Fachwissen im Bereich der Datenanalyse und physiologische Daten aus der Intensivmedizin mit dem Ziel, ein Diagnosewerkzeug zu entwickeln, das medizinisches Personal bei der Erkennung von Markern für den Beginn von ARDS unterstützt.

Methoden: Wir setzen spezialisierte Hard- und Software ein, um so eine Plattform auf dem Dynamic Exascale Entry Platform – Extreme Scale Technologies (DEEP-EST) Cluster des Jülich Supercomputing Centre (JSC) aufzubauen. Die Modular Supercomputing Architecture (MSA) dieses Systems erlaubt es uns, Softwaremodule einfach zu laden und den Speicher und die Rechenleistung zu erweitern, wenn wir sie für unsere Arbeit benötigen. Hierbei verwenden wir die für Data-Science- und ML-Anwendungen notwendigen Python-Module wie Numpy, Pandas, Tensorflow, Keras und Scikit-Learn sowie solche, die speziell für das Tuning von Hyperparametern entwickelt wurden: KerasTuner und Ray. Was die Ressourcennutzung auf dem Supercomputing-Cluster betrifft, so haben wir unseren Code so konzipiert, dass er die verfügbaren GPUs auf den Rechenknoten auf skalierbare Weise nutzt. Tabelle 1 [Abb. 1] zeigt, welche Ressourcen auf jeder Partition des DEEP-Clusters verfügbar sind.

Der Physiologie-Simulator, der von Hardman et al. entwickelt wurde, ist als MATLAB-Skript verfügbar, was seine Skalierung und Implementierung in Krankenhäusern erschwert. Portieren wir ihn mit MATLAB Coder in die Programmiersprache C, laden ihn dann auf den Cluster hoch und nutzen ihn, um mehrere Simulationen parallel laufen zu lassen. Die Simulationen verwenden als Eingabe Daten, die auf der Grundlage der MIMIC-III-Datenbank und dem Universitätsklinikum Aachen (UKA) generiert wurden, und geben eine Reihe von Parametern aus, die für die Diagnose von ARDS verwendet werden können, nämlich PaO2, PaCO2 und Parameter des Säure-Basen-Haushaltes im Blut. Die Eingabe und Ergebnisse der Simulationsläufe werden dann bereinigt, zusammengeführt und zum Trainieren des ML-Modells verwendet.

Anstelle der Simulation kann ein lineares DL-Modell verwendet werden, was den Platz- und Zeitbedarf für die Vorhersage der ausgewählten Parameter reduziert. Es wurden mehrere Modellarchitekturen getestet, wie z.B. künstliche neuronale Netze (ANNs) und Convolutional Neural Networks (CNNs) (siehe Abbildung 1 [Abb. 1]).

Darüber hinaus wurden die Parameter der leistungsstärksten Modelle mit Hilfe der Ray Tune weiter abgestimmt, um die Leistung zu maximieren. Die Abstimmung der Hyperparameter erfolgte mit Hilfe von Schedulern, darunter Hyperband, Population-Based Training (PBT), und Asynchronous Hyperband (ASHA).

Ergebnisse: Erste Tests wurden durchgeführt, um zu überprüfen, ob das übertragene Modell die gleiche Leistung erbringt wie die ursprüngliche MATLAB-Simulation. Die Ergebnisse mehrerer Testläufe bestätigten diese Hypothese, wobei eine erhebliche Beschleunigung erzielt wurde, wie aus Tabelle 2 [Tab. 1] ersichtlich ist.

Die CNN-basierten DL-Modelle übertrafen die ANN-Modelle: Die Trainingszeiten waren bei einer größeren Anzahl von Epochen deutlich kürzer, die Validierungsgenauigkeit war höher (90%), und die Rate der Überanpassungen war erheblich geringer. Darüber hinaus konnten wir mit diesem Ansatz eine Kombination von Parametern grob abschätzen, die zu angemessenen Ergebnissen führte und die durch eine Optimierung der Hyperparameter verbessert werden konnte.

Durch den Einsatz von Ray Tune mit verschiedenen Schedulern konnten wir die ideale Parameterkombination für das Training herausfinden und gleichzeitig die Leistung der ausgewählten Scheduler vergleichen.

Diskussion: Die am JSC verfügbaren HPC-Systeme ermöglichten es, eine Fülle von Daten zu generieren, mit denen ein KI-Modell trainiert werden konnte. Dieser Schritt der Datengenerierung macht die Modelle empfindlicher und robuster gegenüber kleinen Änderungen in den Daten. Die Durchführung dieses Schritts auf lokalen Computern wäre angesichts des Umfangs der Operation unmöglich gewesen.

Auch das Erstellen, Trainieren und Abstimmen der Modelle war nur mit Hilfe von MSA, JupyterLab und dem Online-Speicher möglich. Dies gilt insbesondere für das Hyperparameter Tuning, bei dem mehrere Versuche gleichzeitig durchgeführt werden mussten.

Schließlich benötigt das exportierte Modell keine proprietäre Software, um ausgeführt zu werden, ist extrem portabel und kann offline mit Patientendaten verwendet werden, wodurch es leicht auf der Intensivstation implementiert werden kann, ohne die Sicherheit der in ihr enthaltenen Daten zu gefährden.


Literatur

1.
Ashbaugh DG, Bigelow DB, Petty TL, Levine BE. Acute respiratory distress in adults. Lancet. 1967 Aug 12;2(7511):319-23. DOI: 10.1016/s0140-6736(67)90168-7 Externer Link
2.
Confalonieri M, Salton F, Fabiano F. Acute respiratory distress syndrome. Eur Respir Rev. 2017 Apr 26;26(144):160116. DOI: 10.1183/16000617.0116-2016 Externer Link
3.
Le S, Pellegrini E, Green-Saxena A, Summers C, Hoffman J, Calvert J, Das R. Supervised machine learning for the early prediction of acute respiratory distress syndrome (ARDS). J Crit Care. 2020 Dec;60:96-102. DOI: 10.1016/j.jcrc.2020.07.019 Externer Link
4.
Liaw R, Liang E, Nishihara R, Moritz P, Gonzalez JE, Stoica I. Tune: A research platform for distributed model selection and training [Internet]. 2018. Available from: http://arxiv.org/abs/1807.05118 Externer Link
5.
Hardman JG, Bedforth NM, Ahmed AB, Mahajan RP, Aitkenhead AR. A physiology simulator: Validation of its respiratory components and its ability to predict the patient's response to changes in mechanical ventilation. Br J Anaesth. 1998 Sep;81(3):327-32. DOI: 10.1093/bja/81.3.327 Externer Link