gms | German Medical Science

39. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP)

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

28.09. - 01.10.2023, Köln

KI-gestützte Quantifizierung von Schluckvorgängen

Poster

  • author presenting/speaker Luisa Neubig - Friedrich-Alexander-Universität, Erlangen-Nürnberg, Erlangen, Deutschland
  • Takeshi Ikuma - Department of Otolaryngology-Head and Neck Surgery, Louisiana State University Health Sciences Center, New Orleans, Vereinigte Staaten
  • Melda Kunduk - Department of Communication Sciences and Disorders, Louisiana State University, Baton Rouge, Vereinigte Staaten
  • Deirdre Larsen - Department of Communication Sciences and Disorders, East Carolina University, Greenville, Vereinigte Staaten
  • Rebecca Leonard - Otolaryngology/HNS, Univ. Calif. Davis, Greenwood, Vereinigte Staaten
  • corresponding author Andreas M. Kist - Friedrich-Alexander-Universität, Erlangen-Nürnberg, Erlangen, Deutschland

39. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Köln, 28.09.-01.10.2023. Düsseldorf: German Medical Science GMS Publishing House; 2023. DocP23

doi: 10.3205/23dgpp50, urn:nbn:de:0183-23dgpp500

Veröffentlicht: 20. September 2023

© 2023 Neubig et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Zusammenfassung

Hintergrund: Die Quantifizierung von Schluckvorgängen ist von großer Bedeutung für die Diagnose und Behandlung von Schluckstörungen. In dieser Studie wird ein tiefes neuronales Netz zur automatischen Verfolgung des Bolus in videofluoroskopischen Aufnahmen entwickelt und evaluiert.

Material und Methoden: Videofluoroskopische Aufnahmen von nicht beeinträchtigten Schluckvorgängen wurden für das Training des neuronalen Netzes verwendet. Nach dem Training wurde die Performance des Netzes auf Testdaten evaluaiert. Die Segmentierungsqualität wurde anhand des Dice-Koeffizienten (DC) bewertet, der Werte zwischen 0 (schlecht) bis 1 (exzellent) annehmen kann. Daraufhin wurde der Bolus während des Schluckvorgangs hinsichtlich der Form und seines Hauptweges untersucht.

Ergebnisse: Das entwickelte tiefe neuronale Netz zeigte eine hohe Genauigkeit bei der Verfolgung des Bolus in den videofluoroskopischen Aufnahmen. Es war in der Lage, den Bolus über verschiedene Phasen des Schluckvorgangs genau zu identifizieren und zu verfolgen. Der segmentierte Bereich wurde für die Quantifizierung der Bolusform und dessen Kinematik verwendet. Die Exzentrizität des Bolus über die Zeit zeigte eine Korrelation zwischen der Bolusform und der aktuellen Schluckphase. Zusätzlich wurde der Massenschwerpunkt des Bolus von seinem ersten Auftreten im Mund bis zu seinem Abgleiten durch die Speiseröhre betrachtet. Die Analyse der Verlaufskurve des Bolus über einzelne Schluckvorgänge und Probanden hinweg ist in sich konsistent.

Diskussion: Die Anwendung eines tiefen neuronalen Netzes zur automatischen Verfolgung des Bolus in videofluoroskopischen Aufnahmen bietet eine effiziente und zuverlässige Methode zur Quantifizierung von Schluckvorgängen. Durch die Automatisierung des Prozesses kann eine schnelle und präzise Analyse großer Datenmengen erreicht werden. Die Ergebnisse legen nahe, dass das entwickelte neuronale Netz eine wertvolle Unterstützung für die klinische Bewertung von Schluckstörungen bieten kann.

Fazit: Insgesamt zeigt diese Studie, dass ein tiefes neuronales Netz effektiv eingesetzt werden kann, um den Bolus in videofluoroskopischen Aufnahmen präzise zu verfolgen. Zusätzlich können die nachgeschalteten Analysen der Bolusform und -kinematik weitere Informationen zur Schluckphasen und -verhalten liefern, welche eine wichtige Grundlage für eine umfassende Quantifizierung der Schluckphysiologie bilden. Weitere Forschung und Validierung sind jedoch erforderlich, um die Anwendbarkeit und Zuverlässigkeit dieser Methode in klinischen Umgebungen zu bestätigen.


Text

Hintergrund

Die Quantifizierung von Schluckvorgängen ist von großer Bedeutung für die Diagnose und Behandlung von Schluckstörungen. In dieser Studie wird ein tiefes neuronales Netz zur automatischen Verfolgung des Bolus in videofluoroskopischen Aufnahmen entwickelt und evaluiert.

Material und Methoden

Insgesamt hatten wir Zugriff auf 144 videofluoroskopische Aufnahmen von unbeeinträchtigten Probanden. Aus diesen Aufnahmen konnten wir 461 einzelne Schluckvorgänge extrahieren. Diese Schluckvorgänge wurden annotiert, wodurch der Schluckbrei in jedem Bild der Aufnahme auf Pixelbasis definiert wurde. Diese annotierten Daten wurden verwendet, um ein U-Net zu trainieren, da es aufgrund seiner Architektur besonders für die Segmentierung geeignet ist. Nach dem Training wurde die Leistung des Netzes anhand von Testdaten evaluiert. Die Segmentierung bezeichnet die Abgrenzung des gesuchten Bereichs vom Hintergrund. Die Qualität der Segmentierung wurde anhand des Dice-Koeffizienten (DC) bewertet, der Werte zwischen 0 (schlecht) und 1 (exzellent) annehmen kann. Anschließend wurde der Bolus während des Schluckvorgangs hinsichtlich seiner Form und seines Hauptweges untersucht. Die Form wurde anhand einer Ellipse approximiert und durch die Exzentrizität beschrieben. Für die Bestimmung des zurückgelegten Weges wurde der Masseschwerpunkt des Bolus in jedem Bild des Schluckvorgangs berechnet.

Ergebnisse

Das entwickelte tiefe neuronale Netz erzielte eine bemerkenswert hohe Genauigkeit bei der Verfolgung des Bolus in videofluoroskopischen Aufnahmen. Es konnte den Bolus präzise über verschiedene Phasen des Schluckvorgangs identifizieren und verfolgen. Durch eine systematische Analyse mit verschiedenen Hyperparametern konnten wir die optimalen Einstellungen ermitteln, was zu einem Dice-Koeffizienten (DC) von 0,86 auf dem Validierungsdatensatz und 0,84 auf dem Testdatensatz führte. Der hohe DC-Wert auf dem Testdatensatz bestätigt die Fähigkeit des neuronalen Netzes, den Bolus auch bei neuen Daten gut vom Hintergrund zu unterscheiden, wie in Abbildung 1A [Abb. 1] gezeigt wird. Der segmentierte Bereich wurde verwendet, um die Form und Kinematik des Bolus zu quantifizieren. In Abbildung 1B [Abb. 1] wird die Analyse der Exzentrizität des Bolus im Verlauf des Schluckvorgangs dargestellt, welche eine deutliche Korrelation zwischen der Bolusform und der aktuellen Schluckphase aufzeigt. Zusätzlich wurde der Massenschwerpunkt des Bolus von seinem ersten Auftreten im Mund bis zum Durchgleiten durch die Speiseröhre betrachtet (siehe Abbildung 1C [Abb. 1]). Die Untersuchung der Verlaufskurve des Bolus über einzelne Schluckvorgänge und verschiedene Probanden hinweg ergab konsistente Ergebnisse.

Diskussion/Schlussfolgerung

Die Anwendung eines tiefen neuronalen Netzes ermöglicht eine effiziente und zuverlässige automatische Verfolgung des Bolus in videofluoroskopischen Aufnahmen, was eine präzise Quantifizierung von Schluckvorgängen ermöglicht. Die Ergebnisse deuten darauf hin, dass das entwickelte neuronale Netz eine wertvolle Unterstützung bei der klinischen Bewertung von Schluckstörungen darstellen kann. Eine Automatisierung des Prozesses ermöglicht zudem eine schnelle Analyse großer Datenmengen. Die nachfolgenden Analysen der Bolusform und -kinematik liefern zudem weitere Informationen über Schluckphasen und -verhalten, was eine wichtige Grundlage für eine umfassende Quantifizierung der Schluckphysiologie darstellt. Um die Anwendbarkeit und Zuverlässigkeit dieser Methode in klinischen Umgebungen zu bestätigen, sind jedoch weitere Forschung und Validierung erforderlich. Dies beinhaltet auch, die Evaluation der Leistung des trainierten Netzes auf pathologischen Daten.