gms | German Medical Science

4. Dreiländertagung D-A-CH
35. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP)

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

20.09. - 23.09.2018, Innsbruck, Österreich

Modellbasierte Schätzung des subglottalen Drucks mittels Deep Learning

Vortrag

  • corresponding author presenting/speaker Pablo Gómez - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie an der Hals-, Nasen- und Ohrenklinik, Kopf- und Halschirurgie, Erlangen, Deutschland
  • author Marion Semmler - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie an der Hals-, Nasen- und Ohrenklinik, Kopf- und Halschirurgie, Erlangen, Deutschland
  • author Anne Schützenberger - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie an der Hals-, Nasen- und Ohrenklinik, Kopf- und Halschirurgie, Erlangen, Deutschland
  • author Michael Döllinger - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie an der Hals-, Nasen- und Ohrenklinik, Kopf- und Halschirurgie, Erlangen, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. Sektion Phoniatrie der Österreichischen Gesellschaft für Hals-, Nasen- und Ohrenheilkunde, Kopf- und Halschirurgie. Schweizerische Gesellschaft für Phoniatrie. 4. Dreiländertagung D-A-CH, 35. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Innsbruck, Österreich, 20.-23.09.2018. Düsseldorf: German Medical Science GMS Publishing House; 2018. DocV8

doi: 10.3205/18dgpp09, urn:nbn:de:0183-18dgpp097

Veröffentlicht: 14. September 2018

© 2018 Gómez et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Hintergrund: Mehrere Studien haben Zusammenhänge zwischen dem subglottalen Druck Psub und Dysphonie festgestellt. Der Psub ist in-vivo nur mit invasiven Methoden direkt oder einer sogenannten Rothenbergmaske messbar. Kenntnis des Psub könnte bei der Diagnose helfen.

Zur Schätzung können numerische Modelle verwendet werden, um in einem inversen Problem den Psub zu schätzen. Häufig kommt dabei ein Zwei-Massen-Modell (2MM) zum Einsatz. Bei komplexeren Modellen – z.B. mit besseren Strömungslösern – ist der Rechenaufwand zur klinischen Anwendung zu groß. Wir präsentieren einen Deep Learning Ansatz, der den Rechenaufwand signifikant reduziert.

Material und Methoden: In zwei vorherigen Studien wurde zunächst in ex-vivo Experimenten der Psub bei der Oszillation von Schweinestimmlippen gemessen und dann gezeigt, dass mit einem modifizierten 2MM der Psub geschätzt werden kann. Aus beiden Studien wurden 288 Hochgeschwindigkeitsaufnahmen der Stimmlippenoszillation analysiert, bei denen der experimentelle Psub und die bisher beste Schätzung des Psub bekannt waren. Die Schätzung erfolgte anhand der lateralen Trajektorien der Stimmlippen.

In dieser Studie wurde ein rekurrentes neuronales Netzwerk (RNN) mit synthetischen Trajektorien des 2MM trainiert, den Psub aus Trajektorien zu schätzen. Zum Training wurden 40.000 synthetische Trajektorien generiert.

Ergebnisse: Der Fehler bei der Schätzung des Psub mit dem RNN lag bei den synthetischen Daten im Schnitt bei 80.3 ± 2.7 Pascal (8.1%) und bei den experimentellen ex-vivo Daten bei 194 ± 7.4 Pascal (21.21%). Die Laufzeit des 2MM zur Generierung der synthetischen Daten betrug 6.2 s, das Training des RNN benötigte 569 s.

Diskussion: Die Genauigkeit bei der Schätzung des Psub ist vergleichbar mit dem vorherigen Ansatz (21.21% vs. 17.65% relativer Fehler). Der vorherige Ansatz benötigte aber pro Aufnahme 150.000 Modellauswertungen und 5.8 s, der präsentierte Ansatz benötigt nur einmalig 40.000 Modellauswertungen und unter 1 ms zur Auswertung einer Aufnahme. Der Fehler bei der Schätzung des Psub war im Schnitt nur 22 Pascal höher.

Fazit: Das größte Hindernis zur Schätzung von Parametern wie dem Psub mithilfe von numerischen Modellen ist der hohe Rechenaufwand der Modelle, die in klassischen Optimierungsansätzen vielfach ausgewertet werden müssen. Der präsentierte Deep Learning Ansatz erlaubt eine effizientere Optimierung, die den Einsatz von komplexeren Modellen und damit eine genauere Schätzung physikalischer Parameter wie des Psub ermöglichen könnte.


Text

Hintergrund

Mehrere Studien haben Zusammenhänge zwischen dem subglottalen Druck Psub und Dysphonie festgestellt. Der Psub ist in-vivo nur mit invasiven Methoden direkt oder einer sogenannten Rothenbergmaske messbar. Kenntnis des Psub könnte bei der Diagnose helfen. Zur Schätzung können numerische Modelle verwendet werden, um in einem inversen Problem den Psub zu schätzen. Häufig kommt dabei ein Zwei-Massen-Modell (2MM) zum Einsatz. Bei komplexeren Modellen – z.B. mit besseren Strömungslösern – ist der Rechenaufwand zur klinischen Anwendung zu groß. Wir präsentieren einen Deep Learning Ansatz, der den Rechenaufwand signifikant reduziert.

Material und Methoden

In zwei vorherigen Studien wurde zunächst in ex-vivo Experimenten der Psub bei der Oszillation von Schweinestimmlippen gemessen und dann gezeigt, dass mit einem modifizierten 2MM der Psub geschätzt werden kann. Aus beiden Studien wurden 288 Hochgeschwindigkeitsaufnahmen der Stimmlippenoszillation analysiert, bei denen der experimentelle Psub und die bisher beste Schätzung des Psub bekannt waren. Die Schätzung erfolgte anhand der lateralen Trajektorien der Stimmlippen. In dieser Studie wurde ein rekurrentes neuronales Netzwerk (RNN) mit synthetischen Trajektorien des 2MM trainiert, den Psub aus Trajektorien zu schätzen. Zum Training wurden 40.000 synthetische Trajektorien generiert.

Ergebnisse

Der Fehler bei der Schätzung des Psub mit dem RNN lag bei den synthetischen Daten im Schnitt bei 80.3 ± 2.7 Pascal (8.1%) und bei den experimentellen ex-vivo Daten bei 194 ± 7.4 Pascal (21.21%). Die Laufzeit des 2MM zur Generierung der synthetischen Daten betrug 6.2 s, das Training des RNN benötigte 569 s.

Diskussion

Die Genauigkeit bei der Schätzung des Psub ist vergleichbar mit dem vorherigen Ansatz (21.21% vs. 17.65% relativer Fehler). Der vorherige Ansatz benötigte aber pro Aufnahme 150.000 Modellauswertungen und 5.8 s, der präsentierte Ansatz benötigt nur einmalig 40.000 Modellauswertungen und unter 1 ms zur Auswertung einer Aufnahme. Der Fehler bei der Schätzung des Psub war im Schnitt nur 22 Pascal höher.

Fazit

Das größte Hindernis zur Schätzung von Parametern wie dem Psub mithilfe von numerischen Modellen ist der hohe Rechenaufwand der Modelle, die in klassischen Optimierungsansätzen vielfach ausgewertet werden müssen. Der präsentierte Deep Learning Ansatz erlaubt eine effizientere Optimierung, die den Einsatz von komplexeren Modellen und damit eine genauere Schätzung physikalischer Parameter wie des Psub ermöglichen könnte.

Abbildung 1 [Abb. 1], Abbildung 2 [Abb. 2]

Finanzierung

Diese Studie wurde finanziell unterstützt durch die Deutsche Forschungsgemeinschaft (DFG) – 391215328 mit Antragsnummer DO1247/10-1.


Literatur

1.
Döllinger M, Hoppe U, Hettlich F, Lohscheller J, Schuberth S, Eysholdt U. Vibration parameter extraction from endoscopic image series of the vocal folds. IEEE Trans Biomed Eng. 2002 August;49(8):773-81.
2.
Gómez P, Schützenberger A, Kniesburges S, Bohr C, Döllinger M. Physical parameter estimation from porcine ex vivo vocal fold dynamics in an inverse problem framework. Biomech Model Mechan. 2018 June;17(3):777-92