gms | German Medical Science

36. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP)

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

19.09. - 22.09.2019, Göttingen

Erweiterte Schwingungsanalyse basierend auf der Segmentierung von Glottis und Stimmlippen

Vortrag

  • corresponding author presenting/speaker Mona Kirstin Fehling - Hochschule Trier, Trier, Deutschland
  • Maria Elke Schuster - Klinikum der Universität München, München, Deutschland
  • Bernhard Schick - Universitätsklinikum des Saarlandes, Homburg/Saar, Deutschland
  • Jörg Lohscheller - Hochschule Trier, Trier, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 36. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Göttingen, 19.-22.09.2019. Düsseldorf: German Medical Science GMS Publishing House; 2019. DocV21

doi: 10.3205/19dgpp30, urn:nbn:de:0183-19dgpp301

Published: September 13, 2019

© 2019 Fehling et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Hintergrund: Bisherige Ansätze zur computergestützten Analyse der Stimmlippen-(SL-)schwingung aus endoskopischen Hochgeschwindigkeits-(HG-)aufnahmen basieren auf der segmentierten glottalen Fläche. Erfolgt hierbei kein vollständiges Öffnen entlang der gesamten SL-Länge, kann aus der segmentierten Glottis allein nicht auf die absolute Lage der glottalen Öffnung geschlossen werden, was zu Fehlinterpretationen bei der Schwingungsanalyse führt.

Material und Methoden: Mittels eines Neuronalen Netzes werden sowohl die SL als auch die Glottis vollautomatisch segmentiert. Anschließend werden für jede SL die anatomischen Landmarken processus vocalis sowie vordere Kommissur bestimmt. Die dadurch definierten individuellen Schwingungsachsen erlauben eine exakte Lagebestimmung der glottalen Achse im Bezug zur SL-Länge und können in einer phonovibrogrammbasierten Analyse berücksichtigt werden. Anhand klinischer HG-Aufnahmen von gesunden und pathologischen Probanden (stationäre und nicht-stationäre Phonation) werden Ergebnisse dieser erweiterten Schwingungsanalyse exemplarisch vorgestellt und diskutiert.

Ergebnisse: Die vollständige Segmentierung der SL ermöglicht erstmalig die Beschreibung der SL-Dynamik entlang der gesamten SL-Länge und ist nicht auf die Lage der Glottis beschränkt. Die abgeleiteten Phonovibrogramme ermöglichen sowohl für physiologische als auch für pathologische Schwingungen eine präzisierte Interpretation des zugrundeliegenden Schwingungsvorganges. Die Segmentierung der SL erlaubt weiterhin die Bewertung von Asymmetrien im Muskeltonus, wie sie beispielsweise bei einer einseitigen Recurrensparese vorliegen können. Analysierte Stimmeinsätze und Glissandi demonstrieren, dass mittels individueller Schwingungsachsen für stationäre sowie für nicht-stationäre Phonationen eine präzise Beschreibung der SL-Dynamik erzielt werden kann.

Diskussion: Auf der Segmentierung der Glottis beruhende Ansätze erlauben lediglich die Analyse der Schwingungsdynamik für den sich öffnenden Bereich der SL. Durch die zusätzliche Segmentierung der SL ist es in dieser Arbeit erstmalig gelungen, die Lage und relative Größe der Glottis in direkten Bezug zur SL-Länge zu setzen. Dadurch wird eine präzisierte Beschreibung der SL-Dynamik erreicht, was einen verbesserten Vergleich der Schwingungsdynamik erlaubt.

Fazit: Basierend auf den segmentierten SL erlaubt der vorgestellte Ansatz erstmalig eine präzise SL-individuelle Schwingungsanalyse entlang der gesamten SL-Länge und ermöglicht damit verbesserte intra- sowie interindividuelle Vergleiche.


Text

Hintergrund

Bisherige Ansätze zur computergestützten Analyse der Stimmlippen-(SL-)schwingung aus endoskopischen Hochgeschwindigkeits-(HG-)aufnahmen basieren auf der segmentierten glottalen Fläche. Erfolgt hierbei kein vollständiges Öffnen entlang der gesamten SL-Länge, kann aus der segmentierten Glottis allein nicht auf die absolute Lage der glottalen Öffnung geschlossen werden, wodurch Inkonsistenzen bei der Schwingungsanalyse auftreten können.

Material und Methoden

Beim Phonovibrogramm (PVG) werden zur Beschreibung der Schwingungsdynamik die Auslenkungen der SL in Bezug zur sogenannten glottalen Hauptachse ermittelt, welche jedoch bei einer unsymmetrischen Glottis nicht eindeutig ist [1]. Diese Arbeit präsentiert mit dem Laryngovibrogramm (LVG) eine Erweiterung des PVGs, bei dem die SL-Auslenkungen in Bezug zur individuellen Schwingungsachse einer jeden SL ermittelt werden. Die Bestimmung der beiden SL-Schwingungsachsen erfordert die Extraktion der SL aus den HG-Videos. Dies erfolgt unter Verwendung eines Neuronalen Netzes, welches sowohl die SL als auch die Glottis vollautomatisch segmentiert. Anschließend werden für jede SL die anatomischen Landmarken processus vocalis (Pl, Pr) sowie die vordere Kommissur (A) bestimmt. Diese Landmarken definieren die Lage der individuellen Schwingungsachse und erlauben eine exakte Lagebestimmung der glottalen Öffnung. In Analogie zum PVG lässt sich aus den ermittelten Abstandswerten ein Laryngovibrogramm (LVG) ermitteln, welches die Schwingungsdynamik beider SL in einem Bild visualisiert. Durch Normierung der Abstandswerte auf die SL-Länge lassen sich im Gegensatz zum PVG relative Schwingungsamplituden ermitteln, welche einen Vergleich der Schwingungen ermöglichen.

Ergebnisse

In Abbildung 1 [Abb. 1] sind exemplarisch die PVG- bzw. LVG-Visualisierung an zwei klinischen HG-Videos gesunder Probanden gegenübergestellt. Aus dem PVG lässt sich nicht ableiten, an welcher SL-Position sich die glottale Öffnung befindet und inwieweit ein vollständiges Öffnen der SL vorliegt (Abbildung 1a [Abb. 1]). Da das LVG im Gegensatz dazu die SL-Dynamik entlang der kompletten SL-Länge abbildet, kann erstmalig auch die relative Lage der Glottis dargestellt werden (Abbildung 1b [Abb. 1]). Die abgeleiteten LVGs erlauben sowohl für physiologische als auch für pathologische Schwingungen eine präzisierte Interpretation des zugrundeliegenden Schwingungsvorganges. Durch Kenntnis der SL-Länge kann im LVG eindeutig die mediale SL-Position identifiziert werden, während aus dem PVG lediglich die mediale glottale Position abgeleitet werden kann (Abbildung 1 [Abb. 1], Proband 2). Diese zusätzliche Ortsinformation ermöglicht einen verbesserten intra- sowie interindividuellen Vergleich des Schwingungsverhaltens entlang der SL.

Weicht in unterschiedlichen Aufnahmen die SL-Länge voneinander ab oder ändert sich diese im Rahmen einer nicht-stationären Phonation, so sind die mittels PVG ermittelten absoluten Abstandswerte nicht mehr vergleichbar. Durch Normierung auf die individuelle SL-Länge ermöglicht das LVG die Vergleichbarkeit der ermittelten SL-Auslenkung.

In Abbildung 2 [Abb. 2] ist beispielhaft die SL-Dynamik eines Probanden mit linksseitiger Parese und Glottisschlussinsuffizienz dargestellt (Abbildung 2a [Abb. 2]). Beim PVG wird die SL-Auslenkung bezogen auf die mittig der glottalen Fläche liegende glottale Hauptachse ermittelt, was besonders bei asymmetrischem Schwingungsverhalten problematisch ist und die Interpretation der ermittelten SL-Auslenkungen erschwert. Für die betroffene linke SL zeigt sich im PVG eine reduzierte Schwingungsamplitude (Abbildung 2b [Abb. 2]). Im LVG werden die Auslenkungen bezogen auf SL-individuelle Schwingungsachsen ermittelt, welche aufgrund der Glottisschlussinsuffizienz in diesem Beispiel nicht identisch sind. An medialer Glottisposition zeigt sich im LVG für die rechte SL eine relative Auslenkung von maximal 11% lateral (Abbildung 2c [Abb. 2]). Die betroffene linke SL hingegen weist eine kontralaterale und auf maximal 7% reduzierte Auslenkung auf, was das Mitschwingen mit der gesunden Seite ohne aktive Öffnung kennzeichnet. Das LVG gibt weiterhin ein Öffnen der SL im Bereich 0%–70% der SL-Länge ausgehend vom dorsalen Ende an.

Diskussion

Auf der Segmentierung der Glottis beruhende Ansätze erlauben lediglich die Analyse der Schwingungsdynamik für den sich öffnenden Bereich der SL.

Durch die zusätzliche Segmentierung der SL ist es in dieser Arbeit erstmalig gelungen, die Lage und relative Größe der Glottis in direkten Bezug zur SL-Länge zu setzen. Durch individuelle Schwingungsachsen wird für stationäre sowie für nicht-stationäre Phonationen eine präzise Beschreibung der SL-Dynamik erreicht. Die Normierung der SL-Auslenkung gewährleistet zudem die Vergleichbarkeit der Schwingungsdynamik zwischen verschiedenen HG-Aufnahmen.

Fazit

Basierend auf den segmentierten SL erlaubt der vorgestellte Ansatz erstmalig eine präzise SL-individuelle Schwingungsanalyse entlang der gesamten SL-Länge und ermöglicht damit verbesserte intra- sowie interindividuelle Vergleiche.


Literatur

1.
Lohscheller J, Eysholdt U, Toy H, Dollinger M. Phonovibrography: mapping high-speed movies of vocal fold vibrations into 2-D diagrams for visualizing and analyzing the underlying laryngeal dynamics. IEEE Trans Med Imaging. 2008;27(3):300-9. DOI: 10.1109/TMI.2007.903690. External link