gms | German Medical Science

31. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP) zusammen mit dem 5. Pädakustiker-Symposium der Akademie für Hörgeräte-Akustik

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

18.09. - 21.09.2014, Lübeck

Ein generalisiertes Verfahren zur Analyse stationärer und nicht-stationärer Stimmlippendynamik

Vortrag

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. Akademie für Hörgeräte-Akustik. 31. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP) zusammen mit dem 5. Pädakustiker-Symposium der Akademie für Hörgeräte-Akustik. Lübeck, 18.-21.09.2014. Düsseldorf: German Medical Science GMS Publishing House; 2014. DocV10

doi: 10.3205/14dgpp13, urn:nbn:de:0183-14dgpp138

Veröffentlicht: 2. September 2014

© 2014 Unger et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Zusammenfassung

Hintergrund: Im Gegensatz zur Stroboskopie erlaubt die Hochgeschwindigkeits-(HG-) Laryngoskopie durch ihre hohe zeitliche Auflösung auch die Erfassung nicht stationärer Phonationsprozesse. Der Großteil neuer Verfahren zur Analyse von HG-Videos beschränkt sich jedoch nach wie vor auf das stationäre Phonationsparadigma und nutzt somit nur eingeschränkt die erweiterten technologischen Möglichkeiten der HG-Laryngoskopie.

Material und Methoden: Ein kürzlich vorgestelltes wavelet-basiertes Verfahren zur objektiven Analyse HG-Videos ermöglicht die Quantifizierung des zeitveränderlichen Schwingungsmusters, der Symmetrie sowie der Stabilität der Stimmlippendynamik während gehaltener, stationärer Phonation (Unger et al. 2014). Dieses Verfahren wurde verallgemeinert und ist nun zudem auf die Analyse nicht stationäre Prozesse übertragbar, so dass sich klinisch relevante Größen erfassen und je nach zu Grunde liegender Untersuchungssituation – stationär oder nicht stationär – interpretieren lassen. Das Verfahren wird anhand von 10 stimmgesunden und 10 pathologischen weiblichen Probandinnen bei stationärer Phonation sowie während einer monotonen Erhöhung der Grundfrequenz demonstriert.

Ergebnisse: Mit Hilfe des neuen Verfahrens ließen sich Unterschiede bei der zeitlichen Entwicklung der Schwingungsparameter identifizieren, die spezifisch der Untersuchungssituation in verschiedenen klinisch nutzbaren Parametern quantifiziert wurden. Anhand der definierten Parameter konnte eine Unterscheidung zwischen gesunden und pathologischen Schwingungsmustern sowohl bei den stationären als auch bei den nicht-stationären Phonationen erreicht werden.

Diskussion: Das vorgestellte Verfahren ermöglicht erstmals eine individuell an die Untersuchungssituation angepasste Analyse der Stimmlippendynamik sowohl für stationäre als auch für nicht stationäre Phonation mit einem generalisierten Analyseverfahren.


Text

Hintergrund

Die Hochgeschwindigkeits-(HG-)Laryngoskopie erlaubt durch hohe zeitliche Abtastraten eine exakte Analyse des Schwingungsmusters der Stimmlippen. Da im Gegensatz zur Stroboskopie keine Grundfrequenzanalyse zur Synchronisation notwendig ist, lassen sich auch nichtstationäre und irreguläre Schwingungsvorgänge erfassen. Trotz dieser technischen Überlegenheit wird die HG-Layngoskopie nach wie vor zumeist bei gehaltener Phonation durchgeführt. Pathologische Phonationsmechanismen können jedoch bei verschiedenen Grundfrequenzen unterschiedlich stark ausgebildet sein, so dass bei der gehaltenen Phonation nur ein einzelner Ausschnitt der gesamten Stimmlippendynamik abgebildet wird. Im Rahmen der vorliegenden Studie wird ein generalisiertes Verfahren zur Analyse von Stimmlippenschwingungen anhand von laryngealen HG-Videos vorgestellt. Das Verfahren stellt eine Erweiterung eines wavelet-basierten Verfahrens zur Analyse stationärer Phonation [1] dar und lässt sich nunmehr auch auf nicht-stationäre anwenden. Das Verfahren wird anhand von gesunden und pathologischen Schwingungsmustern bei monotonen Frequenzerhöhungen sowie bei gehaltener Phonation demonstriert und klinisch nutzbare Parameter für beide Phonationsparadigmen zur Identifikation von Pathologien abgeleitet.

Material und Methoden

Zur automatischen Auswertung der HG-Videos wird die Phonovibrogramm (PVG)-Darstellung verwendet. PVGs ermöglichen eine kompakte Repräsentation der Schwingungsdynamik und erlauben neben einer Visualisierung auch eine automatisierte Auswertung der Schwingungscharakteristika. Das Schwingungsmuster wird anhand der wavelet-basierten PVG-Analyse auf lediglich drei Parameter (Eigenwerte) für jede Stimmlippe reduziert. Der erste Eigenwert repräsentiert dabei die Höhe des Öffnungsquotienten. Der zweite Eigenwert charakterisiert eine dorso-ventrale Phasenverschiebung: Bei dorsalem Schwingungsmuster existiert ein zeitlicher Versatz des Öffnungsvorgangs der Stimmlippen von posterior nach anterior; beim Schluss von anterior nach posterior, wohingegen das ventrale Schwingungsmuster eine umgekehrte Bewegung beschreibt. Der dritte Eigenwert unterscheidet analog zwischen Öffnung- und Schluss der Stimmlippen von terminal nach medial und umgekehrt [1].

Zur zeitvarianten Analyse der Schwingungsdynamik wird das PVG in sich überlappende Segmente unterteilt. Die beschriebenen Eigenwert-Parameter lassen sich so von jedem einzelnen Segment berechnen und charakterisieren somit die zeitliche Veränderung des Schwingungsmusters.

Es wurden 20 weibliche Probandinnen (10 stimmgesund, 5 mit unilateraler Recurrensparese und 5 mit funktioneller Dysphonie) während gehaltener Phonation und während einer monotonen Erhöhung der Grundfrequenz mittels HG-Laryngoskopie (HS Endocam 5562, Richard-Wolf-GmbH, 4000 Bilder pro Sekunde) untersucht. Für jede Untersuchungssituation werden exemplarisch Analyseergebnisse gezeigt, die erkennen lassen, dass sich dieses Verfahren auch zur Differenzierung zwischen gesunden und pathologischen Schwingungsmustern eignet.

Ergebnisse und Diskussion

Abbildung 1 [Abb. 1] zeigt die zeitliche Veränderung gesunder und pathologischer Schwingungsmuster bei einer monotonen Frequenzerhöhung. Das Schwingungsmuster der gesunden Probandin weist eine systematische Veränderung von dorsal nach longitudinal mit sukzessiv ansteigendem Öffnungsquotienten auf. Weiterhin ist eine symmetrische Veränderung (hohe Korrelation) der Schwingungsmuster beider Stimmlippen zu erkennen. Dahingegen tritt während der Frequenzerhöhung bei beiden Pathologien eine erhöhte laterale Differenz (geringe Korrelation) zwischen den Schwingungsmustern auf. Die gewichtete Korrelation der Eigenwerte zwischen linker und rechter Stimmlippe kann somit als Maß zur Identifikation von zeitabhängigen Schwingungsasymmetrien verwendet werden. Die Anwendung dieses Asymmetriemaßes auf die 20 Probanden ist in Abbildung 1 [Abb. 1] (rechts) gezeigt. Anhand des Korrelationsparameters lassen sich bei der Frequenzerhöhung gesunde und pathologische Stimmlippenschwingungen eindeutig unterscheiden. Die pathologischen Gruppen weisen einen geringeren Wert auf, was eine verminderte Kopplung der Schwingungsvorgänge beider Stimmlippen vermuten lässt.

Bei gehaltener Phonation zeigt Abbildung 2 [Abb. 2] ein exemplarisches Ergebnis der zeitabhängigen PVG-Waveletanalyse. Bei dem pathologischen Schwingungsmuster ist eine erhöhte Streuung der Eigenwerte zu erkennen, was auf eine verminderte zeitliche Stabilität hindeutet. Insofern lässt sich als Stabilitätsmaß für gehaltene Phonation die gemittelte Standardabweichung aller Eigenwerte definieren, welche für das gesamte Probandenkollektiv ermittelt wurde Abbildung 2 [Abb. 2], rechts).

Bei der stationären Phonation zeigt sich eine erhöhte Irregularität bei den pathologischen Schwingungsmustern. Jedoch ist, im Gegensatz zu dem nicht-stationären Untersuchungsparadigma, keine fehlerfreie Differenzierung zu den gesunden Schwingungsmustern möglichen, da sich hier keine zeitliche Korrelation der Änderungen der Schwingungsmuster nutzen lässt.

Das hier vorgestellte Verfahren stellt einen allgemeinen Ansatz zur Analyse von stationärer sowie nicht-stationärer Phonation dar, mit dessen Hilfe sich für verschiedene Untersuchungsparadigmen unterschiedliche Asymmetrieparameter ableiten lassen. Das Verfahren eignet sich grundsätzlich auch dazu weitere nicht-stationäre Phonationsparadigmen wie den Stimmeinsatz zu analysieren, um zusätzliche klinisch relevante Merkmale für eine objektive Diagnostik zu extrahieren.


Literatur

1.
Unger J, Hecker D, Kunduk M, Schuster M, Schick B, Lohscheller J. Quantifying spatiotemporal Properties of Vocal Fold Dynamics based on a Multiscale Analysis of Phonovibrograms. IEEE Trans Biomed Eng. 2014 Apr. DOI: 10.1109/TBME.2014.2318774 Externer Link
2.
Lohscheller J, Eysholdt U, Toy H, Dollinger M. Phonovibrography: mapping high-speed movies of vocal fold vibrations into 2-D diagrams for visualizing and analyzing the underlying laryngeal dynamics. IEEE Trans Med Imaging. 2008 Mar;27(3):300-9. DOI: 10.1109/TMI.2007.903690 Externer Link