gms | German Medical Science

30. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

20.09. - 22.09.2013, Bochum

Analyse von Phonovibrogrammen bei nicht-stationärer Phonation mittels Wavelets

Vortrag

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 30. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Bochum, 20.-22.09.2013. Düsseldorf: German Medical Science GMS Publishing House; 2013. DocV18

doi: 10.3205/13dgpp47, urn:nbn:de:0183-13dgpp470

Veröffentlicht: 5. September 2013

© 2013 Unger et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Zusammenfassung

Hintergrund: Bei der klinischen Stimmdiagnostik wird üblicherweise die Stimmlippendynamik der Phonation eines gehaltenen Vokals bei mittlerer Sprechstimmlage mittels endoskopischer Bildgebung untersucht. Die Analyse gehaltener Vokale liefert jedoch nur einen Ausschnitt aus der gesamten Schwingungsmechanik, da sich physiologische Eigenschaften der Stimmlippenschwingungen bei unterschiedlichen Grundfrequenzen stark unterscheiden.

Material und Methoden: Eine kürzlich entwickelte Wavelet-Analyse wurde bereits erfolgreich eingesetzt, um Merkmale der Stimmlippenschwingungsform, -Symmetrie und -Stabilität aus endoskopischen Hochgeschwindigkeitsvideos bei gehaltener Phonation abzuleiten und Pathologien automatisch zu klassifizieren [4]. In dieser Arbeit wird gezeigt, wie diese Methode auf nicht-stationäre Phonation erweiterbar ist, um die systematische Veränderung klinisch relevanter Parameter in Abhängigkeit der Grundfrequenz zu analysieren. Die Anwendbarkeit des Verfahrens wird anhand 10 weiblicher Probandinnen (5 stimmgesund, 5 mit Recurrensparese) bei stationärer Phonation sowie während einer Erhöhung der Grundfrequenz mit Vergleich der Ergebnisse demonstriert.

Ergebnisse: Im Gegensatz zur Untersuchung einer stationären Phonation war das neue Verfahren bei der Analyse der nicht-stationären Phonation in der Lage, eine Trennung gesunder und pathologischer Stimmlippenschwingungen vorzunehmen. Durch Anpassung des Verfahrens an zeitveränderliche Prozesse ließen sich zusätzliche klinisch nutzbare Parameter identifizieren.

Diskussion: Die Auswertung einer nicht-stationären Phonation liefert ergänzende neue Informationen über die Stimmlippendynamik, die bisher nicht aus dem stationären Prozess abgeleitet werden können, und erweitert somit das Anwendungsspektrum der HG-Endoskopie.


Text

Hintergrund

Die digitale Hochgeschwindigkeits-Videoendoskopie (HSV) ist derzeit die einzige Technik, die das intrazyklische Schwingungsmuster auch für nicht-stationäre oder stark irreguläre Stimmlippenschwingungen erfasst. Obwohl die Anwendung der HSV nicht auf stationäre Phonation beschränkt ist, wird sie meist bei gehaltener Phonation eingesetzt. Da sich physiologische Eigenschaften der Stimmlippenschwingungen jedoch bei unterschiedlichen Grundfrequenzen stark unterscheiden, liefert die Analyse gehaltener Vokale nur einen Ausschnitt der gesamten Schwingungsmechanik. Im Rahmen der vorliegenden Studie wird ein bereits existierendes wavelet-basiertes Verfahren [3] zur Analyse stationärer Phonation erweitert, um eine monotone Erhöhung der Stimmgrundfrequenz bei gesunden und pathologischen Stimmlippenschwingungen zu untersuchen. Die Ergebnisse wurden mit denen der stationären Phonation verglichen und untersucht welche Untersuchungssituation sich besser zur Identifikation von pathologischen Schwingungsmustern eignet.

Material und Methoden

Die waveletbasierte Analyse basiert auf der automatisierten Auswertung von Phonovibrogrammen. Die Phonovibrogramm (PVG)-Darstellung [2] erlaubt neben der Visualisierung der Schwingungsdynamik der Stimmlippen eine computergestützte Analyse der individuellen Schwingungscharakteristik. Anhand von PVGs ermöglicht die waveletbasierte Analyse neben einer exakten Charakterisierung des Glottisschlusstyps auch eine Quantifizierung von Schwingungs-Regularität und -Symmetrie und zwar ohne die Notwendigkeit einzelne Zyklen identifizieren zu müssen. Der Glottisschlusstyp wird dabei auf bis nur drei skalare Merkmale reduziert. Diese Merkmale repräsentieren quantitativ die Ausprägungen longitudinal, dorsal, ventral, konvex und konkav, entsprechend der in der Klassifikation der European Laryngological Society (ELS) vorgeschlagenen Arten des unvollständigen Glottisschlusses [1].

Um zeitvariante Veränderungen der Schwingungsdynamik zu erfassen wird das PVG nun zusätzlich in konsekutive und sich überlappende Zeitepochen zerlegt. Auf diese Weise lassen sich nicht-stationäre Stimmlippenschwingungen zeitabhängig analysieren und beschreiben. Abbildung 1a [Abb. 1] zeigt exemplarisch die Veränderung der Schwingungsform einer weiblichen Probandin während einer Frequenzerhöhung von 225 Hz bis 512 Hz.

Insgesamt wurden 10 weibliche Probandinnen (5 stimmgesund, 5 mit unilateraler Recurrensparese) bei stationärer Phonation und mittlerer Sprechstimmlage sowie während einer monotonen Erhöhung der Grundfrequenz mit Hilfe der HSV (Endocam 5562, Richard-Wolf-GmbH, 4000 Bilder pro Sekunde) untersucht. Anhand dieser Daten wurde evaluiert welche Vorteile die Analyse von nicht-stationärer Phonation gegenüber stationärer Phonation zur Identifikation von paretischen Schwingungsmustern bietet.

Ergebnisse und Diskussion

Exemplarisch lässt sich bei einer gesunden weiblichen Probandin anhand von Abbildung 1a [Abb. 1] eine systematische Veränderung des Glottisschlusstyps von dorsaler hin zur longitudinalen Ausprägung mit anwachsendem Öffnungsquotienten erkennen. Die Ergebnisse aller Probanden der Untersuchung mit stationärer Phonation sind in Abbildung 1b [Abb. 1] und 1c [Abb. 1] abgebildet.

Die Schwingungsmuster der pathologischen Gruppe liegen teilweise innerhalb und außerhalb des Normbereichs. Eine Unterscheidung zwischen gesunden und pathologischen Schwingungsmustern ist daher allein anhand des Schwingungsmusters bei stationärer Phonation nicht möglich.

Die Ergebnisse der monotonen Frequenzerhöhung für die gesunde und pathologische Gruppe zeigen Abbildung 2a [Abb. 2] und Abbildung 2b [Abb. 2]. Bei den gesunden Probanden lässt sich wie zuvor eine allmähliche Veränderung vom dorsalen hin zum longitudinalen Glottisschluss ausmachen. Die Ausprägungen der Schwingungsmuster der pathologischen Gruppe weisen hingegen eine größere Streuung auf und liegen im Bereich des longitudinalen Schlusstyps mit höherem Öffnungsquotienten. Da bei den gesunden Probanden das dorsale Schwingungsmuster vorwiegend mit einer geringen Grundfrequenz einhergeht, lassen sich für den Bereich von 200–230 Hz die Schwingungsmuster von beiden Gruppen linear trennen.

Die Auswertung einer nicht-stationären Phonation liefert Informationen über die Stimmlippendynamik, die bisher nicht aus dem stationären Prozess abgeleitet werden können. Weitere Parameter wie Asymmetrie, Periodizität und Synchronität lassen sich zukünftig in analoger Weise aus dem beschriebenen Verfahren ableiten und stellen potentiell weitere klinisch nutzbare Parameter dar, deren Relevanz es in weiteren Studien zu validieren gilt.


Literatur

1.
Dejonckere PH, Bradley P, Clemente P, Cornut G, Crevier-Buchman L, Friedrich G, Van De Heyning P, Remacle M, Woisard V. A basic protocol for functional assessment of voice pathology, especially for investigating the efficacy of (phonosurgical) treatments and evaluating new assessment techniques. Guideline elaborated by the Committee on Phoniatrics of the European Laryngological Society (ELS). Eur Arch Otorhinolaryngol. 2001 Feb;258(2):77-82. DOI: 10.1007/s004050000299 Externer Link
2.
Lohscheller J, Eysholdt U, Toy H, Döllinger M. Phonovibrography: mapping high-speed movies of vocal fold vibrations into 2-D diagrams for visualizing and analyzing the underlying laryngeal dynamics. IEEE Trans Med Imaging. 2008 Mar; 27(3):300-9. DOI: 10.1109/TMI.2007.903690 Externer Link
3.
Unger J, Meyer T, Döllinger M, Hecker DJ, Schick B, Lohscheller J. A wavelet-based approach for a continuous analysis of phonovibrograms. San Diego, USA: Engineering in Medicine and Biology Society; 2012.
4.
Unger J, Schuster M, Hecker JD, Schick B, Lohscheller J. A Multiscale Product Approach for an Automatic Classification of Voice Disorders from Endoscopic High-Speed Videos, IEEE Engineering in Medicine and Biology Society. Osaka, Japan; 2013.