gms | German Medical Science

33. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP)

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

Regensburg, 22.09. - 25.09.2016

Generierung einer Normkarte von Stimmlippenschwingungen basierend auf einer waveletbasierten Analyse von Phonovibrogrammen

Vortrag

Search Medline for

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 33. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Regensburg, 22.-25.09.2016. Düsseldorf: German Medical Science GMS Publishing House; 2016. DocV21

doi: 10.3205/16dgpp41, urn:nbn:de:0183-16dgpp416

Published: September 8, 2016

© 2016 Fehling et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Hintergrund: In Verbindung mit der Hochgeschwindigkeits-Laryngoskopie ermöglicht das Phonovibrogramm (PVG) eine kompakte Visualisierung von Stimmlippen(SL)-Schwingungen. Mittels waveletbasierter PVG-Analyse lässt sich zudem eine präzise Quantifizierung der SL-Dynamik erreichen. Innerhalb des Verfahrens wird ein zu analysierender PVG-Datensatz in einen 3D-Referenzparameterraum projiziert, welcher aus 100 Videoaufnahmen stimmgesunder Probanden mittels Hauptkomponentenanalyse (engl.: PCA) generiert wurde. Der so konstruierte Parameterraum dient als physiologische Norm und stellt eine quantitative Repräsentation der charakteristischen Schwingungseigenschaften von SL dar. Infolge des Projektionsschrittes hängen die projizierten Ergebnisse (Eigenwerte) im PCA-Raum direkt von den verwendeten Referenzdatensätzen ab und sind daher nicht eindeutig.

Material und Methoden: Es wird ein Verfahren zur Normierung der PCA-Raumrepräsentation vorgestellt, um eine direkte Vergleichbarkeit von auf Basis unterschiedlicher Referenzdaten ermittelten Ergebnissen zu ermöglichen. Die Normierung basiert auf synthetisch generierten eindeutigen PVG-Mustern, die in individuelle PCA-Räume projiziert und unter Verwendung eines Registrierungsansatzes auf einen normierten PCA-Raum abgebildet werden können.

Die Validierung erfolgt über verschiedene Referenzdatensätzen, die aus einem Pool von 100 stimmgesunden Probanden als Stichproben unterschiedlicher Größe (N=10,...,90) gezogen werden. Die relative Abweichung der projizierten Ergebnisse von 20 Testdatensätzen (10 gesund, 5 Paresen, 5 funktionelle Dysphonien) in verschiedenen normierten Projektionen dient als Maß zur Beurteilung der Güte der Normierung.

Ergebnisse: Für die Normierung der PCA-Räume ist eine affine Transformation als Registrierungsansatz hinreichend. Es zeigt sich ein systematischer Zusammenhang zwischen der Anzahl an verwendeten Referenzdatensätze und der Genauigkeit der Normierung. Für eine verlässliche Projektion der Schwingungsmuster in den PCA-Raum (relative Abweichung <1%) muss dieser aus mindestens 60 Probanden konstruiert werden.

Diskussion: Der vorgestellte Normalisierungsansatz erweitert zuverlässig das von Unger et al. vorgestellte Verfahren zur waveletbasierten PVG-Analyse. Durch Registrierung synthetischer PVG-Formen auf einen normierten PCA-Raum lässt sich in Anlehnung an das Basisprotokoll der European Laryngological Society eine Normkarte generieren, welche die glottalen Schwingungstypen eindeutig repräsentiert.


Text

Hintergrund

In Verbindung mit der Hochgeschwindigkeits-Laryngoskopie ermöglicht das Phonovibrogramm (PVG) eine kompakte Visualisierung von Stimmlippen(SL)-Schwingungen [1]. Mittels eines von Unger et al. [2] entwickelten PVG-Analyseverfahrens lässt sich eine präzise Quantifizierung der SL-Dynamik erreichen, welche durch Projektion des aus dem Video extrahierten PVGs in einen 3D-Parameterraum erfolgt. Da diesem Raum 100 Schwingungsmuster stimmgesunder Probanden als Referenz zugrunde liegen, kann er als eine Normkarte physiologischer Schwingungsformen betrachtet werden. Die Parameterwerte (Eigenwerte λi=1,2,3l,r) repräsentieren dabei die glottalen Schwingungstypen, wobei λ1l,r den Open-Quotient (OQ) eines longitudinalen Schwingungstyps und λ2l,r dorsale bzw. ventrale Schwingungstypen quantifiziert, welche sich hinsichtlich auftretender anterior-posterior (AP) Phasenverschiebungen beim Öffnen und Schließen voneinander unterscheiden.

Infolge der bei der Analyse einer Schwingung verwendeten Projektion hängen die Eigenwerte λil,r jedoch direkt von den verwendeten Referenzdatensätzen ab und sind somit hinsichtlich ihrer Interpretation nicht eindeutig. Abbildung 1 [Abb. 1] zeigt für einen gesunden männlichen Probanden (stationäre Phonation) beispielhaft die Abweichungen der Eigenwerte λ1,2l,r, welche infolge dreier unterschiedlicher Referenzdatensätze (N=40, 60, 100) resultieren.

In dieser Arbeit wird ein Verfahren zur Normierung des 3D-Referenzraumes vorgestellt, welches eine eindeutige und einheitliche Interpretation der berechneten Parameterwerte unabhängig von den verwendeten Referenzdaten ermöglicht.

Material und Methoden

Zur Normierung eines Parameterraumes wird zunächst ein Satz synthetischer Schwingungsformen generiert, deren PVG-Repräsentation somit als bekannt vorausgesetzt werden kann. Diese synthetischen Muster werden anschließend in den jeweils betrachteten Referenzraum projiziert und unter Verwendung eines affinen Registrierungsansatzes auf ein kartesisches Koordinatensystem abgebildet, welches somit eindeutig interpretierbar ist.

Abschließend wird untersucht, inwieweit sich durch diese Vorgehensweise auch unter Verwendung unterschiedlicher Referenzdaten eindeutige Parameterwerte ergeben. Dazu wird die Normierung anhand randomisierter Referenzdaten unterschiedlicher Größe (N=10, ..., 90) durchgeführt. Die Validierung erfolgt unter Verwendung von 20 Testdatensätzen (10 Gesunde, 5 Paresen, 5 funktionelle Dysphonien), welche in die verschiedenen normierten Referenzräume projiziert werden. Hierbei werden zur Beurteilung des Einflusses der Stichprobengröße auf die Genauigkeit der Ergebnisse die relativen Abweichungen der Parameterwerte zu dem Referenzdatensatz aus 100 stimmgesunden Probanden [2] berechnet.

Ergebnisse

Das Ergebnis der Normierung der in Abbildung 1 [Abb. 1] dargestellten Parameterräume ist in Abbildung 2 [Abb. 2] gezeigt. Diese wurden aus als Stichproben unterschiedlicher Größe (N=40, 60, 100) zufällig aus einer Gruppe stimmgesunder Probanden generiert. Zu Verdeutlichung sind entsprechend der Abbildung 1 [Abb. 1] die Eigenwerte des männlichen Probanden für den jeweiligen Parameterraum angegeben. Während die Eigenwerte in den Originalräumen noch deutlich voneinander abweichen, stimmen die transformierten λ1,2T für die normierten Räume nun überein.

Die Güte der Normierung hängt systematisch mit der Anzahl der zur Raumkonstruktion verwendeten Referenzdatensätze N zusammen. So nimmt die relative Abweichung mit zunehmender Raumgröße ab und beträgt ab einer Größe von N=60 weniger als 1%.

Diskussion und Fazit

Durch Registrierung synthetischer PVG-Formen auf einen normierten Raum lässt sich eine physiologische Normkarte für Stimmlippenschwingungen generieren, welche die glottalen Schwingungstypen eindeutig repräsentiert. Der vorgestellte Normalisierungsansatz erweitert somit zuverlässig das von Unger et al. [2] eingeführte Verfahren zur waveletbasierten PVG-Analyse und erlaubt es, auch Analyseergebnisse miteinander zu vergleichen, welche mit Hilfe unterschiedlicher Referenzdaten generiert wurden. Um eine hinreichende Genauigkeit (relative Abweichung <1%) der Normkarte zu gewährleisten, ist eine Mindestanzahl von 60 Referenzdatensätzen erforderlich.


Literatur

1.
Lohscheller J, Eysholdt U, Toy H, Dollinger M. Phonovibrography: mapping high-speed movies of vocal fold vibrations into 2-D diagrams for visualizing and analyzing the underlying laryngeal dynamics. IEEE Trans Med Imaging. 2008 Mar;27(3):300-9. DOI: 10.1109/TMI.2007.903690 External link
2.
Unger J, Hecker DJ, Kunduk M, Schuster M, Schick B, Lohscheller J. Quantifying spatiotemporal properties of vocal fold dynamics based on a multiscale analysis of phonovibrograms. IEEE Trans Biomed Eng. 2014 Sep;61(9):2422-33. DOI: 10.1109/TBME.2014.2318774 External link