gms | German Medical Science

26. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

11.09. - 13.09.2009, Leipzig

Optimierung eines 3D-Mehr-Massen-Modells der Stimmlippendynamik

Vortrag

  • corresponding author presenting/speaker Anxiong Yang - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Jörg Lohscheller - Fachbereich Informatik, Medizininformatik Schneidershof der Fachhochschule Trier, Trier, Deutschland
  • author Michael Stingl - Lehrstuhl für Angewandte Mathematik II der Friedrich-Alexander-Universität Erlangen-Nürnberg, Erlangen, Deutschland
  • author Daniel Voigt - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Ulrich Eysholdt - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Michael Döllinger - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 26. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Leipzig, 11.-13.09.2009. Düsseldorf: German Medical Science GMS Publishing House; 2009. Doc09dgppV17

DOI: 10.3205/09dgpp26, URN: urn:nbn:de:0183-09dgpp269

Published: September 7, 2009

© 2009 Yang et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Zusammenfassung

Das gesunde menschliche Stimmsignal entsteht durch symmetrische Stimmlippenschwingungen. Asymmetrische Vibrationen der Stimmlippen führen zu Heiserkeit. Mittels einer endoskopischen Hochgeschwindigkeitskamera können die Asymmetrien der Stimmlippenschwingungen während der Phonation sichtbar gemacht werden. Um die Stimmlippendynamik in 3D zu analysieren und zu beurteilen, wurde ein 3D-Mehr-Massen-Modell (3D-MMM) entwickelt.

Um die physiologisch interpretierbaren Eigenschaften der Stimmlippendynamik während der Phonation zu bestimmen, wurde das 3D-MMM mit 52 modifizierbaren Modellparametern implementiert. Für deren Identifizierung wurde eine Optimierungsprozedur entwickelt. Verschiedene globale und lokale Optimierungsverfahren wie „Particle Swarm Optimization“, „Simulated Annealing“ und „Powell's direction set method“ wurden auf die Modellparameter angewendet, um die zunächst synthetisch erzeugten 3D-Trajektorien möglichst gut zu approximieren.

Der Optimierungsalgorithmus wird durch synthetisch erzeugte, symmetrische Daten fünf verschiedener Glottisschlusstypen evaluiert. Mithilfe der dabei ermittelten Messwerte wie Korrelationskoeffizient der Dynamik und Übereinstimmung der rekonstruierten Modellparameter lassen sich die Reliabilität und Durchführbarkeit der verwendeten Optimierungsverfahren verifizieren.

In einer weiterführenden Studie sollen das Modell und die entsprechenden Optimierungsverfahren an in-vivo als auch ex-vivo Stimmlippenschwingungen überprüft werden.


Text

Einleitung

Die Stimmlippenschwingungen im menschlichen Kehlkopf erzeugen die primäre Stimme [1]. Bei normaler Phonation bewegen sie sich symmetrisch und dreidimensional (lateral, vertikal und longitudinal). Die biomechanischen Eigenschaften der Stimmlippen (z.B. Muskelspannungen und -massen) können durch die Simulation und Analyse der 3D-Stimmlippendynamik bestimmt werden. In einer vorangegangenen Studie wurde ein biomechanisches 3D-Mehr-Massen-Modell (3DM) vorgestellt [2], mit dem sich realistische Schwingungen in 3D nachbilden lassen. Um das 3DM zukünftig anwenden zu können, wurde eine Optimierungsprozedur zur Anpassung an reale Schwingungen entwickelt. Die 3D-Trajektorien sollen hierbei durch die Optimierungsprozedur des 3DM möglichst gut reproduziert werden. In der vorliegenden Arbeit wird zunächst die Optimierungsprozedur vorgestellt und an synthetischen Daten validiert.

Methode

Das 3DM ist eine Erweiterung des 2DM in vertikaler Richtung [1]. Die Stimmlippen werden innerhalb des Modells mit 25 Oszillatoren (d.h. 50 miteinander gekoppelte Masseelemente) in 3D nachgebildet. Die biomechanischen Eigenschaften der Stimmlippen werden im 3DM durch die Modellparameter wie subglottaler Druck (P sub ), Steifigkeit (k i,s ), Masse (m i,s ) und Ruheposition (x r i,s ) beschrieben. Dabei bezeichnen die Indizes (i,s) das Masseelement i in der Ebene s. Um die Konfiguration des 3DM zu optimieren, werden die aus [2] bekannten Optimierungsparameter (Formel Q p , Formel Q i,s , Formel Q r ) als Skalierungsfaktoren für (P sub , k i,s , m i,s , x r i,s ) definiert und wie folgt initialisiert:

Formel 1, Formel 2

wobei A i,s die Amplitude der synthetisch erzeugten Trajektorien, A m i,s die Amplitude der modellerzeugten Trajektorien und f i,s die zugehörige Grundfrequenz des 3DM bezeichnet. Mit Hilfe der Optimierungsparameter kann jeder Modellparameter in der Optimierungsprozedur angepasst werden. Die Optimierung des 3DM wird ebenen-, querschnitts- und seitenweise durchgeführt und in drei unterschiedliche Phasen unterteilt (primär, grob und fein). Drei verschiedene Kriterien werden zur Auswertung der Qualität der Optimierungsprozedur herangezogen:

  • Die Zielfunktion Г entspricht dem normalisierten Fehler zwischen synthetisch erzeugten und angepassten Trajektorien. Dabei werden verschiedene Gewichtungskoeffizienten berücksichtigt, die in Zusammenhang mit unterschiedlichen Dimensionen, Querschnitten und Ebenen auftreten.
  • Die Übereinstimmung zwischen den Trajektorien wird mit dem Korrelationskoeffizienten κ angegeben.
  • λ zeigt den Grad der Genauigkeit der gefundenen Optimierungsparameter.

Im Optimierungsverfahren werden globale („Particle Swarm Optimization“ [3], „Simulated Annealing“) und lokale Verfahren („Powell’s direction set method“) kombiniert. Es wird die heuristische Bedingung Formel 3 für das Wechseln zwischen lokalen und globalen Verfahren verwendet. Das globale Verfahren wird angewandt, falls die Voraussetzung erfüllt ist.

Es werden 50 synthetische, mit vordefinierten Modellparametern erzeugte Datensätze untersucht, die fünf verschiedenen Glottisschlusstypen mit jeweils zehn Individuen zugeordnet sind (siehe Tabelle 1 [Tab. 1]). Die Intervalle der vordefinierten Modellparameter betragen:

Formel 4

Ergebnisse

Die Werte der Optimierungsprozedur für die synthetischen Daten sind in Tabelle 1 dargestellt. Die durchschnittlichen Werte (Г, λ, κ) betragen 0,07±0,03, 96%±2% und 91%±4%. Die Verhältnisse zwischen den Optimierungsparametern Formel 5 und den vordefinierten Parametern Formel 6 sind in Abbildung 1 [Abb. 1] dargestellt. Die Messwerte werden durch Regressionslinien approximiert. Der Bereich innerhalb der beiden gestrichelten Linien beinhaltet 85% der Optimierungsparameter.

Diskussion

Die Güte der Optimierungsprozedur bei synthetischen Daten ist hinreichend gut (siehe Tabelle 1 [Tab. 1]). Synthetische Individuen, die eine höhere Grundfrequenz und einen stärkeren subglottalen Druck aufweisen, führen zu einem größeren Abstand zwischen den synthetisch erzeugten und den optimierten 3D-Trajektorien. Vermutlich ist die Ursache hierfür, dass der erhöhte subglottale Druck die Instabilität des 3DM erhöht, da er chaotische und asymmetrische Stimmlippenschwingungen bewirken kann [4]. Mithilfe der Optimierungsprozedur konnten die Parameter sehr gut angenähert werden (siehe Abbildung 1 [Abb. 1]). Somit können biomechanische Eigenschaften der 3D-Stimmlippenbewegung quantifiziert und analysiert werden. In einer nachfolgenden Studie wird die Optimierung auf experimentelle Datensätze erweitert, die aus Hemilarynx-Experimenten extrahiert werden [5].


Literatur

1.
Yang A, Lohscheller J, Voigt D, Eysholdt U, Döllinger M. Modellierung der 3D-Stimmlippendynamik mittels eines 3D-Mehr-Massen-Modells. In: 25. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie. Düsseldorf, 12.-14.09.2008. Düsseldorf: German Medical Science GMS Publishing House; 2008. Doc 08dgppP15. Available from: http://www.egms.de/en/meetings/dgpp2008/08dgpp59.shtml External link
2.
Schwarz R, Döllinger M, Wurzbacher T, Eysholdt U, Lohscheller J. Spatio-temporal quantification of vocal fold vibrations using high-speed videoendoscopy and a biomechanical model. J Acoust Soc Am. 2008;123(5):2717-32.
3.
Kennedy J, Eberhart RC. Particle swarm optimization. In: Proc. of the IEEE Int. Conf. on Neural Networks, Piscataway, NJ; 1995. p. 1942-48.
4.
Wurzbacher T, Döllinger M, Schwarz R, Hoppe U, Eysholdt U, Lohscheller J. Spatiotemporal classification of vocal fold dynamics by a multimass model comprising time-dependent parameters. J Acoust Soc Am. 2008;123(4):2324-34.
5.
Bößenecker A, Berry DA, Lohscheller J, Eysholdt U, Döllinger M. Mucosal Wave Properties of a Human Vocal Fold. ACTA Acustica United with Acustica. 2007;93:815-23.