gms | German Medical Science

21. Wissenschaftliche Jahrestagung der DGPP

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie

10. bis 12.09.2004, Freiburg/Breisgau

Modellierung der Stimmlippenbewegung bei Erhöhung der Grundfrequenz

Vortrag

  • author presenting/speaker Tobias Wurzbacher - Klinikum der Universität Erlangen-Nürnberg, Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Raphael Schwarz - Klinikum der Universität Erlangen-Nürnberg, Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Hikmet Toy - Klinikum der Universität Erlangen-Nürnberg, Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Ulrich Eysholdt - Klinikum der Universität Erlangen-Nürnberg, Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Jörg Lohscheller - Klinikum der Universität Erlangen-Nürnberg, Phoniatrie und Pädaudiologie, Erlangen, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 21. Wissenschaftliche Jahrestagung der DGPP. Freiburg/Breisgau, 10.-12.09.2004. Düsseldorf, Köln: German Medical Science; 2004. Doc04dgppV53

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/dgpp2004/04dgpp82.shtml

Veröffentlicht: 9. September 2004

© 2004 Wurzbacher et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Zusammenfassung

Gemeinhin wird bei der klinisch gängigen Diagnostik die Stimmlippenfunktion unter gleich bleibenden, stationären Bedingungen untersucht, z.B. im Rahmen einer Endoskopie bei einem gehaltenen Vokal. Dies bildet den physiologischen Stimmgebrauch und auch erkrankte Stimmen jedoch nur unzureichend ab. In dieser Studie wird als ein Paradigma einer nicht stationären Phonation die Stimmlippenbewegung während einer monotonen Erhöhung der Stimmgrundfrequenz untersucht. Daraus sollten sich Basisdaten zur Analyse pathologischer Stimmen ergeben. Dafür wird ein bestehendes, weit verbreitetes biomechanisches Modell der Stimmlippen erweitert. Als zeitabhängige Größen werden die Modellparameter Masse, Spannung und subglottaler Druck eingeführt. Ein Inversionsalgorithmus passt diese Modellparameter an, bis die Schwingungen der Modellmassen mit den realen Schwingungen der Stimmlippen übereinstimmen, die mittels der endoskopischen Hochgeschwindigkeitsglottographie aufgezeichnet werden. Das Verfahren wird zunächst an synthetischen Stimmlippenbewegungen und dann an realen Bewegungen einer weiblichen Normalstimme erfolgreich verifiziert. Das erweiterte biomechanische Model ist zusammen mit dem entwickelten Inversionsalgorithmus in der Lage, Modellparametern zu extrahieren, die nicht stationäre Stimmlippenbewegungen abbilden. Der klinische Wert des Verfahrens wird nunmehr an pathologischen Stimmen weiter untersucht.


Text

Einleitung

Eine nicht-stationäre Stimme ist mit ihren Variationen in Stimmgrundfrequenz und Schallpegel verwandter mit dem alltäglichen Stimmgebrauch als eine stationäre Phonation [1]. Daher wird in dieser Studie als Beispiel für eine nicht-stationäre Phonation eine monotone Erhöhung der Stimmgrundfrequenz betrachtet. Die Schwingungen der Stimmlippen werden im Rahmen einer endoskopischen Untersuchung mit einer Hochgeschwindigkeitskamera aufgenommen. Eine Bildverarbeitung ermöglicht die Extraktion der nicht-stationären Stimmlippenbewegungen [2]. Diese Schwingungen, im folgenden auch experimentelle Trajektorien genannt, sollen durch ein adaptionsfähiges, biomechanisches Modell nachgebildet werden, weil physiologisch relevante Parameter, wie Muskelmasse etc., nicht direkt messbar sind. Diese Parameter finden sich in dem verwendeten Zwei-Massen Modell (2MM) wieder, welches auf einem modifizierten Ansatz von Ishizaka et al. [3] beruht. Die Einführung von zeitvarianten Modellparametern ermöglicht die Modellierung von nicht-stationären Schwingungen. Ziel dieser Arbeit ist es Modellparameter zu bestimmen, die das Schwingungsverhalten realer Stimmlippen nachbilden, um Aussagen über die Änderungen der Stimmlippeneigenschaften bei einer nicht-stationären Phonation abzuleiten.

Methode

Das 2MM ist in der Lage reale Stimmlippenbewegungen bei stationärer Phonation nachzubilden [4]. Innerhalb des Modells besteht eine Stimmlippe aus zwei gekoppelten Oszillatoren. Das 2MM ist in der Lage, neben den myoelastischen Eigenschaften der Stimmlippen auch aerodynamische Kräfte, die durch den subglottalen Druck P s erzeugt werden, zu beschreiben. Die Schwingungen der unteren Modellmassen werden im folgenden als theoretische Trajektorien bezeichnet. Damit das 2MM mit den theoretischen Trajektorien die nicht-stationären Oszillationen der experimentellen Trajektorien nachbilden kann, ist es um zeitabhängige Modellparameter erweitert worden. Explizit werden dabei die Modellmassen m(t), Modellspannungen k(t) und der subglottale Druck P s (t) als zeitvariante Größen eingeführt, weil diese den Phonationsprozess entscheidend beeinflussen [1]. Durch Variation der genannten Modellparameter ist es möglich die Frequenz und die Amplitude der theoretischen an die experimentelle Trajektorie anzupassen. Dieser Vorgang wird als Inversion bezeichnet.

Der Inversionsalgorithmus extrahiert aus den experimentellen Trajektorien zwei Charakteristiken, die für die Anpassung genutzt werden. Zum einen die zeitvariante Grundfrequenz und zum anderen die Einhüllenden des zeitvarianten Amplitudenverlaufs. Bei der anschließenden Initialisierung der Modellparameter wird berücksichtigt, dass der schwingende Anteil der Stimmlippenmasse m(t) mit steigender Muskelspannung k(t) abnimmt [4]. Dies wird mathematisch durch einen Faktor Q(t) beschrieben: k(t)=k 0 Q(t) und m(t)=m 0 /Q(t). Der eigentliche Anpassungszyklus startet indem zuerst die Frequenz der theoretischen Trajektorien des 2MM durch Variation von Q(t) an die Frequenz der experimentellen Trajektorien angeglichen wird. Im Anschluss findet die Annäherung der theoretischen an die experimentelle Einhüllende über den Modellparameter subglottaler Druck P s (t) statt. Da eine Druckveränderung jedoch auch eine geringe Grundfrequenzänderung bewirkt [1], wird anschließend erneut eine Grundfrequenzanpassung vorgenommen. Dieser Zyklus aus Grundfrequenz- und Einhüllendenanpassung wird solange durchlaufen, bis die Charakteristiken zwischen experimenteller und theoretischer Trajektorie übereinstimmen.

Der Inversionsalgorithmus wurde erfolgreich an synthetischen Stimmlippenbewegungen, die mit vorgegebenen Parametern des 2MM berechnet wurden, verifiziert. Mit der Inversionsprozedur konnten die vorgegebenen Parameter P s (t), k(t) und m(t) errechnet werden. Des weiteren ist das Verfahren auf eine weibliche Probandin mit Normalstimme angewandt worden. Die Testperson erhöhte monoton die Grundfrequenz der Schwingung von 200 auf 500 Hz innerhalb von 270 ms.

Ergebnisse

Die Ergebnisse der Modelanpassung an reale Stimmlippenschwingungen sind in den Abbildungen 1 [Abb. 1] und 2 [Abb. 2] zu sehen. Weil die Oszillationen der rechten und linken Stimmlippenseite bei einer Normalstimme symmetrisch sind, wird im folgenden exemplarisch nur die Schwingungen der linken Seite betrachtet [4]. Die Grundfrequenz der theoretischen Trajektorie stimmt nach der Anpassung mit der experimentellen Trajektorie überein, wie Abbildung 1a [Abb. 1] zeigt. In Abbildung 1b [Abb. 1] sind die berechneten Modelparameter m(t) und k(t) abgebildet. Während die Masse m(t) mit steigender Grundfrequenz abnimmt, erhöht sich der Muskeltonus k(t). Der errechnete subglottale Druck P s (t), dargestellt in Abbildung 1c [Abb. 1], fluktuiert um seinen gleitenden Mittelwert, der mit steigender Frequenz zunimmt. Die Übereinstimmung zwischen der theoretischen und experimentellen Trajektorie wird in Abbildung 2 [Abb. 2] sichtbar. Die generelle Form der experimentellen Kurve, bestehend aus Oszillationsamplitude und Frequenz, kann nachgebildet werden. Der Korrelationskoeffizient (0,91) bestätigt die Ähnlichkeit der beiden Trajektorien. Dies zeigt sich auch bei der Betrachtung eines kürzeren Zeitausschnitts, siehe Abbildung 2 unten [Abb. 2].

Diskussion

Ein nicht-stationärer Phonationsprozess enthält mehr Informationen über die Stimmlippen als eine stationäre Phonation. Dies kann für eine Diagnostik von Stimmstörungen eingesetzt werden. So zeigt sich an den experimentellen Trajektorien der Stimmgrundfrequenzerhöhung eine Abnahme der Oszillationsamplituden. Gleichzeitig verringert sich die Glottisverschlusszeit, bis schließlich keine Kollision zwischen der rechten und linken Stimmlippe bei hohen Frequenzen auftritt. Die physiologischen Änderungen der Stimmlippen während einer Stimmgrundfrequenzerhöhung sind wesentlich komplexer und näher an dem alltäglichen Stimmgebrauch als bei einer stationären Phonation. Die durch Inversion angepassten Modellparameter m(t), k(t) und P s (t) erlauben eine Schätzung physiologischer Größen der Stimmgebung, die einer direkten Messung nicht zugänglich sind. Die Parameter, die durch das Inversionsschema gefunden wurden, liegen innerhalb physiologisch relevanter Bereiche und stellen Informationen über die Einstellvorgänge der Stimmlippen bereit. Die Modellierung von nicht-stationären Phonationen für pathologische Stimmen wird in künftigen Studien vorgenommen.


Literatur

1.
Hoppe U, Rosanowski F, Lohscheller J, Schuster M, Eysholdt U, Endoscopic and acoustical investigation of a glissando. Hamburg: Advances in Quantitative Laryngoscopy AQL; 2003
2.
Lohscheller J, Dynamics of the Laryngectomee Substitute Voice Production. Dissertation, Shaker-Verlag; 2003
3.
Ishizaka K, Flanagan JL. Synthesis of voiced sounds from a two-mass model of the vocal cords. Bell. Syst. Techn. J. 1972; 51:1233-68.
4.
Döllinger M, Hopper u, Hettlich F, Lohscheller F, Schubert S, Eysholdt U, Vibration Parameter Extraction From Endoscopic Image Series of the Vocal Folds. IEEE Trans. Biomed. Eng. 2002; 49(8):773-781