gms | German Medical Science

100 Jahre Phoniatrie in Deutschland
22. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie
24. Kongress der Union Europäischer Phoniater

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

16. bis 18.09.2005, Berlin

Tracheoösophageale Ersatzstimme: Quantifizierung irregulärer Schwingungsmuster

Tracheo-esophageal supplementary phonation: quantification of irregular vibrational patterns

Vortrag

  • corresponding author presenting/speaker Raphael Schwarz - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Tobias Wurzbacher - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Maria Schuster - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Ulrich Eysholdt - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Joerg Lohscheller - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland

100 Jahre Phoniatrie in Deutschland. 22. Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie, 24. Kongress der Union der Europäischen Phoniater. Berlin, 16.-18.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05dgppV55

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/meetings/dgpp2005/05dgpp063.shtml

Published: September 15, 2005

© 2005 Schwarz et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Zusammenfassung

Bei Laryngektomierten mit Stimmventilprothesen ist die Qualität der Ersatzstimme von der Schwingungscharakteristik des pharyngo-ösophagealen Segments (PE-Segment) abhängig. Mit digitalen Hochgeschwindigkeitsaufnahmen (HG-Aufnahmen) kann die Bewegung des PE-Segments gemessen werden. Neben der Morphologie beeinflusst die Dichte des Gewebes und die Spannungsverteilung entlang des Umfangs des PE-Segments maßgeblich die Schwingungscharakteristik. Diese Parameter sind einer direkten Messung nicht zugänglich. Deshalb wurde ein Verfahren entwickelt, bei dem die Gewebeeigenschaften des PE-Segments mit einem biomechanischen Modell nachgebildet werden. Dies wird mit Hilfe einer Inversionsprozedur ermöglicht, welche die Modelldynamik an die Bewegungen des PE-Segments anpasst. Die Inversionsprozedur unterteilt sich in eine Modellinitialisierung durch Auswertung der HG-Messung und einer Optimierung der Modellparameter. Die optimierten Parameterwerte beschreiben qualitativ die Gewebeeigenschaften des PE-Segments und ermöglichen neben der Visualisierung mit Hilfe der Bildverarbeitung eine Quantifizierung der irregulären Schwingungsmuster der tracheoösophagealen Ersatzstimme. In einer ersten Studie wird das Verfahren auf drei HG-Aufnahmen angewendet. Die Ergebnisse der optimierten Parameter erlauben eine Quantifizierung der irregulären Dynamik des PE-Segments. In weiteren Arbeiten soll der Zusammenhang zwischen den optimierten Modellparametern und der Qualität der Ersatzstimme untersucht werden.


Text

Einleitung

Bei Laryngektomierten mit Stimmventilprothesen ist die Qualität der Ersatzstimme von der Schwingungscharakteristik des pharyngo-ösophagealen Segments (PE-Segment) abhängig [1]. Neben der Morphologie beeinflusst die Dichte des Gewebes und die Spannungsverteilung entlang des Umfangs des PE-Segments maßgeblich die Schwingungscharakteristik und somit die Stimmqualität. Diese Parameter sind jedoch einer direkten Messung nicht zugänglich, lediglich die Bewegung des PE-Segments kann mit digitalen Hochgeschwindigkeitsaufnahmen (HG-Aufnahmen) gemessen werden [2]. Es wurde ein Verfahren entwickelt, bei dem Morphologie und Gewebeparameter des PE-Segments mit einem biomechanischen Modell nachgebildet werden [3]. Mit Hilfe einer Inversionsprozedur werden die Modellparameter so bestimmt, dass die Modelldynamik an die Bewegung des PE-Segments angepasst wird. Die somit erzielten Werte der Modellparameter beschreiben qualitativ die Gewebeeigenschaften des PE-Segments. Die entwickelte Methode wird erstmalig auf drei HG-Aufnahmen angewendet.

Methoden

Von drei laryngektomierten männlichen Patienten, im Alter von 65 Jahren, wurden HG-Aufnahmen des PE-Segments während der Phonation erstellt. Die Abtastrate der Kamera beträgt dabei 4000 Bilder pro Sekunde bei einer Auflösung von 256x256 Pixel. Mit einer Bildverarbeitung wurde aus den Aufnahmen die Bewegung des PE-Segments für 350 aufeinander folgende Einzelbilder extrahiert [4], [5]. Das Ergebnis beschreibt die Lage und Form des PE-Segments zu den betrachteten Zeitpunkten. Abbildung 1(a) [Abb. 1] zeigt das Ergebnis der Bildverarbeitung für ein Einzelbild aus einer HG-Aufnahme. Die Umrandete schraffierte Fläche stellt die Öffnung des PE-Segments zu dem in diesem Einzelbild dargestellten Zeitpunkt dar.

Zur Modellierung des PE-Segments dient ein Mehr-Massen-Modell (MMM) [3]. Dieses besteht aus mehrfach gekoppelten Masse-Feder-Elementen. Diese Elemente werden im MMM so angeordnet, dass sie eine geschlossene Kontur bilden, wie in Abbildung 1(b) [Abb. 1] dargestellt. Die dabei umschlossene Fläche soll zu jedem Zeitpunkt Lage und Form der aus den HG-Aufnahmen extrahierten Öffnungsflächen des PE-Segments nachbilden.

Zur Anpassung der Modelldynamik an die Bewegung des PE-Segments werden Optimierungsparameter definiert, mit welchen die Standardwerte der Modellparameter skaliert werden. Hierzu wurde eine Optimierungsprozedur entwickelt, welche die Werte der Optimierungsparameter für eine möglichst gute Anpassung der Modelldynamik an das Schwingungsmuster des PE-Segments berechnet. Der zeitliche Verlauf der Öffnungsfläche des PE-Segments (Flächenfunktion) bzw. der zeitliche Verlauf der vom MMM eingeschlossenen Fläche bestimmt den Verlauf des Optimierungsprozesses. Die Güte der Anpassung wird durch die Differenz aus den Flächenfunktionen von PE-Segment und Modell bestimmt.

Ergebnisse und Diskussion

Durch Einblendung der Modellschwingung in die HG-Aufnahmen vom schwingenden PE-Segment kann überprüft werden, ob der zeitlich Verlauf der Kontur des PE-Segments vom MMM wiedergegeben wird. Dies ist für alle drei Aufnahmen in hinreichend guter Qualität der Fall. Damit konnte gezeigt werden, dass es prinzipiell möglich ist, die irregulären Schwingungen des PE-Segments mit einem biomechanischen Modell des PE-Segments in Kombination mit der hier vorgestellten Inversionsprozedur nachzubilden. Aus dieser Betrachtung lässt sich jedoch kein Maß zur Beurteilung des Anpassungsergebnisses ableiten. Hierfür wird die Flächenfunktion des PE-Segments mit der des Modells verglichen. In Abbildung 2 [Abb. 2] sind die mit Hilfe einer Bildverarbeitung aus den HG-Aufnahmen extrahierten Flächenfunktionen des PE-Segments (gestrichelte Kurven) und die aus der Optimierungsprozedur resultierenden Flächenfunktionen des MMMs (durchgezogene Kurven) dargestellt. Für eine übersichtlichere Darstellung ist aus der 87,5 ms langen HG-Aufnahmen jeweils nur eine Zeitspanne von 50 ms gezeigt.

Für alle drei Aufnahmen konnte der Verlauf der Flächenfunktion gut nachgebildet werden. Das Model schwingt jeweils mit der gleichen Frequenz wie das PE-Segment. Als Korrelationen wurden 66,4%, 87,9% und 83,1% erreicht. Der relative Fehler zwischen der Flächenfunktion des PE-Segments und des Modells ergab sich jeweils zu 14,4%, 7,1% und 7,0%. In allen drei Fällen ist zu beobachten, dass der Verlauf der Flächenfunktion für das Modell unregelmäßiger verläuft , als der für das PE-Segment. Besonders Auffällig ist dabei die Variation der Amplituden der Flächenfunktion. Im Gegensatz dazu bleibt die minimale und maximale Öffnungsfläche je Schwingungszyklus beim PE-Segment nahezu konstant. Dies hat natürlich Auswirkungen auf die Korrelation und den relativen Fehler. Die Ursache für das unregelmäßige Schwingungsverhalten des Modells sind die aus der Optimierung resultierenden asymmetrischen Modellparameter in Kombination mit den Kopplungen und den nichtlinearen Eigenschaften innerhalb des Modells.

Die Ergebnisse der Inversionsprozedur erlauben eine Quantifizierung der irregulären Dynamik des PE-Segments. Die berechneten Sätze von Optimierungsparametern ermöglichen es, den zeitlichen Verlauf der Kontur der Öffnung des PE-Segments mit wenigen skalaren Größen zu beschreiben. Dieser Schritt erlaubt es, verschiedene Schwingungsmuster miteinander zu Vergleichen und zu Klassifizieren. Insbesondere eröffnet sich damit die Möglichkeit, eine Klassifizierung hinsichtlich der aus dem Schwingungsmuster resultierenden Qualität der Ersatzstimme zu entwickeln.


Literatur

1.
C. Van As, M. Tigges, F. Hilgers, U. Eysholdt, "Oesophageal Vibration in Voice Rehabilitation after Laryngectomy". Advances in Quantitative Laryngoscopy, Verlag Abt. Phoniatrie, 1997, 95-102.
2.
U. Eysholdt, M. Tigges, T. Wittenberg, U. Pröschel, "Direct Evaluation of High-Speed Recordings of Vocal Fold Vibrations". Folia Phoniatr. Logop, 1996, 48, 163-170.
3.
J. Lohscheller, M. Döllinger, R. Schwarz, U. Eysholdt, "Modeling of the Laryngectomee Substitute Voice", in C. Manfredi (Hrsg.): Models and Analysis of Vocal Emissions for Biomedical Applications, Verlag Firenze University Press, 2003, 19-22.
4.
J. Lohscheller, M. Döllinger, M. Schuster, U. Eysholdt, U. Hoppe, "The Laryngectomee Substitute Voice: Image Processing of Endoscopic Recordings by Fusion with Acoustic Signals", Meth. Inf. Med.,2003, 3, 277-281.
5.
J. Lohscheller, M. Schuster, U. Eysholdt, U. Hoppe, "Investigation of the tracheo-esophageal voice generating element by means of active contour models", Advances in Quantitative Laryngology, Voice and Speech Research, Hamburg: 2003.