gms | German Medical Science

100 Jahre Phoniatrie in Deutschland
22. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie
24. Kongress der Union Europäischer Phoniater

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

16. bis 18.09.2005, Berlin

Quantitative Auswertung und Interpretation von Stimmlippenschwingungen bei nicht-stationärem Phonationsparadigma

Quantitative analysis and interpretation of vocal fold oscillations for non-stationary phonation paradigm

Vortrag

  • corresponding author presenting/speaker Tobias Wurzbacher - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Raphael Schwarz - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Hikmet Toy - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Ulrich Eysholdt - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Jörg Lohscheller - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland

100 Jahre Phoniatrie in Deutschland. 22. Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie, 24. Kongress der Union der Europäischen Phoniater. Berlin, 16.-18.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05dgppV53

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/dgpp2005/05dgpp064.shtml

Veröffentlicht: 15. September 2005

© 2005 Wurzbacher et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Zusammenfassung

Bei der klinischen Diagnostik von Stimmstörungen wird die Stimmlippendynamik mit Hilfe von endoskopischen Bildgebungsverfahren untersucht. Üblicherweise findet deren Beurteilung auf Basis einer stationären Phonation statt, d.h. bei konstanter Grundfrequenz und Intensität eines gehaltenen Vokals. Ein Nachteil dieses Untersuchungsparadigma ist, dass nur die pathologischen Anteile einer Stimmstörung beobachtbar sind, die sich bei der untersuchten Grundfrequenz ausbilden. In dieser Arbeit wurde untersucht ob ein nicht-stationäres Phonationsparadigma eine umfassendere Befundung von Stimmstörungen ermöglicht. Hierzu wurden während der aktiven Änderung der Tonhöhe, die Stimmlippenschwingungen mittels der digitalen Hochgeschwindigkeitsglottographie aufgezeichnet. Die quantitative Auswertung dieser Schwingungen findet durch ein biomechanisches Modell der Stimmlippen statt. Ein Optimierungsalgorithmus passt dabei die Parameter des Modells automatisch so an, dass die Modelldynamik die Stimmlippenbewegungen reproduzieren. Die Größe der dabei ermittelten Modellparameter geben Auskunft über Symmetrie und Regularität der Stimmlippenschwingungen. Das Verfahren wurde auf je acht Stimmgesunde und –kranke angewandt. Die aus dem Modell ermittelten zeitabhängigen Größen der Modellparameter ermöglichen eine Klassifizierung pathologischer und gesunder Stimmen. In einer weitergehenden Studie soll untersucht werden inwieweit die Parameter auch eine spezifische Unterscheidung von Dysphonien gestatten.


Text

Einleitung

Seit dem Beginn der klinischen Laryngoskopie im 19. Jahrhundert werden Patienten aufgefordert, einen Ton zu singen (stationär gehaltene Phonation, SP). Dieses Untersuchungsparadigma hat sich seit 1960 auch für die Stroboskopie bewährt. Nachteil des SP-Paradigmas ist die Konstanz der Parameter „subglottaler Druck" und „muskuläre Spannung", die nicht variiert werden. Es kann somit sein, dass ein dysphoner Patient in einer Situation mit „normaler Stimme" untersucht wird.

Moderne Untersuchungsmethoden wie die Hochgeschwindigkeitsglottographie (HGG) gestatten eine Visualisierung der Stimmlippenbewegungen auch unter dynamischen Untersuchungsbedingungen [1]. Die hier vorgelegten Ergebnisse stammen aus einer Untersuchungsreihe, bei der dem konventionellen SP-Paradigma ein nicht-stationäres Phonationsparadigma gegenübergestellt wird. Eine Grundfrequenzerhöhung (GFE) der Stimme während der Untersuchung wird als Paradigma verwendet [2].

Die Echtzeitbildserien der HGG werden durch ein adaptionsfähiges biomechanisches Modell der Stimmlippen ausgewertet. Dabei werden die Modellparameter durch einen Optimierungsalgorithmus so eingestellt, dass die beobachteten Schwingungen nachgebildet werden. Diese Vorgehensweise hat sich in früheren Untersuchungen bereits bewährt [3], [4]. Die Größe der zeitabhängigen Modellparameter gibt Auskunft über die links/rechts Asymmetrie der Stimmlippenschwingungen.

Methode

Es wurden 20 Probanden untersucht: Zehn stimmgesunde Frauen (20;4 ± 3;8 Durchschnittsalter ± Standardabweichung) und zehn Patienten (9w, 1m; 39;2 ± 11;2) mit verschiedenen Stimmstörungen (6x funktionelle Dysphonie, 1x Reinke Ödem nach Operation, 1x Stimmlippenpolyp, 2x einseitige Rekurrensparese). Für jeden Probanden wurden zwei HGG-Aufnahmen angefertigt, je eine bei SP- und GFE-Phonation.

Aus den Aufnahmen wurde die Bewegung der rechten und linken Stimmlippenkante im medialen Glottisdrittel durch eine Bildverarbeitung extrahiert [5]. Diese Bewegungskurven wurden für eine quantitative Analyse mit einem Zwei-Massen Modell der Stimmlippen nachgebildet [3], [4]. Die Einführung von zeitvarianten Modellparametern ermöglichte die Modellierung von nicht-stationären GFE Schwingungen. Die zeitabhängigen Modellparameter Federspannung, Masse und Ruhepositionen der Massen der linken und rechten Seite des Modells sowie der subglottale Druck wurden durch ein Optimierungsverfahren so eingestellt, dass die Modelldynamik die beobachteten Bewegungskurven reproduzieren. Zur Optimierung wurden die beobachtete Stimmlippenschwingung in kurze Blöcke einer Periodenlänge (vom Maximum zum Maximum) unterteilt. Dann wurden Block für Block die Modellparameter optimiert, bis die gesamte Bewegungskurve mit dem Modell nachgebildet war.

Gesunde Stimmen zeichnen sich durch eine Symmetrie zwischen linker und rechter Stimmlippenschwingung aus [3]. Für eine quantitative Bewertung sind die Quotienten von linker zu rechter Seite der Modellparameter von Interesse, weil diese Daten den Grad an Asymmetrie im angepassten Modell widerspiegeln. So beschreibt der Quotient Q(t) das Verhältnis der Federsteifigkeiten der beiden Modellseiten zueinander. Der Quotient R(t) beschreibt das Verhältnis der Ruhepositionen der Modellmassen von linker und rechter Seite. Die Modellasymmetrien können in einer zweidimensionalen Kurve C(t) = C(Q(t),R(t)) visualisiert werden. Asymmetrie bedeutet in dieser Darstellung Abweichungen vom Punkt (1,1), absolute Symmetrie ist im Punkt (1,1) dieser Q(t)-R(t) Ebene lokalisiert. Drei verschiedene Maße werden zur Bestimmung des Grades an Asymmetrie herangezogen:

1) Der Abstand des Schwerpunktes der Kurve C(t) zum Symmetriepunkt (1,1).

2) Die Fläche einer Ellipse, die die Kurve C(t) umfasst. Dabei werden die Achsenlängen der Ellipsen so gewählt, dass 95% der Punkte von C(t) innerhalb der Achsen liegen.

3) Die Wurzel aus der Summe der quadrierten Hauptachsenlängen.

Die beiden zuletzt aufgeführten Merkmale können als Maß für die Schwingungsstabilität über der Zeit betrachtet werden. Die Kombination aus den drei Kriterien wird als Rating für den Grad der Asymmetrie definiert. Das Rating dient als Grundlage für die Klassifizierung zwischen gesunden und pathologischen Fällen. Während bei der zeitlich variablen GFE Phonation ein Kurvenverlauf entsteht, entartet die Kurve im Fall der stationären Phonation zu einem einzigen Punkt in der Q(t)-R(t) Ebene. Somit kann nur die Distanz dieses Punktes zum Symmetriepunkt (1,1) als Asymmetriemaß angegeben werden.

Ergebnisse

Für einen gesunden Fall (links) und einen pathologischen Fall (funktionelle Dysphonie, rechts) ist die Q(t)-R(t) Ebene für die GFE-Phonation in Abbildung 1 [Abb. 1] dargestellt. Neben der Kurve C(t) sind der Schwerpunktsabstand und die Ellipse eingezeichnet. Die Normalstimme zeichnet sich gegenüber dem pathologischen Fall dadurch aus, dass die Kurve C(t) weniger Fläche einnimmt und geringere Variationen in der Symmetrieebene aufweist. Dies bildet sich in den unterschiedlich großen Flächen und verschiedenen mittleren Radien der umgebenden Ellipsen ab. Der Schwerpunktsabstand ist in beiden Fällen mit 0,16 gleich groß.

In Abbildung 2a) [Abb. 2] ist der Abstand zum Symmetriepunkt für die SP Phonation abgebildet. Dieser Abstand ist für die Normalstimmen und Dysphonien in derselben Größenordnung mit Ausnahme der Patienten ID 19 und ID 20, die durch vergrößerte Werte auffallen. Mehr als die Hälfte der Normalstimmen übersteigt den Wert des Patienten ID 13. Demgegenüber ist in Abbildung 2b) [Abb. 2] das Rating der GFE Phonation für die 20 Probanden abgebildet. Alle Stimmgesunden weisen ein Rating von unter 0,1 auf, während das Rating der pathologischen Fälle über 0,1 liegt. Eine automatische Unterscheidung zwischen den beiden Gruppen wird hierdurch möglich.

Diskussion

Im Rahmen einer konventionellen stationären Stimmuntersuchung werden die Schwingungseigenschaften der Stimmlippen bei nur einer Grundfrequenz untersucht, d.h. es sind nur diejenigen pathologischen Anteile einer Stimmstörung beobachtbar, die sich bei der untersuchten Grundfrequenz ausbilden. Phoniert der Patient in einer Tonlage, in der sich seine Stimmstörungen nicht oder nur unzureichend auftritt, wird das Ausmaß der Störung nicht im vollen Umfang aufgedeckt. Demgegenüber wird bei dem GFE Paradigma die Schwingungscharakteristik der Stimmlippen in dem überstrichenen Frequenzbereich innerhalb einer Untersuchung überprüft. Typischerweise deckt der Patient bei dem GFE Paradigma die Tonhöhen ab, die er auch im alltäglichen Stimmgebrauch nutzt. Somit werden auch die Stimmstörungen erfasst, die zu der größten Beeinträchtigung der stimmbezogenen Lebensqualität führen. Unter Zuhilfenahme der HGG Untersuchungstechnik können die Stimmstörungen am Entstehungsort, also auf Stimmlippenebene, aufgezeichnet werden. Die Quantifizierung und Klassifizierung der so gewonnenen Stimmlippenschwingungen kann durch den in dieser Arbeit entwickelten modellbasierten Ansatz erfolgen. Eine Differenzierung zwischen gesunden und pathologischen Stimmen ist im Fall der stationären Phonation nicht möglich, jedoch können Normalstimmen von Dysphonien im Falle der nicht-stationären GFE Phonation automatisch unterschieden werden.


Literatur

1.
Wittenberg T, Moser M, Tigges M, Eysholdt U, "Recording, processing and analysis of digital highspeed sequences in glottography", Mach. Vision. Appl. 1995; 8:399-404.
2.
Hoppe U, Rosanowski F, Döllinger M, Lohscheller J, Eysholdt U, "Visualization of the laryngeal motorics during a glissando", J. Voice. 2003; 17:370-376.
3.
Döllinger M, Hoppe U, Hettlich F, Lohscheller F, Schubert S, Eysholdt U, "Vibration Parameter Extraction From Endoscopic Image Series of the Vocal Folds", IEEE Trans. Biomed. Eng. 2002; 49(8):773-781.
4.
Schwarz R, Hoppe U, Schuster M, Wurzbacher T, Eysholdt U, Lohscheller J, "Computation of driving parameters from endoscopic digital high-speed images in unliateral vocal fold paralysis", IEEE Trans. Biomed. Eng. 2005; im Druck
5.
Lohscheller J, Döllinger M, Schuster M, Schwarz R, Eysholdt R, Hoppe U, "Quantitative investigation of the vibration pattern of the substitute voice generator", IEEE Trans. Biomed. Eng. 2004; 51:1394-1400.