gms | German Medical Science

100 Jahre Phoniatrie in Deutschland
22. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie
24. Kongress der Union Europäischer Phoniater

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

16. bis 18.09.2005, Berlin

Konturplots von Stimmlippenbewegungen – Methodentransfer in die Klinik

Contoure plots of the motion of the vocal folds – a transfer of methods into the clinic

Vortrag

  • corresponding author presenting/speaker Jörg Lohscheller - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Hikmet Toy - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Raphael Schwarz - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Tobias Wurzbacher - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Ulrich Eysholdt - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland

100 Jahre Phoniatrie in Deutschland. 22. Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie, 24. Kongress der Union der Europäischen Phoniater. Berlin, 16.-18.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05dgppV54

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/dgpp2005/05dgpp088.shtml

Veröffentlicht: 15. September 2005

© 2005 Lohscheller et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Zusammenfassung

Im letzten Jahrzehnt wurde die Technik der Hochgeschwindigkeitsaufnahmen von Stimmlippenbewegungen bis an die Schwelle der Klinikreife entwickelt. Der Transfer der dort gewonnenen pathophysiologischen Erkenntnisse in klinische Aussagen ist bisher noch nicht zufrieden stellend gelungen. Grund dafür ist u.a., dass die prinzipiell zur Verfügung stehenden Auswerteverfahren weder hinreichend validiert noch kommerziell erhältlich sind. Dies steht der umfassenden Verbreitung der an sich absolut zeitgemäßen und zu fordernden Objektivierung entgegen, die die klinisch relevanten Parameter identifiziert, visualisiert, quantifiziert und bewertet. Wir stellen folgendes Analysewerkzeug vor: Es extrahiert nach der morphologischen Zuordnung die Stimmlippenbewegung, und zwar unabhängig vom Phonationsmodus (z.B. Einsatz, gehaltene Phonation, Glissando, andere). Die Visualisierung erfolgt mittels Kontur-Plots: Sie sind die zweidimensionale Darstellung des vollständigen Schwingungsablaufes beider Stimmlippen über die Zeit. Diese Kontur-Plots erlauben, gezielt Trajektorien an beliebig definierten, fixen Stimmlippenpositionen festzulegen. Die aus der Bildverarbeitung ermittelten Trajektorien sind die Grundlage weitergehender quantitativer Analysen des Schwingungsverhaltens sowohl für weitere pathophysiologische Grundlagenbetrachtungen als auch für die klinische Anwendung.


Text

Einleitung

Im letzten Jahrzehnt wurde die Technik der Hochgeschwindigkeitsaufnahmen von Stimmlippenbewegungen bis an die Schwelle der Klinikreife entwickelt [1], [2]. Mit Hilfe der Hochgeschwindigkeitstechnik (HG-Technik) können Bewegung der Stimmlippen mit hoher zeitlichen Auflösung während der Phonation aufgezeichnet werden. Untersuchungen belegen in einer Reihe von Fallstudien, dass unterschiedliche laryngealer Krankheitsbilder mit der HG-Technik erfasst werden können [3], [4]. Der Transfer der dort gewonnenen pathophysiologischen Erkenntnisse in klinische Aussagen ist bisher jedoch nur ansatzweise gelungen.

In den letzten Jahren wurden eine Reihe automatischer Bildverarbeitungsverfahren entwickelt, die eine quantitative Beschreibung von Stimmlippenschwingungen aus HG-Sequenzen zu Ziel haben [5], [6]. Die Anwendbarkeit vollautomatischer Verfahren ist jedoch vorwiegend auf Sequenzen mit gleichbleibend hoher Bildqualität beschränkt und ist daher für Reihenuntersuchungen in medizinischen Studien oder für die Verwendung in einer klinischen Sprechstunde nicht geeignet. Zudem sind die prinzipiell zur Verfügung stehenden Auswerteverfahren nicht hinreichend validiert. Dies steht der umfassenden Verbreitung der an sich absolut zeitgemäßen und zu fordernden Objektivierung entgegen, welche klinisch relevanten Parameter identifiziert, visualisiert, quantifiziert und bewertet.

Wir stellen ein Analysewerkzeug, welches die Dynamik der Stimmlippenbewegungen erfasst und in einer zweidimensionalen Darstellung visualisiert. Die Visualisierungstechnik stellt das gesamte Schwingungsmuster beider Stimmlippen in einem Bild dar und ermöglicht eine gezielte und schnelle Bewertung der Stimmlippenaufnahmen.

Methode

Die Analyse von Stimmlippenbewegung aus HG-Sequenzen erfordert zunächst die Segmentierung der Stimmlippen aus den HG-Sequenzen. Dazu wurde ein semi-automatisches Verfahren entwickelt, dass durch Zuhilfenahme minimale Benutzerinteraktion in der Lage ist selbst Filmsequenzen mit geringer und veränderlicher Bildqualität auszuwerten. In der klinischen Anwendung ist aus dem gesamten Datensatz lediglich die interessierende Teilsequenz sowie die Wahl geeigneter Schwellwerte erforderlich. Die eigentliche Segmentierung der HG-Sequenz verläuft anschließend vollautomatisch. Der Algorithmus basiert auf einem Region-Growing-Verfahren und erreicht einen mittleren Datendurchsatz von 20 Einzelbildern pro Sekunde. So können selbst lange Filmsequenz mit bis zu 4.000 Einzelbildern in hinreichend kurzer Zeit (< 4 Minuten) ausgewertet werden.

Eine Visualisierung der Schwingungsmuster hat zum Ziel die nur schwer zu interpretierenden segmentierten Filmsequenzen so aufzubereiten, dass eine umgehende Beurteilung des gesamten Schwingungsmusters beider Stimmlippen möglich ist. Dies wird ermöglicht, indem die extrahierten Stimmlippenbewegungen in eine 2D-Matrix transformiert und dort durch eine anschließende Farbkodierung als sogenanntes Phonovibrogramm (PVG) dargestellt werden. Das Phonovibrogramm kann als konsequente Weiterentwicklung der Visualisierung mittels Konturplots betrachtet werden und ermöglicht eine Beschreibung der Stimmlippenschwingungen im gesamten Bereich zwischen vorderer und hintere Kommissur [7]. Die Berechnung von Phonovibrogrammen aus den vorher segmentierten HG-Sequenzen ist in Abbildung 1 [Abb. 1] gezeigt.

Von ventral nach dorsal werden zunächst die Abstände beider Stimmlippenkanten zu der glottalen Achse berechnet und entsprechend des linken Teils der Abbildung 1 [Abb. 1] als Einträge eines Spaltenvektor definiert. Aus allen Einzelbildern einer HG-Sequenz werden anschließend die so berechneten Spaltenvektoren zu einer Matrix zusammengefasst (rechts). Eine Visualisierung der Matrix wird erreicht, indem die reellwertigen Matrixeinträge farbkodiert werden. Die Intensität der Farbkodierung spiegelt hierbei den Betragswert wieder während das Vorzeichen (+/-) durch die Farben rot und blau kodiert wird.

Ergebnisse

Die Visualisierung mittels Phonovibrogrammen ermöglicht eine umfassende Beschreibung von Schwingungseigenschaften von Stimmlippen in einem Bild. Abbildung 2 (oben) [Abb. 2] zeigt das Ergebnis der PVG-Visualisierung einer segmentierten HG-Sequenz bestehend aus 170 Einzelbildern. In dem PVG ist über 10 Schwingungszyklen eine sich regelmäßig wiederholende V-förmige Struktur zu erkennen. Die Stimmlippenschwingungen breiten sich linear von posterior nach anterior aus und bilden sich in entgegengesetzter Richtung zurück. Die schwarzen Bildbereiche kennzeichnen den Verschluss der Stimmlippen und lassen den verlängerten Glottisschluss vor allem naher der vorderen Kommissur erkennen.

Das Phonovibrogramm ermöglicht ferner, an frei wählbaren Positionen DT entlang der Stimmlippenachse Trajektorien zu extrahieren, welche die lateralen Bewegungen der linken und rechten Stimmlippe an genau einer Position auf der glottalen Achse beschreiben. Der untere Graph in Abbildung 2 [Abb. 2] zeigt exemplarisch zwei Trajektorien (links/recht - oben/unten) die aus dem dazugehörigen PVG bestimmt wurden. Die Auslenkungen der Kurve korrespondieren mit der Farbintensität im PVG und zeigen das zyklische und nahezu symmetrische Schwingungsmuster beider Stimmlippen an medialer Position. In Kombination mit dem Phonovibrogramm können so selbst kleine Unsymmetrien von Stimmlippenschwingungen sichtbar machen. Insbesondere lassen sich Veränderungen der Trajektorien in Abhängigkeit der Lage auf der glottalen Achse studieren.

Untersuchungen an verschiedenen Krankheitsbildern (Rekurrensparese, funktionelle u. organisch bedingte Dysphonien) haben gezeigt, dass in Abhängigkeit der Pathologien charakteristische Muster innerhalb der Phonovibrogramme entstehen.

Diskussion

Die alleinige visuelle Bewertung von Hochgeschwindigkeitsaufnahmen gestattet keine adäquate Analyse von Stimmlippenschwingungen. Um das Potential der Hochgeschwindigkeitstechnik für die klinische Nutzung zu erschließen, haben wir ein Verfahren entwickelt, welches eine Bewertung der Stimmlippenbewegungen aus den HG-Sequenzen ermöglicht. Erst die erzielte Reduzierung des zeitlichen Rechenaufwandes ermöglicht die Anwendbarkeit der HG-Technik in medizinischen Studien oder innerhalb der klinischen Sprechstunde.

Die Visualisierung mittels Phonovibrogramme bildet die Grundlage weitergehender quantitativer Analysen des Schwingungsverhaltens von Stimmlippen sowohl für weitere pathophysiologische Grundlagenbetrachtungen als auch für die klinische Anwendung.


Literatur

1.
Hess MM, Herzel H, Koester O, et al.: Endoscopic imaging of vocal cord vibrations. Digital high-speed recording with various systems. HNO 1996, 44(12):685-693.
2.
Cutler JL, Cleveland T: The clinical usefulness of laryngeal videostroboscopy and the role of high-speed cinematography in laryngeal evaluation. Curr Opin Otolaryngol Head Neck Surg 2002, 10(6):462-466.
3.
Eysholdt U, Rosanowski F, Hoppe U: Vocal fold vibration irregularities caused by different types of laryngeal asymmetry. Eur Arch Otorhinolaryngol 2003, 260(8):412-417.
4.
Wittenberg T, Moser M, Tigges M, Eysholdt U. Recording, processing and analysis of digital high-speed sequences in glottography. Machine Vision and Application 1995, 8(12):399-404.
5.
Hertegard S, Larsson H, Wittenberg T High-speed imaging: applications and development. Logoped Phoniatr Vocol 2003, 28(3):133-139.
6.
Yan Y, Ahmad K, Kundak M, Bless D: Analysis of vocal-fold vibrations from high-speed laryngeal images using a Hilbert transform based methodology. J Voice 2005; 19(2):161-75.
7.
Neubauer J, Mergell P, Eysholdt U, Herzel H Spatio-temporal analysis of irregular vocal fold oscillations: biphonation due to desynchronization of spatial modes. J Acoust Soc Am. 2001;110(6):3179-92.