gms | German Medical Science

20. Wissenschaftliche Jahrestagung der DGPP Deutsche Gesellschaft für Phoniatrie und Pädaudiologie

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

12. bis 14.09.2003, Rostock

Voll-quantitative Visualisierung und Analyse von Hochgeschwindigkeitsaufnahmen der Stimmlippenschwingungen

Vortrag

  • corresponding author Ulrich Hoppe - Abteilung für Phoniatrie und Pädaudiologie, Klinikum der Universität Erlangen-Nürnberg, Bohlenplatz 21, 91054 Erlangen, Tel.: 09131/8533815, Fax: 09131/8539272
  • Frank Rosanowski - Abteilung für Phoniatrie und Pädaudiologie, Klinikum der Universität Erlangen-Nürnberg, Bohlenplatz 21, 91054 Erlangen, Tel.: 09131/8533815, Fax: 09131/8539272
  • Jörg Lohscheller - Abteilung für Phoniatrie und Pädaudiologie, Klinikum der Universität Erlangen-Nürnberg, Bohlenplatz 21, 91054 Erlangen, Tel.: 09131/8533815, Fax: 09131/8539272
  • Maria Schuster - Abteilung für Phoniatrie und Pädaudiologie, Klinikum der Universität Erlangen-Nürnberg, Bohlenplatz 21, 91054 Erlangen, Tel.: 09131/8533815, Fax: 09131/8539272
  • Ulrich Eysholdt - Abteilung für Phoniatrie und Pädaudiologie, Klinikum der Universität Erlangen-Nürnberg, Bohlenplatz 21, 91054 Erlangen, Tel.: 09131/8533815, Fax: 09131/8539272

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 20. Wissenschaftliche Jahrestagung der DGPP. Rostock, 12.-14.09.2003. Düsseldorf, Köln: German Medical Science; 2003. DocV14

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/dgpp2003/03dgpp023.shtml

Veröffentlicht: 12. September 2003

© 2003 Hoppe et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Zusammenfassung

Zur Visualisierung von Hochgeschwindigkeitsaufnahmen wird in der Regel die Kymogrammdarstellung verwendet, bei der aus allen Einzelbildern eine Bildzeile extrahiert und durch Aneinanderreihen ein künstliches, funktionelles Bild erzeugt wird. Die Kymogrammdarstellung stellt eine Reduktion eines 3D-Datensatzes auf einen 2D-Datensatz unter Vernachlässigung räumlicher Unterschiede dar. Sie eignet sich daher gut zur Visualisierung von Schwingungen, wenn keine lokalen Schwingungsunterschiede auftreten. Zur Beurteilung von pathologischen Stimmlippenschwingungen ist diese Art der Darstellung oft ungeeignet, da z. B. anterior-posterior-Schwingungsmoden gerade ein wesentlicher Teil des Störungsbildes sind. In diesem Beitrag wird eine Methode beschrieben, wie diese lokalen Schwingungsunterschiede visualisiert und quantifiziert werden können. Bei 10 weiblichen Patienten im Alter von 18 bis 25 Jahren mit normaler Stimmfunktion wurden digitale Hochgeschwindigkeitsvideos der Stimmlippenschwingungen während der Phonation aufgenommen. Für alle Aufnahmen wurden die Schwingungscharakteristika der lokalen Stimmlippenschwingungen. dargestellt und analysiert. Bereits bei normaler Stimmfunktion treten lokale Unterschiede der Stimmlippenschwingungen auf. Diese Unterschiede können mit den bisher üblichen Verfahren nicht visualisiert werden. Mit der hier vorgestellten Methode ist nicht nur eine Visualisierung, sondern auch eine Quantifizierung der lokalen Schwingungsunterschiede und somit eine feinere Klassifikation des Störungsbildes möglich.


Text

Einleitung

Die endoskopische Aufnahme digitaler Hochgeschwindigkeitsvideos von Stimmlippenschwingungen erlaubt die Registrierung des Phonationsvorganges in Echtzeit. Somit können die zeitlichen Eigenschaften der Phonation wie z.B. Dauer des Einschwingvorganges, der Offen- oder Schlussphase quantifiziert werden. Bei Aufnahmegeschwindigkeiten von 4000 Bildern pro Sekunde liegt der absolute Fehler bei 0.25 ms. Die Quantifizierung räumlicher Eigenschaften wie Stimmlippenlänge, und Schwingungsamplituden gelingt jedoch nur relativ. Durch den Einsatz von Laser-Projektionssystemen [1], [2] können die Aufnahmen jedoch kalibriert und somit voll quantitativ ausgewertet werden. Damit diese zusätzliche Information jedoch genutzt werden kann, müssen geeignete Visualisierungstechniken eingesetzt werden.

Die Zeitlupendarstellung solcher Hochgeschwindigkeitsvideos ist für klinische Zwecke ungeeignet, weil sie einerseits sehr zeitaufwendig ist und andererseits nur eine grobe Beurteilung erlaubt [3]. Zur Visualisierung dieser Hochgeschwindigkeitsaufnahmen wird in der Regel die Kymogrammdarstellung verwendet, bei der aus allen Einzelbildern eine Bildzeile extrahiert und durch Aneinanderreihen ein künstliches, funktionelles Bild erzeugt, das eine Abschätzung des Schwingungsverlaufs ermöglicht. Die Kymogrammdarstellung stellt eine Reduktion eines 3D-Datensatzes auf einen 2D-Datensatz unter Vernachlässigung räumlicher Unterschiede dar. Sie eignet sich daher gut zur Visualiserung von Schwingungen, wenn keine lokalen Schwingungsunterschiede auftreten.

Zur Beurteilung von pathologischen Stimmlippenschwingungen ist diese Art der Darstellung oft nicht ausreichend, da lokal unterschiedliche Schwingungsmuster (z. B. anterior-posterior-Schwingungsmoden) gerade ein wesentlicher Teil des Störungsbildes sind [4]. In diesem Beitrag wird eine Methode beschrieben, mit der auch lokale Schwingungsunterschiede visualisert und quantifiziert werden können.

Methoden

Bei 10 weiblichen Patienten im Alter von 18 bis 25 Jahren mit normaler Stimmfunktion wurden digitale Hochgeschwindigkeitsvideos der Stimmlippenschwingungen während der Phonation mit einer Aufnahmerate von 3704 Bildern zu je 128 x 64 Bildpunkten pro Sekunde (8 bit Grauwertkodierung) aufgenommen.

Aus diesen Aufnahmen wurden Kymogramme extrahiert und daraus mit einem bereits früher beschriebenen wissensbasierten Segmentierungsverfahren die Schwingungsverläufe an bis zu fünf unterschiedlichen Stellen entlang der Stimmlippen bestimmt. Außerdem wurden die im folgenden beschriebenen Konturdiagramme berechnet.

Konturdiagramme

In einer Sequenz von 64 Einzelbildern (17.28 Millisekunden) wurde in jedem Einzelbild die Glottis segmentiert. Mittels Regression wurde die Hauptachse der Glottis von anterior nach posterior bestimmt und der Abstand der rechten bzw. linken Stimmlippe von dieser Achse bestimmt. Für jedes Enzelbild wurde ein ‚Streifenbild' konstruiert, in dem von anterior nach posterior die Abstände der Stimmlippen voneinander als Grauwert (hell: großer Abstand, schwarz: Glottisschluss) kodiert wird. Durch Aneinanderreihen dieser Streifen wurde ein künstliches Bild erzeugt, das die Stimmlippenbewegungen während der Phonation darstellt. Dieses Verfahren entspricht der Reduktion eines dreidmensionalen Datensatzes (2-D-Bilder, Zeit) auf ein zweidimensionales funktionelles Bild. In Abbildung 1 [Abb. 1] ist die Erstellung eines Konturdiangramms schematisch für drei Einzelbilder einer Sequenz dargestellt. Ein komplettes Konturdiagramm für den Zeitraum von 17.8 ms ist in Abbildung 2 [Abb. 2] dargestellt.

Ergebnisse und Diskussion

Die Konturdiagramme ermöglichen die Visualisierung des Schwingungsvorganges in einem Bild. Bei dem in Abbildung 2 dargestellten Diagramm entspricht der untere Bildrand dem ventralen Bereich der Stimmlippen und der obere Bildrand dem dorsalen. Offensichtlich sind die maximalen Stimmlippenamplituden etwa auf der Hälfte von dorsal nach ventral zu finden und liegen zwischen 3 und 4.5 mm. Die Periodendauer der Schwingung ist ca. 5.3 ms entsprechend einer Grundfrequenz von190 Hz. Im medialen Bereich ist das Verhältnis zwischen der Dauer der offenen und geschlossenen Glottis etwa 50 % (entsprechend einem Geschlossen-Quotient von 0.5), nach dorsal hin erhöht sich die Dauer der offenen Glottis auf 100 %, nach ventral hin auf ca. 20 %.

Neben diesen globalen Parametern lassen sich jedoch auch lokale Parameter ableiten: So ist das Konturdiagramm zum Beispiel im dorsalen Bereich zu allen Zeitpunkten nicht schwarz. Der Abstand der Stimmlippen ist also niemals Null, was einer Glottisschlussinsuffizienz im dorsalen Bereich entspricht. Die Schlussinsuffizienz ist auf einen Bereich von ca. 1.5 - 2 mm beschränkt. Aus dem Bild geht ferner hervor, dass sich die Glottis von dorsal nach ventral öffnet und nahezu gleichzeitig schließt.

Schlussfolgerung

Die Untersuchung der Konturdiagramme lässt erkennen, dass bereits bei normaler Stimmfunktion lokale Unterschiede der Stimmlippenschwingungen auftreten. Diese Unterschiede können mit den bisher üblichen Verfahren nicht visualisiert werden. Mit der hier vorgestellten Methode ist nicht nur eine Visualisierung, sondern auch eine Quantifizierung der lokalen Schwingungsunterschiede und somit eine feinere Klassifikation des Störungsbildes möglich.


Literatur

1.
Schuberth S, Hoppe U, Döllinger M, Lohscheller J, Eysholdt U: High precision measurement of the vocal fold length and vibratory amplitudes, Laryngoscope 112: 1043-1049, 2002.
2.
Schade G, Hess M, Rassow B: Möglichkeit endolaryngealer morphometrischer Messungen mit einem neuen Laserlichtverfahren. HNO 50(8): 753-5, 2002.
3.
Niimi S, Miyai M: Vocal fold vibration and voice quality. Folia Phoniatr Logo 52(1): 32-38, 2000.
4.
Neubauer J, Mergell P, Eysholdt U, Herzel H: Spatio-temporal analysis of irregular vocal fold oscillations: Biphonation due to desynchronization of spatial modes. J Acoust Soc Am 110(6): 3179-3192, 2001.