gms | German Medical Science

Dreiländertagung D-A-CH
24. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

28. - 30.09.2007, Innsbruck, Österreich

Visualisierung und Quantifizierung von Stimmlippenschwingungen basierend auf Phonovibrogrammen

Visualization and quantitative analysis of vocal fold vibrations using phonovibrograms

Vortrag

Suche in Medline nach

  • corresponding author presenting/speaker Jörg Lohscheller - Abteilung für Phoniatrie und Pädaudiologie, Universitätsklinikum Erlangen, Erlangen, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. Sektion Phoniatrie der Österreichischen Gesellschaft für HNO-Heilkunde, Kopf- und Halschirugie. Schweizerische Gesellschaft für Phoniatrie. Dreiländertagung D-A-CH, 24. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e.V.. Innsbruck, Österreich, 28.-30.09.2007. Düsseldorf: German Medical Science GMS Publishing House; 2007. Doc07dgppH03

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/dgpp2007/07dgpp36.shtml

Veröffentlicht: 28. August 2007

© 2007 Lohscheller.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Zusammenfassung

Die klinische Untersuchung von Stimmstörungen erfordert die visuelle Erfassung der oszillierenden Stimmlippen. Die modernste Technik ist die Hochgeschwindigkeits-(HG-)Endoskopie, welche in der Lage ist sowohl reguläre als auch irreguläre Schwingungsmuster zu erfassen. Bei einer derartigen Untersuchung werden Datensätze von mehreren 100 MByte erzeugt, deren subjektive Auswertung in der klinischen Routine nicht mehr praktikabel ist. Die aktuellen Bilderfassungssysteme erfordern daher zwingend moderne Analyseverfahren, mit denen sich Stimmlippenschwingungen in kurzer Zeit quantitativ beschreiben lassen.

Der neue Ansatz der Phonovibrographie hat das Potential den Schritt von der Grundlagenforschung in die klinische Praxis zu vollziehen. Er beinhaltet ein klinisch validiertes Segmentierungsverfahren, das selbst bei geringer Bildqualität die Stimmlippen aus den HG-Filmen extrahiert. Das Verfahren erreicht einen Datendurchsatz von ca. 100 Bildern pro Sekunde und ist somit für den direkten Einsatz, d.h. im Anschluss an die HG-Aufnahmen, geeignet. In einem zweiten Schritt wird die Dynamik der beiden extrahierten Stimmlippenkanten in einem Farbbild, dem so genannten Phonovibrogamm (PVG) visualisiert. Das PVG veranschaulicht auf eine sehr einfache Art und Weise die Schwingungsmuster von Stimmlippen. Durch Analyse der PVGs lassen sich Aussagen über das vorliegende Krankheitsbild ableiten. Die Anwendung der Phonovibrographie wird an klinisch erhobenen Datensätzen demonstriert.


Text

Einleitung

Ein wesentlicher Bestandteil der phoniatrischen Diagnostik von Stimmstörungen ist der Einsatz bildgebender Verfahren zur endoskopischen Untersuchung des Kehlkopfes. Während organische Abnormalitäten direkt in einem Standbild erkennbar sind (Laryngitis, Polyp, Knötchen), können die Auswirkungen mikroskopischer Veränderungen häufig erst während der Phonation beobachtet werden. In Echtzeit lassen sich Stimmlippenschwingungen mit endoskopischen Hochgeschwindigkeits-(HG-)Aufnahmen abbilden. Ziel ist die Erfassung und Beschreibung der pathologischen Stimmlippendynamik in klinisch nutzbare Aussagen zu transferieren.

Als HG-Verfahren werden die Videokymographie („Linienkamera“) und digitale HG-Videoaufnahmen (zweidimensionaler Sensor) eingesetzt [1], [2]. Zwar lassen sich mit der HG-Aufnahmetechnik irreguläre Schwingungen visualisieren [3], aber die grundsätzlichen Nachteile dieser Videotechniken – die ebenso bei der Stroboskopie auftreten – bleiben bestehen: Zeitaufwand und schwierige perzeptive Klassifikation von Bewegung. Das Potential der HG-Technik kann nur dann für die medizinische Diagnostik genutzt werden, wenn rechnergestützte Analyseverfahren zur Anwendung kommen, die eine automatisierte und standardisierte Analyse von Stimmlippenschwingungen bereitstellen [2], [4].

Methode und Ergebnisse

Der hier vorgestellte Ansatz der Phonovibrographie zur Visualisierung und Analyse von Stimmlippenschwingungen hat das Potential den Schritt von der Grundlagenforschung in die klinische Praxis zu vollziehen. Er beinhaltet ein klinisch validiertes Segmentierungsverfahren, dass selbst bei geringer Bildqualität die Stimmlippen aus den HG-Filmen extrahiert [5]. In einem zweiten Schritt wird die Dynamik der beiden extrahierten Stimmlippenkanten in einem Farbbild, dem so genannten Phonovibrogam (PVG) visualisiert [6], [7]. Das PVG veranschaulicht auf eine sehr einfache Art und Weise die Schwingungsmuster von Stimmlippen. Durch geometrische Analyse der PVGs lassen sich quantitative Aussagen über die Störung des gesamten Schwingungsmusters gewinnen.

Segmentierung

Für die Segmentierung der Stimmlippenkanten aus endoskopischen HG-Aufnahmen wurde eine robuste und benutzerfreundliche Software entwickelt. In Kombination mit dem Kameramodell Highspeed Endocam 5542 der Firma Wolf wird mit diesem Verfahren – bei einer Auflösung von 256x256 Bildpunkten (s/w-Modus) – mittlerweile ein Datendurchsatz von bis zu 150 Bilder pro Sekunde erreicht. Gemessen an der Gesamtdauer der Untersuchung ist die Verarbeitungsgeschwindigkeit so hoch, dass die HG-Aufnahmen direkt im Anschluss an die Untersuchung – also noch in der Sprechstunde – analysiert werden können. In einem Experten-Ringversuch von zehn Klinikern wurde das Verfahren anhand von fast 400 HG-Aufnahmen auf anatomische Reliabilität und Validität geprüft [5].

Typische Ergebnisse der automatischen Segmentierung sind in Abbildung 1 [Abb. 1] gezeigt: In jedes Bild sind die Ergebnisse der Segmentierung eingeblendet: Der mediale Rand der linken und der rechten Stimmlippe begrenzen die (hier jeweils geöffnete) Glottis. Die Punkte A (für „anterior“) am ventralen und P („posterior“) am dorsalen Ende bezeichnen die vordere und hintere Kommissur. Der Abstand zwischen A und P entspricht der Glottislänge L während die die AP-Verbindungslinie die glottale Hauptachse darstellt.

PVG-Visualisierung

Die folgend beschriebene Visualisierung von Stimmlippenschwingungen hat zum Ziel, die nur schwer zu interpretierenden segmentierten Filmsequenzen so aufzubereiten, dass eine umgehende Beurteilung des gesamten Schwingungsmusters beider Stimmlippen möglich ist. Dazu werden die extrahierten Bewegungen der Stimmlippenkanten in eine 2D-Matrix transformiert und dort durch eine anschließende Farbkodierung als sogenanntes Phonovibrogramm (PVG) dargestellt werden. Das Verfahren funktioniert wie folgt. Entlang der Glottishauptachse (AP) werden die Abstände beider Stimmlippenkanten zu der glottalen Achse berechnet. Durch virtuelles Drehen der linken Stimmlippe um den Punkt P lassen sich nun die berechneten Abstandswerte als Einträge eines Spaltenvektor definieren. Dieser Vorgang wird nun für jedes segmentierte Bild einer HG-Sequenz wiederholt und die berechneten Spaltenvektoren zu einer 2D-Matrix zusammengefasst. Eine Visualisierung der Matrix als Phonovibrogramm (PVG) wird erreicht, indem die reellwertigen Matrixeinträge farbkodiert werden. Die Intensität der Farbkodierung spiegelt hierbei den Betragswert wieder während das Vorzeichen, d.h. die Lage der Stimmlippen im Bezug zur glottalen Achse, durch zwei Farben rot/blau kodiert wird [6].

Ergebnisse der PVG-Analyse

In Abhängigkeit von der individuellen Stimmlippenbewegung entstehen im PVG definierte geometrische Muster, die von einem Untersucher leichter erkannt und klassifiziert werden können als 1D-Bewegungskurven oder 2D-Filme. Das gesamte Schwingungsmuster von Stimmlippen lässt sich in einem PVG analysieren, indem für jede Stimmlippe die geometrischen Muster innerhalb eines PVGs durch geometrische Parameterwerte (Winkelmaße) beschrieben werden [7]. In Abbildung 2 [Abb. 2] sind exemplarisch vier normierte Phonovibrogramme (PVG norm) gezeigt, die jeweils einen Schwingungszyklus repräsentieren. Die weiß eingezeichneten Konturlinien werden automatisch durch Segmentierung der Phonovibrogramme gewonnen und deren Lage durch die Winkelmaße α1,2 l,r und β1,2 l,r beschrieben. Diese Parameterwerte der Winkelfunktionen quantifizieren eindeutig das gesamte dorso-ventral Schwingungsmuster der Stimmlippen. Der inter-individuelle Vergleich von PVG-Geometrien zeigt deutlich, dass auch bei gesunder Stimmgebung (Abbildung 2.1-2.2 [Abb. 2]) verschiedenartige Schwingungsmuster von Stimmlippen auftreten. In Abhängigkeit von der Stimmerkrankung entstehen im PVG charakteristische Änderungen der PVG-Geometrien (Abbildung 2.3-2.4 [Abb. 2]).

In Ergänzung zur Beschreibung des gesamten Schwingungsmusters lassen sich innerhalb der PVG-Analyse ebenfalls der Grad der links/rechts Schwingungsasymmetrie (Amplitude, Phase) als auch die glottalen Parameter wie Open Quotient, Glottisschluss Insuffizienz, Speed Quotient berechnen.

Diskussion

Um das Potential der HG-Technik für die klinische Anwendung zu erschließen, wurde ein Verfahren entwickelt, welches eine Bewertung der Stimmlippenbewegungen aus den HG-Sequenzen ermöglicht. Das hier vorgestellte PVG-Verfahren ist eine robuste Methode, um endoskopische Hochgeschwindigkeits-Videofilme von schwingenden Stimmlippen auszuwerten. Es zeigt die gesamte Dynamik der Stimmlippenschwingung unter Verzicht auf die statische Morphologie des Kehlkopfbildes. Die Analyse der PVG-Geometrien ermöglicht eine quantitative Beschreibung des Schwingungsmusters von Stimmlippen. Mit Hilfe entsprechender Analysesoftware lassen sich HG-Sequenzen in wenigen Sekunden analysieren. Die Phonovibrographie stellt die Grundlage weitergehender quantitativer Analysen des Schwingungsverhaltens von Stimmlippen dar, sowohl für weitere pathophysiologische Grundlagenbetrachtungen als auch für die klinische Anwendung.


Literatur

1.
Hess MM, Herzel H, Koester O, et al. Endoscopic imaging of vocal cord vibrations. Digital high-speed recording with various systems. HNO. 1996;44(12):685-93.
2.
Hertegard S, Larsson H, Wittenberg T. High-speed imaging: applications and development. Logoped Phoniatr Vocol. 2003;28(3):133-9.
3.
Eysholdt U, Rosanowski F, Hoppe U. Vocal fold vibration irregularities caused by different types of laryngeal asymmetry. Eur Arch Otorhinolaryngol. 2003;260(8):412-7.
4.
Yan Y, Ahmad K, Kundak M, Bless D. Analysis of vocal-fold vibrations from high-speed laryngeal images using a Hilbert transform based methodology. J Voice. 2005;19(2):161-75.
5.
Lohscheller J, Toy H, Rosanowski F, Eysholdt U, Döllinger M. Clinically evaluated procedure for the reconstruction of vocal fold vibrations from endoscopic digital high-speed videos. Med Image Anal. Epub 2007 Apr 29, ahead of print.
6.
Eysholdt U, Lohscheller J. Phonovibrogram: vocal fold dynamics integrated within a single image. HNO. Epub 2007 May 15, ahead of print.
7.
Lohscheller J, Eysholdt U, Toy H, Döllinger M. Phonovibrography: Mapping high-speed movies of vocal fold vibrations into 2D-diagrams for visualizing and analyzing the underlying laryngeal dynamics. IEEE T Med Imaging. 2006, in press.