gms | German Medical Science

27. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

17.09. - 19.09.2010, Aachen

3D-Echtzeit-Rekonstruktion der Stimmlippenoberfläche für in vitro- und in vivo-Messungen

Vortrag

  • corresponding author presenting/speaker Georg Luegmair - Phoniatrische und Pädaudiologische Abteilung der Uni-Klinik Erlangen, Deutschland
  • author Björn Hüttner - Phoniatrische und Pädaudiologische Abteilung der Uni-Klinik Erlangen, Deutschland
  • author Stefan Kniesburges - Lehrstuhl für Prozessmaschinen und Anlagentechnik, Universität Erlangen, Deutschland
  • author Ulrich Eysholdt - Phoniatrische und Pädaudiologische Abteilung der Uni-Klinik Erlangen, Deutschland
  • author Alexander Sutor - Lehrstuhl für Sensorik, Universität Erlangen, Deutschland
  • author Michael Döllinger - Phoniatrische und Pädaudiologische Abteilung der Uni-Klinik Erlangen, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 27. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Aachen, 17.-19.09.2010. Düsseldorf: German Medical Science GMS Publishing House; 2010. Doc10dgppV17

DOI: 10.3205/10dgpp26, URN: urn:nbn:de:0183-10dgpp260

Published: August 31, 2010

© 2010 Luegmair et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Zusammenfassung

Hintergrund: Ein Teil des akustischen Primärsignals wird durch Turbulenzen im ausgeatmeten Luftstrom erzeugt. Maßgeblich hierfür sind die Form und das 3D-Bewegungsverhalten der Stimmlippen [1]. Die Zusammenhänge zwischen akustischem Signal sowie Form und Verhalten der Stimmlippen sollen in in vivo-Messreihen ermittelt werden.

Aktuelle in vivo-Messmethoden berücksichtigen die dreidimensionalen Bewegungen der Stimmlippe nicht (z.B. Endoskopie), liefern nur begrenzt Informationen darüber (z.B. Endoskopie und Zwei-Punkt-Laser-Verfahren) oder sind nicht in Echtzeit verfügbar (z.B. MRI-Aufnahmen).

Material und Methoden: Wir präsentieren ein Verfahren, bei dem mit Hilfe einer HG-Kamera und einem Laserprojektionssystem die gesamte sichtbare Stimmlippenoberfläche während der Phonation trianguliert wird. Die Methode wird exemplarisch an einem Schweinekehlkopf und künstlichen Stimmlippen angewendet. Die Messdaten werden zum Zweck der verbesserten Visualisierung selektiv in Tiefen-Kymogramme [2] überführt.

Ergebnisse: Die Messergebnisse zeigen deutliche Asymmetrien zwischen den linken und rechten Stimmlippen. Des Weiteren kann der Verlauf der Randkantenverschiebung beim Schweinekehlkopf deutlich erkannt und quantifiziert werden [3].

Diskussion: Da die Messergebnisse von der gesamten Stimmlippenoberfläche vorliegen, lassen sich sowohl lokale als auch globale Schlüsse ziehen. So kann z.B. die Asymmetrie der linken und rechten Stimmlippen die Entstehung der Turbulenzen durch den Coandă-Effekt erklären. Zusätzlich lässt der Verlauf der Randkantenverschiebung darauf schließen, dass diese durch die Kollision der Stimmlippen erzeugt wird, im Gegensatz zu der in [2] vorgestellten Theorie.


Text

Hintergrund

Die menschliche Stimme ist das Produkt zweier aufeinander folgender Prozesse: erstens die Erzeugung des primären Stimmsignals und zweitens die nachfolgende Modulation durch die oberen Atemwege. Ein Teil des akustischen Primärsignals entsteht durch Turbulenzen im ausgeatmeten Luftstrom durch den sogenannten „Coandă-Effekt“. Maßgeblich hierfür sind die Form und das dreidimensionale Bewegungsverhalten der Stimmlippen [1]. Die Zusammenhänge zwischen akustischem Signal sowie Form und Verhalten der Stimmlippen sollen zukünftig durch in vivo-Messreihen ermittelt werden.

Aktuelle endoskopische in vivo-Aufnahmemethoden berücksichtigen die dreidimensionalen Bewegungen der Stimmlippe nicht, liefern nur quantitative Aussagen in longitudinaler und lateraler Richtung (z.B. Zwei-Punkt-Laser-Verfahren) oder sind nicht in Echtzeit verfügbar (z.B. MRI-Aufnahmen). Folgerichtig muss eine neue Methode zur Erfassung der dreidimensionalen Bewegungen der Stimmlippenoberfläche entwickelt werden.

Material und Methoden

Wir präsentieren ein Verfahren, bei dem mit Hilfe einer Hochgeschwindigkeits-Kamera (HG-Kamera) und einem Laserprojektionssystem (LPS) die gesamte sichtbare Stimmlippenoberfläche während der Phonation trianguliert wird. Hierbei werden durch die bekannten Positionen von HG-Kamera und LPS die Koordinaten eines Punktes im dreidimensionalen Raum berechnet. Dazu projiziert das LPS ein regelmäßiges Gitter aus Laserpunkten auf die Stimmlippenoberfläche, die mit Hilfe von Bildverarbeitungsalgorithmen im Kamerabild detektiert werden.

Zur Kalibrierung des Versuchsaufbaus wird ein planares Kalibrierobjekt verwendet. Durch den mathematischen Zusammenhang der „Homographie“ zwischen zwei Abbildungen können durch mehrere Aufnahmen des Objekts sowohl Kamera als auch das LPS kalibriert werden. Für die Kalibrierung und Triangulation ist es notwendig, dass eine Korrespondenzzuweisung zwischen projiziertem Punkt und emittierten Laserstrahl durchgeführt wird. Aktuell wird dies in einem Initialisierungsschritt manuell durchgeführt. Für die Auswertung einer HG-Aufnahme werden diese Korrespondenzen mit Hilfe der Initialisierung und einem wissens-basierten Algorithmus hergestellt. Der Fehler bei der Rekonstruktion beträgt ca. 15 µm.

Die Methode wird exemplarisch an einem Schweinekehlkopf und künstlichen Stimmlippen angewendet. Für die Versuche wird das Endoskop entfernt, um die Helligkeit und den Kontrast der Aufnahmen zu erhöhen. Die detektierten Punkte in den HG-Aufnahmen werden rekonstruiert und die Flächen zwischen den Punkten durch bikubische Interpolation ermittelt. Abbildung 1 [Abb. 1] zeigt links oben einen Ausschnitt eines Frames aus der HG-Aufnahme, unten links ist die rekonstruierte Oberfläche und rechts sind drei Höhenprofile in lateraler Richtung bei ¼, ½ und ¾ der maximalen longitudinalen Distanz zu sehen. Zum Zweck der verbesserten Visualisierung werden Tiefen-Kymogramme [2] erstellt, in dem die Höhenprofile farbkodiert und zeitabhängig dargestellt werden (siehe Abbildung 2 [Abb. 2]).

Ergebnisse

Die rekonstruierten Punkte erlauben die Visualisierung der Stimmlippenoberflächenbewegung während der Phonation. Zudem ermöglicht die Überführung in Tiefen-Kymogramme eine einfache Analyse der Daten an selektierten Stellen. Die Messergebnisse (siehe Abbildung 2 [Abb. 2]) zeigen deutliche Asymmetrien zwischen der linken und der rechten Stimmlippe. Des Weiteren kann der Verlauf der Randkantenverschiebung beim Schweinekehlkopf deutlich erkannt und quantifiziert werden [3]. Beispielhaft wurden die Parameter Frequenz, Open Quotient, Geschwindigkeit vMW der Randkante sowie die maximalen horizontalen und vertikalen Amplituden ermittelt. Die Tabelle 1 [Tab. 1] zeigt die Parameterwerte für die Versuche.

Diskussion

Durch die Erfassung der Bewegung der gesamten Stimmlippenoberfläche ergeben sich zwei Vorteile. Zum Einen lassen sich sowohl lokale als auch globale Schlüsse ziehen. So kann z.B. die Asymmetrie der linken und rechten Stimmlippe die Entstehung der Turbulenzen durch den Coanda-Effekt erklären.

Zum Anderen lassen sich Effekte nicht nur zeitlich über mehrere Perioden sondern auch über die räumliche Verteilung mitteln, wie z.B. im Fall der Randkantenverschiebung. Das gezeigte Beispiel lässt darauf schließen, dass der Verlauf der Randkantenverschiebung durch die Kollision der Stimmlippen erzeugt wird, im Gegensatz zu der in [2] vorgestellten Theorie.

Für die Zukunft ist die Miniaturisierung des LPS geplant. Kombiniert mit der vollkommen automatisierten Korrespondenzzuweisung erlaubt dies den Einsatz in klinische Studien.


Literatur

1.
Link G, Kaltenbacher M, Breuer M, Döllinger M. A 2D finite-element scheme for fluid-solid-acoustic interactions and its application to human phonation. Comp Met App Mech Eng. 2009;189:3321-34. DOI: 10.1016/j.cma.2009.06.009 External link
2.
George NA, de Mul FF, Qiu Q, Rakhorst G, Schutte HK. Depth-kymography: high-speed calibrated 3D imaging of human vocal fold vibration dynamics. Phys Med Biol. 2008;53(10):2667-75. DOI: 10.1088/0031-9155/53/10/015 External link
3.
Döllinger M, Berry DA, Berke GS. Medial surface dynamics of an in vivo canine vocal fold during phonation. J Acoust Soc Am. 2005;117:3174-83 . DOI: 10.1121/1.1871772 External link