gms | German Medical Science

28. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.
2. Dreiländertagung D-A-CH

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.
Schweizerische Gesellschaft für Phoniatrie; Sektion Phoniatrie der Österreichischen Gesellschaft für HNO-Heilkunde, Kopf- und Halschirurgie

09.09. - 11.09.2011, Zürich, Schweiz

Hochgeschwindigkeitsglottographie: Der Einfluss der Kameraaufnahmefrequenz auf objektiv berechnete Parameter

Vortrag

  • author presenting/speaker Ercan Gürlek - Abteilung für Phoniatrie und Pädaudiologie, Universitätsklinikum Erlangen, Erlangen, Deutschland
  • author Georg Luegmair - Abteilung für Phoniatrie und Pädaudiologie, Universitätsklinikum Erlangen, Erlangen, Deutschland
  • author Ulrich Eysholdt - Abteilung für Phoniatrie und Pädaudiologie, Universitätsklinikum Erlangen, Erlangen, Deutschland
  • author Christoph Brücker - Institut für Mechanik und Fluiddynamik, TU Bergakademie Freiberg, Freiberg, Deutschland
  • corresponding author Michael Döllinger - Abteilung für Phoniatrie und Pädaudiologie, Universitätsklinikum Erlangen, Erlangen, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 28. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP), 2. Dreiländertagung D-A-CH. Zürich, 09.-11.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11dgppV32

doi: 10.3205/11dgpp42, urn:nbn:de:0183-11dgpp424

Published: August 18, 2011

© 2011 Gürlek et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Zusammenfassung

Hintergrund: Die Anwendung der Hochgeschwindigkeitsglottographie (HGG) gewinnt im wissenschaftlichen als auch im klinischen Bereich immer mehr an Bedeutung: HGG erlaubt die exakte Bestimmung von Vibrationseigenschaften der Stimmlippen innerhalb als auch zwischen unterschiedlichen Oszillationszyklen. Mittlerweile erlaubt der Einsatz der HGG Technik auch die objektive Auswertung visuell gewonnener Daten der Phonation. Aktuelle klinische Geräte (z.B. KayPENTAX, Richard Wolf GmbH) besitzen eine zeitliche Aufnahmerate zwischen 2.000–4.000 frames per second (fps) bei bis zu 512x512 Pixel räumlicher Auflösung. Die maximal mögliche Aufnahmedauer liegt zwischen 2 und 8 Sekunden. Für wissenschaftliche Studien stehen weitaus leistungsfähigere Kameras zur Verfügung: bis zu 8.000 fps (Phantom v7.3) in Farbe und bis 20.0000 fps (Photron SA-1.1) in Graustufen, bei einer gleichzeitigen räumlichen Auflösung von maximal 1.024x1.024 Pixel.

Um unterschiedliche Studien vergleichen zu können oder um zukünftig klinische Normwerte für Parameter festzulegen muss bestimmt werden, welchen Einfluss unterschiedliche Aufnahmeraten oder räumliche Auflösungen auf die Parameter besitzen.

Material und Methoden: Ein Segment normaler Phonation wurden bei einer Probandin mit einer Hochgeschwindigkeitskamera (Photron SA-1.1, 80 mm Linse, starres Endoskop mit 70° Optik) mit 20.000 fps aufgezeichnet. Die Aufnahmen wurden auf 15.000, 10.000, 9.000, 8.000, 7.000, …, 1.000 fps down gesampelt. Es wurden insgesamt 45 glottale objektive Parameter berechnet.

Ergebnisse: Die meisten Parameter zeigen eine Abhängigkeit bezüglich der Aufnahmefrequenz. Bei ansteigender Aufnahmefrequenz nähern sich die Parameterwerte stabilen Werten an (ab 10.000 fps).

Diskussion: Im Hinblick auf zukünftigen klinischen Einsatz, muss dies berücksichtigt werden. Entweder legt man frequenzabhängige Normwerte fest oder verwendet nur Parameter, die unabhängig von der zeitlichen Abtastrate sind.


Text

Hintergrund

Die Anwendung der Hochgeschwindigkeitsglottographie (HGG) gewinnt im wissenschaftlichen als auch im klinischen Bereich immer mehr an Bedeutung [1]: HGG erlaubt die exakte Bestimmung von Vibrationseigenschaften der Stimmlippen innerhalb als auch zwischen unterschiedlichen Oszillationszyklen. Mittlerweile erlaubt der Einsatz der HGG Technik auch die objektive Auswertung visuell gewonnener Daten der Phonation [2], [3]. Aktuelle klinische Geräte (z.B. KayPENTAX, Richard Wolf GmbH) besitzen eine zeitliche Aufnahmerate zwischen 2.000–4.000 frames per second (fps) bei bis zu 512x512 Pixel räumlicher Auflösung. Die maximal mögliche Aufnahmedauer liegt zwischen 2 und 8 Sekunden. Für wissenschaftliche Studien stehen weitaus leistungsfähigere Kameras zur Verfügung: bis zu 8.000 fps (Phantom v7.3) in Farbe und bis 20.0000 fps (Photron SA-1.1) in Graustufen, bei einer gleichzeitigen räumlichen Auflösung von maximal 1.024x1.024 Pixel [4].

Um unterschiedliche Studien vergleichen zu können oder um zukünftig klinische Normwerte für Parameter festzulegen muss bestimmt werden, welchen Einfluss unterschiedliche Aufnahmeraten oder räumliche Auflösungen auf die Parameter besitzen.

Methode

Ein Segment normaler Phonation wurden bei einer Probandin mit einer Hochgeschwindigkeitskamera (Photron SA-1.1, 80 mm Linse, starres Endoskop mit 70° Optik) mit 20.000 fps aufgezeichnet. Die Aufnahmen wurden auf 15.000, 10.000, 9.000, 8.000, 7.000, …, 1.000 fps down gesampelt. Es wurden folgende objektive Parameter berechnet.

Ergebnis

Folgende Parameter zeigten eine Veränderung von niedrigen zu hohen Aufnahmeraten: z.B. erhöhte sich der Closing Quotient von ≈0.25 auf ≈0.5, der Speed Quotient reduzierte sich von ≈2.8 auf ≈1 und die Spectral Flatness zeigte eine Reduzierung um mehr als 10 dB. Bei der Aufnahmefrequenz um die 10.000 Hz näherten sich die Parameterwerte stabilen Werten an (Abbildung 1 [Abb. 1]).

Folgende Parameter verhielten sich über die unterschiedlichen Aufnahmeraten stabil: Open Quotient, Grundfrequenz F0 und NNE.

Diskussion

Die Studie zeigt: (1) Gewisse Parameter sind unabhängig von der Aufnahmefrequenz der Kamera. Dies bedeutet, dass zukünftig potentielle Normwerte über alle Kameraaufnahmeraten festgelegt werden können. (2) Gewisse Parameter zeigen eine Abhängigkeit bezüglich der Kameraaufnahmerate und stabilisieren sich bei ca. 10.000 fps. Dies bedeutet nicht, dass diese Parameter nicht verwendet werden können, sondern nur dass dies im Hinblick auf zukünftigen klinischen oder wissenschaftlichen Einsatz berücksichtigt werden sollte. Zukünftig potentielle Normwerte dieser Parameter sollten somit in Abhängigkeit der Kameraaufnahmerate festgelegt werden. Dies könnte mit so genannten „Lookup-Tabellen“ problemlos realisiert werden.

Danksagung

Die vorliegende Arbeit wurde durch die DFG gefördert: Forschergruppe FOR894/2 „Strömungsphysikalische Grundlagen der Menschlichen Stimmgebung“.


Literatur

1.
Döllinger M. The next Step in voice assessment: High-Speed digital endoscopy and objective evaluation. Curr Bioinform. 2009;4(2):101-11. DOI: 10.2174/157489309788184774 External link
2.
Inwald EC, Döllinger M, Schuster M, Eysholdt U, Bohr C. Multiparametric Analysis of Vocal Fold Vibrations in Healthy and Disordered Voices in High-Speed Imaging. J Voice. 2010 Aug 19. [Epub ahead of print]. DOI: 10.1016/j.jvoice.2010.04.004 External link
3.
Voigt D, Döllinger M, Braunschweig T, Yang A, Eysholdt U, Lohscheller J. Classification of functional voice disorders based on phonovibrograms. Artif Intell Med. 2010;49(1):51-9. DOI: 10.1016/j.artmed.2010.01.001 External link
4.
Luegmair G, Kniesburges S, Zimmermann M, Sutor A, Eysholdt U, Döllinger M. Optical reconstruction of high-speed surface dynamics in an uncontrollable environment. IEEE Trans Med Imaging. 2010;29(12):1979-91. DOI: 10.1109/TMI.2010.2055578 External link