gms | German Medical Science

28. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.
2. Dreiländertagung D-A-CH

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.
Schweizerische Gesellschaft für Phoniatrie; Sektion Phoniatrie der Österreichischen Gesellschaft für HNO-Heilkunde, Kopf- und Halschirurgie

09.09. - 11.09.2011, Zürich, Schweiz

Synchrone Aufzeichnung von endoskopischen Hochgeschwindigkeitsaufnahmen und akustischem Signal: Aussagekraft des akustischen Signals

Vortrag

  • corresponding author presenting/speaker Michael Döllinger - Abteilung für Phoniatrie und Pädaudiologie, Universitätsklinikum Erlangen, Erlangen, Deutschland
  • author Sabine Vondenhoff - Abteilung für Phoniatrie und Pädaudiologie, Universitätsklinikum Erlangen, Erlangen, Deutschland
  • author Ulrich Eysholdt - Abteilung für Phoniatrie und Pädaudiologie, Universitätsklinikum Erlangen, Erlangen, Deutschland
  • author Manfred Kaltenbacher - Applied Mechatronics, Institute of Smart System-Technologies, Alps-Adriatic University, Klagenfurt, Österreich
  • author Anke Ziethe - Abteilung für Phoniatrie und Pädaudiologie, Universitätsklinikum Erlangen, Erlangen, Deutschland
  • author Ercan Gürlek - Abteilung für Phoniatrie und Pädaudiologie, Universitätsklinikum Erlangen, Erlangen, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 28. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP), 2. Dreiländertagung D-A-CH. Zürich, 09.-11.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11dgppV31

doi: 10.3205/11dgpp41, urn:nbn:de:0183-11dgpp411

Published: August 18, 2011

© 2011 Döllinger et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Zusammenfassung

Hintergrund: Das akustische Stimmsignal und endoskopische Hochgeschwindigkeits-Videoaufnahmen (HGG) werden klinisch zur Beurteilung der Stimmfunktion subjektiv oder objektiv analysiert. Im Allgemeinen werden die auszuwertenden akustischen und endoskopischen Aufnahmen sequentiell durchgeführt. Die synchrone Aufzeichnung von akustischem und visuellem Signal würde einen direkten Vergleich zwischen erzeugtem Ton und Stimmlippenbewegung ermöglichen. Die vorgestellte Studie untersucht die Aussagekraft des synchron zur Endoskopie aufgezeichneten akustischen Signals.

Material und Methoden: HGG und akustische Daten wurden synchron aufgezeichnet. Es wurde eine Hochgeschwindigkeitskamera gekoppelt an ein Endoskop inklusive angebrachtem Mikrophon verwendet. Bei gehaltener Phonation wurden die akustischen Stimmsignale von 80 Gesunden, 254 funktionellen Dysphonien und 338 Patienten mit anatomischen Veränderungen, analysiert (Dr Speech). Zwölf Parameter wurden berechnet. Die statistische Analyse erfolgte mit SPSS 17.0.

Ergebnisse: 550 der 672 Aufnahmen konnten mit Dr Speech ausgewertet werden. Die meisten akustischen Perturbationsmaße zeigten statistisch signifikante Unterschiede zwischen den Geschlechtern bei gesunden Probanden, als auch zwischen gesunden und pathologischen Stimmen. Bei der Linearen Diskriminanzanalyse zeigten die Parameter gute Ergebnisse: Klassifikationsgüte gesund – krank (Männer >88%, Frauen >70%).

Diskussion: Das synchron zur HGG aufgezeichnete akustische Signal kann zur Beurteilung der Stimme herangezogen werden. Normwerte hierfür müssen noch bestimmt werden. Die Kombination von Parametern aus akustischem und visuellem Signal kann zukünftig eine bessere Unterstützung innerhalb der klinischen Diagnose sein. Die erzielte Zeitersparnis ist ebenso zu beachten.


Text

Hintergrund

Das akustische Stimmsignal und endoskopische Hochgeschwindigkeits-Videoaufnahmen (HGG) werden klinisch zur Beurteilung der Stimmfunktion subjektiv oder objektiv analysiert. Im Allgemeinen werden die auszuwertenden akustischen und endoskopischen Aufnahmen sequentiell durchgeführt. Die synchrone Aufzeichnung von akustischem und visuellem Signal würde einen direkten Vergleich zwischen erzeugtem Ton und Stimmlippenbewegung ermöglichen. Die vorgestellte Studie untersucht die Aussagekraft des synchron zur Endoskopie aufgezeichneten akustischen Signals. In einer vorausgehenden Studie wurden die zugehörigen Hochgeschwindigkeitsaufnahmen ausgewertet, dort zeigte sich, dass objektiv berechnete Parameter geeignet sind, gesunde von pathologischen Stimmen zu unterscheiden [1].

Methode

HGG (Richard Wolf GmbH, 4000 fps, 256x256 Pixel) und akustische Daten (B&K, 44.1 kHz) wurden synchron aufgezeichnet. Es wurde eine Hochgeschwindigkeitskamera gekoppelt an ein Endoskop (90° Optik) inklusive angebrachtem Mikrophon verwendet. Bei gehaltener Phonation wurden die akustischen Stimmsignale von 80 Gesunden, 254 funktionellen Dysphonien und 338 Patienten mit anatomischen Veränderungen, analysiert (Dr Speech). Zwölf Parameter wurden berechnet. Die statistische Analyse erfolgte mit SPSS 17.0.

Ergebnis

550 der 672 akustischen Aufnahmen konnten mit Dr Speech ausgewertet werden. Elf von zwölf akustischen Perturbationsmaße zeigten statistisch signifikante Unterschiede zwischen den Geschlechtern bei gesunden Probanden (Tabelle 1 [Tab. 1]. Alle Parameter (bis auf NNE (dB)) zeigten mindestens einen signifikanten Unterschied zwischen der gesunden Gruppe und den pathologischen Gruppen. Bei der Linearen Diskriminanzanalyse zeigten die Parameter gute Ergebnisse: Klassifikationsgüte des Zwei-Klassenproblems gesund – krank (Männer 90%, Frauen >73%).

Diskussion

Das synchron zur HGG aufgezeichnete akustische Signal kann zur Beurteilung der Stimme herangezogen werden. Normwerte hierfür müssen noch bestimmt werden. Die Kombination von Parametern aus akustischem und visuellem Signal [1], [2] kann zukünftig eine bessere Unterstützung innerhalb der klinischen Diagnose sein. Die erzielte Zeitersparnis ist ebenso zu beachten.

Danksagung

Die vorliegende Arbeit wurde durch die DFG gefördert: Forschergruppe FOR894/2 „Strömungsphysikalische Grundlagen der Menschlichen Stimmgebung“.


Literatur

1.
Inwald EC, Döllinger M, Schuster M, Eysholdt U, Bohr C. Multiparametric Analysis of Vocal Fold Vibrations in Healthy and Disordered Voices in High-Speed Imaging. J Voice. 2010 Aug 19. [Epub ahead of print]. DOI: 10.1016/j.jvoice.2010.04.004 External link
2.
Voigt D, Döllinger M, Yang A, Eysholdt U, Lohscheller J. Automatic diagnosis of vocal fold paresis by employing phonovibrogram features and machine learning methods. Comput Methods Programs Biomed. 2010;99(3):275-88. DOI: 10.1016/j.cmpb.2010.01.004 External link