gms | German Medical Science

4. Dreiländertagung D-A-CH
35. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP)

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

20.09. - 23.09.2018, Innsbruck, Österreich

Bestimmung von Vokaltraktresonanzen und Formanten mittels verschiedener Analyseansätze

Vortrag

  • corresponding author presenting/speaker Matthias Echternach - Institut für Musikermedizin, Freiburg, Deutschland
  • Malte Kob - Musikhochschule Detmold, Detmold, Deutschland
  • Johan Sundberg - KTH Stockholm, Stockholm, Schweden
  • Louisa Traser - Phoniatrie, Inselspital, Bern, Schweiz
  • Peter Birkholz - Institut für Akustik und Sprachkommunikation, TU Dresden, Dresden, Deutschland
  • Marie Köberlein - Institut für Musikermedizin, Freiburg, Deutschland
  • Bernhard Richter - Institut für Musikermedizin, Freiburg, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. Sektion Phoniatrie der Österreichischen Gesellschaft für Hals-, Nasen- und Ohrenheilkunde, Kopf- und Halschirurgie. Schweizerische Gesellschaft für Phoniatrie. 4. Dreiländertagung D-A-CH, 35. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Innsbruck, Österreich, 20.-23.09.2018. Düsseldorf: German Medical Science GMS Publishing House; 2018. DocV33

doi: 10.3205/18dgpp48, urn:nbn:de:0183-18dgpp484

Veröffentlicht: 14. September 2018

© 2018 Echternach et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Hintergrund: In der Stimmwissenschaft ist die Bestimmung von Vokaltraktresonanz- bzw. Formantfrequenzen von Relevanz. Jedoch werden zur Bestimmung solcher Frequenzen unterschiedliche Analysemethoden verwendet.

Material und Methoden: In einer Einzel-Subjekt Untersuchung wurden für die Grundfrequenzen 110 und 220Hz und jeweils für die Vokalkonditionen /a/, /i/, /u/, und /ə/ sowohl 3D-MRT-Vokaltraktaufnahmen als auch Audio- und Impedanzaufnahmen in einem reflexionsarmen Raum angefertigt. Die Vokaltraktresonanz- bzw. Formantfrequenzbestimmung erfolgte durch Linear Predicted Coding (LPC) und inverser Filtrierung des Audiosignals, Bestimmung der Impedanz sowohl an den Lippen des Sängers als auch von 3D-Ausdruckmodellen nach Segmentierung und Zahnimplementation aus dem MRT Material. Ferner wurden Resonanzen aus Übertragungsfunktionen bei Anregung der Ausdruckmodelle durch Sweeps wie auch durch numerisches Modelling bestimmt.

Ergebnisse: Insgesamt zeigten die verschiedenen Techniken systematische Unterschiede in der Bestimmung der Resonanz- bzw. Formantfrequenzen bei den jeweils für das Verfahren optimierten Versuchskonditionen. Zudem war ein Einfluss des Materials der Ausdruckmodelle als auch die Frage, ob der Vokaltrakt an eine Modell-Trachea gekoppelt wurde, von Relevanz.

Fazit: Die Bestimmungstechnik hat einen maßgeblichen Einfluss auf die Bestimmung von Vokaltraktresonanz- bzw. Formantfrequenzen.


Text

Einleitung

In der Stimmwissenschaft ist die Bestimmung von Vokaltraktresonanzen und Formanten von Relevanz. Für deren Charakterisierung werden Frequenzen nach unterschiedlichen Analysemethoden bestimmt, von denen einige in einer Pilotstudie verglichen werden.

Material und Methoden

In einer Untersuchung eines professionellen Baritons wurden sowohl 3D-MRT-Vokaltraktaufnahmen, 3D-Trachea- und Lungenaufnahmen, High-Speed-Imaging der Stimmlippen (20.000 fps) als auch Ton- und akustische Impedanzaufnahmen in einem reflexionsarmen Raum (Camera silens) angefertigt (vgl. Abbildung 1 [Abb. 1]). Der Proband wurde aufgefordert, die Grundfrequenzen 110 und 220 Hz jeweils für vier Vokalkondition /a/, /i/, /u/, und /ə/ konstant zu phonieren.

Die Aufnahmen in der Camera silens erfolgten in Analogie zur Situation im MRT in Rückenlage und erfassten in einem 8-Kanalsystem u.a. das Audio- und das Elektroglottographiesignal. In gleicher Sitzung erfolgte die Messung der akustischen Impedanz des Vokaltrakts an der Mundöffnung ebenfalls am liegenden Sänger. Die Resonanzfrequenzbestimmung (Z) erfolgte direkt im Anschluss an die Phonation entsprechender Vokal- und Tonhöhen mit der Anweisung, die Artikulation beizubehalten, jeweils mit offen gehaltener oder verschlossener Glottis. Sowohl aus den gehaltenen Phonationen als auch aus den Phonationen, die den Impedanzmessungen vorausgingen, wurden Linear Predictive Coding (LPC)-Analysen (Software Praat unter der Erwartung von 6 Resonanzen bis 5500 Hz) durchgeführt (Audio: LPCAu bzw. Impedanz: LPCIM). Das Audiosignal wurde unter dem Kriterium einer glatten Geschlossenphase des Flow-Glottogramms invers gefiltert (IFAu).

Das bei der MRT-Messung aufgenommene Tonsignal wurde durch Filterung vom Störgeräusch befreit und ebenfalls einer LPC Analyse unterzogen (LPCMRI).

Nach Segmentierung und Implementation der Zähne wurden aus den 3D-Daten der MRT-Aufnahmen die Resonanzfrequenzen bestimmt, indem entweder a) mit einem Lautsprecher Sinustöne zwischen 20 Hz und 20.000 Hz im Bereich der Glottis in das ausgedruckte Vokaltraktmodell eingebracht und die Schalldruckpegeldifferenz der jeweiligen Töne zum Mundausgang des Modells bestimmt wurde, oder b) eine Leermessung vor dem verschlossenen Vokaltrakt mit einer Tonmessung mit Abnahme des Audiosignals im Bereich der Glottis verglichen wurde [1]. Aus den segmentierten Daten der MRT-Messungen wurden außerdem numerisch Resonanzfrequenzen bestimmt. Zur Untersuchung des Einflusses der Vokaltraktwände wurden die ausgedruckten Modelle sowohl aus weichem als auch aus hartem Material erstellt.

Um sich der Frage des akustischen Einflusses subglottischer Strukturen zu nähern, wurde in einem weiterführenden Versuch das Vokaltraktmodell für den Schwa-Laut mit einer analog zu den Vokaltraktmodellen aus MRT Daten segmentierten und ausgedruckten Trachea gekoppelt. Mit dem Ziel, sowohl bei unterschiedlich weit geöffneter (akustischer Einfluss des Trachealsystems möglich) als auch bei geschlossener Glottis (akustisch kein Einfluss des Trachealsystems möglich) messen zu können, wurde zwischen die Modelle von Vokaltrakt und Trachea ein Glottismodell platziert, welches der Glottisöffnung zu sechs Phasen des glottalen Zyklus entsprechen sollte; die Glottisöffnungsflächen wurden aus real gemessenen hochgeschwindigkeitsglottographischen Aufnahmen des Probanden mit gleicher Tonhöhe und Vokalkondition nach Glottisflächensegmentierung abgeschätzt.

Ergebnisse

Die drei Konditionen (Audio und Impedanz in der Camera Silens bzw. Audio gefiltert aus dem MRT) zeigten hinsichtlich der Resonanzfrequenzen eine relativ große Übereinstimmung in den LPC Analysen (Abbildung 2 [Abb. 2]).

Insgesamt zeigten sich hinsichtlich der Resonanzbestimmungen recht gute Übereinstimmungen zwischen den LPC Analysen und der inversen Filterung (LPCAu versus IFAu) (Abbildung 2 [Abb. 2]), jedoch einige Unterschiede zwischen den LPC Analysen und der numerischen Modellierung.

Die Resonanzfrequenzen unterschieden sich auch in Abhängigkeit vom Ausdruckmaterial. Die Unterschiede waren vor allem im Bereich der unteren beiden Resonanzen mit einer Verschiebung der Resonanzfrequenzen hin zu tieferen Werten für die weicheren Modelle zu beobachten.

Bei der Impedanzbestimmung in Koppelung eines Vokaltraktmodells (Schwa-Laut) mit einer segmentierten Trachea mit unterschiedlichen Glottisöffnungsflächen lässt sich ein Einfluss der verschiedenen Glottisöffnungen aufzeigen. Dies legt einen Einfluss subglottischer Strukturen auf die Impedanz nahe.

Diskussion und Schlussfolgerung

Die vorliegenden Daten weisen darauf hin, dass die Kalkulationen von Resonanzfrequenzen bzw. Formanten je nach Methode voneinander abweichen können. Bei der Bestimmung dieser Frequenzen anhand MRT-basierter 3D-Drucke variieren die Frequenzen je nach Druckmaterial. Die Impedanzmethode hat gezeigt, dass sich die Resonanzfrequenzen je nach Öffnungsgrad der Glottis variieren. Da der glottale Schwingungszyklus sehr schnell zwischen offener und geschlossener Glottis wechselt, können sich möglicherweise auch die Resonanzeigenschaften entsprechend schnell ändern. Es ist davon auszugehen, dass die Resonanzbestimmungen mit dieser Technik vor allem dann kritisch sind, wenn der Glottisschluss kaum oder gar nicht vorhanden ist, wie es bei Phonation bei hoher Grundfrequenz oder bei Dysphonien der Fall sein kann. Erstaunlich an den Daten ist die recht hohe Übereinstimmung von Formantbestimmungen mittels LPC und inverser Filterung. Es sei hier allerdings darauf hingewiesen, dass für die LPC Bestimmung eine anhand des Indifferenzrohres bestimmte Formantanzahl als Erwartung eingestellt wurde und andere Resultate bei unterschiedlicher Anzahl zu erwarten sind. Die inverse Filterung unterliegt auf der anderen Seite der Erwartung einer Linearität von Stimmquelle und Vokaltraktfilter; eine Erwartung, die derzeitig von einigen Wissenschaftlern im Sinne von Interaktionen dieser Systeme in Zweifel gezogen wird. Insgesamt weisen die Ergebnisse darauf hin, dass ein Vergleich von Vokaltraktresonanzdaten, welche mit verschiedenen Techniken gewonnen wurden, nur bedingt möglich ist.


Literatur

1.
Fleischer M, Mainka A, Kürbis S, Birkholz P. How to precisely measure the volume velocity transfer function of physical vocal tract models by external excitation. PLoS One. 2018 Mar 15;13(3):e0193708. DOI: 10.1371/journal.pone.0193708 Externer Link