gms | German Medical Science

38. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP)

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

29.09. - 02.10.2022, Leipzig

Ermittlung von Resonanzeigenschaften verschiedener Stimmqualitäten durch numerische Modellierung aus MRT-basierten 3D-Vokaltraktmodellen

Vortrag

  • corresponding author presenting/speaker Louisa Traser - Institut für Musikermedizin, Universitätsklinikum und Hochschule für Musik Freiburg, Freiburg, Deutschland
  • Stefanie Rummel - Insitut Rummel, Frankfurt, Deutschland
  • Fiona Stritt - Institut für Musikermedizin, Universitätsklinikum und Hochschule für Musik Freiburg, Freiburg, Deutschland
  • Johannes Fischer - Klinik für Radiologie, Abteilung für medizinische Physik, Universitätsklinikum Freiburg, Freiburg, Deutschland
  • Michael Bock - Klinik für Radiologie, Abteilung für medizinische Physik, Universitätsklinikum Freiburg, Freiburg, Deutschland
  • Bernhard Richter - Institut für Musikermedizin, Universitätsklinikum und Hochschule für Musik Freiburg, Freiburg, Deutschland
  • Mario Fleischer - Charité – Universitätsmedizin Berlin, Berlin, Deutschland

38. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Leipzig, 29.09.-02.10.2022. Düsseldorf: German Medical Science GMS Publishing House; 2022. DocV8

doi: 10.3205/22dgpp12, urn:nbn:de:0183-22dgpp124

Published: September 26, 2022

© 2022 Traser et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Hintergrund: Sänger*innen müssen in der klassischen und populären Gesangsliteratur ein breites Spektrum an Klangfarben beherrschen. Gesangsschulen, wie z.B. Estill Voice Training®, definieren u.a. sechs verschiedene Stimmqualitäten (Speech, Falsetto, Sobbing, Twang, Opera und Belting), welche differenziert aus einzelnen Parametern, wie z.B. Art der Stimmlippenschwingung und Konfiguration des Vokaltraktes, zusammengesetzt werden. Wie ökonomisch dabei das Instrument Stimme funktioniert, wird u.a. maßgeblich von den Resonanzeigenschaften des Vokaltraktes bestimmt. Die MRT des Vokaltrakts ist ein etablierter Ansatz zur Untersuchung der Vokaltraktkonfiguration.

Material und Methoden: In dieser Pilotstudie wurde eine professionelle Sängerin gebeten die oben genannten sechs Stimmqualitäten auf zwei Tonhöhen (415 Hz und 208 Hz) und zwei Vokalkonditionen ([i:] und [a:]) in jeweils charakteristischer Lautstärke zu phonieren. Aus den segmentierten Vokaltraktoberflächen erstellten wir Finite-Elemente-Modelle, die dann zur Berechnung der Transferfunktionen des Vokaltrakts verwendet wurden. Aus diesen wurden im nächsten Schritt Filter angepasst, welche wiederum auf das akustische Signal der Sängerin angewendet wurden, um Rückschlüsse auf die verwendete stimmliche Anstrengung und damit ein Maß der Ökonomie der Stimmqualität zu erhalten.

Ergebnisse: Die Ergebnisse weisen auf drei unterschiedliche Konfigurationsarten (Belting/ Twang: kurz und „Megafon-artig“, Falsetto/ Speech: mittel-neutral, Opera/ Sob: lang und „anti-megafon“ mit weitem Hypopharynx) hin, welche sich auch in den akustischen Eigenschaften widerspiegeln. Diese werden durch die Lage der untersten zwei Resonanzen (ƒR1&2) in Relation zur Grundfrequenz (ƒo) und den Harmonischen (2/3ƒo) charakterisiert (ƒR1&2: Opera/ Sob: am niedrigsten, Belting/Twang: am höchsten, Speech/Falsetto: mittlere Position). Dabei weisen die Gruppen intern charakteristische Unterschiede auf wie z.B. einen engeren supraglottischen Raum für Opera im Vergleich zu Sob auf.

Diskussion: Dies könnte auch mit Unterschieden in der Ausprägung der Resonanzmaxima zwischen 3 und 4 kHz zusammenhängen und sich in einem für Opera geringeren Energieaufwand zur Anregung des Vokaltraktes widerspiegeln.

Fazit: Ein besseres Verständnis dieser Parameter könnte eine bewusstere Vokaltrakteinstellung und verlässliche Produktion dieser Stimmqualitäten ermöglichen. Die Kenntnis über die Ökonomieunterschiede kann Überlastung und stimmlichen Problemen vorbeugen.


Text

Einleitung

Sänger*innen müssen in der klassischen und popularen Gesangsliteratur ein breites Spektrum an Klangfarben reproduzierbar beherrschen. Moderne Gesangsschulen, wie z.B. Estill Voice Training®, definieren u.a. sechs verschiedene Stimmqualitäten (Speech, Falsetto, Sobbing, Twang, Opera und Belting), welche differenziert aus einzelnen Parametern, wie z.B. Art der Stimmlippenschwingung und Konfiguration des Vokaltraktes, zusammengesetzt werden [1]. Wie ökonomisch dabei das Instrument Stimme funktioniert, wird u.a. maßgeblich von den Resonanzeigenschaften des Vokaltraktes bestimmt. Im westlich klassisch trainierten Gesang wird eine effiziente Stimmerzeugung z.B. durch die Verstärkung der akustischen Energie nach dem Konzept der sogenannten Sängerformanten in einem Bereich des Klangspektrums erreicht, wo Schallenergie vom Ohr besonders empfindlich wahrgenommen wird. Die Erhöhung der Lautstärke geht dabei häufig mit einer tiefen Kehlkopfposition, einer Verlängerung des Vokaltraktes und einer Erweiterung der Öffnung von Lippe, Kiefer und Rachen [2] sowie einer Verengung des Epilaryngealtubus [3] verbunden. Dagegen ist noch wenig über die Resonanzstrategien der sehr unterschiedlichen Phonationsarten bekannt, welche z.B. in der Popularmusik verwendet werden. Im Gegensatz zum klassischen Gesang westlicher Prägung wurde beschrieben, dass der Vokaltrakt z.B. beim Belting kürzer und im hypoharyngealen Bereich enger ist, während die Öffnung des Mundes zunimmt [4]. Akustisch sind Stimmqualitäten wie Belting und Twang durch eine sehr starke zweite Harmoische im Spektrum gekennzeichnet, die wahrscheinlich zum Teil auf der verlängerten Schussphase der Stimmlippenschwingung beruht [5], [6] und teilweise auf der Verstärkung der zweiten Harmonischen durch die Erhöhung der ersten Vokaltraktresonanz [7], [8], [9]. Es ist nicht bekannt, ob sich die Herangehensweise im Vergleich zur Resonanzstrategie klassisch trainierter Sängerinnen hinsichtlich der Ökonomie unterscheidet. Ziel der vorliegenden Studie war es, die Resonanzstrategien der genannten Stimmqualitäten vergleichend zu untersuchen, um jeweils Rückschlüsse auf die jeweilige Ökonomie schließen zu können.

Methoden

In dieser Pilotstudie wurde eine professionelle Sängerin gebeten die oben genannten sechs Stimmqualitäten auf zwei Tonhöhen (As3, 208 Hz und As4, 415Hz) und zwei Vokalkonditionen (/i:/ und /a:/) in jeweils charakteristischer Lautstärke im MRT liegend gemäß der Definition von Estill Voice Training® zu phonieren. Die Messung erfolgte mit einer bereits bei [10] beschriebenen Methode in einem 3-Tesla-MR System (Prisma, SiemensAG, München). Dabei sollte sie die Lautstärke entsprechend der typischen mittleren Lautstärke für die jeweilige Stimmqualität wählen. Zur Unterstützung der korrekten Durchführung stand ein Echtzeit-Spektrum als direktes Feedback zur Verfügung. Die Segmentierung der MRT-Daten, die Implementierung der Zahnmodelle und die Vorbereitung des Modells für die Simulation wurden wie in [11] ausführlich beschrieben durchgeführt. Drei Ärzte überprüften unabhängig voneinander alle Oberflächenmodelle (Co-Autoren SR, SF und LT) und passten diese bei Bedarf manuell an. Das Ergebnis des Segmentierungsprozesses waren Oberflächendarstellungen der luftgefüllten, laryngealen-, hypo- und oropharyngealen Höhlen mit einer Ausdehnung in den freien Raum vor dem offenen Mund.

Aus den segmentierten Vokaltraktoberflächen erstellten wir Finite-Elemente-Modelle, die dann zur Berechnung der Transferfunktionen des Vokaltrakts verwendet wurden (siehe Abbildung 1 [Abb. 1]).

Ergebnisse

Die Resonanzeigenschaften der 6 verschiedenen Phonationsarten lassen sich in drei grundlegend unterschiedliche Resonanzstrategien zuordnen (Abbildung 2 [Abb. 2]).

Dabei zeigten die kürzesten Vokaltrakte Belting und Twang eine „Megafon-artige“ Konfiguration welche mit einer besonders hohen Lage der ersten zwei Vokaltraktresonanzen (ƒR1&2) für den Vokal /a:/ einherging. Für den Vokal /i:/ war lediglich ƒR2 erhöht, während ƒR1 bei der Grundfrequenz ƒo zu finden war. Dabei lag für den Vokal /a:/ ƒR1 über ƒo und bei 408 Hz auch in enger Nachbarschaft von 2ƒo. Bei ƒo =408 Hz zeigte Belting für beide Vokale jeweils ein ausgeprägtes Resonanzmaximum um 3 kHz, welches bei Twang niedriger hinsichtlich der Amplitude ausgeprägt war und höher hinsichtlich der Frequenz lag. Opera und Sobbing-Modelle sind dagegen deutlich länger und weisen eine sogenannt „umgekehrte-Megafon“ Konfiguration auf, wobei der Mund eher geschlossen ist während der Hypopharynx ein größeres Volumen aufweist. Dies führt wiederum zu einer sehr tiefen Lage der untersten zwei Resonanzen ƒR1&2, wobei ƒR1 in enger Nachbarschaft zu ƒo lag. Opera war ebenfalls durch ausgeprägte Resonanzmaxima zwischen 3–4 kHz gekennzeichnet, während dieser Bereich bei Sobbing deutlich niedrigere Resonanzmaxima aufwiesen die zudem durch starke Antiresonanzen geprägt waren. Speech und Falsetto zeigen wieder sowohl bzgl. ihrer Länge als auch der Lage von ƒR1&2 eine mittlere Position auf und waren durch keine spezifische Resonanzstretegie bzgl. der höheren Resonanzfrequenzen charakterisiert. Im intra-Gruppen Vergleich zeigten Belting, Opera und Speech ein kleineres hypopharyngeales Volumen als Twang, Sobbing und Falsetto.

Diskussion

Ziel der vorliegenden Studie war es, das Wissen über die Resonanzstrategie verschiedener Stimmqualitäten zu erweitern, um damit Rückschlüsse auf deren Ökonomie schließen zu können. Bei dieser Ökonomie-Betrachtung spielen neben den rein physikalischen Eigenschaften (im Sinne des erzeugten Schalldruckpegels) auch psychoakustische Eigenschaften (im Sinne der Lautheit) eine wichtige Rolle. Neben diesen ökonomischen Überlegungen haben die untersuchten Phonationsarten der Klangerzeugung natürlich auch eine rein künstlerische Berechtigung, da sie in der Wahrnehmung des Zuhörers z.B. mit bestimmten Emotionen bezüglich des Interpreten verbunden sind. Zu den sechs hier analysierten Stimmqualitäten gehören jeweils zwei Varianten von drei grundsätzlich unterschiedlichen Typen von Vokaltraktkonfigurationen, die bereits in der Literatur anhand ihrer Vokalfarbe differenziert wurden [12]. Die klassische oder invertierte-Megaphon Konfiguration des Vokaltraktes bei Opera und Sobbing ist auch in den vorliegenden Daten durch eine Absenkung von ƒR1&R2 charakterisiert, was einer Änderung zu einer zentralisierten Vokalfarbe entspricht. Es wurde bereits diskutiert, dass das Absenken von ƒR1&R2 vorteilhaft sein könnte, um Instabilitäten zu vermeiden, welche beim Kreuzen von Resonanzen mit 2ƒo oder ƒo auftreten könnten wenn ƒo steigt [7]. Bzgl. Ökonomieüberlegungen zeigten Opera und Sobbing sehr unterschiedliche Resonanzstrategien im Bereich von 2,5–4 kHz, die durch starke Antiresonanzen bei Sobbing charakterisiert waren. Dies könnte mit den im Vergleich zu Opera größeren hypopharyngealen Volumen zusammenhängen, die auch das Volumen der Vallecula und des oberen Abschnitts der Sinus piriformis umfasst. Diese Nebenkavitäten, die mögliche Antiresonanzfrequenzen bewirken können, könnten sich dabei negativ auf Resonanzmaxima in dem für unser Ohr und damit die Ökonomie wichtigen Bereich der Vokaltraktkonfiuration auswirken [13], [14], [15], [16].

Belting und Twang erreichen durch die Megaphon-Konfiguration des Vokaltraktes eine sehr helle Vokalfarbe welche durch eine starke Erhöhung von ƒR1&R2 für /a:/ und ƒR2 für /i:/ charakterisiert ist. In der Literatur ist beschrieben, dass Belting durch eine Vollschwingung mit verlängerten Schussphase und damit im Vergleich zum klassischen Gesang geringerem Abfall des Energiespektrums mit starker 2ƒo charakterisiert wird [5], [6]. Das beschriebene Resonanzverhalten würde damit zumindest für den Vokal /a:/ diese Energie noch unterstützen und gleichzeitig eine Kreuzung mit ƒo vermeiden. Dabei weist der Belting-Vokaltrakt extrem kleine Volumina im Hypopharynx auf, was ebenfalls die Resonanzerhöhung um 3 kHz bewirken könnte. Interessanterweise fällt diese für die Twang-Modelle im Schnitt geringer auf die wiederum aber auch ein in Relation größeres hypopharyngeales Volumen aufweisen.

Speech und Falsetto weisen bzgl. der Vokalfarbe und Konfiguration meist eine mittlere Einstellung auf. Bei As3 sind wiederum Belting und Speech von der Einstellung bei ƒR1&R2 sehr vergleichbar, was für eine möglicherweise tonhöhenspezifische Charakteristik spricht. In der tiefen Phonation weist Speech auch Resonanzmaxima um 4 kHz auf, wobei bei der höheren Phonation beide Modelle, Speech und Falsetto, wiederum nicht durch eine spezifische Resonanzverstärkung in diesem Bereich charakterisiert sind. Die Ergebnisse sprechen für eine höhere Ökonomie von Speech bei tiefer Phonation, was evtl. auch zum Ursprung der Funktion, welche ja dem Sprechen entlehnt ist, passend wäre.

Schlussfolgerung

Opera und Belting könnten bzgl. ihr Auswirkungen auf die Lautheit günstige Konfigurationen darstellen, die jedoch unterschiedliche Verstärkungsstrategien anwenden. Die Daten weisen zudem auf die für die Ökonomie negative Wirkung von abhängigen Volumina wie der Vallecula und dem Sinus piriformis hin. Ein besseres Verständnis dieser Parameter in weiteren Studien inkl. Qualifizierung der Ökonomieparameter könnte eine bewusstere Vokaltrakteinstellung und verlässliche Produktion dieser Stimmqualitäten ermöglichen. Die Kenntnis über die Ökonomieunterschiede kann Überlastung und stimmlichen Problemen vorbeugen.


Literatur

1.
Steinhauer K, Klimek M, Estill J. The Estill Voice Model: Theory and Translation. 2017.
2.
Echternach M, Burk F, Burdumy M, Traser L, Richter B. Morphometric Differences of Vocal Tract Articulators in Different Loudness Conditions in Singing. PLoS One. 2016;11(4):e0153792. DOI: 10.1371/journal.pone.0153792 External link
3.
Mainka A, Platzek I, Klimova A, Mattheus W, Fleischer M, Mürbe D. Relationship between epilarynx tube shape and the radiated sound pressure level during phonation is gender specific. Logoped Phoniatr Vocol. 2021 Oct:1-13. DOI: 10.1080/14015439.2021.1988143 External link
4.
Echternach M, Popeil L, Traser L, Wienhausen S, Richter B. Vocal tract shapes in different singing functions used in musical theater singing-a pilot study. J Voice. 2014 Sep;28(5):653.e1-653.e7. DOI: 10.1016/j.jvoice.2014.01.011 External link
5.
Titze IR, Worley AS, Story BH, Titze I. Source-Vocal Tract Interaction in Female Operatic Singing and Theater Belting VOICE RESEARCH AND TECHNOLOGY Ingo Titze, Associate Editor. J Sing. 2011;67(5):561-72.
6.
Stone RE, Cleveland TF, Sundberg PJ, Prokop J. Aerodynamic and acoustical measures of speech, operatic, and broadway vocal styles in a professional female singer. J Voice. 2003;17(3):283-97. DOI: 10.1067/S0892-1997(03)00074-2 External link
7.
Titze IR, Worley AS. Modeling source-filter interaction in belting and high-pitched operatic male singing. J Acoust Soc Am. 2009 Sep;126(3):1530. DOI: 10.1121/1.3160296 External link
8.
Sundberg J, Thalén M, Popeil L. Substyles of belting: phonatory and resonatory characteristics. J Voice. 2012 Jan;26(1):44-50. DOI: 10.1016/j.jvoice.2010.10.007 External link
9.
Bourne T, Garnier M. Physiological and acoustic characteristics of the female Music Theater voice. J Acoust Soc Am. 2012 Feb;131(2):1586-94. DOI: 10.1121/1.3675010 External link
10.
Traser L, Birkholz P, Flügge TV, Kamberger R, Burdumy M, Richter B, Korvink JG, Echternach M. Relevance of the Implementation of Teeth in Three-Dimensional Vocal Tract Models. J Speech Lang Hear Res. 2017 Sep;60(9):2379-93. DOI: 10.1044/2017_JSLHR-S-16-0395 External link
11.
Birkholz P, Kürbis S, Stone S, Häsner P, Blandin R, Fleischer M. Printable 3D vocal tract shapes from MRI data and their acoustic and aerodynamic properties. Sci Data. 2020 Aug;7(1):255. DOI: 10.1038/s41597-020-00597-w External link
12.
Titze IR, Maxfield LM, Walker MC. A Formant Range Profile for Singers. J Voice. 2017 May;31(3):382.e9-382.e13. DOI: 10.1016/j.jvoice.2016.08.014 External link
13.
Delvaux B, Howard D. A new method to explore the spectral impact of the piriform fossae on the singing voice: benchmarking using MRI-based 3D-printed vocal tracts. PLoS One. 2014;9(7):e102680. DOI: 10.1371/journal.pone.0102680 External link
14.
Dang J, Honda K. Acoustic characteristics of the piriform fossa in models and humans. J Acoust Soc Am. 1997 Jan;101(1):456-65. DOI: 10.1121/1.417990 External link
15.
Takemoto H, Mokhtari P, Kitamura T. Acoustic analysis of the vocal tract during vowel production by finite-difference time-domain method. J Acoust Soc Am. 2010 Dec;128(6):3724-38. DOI: 10.1121/1.3502470 External link
16.
Feng M, Howard DM. The Dynamic Effect of the Valleculae on Singing Voice - An Exploratory Study Using 3D Printed Vocal Tracts. J Voice. 2021 Jan. DOI: 10.1016/j.jvoice.2020.12.012 External link