gms | German Medical Science

37. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP)

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

17.09. - 18.09.2021, digital

Lassen sich Interaktionen zwischen dem Vokaltrakt und der Stimmquelle bei Sängern nachweisen?

Vortrag

  • corresponding author presenting/speaker Matthias Echternach - Abteilung für Phoniatrie und Pädaudiologie, Klinik für Hals-Nasen-Ohrenheilkunde, LMU Klinikum, München, Deutschland
  • Christian Herbst - Antonio Salieri Department of Vocal Studies and Vocal Research in Music Education, University of Music and Performing Arts Vienna, Wien, Österreich
  • Marie Köberlein - Abteilung für Phoniatrie und Pädaudiologie, Klinik für Hals-Nasen-Ohrenheilkunde, LMU Klinikum, München, Deutschland
  • Brad Story - Department of Speech, Language and Hearing Sciences, University of Arizona, Tuczon, Vereinigte Staaten
  • Michael Döllinger - Abteilung für Phoniatrie und Pädaudiologie, Klinik für Hals-Nasen-Ohrenheilkunde, Uniklinik Erlangen, Erlangen, Deutschland
  • Donata Gellrich - Abteilung für Phoniatrie und Pädaudiologie, Klinik für Hals-Nasen-Ohrenheilkunde, LMU Klinikum, München, Deutschland

37. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). sine loco [digital], 17.-18.09.2021. Düsseldorf: German Medical Science GMS Publishing House; 2021. DocV28

doi: 10.3205/21dgpp08, urn:nbn:de:0183-21dgpp087

Veröffentlicht: 28. Oktober 2021

© 2021 Echternach et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Hintergrund: Theoretische Ansätze zeigen, dass Resonanzen des Vokaltraktes nicht-linear mit der Stimmquelle interagieren könnten. Jedoch liegen nur sehr wenige Untersuchungen hinsichtlich der Fragestellung vor, ob sich solche Interaktionen auch in vivo nachweisen lassen.

Material und Methoden: Bei 12 professionellen Sängern (6 Frauen und 6 Männer) wurden gleitende Vokalübergänge von /i/ über /a/ und /u/ zurück zum /i/ auf konstanter Tonhöhe d’ (ca. 294 Hz) hinsichtlich der Stimmlippenschwingungen untersucht. Hierzu wurden simultan transnasale Hochgeschwindigkeitsaufnahmen (20.000 fps) sowie elektroglottographische (EGG) und akustische Aufnahmen gemacht und in Bezug auf Kreuzungspunkte von Teiltönen (nƒo) und Resonanz- bzw. Formantfrequenzen (ƒFn) systematisch untersucht.

Ergebnisse: Auch wenn sich Änderungen des Offenquotienten für die /i-a/ und /u-i/ Übergänge zum Teil darstellen lassen, konnten an den erwarteten Kreuzungsstellen /i-a/ (2ƒo/ƒF1), /a-u/ (2ƒo/ƒF1) und /u-i/ (3ƒo or 4ƒo /ƒF2) zum Großteil keine systematischen Effekte beobachtet werden. Allerdings konnten an Punkten, an denen perzeptiv im EGG-Signal Auffälligkeiten identifizierbar waren, auch regelmäßig Änderungen im Grundfrequenzgang und in Phonovibrogrammen nachgewiesen werden. Letztere sind hinsichtlich der auftretenden Kreuzungspunkte als Interaktion von Resonanzen mit den Stimmlippenschwingungen (Level 2 nach Titze) zu werten.

Diskussion: Die Untersuchungen unterstützen die Hypothese, dass es singulär zu Interaktionen zwischen Vokaltraktresonanzen und der Stimmquelle kommen kann. Dadurch, dass diese aber nicht systematisch in Erscheinung traten, scheinen andere Begleitfaktoren (z.B. Stimmtechnik, morphologische Gegebenheiten etc.) hinsichtlich der Stabilität der Stimmlippenschwingung auch von wesentlicher Bedeutung zu sein. Jene zu identifizieren, könnte auch für Patienten mit Stimmstörungen von hoher Bedeutung sein.


Text

Einleitung

Während die Stimmerzeugung prinzipiell als lineare Abfolge – Kompressor, Oszillator, Resonator – beschrieben ist, wird gleichzeitig angenommen, dass es nicht-lineare Interaktionen zwischen Vokaltrakt und Stimmquelle gibt. Diese sind bislang nicht systematisch erfasst bzw. abschließend erklärt.

Bei Nicht-linearen Level-1-Interaktionen (L1-SFI) modifiziert der reflektierte Schalldruck den Luftstrom und nimmt somit Einfluss auf das Quellspektrum, jedoch ohne Auswirkungen auf die Stimmlippen. Bei Nicht-linearen Level-2-Interaktionen (L2-SFI) hingegen nimmt der reflektierte Schall Einfluss auf die Stimmlippenschwingung, was bedeutet, dass es zu Instabilitäten und Unterbrechungen kommen kann [1]. Das Auftreten der nicht-linearen Level-2-Interaktionen wird beim Durchkreuzen von den Vokaltraktresonanzen fR1,2,3 und den niedrigeren Teiltönen (2fo-5fo) erwartet, vornehmlich bei Tonhöhenänderungen oder fließenden Vokaländerungen, bei denen sich eine Teiltonfrequenz innerhalb der Resonanz- bzw. Formant-Bandbreite zunächst unterhalb und schließlich oberhalb einer Formantfrequenz befindet ([2], [3], [4]).

Material und Methoden

In dieser Studie wurde versucht, Nicht-lineare Level-2-Interaktionen zu erzeugen, indem die Grundfrequenz D4 (ƒo≈294 Hz) konstant phoniert wurde, während der Vokal darüber in der Reihenfolge [i:] – [a:] – [u:] – [i:] gleitend verändert wurde. Durch die Änderung der Vokalformanten wurden die folgenden Kreuzungen von Formant- und Teiltonfrequenz konstruiert (Abbildung 1 [Abb. 1]):

[i:] – [a:]: 2ƒo/fR1

[a:] – [u:]: 2ƒo/fR1

[u:] – [i:]: 3ƒo/fR2 und o/fR2

Die Stimmlippenschwingungen wurden mittels transnasaler Video-High-Speed-Endoskopie (HSV, resultierend in Glottal Area Waveform GAW) mit 20.000 Bildern pro Sekunde aufgenommen, sowie elektroglottographisch (EGG) und akustisch aufgezeichnet. Gemessen wurden zwölf stimmgesunde professionelle SängerInnen (jeweils 3 Sopranistinnen, Altistinnen, Tenöre und Bässe). Die Formantfrequenzen wurden durch cepstrale Analyse aus dem Audiosignal ermittelt.

Mögliche Interaktionsvorkommen wurden zunächst rechnerisch ermittelt: Um die Punkte herum, wo Formantfrequenzen und Partialtöne kreuzten, wurden 25 ms Fenster definiert, für welche Sample Entropy (SE), Open Quotient (OQEGG, OQGAW), Closing Quotient (ClQGAW), Speed Quotient (SQ), Relative Average Perturbation (RAP) und Lautstärke (Sound Pressure Level SPL) errechnet wurden, sowie das Audio-Signal ausgewertet und Phonovibrogramme (PVG), dEGG-Wavegrams und Glottovibrogramme (GVG) erstellt.

Des Weiteren wurden durch ein auditives Experten-Rating des EGG-Signals irreguläre Ereignisse festgestellt, deren Signale dann im Detail betrachtet wurden.

Ergebnisse

An den errechneten Kreuzungsstellen wurde folgendes beobachtet:

Im Übergang [i:] – [a:] waren OQGAW und ClGAW erhöht, sowie die Grundfrequenz vor dem Übergang höher als danach. Im Übergang [u:] – [i:] war OQGAW tendenziell erhöht. Bei Übergang [a:] – [u:] war die Grundfrequenz nach dem Übergang höher als davor, sowie im GVG die Unterschiede in der Öffnungsphase erhöht (Abbildung 2 [Abb. 2]).

Die Lautstärke war im Übergang [i:] – [a:] erhöht und im Übergang [a:] – [u:] verringert. Die PVGs zeigten keine auffällige Aperiodizität in den Übergängen. Bei einer Probandin traten anterior-posteriore Phasenverschiebungen in allen Übergängen auf.

Die Vokalübergänge wiesen erwartungsgemäß Änderungen in den Intensitäten der Teiltöne auf. Bei einzelnen Probanden waren Anpassungen im dEGG-Wavegram und der Sample Entropy des EGG-Signals sichtbar. An einigen der perzeptiv ermittelten Stellen waren Grundfrequenzschwankungen und Änderungen im Phonovibrogramm sichtbar. An diesen Stellen ließen sich teilweise Kreuzungen höherer Partialtöne und Formantfrequenzen feststellen.

Diskussion

Die Tonhöhenschwankungen vor und nach den Vokalübergängen lassen sich in Übereinstimmung mit Titze [1] dadurch erklären, dass die Steifigkeit leicht erhöht sein kann, wenn ein Teilton leicht oberhalb einer Resonanz liegt, was zu einer Grundfrequenzerhöhung führen kann.

Der erhöhte OQGAW in den Übergängen [i:] – [a:] und [u:] – [i:] sowie Auffälligkeiten im Zusammenhang unterschiedlicher nfo/fRn-Kreuzungen deuten auf L2-SFI bei Deckungsgleichheit von nfo und fRn hin.

Dass in den PVG nur wenige Auffälligkeiten zu beobachten waren, kann einerseits bedeuten, dass es keine sehr starken Interaktion gab oder andererseits, dass professionelle Sänger Techniken bzw. andere Komponenten zur Stabilisierung anwenden.

Limitierend ist zu bemerken, dass die Geschwindigkeit des Vokalübergangs nicht standardisiert war. Es kann sein, dass eine langsamere Modifikation leichter ausgeglichen werden kann als eine schnellere. Die gewählte Tonhöhe D4 liegt zudem für Männerstimmen eher hoch und für Frauen eher tief, jedoch für beide Gruppen im Bereich eines Passaggios (Registerübergang), weshalb nicht ausgeschlossen werden kann, dass die Beobachtungen mit der Registrierung zu tun haben.

Außerdem könnte die transnasale Endoskopie die Phonation sowie die Nasalanz beeinflusst haben. Eine Ankopplung der Nasenräume könnte dann zu einer Erhöhung von fR1 geführt haben [5].


Literatur

1.
Titze IR. Nonlinear source-filter coupling in phonation: theory. J Acoust Soc Am. 2008;123(5):2733-49. DOI: 10.1121/1.2832337 Externer Link
2.
Maxfield L, Palaparthi A, Titze I. New Evidence That Nonlinear Source-Filter Coupling Affects Harmonic Intensity and fo Stability During Instances of Harmonics Crossing Formants. J Voice. 2017;31(2):149-56. DOI: 10.1016/j.jvoice.2016.04.010 Externer Link
3.
Wade L, Hanna N, Smith J, Wolfe J. The role of vocal tract and subglottal resonances in producing vocal instabilities. J Acoust Soc Am. 2017;141(3):1546. DOI: 10.1121/1.4976954 Externer Link
4.
Sundberg J, Lã FM, Gill BP. Voice Source Variation Between Vowels in Male Opera Singers. J Voice. 2016;30(5):509-17. DOI: 10.1016/j.jvoice.2015.07.010 Externer Link
5.
Havel M, Sundberg J, Traser L, Burdumy M, Echternach M. Effects of Nasalization on Vocal Tract Response Curve. J Voice. 2021;S0892-1997(21):00065-5. DOI: 10.1016/j.jvoice.2021.02.013 Externer Link