gms | German Medical Science

39. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP)

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

28.09. - 01.10.2023, Köln

Testung deutscher Sprechstimuli zur Messung der relativen Grundfrequenz

Vortrag

39. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Köln, 28.09.-01.10.2023. Düsseldorf: German Medical Science GMS Publishing House; 2023. DocV33

doi: 10.3205/23dgpp57, urn:nbn:de:0183-23dgpp578

Veröffentlicht: 20. September 2023

© 2023 Rehring et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Hintergrund: Die Stimmanstrengung ist eine häufige Beschwerde bei Personen mit Stimmstörungen. Die relative Grundfrequenz (RFF) ist ein akustisches Maß für stimmliche Anstrengung. Die RFF misst die relative Veränderung der glottalen Zyklen der Stimme mit einer Verbindung zwischen einem Sonorant, einem stimmlosen Konsonant und wieder einem stimmhaften Sonorant (z.B. „afa“). Derzeit sind die validierten Sätze mit gezielten RFF-Segmenten nur in englischer Sprache verfügbar. Ziel dieser Studie soll es sein, festzustellen, welche der hier neu entwickelten deutschen RFF-Sätze und der etablierten einheitlichen Äußerungen die niedrigste Variabilität auf der Token-Ebene aufweisen. Es wird erwartet, dass die verwendeten Sätze und einheitlichen Äußerungen eine moderate Variabilität aufweisen (Sätze SD < 0,6 Halbtöne; einheitliche Äußerungen SD < 0,5 Halbtöne).

Material und Methoden: Ein Gremium aus drei deutschsprachigen und akademisierten Sprachtherapeut*innen entwickelte sechs potenzielle RFF-Satzstimuli mit jeweils drei der Zielkonsonanten /f/ und /ʃ/ in deutscher Sprache, die den Kriterien der englischen Satzstimuli entsprachen (z.B. „In der Auffahrt wächst nie viel Efeu.“). Einheitliche Äußerungen zur Messung von RFF wurden unverändert übernommen (z.B. „afa“). Die stimmgesunden Teilnehmer*innen werden mit einem Kopfmikrofon und einem Audioverstärker aufgenommen. Die Stimuli werden jeweils dreimal aufgezeichnet. Anhand dieser Aufnahmen wird die durchschnittliche Variabilität auf der Token-Ebene ermittelt.

Ergebnisse: Ziel ist die Analyse von zehn weiblichen und zehn männlichen Stimmproben. Die durchschnittliche Variabilität auf der Token-Ebene von neun bisher aufgenommenen Sprecher*innen rangierte zwischen 0,5 und 0,85 Halbtönen. Der Satz mit dem Zielkonsonanten /f/ mit der geringsten Variabilität war “In der Auffahrt wächst nie viel Efeu.” und für das /ʃ/ „Die Schar Kinder nimmt die Schere mit in die Schule.“. Bei den einheitlichen Äußerungen zeigte „ifi“ die geringste Variabilität, gefolgt von „ufu“ und „afa“.

Diskussion: Vor dem Hintergrund der bisher erhobenen Daten ist eine Bestätigung der Hypothesen erwartbar. Die deutschen Satzstimuli variierten im ähnlichen Umfang wie die englischen Sätze. Bei den einheitlichen Äußerungen entsprach die Rangfolge der Variabilität den englischen Vergleichsdaten.

Fazit: Es wurden deutsche Satzstimuli entwickelt von denen zwei auf Grundlage der bisherigen Datenerhebung und Kriterien für RFF-Analysen geeignet sind.


Text

Hintergrund

Die Stimmanstrengung ist eine häufige Beschwerde bei Personen mit Stimmstörungen. Die relative Grundfrequenz (relative fundamental frequency, RFF) ist ein akustisches Maß für stimmliche Anstrengung. Die RFF misst die relative Veränderung der glottalen Zyklen der Stimme mit einer Verbindung zwischen einem Vokal, einem stimmlosen Konsonanten und wieder einem stimmhaften Vokal (engl. vowel-consonant-vowel, VCV; z.B. /afa/). Derzeit sind die validierten Sätze mit gezielten RFF-Segmenten nur in englischer Sprache verfügbar. Ziel dieser Studie soll es sein, festzustellen, welche der hier neu entwickelten deutschen RFF-Sätze und der etablierten einheitlichen Äußerungen die niedrigste Variabilität auf der Token-Ebene aufweisen. Es wird erwartet, dass die verwendeten Sätze und einheitlichen Äußerungen eine moderate Variabilität aufweisen, d.h. für Sätze eine Standardabweichung (SD) unter 0,6 Halbtönen (HT) und für die einheitlichen Äußerungen unter 0,5 HT.

Material und Methoden

Ein Gremium aus drei deutschsprachigen und akademisierten Sprachtherapeut*innen entwickelte sechs potenzielle RFF-Satzstimuli mit jeweils drei der Zielkonsonanten /f/ und /ʃ/ in deutscher Sprache, die den Kriterien der englischen Satzstimuli entsprechen (z.B. „In der Auffahrt wächst nie viel Efeu.“, [1]). Die einheitlichen Äußerungen zur Messung von RFF, bestehend aus einer Vokal-Konsonant-Vokal-Folge, wurden unverändert übernommen (/afa/, /ifi/, /ufu/). Die Aufzeichnung der stimmgesunden Teilnehmer*innen erfolgte mit einem Kopfmikrofon (AKG C520) in einem Winkel von 45 Grad sowie einem Abstand von 4 cm zum naheliegenden Mundwinkel. Als Audioverstärker wurde ein Focusrite Scarlett 2i2 mit 44.1 kHz and 16-bit Auflösung verwendet. Jegliche Stimuli wurden jeweils dreimal aufgezeichnet.

Für die Datenanalyse wurden die VCV-Äußerungen manuell [2] und die Sätze mittels WebMAUS segmentiert [3], [4], um Text und Aufnahme einander zuzuordnen. Anhand dieser Zuordnung wurden Zielstrukturen für die Berechnung der RFF herausgebildet (z.B. “In der Auffahrt wächst nie viel Efeu”; s. Tabelle 1 [Tab. 1]). Im Folgenden wurden für Sätze und einheitliche Äußerungen die Glottisschläge der Zielstrukturen erfasst. Dies erfolgte mit der Software Praat (2021) und MATLAB (v6.1.29) [5], [6].

Anhand der Halbtonunterschiede der unmittelbar vor und nach dem stimmlosen Konsonant umgebenden zehn Glottisschläge und der stationären Frequenz wurde die RFF durch folgende Formel ermittelt [1]:

RFFn = 12 * log2 (fn / fss)

Hierbei ist n die Nummer des Glottisschlags von eins bis zehn mit fn als der unmittelbaren Frequenz des nen Zyklus und fss als der unmittelbaren Frequenz des stationären Zykluses. Die Zurückweisungskriterien sind aus Lien et al. [6] entnommen. Für jeden Satz, Vokal und die einzelnen Zielfrikativgruppen (z.B. Sätze mit /f/) wurden Mittelwert und Standardabweichung ermittelt. Anschließend wurde die durchschnittliche Variabilität auf der Token-Ebene berechnet.

Ergebnisse

Die Standardabweichungen der RFF der einzelnen Token-Ebenen für die unterschiedlichen Sprechstimuli sind Tabelle 1 [Tab. 1] zu entnehmen. Auf Satzebene hatten “In der Auffahrt wächst nie viel Efeu” die geringste Variabilität für den Zielkonsonanten /f/, “Die Schar Kinder nimmt die Schere mit in die Schule” und “Sie sah ihn die schönen, so schicken Teller zuschieben.” für den Konsonanten /ʃ/. Bei den einheitlichen Äußerungen zeigte /ifi/ die geringste Variabilität.

Diskussion

Wie erwartet liegt die Variabilität der Standardabweichung der RFF-Mittelwerte für Sätze unterhalb von 0,6 HT und für die einheitlichen Äußerungen unterhalb von 0,5 HT. Im Vergleich zur Untersuchung der englischsprachigen Satzstimuli (0,59 HT) zeigen die deutschsprachigen eine geringere durchschnittliche Variabilität der Standardabweichung [1]. Der Satz “Die Schar Kinder nimmt die Schere mit in die Schule” hat wegen des fehlenden Kommas und der Kompaktheit eine bessere Lesbarkeit als “Sie sah ihn die schönen, so schicken Teller zuschieben“, weshalb er von den Autoren bevorzugt wird. Bei den einheitlichen Äußerungen entsprach die Rangfolge der Variabilität den englischen Vergleichsdaten (/ifi/ < /ufu/ < /afa/).

Fazit/Schlussfolgerung

Es wird empfohlen, die Sätze “In der Auffahrt wächst nie viel Efeu“ und “Die Schar Kinder nimmt die Schere mit in die Schule” als Satzstimuli für die Ermittlung der RFF zu verwenden. Es konnte gezeigt werden, dass durch die strikte Einhaltung der Kriterien aus Lien et al. [1] Sätze erstellt werden können, die eine relativ geringe Variabilität der RFF aufweisen. Dadurch können deutsch- und anderssprachige Forschungsprojekte zu Stimmermüdung von Satzstimuli für die RFF-Analyse profitieren.


Literatur

1.
Lien YAS, Gattuccio CI, Stepp CE. Effects of phonetic context on relative fundamental frequency. Journal of Speech, Language, and Hearing Research. 2014;57(4):1259-67. DOI: 10.1044/2014_JSLHR-S-13-0158 Externer Link
2.
Vojtech JM, Murray EH. Tutorial for manual relative fundamental frequency (RFF) estimation using Praat. 2019. Available from: https://sites.bu.edu/stepplab/research/rff/ Externer Link
3.
Kisler T, Reichel U, Schiel F. Multilingual processing of speech via web services. Computer Speech & Language. 2017;45:326-47. DOI: 10.1016/j.csl.2017.01.005 Externer Link
4.
Schiel F. Automatic Phonetic Transcription of Non-Prompted Speech. Universitätsbibliothek der Ludwig-Maximilians-Universität München; 1999.
5.
Berardi M, Tippit E, DeSouza GN, Dietrich M. Automatic segmentation of relative fundamental frequency from continuous speech. In: The 14th International Conference on Advances in Quantitative Laryngology, Voice and Speech Research (AQL), Bogotá, Colombia, 2021.
6.
Lien YA, Stepp CE. Automated estimation of relative fundamental frequency. Annu Int Conf IEEE Eng Med Biol Soc. 2013;2013:2136-9. DOI: 10.1109/EMBC.2013.6609956 Externer Link