gms | German Medical Science

29. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

21.09. - 23.09.2012, Bonn

Subharmonische in fortlaufender Sprache

Vortrag

Suche in Medline nach

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 29. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Bonn, 21.-23.09.2012. Düsseldorf: German Medical Science GMS Publishing House; 2012. Doc12dgppV19

doi: 10.3205/12dgpp31, urn:nbn:de:0183-12dgpp316

Veröffentlicht: 6. September 2012

© 2012 Kramer et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Zusammenfassung

Hintergrund: Versuche mit gehaltenen und synthetisierten Vokalen haben gezeigt, dass neben Jitter und Shimmer, die traditionell als akustische Korrelate von perzipierter Rauigkeit angesehen werden, auch subharmonische Frequenzen zum rauen Stimmklang beitragen können.

Material und Methoden: Deshalb untersuchten wir die Stimmproben von 70 nach Geschlecht und Alter angepassten Probanden (m=35, w=35) mit diversen Stimmkrankheiten im Hinblick auf den Zusammenhang zwischen perzipierter Rauigkeit. Einschlusskriterium war das Vorhandensein subharmonischer Frequenzen in mindestens 10 Vokalen (ca. 5%) im Standardtext ”Nordwind und Sonne”. Fünf Stimmexperten, die bei Voruntersuchungen eine akzeptable intra- und interindividueller Reproduzierbarkeit nachweisen konnten, beurteilten die Stimmproben.

Ergebnisse: Alle Stimmen, die die Einschlusskriterien erfüllten, wurden als ”rau” empfunden. Die wahrgenommene Rauigkeit korrelierte signifikant mit Irregularität im F0 Verlauf (r=0.58, p<0.01) und mit prozentuellem Anteil von Oktavfehlern (r=0.47, p<0.01). Eine signifikante Korrelation bestand zwischen prozentuellem Anteil von Oktavfehlern und relativer Stärke von der 2. Subharmonischen im Vergleich zu F0 (r=0.58, p<0.01). Abgesehen von der Höhe der Stimmlage (Modalwert von F0) wiesen die beiden Gruppen keine Unterschiede in den untersuchten Merkmalen auf. Es ergab sich ein kleiner aber signifikanter Unterschied in Raugkeitsurteilen zwischen den Geschlechtern (weibliche Stimmen mit Subharmonischen waren als weniger rau empfunden), deren Ursprung nicht auf Unterschiede in der Höhe der Stimmlage zurückgeführt werden konnte.

Diskussion: Unsere Daten stützen die Annahme, dass subharmonische Frequenzen häufig in fortlaufender Sprache vorkommen und die Perzeption der Rauigkeit maßgeblich bestimmen. Unter Probanden mit Subharmonischen in Vokalsegmenten laufender Sprache hatten nur 34% solche Subharmonischen in gehaltenen Vokale /a/ und /e/. Messungen an gehaltenen Vokalen unterschätzen das Problem und sind daher im Gegensatz zu laufender Sprache nicht geeignet, Subharmonische als Korrelat von Rauigkeit zu entdecken.


Text

Hintergrund

Im Spektrum kranker Stimmen kann häufig neben dem Auftreten von Harmonischen (ganzzahlige Vielfache der Grundfrequenz) auch das Anschwingen von subharmonischen Frequenzen (ganzzahlige Teiler der Grundfrequenz) beobachtet werden. Im Vergleich zu stochastisch auftretenden Störungen der Schwingungsperiodizität wie Jitter und Shimmer zählen Subharmonische zu periodisch wiederkehrenden Unregelmäßigkeiten. Versuche mit gehaltenen und synthetisierten Vokalen haben gezeigt, dass neben Jitter und Shimmer, die traditionell als akustische Korrelate von perzipierter Rauigkeit angesehen werden, auch subharmonische Frequenzen zum rauen Stimmklang beitragen können [1], [2]. Es konnte festgestellt werden, dass unter akustischen Eigenschaften von Subharmonischen insbesondere die Stärke und die Frequenzlage von Subharmonischen (und somit auch die Frequenzlage des Grundtons) mit dem rauen Stimmklang verbunden waren. Diese Studie untersucht gesprochene Sprache von Probanden mit diversen Stimmkrankheiten im Hinblick auf den Zusammenhang zwischen Subharmonischen und perzipierter Rauigkeit.

Material und Methode

Das Schmalbandspektrum von akustischen Signalen im Frequenzband zwischen 0 bis 2000 Hz wurde auf subharmonische Frequenzen untersucht. Einschlusskriterium für die Aufnahme in die Studie war das Vorhandensein subharmonischer Frequenzen in mindestens 10 aus 182 Vokalen im Standardtext „Nordwind und Sonne“. Ein Korpus aus 145 kranken und 5 gesunden Stimmen ergab 77 geeignete Stimmproben. Nach Anpassung von Geschlecht und Alter standen 70 Stimmproben (m=35, w=35) für weitere Analyse zur Verfügung. Das mittlere Alter betrug bei Männern 58.3 (15.8) und bei Frauen 56.2 (15.6) Jahre. Anschließend wurden auch die in bequemer Ton- und Intensitätslage gehaltenen Phonationen /a/ und /e/ auf das Vorhandensein von Subharmonischen untersucht.

Fünf Stimmexperten, die bei Voruntersuchungen eine akzeptable intra- und interindividuelle Reproduzierbarkeit nachweisen konnten, beurteilten die Stimmproben. Zu jeder Stimmprobe wurde aus den einzelnen Urteilen ein arithmetischer Mittelwert gebildet.

Aus dem Text extrahierte Vokalsegmente wurden konkateniert und einer weiteren Analyse unterzogen. Die Stärke der zweiten Subharmonischen (relativ zu F0) wurde anhand von FFT Spektrum mit Hanning-Fenster gemessen. Das Messergebnis stellt jeweils einen Mittelwert über 10 repräsentative Vokalsegmente (ca. 100 ms) dar. Da starke subharmonische Frequenzen subharmonische Fehler bei der Grundfrequenzbestimmung bewirken können, beziehen sich 3 weitere Parameter auf den Grundfrequenzverlauf. Zur Bestimmung der Grundfrequenz wurde die Autokorrelationsmethode verwendet. Die Grundfrequenzkonturen enthielten 100 F0-Werte pro Sekunde. Die untere Grenze der Grundfrequenz lag bei 30 Hz. Der Schwellwert, von dem an ein F0-Wert als stimmhaft eingestuft wird, und der entsprechende Stille Schwellwert wurden auf 0.25 bzw. 0.1 eingestellt. Aus den Grundfrequenzkonturen wurde Irregularität berechnet, die Verteilung der F0-Werte wurde graphisch als Histogramm dargestellt. In Abbildung 1 [Abb. 1] sind zwei Bespiele für Histogramme zur Darstellung der F0-Werte zu sehen. Histogramme dienten der Ermittlung vom Modalwert von F0 (der häufigste Wert). Im Durchschnitt enthielt jedes Histogramm 996 (SD=140) F0-Werte. Sollte sich ein deutliches zweites Maximum im Histogramm im unteren Frequenzbereich zeigen, das auf subharmonische Fehler zurückgeführt werden konnte, war das Maximum, das eher dem aus dem Schmalbandspektrum gewonnenen visuellen Eindruck von F0 entsprach, als Modalwert von F0 gewertet. Das Ausmaß, in dem die Stimme von subharmonischen Fehlern betroffen wurde, konnte nur annäherungsweise bestimmt werden durch den prozentuellen Anteil der F0-Werte, die mehr als 10 Halbtöne entfernt vom Modalwert von F0 liegen. Die Irregularität gibt hier das Verhältnis von der Anzahl der jeweils 2 konsekutiven F0-Werte, die sich um mehr als 2 Halbtöne unterscheiden, zu der Anzahl der untersuchten F0-Paare wieder. Dieser Parameter erfasst F0-Änderungen, die sowohl durch Ein- und Ausschwingen von Subharmonischen als auch durch größere F0-Exkursionen, zustande kommen.

Ergebnisse

Die Analyse des Schmalbandspektrums ergab, dass kranke Stimmen unterschiedlich stark mit Subharmonischen besetzt werden können. Dennoch wurden alle Stimmen, die die Einschlusskriterien erfüllten, als „rau“ empfunden. Die Urteile über wahrgenommene Rauigkeit lagen zwischen 0.8 und 3.0. In 44 Probanden wurde durchgehend nur eine subharmonische Frequenz zwischen zwei benachbarten Harmonischen identifiziert. In 9 männlichen und 19 weiblichen Probanden schwankte die Zahl der Subharmonischen von Vokal zu Vokal zwischen 1 und 2, selten 3. Unter Probanden mit Subharmonischen in Vokalsegmenten laufender Sprache hatten nur 34% solche Subharmonischen in gehaltenen Vokalen /a/ und /e/.

Mehr als die Hälfte untersuchter Stimmen zeigten im Histogramm ein deutliches zweites Maximum im unteren Frequenzbereich. Der Modalwert von F0 lag zwischen 74 und 220 Hz in männlichen bzw. zwischen 81 und 341 Hz in weiblichen Sprechern. Vier männliche Probanden zeichneten sich durch eine besonders hohe Stimme (165–220 Hz) aus. Des Weiteren gab es 8 weibliche Probanden mit einer besonders tiefen Stimme (81–135 Hz). Abgesehen von der Höhe der Stimmlage (Modalwert von F0) wiesen die beiden Gruppen keine signifikanten Unterschiede in den untersuchten Parametern auf. Die Gruppenwerte und die Ergebnisse der einfaktoriellen Varianzanalyse für erhobene Parameter sind Tabelle 1 [Tab. 1] zu entnehmen. Es ergab sich ein kleiner aber signifikanter Unterschied in Rauigkeitsurteilen zwischen den Geschlechtern. Weibliche Stimmen mit Subharmonischen waren als weniger rau empfunden. Die anschließende Kovarianzanalyse, in der der Modalwert von F0 als Kovariante eingeführt wurde, um ihren Einfluss auf wahrgenommene Rauigkeit zu eliminieren, führte kaum zu Veränderung des bisherigen Ergebnisses. Demnach hat der Modalwert von F0 keinen Einfluss auf Unterschiede in Rauigkeitsurteilen zwischen den Geschlechtern (df=1, F=2.94, p=0.09).

Die wahrgenommene Rauigkeit korrelierte signifikant mit Irregularität (r=0.58, p<0.01), prozentuellem Anteil von subharmonischen Fehlern (r=0.47, p<0.01) und relativer Stärke von der 2. Subharmonischen (r=0.25, p<0.01). Eine signifikante Korrelation bestand ebenfalls zwischen prozentuellem Anteil von subharmonischen Fehlern und relativer Stärke von der 2. Subharmonischen (r=0.58, p<0.01).

Diskussion

Unsere Daten stützen die Annahme, dass subharmonische Frequenzen häufig in fortlaufender Sprache vorkommen und die Perzeption der Rauigkeit maßgeblich bestimmen, wobei sie aber nicht von den allgemein gebräuchlichen Stimmanalyseverfahren identifiziert werden. Subharmonische Frequenzen manifestieren sich nicht immer in gehaltenen Vokalen und finden daher oft keine Berücksichtigung als Korrelat von Rauigkeit. Es bedarf weiterer Untersuchungen zur Klärung der Frage nach Beziehung zwischen subharmonischen Frequenzen, subharmonischen Fehlern und Grundtonwahrnehmung in Vokalen gesprochener Sprache.


Literatur

1.
Omori K, Kojima H, Kakani R, Slavit DH, Blaugrund SM. Acoustic characteristics of rough voice: subharmonics. J Voice. 1997 Mar;11(1):40-7.
2.
Bergan CC, Titze IR. Perception of pitch and roughness in vocal signals with subharmonics. J Voice. 2001 Jun;15(2):165-75.