gms | German Medical Science

26. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

11.09. - 13.09.2009, Leipzig

Untersuchungen zur Kategorisierung der Sprechgeschwindigkeit bei Sprechern und Hörern

Vortrag

  • presenting/speaker Miriam Hauke - Klinik für Phoniatrie, Pädaudiologie und Kommunikationsstörungen des Universitätsklinikums Aachen, Aachen, Deutschland
  • Bernhard Lehnert - Klinik für Phoniatrie, Pädaudiologie und Kommunikationsstörungen des Universitätsklinikums Aachen, Aachen, Deutschland
  • corresponding author Christiane Neuschaefer-Rube - Klinik für Phoniatrie, Pädaudiologie und Kommunikationsstörungen des Universitätsklinikums Aachen, Aachen, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 26. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Leipzig, 11.-13.09.2009. Düsseldorf: German Medical Science GMS Publishing House; 2009. Doc09dgppV46

doi: 10.3205/09dgpp64, urn:nbn:de:0183-09dgpp643

Published: September 7, 2009

© 2009 Hauke et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Zusammenfassung

Einleitung: Kategoriale Eigenschaften der Sprechgeschwindigkeit in Hinblick auf Sprachproduktion und -perzeption wurden bisher nur wenig untersucht. Sie sind daher Inhalt der vorliegenden Studie.

Material und Methoden: Diese umfasst einen expressiven Experimentalteil, in dem 30 Frauen gebeten wurden, einen Text in langsamer/normaler/schneller Geschwindigkeit jeweils in erniedrigter/normaler/erhöhter Stimmlage zu lesen. Aus den Aufnahmen wurden die jeweils realisierten Lesegeschwindigkeiten quantifiziert und analysiert. Im rezeptiven Experimentalteil wurde eine in normaler Geschwindigkeit/Stimmlage erstellte Aufnahme mittels Speechmorphing in 20 Geschwindigkeiten variiert und 60 Raterinnen mit der Aufgabe präsentiert, sie den Kategorien langsam/normal/schnell zuzuordnen.

Ergebnisse: Es konnte nachgewiesen werden, dass die Sprechgeschwindigkeit in interindividuell stabilen Kategorien produziert und wahrgenommen wird. So betrug die Lesedauer im Mittel 38 ± 4 s bei normaler, 28 ± 3 s bei schneller und 53 ± 10 s bei langsamer Sprechgeschwindigkeit. Die perzeptive Bewertung zeigte nur geringe Überlappungen in den Übergangsbereichen. Kleinere Einflüsse der Sprechstimmlage wurden beobachtet.

Schlussfolgerung: Es zeigt sich eine gute Übereinstimmung der kategorialen Cluster für Sprachproduktion und Sprachperzeption in den Leseproben.


Text

Einleitung

Die Sprechgeschwindigkeit bildet eine wesentliche Komponente der Sprechverständlichkeit in der verbalen Kommunikation, führt doch eine Beschleunigung der Sprechvorgänge zu einer Reduktion der sprechmotorischen Zungenhebungen und damit zu einer auditorisch als verschliffen wahrgenommenen Artikulation. Obwohl diese Zusammenhänge wohl bekannt sind wurden die Kategorien der Sprechgeschwindigkeit selbst und die Zusammenhänge zwischen Sprachproduktion und -perzeption bisher wenig untersucht. Auch wurde die verwendete mittlere Sprechstimmlage in diesem Zusammenhang meist nicht näher berücksichtigt. Die kategoriale Untersuchung der Sprachproduktion und Sprachperzeption am Beispiel eines deutschen Standard-Lesetextes bildet daher den Gegenstand der vorliegenden Arbeit.

Probanden und Methoden

Die Studie umfasste einen expressiven und einen rezeptiven Experimentalteil: Im expressiven Teil der Untersuchung wurden 30 Probandinnen gebeten, den Standardtext „Der Nordwind und die Sonne“ in den Sprehgeschwindigkeitskategorien „langsam“, „normal“ und „schnell“ jeweils in erniedrigter, normaler und erhöhter mittlerer Sprechstimmlage zu lesen. Insgesamt wurden somit 270 Lesetexte aufgezeichnet. Aus den Tonaufnahmen wurden die jeweils realisierten Lesedauern quantifiziert und analysiert. Die vergleichenden Auswertungen bezogen sich hierbei sowohl auf den tatsächlich realisierten Lesetext, als auch auf eine bearbeitete Form, in der die Pausen herausgeschnitten wurden, um die motorische Sprechdauer und die Pausenrealisation getrennt beurteilen zu können.

Für den perzeptiven Experimentalteil verwendeten wir eine Tonaufnahme, die in normaler Sprechgeschwindigkeit und Sprechstimmlage erstellt wurde. Diese Tonaufnahme wurde einem stufenweisen Speechmorphing mittels ProTools-Software unterzogen, in dem wir synthetische Samples in 20 verschiedenen Geschwindigkeiten erstellten. Diese Samples wurden 30 anderen weiblichen Probandinnen mit der Instruktion vorgespielt, die einzelnen Tonbeispiele den perzeptiven Kategorien „langsam“, „normal“ und „schnell“ zuzuordnen. Hierbei wurden die Bewerterinnen nicht darüber informiert, dass es sich um synthetisch erstellte Lesetextausschnitte handelt. 30 weitere Probandinnen haben vergleichbare Einstufungen mit einer 10er-Skala vorgenommen, die hier nicht Gegenstand des Beitrags ist.

Ergebnisse

Es konnte nachgewiesen werden, dass die Sprechgeschwindigkeit in interindividuell stabilen Kategorien produziert und wahrgenommen wird (vgl. Abbildung 1 [Abb. 1]). So betrug die Lesedauer (einschließlich der Pausenzeiten) in normaler Sprechgeschwindigkeit und Stimmlage (NN) im Mittel 38,3 ± 3,6 s (entsprechend 4,8 Silben/s), bei schneller Sprechgeschwindigkeit und normaler Stimmlage (SN) 27,9 ± 3,2 s (entsprechend 6,6 Silben/s) und bei langsamer Sprechgeschwindigkeit und normaler Stimmlage (LN) 52,8 ± 9,8 (entsprechend 3,5 Silben/s). Die prozentualen Pausenlängen in diesen Sequenzen betrugen 11,4% für NN, 4,2% für SN und 15,5% für LN. Bedingt u.a. durch den höheren Pausenanteil waren die Standardabweichungen bzw. die Varianzen für die langsamen Lesetext-Samples deutlich größer als für die normalen und schnellen Lesetext-Samples. Die Variationen der verwendeten Sprechstimmlagen bewirkten nur geringfügige Verlangsamungen gegenüber der normalen Sprechstimmlage in den jeweiligen Geschwindigkeitskategorien.

Die Ergebnisse der perzeptiven Kategorisierungen zeigen, dass sich die Grenzen der Wahrnehmungskategorien normal, schnell und langsam für die synthetischen Lesetext-Samples verschiedener Sprechgeschwindigkeiten statistisch festlegen lassen, wenngleich sich zwischen benachbarten Geschwindigkeitskategorien Überlappungen nachweisen lassen (vgl. Tabelle 1 [Tab. 1]). Die perzeptiven Ergebnisse stimmen darüberhinaus auffällig gut mit den realisierten Sprechgeschwindigkeiten im Expressionsteil überein. So wurden die Hörbeispiellängen von 22–26 s immer als schnell, die von 28 bis 36 s mal als schnell, mal als normal, die von 38 und 40 s immer als normal, die von 42–54 s manchmal als normal, manchmal als langsam und die von 56–60 s immer als langsam eingestuft.

Diskussion

Die vorgestellten Ergebnisse, die anhand realer und synthetisch veränderter Lesetexte erhoben wurden, lassen sich sicher nicht unmittelbar auf die Sprachproduktion und -perzeption während der Spontansprache übertragen. Dennoch ergeben sie erste Anhaltspunkte für den Zusammenhang zwischen den expressiven und perzeptiven Geschwindigkeitskategorien. Die gefundenen kategorialen Gemeinsamkeiten sind umso bedeutender, da es sich in der vorliegenden Untersuchung nicht um intraindividuelle Vergleichsstichproben von Sprecherinnen und Hörerinnen handelt. Ein Studiendesign, das diesen Zusammenhang abbildet wäre sicherlich von zusätzlichem Interesse.


Literatur

1.
Baken RJ, Orlikoff RF. Clinical measurement of speech and voice. San Diego CA: Singular Publishing Group; 2000.
2.
Hauke M. Untersuchung zur kategorialen Wahrnehmung von Sprechgeschwindigkeit mittels Speechmorphing [Dissertation]. Aachen: Medizinische Fakultät der RWTH; 2008.