gms | German Medical Science

24. Jahrestagung der Deutschen Gesellschaft für Audiologie

Deutsche Gesellschaft für Audiologie e. V.

14.09. - 17.09.2022, Erfurt

Wie gut nehmen Nutzer von Cochlea-Implantaten die Emotion sprachkodierter Sätze wahr?

Meeting Abstract

  • presenting/speaker Martin Böckmann-Barthel - Otto-von-Guericke-Universität Magdeburg, Experimentelle Audiologie, Magdeburg, DE
  • Ece Koyutürk - Otto-von-Guericke-Universität Magdeburg, Magdeburg, DE
  • Ingo Siegert - Otto-von-Guericke-Universität Magdeburg, Magdeburg, DE
  • Jesko L. Verhey - Otto-von-Guericke-Universität Magdeburg, Magdeburg, DE

Deutsche Gesellschaft für Audiologie e.V.. 24. Jahrestagung der Deutschen Gesellschaft für Audiologie. Erfurt, 14.-17.09.2022. Düsseldorf: German Medical Science GMS Publishing House; 2022. Doc188

doi: 10.3205/22dga188, urn:nbn:de:0183-22dga1887

Veröffentlicht: 12. September 2022

© 2022 Böckmann-Barthel et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Fragestellung: Sprache transportiert Emotionen parallel zu den geäußerten Wörtern deren Verständnis für die Kommunikation und Sprachrezeption unerlässlich ist. Wichtige paraverbale Variablen dabei sind der Verlauf der Grundfrequenz, Intensität, Sprechtempo und Sprechpausen. Wird Sprache wie bei digitaler Telefonie oder Sprachassistenzsystemen datenreduziert wiedergegeben, verringert sich die Ausprägung dieser Merkmale. Es stellt sich die Frage, inwieweit eine Datenreduktion der Wiedergabe die transportierte Emotion für CI-Nutzer verbirgt.

Methoden: Teilnehmer der laufenden Studie sind erfahrene CI-Nutzer und eine normalhörende Kontrollgruppe. Als Material dienen von Schauspielern eingesprochene Beispielsätze des Berliner EMO-DB-Korpus. Die Sätze sind inhaltlich neutral gehalten aber in sieben verschiedenen Emotionen eingesprochen. Sie wurden unkomprimiert sowie mit einem von drei Codecs (SPEEX, AMRWB, MP3) komprimiert im Freifeld über einen Lautsprecher dargeboten. Die Teilnehmer sollten nach der Darbietung eines jeden Satzes diesem eine Emotion zuordnen und angeben, wie sicher sie in ihrer Beurteilung sind (für das Verfahren, siehe [1]).

Ergebnisse: Die Teilnehmer der CI-Gruppe waren für jede Emotion deutlich weniger exakt als die Kontrollgruppe. Auffällig ist die Diskrepanz bei Freude und Langeweile, die von der Kontrollgruppe nahezu perfekt, von der CI-Gruppe jedoch mit deutlich geringerer Präzision wahrgenommen wurden. Ein Einfluss des Codecs zeigt sich weder bei der Trefferrate noch der Antwortzeit.

Schlussfolgerungen: Wie erwartet ist es für CI-Nutzer im Vergleich zur Kontrollgruppe schwieriger, die Emotionen zu erkennen. Bemerkenswert ist, dass mit Freude und Wut zwei Emotionen besonders häufig verwechselt werden, die sich durch eine große Veränderung der Grundfrequenz auszeichnen. Besonders subjektive Sicherheit und Antwortzeit sind stark korreliert und stellen somit ein mögliches Maß für die Sicherheit der Entscheidung dar.


Literatur

1.
Siegert I, Lotz AF, Duong L, Wendemuth A. Measuring the impact of audio compression on the spectral quality of speech data. Elektronische Sprachsignalverarbeitung. Leipzig, Germany: TUDpress; 2016. S. 229–236.