GMS | 26. Jahrestagung der Deutschen Gesellschaft für Audiologie | Einkanalige DNN-Störgeräuschunterdrückung mit niedriger Latenz: Effekt auf das Sprachverstehen

26. Jahrestagung der Deutschen Gesellschaft für Audiologie

Deutsche Gesellschaft für Audiologie e. V.

06.03. - 08.03.2024, Aalen

Article

XML version

Send article

Einkanalige DNN-Störgeräuschunterdrückung mit niedriger Latenz: Effekt auf das Sprachverstehen

Meeting Abstract

Search Medline for

Jürgen Tchorz - TH Lübeck, Institut für Akustik, Lübeck, Deutschland
Lea Hackenberg - TH Lübeck, Institut für Akustik, Lübeck, Deutschland
Hannes Wittmann - TH Lübeck, Institut für Akustik, Lübeck, Deutschland

Deutsche Gesellschaft für Audiologie e.V.. 26. Jahrestagung der Deutschen Gesellschaft für Audiologie. Aalen, 06.-08.03.2024. Düsseldorf: German Medical Science GMS Publishing House; 2024. Doc015

doi: 10.3205/24dga015, urn:nbn:de:0183-24dga0151

Published:	March 5, 2024

© 2024 Tchorz et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.

Outline

Top
Text

Text

Im Gegensatz zu mehrkanaligen Störgeräuschunterdrückungsverfahren, die eine räumliche Trennung zwischen Ziel- und Störschall nutzen, steht einkanaligen Verfahren nur ein Monosignal zur Identifizierung und Abschwächung des Störgeräuschanteils zur Verfügung. „Klassische“ Algorithmen wie Spektrale Subtraktion oder Wiener-Filter, die seit vielen Jahren auch in Hörgeräten eingesetzt werden, ermöglichen dort zwar eine Erhöhung des Hörkomforts und der Akzeptanz in Störschall, aber keine substantielle Verbesserung der Sprachverständlichkeitsschwelle (SVS).

Für modernere Verfahren, die auf tiefen neuronalen Netzen (DNN) basieren, wurden dagegen signifikante Verbesserungen der SVS bei hörbeeinträchtigten Versuchspersonen erzielt. Viele dieser Verfahren arbeiten im Frequenzbereich, so dass eine blockweise Verarbeitung erforderlich ist, um die notwendige Frequenzauflösung zu erreichen. Die damit einhergehenden Verzögerungen von typischerweise 20 ms und mehr behindern den zukünftigen Einsatz in Hörgeräten, da hier eine Gesamtverzögerung von ca. 10 ms unterschritten werden sollte.

Für die hier vorgestellte Studie wird eine im Zeitbereich arbeitende, vortrainierte einkanalige DNN-Störgeräuschunterdrückung (Conv-TasNet) mit einer Verzögerung von lediglich 4 ms eingesetzt, so dass ein Einsatz in Hörgeräten prinzipiell möglich wäre. Die SVS von 20 Normal- und 19 Schwerhörenden wurde mit dem Oldenburger Satztest im Störschall (OlSa-Rauschen) mit und ohne Störgeräuschunterdrückung gemessen. Zusätzlich wurden objektive Maße (PESQ, STOI) eingesetzt, um das Sprachverstehen und die Sprachqualität in verschiedenen SNRs vorherzusagen.

Resultate: Während die Störgeräuschunterdrückung bei normalhörenden Versuchspersonen zu einer Verschlechterung der SVS um 0,8 dB (Median) führte, erreichten die schwerhörenden Versuchspersonen eine signifikante Verbesserung um 0,8 dB. In SNRs die höher als ca. -5 dB liegen, sagen PESQ und STOI ein mit Störgeräuschunterdrückung verbessertes Sprachverstenen und -qualität voraus.

gms | German Medical Science