gms | German Medical Science

23. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

15. - 17.09.2006, Heidelberg

Objektive und automatische Ermittlung der Verständlichkeit von Kindern und Jugendlichen mit Lippen-Kiefer-Gaumenspalten

Automatic evaluation of intelligibility of children and adolescents with cleft lip and palate

Vortrag

  • corresponding author presenting/speaker Maria Schuster - Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Andreas Maier - Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Beate Vogt - Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Elmar Nöth - Lehrstuhl für Mustererkennung, Erlangen, Deutschland
  • author Emeka Nkenke - Klinik und Poliniklinik für Mund-, Kiefer-, Gesichtschirurgie, Erlangen, Deutschland
  • author Alexandra Marchis - Zahnklinik 3 Kieferorthopädie, Erlangen, Deutschland
  • author Ulrich Eysholdt - Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Frank Rosanowski - Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 23. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie. Heidelberg, 15.-17.09.2006. Düsseldorf, Köln: German Medical Science; 2006. Doc06dgppV25

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/meetings/dgpp2006/06dgpp36.shtml

Published: September 5, 2006

© 2006 Schuster et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Zusammenfassung

Bei Kindern mit Lippen-Kiefer-Gaumenspalten können trotz adäquater chirurgischer Behandlung Lautbildungsstörungen auftreten, die die Verständlichkeit einschränken. Die übliche subjektive, auditive Bewertung der Verständlichkeit ist für klinische und wissenschaftliche Zwecke nur bedingt geeignet. Objektive Verfahren existieren bisher nicht.

Im Rahmen der interdisziplinären Spaltsprechstunde wurden Sprachaufnahmen von 31 Kindern und Jugendlichen mit Lippen-Kiefer-Gaumenspalten im Alter 10,1 ± 3,8 Jahren mit unterschiedlichen Spaltformen aufgezeichnet. Die Aufnahmen entstanden bei der Durchführung eines standardisierten Tests zur Lautbildung. Basierend auf der automatischen Spracherkennungstechnik wird zur objektiven Sprechanalyse der prozentuale Anteil der richtig erkannten Wörter ermittelt, die „Wortakkuratheit“. Zum Vergleich erfolgt die subjektive Bewertung der Verständlichkeit der Sprachaufnahmen durch 3 Experten.

Die automatische Bewertung ergibt eine Wortakkuratheit von 1,2% bis 75,8% (48,0% ± 19,6%). Die subjektive Bewertung der Sprachverständlichkeit durch die Experten zeigt eine hohe Übereinstimmung mit der automatischen Bewertung (p<0,01).

Die automatische Spracherkennung ist eine geeignete objektive Methode, um die Sprachverständlichkeit zu quantifizieren. Sie kann die Ermittlung des Einflusses verschiedener Sprechstörungen auf die Verständlichkeit verbessern sowie zur genauen Erfassung der Ergebnisqualität verschiedener therapeutischer Konzepte dienen.


Text

Hintergrund

Bei Kindern mit Lippen-Kiefer-Gaumenspalten können trotz adäquater chirurgischer Behandlung Lautbildungsstörungen auftreten. Dabei handelt es sich neben den üblichen Lautbildungsstörungen vor allem um eine vermehrte nasale Luftführung, eine Verlagerung der Artikulation oder veränderte Artikulationsspannung. Dies bedingt eine Einschränkung der Verständlichkeit und damit der kommunikativen Kompetenz der Betroffenen. Lautbildungsstörungen und die Verständlichkeit werden üblicherweise bisher subjektiv auditiv bewertet. Naturgemäß unterliegt die subjektive Bewertung der Verständlichkeit jedoch interindividuellen und intraindividuellen Schwankungen und ist damit für klinische und wissenschaftliche Zwecke nur bedingt geeignet. Objektive Verfahren zur Quantifizierung der Verständlichkeit existierten bisher nicht. In diesem Beitrag wird eine neue Methode zur objektiven Ermittlung der Verständlichkeit [1] von Kindern und Jugendlichen mit Lippen-Kiefer-Gaumenspalten vorgestellt.

Patienten und Methode

Im Rahmen der interdisziplinären Spaltsprechstunde wurden Sprachaufnahmen von 31 Kindern und Jugendlichen mit Lippen-Kiefer-Gaumenspalten im Alter 10,1 ± 3,8 Jahren mit unterschiedlichen Spaltformen aufgezeichnet. Die Aufnahmen entstanden bei der Durchführung des PLAKSS (Psycholinguistische Analyse kindlicher Sprechstörungen) [2]. Für die objektive Bewertung der Verständlichkeit wurde ein Spracherkennungssystem verwendet, das am Lehrstuhl für Mustererkennung der Universität Erlangen entwickelt wurde. Das Spracherkennungssystem analysiert gesprochene Sprache, in dem es diese erst in kleine Zeiteinheiten unterteilt und deren spektrale und temporalen Eigenschaften mit einem internen „Wörterbuch“ vergleicht, welches zuvor durch ein Training des Systems mit vielen Sprachaufnahmen aufgebaut wird. Jedes Wort wird durch eine Sequenz von Hidden Markov Modellen repräsentiert, welche jeweils die Wahrscheinlichkeit wiedergeben, mit der ein akustisches Signal mit einem bekannten Phonem übereinstimmt. Damit werden die Wörter ermittelt, welche mit größter Wahrscheinlichkeit mit den gesprochenen Wörtern übereinstimmen. Die Bewertung der Verständlichkeit durch die automatische Spracherkennungstechnik basiert dann auf der Ermittlung des Anteils der korrekt erkannten Wörter einer Wortfolge in Prozent, der sogenannten Wortakkuratheit. Zur genauen Bestimmung der Wortakkuratheit ist eine Verschriftung der Sprachaufnahmen notwendig.

Zum Vergleich der automatischen Bewertung erfolgt die subjektive Bewertung der Verständlichkeit der Sprachaufnahmen durch 3 Experten. Hierbei wird die Verständlichkeit auf einer Likert-Skala von 1 (sehr gut verständlich) bis 5 (sehr schlecht verständlich) angegeben.

Ergebnisse

Die automatische Bewertung ergibt eine Wortakkuratheit von 1,2% bis 75,8% (48,0% ± 19,6%). Die subjektive Bewertung der Sprachverständlichkeit durch die Experten zeigt eine hohe Übereinstimmung mit der automatischen Bewertung (p<0,01), s. Abbildung. Die Analyse der Übereinstimmung zwischen den Experten mittels Multi-Rater Kappa ist ähnlich hoch wie zwischen den Experten und der automatischen Bewertung (Experten: 0,48; Experten versus automatische Bewertung: 0,52).

Diskussion

Die automatische Spracherkennung ist eine objektive Methode, um die Sprachverständlichkeit zu quantifizieren und dient somit als ein globales Maß für die kommunikative Kompetenz. Dies konnte bisher an Patienten mit ausgeprägter Stimmstörung [1] sowie nun bei Patienten mit Sprechstörung dargestellt werden. Es besteht eine hohe Übereinstimmung zur Bewertung durch Experten, bzw. die automatische Bewertung differiert nicht mehr zur Expertenbewertung als die Expertenbewertung untereinander. Durch die Verwendung von Einzelwörtern ist keine Verfälschung durch kontextuelle Hilfen bei der Bewertung möglich, wie sie von menschlichen Bewertern vor allem bei schlecht verständlicher Sprache genutzt werden könnte. Die Methode kann daher als geeignet für die quantitative Bewertung der Verständlichkeit angesehen werden.

Bei der kleinen Patientengruppe sind derzeit noch keine verlässlichen Aussagen zur Verständlichkeit in Abhängigkeit von unterschiedlichen Spaltfehlbildungstypen möglich. Dies soll im weiteren an einem größeren Kollektiv untersucht werden. Normwerte für unterschiedliche Altersgruppen müssen zum Vergleich erhoben werden. In Zukunft wird diese Methode die Ermittlung des Einflusses verschiedener Sprechstörungen auf die Verständlichkeit verbessern sowie zur exakten Erfassung der Ergebnisqualität verschiedener therapeutischer Konzepte dienen können.

Danksagung

Diese Arbeit wird von der Johannes-und-Frieda-Marohn-Stiftung des Universitätsklinikums Erlangen gefördert.


Literatur

1.
Schuster M, Haderlein T, Nöth E, Lohscheller J, Eysholdt U, Rosanowski F. Intelligibility of laryngectomees' substitute speech: automatic speech recognition and subjective rating. Eur Arch Otorhinolaryngol. 2006;263(2):188-93.
2.
Fox AV. PLAKSS - Psycholinguistische Analyse kindlicher Sprechstörungen. Frankfurt a.M.: Swets & Zeitlinger; 2002. Now available from Harcourt Test Services GmbH, Frankfurt a.M. http://www.harcourt.de.