gms | German Medical Science

100 Jahre Phoniatrie in Deutschland
22. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie
24. Kongress der Union Europäischer Phoniater

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

16. bis 18.09.2005, Berlin

Objektive Bewertung der tracheo-ösophagealen Ersatzstimme

Objective evaluation of tracheo-esophageal substitute voice

Poster

  • corresponding author presenting/speaker Tino Haderlein - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Elmar Noeth - Universität Erlangen - Nürnberg, Lehrstuhl für Mustererkennung, Erlangen, Deutschland
  • author Maria Schuster - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Ulrich Eysholdt - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland
  • author Frank Rosanowski - Universitätsklinikum Erlangen, Abteilung für Phoniatrie und Pädaudiologie, Erlangen, Deutschland

100 Jahre Phoniatrie in Deutschland. 22. Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie, 24. Kongress der Union der Europäischen Phoniater. Berlin, 16.-18.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05dgppP23

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/dgpp2005/05dgpp019.shtml

Veröffentlicht: 15. September 2005

© 2005 Haderlein et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Zusammenfassung

Die tracheoösophageale Ersatzstimme ist heute „state of the art" der Stimmrehabilitation nach einer Laryngektomie. Gemeinhin wird angenommen, dass dies an ihrer Ähnlichkeit zur ursprünglichen Stimme des Betroffenen liegt. Dieses „weiche" Kriterium der Stimmbewertung sollte z.B. im Hinblick auf die Objektivierung eines Behandlungsbedarfs bzw. -fortschritts um objektiv-apparative Befunde ergänzt werden. Dies ist jedoch bisher nur für gehaltene Vokale und noch nicht für die Analyse fortlaufender Sprache möglich. In einer Pilotstudie an 18 Laryngektomierten mit einer tracheoösophagealen Ersatzstimme mittels Provox®-Stimmventilprothese wurde dazu ein andernorts bereits für Marktzwecke professionalisiertes automatisches Spracherkennungssystem erprobt. Zielkriterium war zunächst die Wortakkuratheit WA, die mit der nach einem an Schulnoten orientierten Stimmbewertung durch 5 Experten korreliert wurde. Danach liegt der Korrelationskoeffizient zwischen der WA und dem Expertenurteil insgesamt bei -0,84 (-0,81; -0,65; -0,81; -0,79; -0,55). Die Ergebnisse belegen, dass eine automatische Bewertung der tracheoösophagealen Ersatzstimme grundsätzlich möglich ist. Methodische Optimierungen werden zur Klinikreife des Systems führen.


Text

Einleitung

Die tracheoösophageale Ersatzstimme gilt heute als „state of the art" der Stimmrehabilitation nach einer Laryngektomie. Das zwischen Luft- und Speiseröhre eingebrachte Ventil lenkt den Luftstrom in die Speiseröhre. Die ausströmende Luft versetzt die Schleimhaut im pharyngo-ösophagealen Segment in Schwingungen und erzeugt so das primäre Ersatzstimmsignal, das dann wie bei der normalen Stimmgebung in den Ansatzräumen gefiltert und vom Mund abgestrahlt wird. Die Bewertung der Ersatzstimme erfolgt in der Klinik in aller Regel nach subjektiven Gesichtspunkten, eine objektive Messung und Bewertung der gesprochenen Sprache ist bisher nicht möglich. Und darauf zielte dieses Projekt:

Es wurde untersucht, wie gut die tracheoösophageale Sprache von einem automatischen Spracherkennungssystem erkannt wird und ob die Ermittlung der Qualität der Ersatzstimme zumindest teilweise automatisiert erfolgen kann. Dazu müssten die Bewertung der Maschine und einer Vergleichsgruppe von Experten korrelieren.

Methoden und Patienten

Das auf Hidden Markov Modellen basierende Spracherkennungssystem war unabhängig vom gegenwärtigen Projekt am Lehrstuhl für Mustererkennung der Universität Erlangen-Nürnberg entwickelt und bereits in zahlreichen Forschungsprojekten erfolgreich eingesetzt worden. Es kann spontane, kontinuierliche Sprache mit einem Vokabular von bis zu 10000 Wörtern verarbeiten.

In dieser Studie wurden 18 laryngektomierte Männer mit einer seit mehr als einem Jahr funktionierenden tracheo-ösophagealen Ersatzstimme untersucht. Jeder las den "Nordwind und Sonne" - Text. Die Aufnahmen erfolgten mit einem "dnt Call 4U Comfort" - Headset (Abtastfrequenz 16 kHz, Amplitudenauflösung 16 bit).

Ergebnisse

Die Patienten mit einer tracheoösophagealen Ersatzstimme ereichten auf dem für sie noch nicht gezielt angepassten System eine Wortakkuratheit von maximal 50,0%, minimal 10,0%, bei einem Mittelwert von 28,7%. Die Kontrollgruppe von 18 altergleichen Männern erreichte eine durchschnittliche Wortakkuratheit von 57,6% (Minimum 46,8%, Maximum 71,6%).

Die Ersatzstimmen wurden von fünf Experten mit ganzzahligen Werten belegt ("1" ~ sehr gut verständlich bis "5" ~ unverständlich). Die Inter-Rater-Korrelation, berechnet als der Zusammenhang zwischen einem und dem Durchschnitt der anderen vier Experten, betrug zwischen 0,68 und 0,85.

Danach wurde die Korrelation zwischen Mensch und Maschine bestimmt, wobei die Wortakkuratheit, gemessen über den gesamten Text des jeweiligen Sprechers, als Ergebnis der automatischen Bewertung herangezogen wurde: Die Korrelation ist -0,84.

Schlussfolgerungen

Die bisherigen Ergebnisse zeigenden deutlichen Zusammenhang zwischen den Ergebnissen der menschlichen Bewertung und der maschinellen Analyse. Die Wortakkuratheit ist also ein wichtiger Bestandteil eines automatisch gewonnenen Verständlichkeitsmaßes und sollte für weitere Untersuchungen im Bereich der pathologischen Stimm- und Sprachanalyse herangezogen werden.