gms | German Medical Science

25. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

12.09. - 14.09.2008, Düsseldorf

Visualisierung der Differenzierung von Stimm- und Sprechbefunden

Visualization of the differentiation of voice and speech disorders

Vortrag

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 25. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie. Düsseldorf, 12.-14.09.2008. Düsseldorf: German Medical Science GMS Publishing House; 2008. Doc08dgppV46

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/dgpp2008/08dgpp62.shtml

Veröffentlicht: 27. August 2008

© 2008 Maier et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Zusammenfassung

Die Visualisierung der Differenzierung Stimm- und Sprechbefunden kann die Diagnostik von Kommunikationsstörungen unterstützen. In dieser Arbeit stellen wir mit der Sammon Transformation die Anwendung einer Methode vor, die Rückschlüsse auf die Ähnlichkeit bzw. Unterschiede der akustischen Eigenschaften unterschiedlicher lautsprachlicher Kommunikationsstörungen erlaubt.

Konkret wurden digital gespeicherte Sprachdaten von Patienten mit einer Stimmstörung (41 Laryngektomierte), einer Sprechstörung (46 Personen nach Entfernung eines Mundhöhlenmalignoms) und 18 Kontrollsprechern ohne Stimm- und Sprechstörungen verglichen. Grundlage war ein gelesener Text, nämlich der in der klinischen Praxis gebräuchliche Text „Der Nordwind und die Sonne“.

Durch die automatische Analyse der Daten konnten sprecherspezifische Merkmale gefunden werden. Anhand dieser wurde mittels der Sammon Transformation [1] eine zwei- bzw. dreidimensionale Visualisierung der Daten berechnet, in der ähnliche Sprecher „nebeneinander liegen“. Die Auswertung der Daten erlaubt folgende Interpretation: Alle drei Gruppen lassen sich gut von einander trennen. Eine automatische Unterscheidung von Stimm- und Sprechstörungen ist dem Prinzip nach möglich.


Text

Einleitung

Die Visualisierung der Differenzierung Stimm- und Sprechbefunden kann die Diagnostik von Kommunikationsstörungen unterstützen. In dieser Arbeit stellen wir mit der Sammon Transformation die Anwendung einer Methode vor, die Rückschlüsse auf die Ähnlichkeit bzw. Unterschiede der akustischen Eigenschaften unterschiedlicher lautsprachlicher Kommunikationsstörungen erlaubt.

Material und Methode

Es wurden digital gespeicherte Sprachdaten von männlichen Patienten mit einer Stimmstörung (41 Laryngektomierte), einer Sprechstörung (35 Personen nach Entfernung eines Mundhöhlenmalignoms) und 18 altersangepasste Kontrollsprecher ohne Stimm- und Sprechstörungen verglichen. Grundlage war der gelesene Text „Der Nordwind und die Sonne“.

Durch die automatische Analyse der Daten konnten sprecherspezifische akustische Merkmale identifiziert werden. Anhand dieser wurde mittels der Sammon Transformation [1], [2] eine zwei- bzw. dreidimensionale Visualisierung der hochdimensionalen Daten berechnet, in der ähnliche Sprecher nebeneinander abgebildet sind.

Ergebnisse

Die Auswertung der Daten erlaubt folgende Interpretation (siehe Abbildung 1 [Abb. 1]): Alle drei Gruppen lassen sich gut von einander trennen. Lediglich zwei Sprecher nach Entfernung eines Mundbodenkarzinoms liegen in der Kontrollgruppe. Die auditive Untersuchung der Sprecher zeigte, dass keine Sprechstörung vorliegt. Drei Sprecher der Kontrollgruppe sind nach unten verschoben, liegen jedoch zwischen den beiden Patientengruppen.

Diskussion

Eine automatische Unterscheidung von Stimm- und Sprechstörungen ist dem Prinzip nach möglich. Die Darstellung trennt den Raum zwischen Stimm- und Sprechstörungen auf. Die Kontrollsprecher liegen in der Mitte. Eine Projektion von weiteren Sprechern in diesen Raum ist möglich [2]. Damit lassen sich neue Aufnahmen gut mit vollständig dokumentierten Fundusaufnahmen vergleichen.


Literatur

1.
Haderlein T, Zorn D, Steidl S, Nöth E, Shozakai M, Schuster M. "Visualization of Voice Disorders Using the Sammon Transform". In: 9th International Conf. on Text, Speech and Dialogue (TSD). ser. Lecture Notes in Artificial Intelligence. Sojka P, Kopecek I, Pala K, editors. vol. 4188. Berlin, Heidelberg, New York: Springer; 2006. p. 589-96.
2.
Maier A, Exner J, Steidl S, Batliner A, Haderlein T, Nöth E. "An Extension to the Sammon Mapping fort he Robust Visualization of Speaker Dependencies". In: 11th International Conf. on Text, Speech and Dialogue (TSD). ser. Lecture Notes in Artificial Intelligence. Sojka P, Kopecek I, Pala K, editors. 2008, to appear.