Article
Statische und dynamische MRT's als Datenbasis eines Artikulationsmodells
Search Medline for
Authors
Published: | September 12, 2003 |
---|
Outline
Zusammenfassung
Auf der Basis der Arbeit von Kröger [Ref. 1] wurde ein zweidimensionales mediosagittales Artikulationsmodell zur Visualisierung von lautlichen Zielpositionen und Artikulationsbewegungen (z.B. Hebung von Zungenspitze und Zungenrücken bei Vokal-Konsonant-Übergängen) realisiert. Allerdings konnten die Konturen der Artikulationsorgane bisher nur anhand statischer MRT-Daten generiert werden. Insbesondere wurde die Formung der Artikulationsorgane im artikulatorischen Bewegungsablauf aus diesen Konturen auf der Grundlage von Theorien zur Artikulation und Koartikulation berechnet. In diesem Beitrag soll anhand eines Echtzeit-MRT-Datensatzes (8 Bilder/s) aufgezeigt werden, wie dynamische MRT-Daten genutzt werden können, um das existierende Artikulationsmodell bzgl. koartikulatorischer Vorgänge zu validieren und zu verbessern. MRT-Datensequenzen und modellierte artikulatorische Bewegungssequenzen werden im Rahmen des Beitrages per Film dargeboten.
Text
Auf der Basis von Arbeiten zur artikulatorischen Modellierung des Sprechens [Ref. 1] wurde ein zweidimensionales mediosagittales Artikulationsmodell zur Visualisierung von lautlichen Zielpositionen [Abb. 1] und Artikulationsbewegungen [Abb. 2] realisiert [Ref. 2]. Die Konturen der Artikulationsorgane konnten bisher allerdings nur anhand statischer MRT-Daten generiert werden [Ref. 3]. Die Formung der Artikulationsorgane im artikulatorischen Bewegungsablauf wird zur Zeit anhand dieser statischen Konturen auf der Grundlage von Theorien zur Artikulation und Koartikulation berechnet. Durch die Verfügbarkeit von dynamischen MRT-Daten (8 Bilder/s; SENSE-Verfahren nach Mady et al. 2001[Ref. 4] und 2002 [Ref. 5]) kann das existierende Artikulationsmodell nun insbesondere bzgl. koartikulatorischer Vorgänge validiert und verbessert werden.
Das vorliegende MRT-Datenkorpus umfasst 3x10 CVCV-Kombinationen (C=Konsonant, V=Vokal) wobei 10 Konsonanten und 3 Vokale jeweils so zusammengestellt wurden, dass der zweite Konsonant [t, d, n, l, s, Σ, Χ, g, k, N] im Vokalkontext [a, i, u] realisiert wird. Der erste Kononant ist immer [b]. Die Wörter werden in normalem Sprechtempo mehrmals hintereinander gesprochen. Eine Messung endet jeweils nach 120 Aufnahmen (1.5 s). Hieraus resultiert eine mittlere Wiederholungsrate der Wörter um n=10. Der Sprecher dieses Korpus ist identisch mit dem Sprecher der statischen MRT-Daten [Ref. 3].
Die qualitative Analyse der dynamischen MRT-Daten steht in vielen Punkten bereits in Einklang mit dem Artikulationsmodell:
1) Die Artikulationsstelle der labialen und alveolaren Konsonanten ändert sich trotz des unterschiedlichen vokalischen Kontextes kaum. Die Formung des Zungenrücken ist hier hingegen deutlich durch den vokalischen Kontext geprägt (vgl. [Abb. 1], Zeile 2 und 3: [ba, da, bi, di]).
2) Bei velaren Konsonanten wird eine Variation der Lage der Engebildung in Hinblick auf den vokalischen Kontext sichtbar (vgl. [Abb. 1], Spalte 3: [ga, gi]).
3) Der postalveolare Frikativ [Σ] zeigt neben der Engebildung im Bereich der Zungenspitze im Vergleich zum alveolaren Frikativ [s] eine ausgeprägte Hebung des vorderen Bereiches des Zungenrückens. (Dies wird vom Modell derzeit noch nicht ausreichend realisiert; vgl. [Abb. 1], Zeile 5: [s, Σ])
4) Beim velaren Frikativ [x] ([a] und [u]-Kontext) wird eine konsonantische Enge weiter hinten realisiert als bei den anderen velaren Konsonanten. Der palatale Frikativ [Χ] ([i]-Kontext) zeigt eine annähernd [i]-ähnliche Formung des Zungenrücken. (vgl. Abb. 1, Zeile 6: [Χ, x])
Das Ziel weiterer Arbeiten ist die quantitative Auswertung der dynamischen MRT-Daten zur detaillierten Verbesserung der artikulatorischen und koartikulatorischen Bewegungsabläufe im Artikulationsmodell.
Acknowledgements
Unser besonderer Dank gilt R. Sader, A. Zimmermann und K. Mady (Hightech-Forschungszentrum und Klinik und Poliklinik für Mund-Kiefer-Gesichtschirurgie, Klinikum r. d. Isar, TU München) und A. Beer und Ch. Hannig (Institut für Röntgendiagnostik, Klinikum r. d. Isar, TU München) für die Erstellung der dynamischen MRT-Aufnahmen.
Literatur
- 1.
- Kröger BJ (1998) Ein phonetisches Modell der Sprachproduktion. Niemeyer, Tübingen
- 2.
- Kröger BJ (2003) Ein visuelles Modell der Artikulation. Laryngo-Rhino-Otologie 82: 402-407
- 3.
- Kröger BJ, Winkler R, Mooshammer C, Pompino-Marschall B. (2000) Estimation of vocal tract area function from magnetic resonance imaging: Preliminary results, pp. 333-336. Proceedings of 5th Seminar on Speech Production: Models and Data. Kloster Seeon, Bavaria
- 4.
- Mady K, Sader A, Zimmermann A, Hoole Ph, Beer A, Zeilhofer HF, Hannig Ch (2001) Use of real-time MRI in assessment of consonant articulation before and after tongue surgery and tongue reconstricution. In: B. Maassen, W. Hulstijn, R. Kent, H. Peters, P. van Lieshout (eds.) Speech motor control in normal and disorderd speech, pp.142-145. 4th International Speech Motor Conference, Nijmegen
- 5.
- Mady K, Sader A, Zimmermann A, Hoole Ph, Beer A, Zeilhofer HF, Hannig Ch (2002) Assessment of consonant articulation in glossectomee speech by dynamic MRI, pp. 961-964. Proc. ICSLP 2002, Denver