gms | German Medical Science

29. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

21.09. - 23.09.2012, Bonn

Entwicklung eines 3D-Modells des Vokaltraktes während der Phonation anhand von MRT-Daten

Vortrag

  • corresponding author presenting/speaker Alexander Mainka - Abteilung Phoniatrie und Audiologie, HNO-Klinik, Universitätsklinikum Carl Gustav Carus, Technische Universität, Dresden, Deutschland
  • author Anton Poznyakovskiy - Abteilung Phoniatrie und Audiologie, HNO-Klinik, Universitätsklinikum Carl Gustav Carus, Technische Universität, Dresden, Deutschland
  • author Ivan Platzek - Institut und Poliklinik für Radiologische Diagnostik, Universitätsklinikum Carl Gustav Carus, Technische Universität, Dresden, Deutschland
  • author Hartmut Zabel - Studio für Stimmforschung, Musikhochschule „Carl Maria von Weber“, Dresden, Deutschland
  • author Dirk Mürbe - Abteilung Phoniatrie und Audiologie, HNO-Klinik, Universitätsklinikum Carl Gustav Carus, Technische Universität, Dresden, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 29. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Bonn, 21.-23.09.2012. Düsseldorf: German Medical Science GMS Publishing House; 2012. Doc12dgppV1

doi: 10.3205/12dgpp01, urn:nbn:de:0183-12dgpp018

Veröffentlicht: 6. September 2012

© 2012 Mainka et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Zusammenfassung

Hintergrund: Beim klassischen Gesang sind Einstellungsvorgänge des Vokaltraktes besonders für Timbre und Tragfähigkeit relevant. Mittels dynamischer Echtzeit-MRT konnten eine Reihe morphologischer Veränderungen des Vokaltraktes in der mittleren Sagitalebene zweidimensional visualisiert werden. Es bestehen aber nur sehr begrenzte dreidimensionale Daten zur Vokaltraktkonfiguration im professionellen Gesang.

Material und Methoden: Siebzehn Gesangsstudenten waren aufgefordert, in einem 3T MR-Tomograf einen Ton auf den Vokalen /a/, /e/, /i/, /o/ und /u/ in der Tonhöhe A4 (440 Hz; Frauen) bzw. A3 (220 Hz; Männer) für ca. 10 Sekunden auszuhalten. Hierbei kamen jeweils eine gesangliche und eine an das Sprechen angelehnte Tongebung zum Einsatz. Zur Segmentierung der MRT-Daten wurde in der Coronarebene ein Startquerschnitt der Mundhöhle mit aktiven Konturen ermittelt. Dann wurde der Schwerpunkt des Querschnitts berechnet und mittels eines Kalman Filters der weitere Verlauf des Zentralpfads vorhergesagt. Der Bilderstapel wird so geschnitten, dass die Schnittebene senkrecht zum Tangentenvektor des Zentralpfads liegt. Durch Zusammensetzen der Querschnitte erhält man die 3D-Oberfläche des Vokaltraktes.

Ergebnisse: Für die verschiedenen Vokale ergaben sich spezifische Vokaltraktkonfigurationen, wobei die Daten der mittleren Sagitalebene publizierte zweidimensionale Charakteristika bestätigten. Die dreidimensionale Vokaltraktmorphologie bei sängerischer Einstellung unterschied sich in verschiedenen Parametern von der Einstellung beim Sprechen.

Diskussion: Die Auflösung der angewandten MRT-Sequenz ist zur Erstellung eines 3D-Modells des Vokaltraktes geeignet. Dieses soll genutzt werden, um bei unterschiedlicher Tongebung (Phonationsmodus, Vokalfarbe, Timbre oder Tonhöhe) verschiedene Maße des Vokaltraktes zu generieren. Weiterhin bietet der Untersuchungsansatz die Möglichkeit zur longitudinalen Untersuchung der artikulatorischen Anpassungen beispielsweise während des Gesangsstudiums. Perspektivisch erhoffen sich die Autoren einen Beitrag zur Verbesserung der Vorhersage von professionellen stimmlichen Entwicklungen.


Text

Einleitung und Hintergrund

Die Bildung von Vokalen beruht auf spezifischen artikulatorischen Einstellungen des Vokaltraktes, welche mittels dynamischer MRT visualisiert werden können [1]. Bei der Tongebung im klassischen Gesang sind Einstellungsvorgänge des Vokaltraktes insbesondere für Timbre und Tragfähigkeit relevant und beispielsweise durch den Sängerformanten charakterisiert [2]. Des Weiteren bestehen zwischen verschiedenen Stimmgattungen morphologische Unterschiede des Vokaltraktes [3].

Mittels dynamischer Echtzeit-MRT konnten eine Reihe von Veränderungen der Vokaltrakt-Morphologie in einer mittleren Sagitalebene in zwei Dimensionen visualisiert werden [4].

Allerdings bestehen bis dato nur sehr begrenzte dreidimensionale Daten um dem Zusammenhang zwischen Modifikationen des Vokaltraktes und Klangeigenschaften im professionellen Gesang auf den Grund zu gehen. Unser Ziel war es daher, die Konfiguration des Vokaltrakts im Zustand der Phonation dreidimensional zu untersuchen.

Methode

Siebzehn Gesangsstudenten (10 männliche, 7 weibliche) der Musikhochschule Dresden waren aufgefordert in einem 3T MR Tomograf einen Ton für ca. 10 Sekunden auszuhalten. Die gehaltenen Vokale /a/, /e/, /i/, /o/ und /u/ wurden von den weiblichen und männlichen Probanden mit der Tonhöhe A4 (440 Hz) bzw. A3 (220 Hz) aufgenommen. Die Aufgabe wurde jeweils in zwei unterschiedlichen Phonationsarten durchgeführt. Zum einen in einer an das Sprechen angelehnten Stimmgebung, zum anderen in einer dem klassischen Gesang angelehnten Phonation. Die MRT-Aufnahmen wurden mit einer 12-Elemente Kopf-Hals-Spule mit nachfolgenden Einstellungsparametern erstellt: Schichtdicke: 1,5 mm, Bildanzahl: 52, Bildorientierung: coronar, Matrix: 192x192 mm, Sichtfeld: 250x250 mm. Mögliche weitere Einflussfaktoren wie Alter, Stimmgattung sowie die bisherige Studienzeit wurden ebenso erhoben.

Ergebnisse

Zur Segmentierung der MRT-Daten wurde eine eigens entwickelte Software eingesetzt. In einer mittleren Sagitalebene wurde zunächst ein Zentralpfad in den Vokaltrakt von den Lippen bis in die Trachea gelegt. Anschließend wurde der Bilderstapel so geschnitten, dass die Schnittebenen senkrecht zum Tangentenvektor des Zentralpfades liegen. Aus dem so hergestellten Bilderstapel wurden mittels aktiver Konturen zweidimensionale Segmente entlang der Luft-Weichteil-Grenze erstellt.

Das Zusammensetzen der zweidimensionalen Segmente bildet die dreidimensionale Oberfläche des Vokaltraktes, welche in die Visualisierungssoftware „Amira“ (Visage Imaging, Deutschland) für weitere Messungen weitergeleitet werden kann (Abbildung 1 [Abb. 1]).

Diskussion und Fazit

Die Auflösung der angewandten MRT-Sequenz ist zur Erstellung eines 3D-Modells des Vokaltraktes für verschiedene intraphonatorische Bedingungen geeignet. Zur Darstellung kommen auch Strukturen des supraglottischen Ansatzrohres. Das intendierte Modell soll genutzt werden, um verschiedene Maße während unterschiedlicher Vokaltrakteinstellungen hinsichtlich Phonationsmodus, Vokalfarbe, Timbre oder Tonhöhe zu generieren. Weiterhin bietet der Untersuchungsansatz die Möglichkeit zur longitudinalen Untersuchung der artikulatorischen Anpassungen beispielsweise während des Gesangsstudiums. Perspektivisch erhoffen sich die Autoren einen Beitrag zur Verbesserung der Vorhersage von stimmlichen Entwicklungen im gesangspädagogischen Bereich.


Literatur

1.
Soquet A, Demolin D, Branderud P, Linblom B, Metens T. Real-time magnetic resonance imaging for the study of speech production. J Acoust Soc Am. 2002;112:2324.
2.
Sundberg J. Articulatory interpretation of the "singing formant". J Acoust Soc Am. 1974 Apr;55(4):838-44. DOI: 10.1121/1.1914609 Externer Link
3.
Roers F, Mürbe D, Sundberg J. Voice classification and vocal tract of singers: a study of x-ray images and morphology. J Acoust Soc Am. 2009 Jan;125(1):503-12. DOI: 10.1121/1.3026326 Externer Link
4.
Echternach M, Sundberg J, Arndt S, Breyer T, Markl M, Schumacher M, Richter B. Vocal tract and register changes analysed by real-time MRI in male professional singers-a pilot study. Logoped Phoniatr Vocol. 2008;33(2):67-73. DOI: 10.1080/14015430701875653 Externer Link