gms | German Medical Science

39. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP)

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

28.09. - 01.10.2023, Köln

Morphometrische Details des Vokaltrakts – wie determinieren sie die Transferfunktion?

Vortrag

Suche in Medline nach

  • corresponding author presenting/speaker Mario Fleischer - Charité – Universitätsmedizin Berlin, corporate member of Freie Universität Berlin and Humboldt-Universität zu Berlin, Klinik für Audiologie und Phoniatrie, Berlin, Deutschland
  • author Reuben Scott Walker - Charité – Universitätsmedizin Berlin, corporate member of Freie Universität Berlin and Humboldt-Universität zu Berlin, Klinik für Audiologie und Phoniatrie, Berlin, Deutschland; Hochschule für Musik Carl Maria von Weber, Dresden, Deutschland
  • author Dirk Mürbe - Charité – Universitätsmedizin Berlin, corporate member of Freie Universität Berlin and Humboldt-Universität zu Berlin, Klinik für Audiologie und Phoniatrie, Berlin, Deutschland; Hochschule für Musik Carl Maria von Weber, Dresden, Deutschland

39. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Köln, 28.09.-01.10.2023. Düsseldorf: German Medical Science GMS Publishing House; 2023. DocV9

doi: 10.3205/23dgpp17, urn:nbn:de:0183-23dgpp179

Veröffentlicht: 20. September 2023

© 2023 Fleischer et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Hintergrund: Detaillierte und individuelle 3-dimensionale Segmentationen des humanen Vokaltrakts stellen seit geraumer Zeit den optimalen Ausgangspunkt für die akustische Analyse der Transferfunktion durch abgeleitete 3d-gedruckte physische Modelle aber auch durch abgeleitete 3d-Berechungsmodelle dar. Sowohl die Erarbeitung der Segmentationen als auch die beiden genannten Analysen ziehen einen hohen Arbeitsaufwand nach sich dessen Minimierung ohne großen Genauigkeitsverlust in der Analyse ein lohnenswertes Ziel darstellt.

Material und Methoden: Um einen direkten Zusammenhang zu Detailsegmentierungen zu eruieren, wurden diese als Ausgangsbasis für fünf gehaltene Vokale zur Ableitung weniger detaillierter Modelle genutzt. Hierbei wurde die midsagittale Fläche bestimmt, die Mittellinien angenähert und entlang dieser die Querschnittsflächen berechnet. Auf dieser Basis wurden Zylindermodelle abgeleitet, die keine Nebenkavitäten beinhalten. Parallel dazu wurden Flächenfunktionen zur Auswertung in PRAAT bestimmt. Die Modellkaskaden wurde numerisch mittels der Finiten-Elemente-Methode durch Berechnung der Helmholtz-Gleichung analysiert.

Ergebnisse: Abhängig vom gewählten Vokal, zeigt sich bereits bei der zweiten Resonanzfrequenz eine erhöhte Abhängigkeit unter der Berücksichtigung der Lippenkontur. Während die vokalabhängige Abweichung in fR1 bis zu 77 Hz beträgt, kann die Abweichung bereits bis zu 341 Hz in fR2 und bis zu 1734 Hz in fR5 betragen. Ebenso zeigen die 3dB-Bandbreiten als auch die Amplitudenmaxima bei Frequenzwerten oberhalb der Vokalformanten eine deutliche Abweichung im Vergleich zu den Detailmodellen. Die effektiv zu beachtende akustische Länge des Vokaltrakts in Zylinder- bzw. 1d-Flächenfunktionsmodellen ist dabei vokalabhängig.

Diskussion: Trotz detaillierter Berücksichtigung der gebogenen Struktur des Vokaltrakts, dessen Längsausdehnung und Querschnittsverläufe zeigen bereits Zylindermodelle ab fR2 trotz 3d-Berechnung hohe Abweichungen zum zugehörigen Detailmodell. Dies zeigt, dass eine adäquate Analyse der akustischen Kapazitäten des Vokaltrakts, die auch die Individualität des Probanden berücksichtigt, nur auf Basis detaillierter 3d-Modelle erfolgen kann. Im Umkehrschluss kann postuliert werden, dass die Individualität im Stimmklang durch die morphometrischen Details des Vokaltrakts determiniert werden.

Fazit: Die vereinfachte Betrachtung des Vokaltrakts, z.B. als 1d-Wellenleiter, kann trotz feiner Diskretisierung keinen detaillierten Aufschluss über die realen akustischen Metriken des Vokaltrakts liefern.


Text

Hintergrund

Detaillierte und individuelle 3d-Segmentationen des humanen Vokaltrakts (VT) stellen den optimalen Ausgangspunkt für die akustische Analyse der Transferfunktion durch abgeleitete 3d-gedruckte physische Modelle aber auch durch abgeleitete 3d-Berechnungsmodelle dar. Sowohl die Erstellung der Segmentationen als auch die beiden genannten Analysen ziehen einen hohen Arbeitsaufwand nach sich, dessen Minimierung ohne großen Genauigkeitsverlust in der Analyse ein lohnenswertes Ziel darstellt.

Dabei ist es naheliegend, lediglich einen midsagittalen Schnitt vorhandener MRT- oder Röntgenaufnahmen zu wählen, die Luft-Weichteil-Grenzen in dieser 2d-Ebene zu finden und eine geometrische Mittellinie (ML) mit lokal identischen Abständen (A) zu definieren und diese Daten wiederum als Basis einer Flächenfunktion mit Kreisquerschnitten mit dem Radius A zu nutzen (siehe z.B. [1], [2]).

Es ist offensichtlich, dass die detaillierte 3d-Geometrie des VT (inkl. der realen Querschnittskonturen) aber auch Nebenkavitäten wie z.B. die Sinus piriformes dabei nicht berücksichtigt werden können. Das weiteren ist unter alleiniger Beachtung dieser Schnittebene nicht eindeutig die akustische Relevanz der Lippenkontur durch ihre Wölbung, und damit der Länge der ML, abschätzbar [3]. Die alleinige Betrachtung einer 1d-Flächenfunktion kann andererseits nicht den Einfluss der VT-Biegung abbilden.

Material und Methoden

Um die erwähnten Restriktionen adressieren und quantifizieren zu können wurden ausgehend von verfügbaren 3d-Detailsegmentierungen [4] für fünf gehaltene Vokale zwei Modellhierarchien abgeleitet, (1) 3d-Zylindermodelle und (2) 1d-Flächenfunktionen (Abbildung 1 [Abb. 1]).

Hierbei wurde die midsagittale Fläche bestimmt, die Mittellinien auf Basis von Voronoi-Diagrammen nach [1] angenähert und entlang dieser die Querschnittsflächen mit feiner Diskretisierung (siehe blaue Linien in Abbildung 1 [Abb. 1]) berechnet. Die ML-Länge wurde dabei jeweils parametrisiert, so dass der Bereich vom Mundwinkel (“notch depth” 100 %) bis zur Lippenspitze (“notch depth” 0 %) abgedeckt wird [3]. Auf dieser Basis wurden 3d-Zylindermodelle abgeleitet, die keine Nebenkavitäten beinhalten, und numerisch mittels der Finiten-Elemente-Methode durch Berechnung der Helmholtz-Gleichung analysiert wurden (siehe z.B. [5], [6]). Parallel dazu wurden 1d-Flächenfunktionen zur Auswertung in PRAAT bestimmt. In beiden Modellhierarchien wurden jeweils die Transferfunktionen sowie spektrale Eigenschaften wie Resonanzfrequenzen und 3dB-Bandbreiten analysiert.

Ergebnisse

Abhängig vom gewählten Vokal zeigt sich bereits bei der zweiten Resonanzfrequenz eine erhöhte Abhängigkeit unter der Berücksichtigung der Lippenkontur. Während die vokalabhängige Abweichung in fR1 bis zu 77 Hz beträgt, kann die Abweichung bereits bis zu 341 Hz in fR2 und bis zu 1734 Hz in fR5 betragen. Ebenso zeigen die 3dB-Bandbreiten als auch die Amplitudenmaxima bei Frequenzwerten oberhalb der Vokalformanten eine deutliche Abweichung im Vergleich zu den Detailmodellen. Die effektiv zu beachtende akustische Länge des Vokaltrakts in 3d-Zylinder- bzw. 1d-Flächenfunktionsmodellen ist dabei vokalabhängig (Abbildung 2 [Abb. 2]).

Diskussion

Trotz detaillierter Berücksichtigung der gebogenen Struktur des Vokaltrakts, dessen Längsausdehnung und Querschnittsverläufen zeigen bereits 3d-Zylindermodelle ab fR2 trotz 3d-Berechnung hohe Abweichungen zum zugehörigen Detailmodell. Dies zeigt, dass eine adäquate Analyse der akustischen Kapazitäten des Vokaltrakts, die auch die Individualität des Probanden berücksichtigt, nur auf Basis detaillierter 3d-Modelle erfolgen kann. Im Umkehrschluss kann postuliert werden, dass die Individualität im Stimmklang maßgeblich durch die morphometrischen Details des Vokaltrakts determiniert werden.

Fazit/Schlussfolgerung

Die vereinfachte Betrachtung des Vokaltrakts, z.B. als 3d-Zylinder- oder 1d-Flächenfunktionsmodell, kann trotz feiner Diskretisierung entlang der Mittellinie keinen detaillierten Aufschluss über die realen akustischen Metriken des Vokaltrakts, selbst im Frequenzbereich der Vokalformanten, liefern.


Literatur

1.
Lammert AC, Narayanan SS. On Short-Time Estimation of Vocal Tract Length from Formant Frequencies. PLoS ONE. 2015;10(7):e0132193.
2.
Serrurier A, Neuschaefer-Rube C. Morphological and acoustic modeling of the vocal tract. The Journal of the Acoustical Society of America. 2023 Mar;153(3):1867-86.
3.
Birkholz P, Venus E. Considering Lip Geometry in One-Dimensional Tube Models of the Vocal Tract. In: International Seminar on Speech Production, 2017.
4.
Birkholz P, Kürbis S, Stone S, Häsner P, Blandin R, Fleischer M. Printable 3D vocal tract shapes from MRI data and their acoustic and aerodynamic properties. Scientific Data. 2020 Aug;7(1):255.
5.
Fleischer M, Mainka A, Kürbis S, Birkholz P. How to precisely measure the volume velocity transfer function of physical vocal tract models by external excitation. PLoS ONE. 2018;13(3):e0193708.
6.
Fleischer M, Rummel S, Stritt F, Fischer J, Bock M, Echternach M, et al. Voice efficiency for different voice qualities combining experimentally derived sound signals and numerical modeling of the vocal tract. Frontiers in Physiology. 2022;13:1081622.