gms | German Medical Science

27. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

17.09. - 19.09.2010, Aachen

Neuronale Modelle zur Sensomotorik des Sprechens

Vortrag

Suche in Medline nach

  • corresponding author presenting/speaker Bernd J. Kröger - Klinik für Phoniatrie, Pädaudiologie und Kommunikationsstörungen, RWTH Aachen University, Aachen, Deutschland

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 27. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Aachen, 17.-19.09.2010. Düsseldorf: German Medical Science GMS Publishing House; 2010. Doc10dgppR06

DOI: 10.3205/10dgpp82, URN: urn:nbn:de:0183-10dgpp826

Veröffentlicht: 31. August 2010

© 2010 Kröger.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einführung

Linguistisch-kognitive Modelle der Sprachproduktion (e.g. [8], [1]) sowie der Sprachwahrnehmung [6] beschränken sich im Wesentlichen auf die Beschreibung der Aktivierung von neuronalen Netzwerken auf semantischer, syntaktischer und phonologischer Ebene. Die Ebene der motorischen Umsetzung wie auch der sensorischen Erfassung des Gesprochenen wird hingegen weitgehend ausgespart. In den letzten Jahren wurden nun aber auch Modelle sowohl zur Umsetzung linguistisch-phonologischer Aktivierungen in motorisch-artikulatorische und akustische Sprachsignale (Produktionsmodelle, siehe z.B. [3], [7]) wie auch zur Umsetzung akustischer in neuronale Sprachsignale (Perzeption, siehe z.B. [2]) realisiert.

Im Zentrum dieses Beitrages steht die Beschreibung der Produktionsmodelle von Guenther [3] und von Kröger et al. [7]. Anhand dieser Modelle wird versucht, grundsätzliche Mechanismen des frühen Spracherwerbs aufzuzeigen und die enge Verzahnung zwischen Motorik und Sensorik beim Sprechen zu illustrieren. Abschließend wird diskutiert, in wie weit diese Modelle hilfreich sein können, Sprechstörungen besser zu definieren bzw. inwieweit aufgrund dieser Modelle therapeutische Strategien generiert und begründet werden können.

Das Modell von Guenther (2006)

Guenther [3] unterscheidet in seinem sensomotorischen Produktionsmodell zwischen der Vorwärts-Steuerung („feedforward control subsystem“) und der Rückkopplungs-Steuerung („feedback control subsystem“, Abbildung 1 [Abb. 1]). Bei der Vorwärts-Steuerung wird die neuronale Aktivierung der phonemischen Repräsentation einer Silbe oder eines Wortes (Ebene der Lautkarte; „speech sound map“) in eine motorische Aktivierung (Ebene der artikulatorischen Geschwindigkeits- und Positionsmappe; „articulatory velocity and position map“, Abbildung 1 [Abb. 1]) überführt. Parallel dazu werden die auditorischen und somatosensorischen Erwartungen (Soll-Muster) für die aktivierte Silbe auf der Ebene einer auditorischen bzw. somatosensorische Soll-Karte aktiviert („auditory/somatosensory target region“ in Abbildung 1 [Abb. 1]). Die mittels der Vorwärts-Steuerung realisierte Artikulation führt zur Aktivierung auditorischer und somatosensorischer Ist-Muster auf der Ebene der auditorischen bzw. somatosensorischen Ist-Karte („auditory/somatosensory state map“). Weichen der sensorische Soll- und Ist-Zustand für die gerade produzierte Silbe voneinander ab, so entstehen neuronale Aktivierungen auf der Ebene der auditorischen bzw. somatosensorischen Fehler-Karte („auditory/somatosensory error map“, Abbildung 1 [Abb. 1]). Diese Aktivierungen leiten dann ihrerseits die Aktivierung von korrigierenden motorischen Befehlen ein („feedback commands“, Abbildung 1 [Abb. 1]).

Die Verbindungsgewichte der neuronalen Abbildungen (Pfeile in Abbildung 1 [Abb. 1]) werden im Wesentlichen in zwei Phasen des Spracherwerbs erlernt. Zunächst wird eine sprachunabhängige Lallphase (Babbelphase) simuliert, während der das Modell zufällige motorische Muster ausführt. Die zugehörigen sensorischen (Rückkopplungs-)Signale bzw. Muster werden dann den motorischen Mustern gegenüberstellt um daraus die Inversion von sensorischen in motorische Muster zu erlernen (i.e. Einstellen der Verbindungsgewichte für die korrigierenden motorischen Befehle oder „feedback commands“, Abbildung 1 [Abb. 1]). Danach beginnt die Phase der sprachspezifischen Imitation, d.h. es werden für eine vorgegebene Äußerung zunächst die auditiven Erwartungen, i.e. das auditorische Soll-Muster („auditory target regions“, Abbildung 1 [Abb. 1]). Danach werden in einem trial-and-error-Verfahren das zugehörige motorische Muster („feedforward commands“, Abbildung 1 [Abb. 1]) und das zugehörige sensomotorische Soll-Muster („somatosensory target regions“, Abbildung 1 [Abb. 1]) erlernt. Das Imitationslernen wird in dem Modell allerdings jeweils nur für die momentan zu realisierende Äußerung (Silbe oder Wort) realisiert. Es kann in diesem Modell nicht auf Wissen aus früherem Imitationslernen zurückgegriffen werden.

Das Modell von Kröger et al. (2009)

Das Modell von Kröger et al. [7] baut auf dem Modell von Guenther [3] auf. Auch hier kann die Vorwärts- und Rückkopplungs-Steuerung unterschieden werden. Innerhalb der Vorwärts-Steuerung wird eine Phonemfolge silbenweise in einen motorischen Plan und nachfolgend in primär motorische Bewegungszustände überführt (Abbildung 2 [Abb. 2]). Während auf der Ebene des motorischen Plans nur die aus lautsprachlicher Sicht wichtigsten Parameter der Silbe (e.g. lautliche Zielkonfigurationen, zeitliche Koordinierung der zugehörigen Ziel-Zeitintervalle für die die Lautziele realisierenden Artikulatoren) spezifiziert sind, liegt auf der primär-motorischen Ebene bereits eine vollständige Beschreibung der Bewegungen aller Artikulatoren für jeden Zeitpunkt der Äußerung vor. Innerhalb der Rückkopplungs-Steuerung werden die vom Modell selbst oder von einem externen Sprecher erzeugten sensorischen Ist-Muster (IM, Abbildung 2 [Abb. 2]) innerhalb der sensorisch-phonetischen Verarbeitungsmodule (als Teil des Kurzzeitgedächtnisses) zeitlich silbenweise gespeichert. Hier können diese Ist-Muster dann mit den während der Lernphasen gespeicherten Soll-Muster (SM, Abbildung 2 [Abb. 2]) verglichen werden. Bei merklichen Abweichungen zwischen Ist- und Soll-Mustern wird ein sensorische Korrektursignal generiert, das über die phonetische Karte in ein motorisches Korrektur-Signal überführt werden kann.

Im Unterschied zum Ansatz von Guenther [3] wird das während des Imitationstrainings erworbene Wissen zu den motorischen wie auch den sensorischen Soll-Mustern aller frequenten (häufigen) Silben der Zielsprache in diesem Modell in den neuronalen Abbildungen zwischen phonetischer Karte und motorischem Plan, bzw. zwischen phonetischer Karte und sensorischen Soll-Karten gespeichert (Etablierung eines motorisch-sensorischen Silbenspeichers). Die phonetische Karte selbst stellt eine sich über die Zeitspanne des frühen Spracherwerbs selbst organisierende hypermodale – d.h. über der motorischen Modalität und über den sensorischen Modalitäten stehende – neuronale Karte da, in der alle für diesen Sprecher typischen phonetischen typischen Realisierungs-Zustände der häufigen Silben der Zielsprache nach bestimmten Ordnungskriterien repräsentiert sind (zur detaillierten Beschreibung phonetischer Karten siehe [7]).

Mechanismen des frühen Spracherwerbs

Beide Modelle betonen die Wichtigkeit der Lallphase (Babbelphase) zur Etablierung des Wissens zu den grundlegenden sensorisch- (insbesondere auditorisch-)motorischen Zusammenhängen als Basis für das Imitationslernen. Wird das Erlernen dieser motorisch-sensorischen Zusammenhänge (i.e. die Etablierung der zugehörigen neuronalen Abbildungen) während der Lallphase (erstes Lebensjahr des Kindes) gestört, so wird dadurch auch das nachfolgende sprachspezifische Imitationslernen, d.h. der Aufbau des motorisch-sensorischen Silbenspeichers stark erschwert. Dieser Silbenspeicher wiederum erleichtert aber gerade das Wortlernen der Sprache, d.h. den Aufbau des mentalen Lexikons (Wortexplosion um dem 18. Lebensmonat; siehe z.B. [9]). Somit ist die Förderung motorischer wie auch somatosensorischer (taktiler und propriozeptiver) Fähigkeiten im Bereich der Sprechorgane ein wesentlicher Baustein in der Förderung des produktiven wie auch des rezeptiven Spracherwerbs.

Zur engen Verzahnung von Sensorik und Motorik

Beide Modelle illustrieren die enge Verbindung von Motorik und Sensorik. So ermöglicht die sensorische Kontrolle im Modell von Guenther [3] die Korrektur motorischer Steuersignale. Im Modell von Kröger et al. [7] repräsentiert die phonetische Karte die enge Verbindung von motorischen und sensorischen Mustern. Insbesondere kann hier die Aktivierung z.B. eines auditiven Musters durch einen externen Sprecher zur Koaktivierung zugehöriger motorischer Pläne im Modell (also beim Hörer) führen. Diese Koaktivierung von motorischen durch sensorische Muster ist ein typisches Charakteristikum von Spiegelneuronen [10] und wird auch als „dorsaler Pfad“ der Laut- und Silbenwahrnehmung bezeichnet [4], [5].

Schlussbemerkung

Beide Modelle betonen die Wichtigkeit insbesondere der Lallphase als grundlegend letztlich für das Erlernen der häufigsten motorischen Muster einer Sprache (motorische Muster der frequenten Silben) und letztlich auch des Wortlernens. Zusätzlich bedingt das gemeinsame Einwirken motorischer und sensorischer Muster auf die Selbstorganisation der phonetischen Karte aber auch, dass frequente Silben einfacher perzipiert werden können als nicht-frequente Silben (siehe dazu [7]). Somit hat die mit dem Spracherwerb verbundene motorische Sprechaktivität letztlich sogar fördernde Auswirkungen auf die Sprachwahrnehmung. Somit ist die Funktionsfähigkeit des neuromuskulären artikulatorischen Sprechapparates genau so entscheidend für den erfolgreichen perzeptiven und produktiven Spracherwerb wie die funktionsfähige Sensorik. Und somit begründen diese Modelle integrierte therapeutische Strategien zur gemeinsamen Förderung von Motorik (Artikulationstraining) und Sensorik (auditives, visuelles und somatosensorisches Training), auch wenn durch die Diagnostik entweder motorische oder auditive Störungen betont werden.

Darüber hinaus wird im Modell von Kröger [7] die Trennung von motorischer Planung und motorischer Ausführung (kortikal-motorische und neuromuskuläre Umsetzung) deutlich. Diese Trennung motiviert beispielsweise die Etablierung der Sprechapraxie als eigenständiges Störungsbild und ihre Abgrenzung von den Dysarthrien als Störungen der motorischen Umsetzung und der Aphasien als Störungen der kognitiv-linguistischen Fähigkeiten. Aufgrund der in diesem Modell dargestellten engen Verzahnung von Motorik und Sensorik gerade auf der Ebene der motorischen Planung sollte bei der Diskussion der Sprechapraxie zukünftig auch ein besonderes Augenmerk auf sensorische Defizite gelegt werden.

Danksagung

Diese Arbeit wurde teilweise mit Mitteln der Deutschen Forschungsgemein¬schaft (DFG) Projekt Nr. Kr1439/13-1 und Projekt Nr. Kr1439/15-1 gefördert.


Literatur

1.
Dell GS, Chang F, Griffin ZM. Connectionist models of language production: lexical access and grammatical encoding. Cognitive Science. 1999;23:517-41. DOI: 10.1207/s15516709cog2304_6 Externer Link
2.
Grossberg S. Resonant neural dynamics of speech perception. Journal of Phonetics. 2003;31:423-45. DOI: 10.1016/S0095-4470(03)00051-2 Externer Link
3.
Guenther FH. Cortical interactions underlying the production of speech sounds. Journal of Communication Disorders. 2006;39:350-65. DOI: 10.1016/j.jcomdis.2006.06.013 Externer Link
4.
Hickok G, Poeppel D. Dorsal and ventral streams: a framework for understanding aspects of the functional anatomy of language. Cognition. 2004;92:67-99. DOI: 10.1016/j.cognition.2003.10.011 Externer Link
5.
Hickok G, Poeppel D. The cortical organization of speech processing. Nature Reviews Neuroscience. 2007;8:393-402. DOI: 10.1038/nrn2113 Externer Link
6.
Indefrey P, Levelt WJ. The spatial and temporal signatures of word production components. Cognition. 2004;92:101-44. DOI: 10.1016/j.cognition.2002.06.001 Externer Link
7.
Kröger BJ, Kannampuzha J, Neuschaefer-Rube C. Towards a neurocomputational model of speech production and perception. Speech Communication. 2009;51:793-809. DOI: 10.1016/j.specom.2008.08.002 Externer Link
8.
Levelt WJ, Roelofs A, Meyer A. A theory of lexical access in speech production. Behavioral and Brain Sciences. 1999;22:1-75. DOI: 10.1017/S0140525X99001776 Externer Link
9.
Nazzi T, Bertoncini J. Before and after the vocabulary spurt: two modes of word acquisition? Developmental Science. 2003;6:136-42. DOI: 10.1111/1467-7687.00263 Externer Link
10.
Rizzolatti G, Craighero L. The mirror neuron system. Annual Review of Neuroscience. 2004;27:169-92. DOI: 10.1146/annurev.neuro.27.070203.144230 Externer Link