gms | German Medical Science

27. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie e. V.

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

17.09. - 19.09.2010, Aachen

Objektive Stimmanalyse von Phonationen zur Videostroboskopie

Poster

Search Medline for

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie. 27. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Aachen, 17.-19.09.2010. Düsseldorf: German Medical Science GMS Publishing House; 2010. Doc10dgppP11

DOI: 10.3205/10dgpp38, URN: urn:nbn:de:0183-10dgpp383

Published: August 31, 2010

© 2010 Lemm et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Zusammenfassung

Hintergrund: In der vorliegenden Studie sollte geprüft werden, ob sich das Stimmsignal einer gehaltenen Phonation, welches während der Videostroboskopie (VS) aufgezeichnet wurde, zur Analyse mit dem Göttinger Heiserkeits-Diagramm (GHD) eignet.

Material und Methoden: Hierzu wurden die Stimmaufnahmen der VS von 236 Patienten mit Hilfe des GHD analysiert. Am gleichen Untersuchungstag erfolgte zudem eine typische Mikrophonaufnahme gehaltener Phonationen zur Analyse nach dem vollständigen GHD-Protokoll. Die durch beide Verfahren ermittelten Werte für die Irregularität und die Rauschkomponente (GNE) wurden korreliert.

Um ein zukünftiges Untersuchungsprotokoll für die VS zu entwickeln, wurden außerdem notwendige Dauer und Anzahl von Stimmgebungen sowie die Vereinfachung des Vokals berücksichtigt. Außerdem wurde untersucht, ob sich beide Untersuchungsverfahren gleichermaßen zur klinischen Verlaufskontrolle eignen.

Ergebnisse: Sowohl für die Irregularitätskomponente (r=0,65) als auch für die Rauschkomponente (r=0,55) ergaben sich signifikante Korrelationen (p<0,001) zwischen beiden Verfahren.

Diskussion: Beide Untersuchungsverfahren liefern ähnliche Werte für die Stimmqualität. Außerdem zeigte sich, dass bereits eine einzige Stimmgebung während der VS ein zuverlässiges Ergebnis liefert. Es konnte eine Mindesttonhaltedauer von 1 Sekunde ermittelt werden. Die Vereinfachung des Vokals während der VS beeinflusst das Ergebnis nicht und beide Untersuchungen eignen sich zur klinischen Verlaufskontrolle.


Text

Einleitung und Hintergrund

Die Stimmanalyse mittels des Göttinger Heiserkeits-Diagramms (GHD) ist eine Standardmethode, um die Stimmqualität von Patienten objektiv zu beurteilen. Sie bietet die Möglichkeit, sowohl „normale“ gesunde als auch hochpathologisch veränderte Stimmsignale von Patienten nebeneinander abzubilden und sie vergleichend zueinander in Beziehung zu setzen [1]. Jedoch ist diese Art der Stimmanalyse mit einem nicht zu unterschätzenden zeitlichen Aufwand verbunden, da sie einem festgelegten Protokoll unterliegt. In der folgenden Studie sollte deshalb untersucht werden, ob sich das Stimmsignal einer gehaltenen Phonation, welches während der Videostroboskopie (VS) aufgezeichnet wurde, in gleichwertiger Weise zur Analyse mit dem GHD eignet. Bei möglicher Verwendung des VS-Stimmsignals zur objektiven Stimmanalyse ließe sich so der zeitliche Aufwand deutlich reduzieren.

Material

Als Material dienten videodokumentierte lupenlaryngoskopische und videostroboskopische Untersuchungen, welche in den Jahren 2007 und 2008 in der Phoniatrie und Pädaudiologie der Abteilung für Hals-Nasen-Ohren-Heilkunde der Universitätsmedizin Göttingen angefertigt und routinemäßig im .avi-Format mit einem Computersystem auf der Festplatte gespeichert wurden (Rehder&Partner, Hamburg). Am gleichen Untersuchungstag wurden von denselben Patienten typische Mikrophonaufnahmen gehaltener Phonationen zur Analyse nach dem vollständigen GHD-Protokoll aufgezeichnet. Diese wurden mit einem Computersystem auf Festplatte gespeichert (lingwaves WEVOSYS, Forchheim).

Methode

Die Stimmaufnahmen der VS von 213 Patienten analysierten wir mit Hilfe des GHD. Bedingt durch die Untersuchungssituation wurde bei der VS ausschließlich der Vokal [ε:] produziert. Sowohl die Dauer als auch die Häufigkeit der Phonationen unterschieden sich von Patient zu Patient.

Die nach dem vollständigen GHD-Protokoll aufgezeichneten Mikrophonaufnahmen umfassten standardisiert die Vokale [ε:]1, [a:], [e:], [i:], [o:], [u:], [ε:]2, die jeweils in den Tonlagen normal, hoch, tief und normal2 (nach dem Lesen eines vorgegebenen Textes) von den Patienten produziert wurden [2]. Diese Aufnahmen wurden ebenfalls mit Hilfe des GHD analysiert. Die durch beide Verfahren ermittelten Werte der Irregularität (IRR) und der Rauschkomponente (GNE) wurden miteinander korreliert.

Um ein zukünftiges Untersuchungsprotokoll für die VS zu entwickeln, wurde ebenfalls untersucht, inwiefern sich Dauer und Anzahl der Stimmgebungen sowie die Vereinfachung des Vokals in der VS im Vergleich zum vollständigen GHD-Protokoll auf die ermittelten Werte für IRR und GNE auswirken. Außerdem wurde untersucht, ob sich beide Untersuchungsverfahren gleichermaßen zur klinischen Verlaufskontrolle eignen.

Für statistische Korrelationsanalysen kam der Pearson-Test zur Anwendung. Um einen signifikanten Unterschied in beiden Untersuchungsmethoden nachzuweisen, verwendeten wir den Vorzeichentest für verbundene Stichproben. Das Signifikanzniveau lag jeweils bei 5% (p≤0,05).

Ergebnisse

Für die erste Analyse wurden die Werte für IRR bzw. GNE aus der VS gegen die Werte nach dem vollständigen GHD-Protokoll aufgetragen. Für IRR ergab sich dabei ein Korrelationskoeffizient von r=0,65 und ein P-Wert von P<0,001. Für den Parameter GNE ließ sich eine Korrelation von r=0,55 und ein P-Wert von P<0,001 beobachten. Der P-Wert aus dem Vorzeichen-Test für verbundene Stichproben (im Folgenden Pv) lag bei beiden Parametern bei Pv<0,001 (Abbildung 1 [Abb. 1] und Abbildung 2 [Abb. 2]).

In der zweiten Analyse wurde untersucht, ob die Anzahl der Stimmgebungen in der VS die Höhe der Korrelation zwischen den Werten beeinflusst. Dazu wurden die Werte wie in der ersten Analyse korreliert, dies wurde jedoch in Abhängigkeit von der Anzahl der Stimmgebungen in der VS vorgenommen. Es ergaben sich für IRR und GNE jeweils 6 Korrelationskoeffizienten r1–r6 für Patienten mit einer, zwei, drei, vier und fünf Stimmgebungen. 52 Patienten produzierten in der VS mehr als 5 Stimmgebungen (sechs bis maximal zwölf), hierfür wurde r6 berechnet. Für IRR waren r1=0,74 (n=27), r2=0,62 (n=34), r3=0,72 (n=38), r4=0,53 (n=45), r5=0,78 (n=16), r6=0,39 (n=52). Die P-Werte lagen jeweils bei P<0,001, Pv war für r1=0,44, r2=0,86, r5=0,21, r6=0,004. Für r3 und r4 ergab sich für Pv jeweils ein Wert von Pv<0,001. Für den Parameter GNE waren r1=0,52, r2=0,55, r3=0,47, r4=0,56, r5=0,73. Der P-Wert war außer bei r1 (P=0,01) jeweils P<0,001. Pv war bei r1 und r5 jeweils 0,02, bei r2 und r4 Pv<0,001, bei r3=0,01, bei r6=0,03.

Als nächstes wurde untersucht, ob die Dauer der gehaltenen Phonation(en) in der VS Einfluss auf die Korrelation zum gesamten GHD-Protokoll hat. Zunächst wurde die Korrelation für IRR und GNE für die Patienten ermittelt, bei denen die Länge der Stimmgebung(en) von vorne herein zwei Sekunden oder mehr betrug (n=21). Für IRR ergaben sich hierfür Werte von r=0,76 und P<0,001. Pv betrug 0,66. Für den Parameter GNE lag r=0,29 mit P=0,20 und Pv=0,08. In diesem Fall wurde also eine positive Korrelation festgestellt, der P-Wert war jedoch >0,05 und damit nicht signifikant. In gleicher Weise wurde für die Patienten verfahren, deren Stimmgebungen lediglich eine Sekunde lang waren (n=74). R lag für den Parameter IRR bei 0,61, der P-Wert bei P<0,001. Für GNE ergab sich r=0,58 mit P<0,001. Für beide lag Pv<0,001.

Die vierte Analyse beinhaltete die Auftragung der Werte aus dem gesamten GHD-Protokoll gegen die Werte aus dem reduzierten GHD-Protokoll, die lediglich aus den acht Vokalen [ε:] des gesamten Protokolls ermittelt wurden. Dies sollte zeigen, ob auch unter Verwendung lediglich eines Vokals eine realistische Einschätzung der Stimmqualität möglich ist. Für IRR ließ sich ein Wert von r=0,96 ermitteln, der P-Wert lag bei P<0,001. Für den GNE-Wert lag die Korrelation bei r=0,93 mit einem P-Wert von P<0,001. Erneut ergab sich für Pv für beide Parameter ein Wert von Pv<0,001.

Als letztes wurde untersucht, ob beide Verfahren Veränderungen in der Stimmqualität gleichermaßen abbilden. Dazu wurde bei den 43 Patienten, von denen eine Zweituntersuchung angefertigt wurde, zunächst die Differenz zwischen den Werten für die Irregularität aus dem vollständigen GHD-Protokoll von Zeitpunkt T1 und Zeitpunkt T2 errechnet. Ebenso wurde mit den Werten aus der Laryngoskopie verfahren. Die beiden sich ergebenden Werte wurden dann mit einander korreliert. Für den Parameter GNE wurde entsprechend verfahren. Für IRR ergab sich r=0,32, für GNE r=0,37. Der P-Wert lag jeweils bei P<0,05. Für Pv ergab sich für beide Parameter ein Wert von Pv=0,54.

Diskussion

Es konnte gezeigt werden, dass beide Methoden grundsätzlich vergleichbare Werte für die Stimmqualität liefern.

Darüber hinaus wurde deutlich, dass für den Parameter IRR die Verwendung von fünf Stimmgebungen zur Stimmanalyse im Vergleich zu einer Stimmgebung die Korrelation nur unwesentlich erhöht. Für den Rauschanteil des Stimmsignals (GNE) konnte hingegen nachgewiesen werden, dass sich eine höhere Anzahl von Stimmgebungen positiv auf die Korrelation auswirkt.

Es ließen sich für IRR und GNE insgesamt höhere Werte für die Korrelation erzielen, wenn die Stimmgebung(en) nur eine Sekunde lang waren. Für IRR allein lieferte eine Dauer von zwei Sekunden eine bessere Korrelation.

In der vorliegenden Arbeit zeigte sich darüber hinaus, dass die Verwendung des Vokals [ε:] eine robuste klinische Aussage über die Stimmqualität des Patienten liefert. Für wissenschaftliche Fragestellungen sollte jedoch weiterhin das vollständige Protokoll des GHD angewendet werden [3].


Literatur

1.
Fröhlich M, Michaelis D, Kruse E. Objektive Beschreibung der Stimmgüte unter Verwendung des Heiserkeitsdiagramms. HNO. 1998;46(10):864-9.
2.
Michaelis D. Das Göttinger Heiserkeits-Diagramm - Entwicklung und Prüfung eines Verfahrens zur objektiven Stimmgütebeurteilung pathologischer Stimmen [Dissertation]. Göttingen: Mathematisch-Naturwissenschaftliche Fakultäten der Georg-August-Universität; 1999.
3.
Michaelis D, Fröhlich M, Strube H, Kruse E. Reliabilität akustischer Stimmgütebeschreibung bei reduziertem Umfang der Stimmaufnahmen. In: Gross M (Hrsg). Aktuelle phoniatrisch-pädaudiologische Aspekte 1997, Bd. 5. Heidelberg: Median Verlag; 1998.