gms | German Medical Science

38. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP)

Deutsche Gesellschaft für Phoniatrie und Pädaudiologie e. V.

29.09. - 02.10.2022, Leipzig

Validierung und Klassifizierung des 9-item Voice Handicap Index (VHI-9i)

Vortrag

38. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Leipzig, 29.09.-02.10.2022. Düsseldorf: German Medical Science GMS Publishing House; 2022. DocV12

doi: 10.3205/22dgpp16, urn:nbn:de:0183-22dgpp167

Veröffentlicht: 26. September 2022

© 2022 Caffier et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Hintergrund: Zur diagnostischen Erfassung der subjektiven Stimmbeeinträchtigung werden der Voice Handicap Index (VHI) und seine Kurzformen eingesetzt. Die bisherige 4-stufige Schweregradeinteilung des VHI-9i, der 9-item Kurzform des Voice Handicap Index, beruht dabei auf den Perzentilen einer repräsentativen Untersuchung von 718 Patienten. Hauptziel unserer Studie war es, die Einteilung der Schweregrade anhand einer deutlich größeren Anzahl Untersuchter zu validieren sowie die Grenzwerte der einzelnen Schweregradklassen durch statistische Berechnungen zu bestätigen oder anzupassen.

Material und Methoden: In der DiVAS-Datenbank (XION GmbH) der Klinik für Audiologie und Phoniatrie der Charité – Universitätsmedizin Berlin wurden zwischen 2009 und 2021 insgesamt 17.660 aufeinanderfolgende Fälle dokumentiert, von denen nach Anwendung der Ausschluss- (Jitter >5%) bzw. Einschlusskriterien (nur Erstuntersuchungen, komplette multidimensionale Stimmfunktionsdiagnostik nach ELS-Standard) 3.661 vollständige und eindeutige Fälle übrig blieben. Statistisch analysiert wurden u.a. die Reliabilität des VHI-9i-Fragebogens (Test-Retest), Korrelationen (Pearsons r), sowie die Abhängigkeit von Alter (Regressionsanalyse), Geschlecht (t-Test) und beruflichem Stimmgebrauch (Kruskal-Wallis H-Test).

Ergebnisse: Der VHI-9i erwies sich als äußerst reliabel, ohne relevanten Einfluss von Geschlecht, beruflicher Stimmbelastung und Alter. Durch die Korrelation mit anderen etablierten Stimmfunktionsparametern und die Klassifikation mittels statistischer Verfahren konnte der VHI-9i erfolgreich validiert werden. Die Selbsteinschätzung der aktuellen Stimmbeeinträchtigung (VHIs) zeigte sich prädestiniert für eine Klassifizierung.

Fazit: Aufgrund unserer Untersuchungsergebnisse empfehlen wir folgende VHI-9i-Klassifikation: Schweregrad 0 (keine Stimmstörung): 0≤7 Punkte; Schweregrad 1 (geringgradige Stimmstörung): 8≤16 Punkte; Schweregrad 2 (mittelgradige Stimmstörung): 17≤26 Punkte; Schweregrad 3 (hochgradige Stimmstörung): 27≤36 Punkte.


Text

Hintergrund

Zur diagnostischen Erfassung der subjektiven Stimmbeeinträchtigung werden der Voice Handicap Index (VHI) und seine Kurzformen eingesetzt. Die bisherige 4-stufige Schweregradeinteilung des VHI-9i, der 9-item Kurzform des Voice Handicap Index, beruht auf den Perzentilen einer repräsentativen Untersuchung von 718 Patienten [1]. Hauptziel unserer Studie war es, die Einteilung der Schweregrade anhand einer deutlich größeren Anzahl Untersuchter zu validieren sowie die Grenzwerte der einzelnen Schweregradklassen durch statistische Berechnungen zu bestätigen oder anzupassen. Außerdem enthielten unsere VHI-9i-Fragebögen die Zusatzfrage „Wie schätzen Sie Ihre Stimme heute ein?“. Der aktuelle Zustand der eigenen Stimme konnte dabei mit nur einer einzigen Zahl, dem sogenannten VHIs, auf einer Skala von 0 bis 3 zusammenfassend bewertet werden (0: normal, 1: leicht gestört, 2: mittelgradig gestört, 3: hochgradig gestört).

Material und Methoden

In der DiVAS-Datenbank (XION GmbH) der Klinik für Audiologie und Phoniatrie der Charité – Universitätsmedizin Berlin wurden zwischen 2009 und 2021 insgesamt 17.660 aufeinanderfolgende Fälle dokumentiert, von denen nach Anwendung der Ausschluss- (Jitter >5%) bzw. Einschlusskriterien (nur Erstuntersuchungen, komplette multidimensionale Stimmfunktionsdiagnostik nach ELS-Standard) 3.661 vollständige und eindeutige Fälle übrigblieben.

416 Patienten wurden gebeten, denselben VHI-9i-Fragebogen ein zweites Mal innerhalb einer Woche auszufüllen, um durch den Vergleich der Antworten die Reliabilität des VHI-9i zu etablieren (Test-Retest). Eine zwischenzeitliche therapeutische Intervention fand nicht statt. Die Ergebnisse wurden auf Verzerrungen (t-Test für verbundene Stichproben), Korrelationen (Pearsons r) sowie Abhängigkeiten von Alter (Regressionsanalyse), Geschlecht (t-Test für unabhängige Stichproben) und beruflichem Stimmgebrauch (Kruskal-Wallis H-Test) statistisch analysiert.

Nach der Reliabilitätsanalyse musste die Klassifizierung des VHI-9i validiert werden. Korrelationen mit den Stimmfunktionsparametern VHIs, Dysphonie-Schweregrad-Index (DSI), Stimmumfangsmaß (SUM), stimmlicher Rauigkeit (R), Behauchtheit (B) sowie Gesamtheiserkeit (H) wurden mittels Spearmans rho (ρ) bestimmt, um den am besten geeigneten Klassifikator zu finden. Die Ausgewogenheit dieses potentiellen Klassifikators in Bezug auf Sensitivität und Spezifität wurde anschließend mittels ROC-Kurven (Receiver Operating Characteristic) untersucht. Durch die Berechnung der Fläche unter der Kurve (AUC) konnte die Eignung der Stimmfunktionsparameter als Klassifikator eingeschätzt werden. Als Ausgangspunkt für die ROC-Auswertung wurde der Youden-Index (J) [2] verwendet, der immer dann am höchsten wird (Max J), wenn Sensitivität und Spezifität optimal ausgeglichen sind. Als weiterer Anhaltspunkt wurde der Wert bestimmt, bei dem die Anzahl der korrekt klassifizierten Fälle (CCCs) am größten war (Max CCC). Anschließend wurde der Median zwischen Max J und Max CCC berechnet (J-CCC-Median), um plausible Schwellenwerte zu finden, die sich auch mit unserer jahrzehntelangen klinischen Erfahrung im Einsatz des VHI-9i decken.

Ergebnisse

Bei der Reliabilitätskohorte (n = 416) lag das Durchschnittsalter bei 50 ± 17 Jahren (mean ± SD), wobei Männer (56 ± 16) älter waren als Frauen (46 ± 17). 253 Studienteilnehmer hatten Berufe ohne besonderen Stimmbedarf (60,8%), 78 waren Nicht-Berufssprecher (18,7%), 59 Berufssprecher (14,2%), während lediglich 26 einen Hochleistungsstimmberuf ausübten (6,3%). Der durchschnittliche Zeitabstand zwischen dem Ausfüllen des ersten und zweiten Fragebogens betrug 3,3 Tage (Median 2 Tage). Der mittlere Unterschied im VHI-9i-Gesamtwert betrug 0,25 ± 3,52 Punkte (mean ± SD). Der t-Test für verbundene Stichproben ergab keine signifikanten Unterschiede zwischen den Test-Retest-Ergebnissen (p = 0,146). Beide Gesamtwerte korrelierten sehr gut miteinander (r = 0,919, p < 0,01). In nur 5% der Fälle zeigte sich eine Differenz von mehr als 7 Punkten. Das Konfidenzintervall von 7 kann damit als Mindestgröße für eine signifikante Änderung der Punktzahl der Selbsteinschätzung, z.B. nach Interventionen, angenommen werden. Weder das Geschlecht (p = 0,589) noch der berufliche Stimmgebrauch (p = 0,701) hatten Einfluss auf die Zuverlässigkeit des Fragebogens. Allerdings zeigte sich eine minimale Altersabhängigkeit, wobei für jedes Lebensjahr die Differenz um 0,016 Punkte stieg (p = 0,028).

Bei der Validierungskohorte mit vollständiger multidimensionaler Stimmdiagnostik (n = 3.661) waren 1.456 männlich (39,8%) und 2.205 weiblich (60,2%). Das Durchschnittsalter betrug 48 ± 17 Jahre, wobei Männer etwas älter waren als Frauen (50 ± 18 vs. 47 ± 17). Der VHI-9i korrelierte am stärksten mit dem VHIs, auch wenn die Beziehung zwischen beiden Parametern nur moderat war (ρ = 0,592). DSI und SUM korrelierten ebenfalls moderat miteinander (ρ = 0,663), während H und R die stärkste Korrelation untereinander aufwiesen (ρ = 0,871).

Mit wachsender VHI-9i-Gesamtpunktzahl stiegen auch die Schweregrade von VHIs, DSI, SUM und H, wobei sich deren Grenzen aufgrund mangelnder Trennschärfe überschnitten (Abbildung 1 [Abb. 1]). Das traf insbesondere für DSI und SUM zu, weshalb beide Parameter für eine Klassifizierung des VHI-9i ungeeignet scheinen.

Die ROC-Analyse zeigte, dass der VHIs am besten für die Klassifizierung geeignet ist, da die AUC-Werte hier am höchsten waren (Tabelle 1 [Tab. 1]). Abhängig davon, welcher der Stimmfunktionsparameter VHIs, DSI, SUM oder H als potentieller Klassifikator diente, unterschieden sich die mittels J-CCC-Median-Berechnung gefundenen, potentiellen neuen Grenzen der VHI-9i-Schweregrade. Die erste Grenze, die die Schweregrade 0 und 1 trennt, lag einheitlich zwischen 7 und 8 Punkten. Die Grenze zwischen den Schweregraden 1 und 2 war weniger einheitlich (zwischen 14 und 20 Punkten), weshalb dieser zweite Grenzwert nicht durch die ROC-Klassifizierung bestimmt werden konnte, sondern anhand des 50%-Quartils festgesetzt wurde (16 Punkte). Die Mediane der Grenze zwischen den Schweregraden 2 und 3 lagen – außer beim SUM – wieder relativ einheitlich zwischen 26 und 28 Punkten.

Diskussion und Fazit

Der VHI-9i erwies sich als äußerst reliabel, ohne relevanten Einfluss von Geschlecht und beruflicher Stimmbelastung. Auch der Alterseinfluss scheint von vernachlässigbarer Bedeutung für den klinischen Gebrauch: Für jedes Lebensjahr erhöhte sich das Retest-Ergebnis um 0,016 Punkte, was hochgerechnet einer Differenz von 1 Punkt zwischen einem 18-Jährigen und einem 81-Jährigen entspricht.

Durch die Korrelation mit anderen etablierten Stimmfunktionsparametern und die Klassifikation mittels statistischer Verfahren konnte der VHI-9i erfolgreich validiert werden. DSI, SUM und RBH spielten letztlich keine Rolle in unserer Empfehlung für die überarbeitete VHI-9i-Klassifizierung, weil sie schwächer mit dem VHI-9i korrelierten, nicht praktikable Schweregradgrenzen und eine schlechtere Trennschärfe aufwiesen. Das bestätigt auch die Ergebnisse anderer Studien, die zeigen, dass o.g. Stimmparameter verschiedene Aspekte der Stimmfunktion eines Patienten messen, nicht redundant sind, sondern sich gegenseitig ergänzen [3], [4], [5].

Der Parameter VHIs, d.h. die zusammenfassende Selbsteinschätzung der aktuellen Stimmbeeinträchtigung, zeigte sich prädestiniert für eine Klassifizierung des VHI-9i-Fragebogens. Aufgrund unserer Untersuchungsergebnisse empfehlen wir folgende VHI-9i-Klassifikation: Schweregrad 0 (keine Stimmstörung): 0 ≤ 7 Punkte; Schweregrad 1 (geringgradige Stimmstörung): 8 ≤ 16 Punkte; Schweregrad 2 (mittelgradige Stimmstörung): 17 ≤ 26 Punkte; Schweregrad 3 (hochgradige Stimmstörung): 27 ≤ 36 Punkte.

Der Einsatz des VHI-9i in der multiparametrischen phoniatrischen Stimmfunktionsdiagnostik anstelle der originalen, 30 Einzelfragen umfassenden VHI-Langform erscheint sinnvoll, da ein entscheidender Zeit- und Compliance-Vorteil resultiert, ohne an klinisch relevanter Aussagekraft zu verlieren.


Literatur

1.
Seipelt M, Nawka T. Validierung des 9-Item Voice Handicap Index (VHI-9i). In: Deutsche Gesellschaft für Phoniatrie und Pädaudiologie (DGPP), editor. 27. Wissenschaftliche Jahrestagung der Deutschen Gesellschaft für Phoniatrie und Pädaudiologie (DGPP). Aachen, 17.-19.09.2010. Düsseldorf: German Medical Science GMS Publishing House; 2010. Doc10dgppP10. DOI: 10.3205/10dgpp37 Externer Link
2.
Youden WJ. Index for rating diagnostic tests. Cancer. 1950 Jan;3(1):32-5. DOI: 10.1002/1097-0142(1950)3:1<32::aid-cncr2820030106>3.0.co;2-3 Externer Link
3.
Woisard V, Bodin S, Yardeni E, Puech M. The voice handicap index: correlation between subjective patient response and quantitative assessment of voice. J Voice. 2007 Sep;21(5):623-31. DOI: 10.1016/j.jvoice.2006.04.005 Externer Link
4.
Salmen T, Ermakova T, Möller A, Seipelt M, Weikert S, Rummich J, Gross M, Nawka T, Caffier PP. The Value of Vocal Extent Measure (VEM) Assessing Salmen T, Ermakova T, Möller A, Seipelt M, Weikert S, Rummich J, Gross M, Nawka T, Caffier PP. The Value of Vocal Extent Measure (VEM) Assessing Phonomicrosurgical Outcomes in Vocal Fold Polyps. J Voice. 2017 Jan;31(1):114.e7-114.e15. DOI: 10.1016/j.jvoice.2016.03.016 Externer Link
5.
Müller C, Caffier F, Nawka T, Müller M, Caffier PP. Pathology-Related Influences on the VEM: Three Years' Experience since Implementation of a New Parameter in Phoniatric Voice Diagnostics. Biomed Res Int. 2020 Dec 21;2020:5309508. DOI: 10.1155/2020/5309508 Externer Link