Article
Analyse von klinisch-audiologischen Datenbanken mittels KI
Search Medline for
Authors
Published: | March 5, 2024 |
---|
Outline
Text
Durch den langjährigen Einsatz von Computeraudiometern liegen in vielen Einrichtungen umfangreiche audiologische Datensätze vor, deren Auswertung neue Erkenntnisse liefern können. Auf der anderen Seite bereiten solche Datensätze große Probleme, da Systematik der Erhebung durch klinische Gegebenheiten bestimmt war. Für die Analyse müssen diese Daten jedoch aufbereitet werden. Fehlende Messwerte sind insofern problematisch, da das Fehlen zufällig sein kann, aber auch durch die Ergebnisse anderer Messungen entbehrlich sein könnten. Z.B. wird ein sehr schlechtes Tonaudiogramm evtl. dazu führen, dass ein Sprachaudiogramm gar nicht gemessen wurde. Somit existiert kein Messwert für die Sprachverständlichkeit, da diese mit 0 „bewertet“ wurde. Für die Beurteilung von Hörschwellen außerhalb des Messbereichs ist es erforderlich, die frequenzabhängigen Maximalpegel der Wandler zu kennen, die substantiell variieren können. Daher muss bei der Imputation der fehlenden Daten besondere Sorgfalt gelegt werden und alle Ergebnisse vor diesem Hintergrund betrachtet werden. Dieser als Datenbereinigung bezeichnete Schritt ist besonders wichtig und kann die Interpretation der Ergebnisse deutlich beeinflussen.
Die existierenden Verfahren, die heute unter KI-Verfahren oder maschinelles Lernen bezeichnet werden, sind vielfältig und können bei der Auswertung größerer Datenbanken einen wichtigen Beitrag liefern. Ein Beispiel hierfür ist die auf Entscheidungsbäumen beruhende Analyse mittels Random Forest, das sich für die Klassifikationsaufgaben und für Regressionsaufgaben eignet.
Für die Analyse wurden vollständige Datensätze für erwachsene Patienten in unserer Einrichtung analysiert, bei denen zwischen 2002 und 2020 ein Ton- und Sprachaudiogramm durchgeführt wurde und vollständige Datensätze vorlagen. Nach einer weiteren Datenbereinigung lagen für 19.801 Ohren vollständige ton- und sprachaudiometrische Datensätze vor.
Es wurde für unterschiedliche Sprachverstehenswerte (max. Einsilberverstehen, Einsilberverstehen bei 65 dB, Pegel des maximalen Sprachverstehens (dBopt)) die Abhängigkeit von den Tonhörschwellen bei 0,5 bis 8 kHz und dem Lebensalter der Patienten mittels generalisierten linearen Modellen (GLM) und Random Forest Regression (RFR) analysiert.
Es zeigte für alle Sprachverstehensparameter Parameter eine starke Abhängigkeit vom Tonhörverlust. Zusätzlich wurde für Gruppen identischen Hörverlustes noch das Lebensalter als (negative) Einflussgröße identifiziert. IM GLM zeigte sich hier modellbedingt eine nahezu lineare Abnahme mit dem Lebensalter. In der RFR Analyse wurden außerdem besonders starke Effekte in der vierten und fünften Lebensdekade festgestellt.
Zusammenfassend erlaubt die RFR Analyse eine parameterfreie datengestützte Darstellung des Alterseffektes. Aufgrund des retrospektiven Designs sind die Zusammenhänge insgesamt mit Zurückhaltung zu interpretieren. Die gefunden Ergebnisse müssten noch durch prospektive Studien untersucht werden.