gms | German Medical Science

GMS Zeitschrift für Audiologie — Audiological Acoustics

Deutsche Gesellschaft für Audiologie (DGA)

ISSN 2628-9083

Leistungsoptimierte Signalverarbeitung in der objektiven Audiometrie – Digitale Werkzeuge für die effiziente Messung und Nutzung von AEP und OAE

Optimized signal processing in objective audiometry – Digital tools for the efficient use of AEP und OAE

Übersichtsarbeit

Search Medline for

  • corresponding author Sebastian Hoth - GMS Zeitschrift für Audiologie — Audiological Acoustics, Schriftleitung, Heidelberg, Deutschland

GMS Z Audiol (Audiol Acoust) 2022;4:Doc06

doi: 10.3205/zaud000024, urn:nbn:de:0183-zaud0000243

Published: August 30, 2022

© 2022 Hoth.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Zusammenfassung

Objektive Hörprüfmethoden beruhen auf der Rekonstruktion von verrauschten und mit diversen variablen Störeinflüssen überlagerten Signalen kleiner Amplitude. Die zur Bewältigung dieser Aufgabe etablierten Methoden sind die Selektion und Mittelung von Signalabschnitten. Mit diesen bewährten Instrumenten ist jedoch das heutige Potential der digitalen Signalverarbeitung bei weitem nicht ausgeschöpft. In diesem Artikel wird an bereits beschriebene aber in Vergessenheit geratene Verfahren erinnert und es werden neue Ansätze vorgestellt, die sich teilweise bereits in der klinischen Anwendung als nützlich erwiesen haben, zum anderen Teil noch auf ihre praktische Erprobung warten. Durch die Umsetzung der beschriebenen Verfahren können Präzision und Zuverlässigkeit der aus den otoakustischen Emissionen (OAE) und den akustisch evozierten Potentialen (AEP) abgeleiteten diagnostischen Aussagen erheblich gesteigert werden.

Zu den Inhalten dieser Übersicht zählen ein für den AEP-Nachweis optimiertes digitales Frequenzfilter, die Erweiterung der Signalmittelung auf die Polarität des Eingangssignals, die Extraktion von Parametern zur Gewinnung von Maßen für Qualität und Signifikanz und die zeitlich differentielle Korrelationsanalyse. Erstmals beschrieben sind die digitale Superposition mehrerer unabhängiger Messkurven zur besseren Darstellung einzelner Signalkomponenten, die Nutzung der statistischen Verteilung der Amplitude und ein Algorithmus zur Berücksichtigung der Reststörung bei der Schwellenbestimmung.

Schlüsselwörter: Objektive Audiometrie, akustisch evozierte Potentiale, otoakustische Emissionen, Signalnachweis, Reststörung, Signalstatistik

Abstract

The objective methods of audiometry rely on the registration of noisy signals of low amplitude which are contaminated with interferences of diverse and variable sources. The reconstruction of the target signal is performed by selection and averaging of many signal epochs. Beyond these basic digital tools of signal processing, whose practical value is well-proven, further procedures which have never been established in commercial devices are potentially suitable to further improve the signal quality and the reliability of its detection. They are subject of this paper, as well as several new approaches, some of which have already been proven as useful in clinical practice while others are still awaiting their practical application. By implementation of these procedures, the precision and reliability of the diagnostic conclusions derived from otoacoustic emissions (OAE) and auditory evoked potentials (AEP) can be enhanced substantially.

This review aims to exploit the potential of signal processing to the highest possible extent. Its main topics are a digital filter optimized for the detection of AEP, the extension of averaging to the polarity of the signal, the extraction of parameters qualified as measures for quality and significance, and the time-differential analysis of correlation. Furthermore, the digital superposition of several independent recordings, the use of the amplitude distribution and an algorithm developed to reduce the impact of residual noise on the response threshold are described for the first time.

Keywords: objective audiometry, auditory evoked potentials, otoacoustic emissions, response detection, residual noise, signal statistics


Einleitung

Gewidmet meinem Mentor Dr. Michael Berg, der mich in die Audiologie eingeführt hat.

Die objektive Audiometrie beruht auf der Messung von Signalen, die grundsätzlich und unvermeidbar von Störeinflüssen unterschiedlichen Ursprungs überlagert sind. Seit den Anfängen der Elektrischen Reaktions-Audiometrie (ERA) werden die (Nutz-)Signale biologischen Ursprungs dadurch nachgewiesen, dass sie in mehrfacher Ausfertigung gemessen und die registrierten Signalabschnitte schon während der Datenerfassung zu einem Mittelwert verarbeitet werden. Durch die Signalmittelung reduziert sich der Einfluss der Störsignale biologischen und nicht-biologischen Ursprungs, weil die Amplitude des Nutzsignals mit der Zahl der Summationen linear ansteigt, die Amplitude des Störsignals (Effektivwert=Wurzel aus dem mittleren Amplitudenquadrat) hingegen nur proportional zur Wurzel aus der Zahl der Summationen zunimmt: 100 Summationen führen zu einem 100-fach größeren Nutzsignal aber nur zu einer Verzehnfachung des Störsignals. Die sich daraus ergebende einfache Regel für den Störbefreiungsgewinn (z.B. Vergrößerung des Signal-Rausch-Abstandes um 30 dB bei 1.000 Iterationen) gilt jedoch nur unter der Voraussetzung stochastischer Störsignale, deren relevante Eigenschaften sich im Verlauf der Messung nicht ändern. In der Realität ist insbesondere die Bedingung der Stationarität bestenfalls näherungsweise erfüllt, da es praktisch keine Messung ohne langsame Veränderung der Bedingungen und/oder sporadisch auftretende Störungen gibt. Die Zahl der Faktoren, die das Störsignal beeinflussen, ist groß und inter- wie auch intraindividuell sehr variabel.

Naturgemäß besteht großes Interesse daran, den Störbefreiungsgewinn im Einzelfall zu maximieren. Bei den otoakustischen Emissionen (OAE), deren Nutzung sich in der überwiegenden Zahl der praktischen Anwendungen auf die Gewinnung der dichotomen Aussage „Signalnachweis gelungen oder nicht gelungen“ beschränkt, macht allein die effiziente Reduktion der Störeinflüsse den Wert der Methode aus, da deren Auswirkung bis zur vollständigen Verdeckung von tatsächlich vorhandenen Reizantworten gehen kann. Ebenso ist die Bestimmung von Reizantwortschwellen mit Hilfe der akustisch evozierten Potentiale (AEP) ohne eine differenzierte Beachtung der Störsignale praktisch nicht möglich oder zumindest in unzulässigem Maß ungenau.

Diese Eingangsbemerkungen sollen verdeutlichen, dass erstens die durch die Reststörung determinierte Messqualität mit allen verfügbaren Werkzeugen gefördert werden muss, dass dies zweitens einzelfallspezifisch erfolgen muss und dass drittens der erzielte Erfolg mit geeigneten Maßen beschrieben und dem Endnutzer in der Dokumentation an die Hand gegeben werden muss. Die Bewertung „Signalnachweis nicht gelungen“ kann viele Gründe haben – ein pathologisches Geschehen ist nur einer dieser Gründe.

Es ist das Ziel dieser Übersichtsarbeit, den für die Rekonstruktion der physiologischen Reizantworten geeigneten und verfügbaren Signalverarbeitungsverfahren zu einem größeren allgemeinen Bekanntheitsgrad zu verhelfen und zur Intensivierung ihrer praktischen Anwendung beizutragen. Dieses Bestreben erscheint dem Autor berechtigt, weil in der Medizintechnik häufig zu beobachten ist, dass etablierte diagnostische Verfahren sich gegenüber technischen Erweiterungen oder Neuerungen etwas schwerfällig verhalten. Die durchaus verständliche Neigung, am Bewährten festzuhalten, sollte aber nicht so weit gehen, dass beispielsweise die Beschränkungen der Computerleistung in den Anfangszeiten der objektiven Audiometrie noch heute die Vorgehensweise bestimmen. Der Autor ist überzeugt, dass die im Folgenden beschriebenen Verfahren schlummernde Reserven enthalten, deren konsequente Nutzung die Leistungsfähigkeit der objektiven Hörprüfungen weiter verbessern könnte. Verständlicherweise liegt der Fokus der Ausführungen auf den Schwerpunkten der Arbeit des Autors.


Digitale Filter

Die Messsonde (das Gehörgangsmikrophon bei der OAE- und die Elektroden bei der AEP-Messung) erfasst immer viele Signalfrequenzen, darunter auch solche, die zum Nachweis des physiologischen Signals wenig oder gar nicht beitragen. Für die AEP ist in Abbildung 1 [Abb. 1] gezeigt, dass das von den Elektroden erfasste EEG-Signal im Frequenzbereich von 1 bis 5.000 Hz alle Komponenten kurzer, mittlerer und langer Latenzzeit enthält, diese Nutzsignale aber um bis zu 60 dB übertrifft. Aus diesem Grund sind der Digitalisierung des analogen Signals grundsätzlich elektronische Hardware-Filter vorgeschaltet, deren Aufgabe es ist, den Einfluss von Signalanteilen nicht relevanter Frequenzen zu begrenzen. Es ist nachvollziehbar, dass eine variable Wahl des Durchlassbereiches bzw. der Grenzfrequenzen vorteilhaft ist: So sind z.B. bei den FAEP (frühe AEP) die Komponenten niedriger Frequenz eher unerwünscht, wenn der Wunsch nach einer möglichst genauen Bestimmung der Latenzzeiten besteht; bei schwellennahen Messungen oder im Fall eines Hochtonhörverlustes sind sie jedoch nützlich oder gar unentbehrlich.

Signalfilter können aber nicht nur als analoge elektronische Schaltkreise, sondern auch als digital programmierte Software-Komponenten realisiert werden. Diese haben den Vorteil, dass sie flexibel gestaltet und sowohl „online“ als auch „offline“, d.h. nach Abschluss der Datenerfassung, angewendet werden können. Anders als bei einem Hardware-Filter bleibt das Original bei der a-posteriori-Filterung unangetastet und steht nach Belieben für weitere Bearbeitungen zur Verfügung.

Die Eliminierung von (unerwünschten) Signalanteilen hoher Frequenz gelingt am einfachsten mit einer Dreipunktglättung (der k-te Wert Mk der Kurve wird gemäß der Formel 0.23 · Mk–1+0.54 · Mk+0.23 · Mk+1 aus dem ursprünglichen Wert und seinen Nachbarn berechnet). Sie entspricht einem einpoligen Tiefpassfilter mit einer Flankensteilheit von 6 dB pro Oktave. Digitale Filter höherer Ordnung ermöglichen größere Flankensteilheiten, erfordern jedoch aufwendigere Berechnungen. Die Wirkung eines speziell für die BERA (brainstem electric response audiometry) optimierten vierpoligen Bandpassfilters (Hochpass 300 Hz, Tiefpass 1.800 Hz) ist in Abbildung 2 [Abb. 2] gezeigt. Dieses Filter ist so dimensioniert, dass die Phasenverschiebungen von Hoch- und Tiefpass sich im Frequenzschwerpunkt des FAEP-Spektrums (bei ca. 700 Hz) kompensieren [Hönerloh und Kletti 1978]. Der Programmiercode umfasst, relativ unabhängig von der Programmiersprache, nur wenige Zeilen.

Die Wirkung desselben aber mit anderen Kenngrößen realisierten Filters auf die SAEP (späte AEP) ist in Abbildung 3 [Abb. 3] gezeigt. Die kortikalen Reizantworten weisen regelmäßig ein Vertex-negatives Maximum N1 bei 100 ms und ein Minimum P2 bei 200 ms auf, ohne relevante Abhängigkeit vom Reizpegel. Diese Zeitstruktur entspricht ziemlich genau einer Frequenz von 5 Hz mit wenig Energie bei anderen Frequenzen. Daher ist eine schmalbandige Filterung mit einem Durchlassbereich von 3 Hz bis 7 Hz möglich und für die Isolation des physiologischen Signals vor dem Störhintergrund vorteilhaft.

Jedes Filter bewirkt sowohl beim Nutz- als auch beim Störsignal einen Amplitudenverlust; es ist die Aufgabe der Dimensionierung des Filters, die Balance der Verluste zugunsten des Nutzsignals zu gestalten. In Abbildung 4 [Abb. 4] ist gezeigt, dass das Hochpassfilter bei den FAEP die Detektierbarkeit der FAEP-Reizantworten J1 und J3 im Bereich mittlerer Reizpegel verbessert. Hingegen ist für die Darstellung von J5 in Schwellennähe die breitbandige Ausführung besser, da die langwelligen Kurvenanteile bei der Hochpassfilterung verloren gehen.

Über das hier beschriebene Filter hinaus stehen in nahezu allen heutigen Messsystemen mehrere Realisierungen phasenfehlerfreier digitaler Filter zur Verfügung. Es obliegt dem Anwender, für die reversible Nachbearbeitung der gemessenen Kurven eine aufgrund ihrer Eigenschaften und ihrer Dimensionierung für die jeweilige Fragestellung angemessene Option auszuwählen.

Bei der Messung von OAE verringert die (digitale) Filterung die Auswirkung der in den Störeinflüssen dominierenden niedrigen Frequenzen und verbessert dadurch potentiell das Signal/Rausch-Verhältnis. Die Hochpassfilterung ist in speziellen Messparadigmen implementiert (z.B. QuickScreen-Modus bei ILO92, Otodynamics Limited, UK), die im Fall ungünstiger akustischer Bedingungen zu besseren Ergebnissen führen. Zusätzlich zur Abschwächung der Anteile niedriger Frequenz wird der Zeitbereich der Signalaufzeichnung verkürzt (z.B. von 20 auf 12 ms), da die Amplitude der im späten Latenzbereich (von 12 bis 20 ms) auftretenden und in den apikalen Regionen der Cochlea generierten Antworten niedriger Frequenz [4] durch das Filter verringert wird. Durch die Kombination der zwei Maßnahmen verbessert sich der Signalnachweis für die hochfrequenten physiologischen Antworten basocochleären Ursprungs und es verkürzt sich die Untersuchungsdauer.


Vorzeichenmittelung

Das herkömmliche Verfahren zur Rekonstruktion der physiologischen Reizantwort aus dem Untergrund der Störungen beruht auf der (linearen) Mittelung der Amplitude von reizsynchron aufgezeichneten Signalabschnitten. Ein alternatives Vorgehen, das sowohl Einschränkungen als auch Vorzüge aufweist, besteht in der Mittelung des Vorzeichens (oder der Polarität) des Signals an Stelle seiner Amplitude und der Interpretation des Ergebnisses mit Hilfe der Binomialstatistik [27], [10]. Diese Vorzeichenmittelung ist nur auf den ersten Blick eine „1-Bit-Mittelung“; tatsächlich trägt jeder Abtastwert in der Ausprägung von drei Kategorien („negativ“, „Null“ und „positiv“) zum Summationsergebnis bei. Das Verfahren wurde in den Anfängen der ERA in vielen Laborgeräten realisiert. Nur bei OAE-Screening-Geräten ist es zu einem auch heute noch verbreitet eingesetzten und wesentlichen Bestandteil der Signalbewertung in der Praxis geworden.

Der (indirekte) Beitrag der Vorzeichenmittelung zum Signalnachweis beruht auf ihrer Empfindlichkeit auf systematische Abweichungen eines Signals vom Zufallsprozess. Für ein vom Zufall bestimmtes (mittelwertfreies) Zeitsignal gilt, dass ein jeder einzelne Abtastwert mit gleicher Wahrscheinlichkeit ein positives oder negatives Vorzeichen hat. Die Addition des Vorzeichens über viele Ausführungen des Signals wird daher an jedem Punkt der Kurve statistisch den Erwartungswert 0 ergeben. Eine nach Maßgabe der Binomialstatistik, die für eine hinreichend große Zahl von Versuchen (Mittelungsschritten) in die Gauß-Verteilung übergeht, signifikante Abweichung von Null deutet darauf hin, dass das Signal nicht durch einen Zufallsprozess beschrieben werden kann.

Das Ergebnis „Null“ in der Vorzeichenmittelung bedeutet, dass das aus Nutz- und Störsignal zusammengesetzte Gesamtsignal in der Gesamtheit der Signalabschnitte genauso häufig positiv wie negativ war (oder in allen Ausfertigungen exakt Null). Durch Gleichspannungen oder Signalanteile niedriger Frequenzen, die trotz der Hochpassfilterung noch präsent sind, kann die Referenzlinie von Null verschieden sein. Die (vertikale) Abweichung von dieser Linie zeigt das Überwiegen einer der zwei Polaritäten an. Der besondere Wert der Vorzeichenmittelung besteht darin, dass eine Störung großer Amplitude sich in der Amplitudenmittelung mit dem Gewicht ihrer numerischen Größe, in der Vorzeichenmittelung hingegen nur mit einer einzigen binären Einheit auswirkt. Dadurch ist die Vorzeichenmittelung im Vergleich zur konventionellen Amplitudenmittelung sehr robust gegen Störeinflüsse.

Wenn die Vorzeichenmittelung nach n Mittelungen die Grenze

[Gleichung 1]

Gleichung 1

überschreitet – mit cp=1.645 für p=0.05, cp=2.326 für p=0.01 und cp=3.090 für p=0.001 – dann liegt mit der Wahrscheinlichkeit (1–p) zum Zeitpunkt der Überschreitung ein signifikant vom Zufallsprozess abweichendes Signal vor [22]. Ist das Originalsignal stark verrauscht, so wird bei gleicher Amplitude des Nutzsignals ein gegebenes Signifikanzniveau erst nach mehr Mittelungsschritten bzw. zu einem späteren Zeitpunkt erreicht. Im Gegensatz zur Kurve, die die Amplitudenmittelung der EEG-Abschnitte wiedergibt, erteilt die Vorzeichenmittelung nicht Auskunft über die Größe der Reizantwort, sondern über ihre Signifikanz.

Wird die Vorzeichenmittelung nur für einen Punkt des gesamten Zeitsignals berechnet, dann besteht die Gefahr, dass dessen „Abweichung vom Zufall“ gerade darin besteht, eine Nullstelle zu sein. Daher entfaltet die Methode nur dann ihr volles Potential, wenn der gesamte erfasste Zeitbereich in die Mittelung des Vorzeichens einbezogen wird (Abbildung 5 [Abb. 5]). Der Aufbau der Vergleichskurve erfolgt während der Datenerfassung, ihre visuelle Betrachtung ermöglicht es, den Fortschritt des Signalnachweises zu beurteilen und qualifiziert über Abbruch, Fortsetzung oder Beendigung Messung zu entscheiden – ähnlich wie auch bei dem auf der Single Point Variance beruhenden Verfahren [7], [9].


Reproduzierbarkeit und Signal/Rausch-Verhältnis

Bei vielen statistischen Prozeduren gilt der Satz, dass zwei Teile mehr Information enthalten als das aus diesen Teilen zusammengesetzte Ensemble. Bezogen auf die Mittelung von reizkorrelierten Biosignalen bedeutet dies unter anderem, dass die Berechnung einer einzigen Kurve aus der Gesamtheit aller Einzelantworten keine Beurteilung der Reproduzierbarkeit des Ergebnisses zulässt. Es erfordert jedoch weder apparativen noch Programmieraufwand, die Datenerfassung konsequent in zwei Teilmittelwertkurven A(t) und B(t) zu organisieren und die Option zur Berechnung und Darstellung des Gesamtmittelwertes (A + B)/2 anzubieten. Die Konstruktion von A(t) und B(t) muss schon während der Datenakquisition erfolgen, indem die nach den Reizen registrierten Signalabschnitte alternierend in einen von zwei Puffern summiert werden. Diese „quasi-simultane“ Bildung von Teilmittelwerten ist sehr hilfreich bei der Entscheidung, ob die Reizantwort als „echt“, d.h. signifikant aus dem Untergrund herausragend einzuschätzen ist (Abbildung 6 [Abb. 6]).

Die Reproduzierbarkeit r (aus den Kurven A(t) und B(t) berechneter Korrelationskoeffizient) ist nach [24] gemäß der nahezu exakt gültigen Gleichung

[Gleichung 2]

Gleichung 2

gleichwertig mit dem Signal/Rausch-Verhältnis

[Gleichung 3]

Gleichung 3

wobei (s+n) für das aus Signal und Restrauschen zusammengesetzte Gesamtsignal und n für das aus der (halben) Differenz der Teilmittelwerte bestimmte Restrauschen steht. Es steht dem Anwender frei, sich für die Betrachtung der Reproduzierbarkeit oder des Signal/Rausch-Verhältnisses zu entscheiden. In beiden Fällen muss für die Berechnung ein geeignetes Zeitfenster gewählt werden, welches durchaus mit Gewinn auch entlang der Zeitachse verschoben werden kann, um die Korrelation zeitlich differentiell anzuzeigen [19], [16].

Die Verfügbarkeit zweier Teilmittelwertkurven A(t) und B(t) eröffnet weiterhin die nützliche Option zur Berechnung des Kreuzleistungsspektrums aus Realteil Re und Imaginärteil Im der Spektren A(f) und B(f):

[Gleichung 4]

Gleichung 4

welches den kohärenten, den Teilmittelwerten A und B gemeinsamen spektralen Anteilen entspricht, und den inkohärenten Anteil

[Gleichung 5]

Gleichung 5

welcher das Spektrum des Restrauschens N wiedergibt (FFT=Fast Fourier Transformation). Die Trennung der kohärenten von den inkohärenten Anteilen ist vor allem bei den TEOAE sinnvoll und dort auch allgemein üblich [26].

Die Bemerkung erscheint angebracht, dass ipsi- und contralaterale Ableitung der AEP nicht in demselben Maße voneinander unabhängig sind wie zwei unter gleichen Bedingungen quasi-simultan registrierte Teilmittelwertkurven. Ihr Vergleich ist daher nur begrenzt als Kontrolle der Reproduzierbarkeit brauchbar.


Qualitätsmaße

Der Nachweis der im Rauschen verborgenen physiologischen Reizantwort hängt entscheidend davon ab, wie weit es gelingt, die nach der Signalmittelung verbleibende Reststörung klein zu halten. Bei Annäherung der Reizintensität an die Auslöseschwelle verschwindet die Reizantwort im Rauschen – erst bei noch niedrigeren Reizpegeln nimmt ihre Amplitude den Wert Null an. Daher liegt die Nachweisschwelle immer höher als die Auslöseschwelle; der Abstand zwischen beiden Schwellen ist umso größer, je größer die Reststörung ist. Im Grenzfall sehr großer Reststörung entziehen sich auch alle überschwelligen Reizantworten dem Nachweis.

Diese Betrachtungen machen deutlich, dass die Reststörung σ eine für die Beurteilung der Qualität einer AEP- oder OAE-Messung geeignete Maßzahl ist. Sie wird definiert als die Effektivspannung der halben Differenz der Teilmittelwerte A und B:

[Gleichung 6]

Gleichung 6

Hierbei erstreckt sich die zeitliche Integration über ein geeignetes Zeitfenster (bzw. die Summation über die Zeitreihe der zugeordneten Abtastwerte), z.B. von t1=2 ms bis t2=12 ms für die FAEP. Die Effektivspannung ist mit der Standardabweichung des Restrauschens gleichwertig.

Die Normen DIN EN 60645-6 und 60645-7 [5], [6] fordern die Anzeige eines (abgeschätzten) Qualitätsmaßes. Diese Vorgabe wird von vielen aber nicht allen Praxisgeräten eingehalten. Speziell bei den FAEP bietet sich die Kombination der Reststörung mit der graphischen Amplitudenkennlinie an, um die Identifizierung signifikanter Reizantworten zu erleichtern. Eine nutzerfreundliche, zweckmäßige und übersichtliche Umsetzung dieses Konzepts ist in Abbildung 7 [Abb. 7] gezeigt.

Die Reststörung ist ein geeignetes Maß zur Bildung von gewichteten Mittelwerten (in der Tabelle von Abbildung 7 [Abb. 7] mit „GMW“ gekennzeichnet) aus Parametern, die mehrfach anhand verschiedener Messungen bestimmt wurden. Beispielsweise sind die Differenzen von Latenzzeiten, insbesondere die cochleo-mesencephale Latenzdifferenz t5–t1 („Hirnstammlaufzeit“), in guter Näherung vom Reizpegel unabhängig und es kann daher aus den bei mehreren Reizpegeln gemessenen Einzelwerten ein Mittelwert berechnet werden, wobei die Einzelwerte sinnvollerweise mit einem zum Kehrwert der jeweiligen Reststörung proportionalen Faktor gewichtet werden. Dadurch wird sichergestellt, dass die aus Messungen mit guter Qualität abgeleiteten Parameter einen größeren Einfluss auf das Endergebnis haben. Die Wichtung bei der Bildung von Mittelwerten und die Differenzierung zwischen zuverlässigen und weniger zuverlässigen Messwerten kann entfallen, wenn für eine immer gleichbleibende (möglichst niedrige) Reststörung Sorge getragen wird.

In Kombination mit der Amplitude der Reizantwort ist die Reststörung das relevante Maß für die Signifikanz des Signalnachweises. Daher liegt es nahe, diese Größe schon während der Messung laufend zu berechnen, dem Untersucher anzuzeigen und zusätzlich optional als Stoppkriterium für den Abschluss der Messung zu nutzen. Für die transitorisch evozierten OAE (TEOAE) wurde nachgewiesen, dass die Identifikation der Reizantwort durch Experten in 87% der Fälle gelingt, wenn der Pegel der Reststörung unter –1.5 dB SPL liegt, hingegen in nur 71% der Fälle, wenn dieser Wert über +1.5 dB SPL liegt [16], [15]. Für den „numerischen“ Signalnachweis anhand der Reproduzierbarkeit betragen die entsprechenden Erkennungsraten 94% bzw. 84%, jeweils bezogen auf das Expertenurteil. Für die otoakustischen Distorsionsprodukte (DPOAE) gelten qualitativ ganz ähnliche, quantitativ aber weniger kritische Regeln, da die Reststörung aus messtechnischen Gründen viel niedriger liegt [18].


Digitale Superposition

In der Elektrischen Reaktions-Audiometrie (ERA) zielt ein großer Teil der Bemühungen um eine Steigerung von Qualität und Zuverlässigkeit auf die Objektivierung des Signalnachweises und die Bestimmung der Reizantwortschwelle. Daneben wird die ERA in Klinik und Praxis aber auch zu dem Zweck eingesetzt, Hinweise auf Reifungsverzögerungen oder auf Raumforderungen (wie z.B. ein Vestibularisschwannom oder eine Gefäßschlinge im inneren Gehörgang oder Kleinhirnbrückenwinkel) zu erhalten. Die Gewinnung von Information zu diesen Fragestellungen beruht ebenfalls auf der dichotomen und primär qualitativen Verwertung des Messergebnisses in Bezug auf die Identifizierung von Potential J5, zusätzlich aber auch auf dem Nachweis von J1 und der möglichst exakten quantitativen Vermessung der Latenzzeiten beider Komponenten.

Bis auf seltene Ausnahmen ist die Amplitude von Potential J1 kleiner als die von J5. Zusätzlich geht die Amplitude von J1 infolge von Hochtonschwerhörigkeiten, die in vielen der Verdachtsfälle vorliegt, in viel höherem Maße verloren als die von J5. Daher ist diese für die Bestimmung der cochleo-mesencephalen Latenzdifferenz t5–t1 („Hirnstammlaufzeit“) unentbehrliche Komponente in vielen Fällen nicht eindeutig identifizierbar. Das im Folgenden beschriebene Schema der nachträglichen Aufarbeitung der Daten dient dazu, das Potential J1 ohne zusätzliche Messungen deutlicher hervorzuheben.

Als Ausgangsmaterial für die Anwendung des Verfahrens liegen typischerweise zwei oder mehr bei verschiedenen Reizpegeln gemessene Click-evozierte FAEP-Ableitungen mit identifizierbarer und als signifikant ausgewiesener Komponente J5 vor. Unter diesen trifft der Untersucher mit Hilfe eines speziellen Software-Moduls eine Auswahl für die weitere Verarbeitung. Die Software korrigiert die Pegelabhängigkeit der Latenzzeiten, indem jede der ausgewählten Kurven entlang der Zeitachse nach Maßgabe des jeweiligen Wertes von t5 verschoben wird. Da die Latenzdifferenz t5–t1 in guter Näherung nicht vom Reizpegel abhängt [22], ist durch diese Maßnahme auch J1 synchronisiert. Aus den verschobenen Kurven wird eine Mittelwertkurve berechnet und dargestellt („aligned overlay“). Der beabsichtigte und erzielte Ausgleich der in systematischer Weise pegelabhängigen Latenz t5 folgt demselben Prinzip wie die Eliminierung der Frequenzabhängigkeit bei Bildung der „stacked derived-band response“ [8]. Aus der resultierenden „latenzkorrigierten digitalen Superposition“ kann die gesuchte Latenzdifferenz t5–t1 bestimmt werden (Abbildung 8 [Abb. 8]).

Der Ertrag dieser latenzkompensierten Superposition besteht in vielen Fällen in einer eindeutigen Rekonstruktion aller Potentiale J1 bis J5, die eine eindeutige Bestimmung der diagnostisch bedeutenden Latenzdifferenz t5–t1 zulässt. Sofern dies nicht gelingt, formuliert der Untersucher die Aussage „Hirnstammlaufzeit nicht bestimmbar“ auf einer wesentlich besser abgesicherten Grundlage als ohne diese digitale Auswertehilfe.

Durch die Verarbeitung mehrerer Kurven verbessert sich das Signal/Rausch-Verhältnis nach den allgemein geltenden Regeln, beispielsweise bei vier Kurven gleicher Amplitude um den Faktor zwei. Die Alternative besteht darin, die Zahl der Mittelungen um denselben Faktor zu erhöhen, was aber eine entsprechend höhere Belastung des Patienten und Verlängerung der Untersuchungsdauer zur Folge hat. Der praktische Nutzen der digitalen Superposition kann nicht in empirischen Zahlen angegeben werden. In der klinischen Arbeit des Autors hat sie sich jedoch als ein beinahe täglich angewendetes und wegen seiner Nützlichkeit sehr geschätztes Werkzeug bewährt.


Effektivamplitude als Alternative zur Amplitudendifferenz

Es gibt gute Gründe dafür, einen im Allgemeinen eher weniger beachteten Parameter der FAEP, nämlich die Amplitude A5 der Komponente J5, näher zu betrachten. Ganz allgemein ist die Annahme berechtigt, dass die Größe oder Stärke einer physiologischen Reizantwort zur Stärke des Reizes und zur Funktionalität und Vitalität des stimulierten biologischen Systems in einer engen und bestenfalls sogar diagnostisch nutzbaren Beziehung steht. Dabei verdient angesichts der unvermeidlichen Beimischung von Störungen zunächst die Frage nach einer eindeutigen und robusten Definition der Zielgröße Beachtung.

Bisher wird A5 üblicherweise aus der Differenz zweier Amplitudenwerte, meistens Maximum und Minimum (Abbildung 9 [Abb. 9]) bezogen. Diese Größe entspricht der vertikalen Ausdehnung des Potentialgipfels. Die relativ einfache Definition dieser linearen Amplitudendifferenz A5lin ist nicht das Ergebnis einer Optimierung in Bezug auf Aussagekraft, Präzision oder Robustheit, sondern eher darauf zurückzuführen, dass ihre Berechnung mit nur wenig Aufwand verbunden ist. In der Nachrichtentechnik ist es jedoch allgemein üblich, für die quantitative Beschreibung zeitabhängiger Signale die Effektivamplitude und nicht die Differenz zweier Einzelwerte zu betrachten, insbesondere bei unregelmäßigem Signalverlauf. Einer der Gründe dafür besteht darin, dass die effektive Amplitude eher als die lineare Amplitude das wiedergibt, was hier relevant ist, nämlich die im Signal enthaltene physikalische Leistung. Dies ist bei der linearen Amplitudendifferenz dann und nur dann der Fall, wenn alle durch z.B. Reizparameter oder Krankheit hervorgerufenen Änderungen des Potentialgebildes J5 rein lineare Maßstabstransformationen (ohne Verformungen oder Verzerrungen wie z.B. Abflachung) sind.

Die Effektivamplitude A5eff ist definiert als die Wurzel aus der kontinuierlich oder diskret berechneten mittleren quadratischen Abweichung der gemessenen Spannung U(t) von ihrem Mittelwert Ū:

[Gleichung 7]

Gleichung 7

Die Ausgangsgröße U(t) ihrerseits ist der aus den Teilmittelwerten A(t) und B(t) berechnete Gesamtmittelwert U(t) der EEG-Spannung und Ū die mittlere Amplitude dieser Kurve im Zeitintervall der Integration bzw. Summation, welches sich von t1=t5+–Δt/2 bis t2=t5–t/2 erstreckt; Lage und Ausdehnung dieses Zeitintervalls werden aus den Latenzzeiten von Maximum und Minimum abgeleitet (s. Abbildung 9 [Abb. 9]).

Die Berechnung der Effektivamplitude A5eff ist für den Untersucher mit keinem zusätzlichen Aufwand verbunden. Die einzige Intervention besteht in der ohnehin üblichen Identifizierung von Maximum und Minimum des Potentialgebildes J5. Aus den dadurch festgelegten Latenzzeiten t5+ und t5– ergibt sich der durch den doppelten horizontalen Abstand Δt zwischen Gipfel und Tal gegebene Zeitbereich der Integration bzw. Summation. Mit dieser Wahl des Zeitfensters ist die Erfassung des gesamten relevanten Signalabschnitts sichergestellt.

Die Effektivamplitude ist nicht etwa die von der Potentialkurve und der Null-Linie eingeschlossene Fläche, sondern die Wurzel aus dem mittleren Quadrat (root mean square, RMS) der zeitabhängigen Amplitude. Es handelt sich somit um eine statistisch definierte Größe, die bis auf das Zeitfenster genauso definiert ist wie die weiter oben definierte Reststörung der zugrundeliegenden Messung (und daher mit dieser direkt verglichen werden kann). Im Vergleich zur linearen Amplitudendifferenz ist dieser Parameter, da er aus viel mehr als nur zwei Abtastwerten hervorgeht, weniger anfällig gegenüber Variationen des Untergrundes als jede seiner Komponenten und somit ein genaueres Maß für die Signalstärke.

Die Effektivamplitude kann als Messgröße auch dann genutzt werden, wenn keine Reizantwort vorhanden ist. Zu diesem Zweck wird bei Registrierungen, die mit Reizpegeln unter der Reizantwortschwelle abgeleitet wurden, das Zeitfenster für die Berechnung von A5eff manuell oder automatisch aus der Extrapolation der exponentiellen Latenzkennlinie festgelegt [12]. Bei niedrigen Reizpegeln bewegt sich die Effektivamplitude zufallsbestimmt auf dem Niveau des Untergrundes; an der Reizantwortschwelle nimmt ihr Wert mit steigendem Reizpegel L systematisch zu (Abbildung 10 [Abb. 10]). Ein Knick in der Amplitudenkennlinie A5eff(L) kennzeichnet die Reizantwortschwelle. Hart an der Grenze zur Trivialität bewegt sich die Feststellung, dass für die zuverlässige Bestimmung der Schwelle sowohl Messwerte unter als auch über der Schwelle vorliegen werden müssen [13]. Neben dem visuell durch den Untersucher identifizierten Knick in der Graphik ist ein numerisches Kriterium maßgebend für signifikant über die Reststörung hinausgehende Reizantworten. Die Bedingung lautet, dass A5eff um mindestens eine Standardabweichung größer ist als die mit dieser Standardabweichung identische Reststörung σ [14].

Das Konzept der Effektivamplitude eröffnet die Möglichkeit, die Elektrische Reaktions-Audiometrie um eine nützliche Option zu erweitern. Durch seine Anwendung liegt die Einstufung als „Clear Response“ nicht allein „im Auge des Betrachters“, sondern sie beruht auf einem exakt definierten numerischen Kriterium. Dies führt zu einer erheblichen Erhöhung der Sicherheit bei der Objektivierung der Reizantwortschwelle.


Zeitlich differentielle Korrelationsanalyse (gliding reproducibility)

Die meisten der in der objektiven Audiometrie registrierten physiologischen Reizantworten liegen nur in einem Teil des aufgezeichneten Zeitbereichs vor. Dennoch wird der (häufig mit „Repro“ bezeichnete) Korrelationskoeffizient bzw. das Signal/Rausch-Verhältnis in aller Regel auf Grundlage der Daten des gesamten Zeitfensters berechnet. Dadurch kann die Situation eintreten, dass zwischen dem Ergebnis dieser Rechnung und der Reizantwort nur wenig oder gar kein Zusammenhang besteht. Im schlimmsten Fall führt dies dazu, dass eine Antwort übersehen wird, in jedem Fall aber wird mit der alleinigen Betrachtung der integralen Reproduzierbarkeit das Potential des Parameters zumindest nicht erschöpfend genutzt. Mit Hilfe der lokalen, zeitlich differentiellen Auswertung einzelner Abschnitte des Zeitfensters hingegen entgehen auch zeitlich enger begrenzte und in ihrer Lage (Latenzzeit) variable Reizantworten nicht dem Nachweis.

In Abbildung 11 [Abb. 11] ist das Ergebnis einer TEOAE-Messung gezeigt, das ausweislich der visuellen Bewertung eine eindeutige physiologische Reizantwort enthält. Da jedoch die Dauer dieser Antwort auf den ersten Teil des Zeitfensters beschränkt ist, beträgt die integral berechnete Reproduzierbarkeit gerade mal 48,2%. Den gängigen Regeln zufolge führt das zur Klassifizierung als „OAE-negativ“, obwohl die Grenze von 60% im Intervall 3 bis 9 ms durchgehend überschritten ist – mit einem Spitzenwert von 94,9%. Die gleitende zeitlich differentielle Berechnung des Korrelationskoeffizienten (gliding reproducibility) ermöglicht den zweifelsfreien OAE-Nachweis [16].

Für die Bewertung durch den Nutzer ist die quantitative graphische Darstellung der Reproduzierbarkeit in einem zusätzlichen Koordinatensystem nicht optimal. Intuitiver und für das Auge des Betrachters im Vergleich zur zweidimensionalen Graphik unmittelbarer zu erfassen ist die in Abbildung 12 [Abb. 12] gezeigte Codierung in des lokalen Korrelationskoeffizienten in abgestuften Grautönen [19]. Der Grad der Schwärzung variiert von weiß (Korrelationskoeffizient r≤0%) bis schwarz (r=100%). Da die Reproduzierbarkeit als Korrelationskoeffizient eine statistische, aus vielen Zahlenwerten berechnete Größe ist, ist sie umso mehr vom Zufall bestimmt, je kürzer das zugrundeliegende Zeitfenster ist. Daraus erklärt sich, dass im Grad der Schattierung benachbarter Felder große Kontraste auftreten können.

Das in Abbildung 12 [Abb. 12] gezeigte Beispiel macht deutlich, dass nachweisbare und normale OAE nicht dasselbe sind und die Unterscheidung zwischen beiden durchaus möglich und auch klinisch sinnvoll ist. Die globale Reproduzierbarkeit ist Grundlage des rein dichotomen Signalnachweises, sie sagt somit nicht mehr aus als „Signalnachweis gelungen“. Hingegen lässt ihre zeitlich differentielle Betrachtung differenzierte Aussagen über Abweichungen vom normalen Erscheinungsbild der Antwort und damit über mögliche pathologische Ursachen zu. Auch im Frequenzbereich erweitert die differentielle Betrachtung des Spektrums und die Codierung des lokalen Signal/Rausch-Verhältnisses in Graustufen die Informationsausbeute. Die durch die graphische Aufarbeitung unterstützte visuelle Entdeckung ausgefallener Latenzbereiche oder Frequenzbänder erleichtert die Ableitung von Hinweisen auf die von einer möglichen Hörminderung betroffenen Frequenzen.

Unter den in der objektiven Audiometrie genutzten physiologischen Signalen nehmen die TEOAE insofern eine Sonderstellung ein, als die Reizantwort sich im Normalfall über die gesamte Dauer des registrierten Zeitfensters erstreckt. Hingegen nimmt bei den transienten AEP (z.B. den mit der BERA gemessenen FAEP und den mit der CERA gemessenen SAEP) die Reizantwort nur einen Teil des Zeitfensters ein und ihre Lage innerhalb dieses Fensters ist variabel, da die Latenzzeit von den Reizparametern, von physiologischen Gegebenheiten und von pathologischen Veränderungen abhängt. Gerade in dieser Situation trägt die zeitlich differentielle Korrelationsanzeige ähnlich wie die Vorzeichenmittelung zur Identifikation der Reizantwort und zur Beurteilung ihrer Signifikanz bei (Abbildung 13 [Abb. 13]).

Die in diesem und in den vorangegangenen Abschnitten betrachtete Korrelation geht aus der Amplitude der beteiligten Kurven und ihrem zeitlichen Verlauf hervor. Zusätzlich kann aus der ersten zeitlichen Ableitung der Kurven die Korrelation der Steigung der Kurven bestimmt werden. Das Interesse daran ergibt sich daraus, dass die für die Diagnose so wichtigen Latenzzeiten der einzelnen Potentialkomponenten als lokale Maxima und Minima durch eine waagerechte Tangente gekennzeichnet sind. Die Steigung muss somit in beiden Teilmittelwertkurven eine Nullstelle aufweisen. Diese Gleichheit geht mit einer intensiven Schwärzung der Graustufenanzeige einher (Abbildung 13 [Abb. 13]). Sind die Maxima gegeneinander zeitlich versetzt, dann ist die Anzeige eher grau statt schwarz und die Latenzbestimmung ist weniger zuverlässig.


Amplitudenhistogramme

Die Erkennung des Signals vor dem Hintergrund der Reststörung ist der Schlüssel für den Nachweis von OAE und AEP. Als Instrumente bei der Bewältigung dieser Aufgabe werden alle Merkmale genutzt, die zur Unterscheidung zwischen Signal und Rauschen beitragen können. Zu diesen Merkmalen zählen zunächst die elementaren Parameter Frequenz, Phase und Amplitude, durch die alle zeitabhängigen Vorgänge vollständig beschrieben sind. Jede dieser Größen hat jedoch nicht nur einen Momentanwert, der z.B. in die Vorzeichenmittelung und den Korrelationskoeffizienten eingeht, sondern auch eine statistische Verteilung, die für deterministische und stochastische Vorgänge jeweils charakteristisch und voneinander verschieden sind. Diese Häufigkeitsverteilungen oder Histogramme der genannten Kenngrößen sind für den Prozess, der der Entstehung des Signals zugrunde liegt, charakteristisch. Im Allgemeinen werden Signal und Rauschen unterschiedliche Verteilungsdichten aufweisen. Wenn Signal und Rauschen als Mischung auftreten, überlagern sich ihre Verteilungsfunktionen.

Die statistische Verteilungsdichte enthält die Antwort auf die Frage, mit welcher Häufigkeit die einzelnen Werte des betrachteten Parameters auftreten. Unter den Parametern, deren Histogramme einen Nutzen haben könnten, sei hier nur die Amplitude näher betrachtet, wenngleich durchaus auch Frequenz- und Phasenspektren beim statistisch fundierten Signalnachweis eine Rolle spielen [2], [3].

Die Amplitudenverteilung eines stochastischen Prozesses hat bekanntlich die Gestalt einer Gauß-Kurve: Am häufigsten tritt der Wert Null auf, mit zunehmender Amplitude wird die Wahrscheinlichkeit ihres Auftretens immer kleiner. Weniger bekannt ist die Amplitudenverteilung einer harmonischen Schwingung: Weil die Sinuswelle in ihren Extremwerten flach und dazwischen steil verläuft, hat sie die Gestalt einer Mulde mit zwei Polstellen (Unendlichkeiten oder Singularitäten). Anschaulich ausgedrückt liegt das daran, dass die vertikale Zustandsdichte (Aufenthaltswahrscheinlichkeit) des Systems gegeben ist durch den Kehrwehrt der Steigung, wenn die Zustände der elektrischen Spannung in der horizontalen Dimension (Zeitachse) äquidistant verteilt sind.

Diese Betrachtung macht deutlich, dass die Amplitudenverteilungsdichte der additiven Überlagerung eines stochastischen Prozesses und eines sinusoidalen Signals sich durch Überhöhungen bei großen Absolutwerten der Amplitude in charakteristischer Weise von der die Zufallsverteilung kennzeichnende glockenförmigen Kurve unterscheidet (Abbildung 14 [Abb. 14]). Die Höhe dieser randständigen Linien im Spektrum hängt vom Signal/Rausch-Verhältnis ab; bei der isolierten Reststörung verschwinden die Überhöhungen ganz.

In der klinischen Praxis hat sich die Betrachtung der Amplitudenhistogramme vor allem für den N1-P2-Komplex der SAEP bewährt, da hier abschnittsweise ein evoziertes Signal vorliegt, das einer reinen harmonischen Schwingung gleicht (dem zeitlichen Abstand von 100 ms zwischen Maximum N1 und Minimum entsprechend beträgt die Frequenz dieser Schwingung ca. 5 Hz). Der Vergleich der Häufigkeitsverteilung der Summe aus Signal und Rauschen mit der der isolierten Reststörung macht die Anwesenheit einer Reizantwort in überzeugender Weise deutlich (Abbildung 15 [Abb. 15]). Über einen einzelnen bisher bestehenden, im Labor des Autors realisierten Prototypen hinaus ist sicher noch eine Optimierung möglich, beispielsweise in Bezug auf Länge des analysierten Zeitfensters. Mit zunehmender Länge nimmt der Einfluss des Rauschens zu und der Unterschied in den Amplitudenspektren verliert an Deutlichkeit.

Der praktische Nutzen der Amplitudenhistogramme erschöpft sich in der Betrachtung und Beurteilung ihrer graphischen Wiedergabe; quantitative Angaben zur Erhöhung der diagnostischen Sicherheit sind nicht möglich. Selbstverständlich kann die Abweichung der positiven Reizantwort von der Normalverteilung mit der Hilfe statistischer Tests in Zahlen gefasst werden; die Visualisierung trifft aber eher den Bedarf der Anwender, die auf diese Weise von einem maschinell und ohne zusätzlichen Aufwand bei der Identifizierung der Reizantwort unterstützt werden.


Dokumentation

Unter den im praktischen Einsatz befindlichen kommerziell erhältlichen Geräten zur Messung von OAE oder AEP befinden sich solche, bei denen die finale Präsentation der Untersuchungsergebnisse in Hinblick auf Zweckmäßigkeit und Ergonomie noch verbessert werden könnte. Nicht zweckmäßig und noch weniger ergonomisch ist es, das in vielen Bereichen des Lebens durchaus angebrachte Gebot der Vollständigkeit zu befolgen. Auch wenn es ohne Zweifel richtig ist, alle die Reizgebung, die Signalerfassung, die Messbedingungen und die Ergebnisse betreffenden Parameter zu dokumentieren, ist die Vollständigkeit der Angaben auf dem für die Patientenakte oder zur Weitergabe an Kollegen bestimmten (ausgedruckten) Untersuchungsbericht eher nachteilig als zielführend. Eine an den Erfordernissen einer rational bestimmten, übersichtlichen und dem Zweck orientierten Dokumentation beschränkt sich auf die Angaben, die diagnostische oder therapeutische Konsequenzen haben. Der Verstärkungsfaktor oder die Filtergrenzen gehören sicher nicht dazu; da ihre Einstellwerte nur bei seltenen speziellen Fragestellungen verändert werden, müssen sie nicht auf dem täglichen Befundbericht angegeben werden.

Ebenso wie die Überfrachtung mit irrelevanten Parametern gehört die Unterlassung substantieller Angaben zu den häufig anzutreffenden Mängeln. Der für die Deutung des Messergebnisses fundamental wichtige Vertäubungspegel und die nach den Normen DIN EN 60645-6 und 60645-7 [5], [6] unerlässliche Maßzahl für die Reststörung sind bei vielen Messsystemen gar nicht oder erst nach längerer Suche und nur am Bildschirm aufzufinden. Diese Defizite zu meiden war das Ziel der Entwicklung einer Software-Umgebung am Audiologischen Labor der Univ.-HNO-Klinik Heidelberg, mit deren Hilfe die Ergebnisse von OAE- und AEP-Messungen vollständig und zugleich kompakt dargestellt werden können.

Für die mit der BERA gemessenen FAEP sei die über Jahrzehnte optimierte Kompilation von graphischen Anzeigen und numerischen Angaben hier näher vorgestellt (Abbildung 16 [Abb. 16]). Vorteilhaft für den Betrachter ist die Erfassung der primären und sekundären Untersuchungsergebnisse auf einen Blick – ohne die Notwendigkeit, umzublättern bzw. zwischen verschiedenen Fenstern zu springen.

Mit besonderem Nachdruck sei hier für die Darstellung von jeweils zwei Teilmittelwertkurven geworben. Im üblicherweise gezeigten Gesamtmittelwert ist praktisch immer an den Stellen, an denen der Auswerter danach sucht, ein Potentialmaximum zu finden. Nur durch die Betrachtung der Teilmittelwerte ist eine Entscheidung über die Reliabilität dieses Maximums möglich. Bei Bedarf können die zwei Teile mit Leichtigkeit zum Ganzen zusammengesetzt werden, der Nutzen besteht aber lediglich in einer ästhetischen Aufwertung – unter Inkaufnahme eines Informationsverlustes.

Im Prinzip können alle angesprochenen Bestandteile der Dokumentation schon während der Datenerfassung angezeigt werden. Nach Abschluss der Messreihe können sich, wie im nächsten Abschnitt näher beschrieben, Auswertungen zur Auffindung der Reizantwortschwelle anschließen.


Schwellenbestimmung

Viele der in dieser Übersicht beschriebenen Verfahren und Hilfsmittel dienen dem Zweck, die Reizantwort sicher zu identifizieren und damit zur Bestimmung der Reizantwortschwelle beizutragen. Das audiologische Interesse an der Reizantwortschwelle – d.h. des niedrigsten Reizpegels, bei dem eine Reizantwort nachweisbar ist – begründet sich aus der engen Beziehung dieser Größe zur Hörschwelle als der für die Hördiagnose eigentlich relevanten Zielgröße. Hörschwelle und Reizantwortschwelle sind nicht identisch, sie können aber sehr nah beieinander liegen. Grundsätzlich liegt die Hörschwelle immer unter der Reizantwortschwelle, denn wo eine Reizantwort nachgewiesen wurde, da ist das Hörsystem ja schon aktiviert.

Die Distanz zwischen Hör- und Reizantwortschwelle ist variabel und sie hängt von vielen Faktoren ab (Abbildung 17 [Abb. 17]). Ausgangspunkt für die nähere Betrachtung ist die zweifelsfrei richtige Feststellung, dass nicht das Verschwinden der Reizantwort beobachtet wird, sondern nur ihr Versinken im Rauschen. Um mit ausreichender Sicherheit als signifikantes Signal anerkannt zu werden, muss die (effektive) Amplitude der Antwort die (effektive) Amplitude der Reststörung um einen vorgegebenen Mindestbetrag übertreffen. In der Nachrichtentechnik ist es allgemein üblich, einen Abstand von 6 dB zu fordern. Dieser Betrag ist dadurch ausgezeichnet, dass er einem Faktor zwei der Amplituden von Signal und Rauschen entspricht – etwas präziser: Die um die Signalamplitude S vermehrte Effektivamplitude N des Rauschens ist doppelt so groß wie N alleine, oder σ(S+N)>2σ(N).

Reizantworten, deren Amplitude die genannte Grenze unterschreitet, entziehen sich dem Nachweis. Bei Reizpegeln oberhalb der Reizantwortschwelle L1 nimmt die Amplitude des Signals zu, darunter nimmt sie weiter ab, bis sie den Wert Null erreicht. Die Nullstelle L0 kann näherungsweise durch (lineare) Extrapolation der überschwellig gemessenen Amplitudenkennlinie oder Wachstumsfunktion (amplitude growth function AGF) ermittelt werden. Ihr (horizontaler) Abstand ΔL1 zur Reizantwortschwelle hängt von der Stärke des Reststörung, von der absoluten Amplitude der Reizantwort, von der Steigung ihrer Wachstumsfunktion und der Art eines möglicherweise vorliegenden pathologischen Geschehens ab (z.B. bei Recruitment oder Verlust der neuronalen Synchronisation). Auch der zu dieser Nullstelle gehörende Reizpegel liegt im Allgemeinen noch über der (physiologischen) Hörschwelle LHS. Der Abstand zwischen den Schwellen LHS und L0 hängt u.a. von Art und Ursprung des nachzuweisenden Signals ab (z.B. ist er im Falle des Stapediusreflexes sehr groß).

Der Einfluss von Störsignalamplitude, Steigung der Wachstumsfunktion und Zahl der Mittelungen auf die Reizantwortschwelle kann mit Hilfe einfacher Überlegungen und auf der Grundlage realistischer Annahmen in einem übersichtlichen mathematischen Ausdruck wiedergegeben werden:

[Gleichung 8]

Gleichung 8.

Hier bezeichnen

  • L1 die Reizantwortschwelle,
  • L0 die Nullstelle der Amplitudenwachstumsfunktion,
  • AN(m=1) die (effektive) Amplitude des nicht gemittelten Rauschens,
  • g („growth“) die Steigung der (linear approximierten) Amplitudenwachstumsfunktion (für FAEP typisch 10 nV/dB) und
  • m die Zahl der Mittelungen.

Wird in der gegebenen Gleichung nur die Auswirkung der Zahl m der Mittelungen betrachtet, so ist zu erkennen, dass die Reizantwortschwelle L1 sich mit zunehmender Genauigkeit der Nullstelle L0 annähert. Die zwei Größen stimmen aber nur asymptotisch (d.h. für m → ∞) miteinander überein.

Die anderen in der Gleichung auftretenden Parameter wirken sich in der folgenden Weise aus (Abbildung 18 [Abb. 18]):

  • Je stärker die (ungemittelte) Störung AN(m=1), desto größer ist die Diskrepanz zwischen L1 und L0.
  • Je steiler die Amplitudenkennlinie (große Steigung g), desto kleiner ist diese Abweichung.

Unter ungünstigen, aber realistischen Bedingungen kann die vermeintliche Schwelle L1 um bis zu 30 dB von der wirklichen Schwelle L0 abweichen. In der Praxis lässt sich die Zuverlässigkeit der Schwellenschätzung abschätzen, indem nach Abschluss der (aus mehreren bei verschiedenen Reizpegeln durchgeführten Ableitungen bestehenden) Messreihe der erhaltene Datensatz mehrfach graphisch dargestellt wird, beispielsweise für die Mittelungszahlen m, m/2, m/4 und m/8 (dies setzt voraus, dass während der Datenakquisition entweder alle einzelnen Sweeps oder zumindest die Zwischenstände der Mittelwertkurven gespeichert wurde). Sodann bestimmt der Untersucher aus jeder der vier Serien die visuelle Reizantwortschwelle, vergleicht die Werte miteinander und leitet daraus eine Schätzung für die „wahre Schwelle“ ab.

Der Theorie zufolge nimmt die Differenz L1L0 aus vermeintlicher und wirklicher Schwelle bei Verdoppelung der Mittelungszahl um einen Faktor √2 ab:

[Gleichung 9]

Gleichung 9.

Diese Gleichung kann nach L0 aufgelöst werden und ergibt für die „wahre Schwelle“ den Ausdruck

[Gleichung 10]

Gleichung 10.

Wenn beispielsweise bei Verdoppelung der Mittelungszahl die beobachtete Reizantwortschwelle L1 von 40 auf 30 dB absinkt, dann liegt die wahre Reizantwortschwelle L0 bei 6 dB.

Über den praktischen Nutzen des beschriebenen Ansatzes kann keine Aussage gemacht werden, da bisher kein Messgerät mit entsprechender Implementierung existiert. Es darf davon ausgegangen werden, dass die beschriebenen Regeln in der Praxis aus mindestens zwei Gründen nur näherungsweise gültig sind: Erstens beruhen die Betrachtungen auf der Annahme eines stationären EEG-Rauschens, welches zu produzieren nur wenige Patienten bereit und in der Lage sind, und zweitens werden die Reizpegel innerhalb einer Messreihe üblicherweise in einem Raster mit Abständen von 10 dB variiert, wodurch die Genauigkeit der Ergebnisse begrenzt wird. Grundsätzlich nimmt die Relevanz der Schwellenkorrektur mit zunehmender Steigung der Amplitudenwachstumsfunktion ab. Für sehr effiziente Stimuli wie den CE-Chirp ist sie wahrscheinlich entbehrlich.

Die Korrektur der beobachteten Reizantwortschwelle um den Einfluss des Restrauschens enthebt den Untersucher nicht der Notwendigkeit, aus der Reizantwortschwelle die Hörschwelle abzuleiten. Wie in Abbildung 17 [Abb. 17] gezeigt ist, setzt sich der Abstand zwischen diesen zwei Größen aus zwei Beiträgen ΔL1 und ΔL2 zusammen. Da der Beitrag ΔL1 nun unter Kontrolle ist, verbleibt als einzige Unbekannte nur noch die Differenz ΔL2. Dieser Term trägt dem Umstand Rechnung, dass auch unter idealen (störungsfreien) Bedingungen nicht jede Stimulation, die zu einer Wahrnehmung des Reizes führt, mit einer messbaren Antwort der jeweiligen sensorischen, synaptischen oder neuronalen Zielstruktur einhergeht. Beispielsweise ist mit der Elektrocochleographie (ECochG) das Summenaktionspotential (compound action potential CAP) praktisch direkt an der Hörschwelle nachweisbar, die cochleären Mikrophonpotentiale (CM) hingegen sind es erst bei mehr als 50 dB höheren Reizpegeln [22]. Für die Berücksichtigung von Effekten dieser Art besteht das einzige praktikable Vorgehen wie bisher in der Anwendung einer empirisch begründeten methodenspezifischen Korrektur. Infolge der Kompensation der unzureichenden Störsignalbefreiung werden die Korrekturen aber kleiner ausfallen und die Genauigkeit dadurch zunehmen.


Fazit und Ausblick

Die heute für den praktischen Einsatz angebotenen Geräte zur Messung von OAE und AEP weisen zweifellos ein hohes technisches Niveau auf, sie schöpfen jedoch die Möglichkeiten der Signalverarbeitung nicht aus. Aus den technischen Beschränkungen in der etwa ein halbes Jahrhundert zurückliegenden Pionierzeit der Elektrischen Reaktions-Audiometrie haben sich Relikte erhalten, die heute ihre Daseinsberechtigung eingebüßt haben und zum Teil auch für die Messung von OAE übernommen wurden. Ein prominentes Beispiel für nicht genutzte technische Ressourcen ist die Verwerfung von Signalabschnitten mit unerwünscht großer Amplitude („Artefakten“) unmittelbar nach ihrer Registrierung. Die Verfügbarkeit von Speicherplatz und Rechenkapazität lassen es heute zu, alle Signalabschnitte (Sweeps) bis zum Abschluss der Signalmittelung zu speichern, um sie später zu sortieren und solche Sweeps, bei denen der durch das ungünstige Signal/Rausch-Verhältnis bewirkte Schaden den Nutzen einer zusätzlich erfassten physiologischen Antwort übertrifft, aussortieren zu können [28]. Allgemein und schon in frühen Lebensjahren ist bekannt, dass erst am Jahresende, wenn alle Schulnoten vorliegen, eine Grundlage für die Entscheidung besteht, welche der einzelnen Bewertungen bei der Berechnung der Durchschnittsnote ausgeschlossen werden sollten. Die Realisierbarkeit des „sorted averaging“ und der damit erzielbare Gewinn wurden bereits unter Beweis gestellt [29].

Ausgangspunkt für die vorliegende Übersicht war die Überzeugung, dass die Nutzung aller Optionen der Signalverarbeitung zu einer Reduzierung der sicher sehr hohen Zahl negativer AEP- oder OAE-Ergebnisse, die nicht auf eine Pathologie zurückgeführt werden können, führt. Bei vielen der vorgestellten Werkzeuge handelt es sich um bewährte Elemente der handwerklichen Grundausstattung, deren Anwendung beim Nachweis kleiner und verrauschter Signale selbstverständlich sein sollte, es aber nicht ist. Andere Ansätze sind neu und bisher nur vorläufig erprobt, so dass ihr Gewinn oder Nutzen nicht quantitativ angegeben werden kann. Die Bemerkung erscheint angebracht, dass die Algorithmen der leistungsoptimierten Signalverarbeitung maschinell und automatisch im Hintergrund ablaufen und dem Untersucher keine zusätzlichen Kenntnisse oder Interventionen abverlangen.

Lediglich bei der Ableitung der Hörschwelle aus der Reizantwortschwelle ist eine minimale Mitwirkung des Anwenders gefordert. Der mit der Korrektur der Reststörung verbundene Aufwand geht jedoch über den der bisherigen Anwendung von fragwürdigen „Extrapolationsregeln“ nicht wesentlich hinaus. Da der größte Teil der in der Praxis durchgeführten objektiven Hörprüfungen der Bestimmung der Hörschwelle insbesondere bei Kindern dient und weil Fehlbestimmungen der Schwelle gerade hier schwerwiegende Folgen haben können [23], ist dieser Aufwand sicher gerechtfertigt.

Zur Steigerung der Qualität in der objektiven Audiometrie trägt es sicher auch bei, wenn Hersteller und Anwender den einschlägigen Normen [DIN EN 60645-6 und 60645-7] und Empfehlungen [1], [21] erhöhte Aufmerksamkeit zuteil werden lassen. Schließlich sei noch angemerkt, dass das Fehlen einer einheitlichen Nomenklatur für die Verfahren und Parameter ihre Nutzung unnötig erschwert [20]. Hierbei sind, wie auch beim vertieften Studium der Inhalte des nun zu Ende gehenden Artikels, die Hersteller sicher in höherem Maße gefordert als die Anwender ihrer Produkte.


Anmerkungen

Interessenkonflikte

Der Autor erklärt, dass er keine Interessenkonflikte im Zusammenhang mit diesem Artikel hat.


Literatur

1.
ADANO, Hoth S. Empfehlungen der Arbeitsgemeinschaft Deutschsprachiger Audiologen und Neurootologen (ADANO) zur Durchführung der Elektrischen Reaktions-Audiometrie mit transienten Potentialen. 2006. Verfügbar unter: https://adano.hno.org/storage/app/media/PDF/ERA-Empfehlungen2006.pdf External link
2.
Aoyagi M, Suzuki Y, Yokota M, Furuse H, Watanabe T, Ito T. Reliability of 80-Hz amplitude-modulation-following response detected by phase coherence. Audiol Neurootol. 1999 Jan-Feb;4(1):28-37. DOI: 10.1159/000013817 External link
3.
Beagley HA, Sayers BM, Ross AJ. Fully objective ERA by phase spectral analysis. Acta Otolaryngol. 1979 Mar-Apr;87(3-4):270-8. DOI: 10.3109/00016487909126420 External link
4.
Böhnke F, Janssen T, Steinhoff HJ. Zeit-Frequenz-Darstellung evozierter otoakustischer Emissionen zur Diagnose kochleärer Funktionsstörungen. Otorhinolaryngol Nova. 1992;2(2):80-4. DOI: 10.1159/000312825 External link
5.
DKE/GUK 821.6 - Hörgeräte, Audiometer und Kuppler. DIN EN 60645-6:2010-08: Akustik – Audiometer – Teil 6: Geräte zur Messung von otoakustischen Emissionen (IEC 60645-6:2009); Deutsche Fassung EN 60645-6:2010. Berlin: Beuth; 2010.
6.
DKE/GUK 821.6 - Hörgeräte, Audiometer und Kuppler. DIN EN 60645-7:2010-08: Akustik – Audiometer – Teil 7: Geräte zur Messung von akustisch evozierten Hirnstammpotentialen (IEC 60645-7:2009); Deutsche Fassung EN 60645-7:2010. Berlin: Beuth; 2010.
7.
Don M, Elberling C, Waring M. Objective detection of averaged auditory brainstem responses. Scand Audiol. 1984;13(4):219-28. DOI: 10.3109/01050398409042130 External link
8.
Don M, Masuda A, Nelson R, Brackmann D. Successful detection of small acoustic tumors using the stacked derived-band auditory brain stem response amplitude. Am J Otol. 1997 Sep;18(5):608-21.
9.
Elberling C, Don M. Quality estimation of averaged auditory brainstem responses. Scand Audiol. 1984;13(3):187-97. DOI: 10.3109/01050398409043059 External link
10.
Hönerloh HJ, Kletti J. Ein Verfahren zur Objektivierung von ERA-Messungen. Laryngol Rhinol Otol (Stuttg). 1981 Apr;60(4):178-80.
11.
Hönerloh HJ, Kletti J. Filterung und Glättung von ERA-Potentialen. Arch Otorhinolaryngol. 1978 Sep 28;221(2):135-41.
12.
Hoth S. Die Kategorisierung von Hörstörungen anhand der Latenzabweichung in der BERA. Laryngol Rhinol Otol. 1987 Dec;66(12):655-60.
13.
Hoth S. Die Schwelle in der Begriffswelt des Audiologen. Z Audiol. 2009;48(1):46-9.
14.
Hoth S. Ein alternatives Maß für die Amplitude elektrophysiologischer Reizantworten. Z Audiol. 2017;56(4):140-6.
15.
Hoth S. OAE in HD-Qualität. Omnimed Forum HNO. 2020;22(4):196-200.
16.
Hoth S. OAE in Klinik und Praxis – Neue Bewertung etablierter Regeln. Z Audiol. 2019;58(4):148-51.
17.
Hoth S. Reliability of latency and amplitude values of auditory-evoked potentials. Audiology. 1986;25(4-5):248-57. DOI: 10.3109/00206098609078390 External link
18.
Hoth S. Warum sind TEOAE und DPOAE gegenüber cochleären Funktionsdefiziten unterschiedlich empfindlich? Z Audiol. 2003;42(2):48-50.
19.
Hoth S. Zeitlich differentielle Analyse des Korrelationskoeffizienten: Eine Bereicherung bei der Auswertung von akustisch evozierten Potentialen. Audiol Akustik. 1991;30(6):214-20.
20.
Hoth S, Böttcher P. Nomenklatur und Diagramme bei der Beschreibung und Interpretation von OAE-Messungen. Z Audiol. 2008;47(4):140-9.
21.
Hoth S, Janssen T, Mühler R, Walger M, Wiesner T. Empfehlungen der AGERA zum Einsatz objektiver Hörprüfmethoden im Rahmen der pädaudiologischen Konfirmationsdiagnostik (Follow-up) nach nicht bestandenem Neugeborenen-Hörscreening. HNO. 2012;60:1100-2.
22.
Hoth S, Lenarz T. Elektrische Reaktions-Audiometrie. Heidelberg: Springer; 1994.
23.
Hoth S, Mühler R, Neumann K, Walger M. Objektive Audiometrie im Kindesalter – Ein Lehrbuch für die Praxis. Heidelberg: Springer; 2014.
24.
Hoth S, Polzer M. Qualität in Zahlen. Signalnachweis in der objektiven Audiometrie. Z Audiol. 2006;45(3):100-10.
25.
IERASG. A specification for ABR systems used for post newborn hearing screening diagnostic testing. 2021. Verfügbar unter: http://ag-era.bplaced.net/wordpress/wp-content/uploads/2021/05/20210527-IERASG-ABR-Equip-Spec-v1-8.pdf External link
26.
Kemp DT, Bray P, Alexander L, Brown AM. Acoustic emission cochleography – Practical aspects. Scand Audiol Suppl. 1986;25:71-95.
27.
Leitner H. Ein neues Verfahren zur automatischen Auswertung der ERA mit Hilfe der stochastisch-ergodischen Konversion (SEC). Laryng Rhinol. 1975;54:677-81.
28.
Mühler R, von Specht H. Sorted averaging – principle and application to auditory brainstem responses. Scand Audiol. 1999;28:145-9.
29.
Rahne T, von Specht H, Mühler R. Sorted averaging – application to auditory event-related responses. J Neurosc Meth. 2008;172(1):74-8.