gms | German Medical Science

50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie (dae)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Deutsche Arbeitsgemeinschaft für Epidemiologie

12. bis 15.09.2005, Freiburg im Breisgau

Planung einer klinischen Studie zur Evaluierung und zum Vergleich von Alarmsystemen in der Intensivmedizin

Meeting Abstract

Suche in Medline nach

  • Silvia Kuhls - Universität Dortmund, Dortmund
  • Vivian Lanius - Universität Dortmund, Dortmund
  • Ursula Gather - Universität Dortmund, Dortmund
  • Michael Imhoff - Klinikum Dortmund, Dortmund

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Deutsche Arbeitsgemeinschaft für Epidemiologie. 50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie. Freiburg im Breisgau, 12.-15.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05gmds020

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2005/05gmds258.shtml

Veröffentlicht: 8. September 2005

© 2005 Kuhls et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung und Fragestellung

Klinische Informationssysteme ermöglichen eine kontinuierliche und automatische Online-Erfassung von Vitalparametern, Laborwerten, Medikamentengaben und therapeutischen Maßnahmen für jeden einzelnen Patienten in der Intensivmedizin. Ziel ist die bettseitige Überwachung des Patientenzustands basierend auf diesen Daten. Derzeit werden in der Praxis fast ausschließlich univariate Schwellwertalarmsysteme eingesetzt. Die große Mehrzahl aller Alarme der Patientenüberwachungsgeräte sind falsch positive Alarme, die ohne klinische Relevanz für die Behandlung des kritisch Kranken sind. Die Häufigkeit falscher Alarme führt zu einer Desensibilisierung der Mitarbeiter auf Intensivstationen gegenüber wahren Alarmen.

Zur Unterstützung therapeutischer Maßnahmen ist die für jeden Patienten kontinuierlich anfallende Datenflut geeignet zu analysieren [1]. Benötigt werden Verfahren, die eine automatische Extraktion und Abstraktion der in den Daten enthaltenen Informationen in klinisch relevante Muster ermöglichen. Eine Konstruktion intelligenter Alarmsysteme gelingt mittels neuer statistischer Methoden [2], [3], [4], [5].

Neu entwickelte Alarmalgorithmen im Intensivmonitoring sind mittels einer Studie anhand von echten Daten klinisch zu validieren. Die Frage ist, inwieweit neu entwickelte Prozeduren zur Alarmgebung in der Lage sind, die Anzahl der Fehlalarme zu reduzieren und bei der richtigen Erkennung alarmrelevanter Zustände mindestens ebenso gut abzuschneiden wie existierende Alarmsysteme. Gezeigt werden soll höhere Spezifität der neuen Alarmalgorithmen bei mindestens ebenso guter Sensitivität im Vergleich zu bestehenden Verfahren. In dem Vortrag werden Ansätze und Probleme bei der Evaluierung neuer Alarmsysteme in der Intensivmedizin diskutiert und Lösungsstrategien aufgezeigt.

Material und Methoden

Datengrundlage der Studie sind sekündlich aufgezeichnete Messungen von Vitalparametern für eine ausreichend große Anzahl von Patienten im Intensivmonitoring. Zu diesen Variablen zählen z.B. arterielle und pulmonalarterielle Blutdrücke, der zentralvenöse Blutdruck, Herzfrequenz, Puls, die Sauerstoffsättigung des Blutes und die Atemfrequenz. Daneben ist eine sorgfältige Dokumentation der Alarmeinstellungen und -meldungen des während der Datenaufzeichnung im Einsatz befindlichen Alarmsystems mit Zeitpunkten erforderlich. Für jede gemessene Variable, für die die Alarmfunktion eingeschaltet ist, müssen sowohl die oberen und unteren Alarmgrenzen als auch Modifikationen dieser Werte festgehalten werden. Für eine klinische Beurteilung von Alarmsystemen sind außerdem klinische Annotationen, die klinisch wichtige Ereignisse sowie eine Bewertung der Alarme des eingesetzten Alarmsystems umfassen, unverzichtbar.

Da eine Großzahl der Fehlalarme auf Messfehler und Artefakte zurückzuführen ist, besteht ein Ansatz in der Filterung solcher irrelevanter Information aus den Daten. Dies leistet eine robuste Online-Extraktion klinisch relevanter Signale für die aufgezeichneten Vitalparameter [2], [3], [4]. Neue Alarmalgorithmen stellen eine Verbesserung der existierenden Schwellwertalarmsysteme dar, wenn sie in der Lage sind, die Fehlalarmrate zu verringern, ohne dass dies mit einem Sensitivitätsverlust einhergeht. Sensitivität bezieht sich hier auf das richtige Erkennen alarmrelevanter Zustände. Eine Definition des Begriffes „alarmrelevant“, der alle Intensivmediziner zustimmen würden, ist schwer zu finden. Hier wird ein Zustand als alarmrelevant bezeichnet, wenn er eine diagnostische oder therapeutische Entscheidung nach sich zieht oder wenn er die Behebung eines technischen Problems, welches die korrekte Datenerfassung dauerhaft beeinträchtigt, erforderlich macht. Erfolgt als Reaktion auf den Patientenzustand eine Handlung seitens des intensivmedizinischen Personals, gilt der Zustand also als alarmrelevant. In der Literatur zu anderen Studien über Alarmsysteme in der Intensivmedizin werden alarmrelevante Zustände ähnlich definiert [6].

Im Rahmen der klinischen Studie müssen alarmrelevante Zustände mit Hilfe von Annotationen identifiziert werden. Jeder Alarm, der von dem eingesetzten Alarmsystem ausgelöst wird, ist als richtig oder falsch (positiv) zu klassifizieren, abhängig davon, ob ein alarmrelevanter Zustand vorliegt. Zusätzlich sind Alarme, die vom Personal herbeigeführt wurden, abzugrenzen. Zum anderen muss in den Annotationen festgehalten werden, wann ein alarmrelevanter Zustand vorlag, ohne dass vorher ein Alarm ausgelöst wurde (falsch negativer Alarm). Eine ebensolche Beurteilung in richtig und falsch positive und negative Alarme ist für die gleichen Daten unter den neuen Alarmalgorithmen nötig.

Ziel ist es, eine Überlegenheit der neuen Alarmalgorithmen gegenüber den einfachen Schwellwertsystemen in Bezug auf die Spezifität bei gleichzeitiger Nicht-Unterlegenheit bezüglich der Sensitivität zu zeigen. Zum Vergleich der beiden Alarmsysteme anhand derselben Daten können die Anzahlen der klassifizierten Alarmmeldungen mittels Symmetrietafeln dargestellt werden. Diese zeigen zum einen für die alarmrelevanten und zum anderen für die nicht alarmrelevanten Situationen auf, in wie vielen Fällen die Alarmalgorithmen die Situationen übereinstimmend bzw. unterschiedlich bewerten. Außerdem lassen sich Sensitivität und Spezifität der beiden Alarmalgorithmen aus diesen Symmetrietafeln schätzen.

Das Überlegenheits-Testproblem lässt sich mit dem McNemar-Test und das Nicht-Unterlegenheits-Testproblem mit der Score-Teststatistik aus [7] behandeln. Für den Nachweis, dass Überlegenheit in Bezug auf die Spezifität und gleichzeitig Nicht-Unterlegenheit bezüglich der Sensitivität gilt, müssen nach dem Intersection-Union-Testprinzip beide Forderungen einzeln erfüllt sein [8].

Diskussion und Ausblick

Die Datensammlung für eine klinische Studie der oben beschriebenen Art wurde sorgfältig geplant und begonnen, sie ist aber noch nicht abgeschlossen. Zur Auswertung der Daten sollen die im vorherigen Abschnitt genannten Methoden zum Einsatz kommen, die für den Vergleich diagnostischer Tests entwickelt wurden. Bei einem Vergleich verschiedener Alarmsysteme gestaltet sich die Situation als schwierig, da zunächst die Aufgabe der Zählung und Bewertung von richtig und falsch positiven und negativen Alarmen bewältigt werden muss. Der Vortrag spricht verschiedene Lösungsstrategien für dieses Problem an, die sich letztlich bei Vorliegen des vollständigen Datenmaterials bewähren müssen.

Ein Ansatz ist die Einteilung des gesamten Beobachtungszeitraums in kurze Zeitabschnitte. Für jedes Zeitintervall ist festzuhalten, ob ein alarmrelevanter Zustand vorlag und ob von den untersuchten Alarmsystemen ein Alarm ausgelöst wurde. So soll sichergestellt werden, dass auch die richtig negativen Fälle gezählt werden können.

Die gesammelten klinisch annotierten Daten der klinischen Studie können als Referenzdatensatz zur Weiterentwicklung neuer Alarmalgorithmen genutzt werden. Ein weiteres Ziel ist eine Untersuchung der Fragestellung, inwieweit neue statistische Verfahren zur Früherkennung alarmrelevanter Zustände beitragen können.

Danksagung

Wir danken der Deutschen Forschungsgemeinschaft, die diese Arbeit im Rahmen des Sonderforschungsbereichs 475 „Komplexitätsreduktion in multivariaten Datenstrukturen“ fördert, für die Unterstützung.


Literatur

1.
Imhoff M, Bauer M. Time Series Analysis in Critical Care Monitoring. New Horiz 1996; 4: 519-31.
2.
Gather U, Fried R. Methods and Algorithms for Robust Filtering, Invited paper, Proceedings of the COMPSTAT 2004, erscheint
3.
Gather U, Schettlinger K, Fried R. Online Signal Extraction by Robust Linear Regression. Computation Stat 2005, erscheint
4.
Davies PL, Fried R, Gather U. Robust Signal Extraction for On-Line Monitoring Data. J Stat Plan Infer 2004; 122: 65-78
5.
Fried R, Imhoff M. On the Online Detection of Monotonic Trends in Time Series, Biometrical J 2004; 46: 90-102
6.
Chambrin MC, Ravaux P, Calvelo-Aros D, et al. Multicentric Study of Monitoring Alarms in the Adult Intensive Care Unit (ICU): A Descriptive Analysis. Intensive Care Med 1999; 25: 1360-6.
7.
Nam JM. Establishing Equivalence of Two Treatments and Sample Size Requirements in Matched-Pairs Design. Biometrics 1997; 53:1422-30
8.
Lu Y, Jin H, Genant HK. On the Non-Inferiority of a Diagnostic Test Based on Paired Observations. Stat Med 2003; 22: 3029-44