gms | German Medical Science

GMDS 2013: 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

01. - 05.09.2013, Lübeck

Analyse geclusterter binärer Daten im Kontext diagnostischer Studien: Schätzung von Sensitivität und Spezifität mit geeigneten Konfidenzintervallen

Meeting Abstract

Search Medline for

  • Verena Hoffmann - Ludwig-Maximilians-Universität, München, DE
  • Yi Hao - Ludwig-Maximilians-Universität, München, DE
  • Fabian Bamberg - Ludwig-Maximilians-Universität, München, DE

GMDS 2013. 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Lübeck, 01.-05.09.2013. Düsseldorf: German Medical Science GMS Publishing House; 2013. DocAbstr.180

doi: 10.3205/13gmds165, urn:nbn:de:0183-13gmds1654

Published: August 27, 2013

© 2013 Hoffmann et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung und Fragestellung: Um die Güte eines diagnostischenTests zu bestimmen werden regelmäßig die Kennzahlen Sensitivität und Spezifität in Verbindung mit einem Konfidenzintervall benutzt. Verschiedene diagnostische Verfahren liefern allerdings nicht nur einen sondern mehrere Werte pro Patient. Zahlreiche Beispiele dafür finden sich im Bereich der Radiologie. Bei der Auffindung von Stenosen in den Herzkranzgefäßen beispielsweise liefert ein CT für jeden Abschnitt der Koronararterien eines Patienten ein einzelnes Ergebnis, das mit dem Ergebnis einer Angiographie verglichen werden kann, um Sensitivität und Spezifität der CT-Untersuchung zu errechnen. Da es sich aber bei den Einzelergebnissen nicht um unabhängige Beobachtungen handelt, sondern um Beobachtungen aus einem Cluster, die hochkorreliert sein können, sollte nicht der einfache binomiale Schätzer verwendet werden, sondern ein Methode, die die besondere Struktur der Daten angemessen berücksichtigt.

Material und Methoden: In einer Simulationsstudie wurden der Ratio Schätzer, der Intracluster Korrelations Schätzer, der Gewichtete Schätzer und der Schätzer aus einer generalisierten Schätzgleichung (Generalized Estimation Equation, GEE) über den mittleren quadratischen Fehler mit dem Binomialen Schätzer verglichen. Zur Schätzung der Varianz und daraus folgend der Konfidenzintervalle für geclusterte Datenwurden für alle Methoden Wilson Konfidenzintervalle angepasst und mit den Ergebnissen des Wald Konfidenzintervalls für den binomialen Schätzer verglichen. Die Überdeckungswahrscheinlichkeiten wurden für alle Methoden in 36 Szenarien mit verschiedenen wahren Sensitivitäten, Spezifitäten, Fallzahlen und Korrelationen innerhalb der Cluster verglichen. Außerdem wurden sowohl Szenarien mit balancierten als auch Szenarien mit nicht balancierten Daten geprüft. Anschließend werden die Methoden, die sich in der Simulationsstudie als geeignet erwiesen haben, auf die Daten aus dem Institut für Radiologie der Ludwig-Maxmimilians-Universität angewandt, um die Güte von CT-Untersuchungen zur Auffindung von Stenosen in den Herzkranzgefäßen zu bewerten. Dabei handelt es sich um Daten von 26 Patienten mit insgesamt 83 Messungen. Als Goldstandard wurden die Ergebnisse der Angiographie genutzt, die ebenfalls bei allen Patienten durchgeführt wurde.

Ergebnisse: Der Binomiale Schätzer liefert gute Ergebnisse für unkorrelierte Daten, der mittlere Quadratische Fehler nimmt bei wachsender Korrelation innerhalb der Daten allerdings schnell zu. Für mittlere und starke Korrelationen innerhalb der Daten kann der gewichtete Schätzer empfohlen werden, bei großen Fallzahlen liefern auch GEEs gute Schätzungen von Sensitivität und Spezifität. Die neu entwickelten Konfidenzintervalle erreichten höhere Überdeckungswahrscheinlichkeiten als Wald Konfidenzintervalle, wenn die Daten korreliert waren. Außerdem bleiben die Wilson Intervalle auch bei sehr großen beziehungsweise kleinen Schätzern im Intervall [0,1]. Zwischen den geeigneten Methoden gab es keine erheblichen Unterschiede in der Güte der Intervallschätzung. Abschließend wurden die Daten zu CT-Untersuchung zur Diagnose von Stenosen der Herzkranzgefäße mit den geeigneten Verfahren ausgewertet. Diese führten zu einer Schätzung der Sensitivität der CT auf 80,43% mit einem 95%-Konfidenzintervall von [ 66,83%; 89,35% ] und der Spezifität auf 69,70% mit einem 95%-Konfidenzintervallvon [52,15%; 87,24%].

Diskussion: Wird die besondere Struktur geclusterter Daten bei der Auswertung nicht berücksichtigt, kommt es mit zunehmender Korrelation zu starken Verzerrungen des Ergebnisses. Die Güte der Schätzung kann aber schon durch die Anwendung einfacher Methoden wie dem Gewichteten Schätzerund dem geeigneten ebenfalls leicht zu berechnenden Konfidenzintervall erheblich verbessert werden.