gms | German Medical Science

EbM – ein Gewinn für die Arzt-Patient-Beziehung?
Forum Medizin 21
11. EbM-Jahrestagung

Paracelsus Medizinische Privatuniversität, Deutsches Netzwerk Evidenzbasierte Medizin e. V.

25.02. - 27.02.2010, Salzburg, Österreich

Methodische Evaluation von diagnostischen Studien: Erfahrungen und Verbesserungsbedarf für das QUADAS-Instrument

Meeting Abstract

EbM – ein Gewinn für die Arzt-Patient-Beziehung?. Forum Medizin 21 der Paracelsus Medizinischen Privatuniversität & 11. EbM-Jahrestagung des Deutschen Netzwerks Evidenzbasierte Medizin. Salzburg, 25.-27.02.2010. Düsseldorf: German Medical Science GMS Publishing House; 2010. Doc10ebm121

DOI: 10.3205/10ebm121, URN: urn:nbn:de:0183-10ebm1211

Published: February 22, 2010

© 2010 Raatz et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Hintergrund: Kommt ein neuer Test auf den Markt, lautet die entscheidende Frage des Klinikers: Wie genau diagnostiziert der neue Test die Krankheit verglichen mit dem Routinetest? Wie genau sind beide verglichen mit dem Referenzstandard?

Mit dem QUADAS-Instrument [1], [2] lässt sich die Qualität von Studien zur diagnostischen Güte (Sensitivität und Spezifität) bewerten und das Risiko für Bias systematisch abschätzen. Dabei evaluiert QUADAS das Biasrisiko 1) bei der Patientenselektion, 2) des neuen Tests (=Indextest=IT), aber nicht des aktuellen Routinetests (=Vergleichstest) 3) und eines zeitgleichen Referenzstandards [1], [2].

In einem systematischen Review zur Bewertung von PET bei Lymphomen vgl. mit der Routine-Diagnostik wurde erfasst, ob QUADAS das Biasrisiko umfassend abbildet.

Material/Methoden: 2 Reviewer bewerteten 7 Diagnostikstudien zu PET mit und ohne Routinetest bei Lymphomen und verglichen die Testergebnisse mit dem Referenzstandard „Nachbeobachtung für definierten Zeitraum“. Sie untersuchten, wie sich die fehlende Bewertung des Routinetest und der ausschließlich zeitgleiche Referenzstandard in QUADAS auf die Einschätzung des Biasrisikos auswirkt.

Ergebnisse: Folgende Defizite zeigten sich:

1.
Verzerrungen im Routinetest sind auch für den IT relevant: Verzerrungen in Sensitivität und Spezifität des CTs führen zu verzerrten Vergleichen mit PET, auch wenn die PET-Studien Bias frei sind. Trotzdem kennt QUADAS keine Qualitätskriterien für den Vergleichstest.
2.
QUADAS fordert eine kurze Zeitspanne zwischen IT und Referenzstandard. Häufig ist die „Nachbeobachtung“ der einzige mögliche Referenzstandard und das Kriterium müsste „ausreichender Follow-up“ lauten, um Heilung oder Rezidiv sicherzustellen.
3.
Ist die Nachbeobachtung der Referenzstandard, wird die prognostische Güte evaluiert. Mögliche Confounder müssten in der Analyse ggf. berücksichtigt werden.
4.
Bei 2 Tests mit subjektiver Beurteilung (z. B. PET und CT) müsste jeder Beurteiler gegenüber den anderen Testresultaten verblindet sein. QUADAS fragt nicht nach dieser Verblindung.
5.
QUADAS evaluiert nicht, ob der statistische Test in den Studien berücksichtigt, dass zwischen IT und Routinetest in der gleichen Population keine Unabhängigkeit besteht [3].

Schlussfolgerung/Implikation: QUADAS erwies sich in der Biasbewertung als hilfreich, aber nicht umfassend. Bei der nächsten Überarbeitung sollte QUADAS um einige wichtige Bias-Aspekte bei vergleichenden Genauigkeitsstudien erweitert werden .


Literatur

1.
Whiting P, Rutjes AW, Reitsma JB, et al. The development of QUADAS: a tool for the quality assessment of diagnostic accuracy included in systematic reviews. BMC Medical Research Methodology. 2003;3:25.
2.
Whiting PF, Weswood ME, Rutjes AW, et al. Evaluation of QUADAS, a tool for the quality assessment of diagnostic accuracy studies. BMC Medical Research Methodology. 2006;6:9.
3.
Suzuki S. Young investigator award winner's special article. Conditional relative odds ratio and comparison of accuracy of diagnostic tests based on 2x2 tables. J Epidemiol. 2006;16:145-53.