gms | German Medical Science

53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

15. bis 18.09.2008, Stuttgart

Diagnostik bei Reihenuntersuchungen: ist bei gleicher Spezifität der sensitivste Test immer der Beste?

Meeting Abstract

Suche in Medline nach

  • Robert Großelfinger - IQWiG, Köln, Deutschland
  • Stefan Lange - IQWiG, Köln, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds). Stuttgart, 15.-19.09.2008. Düsseldorf: German Medical Science GMS Publishing House; 2008. DocP-27

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2008/08gmds089.shtml

Veröffentlicht: 10. September 2008

© 2008 Großelfinger et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Hintergrund

Für die Bewertung der Nützlichkeit diagnostischer Tests haben verschiedene Autoren ein stufenweises Vorgehen vorgeschlagen [1], [2]. Hierbei sind nicht nur die Testgüte, sowohl bemessen an den so genannten prävalenzunabhängigen (Sensitivität, Spezifität) als auch den prävalenzabhängigen Testeigenschaften (prädiktive Werte) von Bedeutung. Eine große Rolle spielt die durch den Test (z. B. durch eine Behandlung) bewirkte Änderung des weiteren Krankheitsverlaufs mit Hinblick auf patientenrelevante Zielgrößen (Phase 4 nach Köbberling et al, Level 5 nach Fryback et al. [1], [2]).

Hierbei kann der Vergleich der Strategien als Ganzes (Kombination von Test und Intervention), basierend auf der Wahl des diagnostischen Tests, nicht unterscheiden, ob beispielsweise bei Fehlen eines Effekts bezüglich eines patientenrelevanten Endpunktes dies auf eine unwirksame Behandlung zurückzuführen ist oder auf das Unvermögen des Tests, von der Behandlung profitierende Patienten zu erkennen. Eine Konsequenz dieses Mangels üblicher Testvalidierungen findet seinen Niederschlag im Phänomen der so genannten Übertherapien.

Allgemein formuliert können solche irrelevanten Krankheitsverläufe entstehen, wenn beispielsweise Frühstadien der Erkrankung einer spontanen Rückbildung unterliegen. Das gleiche gilt für (kausale) Risikofaktoren der Erkrankung. Sie können aber auch entstehen, wenn vorhandene Erkrankungen klinisch nicht wahrnehmbar verlaufen (so genannte stumme Verläufe) und somit auch zu keiner Beeinträchtigung des Betroffenen führen, oder aber die vom Test erkannten Patienten bezüglich der Behandlung refraktär sind. Dies führt zu der (paradoxen) Möglichkeit, dass bei gleicher Sensitivität und gleicher Spezifität zweier Tests, der letztendliche Nutzen der Tests unterschiedlich ausfällt. Dies ist beispielsweise dann der Fall, wenn der betreffende Test im Falle einer spontanen Regression der Erkrankung „behandlungsbedürftige“ bzw. im Falle einer Responder-Verteilung „behandlungswürdige“ Patienten besser unterscheiden kann).

Zielsetzung

Beschreibung der Relevanz/Irrelevanz positiver Testergebnisse als ein zusätzliches (Güte)Merkmal diagnostischer Tests, das für deren Einsatz in Reihenuntersuchungen von Bedeutung ist.

Methodik

Aus den Erfahrungen bei der Bewertung diagnostischer Test für den Einsatz bei einer Reihenuntersuchung von Kindern im Vorschulalter zur Erkennung von amblyogenen Sehstörungen [3] soll ein Vorschlag abgeleitet werden, die Validierung diagnostischer Tests hinsichtlich deren Eignung für ein Screening um den Aspekt der „Relevanz positiver Diagnosen“ zu ergänzen.

Ergebnisse

Unter Einbeziehung des Anteils irrelevant positiver Diagnosen sind Konstellationen möglich, in denen ein Screeningtest dem anderen vorzuziehen wäre, obwohl der Test eine gleiche oder sogar unterlegene Testgüte i. S. einer gleichen/geringeren Sensitivität bei gleicher Spezifität aufweist. Als Konsequenz sollte die (zusätzliche) Information zu irrelevanten positiven Diagnosen zu einem besseren Nutzen-Schaden-Verhältnis des Einsatzes von diagnostischen Tests im Rahmen von Screeningmaßnahmen bezüglich patientenrelevanter Endpunkte führen. Zeigen beispielsweise beide diagnostischen Strategien (siehe Abbildung 1 [Abb. 1]) einen gleichen (äquivalenten) Interventionseffekt würde in Kenntnis des Anteils der irrelevanten positiven Testergebnisse im Falle eines Screenings die Wahl auf die Strategie mit dem geringeren Anteil fallen. Dies ermöglichte eine Reduzierung ggf. vorhandener schädlicher Effekte der Intervention insbesondere dann, wenn die Intervention ein hohes Schadenspotenzial aufweist. Die herausgehobene Bedeutung irrelevanter positiver Diagnosen liegt im Falle eines Screenings in der besonderen Verantwortung für den (definitionsgemäß) größten Teil des adressierten Zielpublikums – den Gesunden, welche in großer Zahl diesem Risiko ausgesetzt sind.

Schlussfolgerung

Für den Einsatz eines diagnostischen Tests bei Reihenuntersuchungen ist es wichtig den Anteil irrelevanter positiver Testergebnisse zu kennen.


Literatur

1.
Köbberling J, Trampisch HJ, Windeler J. Memorandum zur Evaluierung diagnostischer Maßnahmen. Nucl Med 1989; 28: 255-60.
2.
Fryback, DG, Thornbury JR. The efficacy of diagnostic imaging. Med Decis Making 1991; 11(2): 88-94.
3.
Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen. Früherkennungsuntersuchung von Sehstörungen bei Kindern bis zur Vollendung des 6. Lebensjahres. Abschlussbericht S05-02. Köln: IQWiG; 2008.