gms | German Medical Science

EbM zwischen Best Practice und inflationärem Gebrauch
16. Jahrestagung des Deutschen Netzwerks Evidenzbasierte Medizin

Deutsches Netzwerk Evidenzbasierte Medizin e. V.

13.03. - 14.03.2015, Berlin

Wie interpretieren Autoren und Nutzer von Systematischen Reviews unterschiedliche Kategorien der Qualität der Evidenz (nach GRADE) in Bezug auf die Zuverlässigkeit von Forschungsergebnissen?

Meeting Abstract

  • corresponding author presenting/speaker Isolde Sommer - Donau-Universität Krems, Krems, Österreich
  • author Gerald Gartlehner - Donau-Universität Krems, Cochrane Austria, Research Triangle Institute International, Krems, Österreich
  • author Tammeka Swinson Evans - Research Triangle Institute International, Research Triangle Park North Carolina, Vereinigte Staaten
  • author Kylie Thaler - Donau-Universität Krems, Cochrane Austria, Krems, Österreich
  • author Andreea Iulia Dobrescu - Victor Babes University of Medicine and Pharmacy, Timisoara, Rumänien
  • author Kathleen Lohr - Research Triangle Institute International, Research Triangle Park North Carolina, Vereinigte Staaten

EbM zwischen Best Practice und inflationärem Gebrauch. 16. Jahrestagung des Deutschen Netzwerks Evidenzbasierte Medizin. Berlin, 13.-14.03.2015. Düsseldorf: German Medical Science GMS Publishing House; 2015. Doc15ebmP10e

doi: 10.3205/15ebm078, urn:nbn:de:0183-15ebm0783

Veröffentlicht: 3. März 2015

© 2015 Sommer et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen. Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden. Lizenz-Angaben siehe http://creativecommons.org/licenses/by-nc-nd/3.0/.


Gliederung

Text

Hintergrund und Fragestellung: GRADE (Grading of Recommendations Assessment, Development and Evaluation) bietet ein System, um die Qualität der Evidenz in systematischen Übersichtsarbeiten und Leitlinien einzuschätzen und Empfehlungen in Leitlinien abzustufen. GRADE beurteilt dabei das Bias Risiko, fehlende Präzision, Inkonsistenz, Indirektheit und Publikationsbias um die Qualität der Evidenz (QE) zu bewerten und das Vertrauen in die Beweislage zu kommunizieren. GRADE verwendet dafür vier Kategorien (hoch-mittel-niedrig-sehr niedrig), die ausdrücken, wie nahe ein Forschungsergebnis der „Wahrheit“ kommt.

Die Definitionen der QE-Kategorien verwenden jedoch Begriffe wie „wahre Effekt“ „mäßig“ oder „begrenzt“, die von unterschiedlichen Personen unterschiedlich interpretiert werden könnten. Das Ziel der Studie war es zu erheben, wie Autoren und Nutzer von systematischen Reviews GRADE Kategorien mit der Zuverlässigkeit von Forschungsergebnissen in Verbindung bringen.

Methoden: Wir führten eine webbasierte Befragung von internationalen Autoren und Nutzern von systematischen Reviews durch. Anhand einer visuellen Analogskala wurde deren Interpretation des Grads an Zuverlässigkeit, dass zukünftige Studien den gegebenen Effektschätzer nicht mehr wesentlich ändern würden, gemäß den QE Bewertungen „hoch“, „moderat“, „niedrig“ und „sehr niedrig“ eingeordnet (0% bis 100%).

Ergebnisse: Insgesamt wurden Daten von 208 Personen erhoben. Davon waren 82 (39%) Autoren, 49 (24%) Nutzer, und 77 (37%) sowohl Autor als Nutzer von Systematischen Reviews. Im Allgemeinen ordneten Autoren und Nutzer einzelnen QE-Kategorien ähnliche Wahrscheinlichkeiten zu, dass Behandlungseffekte langfristig stabil bleiben (p=0,29), auch wenn diese innerhalb der Gruppen stark variierten. Für Effektschätzer, die mit einer hohen QE bewertet wurden, reichten die Wahrscheinlichkeiten über alle Gruppen hinweg von 86% bis 100%, bei Effektschätzern von moderater QE von 61% bis 85%, bei jenen von niedriger QE von 34% bis 60% und bei sehr niedrigen von 0% bis 33%.

Schlussfolgerung: Die Ergebnisse dieser Studie zeigen eine hohe Variabilität in der Interpretation von QE Bewertungen, wobei die Interpretationen zwischen Autoren und Nutzern von Systematischen Reviews ähnlich ist. Die Bandbreite an zugeordneten Wahrscheinlichkeiten streicht die Notwendigkeit einer Diskussion über die Bedeutung der QE Definitionen hervor. Des Weiteren könnten zukünftige Studien die prädiktive Validität des GRADE Ansatzes anhand realer Evidenzkörper testen.