Artikel
Wie interpretieren Autoren und Nutzer von Systematischen Reviews unterschiedliche Kategorien der Qualität der Evidenz (nach GRADE) in Bezug auf die Zuverlässigkeit von Forschungsergebnissen?
Suche in Medline nach
Autoren
Veröffentlicht: | 3. März 2015 |
---|
Gliederung
Text
Hintergrund und Fragestellung: GRADE (Grading of Recommendations Assessment, Development and Evaluation) bietet ein System, um die Qualität der Evidenz in systematischen Übersichtsarbeiten und Leitlinien einzuschätzen und Empfehlungen in Leitlinien abzustufen. GRADE beurteilt dabei das Bias Risiko, fehlende Präzision, Inkonsistenz, Indirektheit und Publikationsbias um die Qualität der Evidenz (QE) zu bewerten und das Vertrauen in die Beweislage zu kommunizieren. GRADE verwendet dafür vier Kategorien (hoch-mittel-niedrig-sehr niedrig), die ausdrücken, wie nahe ein Forschungsergebnis der „Wahrheit“ kommt.
Die Definitionen der QE-Kategorien verwenden jedoch Begriffe wie „wahre Effekt“ „mäßig“ oder „begrenzt“, die von unterschiedlichen Personen unterschiedlich interpretiert werden könnten. Das Ziel der Studie war es zu erheben, wie Autoren und Nutzer von systematischen Reviews GRADE Kategorien mit der Zuverlässigkeit von Forschungsergebnissen in Verbindung bringen.
Methoden: Wir führten eine webbasierte Befragung von internationalen Autoren und Nutzern von systematischen Reviews durch. Anhand einer visuellen Analogskala wurde deren Interpretation des Grads an Zuverlässigkeit, dass zukünftige Studien den gegebenen Effektschätzer nicht mehr wesentlich ändern würden, gemäß den QE Bewertungen „hoch“, „moderat“, „niedrig“ und „sehr niedrig“ eingeordnet (0% bis 100%).
Ergebnisse: Insgesamt wurden Daten von 208 Personen erhoben. Davon waren 82 (39%) Autoren, 49 (24%) Nutzer, und 77 (37%) sowohl Autor als Nutzer von Systematischen Reviews. Im Allgemeinen ordneten Autoren und Nutzer einzelnen QE-Kategorien ähnliche Wahrscheinlichkeiten zu, dass Behandlungseffekte langfristig stabil bleiben (p=0,29), auch wenn diese innerhalb der Gruppen stark variierten. Für Effektschätzer, die mit einer hohen QE bewertet wurden, reichten die Wahrscheinlichkeiten über alle Gruppen hinweg von 86% bis 100%, bei Effektschätzern von moderater QE von 61% bis 85%, bei jenen von niedriger QE von 34% bis 60% und bei sehr niedrigen von 0% bis 33%.
Schlussfolgerung: Die Ergebnisse dieser Studie zeigen eine hohe Variabilität in der Interpretation von QE Bewertungen, wobei die Interpretationen zwischen Autoren und Nutzern von Systematischen Reviews ähnlich ist. Die Bandbreite an zugeordneten Wahrscheinlichkeiten streicht die Notwendigkeit einer Diskussion über die Bedeutung der QE Definitionen hervor. Des Weiteren könnten zukünftige Studien die prädiktive Validität des GRADE Ansatzes anhand realer Evidenzkörper testen.