gms | German Medical Science

GMDS 2013: 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

01. - 05.09.2013, Lübeck

Fehlende Werte: Umgang, Probleme und Interpretation am Beispiel der Bewertung der Biologika zur Behandlung der rheumatoiden Arthritis

Meeting Abstract

  • Julia Schiffner-Rohe - Pfizer Deutschland GmbH, Berlin, DE
  • Sebastian Kloss - Pfizer Deutschland GmbH, Berlin, DE
  • Sonja Eberle - Winicker Norimed GmbH, München, DE
  • Friedhelm Leverkus - Pfizer Deutschland GmbH, Berlin, DE

GMDS 2013. 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Lübeck, 01.-05.09.2013. Düsseldorf: German Medical Science GMS Publishing House; 2013. DocAbstr.37

doi: 10.3205/13gmds159, urn:nbn:de:0183-13gmds1598

Published: August 27, 2013

© 2013 Schiffner-Rohe et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung und Fragestellung: Fehlende Werte sind in klinischen Studien möglichst zu vermeiden. Insbesondere in Langzeitstudien ist dies häufig nicht möglich, was das Ersetzen fehlender Werte erforderlich macht. Die „points to consider“ der EMA fordern bei der Ersetzung fehlender Werte einen konservativen Ansatz. Gerade dieser ist durch das häufig angewandte last observation carried forward (LOCF) in Studien nicht gewährleistet, in denen sich die Abbruchrate in den Therapiearmen aufgrund von Unwirksamkeit deutlich unterscheidet. Im aktuellen Vorbericht des Instituts für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) zur Nutzenbewertung A10-01 wird eine sehr konservative Sensitivitätsanalyse vorgeschlagen. Im Rahmen der vorliegenden Arbeit sollen alternative Methoden vorgestellt und diskutiert werden.

Material und Methoden: In den Studien, die für die Nutzenbewertung untersucht wurden, wurde LOCF angewandt. Das IQWiG hatte in seinem Vorbericht eine Sensitivitätsanalyse vorgeschlagen, in der die Responseraten der Therapieabbrecher imputiert werden mit den Responseraten der beobachteten Patienten aus dem Kontrollarm (single imputation). Das Imputations-Prinzip für stetige Variablen war vergleichbar. Für eine der vom IQWiG bewerteten Studien (TEMPO) wurde nun alternativ ein mixed effect model sowie drei multiple Imputationsverfahren (MI) angewandt:

  • Propensity score MI
  • Multiple regression imputation
  • MCMC multiple imputation,

jeweils mit n=10 Imputationsdatensätzen, die meta-analytisch zusammengefasst wurden. Es werden exemplarisch die Ergebnisse des Zielparameters „schmerzhafte Gelenke“ dargestellt, eine Reduktion gilt dabei als Verbesserung.

Ergebnisse: Zu Studienbeginn lagen Werte von 459 Patienten (231:228) mit durchschnittlich 34 schmerzhaften Gelenken vor. 43% der Patienten unter Verum und 61% unter Placebo brachen die Studie vorzeitig ab. Die Schätzer für die Werte zu Studienende auf Basis der verschiedenen Verfahren der MI unterscheiden sich untereinander kaum (9.9 – 10.8; jeweils Werte für Placebo), das mixed linear model zeigte höhere Schätzwerte (13.4). Unter Verum unterscheiden sich die imputierten Werte nach LOCF kaum, bei Placebo lagen diese allerdings um 2-3 Punkte höher als unter MI. Die Unterschiede der Verfahren zeigen sich eher in der Varianz der Schätzer. MCMC und multiple regression wiesen die kleinsten Varianzen auf (9.5 bzw. 9.9), Propensity Score imputation führte zu deutlich höheren Werten (13.7) vergleichbar zu denjenigen durch LOCF (13.0). Die höchste Varianz zeigte mit 14.0 die Schätzung mittels Mixed linear model. Varianzen für die Sensitivitätsanalyse des IQWiG wurden nicht ausgewiesen. Bei Untersuchung des Gruppenunterschieds (rel. Veränderung im Vergleich zu Baseline) zeigten LOCF, MCMC und multiple Regression sowie das mixed linear model eine signifikante Überlegenheit des aktiven Behandlungsarms. Unter Imputation mittels Propensity Score wurde die Signifikanz hingegen verfehlt. Die Sensitivitätsanalyse des IQWiG kam zu dem Schluss, dass kein signifikanter Gruppenunterschied vorliegt.

Diskussion: Die Wahl der Imputationsmethode für fehlende Werte kann das Studienergebnis entscheidend beeinflussen und sollte daher wohl überlegt sein. Eine Sensitivitätsanalyse mittels mehrerer Verfahren scheint daher angeraten um die Robustheit der Ergebnisse zu prüfen. Ergebnisse weiterer Simulationsstudien zeigten die Unsicherheit der Propensity Score Methode. Der Effekt war dabei stark abhängig von der Wahl der Blöcke. Eine Simulation von 1000 multiplen Imputationen (mit je 10 Imputationsdatensätzen) zeigte zudem eine deutlich größere Streuung des Varianzschätzers als für die anderen untersuchten Methoden.