gms | German Medical Science

HEC 2016: Health — Exploring Complexity
2016 Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

28.08. - 02.09.2016, München

Multiple Imputation bei fehlenden Werten im Cause-specific Hazards-Modell bei konkurrierenden Ereignissen

Meeting Abstract

Search Medline for

  • Michael Lauseker - IBE - Institut für Medizinische Informationsverarbeitung, Biometrie und Epidemiologie, Ludwig-Maximilians-Universität München, München, Deutschland

HEC 2016: Health – Exploring Complexity. Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI. München, 28.08.-02.09.2016. Düsseldorf: German Medical Science GMS Publishing House; 2016. DocAbstr. 515

doi: 10.3205/16gmds008, urn:nbn:de:0183-16gmds0082

Published: August 8, 2016

© 2016 Lauseker.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Hintergrund: Fehlende Werte sind ein häufiges Problem in klinischen Studien. Multiple Imputation stellt derzeit die beste bekannte Methode zur Behandlung dieses Problem dar und gewinnt zunehmend an Popularität. Anhand der Fragestellung, ob Rauchen einen Einfluss auf das Überleben bzw. die Krankheitsprogression bei Patienten mit chronischer myeloischer Leukämie (CML) hat, wird untersucht, wie mit fehlenden Werte in stratifizierten Cause-specific Hazards-Modellen für zwei konkurrierende Ereignisse umgegangen werden kann.

Methoden: Die Analyse erfolgte mittels „substantive model compatible fully conditional specification“ (SMC-FCS), einem neuen Ansatz von Bartlett et al. (Stat Methods Med Res 2015). Dieser hat den Vorteil, dass zwischen dem Imputationsmodell und dem Modell für die eigentliche Analyse Kompatibilität hergestellt werden kann. Um zu untersuchen, wie sich die Stratifizierung auf die Imputation auswirkt, wurden für verschiedene Mechanismen fehlender Daten Simulationen durchgeführt. Die simulierten Daten wurden mittels Complete case analysis (CCA) sowie multipler Imputation analysiert, wobei die Strata im Imputationsmodell als Kovariable berücksichtigt wurden, unberücksichtigt blieben und für jedes Stratum ein eigenes Imputationsmodell geschätzt wurde.

Zur Bewertung wurden Bias, Standardabweichung des Schätzers und Überdeckungswahrscheinlichkeit des Konfidenzintervalls erhoben. Die Daten wurden mit dem R-package smcfcs analysiert.

Ergebnisse: In der Simulation zeigten alle drei Varianten der multiplen Imputation eine geringere Standardabweichung der Regressionskoeffizienten als die CCA. Bei vollständig zufällig fehlenden Werten (missing completely at random) oder zufällig fehlenden Werten in Abhängigkeit von einer Kovariable (missing at random) war weder bei der CCA noch bei den Fällen mit multipler Imputation ein nennenswerter Bias vorhanden. Wenn die Werte in Abhängigkeit vom Outcome fehlten, war der Bias bei den Modellen mit Imputation hingegen deutlich geringer als in der CCA. Wenn andererseits die Daten nicht zufällig fehlten (missing not at random), sondern in Abhängigkeit von der betroffenen Variable, entstand in den Fällen mit multipler Imputation ein größerer Bias als bei der CCA.

Die Überdeckungswahrscheinlichkeit erreichte in den meisten Fällen das nominelle Konfidenzniveau, lediglich bei starkem Bias wurden mit allen Modellen deutlich niedrigere Werte erzielt.

Bei den CML-Daten wurden proportional Cause-specific Hazards -Modelle für den Tod und die Krankheitsprogression stratifiziert nach Therapiearm geschätzt. Die Ergebnisse unterschieden sich nur geringfügig zwischen den drei verschiedenen Imputationsverfahren. Ein Interaktionseffekt zwischen Alter und Rauchverhalten im Hinblick auf die Überlebenswahrscheinlichkeit wurde von allen Modellen gefunden.

Zusammenfassung: Der SMC-FCS-Ansatz bietet eine wirkungsvolle Methode, bei Modellen für Cause-specific Hazards mit fehlenden Werten umzugehen, wenn davon ausgegangen werden kann, dass diese zufällig oder vollständig zufällig fehlten. Verzerrungen bei nicht-zufällig fehlenden Werten traten auf, allerdings unabhängig von einer möglichen Stratifizierung.