gms | German Medical Science

GMDS 2012: 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

16. - 20.09.2012, Braunschweig

Imputation als Umgang mit fehlenden Werten: Ein Beispiel aus der Nephrologie

Meeting Abstract

  • Mathias Schaller - Universität Köln, Deutschland
  • Verena Weiß - Institut für Medizinische Statistik, Informatik und Epidemiologie der Universität zu Köln, Deutschland
  • Gero von Gersdorff - QiN-Gruppe, Köln, Deutschland
  • Martin Hellmich - Universität Köln, Deutschland
  • Claudia Barth - KfH, Neu-Isenburg, Deutschland

GMDS 2012. 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Braunschweig, 16.-20.09.2012. Düsseldorf: German Medical Science GMS Publishing House; 2012. Doc12gmds202

DOI: 10.3205/12gmds202, URN: urn:nbn:de:0183-12gmds2021

Published: September 13, 2012

© 2012 Schaller et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung und Fragestellung: Die elektronischen Patienten- und Gesundheitsakten einiger Krankenhäuser erlauben die sekundäre Datenanalyse interessanter Fragestellungen. Da die Daten nicht primär für diese Fragestellungen erhoben wurden, liegen nicht alle Prädiktoren für alle Patienten vor. Trifft dies für eine große Zahl an Prädiktoren zu, so liegt oft nur für eine Minderheit der Patienten ein vollständiger Datensatz vor. Um auch die Information der unvollständigen Datensätze zu analysieren, kann eine Multiple Imputation (MI) angewendet werden. Die Auswirkungen einer solchen MI werden anhand einer Cox Analyse bei Dialysepatienten untersucht.

Material und Methoden: Die Daten wurden im QiN Programm des KfH gesammelt und für die Analyse aufgearbeitet. Insgesamt werden 30 Prädiktoren von 16.183 Patienten analysiert. Bei 26 dieser Prädiktoren kommt es zu fehlenden Werten. Bei 10428 Patienten fehlen im Mittel drei aber mindestens ein Prädiktor. Für Prädiktoren wird mit Hilfe der sas Prozeduren PROC MI und PROC MIANALYZE eine MI durchgeführt. Dabei wird auf die Imputationsprozedur von Rubin (1987 [1]) zurückgegriffen. Diese weist einem fehlenden Wert einen Satz möglicher Werte zu, um die Unsicherheiten der MI zu reflektieren.

Ergebnisse: Durch die MI war es möglich alle 16.183 Patienten in die Analyse mit einzubeziehen. Dabei wurden für einzelne Prädiktoren nicht mehr als 20% der Werte imputiert. Ein Cox Modell wurde mit imputierten Daten gerechnet und dem Cox Modell basierend auf vollständigen Daten gegenübergestellt. Dabei wurden wenige Veränderungen bei den geschätzten Effektgrößen festgestellt. Die geschätzten Standardfehler der Effekte waren jedoch deutlich geringer. Dabei werden sechs weitere Effektschätzer als signifikant eingestuft.

Diskussion: Die MI ist eine Möglichkeit nicht vollständige Datensätze in die Analyse mit einzubeziehen. Die Ergebnisse der Analyse mit vollständigen Datensätzen werden bestätigt. Durch die höhere Fallzahl ist es jedoch möglich, die Parameterschätzer genauer zu bestimmen.


Literatur

1.
Rubin DB. Multiple Imputation for Nonresponse in Surveys. New York: John Wiley & Sons; 1987.