gms | German Medical Science

53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

15. bis 18.09.2008, Stuttgart

Modellierung und Validierung logistischer Regressionsmodelle mit einem SAS-Makropaket

Meeting Abstract

Suche in Medline nach

  • Rainer Muche - Universität Ulm, Ulm, Deutschland
  • Christina Ring - Universität Ulm, Ulm, Deutschland
  • Christoph Ziegler - Biostatistics Department, F. Hoffmann-La Roche Ltd, Basel, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds). Stuttgart, 15.-19.09.2008. Düsseldorf: German Medical Science GMS Publishing House; 2008. DocP-17

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2008/08gmds079.shtml

Veröffentlicht: 10. September 2008

© 2008 Muche et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung und Fragestellung

Prognosen bestimmen die medizinischen Therapie- und Diagnostikentscheidungen direkt oder indirekt. Neben der subjektiven Einschätzung des Arztes können mathematische Modelle für Prognosezwecke entwickelt und validiert werden. In der Praxis ist die betrachtete Zielgröße häufig dichotom, so dass multiple logistische Regressionsmodelle zum Einsatz kommen [3]. Im Folgenden werden SAS-Makros angegeben, die für eine Modellierung basierend auf logistischen Regressionsmodellen entwickelt wurden [1], [4]. Die Untersuchung der Prognosemöglichkeiten erfolgt in drei Schritten: Modellentwicklung, Bestimmung der Prognosegüte und Modellvalidierung [2].

Material und Methoden

Verschiedene Schritte sind zur Modellentwicklung notwendig:

Untersuchung / Deskription der Variablen: PM_DESCRIPTIVE.MAC.SAS
Multikollinearitätsanalyse: PM_MULTICOLLIN.MAC.SAS
Missing-Value Ersetzung: PM_MISSING.MAC.SAS
einflussreiche Beobachtungen identifizieren: PM_INFLUENCE.MAC.SAS
univariate logistische Regression / fractional polynomials: PM_UNI_LOGREG.MAC.SAS
multiple logistische Regression: PM_LOGREG.MAC.SAS
Goodness-of-Fit Untersuchung: PM_GOF.MAC.SAS

Die Prognosegüte wird anhand einer ROC-Analyse ausgewertet: PM_ROC.MAC.SAS

Modellvalidierungen sind ebenfalls umgesetzt:

externe Validierung: PM_EXTERNAL_VALIDATION.MAC.SAS
Data-Splitting: PM_DATASPLITTING.MAC.SAS
Crossvalidation: PM_CROSSVALIDATION.MAC.SAS
Bootstrap: PM_BOOTSTRAP_VALIDATION.MAC.SAS
Shrinkage: PM_SHRINKAGE_VALIDATION.MAC.SAS

Inzwischen ist das Makropaket für die SAS Version 9.1 überarbeitet worden und steht als Download unter http://www.uni-ulm.de/biometrie/prognosemakros.html zur Verfügung.

Diskussion

Insgesamt ist somit ein Werkzeug vorhanden, mit dem die Entwicklung und Validierung eines logistischen Prognosemodells ohne größeren Aufwand ermöglicht wird, so dass speziell die Modellvalidierung in Zukunft zu jeder Prognosebetrachtung herangezogen werden kann und sollte.


Literatur

1.
Allison PD. Logistic regression using the SAS system. SAS Institute Books by Users, Cary NC, 1999
2.
Harrell FE. Regression modeling strategies. Springer, New York, 2001
3.
Hosmer DW, Lemeshow S. Applied logistic regression (2nd Ed.). J. Wiley & Sons, New York, 2000
4.
Muche R, Ring C, Ziegler C. Entwicklung und Validierung von Prognosemodellen. Shaker Verlag, Aachen, 2005