gms | German Medical Science

53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

15. bis 18.09.2008, Stuttgart

Modellierung und Validierung logistischer Regressionsmodelle mit einem SAS-Makropaket

Meeting Abstract

Search Medline for

  • Rainer Muche - Universität Ulm, Ulm, Deutschland
  • Christina Ring - Universität Ulm, Ulm, Deutschland
  • Christoph Ziegler - Biostatistics Department, F. Hoffmann-La Roche Ltd, Basel, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds). Stuttgart, 15.-19.09.2008. Düsseldorf: German Medical Science GMS Publishing House; 2008. DocP-17

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/meetings/gmds2008/08gmds079.shtml

Published: September 10, 2008

© 2008 Muche et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung und Fragestellung

Prognosen bestimmen die medizinischen Therapie- und Diagnostikentscheidungen direkt oder indirekt. Neben der subjektiven Einschätzung des Arztes können mathematische Modelle für Prognosezwecke entwickelt und validiert werden. In der Praxis ist die betrachtete Zielgröße häufig dichotom, so dass multiple logistische Regressionsmodelle zum Einsatz kommen [3]. Im Folgenden werden SAS-Makros angegeben, die für eine Modellierung basierend auf logistischen Regressionsmodellen entwickelt wurden [1], [4]. Die Untersuchung der Prognosemöglichkeiten erfolgt in drei Schritten: Modellentwicklung, Bestimmung der Prognosegüte und Modellvalidierung [2].

Material und Methoden

Verschiedene Schritte sind zur Modellentwicklung notwendig:

Untersuchung / Deskription der Variablen: PM_DESCRIPTIVE.MAC.SAS
Multikollinearitätsanalyse: PM_MULTICOLLIN.MAC.SAS
Missing-Value Ersetzung: PM_MISSING.MAC.SAS
einflussreiche Beobachtungen identifizieren: PM_INFLUENCE.MAC.SAS
univariate logistische Regression / fractional polynomials: PM_UNI_LOGREG.MAC.SAS
multiple logistische Regression: PM_LOGREG.MAC.SAS
Goodness-of-Fit Untersuchung: PM_GOF.MAC.SAS

Die Prognosegüte wird anhand einer ROC-Analyse ausgewertet: PM_ROC.MAC.SAS

Modellvalidierungen sind ebenfalls umgesetzt:

externe Validierung: PM_EXTERNAL_VALIDATION.MAC.SAS
Data-Splitting: PM_DATASPLITTING.MAC.SAS
Crossvalidation: PM_CROSSVALIDATION.MAC.SAS
Bootstrap: PM_BOOTSTRAP_VALIDATION.MAC.SAS
Shrinkage: PM_SHRINKAGE_VALIDATION.MAC.SAS

Inzwischen ist das Makropaket für die SAS Version 9.1 überarbeitet worden und steht als Download unter http://www.uni-ulm.de/biometrie/prognosemakros.html zur Verfügung.

Diskussion

Insgesamt ist somit ein Werkzeug vorhanden, mit dem die Entwicklung und Validierung eines logistischen Prognosemodells ohne größeren Aufwand ermöglicht wird, so dass speziell die Modellvalidierung in Zukunft zu jeder Prognosebetrachtung herangezogen werden kann und sollte.


Literatur

1.
Allison PD. Logistic regression using the SAS system. SAS Institute Books by Users, Cary NC, 1999
2.
Harrell FE. Regression modeling strategies. Springer, New York, 2001
3.
Hosmer DW, Lemeshow S. Applied logistic regression (2nd Ed.). J. Wiley & Sons, New York, 2000
4.
Muche R, Ring C, Ziegler C. Entwicklung und Validierung von Prognosemodellen. Shaker Verlag, Aachen, 2005