gms | German Medical Science

50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie (dae)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Deutsche Arbeitsgemeinschaft für Epidemiologie

12. bis 15.09.2005, Freiburg im Breisgau

Die Vorhersage funktioneller Unabhängigkeit nach einem Schlaganfall: Logistische Regression versus Zufallswälder

Meeting Abstract

  • Inke R. König - Institut für Medizinische Biometrie und Statistik, Universtitätsklinikum Schleswig-Holstein, Campus Lübeck, Lübeck
  • James D. Malley - Center for Information Technology, National Institutes of Health, Bethesda, USA
  • Christian Weimar - Klinik für Neurologie, Universitätsklinikum Essen, Universität Duisberg-Essen, Essen
  • Hans-Christoph Diener - Klinik für Neurologie, Universitätsklinikum Essen, Universität Duisberg-Essen, Essen
  • Andreas Ziegler - Institut für Medizinische Biometrie und Statistik, Universtitätsklinikum Schleswig-Holstein, Campus Lübeck, Lübeck

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Deutsche Arbeitsgemeinschaft für Epidemiologie. 50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie. Freiburg im Breisgau, 12.-15.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05gmds163

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2005/05gmds290.shtml

Veröffentlicht: 8. September 2005

© 2005 König et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung und Fragestellung

Mortalität und Wiedererlangen funktioneller Unabhängigkeit sind nach einem akuten Schlaganfall klinisch relevante Zielkriterien. Über den Einfluss prognostischer Faktoren auf diese Ereignisse ist aber nur wenig bekannt. Daher war es das Ziel dieses Projekts, prognostische Modelle zur Vorhersage funktioneller Unabhängigkeit und Mortalität nach 100 Tagen zu entwickeln und in einem unabhängigen Datensatz zu validieren. Neben logistischen Regressionsverfahren wurde hierfür eine Methode des maschinellen Lernens, Zufallswälder, eingesetzt.

Material und Methoden

Unter Verwendung von prognostischen Faktoren, die innerhalb der ersten 72 Stunden nach einem Schlaganfall prospektiv erhoben werden, wurden an einem Testdatensatz mit 1869 Schlaganfallpatienten der Deutschen Schlaganfall Datenbank der Stiftung Deutsche Schlaganfall-Hilfe zwei logistische Regressionsmodelle entwickelt. Diese Modelle dienten der Vorhersage 1) vollständiger versus unvollständiger Wiederherstellung funktioneller Unabhängigkeit oder Mortalität und 2) Mortalität versus Überleben [1]. Die Modelle enthielten elf bzw. drei Variablen und klassifizierten 81% und 90% der Patienten korrekt. Das Pseudo-R2 nach McKelvey und Zavoina [2] betrug 55% und 41%. Beide Modelle wurden zehnfach kreuzvalidiert und kalibriert.

Auf Basis dieser Ergebnisse wurde eine Validierungsstudie geplant und durchgeführt [3]. Es wurden 1805 Patienten eingeschlossen und, bei Verwendung der vorher entwickelten Modelle und Schwellenwerte, zu 78% und 76% korrekt vorhergesagt [4].

Ein Nachteil dieses klassischen Vorgehens war die aufwändige Entwicklung der logistischen Regressionsmodelle. Daher wurden als alternativer Algorithmus Zufallswälder nach Breiman [5] verwendet. Die resultierenden Modelle aus dem Testdatensatz wurden zur Klassifikation im Validierungsdatensatz genutzt. Unterschiede in der Vorhersagegüte der Algorithmen wurden mit McNemar’s Tests und Konfidenzintervallen nach Tango [6] verglichen.

Ergebnisse und Diskussion

Unter Verwendung der Zufallswälder konnten ähnlich gute Ergebnisse erzielt werden wie mit dem klassischen Vorgehen der logistischen Regression. Darüber hinaus zeigte sich, dass beide Verfahren für die Klassifikation der Patienten vorrangig ähnliche Variablen benutzen. Allerdings müssen in der Anwendung wichtige Unterschiede zwischen diesen Ansätzen berücksichtigt werden. Im Vordergrund steht hierbei die möglicherweise schlechtere Interpretierbarkeit der resultierenden Zufallswälder. Die Vor- und Nachteile in der Anwendung der verschiedenen Algorithmen werden im Beitrag diskutiert.


Literatur

1.
Weimar C, Ziegler A, König IR, Diener HC. Predicting functional and vital outcome after acute ischemic stroke. J Neurol 2002; 249: 888-95
2.
McKelvey RD, Zavoina W. A statistical model for the analysis of ordinal level dependent variables. J Math Sociol 1975; 4: 103-20
3.
König IR, Weimar C, Diener HC, Ziegler A. Vorhersage des Funktionsstatus 100 Tage nach einem ischämischen Schlaganfall: Design einer prospektiven Studie zur externen Validierung eines prognostischen Modells. Z Arztl Fortbild Qualitatssich 2003; 97: 717-22
4.
The German Stroke Collaboration. Predicting outcome after acute ischemic stroke: An external validation of prognostic models. Neurology 2004; 62: 581-5
5.
Breiman L. Random Forests. Machine Learning 2001; 45: 5-32
6.
Tango T. Re: Improved confidence intervals for the difference between binomial proportions based on paired data by Robert G. Newcombe, Statistics in Medicine, 17, 2635-2650 (1998). Stat Med 1999; 18: 3511-3