Artikel
Die Vorhersage funktioneller Unabhängigkeit nach einem Schlaganfall: Logistische Regression versus Zufallswälder
Suche in Medline nach
Autoren
Veröffentlicht: | 8. September 2005 |
---|
Gliederung
Text
Einleitung und Fragestellung
Mortalität und Wiedererlangen funktioneller Unabhängigkeit sind nach einem akuten Schlaganfall klinisch relevante Zielkriterien. Über den Einfluss prognostischer Faktoren auf diese Ereignisse ist aber nur wenig bekannt. Daher war es das Ziel dieses Projekts, prognostische Modelle zur Vorhersage funktioneller Unabhängigkeit und Mortalität nach 100 Tagen zu entwickeln und in einem unabhängigen Datensatz zu validieren. Neben logistischen Regressionsverfahren wurde hierfür eine Methode des maschinellen Lernens, Zufallswälder, eingesetzt.
Material und Methoden
Unter Verwendung von prognostischen Faktoren, die innerhalb der ersten 72 Stunden nach einem Schlaganfall prospektiv erhoben werden, wurden an einem Testdatensatz mit 1869 Schlaganfallpatienten der Deutschen Schlaganfall Datenbank der Stiftung Deutsche Schlaganfall-Hilfe zwei logistische Regressionsmodelle entwickelt. Diese Modelle dienten der Vorhersage 1) vollständiger versus unvollständiger Wiederherstellung funktioneller Unabhängigkeit oder Mortalität und 2) Mortalität versus Überleben [Ref. 1]. Die Modelle enthielten elf bzw. drei Variablen und klassifizierten 81% und 90% der Patienten korrekt. Das Pseudo-R2 nach McKelvey und Zavoina [Ref. 2] betrug 55% und 41%. Beide Modelle wurden zehnfach kreuzvalidiert und kalibriert.
Auf Basis dieser Ergebnisse wurde eine Validierungsstudie geplant und durchgeführt [Ref. 3]. Es wurden 1805 Patienten eingeschlossen und, bei Verwendung der vorher entwickelten Modelle und Schwellenwerte, zu 78% und 76% korrekt vorhergesagt [Ref. 4].
Ein Nachteil dieses klassischen Vorgehens war die aufwändige Entwicklung der logistischen Regressionsmodelle. Daher wurden als alternativer Algorithmus Zufallswälder nach Breiman [Ref. 5] verwendet. Die resultierenden Modelle aus dem Testdatensatz wurden zur Klassifikation im Validierungsdatensatz genutzt. Unterschiede in der Vorhersagegüte der Algorithmen wurden mit McNemar’s Tests und Konfidenzintervallen nach Tango [Ref. 6] verglichen.
Ergebnisse und Diskussion
Unter Verwendung der Zufallswälder konnten ähnlich gute Ergebnisse erzielt werden wie mit dem klassischen Vorgehen der logistischen Regression. Darüber hinaus zeigte sich, dass beide Verfahren für die Klassifikation der Patienten vorrangig ähnliche Variablen benutzen. Allerdings müssen in der Anwendung wichtige Unterschiede zwischen diesen Ansätzen berücksichtigt werden. Im Vordergrund steht hierbei die möglicherweise schlechtere Interpretierbarkeit der resultierenden Zufallswälder. Die Vor- und Nachteile in der Anwendung der verschiedenen Algorithmen werden im Beitrag diskutiert.
Literatur
- 1.
- Weimar C, Ziegler A, König IR, Diener HC. Predicting functional and vital outcome after acute ischemic stroke. J Neurol 2002; 249: 888-95
- 2.
- McKelvey RD, Zavoina W. A statistical model for the analysis of ordinal level dependent variables. J Math Sociol 1975; 4: 103-20
- 3.
- König IR, Weimar C, Diener HC, Ziegler A. Vorhersage des Funktionsstatus 100 Tage nach einem ischämischen Schlaganfall: Design einer prospektiven Studie zur externen Validierung eines prognostischen Modells. Z Arztl Fortbild Qualitatssich 2003; 97: 717-22
- 4.
- The German Stroke Collaboration. Predicting outcome after acute ischemic stroke: An external validation of prognostic models. Neurology 2004; 62: 581-5
- 5.
- Breiman L. Random Forests. Machine Learning 2001; 45: 5-32
- 6.
- Tango T. Re: Improved confidence intervals for the difference between binomial proportions based on paired data by Robert G. Newcombe, Statistics in Medicine, 17, 2635-2650 (1998). Stat Med 1999; 18: 3511-3