gms | German Medical Science

50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie (dae)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Deutsche Arbeitsgemeinschaft für Epidemiologie

12. bis 15.09.2005, Freiburg im Breisgau

Zum Vergleich von Überlebenszeiten bei zeitabhängiger Gruppenzugehörigkeit

Meeting Abstract

Suche in Medline nach

  • Tania Schink - Charité, Universitätsmedizin Berlin, Berlin
  • Klaus Wernecke - Charité, Universitätsmedizin Berlin, Berlin

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Deutsche Arbeitsgemeinschaft für Epidemiologie. 50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie. Freiburg im Breisgau, 12.-15.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05gmds461

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2005/05gmds301.shtml

Veröffentlicht: 8. September 2005

© 2005 Schink et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung und Fragestellung

Bei Überlebenszeitanalysen kann es vorkommen, dass die Gruppierungsvariable zum Beobachtungsbeginns noch nicht feststeht, sondern erst im Verlauf gemessen oder festgelegt wird. So steht z.B. bei der Behandlung chronischer Leukämien zum Zeitpunkt der Diagnose noch nicht fest, ob und wann sich für den Patienten ein Knochenmarkspender finden lässt. Bestimmte Interventionen wie die prophylaktische Spenderlymphozyteninfusion setzen erst nach Beginn der Beobachtungszeit ein und einige Komplikationen wie die chronische Graf-versus-Host-Disease treten erst im Laufe der Beobachtung auf. Oft interessiert man sich auch für den Vergleich von Respondern, d.h. von Patienten die auf die Therapie angesprochen haben, im Vergleich zu den Nonrespondern, bei denen die Therapie keine messbare Wirkung erzielt hat.

Allen diesen Fällen ist gemeinsam, dass ein Patient lange genug überleben muss, um überhaupt in die Interventionsgruppe gelangen zu können. Patienten, die vorher sterben oder einen Rückfall erleiden, bleiben automatisch in der Kontrollgruppe. Die für diese Fragestellung häufig verwendete klassische Kaplan-Meier-Schätzung [1] für die Überlebensraten in beiden Gruppen und der oft verwendete Log-Rang-Test [2], weisen dadurch einen Bias zu Gunsten der Interventionsgruppe auf und führen zu falschen Ergebnissen.

Material und Methoden

In der Literatur werden zwei valide Methoden für die Auswertung mit zeitabhängigen Kovariablen vorgeschlagen die sogenannte Landmarkmethode und der Mantel-Byar-Test.

Bei der Landmarkmethode [3] wird ein Zeitpunkt als sogenannter Landmark festgelegt. Patienten, die zu dieser Landmarkzeit noch unter Beobachtung stehen, werden gemäß ihrem Status zu diesem Zeitpunkt in Kontroll- und Vergleichsgruppe eingeteilt und die Überlebenszeiten nach der Landmarkzeit mittels Log-Rank-Test verglichen bzw. Kaplan-Meier-Kurven dargestellt.

Der Mantel-Byar-Test [4] ist eine Erweiterung des Log-Rank-Testes. Der Hauptunterschied besteht darin, dass die Patienten zum Zeitpunkt der Intervention von der Kontroll- in die Interventionsgruppe wechseln und dort dann weitergeführt werden.

Die Unterschiede, Vor- und Nachteile der verschiedenen Methoden werden am Beispiel einer Studie mit 105 Patienten mit akuter lymphatischer Leukämie (ALL), in der die Wirksamkeit von prophylaktischen Spenderlymphozyteninfusion (donor lymphocyte infusion, DLI) nach allogenen Stammzellentransplantation untersucht werden sollte, dargestellt.

Ergebnisse

Bei der klassischen Herangehensweise unterscheiden sich die mittels Kaplan-Meier-Methode geschätzten Kurven deutlich und der Log-Rank Test ergibt sowohl für das krankheitsfreie Überleben (p=0.0017) als auch das Gesamtüberleben (p=0.0003) signifikante Unterschiede zwischen den beiden Gruppen.

Wenn man die Berechnungen so modifiziert, dass die Patienten, die Prophylaxe erhalten, bis zum Zeitpunkt der Infusion in der Ausgangsgruppe mitgeführt werden, sind die Unterschiede zwischen den beiden Gruppen kleiner, die Kaplan-meier-Kurven liegen näher beisammen. Dies spiegelt sich auch in den p-Werten des Log-Rank-Tests wider: p=0.0274 für das krankheitsfreie Überleben und p=0.0040 für das Gesamtüberleben.

Bei der Landmark-Methode ist die Größe der Unterschiede von der Wahl der Landmark-Zeit abhängig. Je nachdem wie früh oder spät man sie ansetzt unterscheiden sich die Überlebenskurven mehr oder weniger stark bzw. sind die Unterschiede zwischen den beiden Gruppen für krankheitsfreie Überleben der Patienten signifikant oder nicht signifikant.

Der Mantel-Byar-Test kommt zu keinem signifikanten Unterschied für das krankheitsfreies Überleben (p=0.40564): Die DLI-Prophylaxe hat aber weiterhin einen signifikanten Einfluss auf das Gesamtüberleben (p=0.02614).

Diskussion

Die unkritische Anwendung der Kaplan-Meier-Kurven bzw. des Log-Rank-Tests kann bei zeitabhängiger Gruppenzugehörigkeit zu einem erhebliche Bias zu Gunsten der Interventionsgruppe führen. Dies ist besonders deutlich, wenn die Hazardfunktion, wie es in der Praxis oft der Fall ist, zu Beginn steiler verläuft als am Ende.

Die Ergebnisse der Landmarkmethode hängen stark von der Wahl der Landmarkzeit ab. Wenn die Interventionszeitpunkte eng beieinander liegen ist, es einfacher die Landmarkzeit festlegen und zu validen und stabilen Ergebnissen zu kommen.

Diese Voraussetzung muss beim Mantel-Byar-Test nicht erfüllt werden. Auch wenn die Interventionszeitpunkte, wie in unserem Beispiel sich über einen langen Zeitraum erstrecken, kommt dieses Verfahren zu unverfälschten Ergebnissen. Deswegen empfehlen wir im allgemeinen den Einsatz des Mantel-Byar-Tests.


Literatur

1.
Kaplan EL, Meier P. Nonparametric estimation from incomplete obeservations. JASA 1958, 53:457-481
2.
Mantel N, Haenszel. Statistical aspects of the analysis of data from retrospectivestuides of diesease. J Natl Cancer Inst 1959, 22:719-748
3.
Simon R, Makuch RW. A Non-parametric graphical representation of the releationship between survival and the occurrence of an event: application to responders versus nonresponders bias. Stat Med 1984, 3:35-44.
4.
Mantel N, Byar DP. Evaluation of Response-Time Involving Transient States: An Illustration Using Heart-Transplant Data. JASA 1974; 69: 81-86.