gms | German Medical Science

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

26. - 29.09.2011 in Mainz

Planung des Stichprobenumfangs bei Genexpressionsstudien zur Vorhersage von Überlebenszeiten

Meeting Abstract

Suche in Medline nach

  • Isabella Zwiener - Universitätsmedizin Mainz, Mainz
  • Heiko Götte - Merck KGaA, Darmstadt

Mainz//2011. 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi). Mainz, 26.-29.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11gmds056

DOI: 10.3205/11gmds056, URN: urn:nbn:de:0183-11gmds0565

Veröffentlicht: 20. September 2011

© 2011 Zwiener et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung: In der medizinischen Forschung werden viele Studien durchgeführt, in denen die Vorhersage der Überlebenszeit von Patienten im Mittelpunkt steht. Ziel ist es, eine möglichst gute Einteilung der Patienten in solche mit guter und schlechter Prognose zu erstellen. Die Vorhersage dient dazu, den Patienten durch eine Therapiestratifikation die optimale Therapie zukommen zu lassen. In den letzten Jahren wird vermehrt versucht, die Prognose der Patienten nicht nur anhand von klinischen Parametern sondern auch anhand von Genexpressionswerten vorherzusagen. Zur Planung dieser Studien ist eine Fallzahlkalkulation notwendig. Es gibt bisher keine Methoden, die die Hochdimensionalität der genetischen Daten bei Überlebenszeiten berücksichtigen können.

Methoden: Wir präsentieren eine Methode zur Fallzahlplanung für Vorhersagemodelle mit hochdimensionalen Einflussgrößen [1]. Bei Vorhersagemodellen können auch bei unendlich großer Fallzahl nicht alle Patienten korrekt klassifiziert werden. Daher ist der bestmögliche Vorhersagefehler häufig größer als 0. Die von uns entwickelte Fallzahlplanung kontrolliert die Differenz zwischen dem bestmöglichem und dem erwartetem Vorhersagefehler. Der Vorhersagefehler kann sowohl als Misklassifikationsrate als auch durch den Brier Score definiert werden. Eine Dimensionsreduktion findet durch univariable Selektion und penalisierte Regressions-Modelle statt, wie z.B. Lasso [2]. Zensierte Patienten werden berücksichtigt.

Ergebnisse: Wir zeigen, dass durch die Variablenselektion die Parameterschätzer in der Cox-Regression verzerrt sind. Daher werden die verzerrten Schätzer für die Fallzahlplanung benutzt. Zur Untersuchung der Performance der Fallzahlplanungsformel werden Ergebnisse einer Simulationsstudie präsentiert. Die Anzahl der Gene mit Einfluss auf das Überleben als auch die Stärke der Effekte haben einen großen Einfluss auf die benötigte Fallzahl. Der Effekt einer Drop-Out-Rate ist im Vergleich eher gering.

Diskussion: Um die Verzerrung der Effektschätzer in der Fallzahlplanung berücksichtigen können, empfehlen wir, eigene Simulationsstudien durchzuführen oder unsere Simulationsergebnisse in ähnlichen Situationen einzusetzen.


Literatur

1.
Götte H, Zwiener I. Sample size planning for survival prediction with focus on high dimensional data [submitted]. 2011.
2.
Tibshirani R. The lasso method for variable selection in the Cox model. Statistics in medicine. 1997;16:385-95.