gms | German Medical Science

GMDS 2013: 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

01. - 05.09.2013, Lübeck

CARESS als integrierte Auswertungssoftware zur Berechnung von Überlebenszeitanalysen

Meeting Abstract

Suche in Medline nach

  • David Korfkamp - OFFIS e.V., Oldenburg, DE
  • H.-Jürgen Appelrath - Universität Oldenburg, Oldenburg, DE
  • Eunice Sirri - Epidemiologisches Krebregister Niedersachsen, Oldenburg, DE

GMDS 2013. 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Lübeck, 01.-05.09.2013. Düsseldorf: German Medical Science GMS Publishing House; 2013. DocAbstr.259

doi: 10.3205/13gmds084, urn:nbn:de:0183-13gmds0849

Veröffentlicht: 27. August 2013

© 2013 Korfkamp et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

In diesem Abstract stellen wir die Softwareanwendung CARESS vor, die verschiedene Methoden zur Durchführung von Überlebenszeitanalysen unterstützt, die hierfür notwendigen Daten integriert und Ad-hoc-Analysen ermöglicht.

Einleitung: Bisherige Ansätze, Überlebenszeitanalysen durchzuführen (siehe R [1], Surv-4 [2], Stata [3], SAS), stellen zwar einerseits erprobte Verfahren dar, sind aber andererseits auch von den Daten isoliert. Sie sind daher darauf angewiesen, mit einem vom Anwender selektierten und aufbereiteten Datensatz genutzt zu werden. Diese Aufbereitung stellt, wenn sie manuell geschieht, eine zeitaufwändige und tendenziell fehlerträchtige Tätigkeit dar. Zur Verbesserung dieser Situation haben wir eine Anwendung zur Berechnung von Überlebenszeitanalysen erstellt, die mit einer auswertungsorientierten Datenbank [4] integriert ist. Durch diese Integration kann sich der Anwender auf die inhaltliche Fragestellung konzentrieren.

Vorgehen: Die Überlebenszeitanalyse wurde als Modul in die Datenauswertungssoftware CARESS integriert. CARESS wird seit 1993 am Informatikinstitut OFFIS in enger Zusammenarbeit mit dem epidemiologischen Krebsregister Niedersachsen (EKN) entwickelt und integriert verschiedene Visualisierungsformen für Maßzahlen (z.B. flexible Tabellen, Diagramme und thematische Karten). Als Datenquelle verwendet CARESS eine auswertungsorientierte Datenbank. Es besitzt eine automatisierte Schnittstelle zur Statistiksoftware R, über die bereits komplexe epidemiologische Maßzahlen berechnet werden, daher wurde für unsere Implementierung das bereits existierende R-Paket periodR [4] angepasst und genutzt.

Ergebnisse: Unsere Implementierung unterstützt verschiedene gängige Ansätze (Kohorten-, Perioden- und Kaplan-Meyer-Ansatz) und Methoden (Hakulinen, EdererII) zur Berechnung von Überlebenszeitanalysen [5], [6], [7]. Zudem können unterschiedliche Sterbetafeln (z. B. für neue und alte Bundesländer) zur Berechnung herangezogen werden. Der Anwender kann die in CARESS bereits vorhandenen Möglichkeiten zur Auswahl von Daten nutzen, diese werden automatisiert aufbereitet und in R berechnet. Die Ergebnisse werden in Tabellen- und Diagrammform präsentiert und lassen sich zur weiteren Bearbeitung (z.B. Berichtserstellung) exportieren. In der Evaluation mit Fachanwendern vom EKN konnten wir feststellen, dass unser Ansatz die Durchführung deutlich beschleunigt. Dieser Zeitgewinn manifestiert sich in zwei Faktoren: die Selektion der Quelldaten für die Überlebenszeitanalyse, sowie die Aufbereitung und Formatierung dieser Daten für die Berechnungssoftware. Die Selektion der Daten erfolgt bei CARESS über eine Dimensionsauswahl, in der Auswertungsdimensionen wie z. B. ICD10, Lokalisation oder Alter zur Verfügung stehen. In dieser Dimensionsauswahl können die benötigten Klassifikationsknoten per Drag&Drop ausgewählt werden. Bei nicht-integrierten Verfahren hingegen muss die Datenbank manuell abgefragt werden, beispielsweise per SQL, was Kenntnisse des Datenschemas voraussetzt und üblicherweise einen größeren Aufwand bedeutet. Die Aufbereitung und Formatierung der Daten, sowie der Aufruf der benötigten R-Funktion erfolgt bei CARESS automatisch im Hintergrund. Bei der bisher erforderlichen manuellen Aufbereitung mussten hingegen Ausprägungen der einzelnen Datensätze an das erwartete Format angepasst werden (beispielsweise Codierung des Vitalstatus, Aufteilung der Daten). Des Weiteren musste der Follow-up-Zeitpunkt anhand des Sterbe- und Beobachtungszeitraums berechnet werden, sofern dieser nicht in der Datenquelle hinterlegt ist und inkonsistente Fälle identifiziert und korrigiert, bzw. ausgeschlossen werden. Insbesondere dieser zweite Faktor ist zeitaufwändig und fehleranfällig.

Diskussion: Unser Ansatz zur Berechnung von Überlebenszeitanalysen ist durch eine vollständige Integration mit einer auswertungsorientierten Datenbank charakterisiert. Diese Integration verringert den Arbeitsaufwand und die benötigte Berechnungszeit. Durch diese Vereinfachung wird eine explorative Vorgehensweise unterstützt, da mit relativ geringem Aufwand unterschiedliche Analysen mit variierenden Ansätzen, Methoden und Einschränkungen der Daten durchgeführt werden können.


Literatur

1.
Holleczek B, Gondos A, Brenner H. periodR–an R Package to Calculate Long-term Cancer Survival Estimates Using Period Analysis. Methods Inf Med. 2009; 48: p. 123-128.
2.
European Cancer Registry. http://www.eurocare.it/Surv4/tabid/68/Default.aspx, letzter Zugriff: 12.04.2013 Externer Link
3.
Kohler U, Kreuter F. Datenanalyse mit Stata: allgemeine Konzepte der Datenanalyse und ihre praktische Anwendung. Oldenbourg Verlag, 2012.
4.
Chamoni Peter. Analytische Informationssysteme: Business Intelligence-Technologien und -Anwendungen. Springer Verlag, 2010
5.
Brenner H, Gefeller O. An alternative approach to monitoring cancer patient survival. Cancer. 1996; 78(9): p. 2004-10.
6.
Brenner H, Gefeller O, Hakulinen T. Period analysis for 'up-to-date' cancer survival data: theory, empirical evaluation, computational realisation and applications. Eur J Cancer. 2004; 40(3): p. 326-35.
7.
Ederer F, Axtell LM, Cutler SJ. The relative survival rate: a statistical methodology. National Cancer Inst Monogr. 1961; 6: p. 101-21.