gms | German Medical Science

GMDS 2013: 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

01. - 05.09.2013, Lübeck

CARESS als integrierte Auswertungssoftware zur Berechnung von Überlebenszeitanalysen

Meeting Abstract

Search Medline for

  • David Korfkamp - OFFIS e.V., Oldenburg, DE
  • H.-Jürgen Appelrath - Universität Oldenburg, Oldenburg, DE
  • Eunice Sirri - Epidemiologisches Krebregister Niedersachsen, Oldenburg, DE

GMDS 2013. 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Lübeck, 01.-05.09.2013. Düsseldorf: German Medical Science GMS Publishing House; 2013. DocAbstr.259

doi: 10.3205/13gmds084, urn:nbn:de:0183-13gmds0849

Published: August 27, 2013

© 2013 Korfkamp et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

In diesem Abstract stellen wir die Softwareanwendung CARESS vor, die verschiedene Methoden zur Durchführung von Überlebenszeitanalysen unterstützt, die hierfür notwendigen Daten integriert und Ad-hoc-Analysen ermöglicht.

Einleitung: Bisherige Ansätze, Überlebenszeitanalysen durchzuführen (siehe R [1], Surv-4 [2], Stata [3], SAS), stellen zwar einerseits erprobte Verfahren dar, sind aber andererseits auch von den Daten isoliert. Sie sind daher darauf angewiesen, mit einem vom Anwender selektierten und aufbereiteten Datensatz genutzt zu werden. Diese Aufbereitung stellt, wenn sie manuell geschieht, eine zeitaufwändige und tendenziell fehlerträchtige Tätigkeit dar. Zur Verbesserung dieser Situation haben wir eine Anwendung zur Berechnung von Überlebenszeitanalysen erstellt, die mit einer auswertungsorientierten Datenbank [4] integriert ist. Durch diese Integration kann sich der Anwender auf die inhaltliche Fragestellung konzentrieren.

Vorgehen: Die Überlebenszeitanalyse wurde als Modul in die Datenauswertungssoftware CARESS integriert. CARESS wird seit 1993 am Informatikinstitut OFFIS in enger Zusammenarbeit mit dem epidemiologischen Krebsregister Niedersachsen (EKN) entwickelt und integriert verschiedene Visualisierungsformen für Maßzahlen (z.B. flexible Tabellen, Diagramme und thematische Karten). Als Datenquelle verwendet CARESS eine auswertungsorientierte Datenbank. Es besitzt eine automatisierte Schnittstelle zur Statistiksoftware R, über die bereits komplexe epidemiologische Maßzahlen berechnet werden, daher wurde für unsere Implementierung das bereits existierende R-Paket periodR [4] angepasst und genutzt.

Ergebnisse: Unsere Implementierung unterstützt verschiedene gängige Ansätze (Kohorten-, Perioden- und Kaplan-Meyer-Ansatz) und Methoden (Hakulinen, EdererII) zur Berechnung von Überlebenszeitanalysen [5], [6], [7]. Zudem können unterschiedliche Sterbetafeln (z. B. für neue und alte Bundesländer) zur Berechnung herangezogen werden. Der Anwender kann die in CARESS bereits vorhandenen Möglichkeiten zur Auswahl von Daten nutzen, diese werden automatisiert aufbereitet und in R berechnet. Die Ergebnisse werden in Tabellen- und Diagrammform präsentiert und lassen sich zur weiteren Bearbeitung (z.B. Berichtserstellung) exportieren. In der Evaluation mit Fachanwendern vom EKN konnten wir feststellen, dass unser Ansatz die Durchführung deutlich beschleunigt. Dieser Zeitgewinn manifestiert sich in zwei Faktoren: die Selektion der Quelldaten für die Überlebenszeitanalyse, sowie die Aufbereitung und Formatierung dieser Daten für die Berechnungssoftware. Die Selektion der Daten erfolgt bei CARESS über eine Dimensionsauswahl, in der Auswertungsdimensionen wie z. B. ICD10, Lokalisation oder Alter zur Verfügung stehen. In dieser Dimensionsauswahl können die benötigten Klassifikationsknoten per Drag&Drop ausgewählt werden. Bei nicht-integrierten Verfahren hingegen muss die Datenbank manuell abgefragt werden, beispielsweise per SQL, was Kenntnisse des Datenschemas voraussetzt und üblicherweise einen größeren Aufwand bedeutet. Die Aufbereitung und Formatierung der Daten, sowie der Aufruf der benötigten R-Funktion erfolgt bei CARESS automatisch im Hintergrund. Bei der bisher erforderlichen manuellen Aufbereitung mussten hingegen Ausprägungen der einzelnen Datensätze an das erwartete Format angepasst werden (beispielsweise Codierung des Vitalstatus, Aufteilung der Daten). Des Weiteren musste der Follow-up-Zeitpunkt anhand des Sterbe- und Beobachtungszeitraums berechnet werden, sofern dieser nicht in der Datenquelle hinterlegt ist und inkonsistente Fälle identifiziert und korrigiert, bzw. ausgeschlossen werden. Insbesondere dieser zweite Faktor ist zeitaufwändig und fehleranfällig.

Diskussion: Unser Ansatz zur Berechnung von Überlebenszeitanalysen ist durch eine vollständige Integration mit einer auswertungsorientierten Datenbank charakterisiert. Diese Integration verringert den Arbeitsaufwand und die benötigte Berechnungszeit. Durch diese Vereinfachung wird eine explorative Vorgehensweise unterstützt, da mit relativ geringem Aufwand unterschiedliche Analysen mit variierenden Ansätzen, Methoden und Einschränkungen der Daten durchgeführt werden können.


Literatur

1.
Holleczek B, Gondos A, Brenner H. periodR–an R Package to Calculate Long-term Cancer Survival Estimates Using Period Analysis. Methods Inf Med. 2009; 48: p. 123-128.
2.
European Cancer Registry. http://www.eurocare.it/Surv4/tabid/68/Default.aspx, letzter Zugriff: 12.04.2013 External link
3.
Kohler U, Kreuter F. Datenanalyse mit Stata: allgemeine Konzepte der Datenanalyse und ihre praktische Anwendung. Oldenbourg Verlag, 2012.
4.
Chamoni Peter. Analytische Informationssysteme: Business Intelligence-Technologien und -Anwendungen. Springer Verlag, 2010
5.
Brenner H, Gefeller O. An alternative approach to monitoring cancer patient survival. Cancer. 1996; 78(9): p. 2004-10.
6.
Brenner H, Gefeller O, Hakulinen T. Period analysis for 'up-to-date' cancer survival data: theory, empirical evaluation, computational realisation and applications. Eur J Cancer. 2004; 40(3): p. 326-35.
7.
Ederer F, Axtell LM, Cutler SJ. The relative survival rate: a statistical methodology. National Cancer Inst Monogr. 1961; 6: p. 101-21.