gms | German Medical Science

62. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

17.09. - 21.09.2017, Oldenburg

vivaGen: Ein Datensatzgenerator für Überlebenszeitdaten

Meeting Abstract

  • Matthias Gietzelt - Universität Heidelberg, Heidelberg, Deutschland
  • Christian Karmen - Universität Heidelberg, Heidelberg, Deutschland
  • Christian Haux - Universität Heidelberg, Heidelberg, Deutschland
  • Matthias Ganzinger - Universität Heidelberg, Heidelberg, Deutschland
  • Petra Knaup - Universität Heidelberg, Heidelberg, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 62. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Oldenburg, 17.-21.09.2017. Düsseldorf: German Medical Science GMS Publishing House; 2017. DocAbstr. 255

doi: 10.3205/17gmds052, urn:nbn:de:0183-17gmds0522

Published: August 29, 2017

© 2017 Gietzelt et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Entscheidungsunterstützungssysteme können auf Basis von Case-Based Reasoning (CBR) realisiert werden [1]. Im medizinischen Kontext werden dabei z.B. behandelte Fälle in einer Fallbasis analysiert, um für einen neuen Fall die Auswahl einer geeigneten Therapie zu unterstützen.

Im Projekt CLIOMMICS [2] wird ein CBR-System entwickelt, das die Ähnlichkeit von Probanden in Bezug auf Überlebenszeitdaten als kombinierten Endpunkt (Überlebenszeit, Überlebensstatus) untersucht [3]. Für das Design des CBR-Systems wurde angenommen, dass dieser kombinierte Endpunkt auch für die beste Therapieentscheidung hilfreich sein kann.

Solche CBR-Systeme zu evaluieren gestaltet sich unter Umständen schwierig, etwa wenn die Therapie der Patienten in der Fallbasis im Rahmen einer Studie zufällig gewählt wurde, aber vermutet wird, dass der unterlegene Therapiearm bei einer Subkohorte aufgrund einer noch unbekannten Disposition doch die bessere Therapieentscheidung gewesen wäre. Eine Möglichkeit zu einer solchen Evaluation ist die Verwendung von Datensätzen mit „Surrogatbiomarkern“.

Ziel dieser Arbeit ist die Entwicklung einer Software zur Generierung von Datensätzen, die solche Surrogatbiomarker, aber auch zufällige Kovariate enthalten. Die generierten Datensätze können so als Grundlage zur Evaluation des auf statistischen Methoden basierenden CBR-Systems dienen.

Methoden: Als Grundschema zur Generierung der Daten dient eine typische zweiarmige randomisierte kontrollierte Interventionsstudie mit Überlebenszeitdaten.

Zur Modellierung der Überlebenszeit dienen wahlweise die Weibull- oder die Log-logistische Verteilung und zur Erzeugung des Überlebensstatus die Binomialverteilung. Das Besondere an dem hier verwendeten Verfahren ist die Organisation des Probandenkollektivs: Neben der Aufteilung in einen Arm A (Standardtherapie) und B (neue Therapie) bzw. Short-Term-Survivors (STS, Gruppe mit schlechten Überlebenschancen) und Long-Term-Survivors (LTS, gute Überlebenschancen), gibt es eine weitere Unterteilung in Überlebende und Nicht-Überlebende. Dies ermöglicht die gezielte Beeinflussung bei der Generierung der Kovariaten hinsichtlich der Überlebenszeit und des Überlebensstatus.

Die Simulation der Überlegenheit des Arms B gegenüber dem Arm A soll es erlauben, die erwartete, klinisch relevante Differenz einstellen zu können.

Ergebnisse: Die generierten nominalen Kovariaten können mithilfe von Überlebenszeit-Diagrammen visualisiert und auf diese Weise die Auswirkungen der Konfiguration des Generators überprüft werden. Ein eigens entwickeltes Verfahren zur Dichotomisierung von numerischen Kovariaten zur Darstellung in Überlebenszeit-Diagrammen sucht nach dem optimalen Cut-Off zur Unterscheidung von Überlebenden und Nicht-Überlebenden [3].

Der Generator „vivaGen“ wurde in Java implementiert, wobei die Berechnungsmethoden einer vollständigen Testabdeckung unterliegen. Die Laufzeit bei der Erzeugung auch großer Datensätze (>10.000 Probanden) ist unter modernen Desktop-Systemen vernachlässigbar klein (<0.5s).

Diskussion: Die besondere Eigenschaft dieses Generators liegt in den getrennt generierbaren Subgruppen STS und LTS, wobei die Überlebenszeitkurven des Überlebenszeit-Schätzers jeweils durch einen definierbaren Punkt gehen (Überlebenswahrscheinlichkeit in %, Zeit in Monaten). Dies ist insbesondere für Forscher interessant, die eine Überlebenswahrscheinlichkeit zu einem bestimmten Zeitpunkt aus der Praxis schätzen können.

Durch die Trennung der Subgruppen STS und LTS und die erneute Aufspaltung in Überlebende und Nicht-Überlebende, wird eine gezielte Beeinflussung der Kovariaten ermöglicht. Das erlaubt die getrennte Festlegung von Surrogatbiomarkern für jeden der beiden simulierten Therapie-Arme, indem z.B. bei der LTS-Subgruppe eine Verteilung mit veränderter Parametrierung (gegenüber allen anderen Subgruppen) zugewiesen werden kann.

Die hier vorgestellte Software vivaGen ist frei verfügbar [4].

CLIOMMICS wird vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen der e:Med-Initiative unter dem Förderkennzeichen 01ZX1609A gefördert.



Die Autoren geben an, dass kein Interessenkonflikt besteht.

Die Autoren geben an, dass kein Ethikvotum erforderlich ist.


Literatur

1.
Aamodt A, Plaza E. Case-based reasoning: foundational issues, methodological variations, and system approaches. AI Commun. 1994;7(1):39-59.
2.
e:Med-Initiative Systemmedizin des BMBF [Online]. 2013. URL: http://www.sys-med.de/de/ konsortien/cliommics (letzter Zugriff: 21.04.2017) External link
3.
Karmen C, Gietzelt M, Knaup P, Ganzinger M. Ein Ähnlichkeitsmaß für klinische Merkmale unter Einbindung des Kaplan-Meier-Schätzverfahrens. Proceedings of the Health – Exploring Complexity conference (HEC); Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI; 2016 Aug 28-Sep 2; München, Germany. Abstract no. 712. DOI: 10.3205/16gmds131 External link
4.
SourceForge.net. Project vivaGen, version 1.0 [Online]. 2017. URL: https://sourceforge.net/projects/vivagen (letzter Zugriff: 10.03.2017) External link