gms | German Medical Science

HEC 2016: Health — Exploring Complexity
2016 Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

28.08. - 02.09.2016, München

Ein Ähnlichkeitsmaß für klinische Merkmale unter Einbindung des Kaplan-Meier-Schätzverfahrens

Meeting Abstract

Suche in Medline nach

  • Christian Karmen - Universität Heidelberg, Heidelberg, Deutschland
  • Matthias Gietzelt - Universität Heidelberg, Heidelberg, Deutschland
  • Petra Knaup - Universität Heidelberg, Heidelberg, Deutschland
  • Matthias Ganzinger - Universität Heidelberg, Heidelberg, Deutschland

HEC 2016: Health – Exploring Complexity. Joint Conference of GMDS, DGEpi, IEA-EEF, EFMI. München, 28.08.-02.09.2016. Düsseldorf: German Medical Science GMS Publishing House; 2016. DocAbstr. 712

doi: 10.3205/16gmds131, urn:nbn:de:0183-16gmds1317

Veröffentlicht: 8. August 2016

© 2016 Karmen et al.
Dieser Artikel ist ein Open-Access-Artikel und steht unter den Lizenzbedingungen der Creative Commons Attribution 4.0 License (Namensnennung). Lizenz-Angaben siehe http://creativecommons.org/licenses/by/4.0/.


Gliederung

Text

Hintergrund: Instanz-basiertes Lernen ist eine Methode für die Modellierung von Systemen zur Entscheidungsunterstützung (Decision Support System - DSS) und für fallbasiertes Schließen (Case Based Reasoning – CBR), die derzeit wieder stark an Bedeutung gewinnt [1].

Speziell beim CBR werden ähnliche Fälle innerhalb einer Fallbasis mit Hilfe von Ähnlichkeitsmaßen gesucht. Dazu werden zunächst die lokalen Ähnlichkeiten zwischen allen Ausprägungen eines Merkmals definiert, um anschließend aus allen Merkmalsähnlichkeiten zusammen die globale Ähnlichkeit zweier Fälle zu berechnen.

Zur Bestimmung von lokalen Ähnlichkeiten werden häufig Expertenwissen und Studienergebnisse genutzt. Ein Problem hierbei können individuelle Einschätzungen von Schweregraden jeweiliger Merkmale der jeweiligen Forschungsgruppe darstellen.

Alternativ werden auch rein statistische Ähnlichkeitsmaße eingesetzt, welche sich z.B. auf Häufigkeiten von Merkmalsausprägungen in der Fallbasis beziehen [2]. Die hierbei erreichten Vorhersage-Genauigkeiten von 80 – 85% zeigen zwar eine Verbesserung bisheriger Verfahren, können für klinische Anwendungen allerdings immer noch als zu gering betrachtet werden.

Methoden: Das vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) und University of West London (UWL) entwickelte Java-Framework „myCBR“ [3] wird für eine Implementierung des im Folgenden vorgestellten Ähnlichkeitsmaßes verwendet. Darauf aufbauend wurde eine graphisch-bedienbare Standalone-CBR-Applikation zur Abfrage von Ähnlichkeiten implementiert.

Unser Ansatz einer Ähnlichkeitsfunktion besteht darin, die Relevanz jedes einzelnen Merkmals in Bezug auf dessen Überlebenszeit zu ermitteln und in ein neues Ähnlichkeitsmaß einfließen lassen. Dadurch wird erreicht, dass neben dem klassischen Endpunkt Überlebensstatus (tot, lebendig) ein kombinierter Endpunkt zusammen mit dem Faktor Überlebenszeit entsteht. Es wird angenommen, dass die Überlebenszeit, welche bereits als primärer Endpunkt in den meisten klinischen Studien dient, auch als kombinierter Endpunkt für die beste Therapieentscheidung hilfreich ist.

Ergebnisse: In unserem entwickelten Ähnlichkeitsmaß wird von jeder Ausprägung eines nominalen Merkmals, welches zur Beschreibung eines Falles dient, das Kaplan-Meier-Schätzverfahren mit Zielvariable Progression-Free-Survival (PFS) angewandt. Bei nicht-nominellen Ausprägungen wird vorab eine Diskretisierung durchgeführt.

Die berechnete Ähnlichkeit zwischen zwei Ausprägungen wird davon abgeleitet, wie groß der Flächeninhalt zwischen zwei Ausprägungen eines Merkmals in dem errechneten KM-Diagramms (KMD) ist. Anschließend wird dieser Flächenwert normalisiert.

Zur Bestimmung der Gewichtung eines Merkmals wird die Fläche des KMD der Eingangsausprägung mit allen anderen Ausprägungen in Bezug gesetzt. Alternativ können auch die Flächen der Ausprägungen mit schwächster und stärkster Überlebenszeit betrachtet werden.

Als Gesamtähnlichkeit eines Falles wird der euklidische Abstand berechnet.

Zusammenfassung: Da die Überlebenszeit im Allgemeinen das wichtigste Therapiekriterium, vor allem bei malignen Erkrankungen, darstellt, halten wir den vorgestellten Ansatz für vielversprechend.

Es ist zu beachten, dass eine Validierung von Ähnlichkeitsmaßen im medizinischen Umfeld nur schwer möglich ist, da die effizienteste Therapie für einen individuellen Patienten, falls überhaupt, erst post festum ermittelt werden kann. Denkbar wäre ein Validierungsansatz, welcher anstelle des besten Matches (k=1) eine Gruppe ähnlicher Fälle in Betracht zieht.

Wir nutzen die vorgestellte Implementierung in dem Projekt CLIOMMICS [4] als Teil eines neuartigen CBR-Baukastensystems, welches dynamisch mit einer Vielzahl von Merkmalen umgehen kann. Dieses System wird beliebige Merkmale aus z.B. einem harmonisierten Data Warehouse automatisiert verarbeiten können und für die Ähnlichkeitsbestimmung heranziehen.

CLIOMMICS wird vom Bundesministerium


Literatur

1.
Richter MM, Weber RO. Case-based reasoning: A textbook. Heidelberg: Springer; 2013.
2.
Wilson DR, Martinez TR. Improved heterogeneous distance functions. Journal of artificial intelligence research. 1997.
3.
Bach K, Althoff KD. Developing Case-Based Reasoning Applications Using myCBR 3. Berlin, Heidelberg: Springer; 2012.
4.
e:Med Systems Medicine, CLIOMMICS. Letzter Zugriff: 13.03.2016. Verfügbar über URL: http://www.sys-med.de/en/consortia/cliommics/ Externer Link