Artikel
Ein Ähnlichkeitsmaß für klinische Merkmale unter Einbindung des Kaplan-Meier-Schätzverfahrens
Suche in Medline nach
Autoren
Veröffentlicht: | 8. August 2016 |
---|
Gliederung
Text
Hintergrund: Instanz-basiertes Lernen ist eine Methode für die Modellierung von Systemen zur Entscheidungsunterstützung (Decision Support System - DSS) und für fallbasiertes Schließen (Case Based Reasoning – CBR), die derzeit wieder stark an Bedeutung gewinnt [1].
Speziell beim CBR werden ähnliche Fälle innerhalb einer Fallbasis mit Hilfe von Ähnlichkeitsmaßen gesucht. Dazu werden zunächst die lokalen Ähnlichkeiten zwischen allen Ausprägungen eines Merkmals definiert, um anschließend aus allen Merkmalsähnlichkeiten zusammen die globale Ähnlichkeit zweier Fälle zu berechnen.
Zur Bestimmung von lokalen Ähnlichkeiten werden häufig Expertenwissen und Studienergebnisse genutzt. Ein Problem hierbei können individuelle Einschätzungen von Schweregraden jeweiliger Merkmale der jeweiligen Forschungsgruppe darstellen.
Alternativ werden auch rein statistische Ähnlichkeitsmaße eingesetzt, welche sich z.B. auf Häufigkeiten von Merkmalsausprägungen in der Fallbasis beziehen [2]. Die hierbei erreichten Vorhersage-Genauigkeiten von 80 – 85% zeigen zwar eine Verbesserung bisheriger Verfahren, können für klinische Anwendungen allerdings immer noch als zu gering betrachtet werden.
Methoden: Das vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) und University of West London (UWL) entwickelte Java-Framework „myCBR“ [3] wird für eine Implementierung des im Folgenden vorgestellten Ähnlichkeitsmaßes verwendet. Darauf aufbauend wurde eine graphisch-bedienbare Standalone-CBR-Applikation zur Abfrage von Ähnlichkeiten implementiert.
Unser Ansatz einer Ähnlichkeitsfunktion besteht darin, die Relevanz jedes einzelnen Merkmals in Bezug auf dessen Überlebenszeit zu ermitteln und in ein neues Ähnlichkeitsmaß einfließen lassen. Dadurch wird erreicht, dass neben dem klassischen Endpunkt Überlebensstatus (tot, lebendig) ein kombinierter Endpunkt zusammen mit dem Faktor Überlebenszeit entsteht. Es wird angenommen, dass die Überlebenszeit, welche bereits als primärer Endpunkt in den meisten klinischen Studien dient, auch als kombinierter Endpunkt für die beste Therapieentscheidung hilfreich ist.
Ergebnisse: In unserem entwickelten Ähnlichkeitsmaß wird von jeder Ausprägung eines nominalen Merkmals, welches zur Beschreibung eines Falles dient, das Kaplan-Meier-Schätzverfahren mit Zielvariable Progression-Free-Survival (PFS) angewandt. Bei nicht-nominellen Ausprägungen wird vorab eine Diskretisierung durchgeführt.
Die berechnete Ähnlichkeit zwischen zwei Ausprägungen wird davon abgeleitet, wie groß der Flächeninhalt zwischen zwei Ausprägungen eines Merkmals in dem errechneten KM-Diagramms (KMD) ist. Anschließend wird dieser Flächenwert normalisiert.
Zur Bestimmung der Gewichtung eines Merkmals wird die Fläche des KMD der Eingangsausprägung mit allen anderen Ausprägungen in Bezug gesetzt. Alternativ können auch die Flächen der Ausprägungen mit schwächster und stärkster Überlebenszeit betrachtet werden.
Als Gesamtähnlichkeit eines Falles wird der euklidische Abstand berechnet.
Zusammenfassung: Da die Überlebenszeit im Allgemeinen das wichtigste Therapiekriterium, vor allem bei malignen Erkrankungen, darstellt, halten wir den vorgestellten Ansatz für vielversprechend.
Es ist zu beachten, dass eine Validierung von Ähnlichkeitsmaßen im medizinischen Umfeld nur schwer möglich ist, da die effizienteste Therapie für einen individuellen Patienten, falls überhaupt, erst post festum ermittelt werden kann. Denkbar wäre ein Validierungsansatz, welcher anstelle des besten Matches (k=1) eine Gruppe ähnlicher Fälle in Betracht zieht.
Wir nutzen die vorgestellte Implementierung in dem Projekt CLIOMMICS [4] als Teil eines neuartigen CBR-Baukastensystems, welches dynamisch mit einer Vielzahl von Merkmalen umgehen kann. Dieses System wird beliebige Merkmale aus z.B. einem harmonisierten Data Warehouse automatisiert verarbeiten können und für die Ähnlichkeitsbestimmung heranziehen.
CLIOMMICS wird vom Bundesministerium
Literatur
- 1.
- Richter MM, Weber RO. Case-based reasoning: A textbook. Heidelberg: Springer; 2013.
- 2.
- Wilson DR, Martinez TR. Improved heterogeneous distance functions. Journal of artificial intelligence research. 1997.
- 3.
- Bach K, Althoff KD. Developing Case-Based Reasoning Applications Using myCBR 3. Berlin, Heidelberg: Springer; 2012.
- 4.
- e:Med Systems Medicine, CLIOMMICS. Letzter Zugriff: 13.03.2016. Verfügbar über URL: http://www.sys-med.de/en/consortia/cliommics/