Artikel
Erklärbare künstliche Intelligenz für die Deep Learning-basierte Klassifikation von Lungenveränderungen im MRT bei cystischer Fibrose
Suche in Medline nach
Autoren
Veröffentlicht: | 15. September 2023 |
---|
Gliederung
Text
Einleitung: Magnetresonanztomographie (MRT) ist ein etabliertes Verfahren zur Beurteilung von Lungenveränderungen bei cystischer Fibrose (CF) [1]. Auf Basis eines aus sechs Scoringelementen bestehenden morpho-funktionellen Gesamtscores lassen sich reproduzierbare Ergebnisse zur Beurteilung der Lungen von CF-Patient*innen erzielen [2]. Um das Scoring zu beschleunigen und die Variabilität zu verringern, wird derzeit in unserer Arbeitsgruppe ein Deep Learning (DL) basierter Scoringansatz entwickelt. Neben der Methodenentwicklung sind weitere Maßnahmen vorgesehen, um dem radiologischen Fachpersonal die Plausibilität der DL-Klassifikationsergebnisse zu erklären und somit Vertrauen zu schaffen. In dieser Arbeit soll untersucht werden, ob Algorithmen der erklärbaren künstlichen Intelligenz (XAI) [3] geeignet sind, um den DL-Klassifikationsprozess zu unterstützen. Hierbei betrachten wir Lungenperfusionsdefekte als eines der sechs Scoringelemente, welches mittels MRT mit Kontrastmittelinjektion und anschließender Bildsubtraktion beurteilt wird.
Methodik: Es werden geeignete XAI-Algorithmen ausgewählt [4], implementiert und auf ein selbst entwickeltes neuronales Netz für das Scoring der Lungenperfusionsdefekte angewendet. Um einen möglichen Mehrwert für den DL-Klassifikationsprozess zu quantifizieren, wird ein Bewertungsprozess etabliert. Hierbei wird für jede Schicht einer MRT-Untersuchung die berechnete XAI-Visualisierung überlagert und durch einen Data Scientist inspiziert. Anschließend wird die MRT-Untersuchung einer Kategorie zugeordnet:
- Kategorie 1: Maximal zwei Schichten der MRT-Untersuchung weisen nicht plausible Überlagerungen auf.
- Kategorie 2: Drei oder mehr Schichten, aber nicht alle Schichten der MRT-Untersuchung weisen nicht plausible Überlagerungen auf.
- Kategorie 3: Alle Schichten weisen nicht plausible Überlagerungen auf.
- Kategorie 4: Es wird nichts hervorgehoben.
Eine Überlagerung wird als plausibel angesehen, wenn sie die für das radiologische Scoring relevanten Areale hervorhebt.
Ergebnisse: Class Activation Maps (CAM) und Grad Cam (GCam) werden als geeignete Algorithmen identifiziert, implementiert und evaluiert. Die Berechnungszeit liegt jeweils bei unter drei Sekunden für eine MRT-Untersuchung (je nach Lungengröße und Auflösung zwischen 20 und 80 Schichten). Die Algorithmen verwenden die Bildinformationen zusammen mit dem vorhergesagten Score als Ausgangspunkt für die Berechnung einer Zuordnungskarte (Überlagerung). Anhand des Bewertungsprozesses werden 134 MRT-Perfusionsuntersuchungen inspiziert und in die Kategorien 1-4 eingeordnet (siehe Tabelle 1 [Tab. 1]).
Diskussion: Insgesamt werden die Ergebnisse für CAM besser bewertet als für GCam. Das zeigt sich durch den höheren prozentualen Anteil in Kategorie 1 und den geringeren Anteilen in Kategorie 2 und 3. Die Kategorie 4 stellt einen Sonderfall dar. Für Untersuchungen ohne Lungenperfusionsdefekt kann es als radiologisch plausibel angesehen werden, dass keine Areale hervorgehoben werden. Für alle anderen Untersuchungen ist eine Einstufung in diese Kategorie als problematisch anzusehen.
Überraschend ist, dass GCAM schlechtere Ergebnisse erzielten, da sie eine Weiterentwicklung von CAM darstellen und bei vergleichbaren Fragestellungen erfolgreich eingesetzt wurden [5]. Weitere Untersuchungen sind diesbezüglich nötig.
Schlussfolgerung: Die Anwendung von XAI-Algorithmen liefert zusätzliche nützliche Informationen für das radiologische Fachpersonal bei der Auswertung von Lungen-MRTs von CF-Patient*innen. Die Inspektion der XAI-Überlagerungen zeigt, dass bei vorliegenden Lungenperfusionsdefekten die für das Scoring relevanten Bereiche häufig korrekt hervorgehoben wurden, offenbart aber auch Potential für weitere Optimierungen.
Die Autoren geben an, dass kein Interessenkonflikt besteht.
Die Autoren geben an, dass ein positives Ethikvotum vorliegt.
Literatur
- 1.
- Puderbach M, Eichinger M, Haeselbarth J, Ley S, Kopp-Schneider A, Tuengerthal S, et al. Assessment of morphological MRI for pulmonary changes in cystic fibrosis (CF) patients: comparison to thin-section CT and chest x-ray. Invest Radiol. 2007;42:715–25. DOI: 10.1097/RLI.0b013e318074fd81
- 2.
- Eichinger M, Optazaite DE, Kopp-Schneider A, Hintze C, Biederer J, Niemann A, et al. Morphologic and functional scoring of cystic fibrosis lung disease using MRI. Eur J Radiol. 2012;81:1321–9. DOI: 10.1016/j.ejrad.2011.02.045
- 3.
- Tjoa E, Guan C. A Survey on Explainable Artificial Intelligence (XAI): Toward Medical XAI. IEEE Trans Neural Netw Learn Syst. 2021;32:4793–813. DOI: 10.1109/TNNLS.2020.3027314
- 4.
- van der Velden BHM, Kuijf HJ, Gilhuijs KGA, Viergever MA. Explainable artificial intelligence (XAI) in deep learning-based medical image analysis. Med Image Anal. 2022;79:102470. DOI: 10.1016/j.media.2022.102470
- 5.
- Selvaraju RR, Cogswell M, Das A, Vedantam R, Parikh D, Batra D. Grad-CAM: Visual Explanations from Deep Networks via Gradient-Based Localization. Int J Comput Vis. 2020;128:336–59. DOI: 10.1007/s11263-019-01228-7