gms | German Medical Science

MAINZ//2011: 56. GMDS-Jahrestagung und 6. DGEpi-Jahrestagung

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V.
Deutsche Gesellschaft für Epidemiologie e. V.

26. - 29.09.2011 in Mainz

Freitextdaten in der Radiologie: Automatische Verschlagwortung radiologischer Befundtexte und Anwendungsszenarien

Meeting Abstract

  • Christian Simon - Averbis GmbH, Freiburg
  • Kai Simon - Averbis GmbH, Freiburg
  • Oleg Lichtenwald - Averbis GmbH, Freiburg
  • Philipp Daumke - Averbis GmbH, Freiburg
  • Sören Holste - Radiologische Universitätsklinik, Freiburg
  • Sarah Ambroz - Averbis GmbH, Freiburg
  • Axel Kühn - Klinik und Poliklinik für Diagnostische und Interventionelle Radiologie, Leipzig
  • Elmar Kotter - Radiologische Universitätsklinik, Freiburg

Mainz//2011. 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi). Mainz, 26.-29.09.2011. Düsseldorf: German Medical Science GMS Publishing House; 2011. Doc11gmds546

DOI: 10.3205/11gmds546, URN: urn:nbn:de:0183-11gmds5467

Published: September 20, 2011

© 2011 Simon et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung/Hintergrund: Radiologische Befundberichte enthalten eine Fülle von Informationen über den Gesundheitsstand und den Krankheitsverlauf von Patienten. Durch die freitextliche Form der Berichte ist es jedoch nicht ohne weiteres möglich, die Inhalte für statistische Auswertungen, Vergleiche oder den Aufbau einer semantischen Suche zu nutzen. Ziel des RADMINING-Projekts ist die Entwicklung entsprechender Technologien zur maschinellen Erschließung von Wissen aus radiologischen Freitexten. Eine zentrale Rolle spielt dabei eine qualitativ hochwertige automatische Verschlagwortung der Befundtexte anhand adäquater Referenzterminologien. Im radiologischen Umfeld stellt RADLEX [1] eine solche Referenzterminologie dar, welche für den Gebrauch in RADMINING ins Deutsche übersetzt wurde. Da mittels RADLEX nur 65% der relevanten Terme abdeckt werden kann [2], wurden manuell über 1.000 Terme ergänzt.

Daten und Methoden: Durch die klinischen Projektpartner wurde ein Datenpool von ca. 100.000 anonymisierten radiologischen Befundtexten unterschiedlicher Modalitäten zusammengetragen. Aus diesem sprachlich heterogenen Datenbestand wurden randomisiert 100 Befundtexte aus dem Bereich Lymphomuntersuchungen manuell von Experten mittels einer speziellen Annotationsoberfläche [3] annotiert. Der erstellte Gold-Standard weist im Mittel über 100 verschlagwortete Terme pro Befundtext auf. Ferner wurde eine Textanalyse-Software [3] entwickelt, die u.a. eine morphologische Analyse zur Zerlegung zusammengesetzter Wörter [4] sowie die Erkennung von Nominalphrasen und Abkürzungen zur Verschlagwortung nutzt. Zudem ist es möglich, negierte Aussagen, Größen-, Datumsangaben und Bildreferenzen auf DICOM-Bilder zu extrahieren.

Ergebnisse: Um die Zuverlässigkeit der Verschlagwortungskomponente zu bewerten, wurde das standardisierte F1-Maß (F1) genutzt, welches die Größen Precision (P) und Recall (R) durch das harmonische Mittel gewichtet. Untersuchungen zeigten, dass eine Verschlagwortung der Texte durch den direkten Abgleich mit den Einträgen in der Terminologie (ohne Textanalyse) zu Werten P=0.877, R=0.162 und F1=0.27 führte. Im Vergleich dazu verbesserte sich die Qualität der Verschlagwortung signifikant, wenn die Textanalyse-Software vorgeschaltet wurde. So konnten Werte von P=0.921, R=0.935 und F1=0.928 erzielt werden. Das entspricht einer Verbesserung des F1-Maßes um 0.658 Punkte.

Diskussion/Zusammenfassung: Die automatische Wissenserschließung deutschsprachiger radiologischer Befundtexte stellt eine Reihe technischer Herausforderungen an die maschinelle Textanalyse. Die Untersuchungen zeigten die Komplexität der automatischen Verschlagwortung in radiologischen Freitexten. Erst eine syntaktische und semantische Analyse der radiologischen Freitexte ermöglicht eine qualitativ hochwertige Verschlagwortung, welche für eine semantische und strukturierte Erschließung der Texte notwendig ist.

Anwendungsszenario: Als erstes Anwendungsszenario wurde eine semantische Bildersuche aufgesetzt, die Bilddaten anhand ihrer textuellen Beschreibungen in den Befundtexten durchsuchbar macht und Ärzten in ihrer täglichen Arbeit eine wertvollen Entscheidungsunterstützung bietet.


Literatur

1.
http://www.rsna.org/radlex/ External link
2.
Daumke P, Enders F, Simon K, Poprat M, Markó K. Semantic Annotation of Clinical Text – the Averbis Annotation Editor. In: Proceedings of the 55th Conference of the German Society of Medical Informatics, Biometry and Epidermiology (GMDS 2010). 2010. Köln, Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS).
3.
Daumke P, Holste S, Ambroz S, Poprat M, Simon K, Marwede D, Kotter D. Informationsextraktion aus radiologischen Befundberichten. In: Proceedings of the 55th Conference of the German Society of Medical Informatics, Biometry and Epidermiology (GMDS 2010). 2010. Köln, Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS).
4.
Daumke P, Schulz S, Müller ML, Dzeyk W, Prinzen L, Pacheco EJ, Cancain P, Nohama P, Markó K. Subword-based Semantic Retrieval of Clinical and Biblographic Documents. Methods Inf Med. 2010;49(2):141-7.