gms | German Medical Science

54. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

07. bis 10.09.2009, Essen

Automatisches Tagging von Pathologie-Befunden

Meeting Abstract

Search Medline for

  • Erich Schmiedberger - Institut für Medizinische Informatik, Statistik und Dokumentation, Medizinische Universität Graz, Graz
  • Maximilian Errath - Institut für Medizinische Informatik, Statistik und Dokumentation, Medizinische Universität Graz, Graz

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 54. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds). Essen, 07.-10.09.2009. Düsseldorf: German Medical Science GMS Publishing House; 2009. Doc09gmds294

DOI: 10.3205/09gmds294, URN: urn:nbn:de:0183-09gmds2942

Published: September 2, 2009

© 2009 Schmiedberger et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung / Hintergrund: Eine Konsequenz der steigenden Vernetzung und Integration medizinischer Informationssysteme sind zum Teil überwältigend lange Dokumentlisten, die als Resultat einer Suche nach der medizinischen Dokumentation zu einem Patienten präsentiert werden. Ziel dieses Projektes war es, Ärztinnen und Ärzten des Instituts für Pathologie zusätzliche, aus den Befundtexten extrahierte Informationen direkt in der Dokumentliste zur Verfügung zu stellen, und ihnen so die Auswahl der im Rahmen der Diagnoseerstellung näher zu betrachtenden Befunde zu erleichtern. Zu diesem Zweck werden die Diagnosetexte der pathologischen Befunde automatisch bezüglich der Fragestellung „Text enthält Hinweis auf eine Entzündung oder Neoplasie“ klassifiziert und mit den entsprechenden Markierungen (Tags) versehen.

Material und Methoden: Gängige Ansätze zur Klassifikation von Dokumenten basieren auf Methoden des maschinellen Lernens oder auf einem für den jeweiligen Anwendungsbereich zugeschnittenen Regelwerk. Nach dem Test verschiedener Machine-Learning-Verfahren (aus dem WEKA-Toolkit [1]) wurde ein regelbasierter Ansatz gewählt, da – auf Grund der sehr spezifischen Aufgabenstellung – damit bessere Ergebnisse erzielt werden konnten. Das Regelwerk wurde in Zusammenarbeit mit Pathologen erstellt und basiert hauptsächlich auf Mustervergleichen mit Regular Expressions; die Erkennung von Verneinungen ist grob an NegEx [2] angelehnt. Als Grundlage für die Generierung und Überprüfung des Regelwerks sowie für den Vergleich mit anderen Verfahren diente eine aus rund 3000 Diagnosetexten bestehende Stichprobe, die aus den Datenbanken der Pathologie extrahiert und manuell klassifiziert wurde.

Ergebnisse und Diskussion: Mit dem regelbasierten Ansatz konnte bei der Klassifizierung von Befunden bezüglich der Merkmale Entzündung und Neoplasie ein F1-Measure von 0,98 erreicht werden. Die Klassifikationssoftware wurde in die zum Retrieval und zur Anzeige von Befunden verwendete Web-Anwendung AURAWeb [3] integriert und befindet sich an der Medizinischen Universität Graz im Einsatz. Die Befunde werden unmittelbar nach dem Retrieval klassifiziert (damit ist keine Änderung in den Datenbanken der Informationssysteme notwendig), die generierten Tags werden direkt in der resultierenden Dokumentliste angezeigt und als zusätzliche Sortier- und Filterkriterien angeboten.


Literatur

1.
Witten IH, Frank E. Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. San Francisco, CA: Morgan Kauffman; 2000.
2.
Chapman WW, Bridewell W, Hanbury P, Cooper GF, Buchanan BG. A simple algorithm for identifying negated findings and diseases in discharge summaries. J Biomed Inform. 2001;34:301-10.
3.
Geierhofer R, Errath M. AURAWeb: Kostengünstige Einbindung von Legacy-Daten in ein KIS. 51. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Leipzig, 10.-14.09.2006. Düsseldorf, Köln: German Medical Science; 2006. Doc 06gmds330. Available from: http://www.egms.de/en/meetings/gmds2006/06gmds233.shtml External link