gms | German Medical Science

GMDS 2015: 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

06.09. - 09.09.2015, Krefeld

Automatische OPS-Verschlüsselung aus OP-Berichten unter Berücksichtigung diskursstruktureller und domänenspezifischer Anforderungen

Meeting Abstract

  • Till Kolter - ID Information und Dokumentation im Gesundheitswesen GmbH & Co. KGaA, Berlin, Deutschland
  • Kristin Irsig - ID Information und Dokumentation im Gesundheitswesen GmbH & Co. KGaA, Berlin, Deutschland
  • Lukas Faulstich - ID Information und Dokumentation im Gesundheitswesen GmbH & Co. KGaA, Berlin, Deutschland
  • Conrad Plake - ID Information und Dokumentation im Gesundheitswesen GmbH & Co. KGaA, Berlin, Deutschland

GMDS 2015. 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Krefeld, 06.-09.09.2015. Düsseldorf: German Medical Science GMS Publishing House; 2015. DocAbstr. 115

doi: 10.3205/15gmds103, urn:nbn:de:0183-15gmds1031

Published: August 27, 2015

© 2015 Kolter et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Die lückenlose und zeitnahe Erfassung von Verlaufsdaten von Operationen ist zwingend notwendig, um die angemessene postoperative Versorgung des Patienten zu gewährleisten. Neben Aspekten, welche primär der Patientensicherheit dienen, ist die vollständige Dokumentation des Operationsverlauf als Abrechnungsgrundlage für die Kostenträger gesetzlich vorgeschrieben. Die erste Stufe zur Dokumentation der Operationsprozesse erfolgt in der Regel durch ein Diktat, welches entweder direkt während der OP durch Einsatz von Diktiersoftware oder vom operierenden Arzt postoperativ durchgeführt wird. Anschließend wird die Tonaufnahme üblicherweise von Stationsmitarbeitern oder vom Sekretariat durch Transkription in Freitextform überführt. Durch den voranschreitenden Trend zur Digitalisierung von Patientenakten bieten sich neue Möglichkeiten bei der computerunterstützten Dokumentation und abrechnungsrelevanter Verschlüsselung. Die elektronischen Dokumente stehen den Medizinischen Dokumentaren (MD) und Medizinischen Dokumentationsassistenten (MDA) entweder im Original zur Verfügung oder werden über Archivierungslösungen in digitaler oder digitalisierter Form bereitgestellt.

Mit Hilfe computerlinguistischer Aufbereitung und spezialisierter Suchstrategien können Diagnosen und Prozeduren in klinischen Dokumenten erkannt und auf die Klassifikationen ICD-10-GM und OPS abgebildet werden [1]. Zu jeder codierrelevanten Textstelle werden entsprechende Codiervorschläge angezeigt, die der Codierer auswählen und übernehmen kann. Die Güte der extrahierten Codes hängt dabei stark von Dokumenteigenschaften wie Typ und Struktur ab. OP-Berichte protokollieren den zeitlichen Ablauf der Operation von der Präparation der Materialien und Werkzeuge bis hin zum Abschluss des Eingriffs streng linear und stellen aufgrund dessen eine besondere Herausforderung dar. Um die Dokumentation abrechnungsrelevanter Prozeduren aus freitextlichen OP-Berichten optimal zu unterstützen, müssen Ereignisse und Entitäten zusammen gefügt werden, die an unterschiedlichen Stellen im Dokument genannt werden. Im Rahmen des Projekts haben wir unsere bestehenden generischen Algorithmen zur automatischen Informationsextraktion analysiert und erweitert, um den speziellen Herausforderungen der beschriebenen Anwendungsdomäne gerecht zu werden. Ziel des Algorithmus ist die Berechnung aller relevanten OPS-Codes der OP-Berichte bei maximaler Präzision.

Material und Methoden: Als Projektpartner konnten das ETHIANUM Klinikum Heidelberg und das Deutsche Mikrofilm Institut (DMI) gewonnen werden. Für die Entwicklung und Evaluation der Algorithmen wurden vom ETHIANUM Klinikum 200 anonymisierte OP-Berichte aus den Fachabteilungen Ästhetische und plastisch-rekonstruktive Chirurgie sowie Handchirurgie, Sportorthopädie und Wirbelsäulenchirurgie zur Verfügung gestellt. Neben den Texten wurde zusätzlich für jedes Dokument die Menge der abgerechneten ICD- und OPS-Codes hinterlegt. Die Anzahl der ICD-Codes besteht pro Dokument aus einer Hauptdiagnose mit bis zu drei Nebendiagnosen, die Anzahl der Prozeduren schwankt je nach Dokument zwischen einem und zwanzig OPS-Codes. In einer separaten Studie durch das DMI wurden die Ergebnisse der automatischen Extraktion von ausgebildeten MD und MDA evaluiert.

Der Ausgangspunkt für die entwickelten Methoden sind bestehende Verfahren zur Informationsextraktion aus medizinischen Freitexten [2], [3]. Zunächst durchläuft jedes Textdokument eine Reihe computerlinguistischer Verarbeitungsschritte wie u.a. Abschnitts- und Überschriftenerkennung, Satzzerlegung, Rechtschreibkorrektur, morphologische Dekomposition und syntaktische Analyse. Als abschließender Teil der Vorverarbeitung erfolgt die semantische Aufbereitung durch Abbildung auf terminologische Konzepte unter Verwendung der Wingert-Nomenklatur [4]. Die Wingert-Nomenklatur ist multi-axial und umfasst die Achsen Topographie, Morphologie, Funktion, Verfahren, Diagnose und Wirkstoff. Die Abstraktionsebene der terminologischen Konzepte ermöglicht bei der Entwicklung die saubere Trennung von inhaltlicher Spezifikation der zu extrahierenden Informationen durch medizinische Experten und die Implementierung generischer Algorithmen durch IT-Spezialisten.

Im Rahmen einer Vorstudie wurde der bestehende Algorithmus geprüft, um mögliche Fehlerklassen zu identifizieren. Im ersten Durchgang enthielten die OP-Berichte weder die übliche Überschrift mit Erwähnung der Hauptprozedur, noch die Indikation. Die Auswertung zeigte, dass einzelne Textpassagen der OP-Berichte ohne Eingrenzung des prozeduralen Fachgebiets sich häufig nicht konzentriert auf die gewünschten Zielbereiche der OPS Klassifikation abbilden ließen. Zusätzlich erwiesen sich einzelne Bestandteile von Verfahren als irrelevant für die Abrechnung, obwohl diese wiederum für Operationen aus anderen Fachbereichen bzw. Indikationen verschlüsselt werden müssten. Ein ausschlaggebender Faktor ist die Diskursstruktur von OP-Berichten. Während in Arztbriefen die Informationen innerhalb eines Abschnitts und für untergeordnete Sätze und Teilsätze in einem ausreichenden Umfang verdichtet vorliegen, so dass sich relevante Teilphrasen in der Regel direkt auf die terminalen Codebereiche abbilden lassen, erfordern OP-Berichte eine diskursanalytische Betrachtung, um satz- und abschnittsübergreifende Zusammenhänge zwischen Entitäten und Ereignissen (z.B. zwischen Schrauben-Stabsystem und dem dazugehörigem Verfahren) herzustellen. Weiterhin kann es trotz einer umfangreichen terminologischen Abdeckung dazu kommen, dass nicht erfasste Vokabeln wie z.B. Firmennamen spezieller Behandlungswerkzeuge und Materialien durch Korrekturmechanismen fälschlicherweise als andere Begriffe der Terminologie interpretiert werden.

Zur Weiterentwicklung der bestehenden Algorithmen wurden im weiteren Verlauf allgemeine und fachspezifische diskursstrukturelle Eigenschaften von OP-Berichten genauer spezifiziert, um abschnittübergreifende Zusammenhänge geordnet erfassen zu können. Die Spezifikation erfolgte durch manuelle Erstellung von Richtlinien durch Linguisten und Mediziner. Parallel dazu wurden relevante Teile der OPS-Klassifikation unter Einsatz der Wingert-Nomenklatur [4] automatisch dekomponiert, um den Suchraum für die jeweiligen Fachbereiche besser einzugrenzen.

Ergebnisse: Um die Güte des Verfahrens zu bestimmen, wurden im Rahmen des Projekts zwei unabhängig voneinander publizierte Strategien zur Evaluation verfolgt. Innerhalb dieser Veröffentlichung erfolgt eine Evaluation der ermittelten OPS-Codes gegenüber den im Datensatz überlieferten Codes anhand einer Konfusionsmatrix und den Gütemerkmalen Genauigkeit (Precision), Trefferquote (Recall) und F-Maß (gewichtetes harmonisches Mittel von Precision und Recall). Als Baseline werden die Evaluationsergebnisse verwendet, die im Rahmen der beschriebenen Vorstudie zu Beginn des Projekts ermittelt wurden. Unsere Ergebnisse zeigen, dass sich unter Berücksichtigung allgemeiner und fachbereichsspezifischer Diskursstruktur und Codierrichtlinien sowie semantischer Dekomposition der Klassifikation die Genauigkeit und Trefferquote bei der automatischen Ermittlung von OPS-Codes im signifikanten Ausmaß steigern lassen.

Der zweite Teil der Evaluation konzentriert sich auf den monetären Aspekt des Verfahrens und erfolgt durch die Kooperationspartner DMI und ETHIANUM. Die Ergebnisse werden in einer separaten Studie veröffentlicht.

Diskussion: Die automatische Extraktion von OPS-Codes aus OP-Berichten erweist sich unter vielen unabhängigen Aspekten als große Herausforderung. Neben allgemeinen textlinguistischen Herausforderungen wie domänenspezifischer Auflösung von semantischen Mehrdeutigkeiten von Begriffen und Abkürzungen, Erkennung formelhafter Ausdrücke und Rechtschreibfehler, stellt die streng lineare Erfassung einzelner Schritte innerhalb von OP-Berichten besondere Anforderungen an die automatische Textanalyse dar. In diesem Beitrag präsentieren wir einen dynamischen Ansatz, welcher diskursspezifische Aspekte berücksichtigt und sich mit vertretbarem personellen Aufwand auf weitere Domänen übertragen lässt, so dass in den OP-Berichten enthaltene Informationen zielgerichtet zusammengefasst und korrekt interpretiert werden können.


Literatur

1.
Eickhoff F, Faulstich L, Irsig K, Kolter T, Conrad P. Automatische Codierung zusatzentgeltrelevanter Leistungen aus klinischen Freitexten. In: GMDS 2013. 58. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Lübeck, 01.-05.09.2013. Düsseldorf: German Medical Science GMS Publishing House; 2013. DocAbstr.137. DOI: 10.3205/13gmds234 External link
2.
Denecke K, Kohlhof I. Informationsextraktion aus medizinischen Texten basierend auf einer multiaxialen Indexierung. In: Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (gmds). 51. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Leipzig, 10.-14.09.2006. Düsseldorf, Köln: German Medical Science; 2006. Doc06gmds060. Verfügbar unter: http://www.egms.de/en/meetings/gmds2006/06gmds274.shtml External link
3.
Faulstich LC, Müller F, Sander A. Automatisierte Klinische Dokumentation aus Elektronischen Dokumenten. In: Kooperative Versorgung - Vernetzte Forschung - Ubiquitäre Information. 49. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 19. Jahrestagung der Schweizerischen Gesellschaft für Medizinische Informatik (SGMI) und Jahrestagung 2004 des Arbeitskreises Medizinische Informatik (ÖAKMI) der Österreichischen Computer Gesellschaft (OCG) und der Österreichischen Gesellschaft für Biomedizinische Technik (ÖGBMT). Innsbruck, 26.-30.09.2004. Düsseldorf, Köln: German Medical Science; 2004. Doc04gmds326. Verfügbar unter: http://www.egms.de/en/meetings/gmds2004/04gmds326.shtml External link
4.
Wingert F. SNOMED. Systematisierte Nomenklatur der Medizin. Hrsg. der amerikanischen Ausgabe R. A. Côté. Deutsche Ausgabe bearbeitet und adaptiert von F. Wingert. Berlin, Heidelberg, New York, etc.: Springer; 1984.