Artikel
Automatische Codierung zusatzentgeltrelevanter Leistungen aus klinischen Freitexten
Suche in Medline nach
Autoren
Veröffentlicht: | 27. August 2013 |
---|
Gliederung
Text
Einleitung und Fragestellung: Medizinische Dokumente wie Arztbriefe und Befundschreiben sind bei der Behandlung eines Patienten zweifellos eine wichtige Informationsquelle. Abrechnungsrelevante Angaben (Diagnosen, Prozeduren, Laborwerte, Medikamente) werden oft primär in Textform dokumentiert und müssen von den medizinischen Codierfachkräften erkannt und codiert werden. Am Beispiel von Zusatzentgelten (ZE), die gerade auf Ebene der einzelnen Krankenhäuser eine "größere und existenzsichernde Bedeutung" [1] erlangen können, zeigen wir, wie der Codierprozess durch das automatische Generieren von Code-Vorschlägen unterstützt werden kann. Dazu wird ein Verfahren zur automatischen Informationsextraktion aus medizinischen Freitexten erweitert und evaluiert.
Material und Methoden: Wir untersuchten eine Menge von ca. 210 codierten Behandlungsfällen mit dazugehörigen anonymisierten Entlassschreiben, die uns durch das Medizincontrolling des Klinikum Itzehoe zur Verfügung gestellt wurden. Neben dem Arztbrief im Word-Format sind zu jedem Fall die Haupt- und Nebendiagnosen als ICD-Schlüssel (ICD10-GM 2011) sowie die Prozeduren als OPS (Version 2011) hinterlegt. Anhand des OPS wurden alle ZE-relevanten Leistungen gesondert markiert. Das automatische Codieren von Fällen anhand von Arztbriefen erfordert i.d.R. viele Verarbeitungsschritte [2], [3]. Der in diesem Beitrag verwendete Algorithmus basiert auf bestehenden Informationsextraktionsmethoden [3], [4], bei denen jedes normalisierte Wort verschlagwortet, d.h. einem oder mehreren Konzepten in einer Terminologie zugeordnet wird. Wir verwenden die Wingert-Nomenklatur [5], welche u.a. entlang der Achsen Topographie, Morphologie, Funktion, Verfahren, Diagnose und Wirkstoff ausgeprägt ist. Für die Codierung wird jeder Satz(abschnitt) daraufhin geprüft, ob ihm Diagnose- oder Prozeduren-relevante Konzepte zugeordnet sind (entsprechend den Achsen in der Nomenklatur). Ist dies der Fall, wird nach Texten aus dem ICD bzw. OPS-Katalog gesucht, die eine hohe semantische Ähnlichkeit zu dem Eingabetext haben. Für alle ZE-relevanten OPS wurde anhand des Fallpauschalenkataloges [6] ein gesonderter Katalog erstellt, in dem inhaltlich zusammengehörige Codes unter einem Text zusammengefasst sind. Die ähnlichsten Katalogtexte werden jeweils als Codiervorschläge hinterlegt.
Ergebnisse: Um die Güte der automatischen Codierung zu bestimmen, vergleichen wir die automatisch ermittelten Codes mit den im Datensatz enthaltenen Referenzcodes und berechnen die Konfusionsmatrix. Anhand der Matrix lassen sich die Gütemerkmale Genauigkeit, Sensitivität und F-Maß bestimmen. Die Evaluation erfolgt getrennt nach ICD, OPS, und OPS-ZE Codes. Die ersten Ergebnisse auf einem Teil der zur Verfügung stehenden Falldaten zeigen, dass durch die Fokussierung auf bestimmte Merkmale wie ZE-relevante Leistungen deutlich bessere Resultate erzielt werden können als bei der Extraktion exakter ICD- und OPS-Codes [4]. Für das Erkennen von ZE-relevanten OPS erzielt unser Codiersystem derzeit einen Wert von 0.75 F-Maß. Weitere Ergebnisse auf neuen, noch unbekannten Falldaten werden demnächst zur Verfügung stehen. Des Weiteren wird eine kostenbasierte Evaluation durchgeführt, um den finanziellen Mehraufwand automatisch gefundener, aber nicht abgerechneter ZE zu bewerten und den praktische Nutzen unseres Ansatzes besser abschätzen zu können.
Diskussion: Die Extraktion von Codes aus Arztbriefen ist schwierig, da domänenspezifische Begriffe, Verkürzungen, formelhafte Ausdrücke und Rechtschreibfehler berücksichtigt werden müssen, die in narrativen klinischen Texten typischerweise auftreten. In diesem Beitrag präsentieren wir einen Ansatz, der ein automatisches Codieren anhand von Arztbriefen aus beliebigen Fachabteilungen eines Krankenhauses unterstützt. Die Evaluation zeigt, dass unser Ansatz vor allem solche Codes gut erkennt, die einen hohen Einfluss auf die Fall-DRG haben und daher für das Krankenhaus von besonderem Interesse sind.
Literatur
- 1.
- Klauber J, Robra BP, Schellschmidt H, Hrsg. Krankenhaus-Report 2007; Schwerpunkt: Krankenhausvergütung - Ende der Konvergenzphase? Schattauer (Stuttgart / New York); 2008.
- 2.
- Meystre SM, Savova GK, Kipper-Schuler KC, Hurdle JF. Extracting information from textual documents in the electronic health record: a review of recent research. Yearb Med Inform. 2008:128-144.
- 3.
- Denecke K, Kohlhof I. Informationsextraktion aus medizinischen Texten basierend auf einer multiaxialen Indexierung. In: 51. GMDS-Jahrestagung, Leipzig, 10.-14.09.2006.
- 4.
- Faulstich LC, Müller F, Sander A. Automatisierte Klinische Dokumentation aus Elektronischen Dokumenten. In: 55. GMDS-Jahrestagung, Mannheim, 05.-09.09.2010.
- 5.
- Wingert F. SNOMED. Systematisierte Nomenklatur der Medizin. Hrsg. der amerikanischen Ausgabe R. A. Côté. Deutsche Ausgabe bearbeitet und adaptiert von F. Wingert. Berlin, Heidelberg, New York etc.: Springer. 1984.
- 6.
- Fallpauschalenkatalog 2011, Institut für das Entgeltsystem im Krankenhaus (InEK), http://www.g-drg.de