gms | German Medical Science

50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie (dae)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Deutsche Arbeitsgemeinschaft für Epidemiologie

12. bis 15.09.2005, Freiburg im Breisgau

Kompositionalität in Begriffsmolekülen

Meeting Abstract

Suche in Medline nach

  • Hans Rudolf Straub - Semfinder AG, Kreuzlingen
  • Norbert Frei - Fachhochschule St. Gallen, St. Gallen
  • Csaba Perger - Semfinder AG, Kreuzlingen
  • Annette Ulrich - Semfinder AG, Kreuzlingen

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Deutsche Arbeitsgemeinschaft für Epidemiologie. 50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie. Freiburg im Breisgau, 12.-15.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05gmds353

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2005/05gmds363.shtml

Veröffentlicht: 8. September 2005

© 2005 Straub et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Automatisierte Diagnosekodierung (Herausforderungen)

Die voll automatisierte Diagnosekodierung (One-Step-Coding) steht vor mehreren Herausforderungen:
a) Eine Vielfalt von ärztlichen Diagnoseformulierungen muss erkannt werden (kombinatorische Explosion).
b) Medizinische Wörter enthalten implizite Informationen (Radius → Unterarm, Knochen).
c) Eine Anordnung der Diagnosen in Hierarchien (analog zu den Systematiken in Zoologie und Botanik) wäre wünschenswert, führt aber zu Widersprüchen.
d) Eine Systematik mit mehreren Achsen (Multidimensionalität) verbessert die Situation, löst aber die Probleme der Begriffsanordnung nicht vollständig.
e) Die Systematik der ICD-10 enthält umfangreiche explizite und implizite Kodierregeln (Inklusiva, Exklusiva usw.), zu denen die Deutschen Kodierrichtlinien hinzukommen. Ein Kodierautomatismus muss diese Regeln berücksichtigen.
f) Sowohl die Kodierwerke (ICD-10, OPS) wie die Deutschen Kodierrichtlinien werden jährlich erneuert. Das Regelwerk für die automatisierte Kodierung muss diese Änderungen nachvollziehen können (Wartbarkeit).

Verknüpfung der Begriffsachsen

Die kombinatorische Explosion erfordert zwingend ein System mit mehreren Achsen (Hierarchien). Wieviele Achsen sind nötig? Für die informatische Potenz ist es vorteilhaft, möglichst viele Achsen (Freiheitsgrade) zu öffnen. Zu viele Achsen machen das System aber unhandlich und in letzter Konsequenz unwartbar. Durch eine strukturierte Architektur der Achsen (Multifokalität) ist es möglich, die Achsenzahl beliebig gross werden zu lassen, ohne die Übersicht zu verlieren.

Kompositionalität innerhalb der hierarchischen Kette

Unterbegriffe erben die Eigenschaften von Oberbegriffen. Medizinische Begriffe können (wie alle Begriffe) mehrere Generationen von Oberbegriffen implizieren (Beispiel: Bronchial-Ca → Karzinom → Malignom → Neubildung → Diagnose). Es erweist sich als sinnvoll, in einer derartigen Kette alle Glieder explizit in der internen Darstellung aufzuführen, um bei der Verarbeitung auf jedes Glied gezielt zugreifen zu können.

Kompositionalität zwischen den Hierarchien

Während Hierarchieketten in Begriffsmolekülen prinzipiell horizontal dargestellt werden (Beispiel in Abbildung 1 [Abb. 1]: Diagnose – Entzündung – Zystitis), werden extrahierarchische Begriffsverbindungen als Verknüpfung in der Vertikalen gezeigt (Beispiele: Diagnose–Lokalisation, Diagnose–Erreger, Entzündung–infektiös, usw.).

Durch dieser Anordnung wird die multifokale Achsenarchitektur deutlich erkennbar: Alle Begriffe der gleichen Achse (Dimension) ordnen sich horizontal, während eine neue Zeile eine neue Dimension bedeutet. Die in der Bildschirmdarstellung nach unten verknüpfenden Begriffe sind mit den Verknüpfungspunkten der Achsen der multifokalen Architektur identisch. Siehe Beispiel in Abbildung 1 [Abb. 1]: Bakterium als Glied in der Hierarchiekette Erreger ist der Ausgangspunkt (Fokus) von drei neuen Achsen, deren erste das Verhalten in der Gramfärbung bezeichnet.

Die vertikalen Verknüpfungen entsprechen attributiven Relationen. Die Begriffsmoleküle verzichten im Gegensatz zu anderen Konzeptdarstellung, z.B. der Conceptual Graphs nach J.F. Sowa [1], auf eine Benennung der Relationen. Der Vorteil dieser Darstellung liegt in der Einfachheit und Kompaktheit bei erhaltener Aussagekraft und Modellierbarkeit.

Kompositionalität in Diagnosen (Status) und Regeln (Dynamik)

In Abbildung 1 [Abb. 1] ist ein Begriffsmolekül dargestellt, das eine Diagnose, d.h. einen Zustand (Status) darstellt. Um die Texteingaben inhaltlich zu interpretieren, die impliziten Inhalte aufzubauen und die Diagnosen am Schluss zu kodieren, sind dynamische Elemente nötig, d.h. Regeln, die von uns ebenfalls als Begriffsmoleküle notiert werden. Dies hat zwei Vorteile: Einerseits können mit Begriffsmolekülen komplexe Bedingungen (IFs) semantisch präzis formuliert werden und deshalb die Regeln auch in komplizierten Situationen (Ausnahmen usw.) sehr zielgenau gebaut werden, andererseits ermöglicht es die Kompositionalität der Statusdarstellung, gezielt einen bestimmten atomaren Teilinhalt der Diagnose abzufragen, der in einer weniger kompositen Darstellung nicht sicher greifbar wäre. Dadurch kann die Zahl der Regeln vermindert werden. Durch die Übersichtlichkeit der Darstellung wird die Wartung wirksam erleichtert.

Resultate

Durch eine konsequent komposite Begriffsdarstellung kann mit Begriffsmolekülen die Anzahl der atomaren Begriffe reduziert werden. So ist "E.coli-Zystitis" (Abbildung 1 [Abb. 1]) kein eigener Begriff (Atom), sondern wird als eine Kombination von vielen, meist implizierten Begriffen repräsentiert. Dabei werden die Achsen (d.h. Hierarchien, bzw. Freiheitsgrade) nicht unstrukturiert nebeneinander gesetzt, sondern das Verknüpfungsmuster der Achsen ist selber ein Bestandteil der Begriffsdarstellung (Multifokalität). Auf diese Weise kann mit einer kleinen Zahl von atomaren Begriffen und Regeln der semantische Inhalt der ärztlichen Diagnosen detailliert und klar strukturiert dargestellt werden. Das so entstandene Kodiersystem wird in Krankenhäusern eingesetzt.


Literatur

1.
Sowa JF: Knowledge Representation - Logical, Philosophical and Computational Foundations. Pacific Grove: Brooks/Cole, 2000
2.
Straub HR: Das interpretierende System - Diagnosekodierung und Begriffsrepräsentation in Mensch und Maschine. Wolfertswil: Z/I/M-Verlag, 2001
3.
Straub HR: Four Different Types of Classification Models. In: Grütter R, Hrsg. Knowledge Media in Health Care: Opportunities and Challenges. Herskey / London: Idea Publishing Group, 2002: 58 - 82