gms | German Medical Science

49. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
19. Jahrestagung der Schweizerischen Gesellschaft für Medizinische Informatik (SGMI)
Jahrestagung 2004 des Arbeitskreises Medizinische Informatik (ÖAKMI)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Schweizerische Gesellschaft für Medizinische Informatik (SGMI)

26. bis 30.09.2004, Innsbruck/Tirol

Optimierung der Recherchierbarkeit multimedialer Archive durch die semantischen Informationen des UMLS

Meeting Abstract (gmds2004)

  • corresponding author presenting/speaker Thomas Frankewitsch - Universität Erlangen-Nürnberg, Erlangen, Deutschland
  • Thomas Ganslandt - Universität Erlangen-Nürnberg, Erlangen, Deutschland
  • Marcel Müller - Universität Freiburg, Freiburg, Deutschland
  • Hans Ulrich Prokosch - Universität Erlangen-Nürnberg, Erlangen, Deutschland

Kooperative Versorgung - Vernetzte Forschung - Ubiquitäre Information. 49. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 19. Jahrestagung der Schweizerischen Gesellschaft für Medizinische Informatik (SGMI) und Jahrestagung 2004 des Arbeitskreises Medizinische Informatik (ÖAKMI) der Österreichischen Computer Gesellschaft (OCG) und der Österreichischen Gesellschaft für Biomedizinische Technik (ÖGBMT). Innsbruck, 26.-30.09.2004. Düsseldorf, Köln: German Medical Science; 2004. Doc04gmds064

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2004/04gmds064.shtml

Veröffentlicht: 14. September 2004

© 2004 Frankewitsch et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung

In vielen nicht-radiologischen Abteilungen der Kliniken werden Bildaufnahmen zur Ergänzung der Krankenakte, als Demonstrationsbeispiele für den Unterricht oder zu Publikationszwecken durchgeführt. Auch die „Klinik und Poliklinik für Kinderheilkunde, Allgemeine Kinderheilkunde der Universität Münster" dokumentiert seit vielen Jahrzehnten interessante Fälle. Diese Bilder werden entweder in den abteilungsspezifischen Archiven der Professoren und Oberärzte gesammelt oder innerhalb der Krankenakten abgelegt.

Aus dem ersten Dia-Archiv wurden ca. 10.000 Bilder ausgewählt und digitalisiert. Weitere stehen zur Bearbeitung an. Diese Bilder sollen die Lehre und Ausbildung der Fachärzte unterstützen und ggf. als Referenzmaterial bei problematischen Fällen genutzt werden.

Jede Datensammlung und so auch eine Diathek ist nur solange wert- und sinnvoll, wie die gespeicherten Elemente auch wieder gefunden und weiter verwendet werden können. Dies gilt sowohl für herkömmliche als auch erst recht für digitale Archive und insbesondere dann, wenn die Dokumente nonverbal, also bildhaft, sind.

In der Regel werden diese Bilddokumente verschlagwortet und damit in den verbalen Informationsraum projiziert. Dabei gibt es mehrere inhaltliche Problemstellen:

• Die ‚richtige' Grundmenge an Worten muss definiert werden.

• Das Bilddokument muss möglichst vollständig beschrieben werden.

• Ein Bild muss auch abteilungs- und fachübergreifend zu finden sein.

Methoden

Als ein hinreichend brauchbares Grundvokabular wurde der ICD10-Katalog (International Classification of Diseases) ermittelt. Dieser Wortschatz dient in Deutschland der Klassifikation von Behandlungsfällen zu Abrechnungszwecken und wird daher täglich für jeden Patienten angewendet. Der Katalog ist dem medizinischem Personal vertraut, relativ einfach strukturiert und mit aktueller Hilfssoftware (ID DIACOS® oder KODIP®) leicht handhabbar [1].

Der entscheidende Punkt besteht darin, dass der ICD10 Teil des „Unified Medical Language Systems" (UMLS) ist. Damit ist der ICD10 in eine globale Wortschatzsammlung von derzeit 975.354 Begriffen eingebunden, die in einem unvollständigem, aber doch sehr großem, semantischen Netzwerk angeordnet sind [2].

Mit dem anwendungsspezifischen Vorwissen, dass der ICD10 eigentlich nur Diagnosen beschreibt, kann nun die Lokalisation des verschlagworteten Begriffs innerhalb der Begriffswelt des UMLS durchgeführt werden:

Dazu werden die kürzesten Wege zwischen dem allgemeinen Begriff „Diagnose" und dem jeweiligen Schlagwort aus dem ICD10 gebildet. Da im UMLS „Diagnose" mehrfach mit geringgradigen Intentionsnuancen erfasst ist, wurden folgende Begriffe als Wurzel definiert: "C0011900 Diagnosis", "C0012674 Diseases (MeSH Category)", "C0338067 DISEASES/DIAGNOSES", "C0868947 Diseases and defects", "C0872314 disease/disorder model", und "C0497531 Diagnosis / Diseases Component".

Diese Begriffe wurden von den Autoren der verschiedenen Quellthesauren rekursiv zu anderen Begriffen in Relationen gesetzt. Damit sollte es möglich sein, einen Weg vom Wurzelknoten mit dem abstrakten Begriff „Diagnose" zum gesuchten Diagnosenbegriff (aus dem ICD10) zu finden, wenn man sich auf ein Grundset an gerichteten Relationen beschränkt, wie „ist ein", „ist Teil von", „ist Kind von" etc.

Der kürzeste Weg definiert die logische Position eines gesuchten Begriffes in der Hierarchie der Bedeutungen und bildet einen Graphen aus Knoten (den Begriffen) und Kanten (den Relationen). Die überlagerte Summe aller Graphen bildet eine Baumstruktur mit teilweise sich aufspaltenden und wieder vereinigenden Ästen. Ausgehend vom Allgemeinen (der Wurzel „Diagnose") werden diese immer spezieller.

Ergebnisse

Betrachtet man den gesamten ICD10 Katalog, so findet man für 11.930 der insgesamt 12.289 ICD10-Diagnosen einen Graphen, der seinen Ursprung in einem der abstrakten Diagnosenbegriffe hat. Das entspricht einer Zuordnung von 97%. Probleme treten auf bei Diagnosen, die im eigentlichen Sinne keine sind: z.B. "(Z50.9) Rehabilitationsmaßnahme", "(Z00.8) Allgemeine Untersuchung".

Für die ausgewählten Bilder der Kinderklinik wurden etwa 600 unterschiedliche Diagnoseneinträge verwendet, d.h. ca. 5% aller möglichen Kodierungen. Für alle gültigen ICD10-Codes konnte ein entsprechender Graph dargestellt werden. Dabei stellte man auch Fehlverschlüsselungen fest, bei denen aus Versehen keine Diagnose, sondern eine Lokalisation im Datensatzfeld erfasst worden war.

Damit ist die automatisierbare Navigation vom allgemeinen Ausdruck zum speziellen hin durchführbar, wobei mehrere Möglichkeiten gefunden werden können (siehe [Abb. 1]. Die Information über die anatomische Lokalisation ist in dieser Abbildung nicht dargestellt.) Die Hierarchie des ICD-10-SGBV 2.0 fällt wesentlich flacher und vor allem monohierarchisch aus:

• Bösartige Neubildungen der Harnorgane

• • C64 Bösartige Neubildung der Niere, ausgenommen Nierenbecken = (Nephroblastom o.n.A.)

Mithilfe der UMLS-Einbindung kann nun das Nephroblastom auch gefunden werden, wenn der Suchende sich über maligne mesenchymale Tumore informieren will, unabhängig von der Lokalisation.

Diskussion

Zum UMLS-Projekt finden sich im deutschsprachigen Raum noch kaum Anwendungen. Allerdings bietet das UMLS auch für den deutschen Sprachraum die nicht zu unterschätzende Möglichkeit, auf einen Thesaurus und gleichzeitig auf ein semantisches Netzwerk zugreifen zu können: Wichtige Grundvokabulare wie der MeSH oder die ICD-Familie wurden durch das DIMDI bereits integriert [3].

Die Verwendung des ICD10 zur Verschlagwortung multimedialer Dateien übersteigt unter dem Kontext des UMLS bei weitem die Optionen des ursprünglichen Vokabulars. Der ICD10 gewinnt damit auch in der deutschen Version reichhaltige Umgebungsinformationen, die sinnvoll ausgewertet werden können:

Erst durch die ICD10-fremden, aber verknüpften Wissensinhalte ist bei sachgemäßer Indizierung eine übergeordnete Suche durchführbar. Trotz der primären Verwendung eines limitierten Wortschatzes kann eine unscharfe und damit auch fachübergreifende Recherche implementiert werden. Der UMLS bietet sich an, auch die weiteren Informationselemente eines multimedialen Element zu kodieren, wie z.B. betroffene Organsysteme, anatomische Daten, Untersuchungsverfahren etc. Da eine größere Anzahl an Begriffen aus den verschiedenen Quellen zur Verfügung steht, sind auch diese Sachverhalte exakter definierbar. Zudem sind all diese Konzepte in einem semantischen Netz aufgespannt, und es ist dann möglich, komplexe kombinierte unscharfe Suchen zu realisieren, ohne dass diese explizit definiert werden müssen (z.B. Infektion UND Atemwegssystem UND Radiologie).


Literatur

1.
Graubner B, Brenner G. German adaptations of ICD-10. Stud Health Technol Inform 1999; 68: 912-917
2.
UMLS Fact Sheets. http://www.nlm.nih.gov/pubs/factsheets/umlsmeta.html. zuletzt besucht 03/2004
3.
Deutsche ICD 10. Revision, Version 2.0[SGB V]. DIMDI. http://www.dimdi.de. zuletzt besucht 03/2004