gms | German Medical Science

50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie (dae)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Deutsche Arbeitsgemeinschaft für Epidemiologie

12. bis 15.09.2005, Freiburg im Breisgau

Standardisierte Terminologien in der Medizin zwischen Begriffssemantik und Anwendungspragmatik

Meeting Abstract

Search Medline for

  • Josef Ingenerf - Universität zu Lübeck, Lübeck

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Deutsche Arbeitsgemeinschaft für Epidemiologie. 50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie. Freiburg im Breisgau, 12.-15.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05gmds435

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/meetings/gmds2005/05gmds425.shtml

Published: September 8, 2005

© 2005 Ingenerf.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung und Fragestellung

Der Einsatz standardisierter Terminologien rückt zunehmend in den Blickpunkt verschiedenster Anwendungsfelder. Die Beschäftigung mit dem Thema wird bekanntlich erschwert durch eine äußerst problematische Meta-Terminologie. Unscharf verwendete Fachtermini wie „Klassifikation“, „Nomenklatur“, „Thesaurus“, „Ontologie“ oder „kontrolliertes Vokabular“ behindern die Fachdiskussion. Damit zusammenhängend führen sie zu fundamentalen Missverständnissen.

In diesem Beitrag wird eine Typisierung von Ordnungssystemen vorgestellt. Es erscheint dringend notwendig, begriffsorientierte Terminologien (Begriffssysteme im engeren Sinne) von anwendungsorientierten Systematiken zu unterscheiden. Letztere sind eben nicht primär begriffsorientiert. Sie aggregieren und ordnen Sachverhalte zweckorientiert nach pragmatischen Gesichtspunkten.

Diese Differenzierung ist vor allem deshalb bedeutsam, weil sich das Gebiet logisch definierter Ontologien zunehmend in der Informatik etabliert, insbesondere im Zusammenhang mit dem „Semantic Web“. Die so verstandenen Ontologien erfüllen eine Reihe erwünschter formaler Kriterien. Traditionelle Ansätze werden zunehmend in Frage gestellt oder sind zumindest formallogisch zu rekonstruieren. Dieser Trend verkennt jedoch die Pragmatik der anwendungsorientierten Ansätze. Deren Berücksichtigung in Ontologien würde gerade eine Verletzung der gewünschten formalen Kriterien eines Logikkalküls verursachen.

Hintergrund

Trotz diverser ISO-Definitionen werden verschiedene Ansätze standardisierter Terminologien oder begrifflicher Ordnungssysteme äußerst heterogen benannt und verwendet. Die Benennungsproblematik steht nicht im Vordergrund dieses Vortrags. Sie kann in einem zweiten Schritt betrachtet werden. Aus praktischer Sicht haben Klassifikationen und Thesauren etwa in den (medizinischen) Dokumentations- und Bibliothekswissenschaften eine sehr lange Tradition. Es gibt recht klare Vorstellungen über ihre Strukturmerkmale. Im Wesentlichen zwei Entwicklungen haben die Situation verändert: erstens der Einsatz des Rechners und der Bedarf an rechnerinterpretierbaren Beschreibungen. Zweitens das Ziel einer maximalen, automatisierten Wiederverwendbarkeit einmal erfasster Primärdaten.

Parallel wurden in der Informatik Ansätze wie „Topic Maps“ und „Beschreibungslogiken“ zur Repräsentation von so genannten Ontologien entwickelt. Die Dynamik dieser Entwicklung resultiert aus Notwendigkeiten im Zusammenhang mit dem Semantic Web und der semantischen Integration von Informationssystemen. Allerdings stellt sich sie Akquisition der zu repräsentierenden Inhalte als schwierig heraus, so dass oft existierende, traditionelle Ansätze als „ontologische“ Kandidaten herangezogen werden. Als Beispiel sei die versuchte Rekonstruktion des MeSH-Thesaurus in OWL (Ontology Web Language) genannt [7]. Der W3C-Standard „OWL“ basiert auf Beschreibungslogiken und ergänzt Meta-Beschreibungssprachen wie RDF (Resource Description Language) zur Annotierung von Web-Seiten.

Andererseits werden Klassifikationen wie die ICD aufgrund ihrer Mängel kritisiert. Formallogische Ontologien wie SNOMED CT gelten als adäquatere Terminologien zur Primärdokumentation, die eine flexible Aggregration bis hin zur Ansteuerung von DRGs ermöglichen. Allenfalls als sekundäres Aggregations-Instrument akzeptiert, wird ein Mapping von SNOMED CT auf ICD bereitgestellt [3].

Vorschlag einer Einteilung von Ordnungssystemen

Die in der Tab. 1 [Tab. 1] definierten Ordnungssystemtypen decken mit den genannten Beispielen die üblichen Ansätze in der medizinischen Anwendung ab. Zur Einteilung werden folgende Kriterien verwendet:

  • Identifikation von Begriffen, Klassen oder Themen und Benennungsvarianten
  • Präkoordination (monoaxial), Postkoordination (multiaxial oder formal)
  • Hierarchisierung (monohierarchisch, polyhierarchisch)
    beachte: Begriffssysteme im engeren Sinne sind inhärent polyhierarchisch.
  • Fokus auf Begriffssemantik oder Anwendungspragmatik zur Etablierung eines Ordnungssystems. Die Frage nach dem Grund einer (hierarchischen) Relationierung von Begriffen, Klassen oder Themen verlangt verschiedene Antworten.

Die Angabe von drei Generationen aus den neunziger Jahren wurde ergänzt [5]. Die fett gedruckten Typen von Ordnungssystemen stehen im Mittelpunkt des Vortrags.

Nur bei den Typen 1a), 2a) und 3) handelt es sich um Begriffssysteme im engeren Sinne. Es geht in verschiedener Perfektion um die Rekonstruktion von Begriffssemantik, d.h. terminologische Standardisierung auf möglichst granulärer Ebene. Die algorithmischen Vorteile z.B. für eine kompositionelle Begriffsanalyse korrelieren geradezu mit ihrer Zweck-Neutralität. Diese Neutralität wiederum ist Voraussetzung für eine Wiederverwendung etwa von SNOMED CT-kodierten Sachverhalten.

Bei den Typen 1b) und 2b) sowie 1c) handelt es sich streng genommen nicht um Begriffssysteme, da die Begriffsbedeutungen nur mittelbar eingehen in die Definition von Themen (1b, 2b) und Klassen (1c). Deren Gebrauch wird für die jeweiligen Verwendungszwecke durch Regelwerke gesteuert. Die Semantik lässt sich nicht durch kompositionelle Analysen bestimmen. Entscheidend ist die Beobachtung, dass Themen und Klassen gezielte Aggregationen bereitstellen, deren Bedeutung man mit einem Begriffssystem vom Typ 2a) und 3) rekonstruieren kann. Genau dieses geschieht, indem neben der Systematik der ICD-10 ein Alphabet bereitgestellt wird. Die den Klassen zugeordneten alphabetischen „Begriffe“ lassen sich zunächst zur verbesserten Kommunikation identifizieren, siehe Alpha-ID in [1]. Sie lassen sich weiterhin mit formalen Begriffsystemen „unterhalb der Klassenebene“ kodieren [4]. Ein analoges Vorgehen kann auf Thesauren angewendet werden bzw. wurde bereits beim MeSH-Thesaurus angewendet [6]. Unterstützte Abbildungen (Mappings) zwischen anwendungsorientierten und begriffsorientierten Systemen bedeuten aber nicht, dass die Typen 1c) und 2b) etwa durch SNOMED CT ersetzt werden können.

Diskussion

Im Vortrag wird auf weitere Eigenschaften und Konsequenzen eingegangen, die sich aus der Einteilung in Tab. 1 [Tab. 1] ableiten lassen, z.B. mit Bezug auf [2]. Es ist geplant, ausgehend von diesem Vorschlag einen breiteren Konsens in der GMDS-Projektgruppe „Standardisierte Terminologien in der Medizin“ zu erzielen. Eine solche Grundlage erscheint als Ausgangspunkt für die inhaltliche Arbeit der Gruppe als erstrebenswert [1], siehe http://www.imi.uni-luebeck.de/gmds-ag-stm/.


Literatur

1.
Ingenerf, J., Mulder-Rathgeber, A., Graubner, B. (2005). Diagnosen- und Prozedurendokumentation für Zwecke von DRGs, Qualitätsmanagement und Gesundheitstelematik. In: H. Handels, et al. (eds.). KIS-Jahrestagung, Hamburg, 2-4. März 2005. Norderstedt: Books on Demand, 103-112.
2.
ISO/TS 17117 (2002). Health informatics - Controlled health vocabularies - Vocabulary structure and high-level indicators. "Technical Specification", siehe http://www.tc251wg3.nhs.uk.
3.
PITAC (2004). Revolutionizing Health Care Through Information Technology: PITAC-Report (President´s Information Technology Advisory Committee) June 2004, siehe (unter Reports "2003-Present") http://www.itrd.gov/pitac/index.html.
4.
Rodgers, J.E., Solomon, W.D., Rector, A.L., Pole, P., Zanstra, P., van der Haring, E. (1997). Rubrics to dissections to GRAIL to classifications. Stud Health Technol Inform 43 Pt A: 241-245.
5.
Rossi-Mori, A. (1996). Towards a new generation of terminologies and coding systems. In: J. Brender et al. (eds.). Proc. MIE´96, Copenhagen, Denmark. Amsterdam: IOS Press, 208-212.
6.
Savage, A. (2000). Changes in MeSH Data Structure. NML Technical Bulletin 313 (March-April), siehe http://www.nlm.nih.gov/pubs/techbull/.
7.
Soualmia, L.F., Golbreich, C., Darmoni, S.J. (2004). Representing the MeSH in OWL: Towards a Semi-Automatic Migration. In: U. Hahn (ed.). Proc. of the KR-MED 2004, Whistler (BC), Canada, Online-Publikation, siehe http://CEUR-WS.org/Vol-102/, 81-87.