gms | German Medical Science

GMDS 2014: 59. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

07. - 10.09.2014, Göttingen

Die häufigsten Medizinischen Konzepte bei Patientenauswahlkriterien in Klinischen Studien und deren Abdeckung in MeSH und SNOMEDCT

Meeting Abstract

Suche in Medline nach

  • J. Varghese - Westfälische Wilhelms-Universität Münster, Münster
  • M. Dugas - Westfälische Wilhelms-Universität Münster, Münster

GMDS 2014. 59. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Göttingen, 07.-10.09.2014. Düsseldorf: German Medical Science GMS Publishing House; 2014. DocAbstr. 142

doi: 10.3205/14gmds147, urn:nbn:de:0183-14gmds1477

Veröffentlicht: 4. September 2014

© 2014 Varghese et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

1) Einleitung und Fragestellung: Ein- und Ausschlusskriterien (E/A-Kriterien) definieren das Patientenkollektiv in klinischen Studien und sind daher für das Studiendesign und die erfolgreiche Studiendurchführung von großer Bedeutung [1], [2].

In den meisten Fällen erfolgt die Angabe der E/A-Kriterien in nicht standardisierten Freitexten, was unter anderem eine computerbasierte Verarbeitung dieser Kriterien erschwert.

Semantische Annotationen ermöglichen eine automatisierte Analyse von Datenelementen in medizinischen Formularen [3] und sind insbesondere für die elektronische Unterstützung der Patientenrekrutierung von Bedeutung.

Im Rahmen dieser Arbeit sollen zunächst die häufigsten medizinischen Konzepte, welche E/A-Kriterien klinischer Studien repräsentieren, mit semantischen Annotationen ermittelt werden.

Diese Liste soll Datenelemente enthalten, die häufig in E/A-Kriterien vorkommen und daher in EHR-Systemen abgebildet werden sollten.Darüberhinaus soll die Abdeckung dieser häufigsten Konzepte in zwei großen medizinischen Vokabularen, MeSH und SNOMED-CT, untersucht werden.

2) Material und Methoden: Analysiert wurden EAK von 425 klinische Studien, welche zwischen den Jahren 2000 und 2011 am Universitätsklinikum Münster durchgeführt wurden. 7340 Konzepte wurden durch einen medizinischen Kodierer manuell identifiziert und semantisch annotiert mit Concept Unique Identifiers (CUIs) aus dem Meta Thesaurus Unified Medical Language System (UMLS), Version 2013AA.

Die Konzepte wurden von zwei Ärzten mit Hilfe eines semi-automatischen Verfahrens geprüft Kodierungsfehler korrigiert. Hierbei wurden in einem automatisierten ersten Schritt alle verschiedenen Konzepte mit ähnlichem Konzeptnamen aufgelistet. Zwei Konzeptnamen als Zeichenketten A und B gelten in diesem Fall als ähnlich, falls A gleich B ist, oder wenn A eine Wortsequenz innerhalb von B ist oder B eine Wortsequenz innerhalb von A. Die Überprüfung einer Wortsequenz geschieht unter Verwendung regulärer Ausdrücke.

Im anschließenden zweiten Schritt wird manuell geprüft, ob die verschiedenen Konzepte bei Namensähnlichkeit nicht doch ein gleiches medizinisches Konzept darstellen.

Das Ziel dieser semi-automatischen Herangehensweise liegt darin gleiche Konzepte zu filtern, die jedoch unterschiedlich kodiert wurden, was eine Folge der Benutzung des UMLS-Metathesaurus ist, da dieser mehrere verschiedene plausible Konzeptcodes zu einer Konzeptsuche liefern kann.

Ein binomialer Vorzeichentest wurde verwendet, um die Abdeckung dieser häufigsten Konzepte in MeSH (Version 2013_1_21) und SNOMED-CT (Version 2013_31) gegeneinander zu vergleichen.

3) Ergebnisse: Basierend auf allen EAK von 425 Studienformularen wurden mit den oben beschriebenen Methoden 6671 EAK und 7433 Konzepte, darunter 5231 unterschiedliche Konzepte, erfasst und semantisch annotiert.

Die semiautomatsche Korrektur berichtigte 1033 Konzepte.

Eine Top 100 Liste wurde erstellt, diese enthält 101 medizinische Konzepte, welche am häufigsten die E/A-Kriterien aller Studienformulare repräsentieren. Die Konzepte dieser Liste decken 25% aller gefundenen Konzepte in den 425 Studienformularen ab. Die Verfügbarkeit dieser Konzepte bei SNOMED-CT liegt bei 94%, bei MeSH 88%. Die Konzeptabdeckung in den verschiedenen Vokabularen ist nicht signifikant unterschiedlich (p=0.1094).

4) Diskussion: Die Analyse von 425 klinischen Studien zeigt, dass nur 101 Konzepten genügen, um 25% der verwendeten Konzepte abzudecken, bei einer Gesamtmenge von 5231 verschiedenen Konzepten. Die meisten dieser Konzepte sind in SNOMED-CT und MeSH verfügbar.

4.1) Mögliche Einschränkungen:

1.
Die Kodierung von medizinischen Konzepten, insbesondere unter Verwendung des UMLS Metathesaurus, welcher keine medizinische Klassifikation darstellt, ist nicht immer trivial und mit Uneindeutigkeiten bei der Zuweisung von medizinischen Kodes verbunden. Dieser Problematik wirkten wir dadurch entgegen, dass eine sorgfältige manuelle Kodierung im Rahmen eines medizinischen Expertenkonsensus erfolgt ist. Ein zusätzlicher maschineller Schritt sorgte dafür, dass Konzepte mit gleichen oder ähnlichen Konzeptnamen gesondert gelistet wurden zur manuellen Nachkontrolle.
2.
Unser Datenmaterial bezieht sich auf 425 Studienformulare eines Universitätsklinikums.

Die Forschungsschwerpunkte dieses Klinikums könnten zu einer Selektion der häufigen Konzepte führen. Da jedoch eine relativ hohe Anzahl von Studienformulare aus einem Zeitraum von mehr als 10 Jahren herangezogen wurde und das Universitätsklinikum Münster ein sehr breites klinisches Forschungsspektrum aufweist, schätzen wir den Selektionseffekt als gering ein.

4.2) Fazit: Semantische Annotationen sind ein wichtiger Bestandteil zur Standardisierung von EAK in Studienformularen. Eine begrenzte Menge von 101 medizinischen Konzepten deckt bereits ein Viertel aller gefundenen Konzepte in den 425 von uns untersuchten Studienformularen ab. Die meisten dieser Konzepte sind in SNOMED-CT und MeSH verfügbar. Diese Konzepte sollten in EHR-Systemen abgebildet werden, um die klinische Forschung mit Daten aus der Patientenakte zu unterstützen.


Literatur

1.
McDonald AM, Knight RC, Campbell MK, Entwistle VA, Grant AM, Cook JA, Elbourne DR, Francis D, Garcia J, Roberts I, Snowdon C. What influences recruitment to randomised controlled trials? A review of trials funded by two UK funding agencies. Trials. 2006;7:9. DOI: 10.1186/1745-6215-7-9 Externer Link
2.
van der Wouden JC, Blankenstein AH, Huibers MJ, van der Windt DA, Stalman WA, Verhagen AP. Survey among 78 studies showed that Lasagna's law holds in Dutch primary care research. J Clin Epidemiol. 2007 Aug;60(8):819-24.
3.
Dugas M, Fritz F, Krumm R, Breil B. Automated UMLS-based comparison of medical forms. PLoS One. 2013 Jul 4;8(7):e67883. DOI: 10.1371/journal.pone.0067883 Externer Link