GMS | GMDS 2012: 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS) | Erschließung von medizinischem Episodenwissen aus Freitexten

GMDS 2012: 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

16. - 20.09.2012, Braunschweig

Artikel

XML Version

Artikel empfehlen

Erschließung von medizinischem Episodenwissen aus Freitexten

Meeting Abstract

Suche in Medline nach

Josef Schepers - Charité – Unniversitätsmedizin, Campus Benjamin Franklin, Berlin, Deutschland
Peter Geibel - Charité – Universitätsmedizin Berlin, Deutschland
Frank Müller - Charité – Universitätsmedizin Berlin, Deutschland
Christian H. Nolte - Charité – Universitätsmedizin Berlin, Deutschland
Tatiana Usnich - Charité – Universitätsmedizin Berlin, Deutschland
Thomas Tolxdorff - Charité - Universitätsmedizin Berlin, Institut für Medizinische Informatik, Berlin, Deutschland

GMDS 2012. 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Braunschweig, 16.-20.09.2012. Düsseldorf: German Medical Science GMS Publishing House; 2012. Doc12gmds125

doi: 10.3205/12gmds125, urn:nbn:de:0183-12gmds1253

Veröffentlicht:	13. September 2012

© 2012 Schepers et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.

Gliederung

Text

Einleitung: Daten und Informationen für die klinische Forschung werden in der Regel durch gezielte manuelle Erfassung in Registern und Case Report Forms zusammengestellt. Nicht selten dienen Arztbriefe und Befunde als visuelle Vorlagen für diese manuellen Eingaben. Oder die Daten werden durch Extraktion aus den strukturierten Tabellen von Krankenhausinformationssystemen bereitgestellt. In der Charité – Universitätsmedizin Berlin und in den Berliner Vivantes-Kliniken wird angestrebt, diese Verfahren durch die computerlinguistische Erschließung von medizinischen Befundtexten und Arztbriefen zu ergänzen oder zu ersetzen. In den beiden Berliner Gesundheitsunternehmen befinden sich Forschungsplattformen im Aufbau, die sowohl über HL7- und ETL-Prozesse mit relational vorstrukturiertem Daten als auch über eine linguistische Pipeline mit semantisch erschlossenem, klinischem Episodenwissen aus Texten gespeist werden.

Methoden: Um das in den klinischen Textdokumenten enthaltene Episodenwissen für die Forschung zu erschließen, muss es mit medizinischem Modellwissen verknüpft werden, das in Form von Ontologien bereitgestellt wird. Dies geschieht einmal bei der Extraktion und Transformation der Informationen aus den Texten, und es geschieht ein weiteres Mal bei der Abfrage selber, wenn mit Hilfe des medizinischen Modellwissens die Abfrage mit dem abgelegten Informationen verknüpft wird.

Für die Erschließung von medizinischen Informationen aus Freitexten wird ätiologisches, morphologisches, topologisches, prozedurales und prognostisches Modellwissen schon bei der Identifikation von Aussagen in den Textdokumenten benötigt. Medizinische Begriffe in den Texten können nur dann korrekt als Diagnosen, Therapien oder Lokalisationen identifiziert werden, wenn sie in den Ontologien entsprechend berücksichtigt sind.

Bei der Speicherung in speziellen Datenbanksystemen findet nach der Extraktion aus den Texten nicht unbedingt eine Klassifizierung und Kodierung statt. Das heißt, dass ein Schlaganfall nicht gezwungenermaßen durch einen ICD-Kode wie I63.3 dokumentiert wird. Vielmehr können die tatsächlich gewählten Begriffe wie Insult, Apoplex und thrombotischer Verschluss einer zerebralen Arterie gespeichert werden. Das Gleiche gilt für Begriffe wie walnussgroß, erhaben und auffällig, für die keine Kodes vorhanden sind.

Bei Abfragen auf den gespeicherten Informationen wird das Modellwissen dann wieder benötigt, um Fälle mit gleichen Eigenschaften trotz unterschiedlicher Beschreibung zusammenzufassen. Unterschiedliche Beschreibungen desselben Sachverhaltes entstehen z.B. durch die Verwendung von Synonymen wie (Schlaganfall und zerebraler Insult) und durch Varianten in der sprachlichen Formulierung. Für eine weitergehende Erschließung inhaltlicher Zusammenhänge muss das System Negationen erkennen, taxonomische Informationen interpretieren und morphologische oder topologische Zusammenhänge darstellen (beispielsweise die Arteria cerebri media als Blutgefäß des zentralen Nervensystems, deren Verschluss einen Hirninfarkt verursacht). Die Verknüpfung von Episodenwissen mit medizinischem Modellwissen spielt auch bei der sogenannten Disambiguierung von Begriffen eine Rolle. Ein bekanntes Beispiel ist die Abkürzung HWI, welche entweder als Harnwegsinfekt oder Hinterwandinfarkt zu lesen ist. Die richtige Bedeutung kann nur im Kontext über zusätzlich verfügbare Informationen wie Therapien, Medikamente und Lokalisationen erschlossen werden.

Im Rahmen des Konsortialprojektes Berliner Forschungsplattform Gesundheit untersuchen die Klinik für Neurologie und das Institut für Medizinische Informatik mit den Projektpartnern von Vivantes und Ortec medical die Möglichkeiten und Grenzen der linguistischen Texterschließung für die Diagnosen Schlaganfall, Multiple Sklerose und Morbus Parkinson. Für den Aufbau des Forschungs-Datawarehouse CHAPEAUX in der Charité werden zunächst für die neurologische Klinik insbesondere strukturierte Daten aus den Modulen IS/H und i.s.h.med mit Inhalten aus Arztbriefen und Befundtexten zusammengeführt.

Gliederung

Literatur

1.: Peter Geibel, Alexander Mehler, Kai-Uwe Kühnberger. Learning Methods for Graph Models of Document Structure. In: Storrer A, et al, editors. Modeling, Learning and Processing of Text Technological Data Structures. Studies in Computational Intelligence. Heidelberg/New York: Springer; 2011.
2.: Frank Müller. A finite-state approach to shallow parsing and grammatical functions annotation of German, Dissertation. Tübingen: Universität; 2005.
3.: Scheitz JF, Mochmann HC, Nolte CH, Haeusler KG, Audebert KG, Heuschmann PU, Laufs U, Witzenbichler B, Schultheiss HP, Endres M. Troponin elevation in acute ischemic stroke (TRELAS) – protocol of a prospective observational trial. M BMC Neurol. 2011;11:98.
4.: Scheitz JF, Mochmann HC, Witzenbichler B, Fiebach JB, Audebert HJ, Nolte CH. Takotsubo cardiomyopathy following ischemic stroke: a cause of troponin elevation. J Neurol. 2012;259:188-90.
5.: Beckett D. RDF/XML Syntax Specification (Revised). W3C Recommendation; 2004.

gms | German Medical Science

GMDS 2012: 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Artikel

Erschließung von medizinischem Episodenwissen aus Freitexten

Suche in Medline nach

Autoren

Gliederung

Text

Literatur