gms | German Medical Science

54. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

07. bis 10.09.2009, Essen

Anforderungen an Werkzeuge zur Semantischen Repräsentation von medizinischen Social Media Daten

Meeting Abstract

Search Medline for

  • Kerstin Denecke - Universität Hannover, Hannover

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 54. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds). Essen, 07.-10.09.2009. Düsseldorf: German Medical Science GMS Publishing House; 2009. Doc09gmds223

doi: 10.3205/09gmds223, urn:nbn:de:0183-09gmds2235

Published: September 2, 2009

© 2009 Denecke.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

In Social Media Daten (z.B. Weblogs, Frageportalen, Foren) finden wir zunehmend Informa-tionen zu den Themen Gesundheit, Medizin und Wellness. Die entsprechenden Inhalte ge-winnen als Informationsquelle für den einzelnen Nutzer (Patienten, Ärzte, usw.), aber auch für Krankenkassen, Pharmakonzerne u.a.m. zunehmend an Bedeutung. Beispielsweise ist es für Unternehmen, Krankenkassen und andere Einrichtungen des Gesundheitswesens re-levant, Meinungen und deren Trends sowie aktuelle Themen zu analysieren, um ggf. durch Marketingstrategien oder gezielter Information darauf zu reagieren. Entsprechende Verfah-ren zur semantischen Analyse und Repräsentation solche Texte sind allerdings für den me-dizinischen Bereich noch nicht verfügbar.

Es gibt bereits Methoden zur Analyse medizinischer Dokumente, die allerdings für die Verar-beitung klinischer Dokumente entwickelt wurden (z.B. MedLEE [1], MedIE [2], SeReMeD [3]). Eine offene Fragestellung ist, ob diese Methoden auch Social Media Daten korrekt verarbei-ten können, da sich diese sprachlich und inhaltlich stark von klinischen Dokumenten unter-scheiden. Daher untersuchten wir die Qualität der Repräsentation medizinischer Social Me-dia Daten durch das System SeReMeD. SeReMeD identifiziert medizinische Konzepte in Dokumenten und kombiniert sie über semantische Relationen entsprechend der in einem Dokument beschriebenen Abhängigkeiten zu einer semantischen Repräsentation.

Das System wurde anhand von zu Medikamenten geäußerten Kritiken („Drug Reviews“ http://drugratingz.com) und Fragen bzw. Antworten des Frageportals Healia http://communities.healia.com getestet. Die Ergebnisse zeigen, dass das Verfahren ohne Anpassungen diese Texte nur zu 50% korrekt darstellen kann, während klinische Dokumente mit 80% Korrektheit wesentlich besser repräsentiert werden [3]. Hauptfehlerursachen sind fehlende oder fehlerhafte Abbildungen auf das zugrunde lie-gende Domänenwissen (UMLS). Insbesondere beeinflusst die Komplexität der Sätze die Qualität der Repräsentation negativ. Entsprechende Verbesserungen des Systems sind z.B. die Integration einer zusätzlichen Wissensressource sowie einer genaueren syntaktischen Analyse. Weiterhin müssen Bedeutungen von Verben in die semantische Struktur einfließen.

Eine geplante Erweiterung ist Identifizierung von Meinungen und deren Integration in die semantische Struktur, um so einen automatische Auswertung und eine differenziertere Su-che zu ermöglichen.


Literatur

1.
Friedman C. A broad-coverage natural language processing system. Proc AMIA Annual Sympos. 2000: 270-74.
2.
Zhou X. Approaches to text mining for clinical medical records. Proc 2006 ACM Symposium on Applied Computing. 2006:235-39.
3.
Denecke K. Semantic structuring of and information extraction from medical documents using the UMLS. Methods Inf Med. 2008; 47(5):425-34.