gms | German Medical Science

GMDS 2012: 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

16. - 20.09.2012, Braunschweig

Beschreibungslogische Abfragen zur Qualitätssicherung des Krankheitsmanagements vernachlässigter Tropenerkrankungen

Meeting Abstract

  • Daniel Schober - Institut für Medizinische Biometrie und Medizinische Informatik, Universitätsklinikum Freiburg, Freiburg i Br., Deutschland
  • Roberta Fernandes - Informatics Center, Federal University of Pernambuco (CIn/UFPE), Recife, Brasilien
  • Filipe Santana - Informatics Center, Federal University of Pernambuco (CIn/UFPE), Recife, Brasilien
  • Zulma Medeiros - Pathology Department, Institute of Biological Sciences, University of Pernambuco, Recife, Brasilien
  • Martin Boeker - Institut für Medizinische Biometrie und Medizinische Informatik, Universitätsklinikum Freiburg, Deutschland
  • Frederico Freitas - Informatics Center, Federal University of Pernambuco (CIn/UFPE), Recife, Brasilien

GMDS 2012. 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Braunschweig, 16.-20.09.2012. Düsseldorf: German Medical Science GMS Publishing House; 2012. Doc12gmds019

doi: 10.3205/12gmds019, urn:nbn:de:0183-12gmds0199

Veröffentlicht: 13. September 2012

© 2012 Schober et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung: Vernachlässigte Tropenkrankheiten (Neglected Tropical Diseases, NTD) haben eine hohe Prävalenz in Entwicklungs- oder Schwellenländern tropischer Klimazonen und treffen damit eine ohnehin unter Armut und mangelnder Versorgung leidende große Bevölkerungsschicht. Benötigt werden intelligente Informationssysteme, welche die in unterschiedlichen und verteilten Datenbanken gehaltenen Patientendaten intelligent und effizient abfragen können, etwa um fehlerhafte Daten zu entdecken, oder um Daten unterschiedlicher Regionen zu vergleichen und Muster zu entdecken, die in der Krankheitsprävention und Versorgungsforschung verwendbar sind [1].

Zielsetzung: Ziel dieses Projektes ist die Repräsentation epidemiologischer Daten des Brasilianischen Gesundheitsministeriums in einer Form, die eine möglichst umfangreiche, effiziente und intelligente Daten-Auswertung und Sekundärnutzung erlaubt.

Methoden: Ein D2R Server macht über ein Schema-zu-RDF mapping die relationalen Daten über die SPARQL RDF Anfragesprache zugänglich. Diese RDF Daten werden nun über eine um epidemiologie-relevante Daten erweiterte NTD Ontologie [2] annotiert und damit semantisch formalisiert. Über Computer-interpretierbare OWL-DL EL Ontologien [3] werden logik-basierte Schlussfolgerer eingesetzt, die beschreibungslogische axiomatische Klassendefinitionen zur intelligenten Wissensausbeute und Datenvalidierung nutzen. Es wurde Untersucht, ob Ontologien in beschreibungslogischer Semantik praktisch zur Integration großer Patientendatenmengen geeignet, bzw. die Schlussfolgerungs-Algorithmen noch performant sind. Es werden KI-Methoden, wie regelbasiertes und Konsequenz-basiertes Schussfolgern [4] und SPARQL-OWL entailments [5] untersucht, die alternativ zum klassischen Tableau-basierten Beschreibungslogik-Schlussfolgern genutzt werden können, um derartig große Datenmengen in akzeptablen Anfragezeiten erschließbar zu machen.

Ergebnisse: Es wird eine epidemiologische Wissensbank vorgestellt, die auf anonymisierte Patientendaten aus zwei unterschiedlichen brasilianischen Datenbanken, einer für Sterbedaten und einer anderen für Komorbiditäten, zugreift und die so integrierten Daten synergistisch nutzt, um durch Vergleich untereinander und mit dem inferierten Erweiterungssatz Eingabefehler und Inkonsistenzen in den Ausgangsdaten zu entdecken. Dies bestätigt die Eingangshypothese, dass hochformale Aspekte von Beschreibungslogik-basierten Ontologien wie Subsumption, Disjunktheit, universelle und existentielle Quantoren und Kardinalitäten in der praktischen Patientendatenverwaltung nutzbar gemacht werden können.

Schlussfolgerung: Die beschreibungslogische Modellierung von Terminologien im Bereich vernachlässigter Tropenerkrankungen ermöglicht die inhaltsbasiert-semantische, sowie syntaktische Integration von epidemiologischen Patientendaten. Dies erlaubt unter Einsatz von Schlussfolgerern die Datenqualität zu erhöhen und einer robusteren Sekundärdatennutzung zuzuführen. Über eine gemeinsame Ontologie repräsentierte Daten aus unterschiedlichen Quellen sind integrativ abfragbar und damit einfach zu vergleichen. Diese Vergleiche und die über Ontologien ermöglichte kontextuelle Erschließung ganzer Wissens-Netze erleichtern die Entdeckung von neuen Mustern und neuem Wissen über das Vorkommen von NTD, wodurch deren Therapie und Kontrolle, z.B. über epidemiologische Monitoring Systeme, vereinfacht werden kann.


Literatur

1.
Hotez PJ, et al. Rescuing the bottom billion through control of neglected tropical diseases. Lancet. 2009;373(9674):1570-5. DOI: 10.1016/S0140-6736(09)60233-6 Externer Link
2.
Santana F, Schober D, Medeiros Z, Freitas F, Schulz S. Ontology patterns for tabular representations of biomedical knowledge on neglected tropical diseases. Bioinformatics. 2011;27(13):i349-i356. DOI: 10.1093/bioinformatics/btr226 Externer Link
3.
Baader F, et al. The Description Logic Handbook. Theory, Implementation, and Applications. 2nd ed. Cambridge: Cambridge University Press; 2007.
4.
Kazakov Y‚ Krötzsch M, Simancik F. Unchain My EL Reasoner. In: Rosati R‚ Rudolph S, Zakharyaschev M, editors. Description Logics. Vol. 745 of CEUR Workshop Proceedings. 2011.
5.
Kollia I‚ Glimm B, Horrocks I. Answering Queries over OWL Ontologies with SPARQL. In: Proceedings of the 8th International Workshop on OWL: Experiences and Directions (OWLED 2011). 2011.