gms | German Medical Science

51. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (gmds)

10. - 14.09.2006, Leipzig

Identifying pattern in microarray expression series using algorithmic information theory

Meeting Abstract

  • S.E. Ahnert - Theory of Condensed Matter, Cavendish Laboratory, Cambridge
  • F.C.S. Brown - Département de Mathématiques et Applications, ENS, Paris
  • T.M.A. Fink - Institut Curie, Paris
  • K. Willbrand - Laboratoire de Physique Statistique, ENS, Paris

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (gmds). 51. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Leipzig, 10.-14.09.2006. Düsseldorf, Köln: German Medical Science; 2006. Doc06gmds149

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2006/06gmds088.shtml

Veröffentlicht: 1. September 2006

© 2006 Ahnert et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

We introduce a method of detecting pattern in data series independent of the nature of the pattern. Our approach is to replace each data series with an alternative description from which the original data can be fully recovered. Data series with short descriptions, which are significantly compressible are more likely to result from simple underlying mechanisms than series which are incompressible. We assume compressible gene expression profiles to be biologically or medically interesting. We show that the compression in bits k is a universal currency which is independent of the type of noise underlying the data and by which we can order data series according to their significance. The method is successfully tested on microarray time series of yeast cell cycle.