gms | German Medical Science

Kongress Medizin und Gesellschaft 2007

17. bis 21.09.2007, Augsburg

Entwurf und Implementierung einer Datenbank zur Analyse von Listen differentiell exprimierter Gene bei Leukämien

Meeting Abstract

Suche in Medline nach

  • Hans-Ulrich Klein - Institut für Medizinische Informatik und Biomathematik / Universität Münster, Münster
  • Sylvia Merk - Institut für Medizinische Informatik und Biomathematik / Universität Münster, Münster
  • Claudia Haferlach - Münchener Leukämie Labor, München
  • Martin Dugas - Institut für Medizinische Informatik und Biomathematik / Universität Münster, Münster

Kongress Medizin und Gesellschaft 2007. Augsburg, 17.-21.09.2007. Düsseldorf: German Medical Science GMS Publishing House; 2007. Doc07gmds195

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2007/07gmds195.shtml

Veröffentlicht: 6. September 2007

© 2007 Klein et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung/Hintergrund: In den letzten Jahren haben sich Genexpressionsanalysen zu einem Standardverfahren zur Erforschung molekularbiologischer Ursachen von Krebserkrankungen entwickelt. Publikationen aus diesem Gebiet enthalten zahlreiche Genlisten, die mit diesen Erkrankungen assoziiert sind. Der Zugriff auf die Genlisten ist jedoch oft mit erheblichen Aufwand verbunden, da die Listen auf verschiedenen Web-Seiten in unterschiedlichen Formaten vorliegen. Wir haben eine Datenbank entworfen und implementiert, die einen einfachen Zugriff auf Listen differenziell exprimierter Gene bei Leukämien in einem einheitlichen XML-Format ermöglicht. Dadurch wird der Aufwand für die Durchführung von Metaanalysen und für Vergleiche von Genlisten reduziert.

Methoden: Zur Entwicklung der Datenbank wurde ein Entity-Relationship-Modell entworfen und in ein normalisiertes Datenbankschema überführt. Als relationales DBMS wurde PostgreSQL verwendet. Der Zugriff auf die Datenbank wird über eine in Java-EE implementierte SOAP-Schnittstelle ermöglicht. Einzelne Datenbankabfragen können zudem mit einem Web-Browser über HTTP-Servlets durchgeführt werden.

Ergebnisse: Einer Genliste werden die untersuchten Patientengruppen, die verwendete Microarray-Plattform und die zugehörige PubMed-ID zugeordnet. Jeder Eintrag in einer Genliste besteht aus seiner Rangnummer und einer GenBank-Accession-Number [1]. Bei einem Vergleich von zwei Gruppen wird zusätzlich die Richtung (hoch- oder herunterreguliert) angegeben. Falls den Accession-Numbers bekannte Gene zugeordnet sind, werden durch Online-Abfragen der Entrez-Gene-Datenbank [2] aktuelle genspezifische Informationen (z.B. HUGO-Symbole) ermittelt. Den untersuchten Patientengruppen werden neben Attributen wie Alter oder Herkunft des Zellmaterials Leukämiearten zugeordnet. Dazu wurde eine hierarchische Klassifikation von Leukämiearten modelliert, so dass Datenbankabfragen gezielt nach ca. 30 unterschiedlichen Leukämieunterarten durchgeführt werden können.

Wir haben ungefähr 60 relevante Genlisten aus 35 Artikeln identifiziert, welche in die Datenbank übertragen wurden. Eine systematische Analyse der Übereinstimmungen und Abweichungen publizierter Genlisten einzelner Leukämiearten wird erarbeitet und vorgestellt.

Diskussion: Die Datenbank ermöglicht die Durchführung von Metaanalysen einer großen Anzahl von Genexpressionsexperimenten bei Leukämien. Die Metaanalysen können direkt auf Genen, auf Distanzmaßen für Genlisten [3] oder bspw. auf Gene-Ontology- oder Pathway-Analysen basieren. Zudem ermöglicht die Datenbank einen einfachen Vergleich von eigenen Genlisten mit bereits veröffentlichten Ergebnissen.


Literatur

1.
Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Wheeler DL. GenBank. Nucleic Acids Res. 2006;34(Database Issue):D16-D20.
2.
Maglott D, Ostell J, Pruitt KD, Tatusova T. Entrez Gene: gene-centered information at NCBI. Nucleic Acids Res. 2005;33(Database Issue):D54–D58.
3.
Yang X, Bentink S, Scheid S, Spang R. Similarities of ordered gene lists. Bioinformatics and Computational Biology. 2006;4(3):693-708.