gms | German Medical Science

50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie (dae)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Deutsche Arbeitsgemeinschaft für Epidemiologie

12. bis 15.09.2005, Freiburg im Breisgau

Bewertung von Profilen der Genexpression zur Analyse von Microarray Daten

Meeting Abstract

Search Medline for

  • Änne Glass - Universität Rostock, Medizinische Fakultät, Rostock
  • T. Karopka - Universität Rostock, Medizinische Fakultät, Rostock

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Deutsche Arbeitsgemeinschaft für Epidemiologie. 50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie. Freiburg im Breisgau, 12.-15.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05gmds249

The electronic version of this article is the complete one and can be found online at: http://www.egms.de/en/meetings/gmds2005/05gmds353.shtml

Published: September 8, 2005

© 2005 Glass et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Einleitung und Fragestellung

Die Technologie der Microarrays spielt in der angewandten klinischen Genomforschung eine große Rolle, da sie die zeitgleiche Messung der Expression von ca. 30.000 Gensequenzen auf mRNA Ebene in klinischen Proben ermöglicht. Im Ergebnis eines Microarray Experimentes liegt zu jeder der 30.000 Gensequenzen ein Expressionswert - entsprechend der Menge des Proben-Transkriptes - vor. Aus diesen Daten werden zeit- oder dosisabhängige Expressionsprofile der Gene erstellt, die wesentlich zur Charakterisierung des Expressionsverhaltens von Genen unter experimentellen Bedingungen beitragen. Dazu ist die Analyse der Änderung der Expression im Vergleich zur Kontrolle als „x-fache Regulation“ und die Visualisierung der Profile notwendig. Doch gerade eine adäquate Visualisierung der Profile und anschließende Bewertung der Regulation ist in Ermangelung eines geeigneten Basisprofils recht schwierig. Wir zeigen anhand der Untersuchungen unterschiedlicher Microarray Experimente, dass sich mittels des Variationskoeffizienten durchaus geeignetere Gene als die herkömmlichen „Housekeeping“ Gene [1], [2] zur Generierung von Basisprofilen ermitteln lassen.

Material und Methoden

Genexpressionsdaten aus 16 Microarray Experimenten mit differenten Geweben, Mediatoren und Zeitpunkten wurden untersucht. Die Experimente wurden so designed, dass sie bei maximaler Übereinstimmung der untersuchten Sequenzen (in allen Experimenten wurden die gleichen Arrays und dieselbe Technologie verwendet) eine maximale Variabilität der experimentellen Bedingungen zeigten. Auf diese Weise konnte die größtmögliche Spannweite der Expression für alle verfügbaren Gensequenzen ermittelt werden. Alle 22.691 Gensequenzen inklusive der 5 vom Hersteller präferierten „Housekeeping“ Gene GAPDH, Beta Actin, Pcx, Trfr or 18SRNA - jeweils vertreten durch die 3 Sequenzabschnitte 3’-, 5’- sowie eine M-Sequenz - wurden bezüglich ihrer Expression analysiert. Dazu wurde eine Matrix aus 22.691 Zeilen (untersuchte Sequenzen) und den Spalten für alle Arrays (unterschiedliche Bedingungen mit den jeweiligen Replikaten) erstellt. Für jede Sequenz wurde der Variationskoeffizient berechnet. Ein minimaler Variationskoeffizient induziert eine geringe Variabilität der Genexpression. Die Top-Kandidaten sind also diejenigen Gensequenzen, die unter maximal variablen Einflüssen auf die Genexpression den geringsten Variationskoeffizienten liefern. Das anschließende Ranking aller Sequenzen nach aufsteigendem Variationskoeffizienten liefert auf dem ersten Rang diejenige Gensequenz, welche ein Basisprofil für die adäquate und auswertbare Visualisierung der übrigen Expressionsprofile des betrachteten Experimentes liefern kann. Dabei ist es zunächst unbedeutend, ob diese Sequenz annotiert ist (annotiertes Gen) oder nicht (Riken Sequenz oder „Expressed Sequence Tag“ EST). Entscheidend ist ihre weitgehend konstante Expression auf mRNA Ebene.

Ergebnisse

Die Auswertung verschiedenartiger Microarray Experimente zeigte, dass Housekeeping Gene nicht generell für Basisprofile geeignet sind. Wir analysierten die 5 herstellerempfohlenen Housekeeping Gene GAPDH, Beta Actin, Pcx, Trfr und 18SRNA in je 3 Sequenzen (3’-, 5’- and M). Die 15 untersuchten Housekeeping Gensequenzen nahmen im Ranking Positionen zwischen Rang 235 und 22.637 ein (Tabelle 1 [Tab. 1]). Damit scheiden sie als Basisprofil-Gene im generellen Sinne (experimentunabhängig) aus. Die jeweils 3 Sequenzen von GAPDH and Beta Actin befanden sich im oberen Drittel der Ranking Liste und bilden damit zumindest „relativ“ konstante Expressionsprofile aus. Die erste der 6 Sequenzen (GAPDH 3’) lag auf Rang 235, die letzte (Beta-Actin M) auf Platz 8.715. Die am besten für ein Basisprofil geeignete Sequenz in unserem zu Untersuchungszwecken angelegten experimentellen Rahmen war die Riken Sequenz 2410004D02. Sie zeigte die konstanteste Expression mit minimalem Variationskoeffizienten von 0,07.

Diskussion

Die adäquate Darstellung und daraus resultierende Bewertung von Genexpressionsprofilen bedarf eines geeigneten Basisprofils. Zur Generierung eines solchen wurden 22.691 Gensequenzen unter verschiedenen experimentellen Bedingungen auf mRNA Ebene hinsichtlich ihrer Expression mit folgenden Ergebnissen untersucht:

a) Ein konstantes Basisprofil der Höhe 1 (1-fache Änderung der Genexpression im Vergleich zur Kontrolle) ist sowohl wegen der hohen biologischen Variabilität, als auch wegen technischer Fehler im Technologieablauf nicht realistisch.

b) Auch die sehr häufig herangezogenen „Housekeeping“ Gene sind, wie unsere Untersuchungen zeigen, nicht für Basisprofile geeignet, denn selbst „Housekeeping“ Gene reflektieren Behandlungseffekte als deutliche Schwankungen in ihrer Expression (Abbildung 1 [Abb. 1]).

Deshalb sollte vielmehr für jedes Experiment die experimentspezifische Sequenz mit minimaler Expressionsvariabilität zur Generierung eines Basisprofils ermittelt werden. Eine geeignete Methode hierfür ist das Ranking der Variationskoeffizienten aller Gensequenzen innerhalb eines Experimentes.

Danksagung

Das Projekt wurde mit Mitteln des „Landesforschungsförderprogramms“ Mecklenburg/Vorpommerns sowie des Europäischen Fonds für regionale Entwicklung (EFRE) 0400210/2004 gefördert.


Literatur

1.
Thellin O, Ziorzi W, Lakaye B, De Bormann B, Coumans B, Hennen G, Grisar T, Igout A, Heinen E. Housekeeping genes as internal standards: use and limits. J Biotechnol 1999; 75: 291-5
2.
Savli H, Karadenizli A, Kolayli F, Gundes S, Ozbek U, Vahaboglu H. Expression stability of six housekeeping genes: a proposal for resistance gene quantification studies of Pseudomonas aeruginosa by real-time quantitative RT-PCR. J Med Microbiol 2003; 52: 403-8