gms | German Medical Science

53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

15. bis 18.09.2008, Stuttgart

Über die Schätzung der Wahrscheinlichkeitsmodelle für Genexpressionsprofile, basierend auf mRNA-Fließgleichgewichten

Meeting Abstract

Suche in Medline nach

  • Norman Bitterlich - Medizin & Service GmbH Chemnitz, Deutschland
  • Georg Hoffmann - Institut für Molekulare Onkologie, Martinsried bei München, Deutschland

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. 53. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds). Stuttgart, 15.-19.09.2008. Düsseldorf: German Medical Science GMS Publishing House; 2008. DocMI10-5

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2008/08gmds154.shtml

Veröffentlicht: 10. September 2008

© 2008 Bitterlich et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung und Fragestellung

Das Transkriptom aller bisher untersuchten Spezies weist ein rechtsschiefes Verteilungsmuster auf: Etwa 1% der rund 30.000 mRNA-Transkripte machen 20% der Gesamtkonzentration aus, 95% liegen in kaum messbaren Mengen von 0,1 bis 10 Kopien pro Zelle vor. Basierend auf bekannten Ansätzen [1], [2] wird ein physiologisches Modell beschrieben, das diese Verteilung als Folge von mRNA-Fließgleichgewichten nach der Gleichung c = S/D erklären könnte. Dabei ist S die Syntheserate (1/min) und D die Abbaukonstante (1/min). Mit diesem interpretierbaren Modell erreicht man eine anschaulich gute qualitative Übereinstimmung mit empirischenVerteilungen realer Microarray-Daten. Für einfache Verteilungsannahmen an S und D lassen sich die Verteilungsfunktionen des Quotienten analytisch ermitteln, so dass die Modelle analysiert werden können. Die Erzeugung simulierter Daten ermöglicht zudem weitere vergleichende Untersuchungen. Dabei erscheint die Verteilungsanpassung an vorliegende Daten als die Herausforderung, um die Abgrenzung gegenüber anderen publizierten Modellen (beispielsweise nach Zipf, Pareto, Weibull, ...) quantifizieren zu können.

Lösungsansatz

Das Modell basiert auf der Annahme, dass Expressionssignale durch mRNA-Konzentrationen im Fließgleichgewicht von Synthese S und Abbau D repräsentiert werden, denn nur Werte im Gleichgewicht können reproduzierbar gemessen werden [3]. Beide Teilprozesse lassen sich mittels einfacher Differenzialgleichungen beschreiben, deren Zusammenführung die interessierende mRNA-Konzentration liefert [4]. In einem im Internet frei zugänglichen Computermodell [5] können Simulationen durchgeführt und verschiedene Kenngrößen der Genregulation berechnet werden.

Der Vergleich empirischer Verteilungsfunktionen realer Microarray-Daten zeigt, dass diese mittels Lognormalverteilung nicht adäquat erklärt werden können. Formal lassen sich verschiedene Verteilungsfunktionen anwenden, um qualitativ eine bessere Datenanpassung zu erreichen. Die damit erreichbare Güte wird häufig nur qualitativ diskutiert, zumal Modellabweichungen nur für einen relativ geringen Teil der Daten erwartet werden.

Ergebnisse

Für den Modellansatz c = S/D lässt sich für einfache Verteilungsannahmen an S und D über Faltungsintegrale die Verteilungsdichte des Quotienten berechnen. Für normalverteilte und voneinander unabhängige Syntheserate und Abbaukonstante erhält man die bekannte Cauchy-Verteilung. Doch selbst die Annahme der Gleichverteilung von S und D liefert ein sehr interessantes Modell, deren Verteilungsfunktion sich aus zwei verschiedenen Funktionsästen zusammensetzt. Dieser Effekt bleibt auch erhalten, wenn S als ein Produkt von unabhängigen und gleichverteilten Zufallsgrößen betrachtet wird.

Obwohl analytisch für eine gleichverteilte Abbaukonstante D ein „Knick“ in der Verteilungsfunktion des verallgemeinerten Modells c = (S1·S2·...·Sn)/D nachgewiesen werden kann, ist dieser Effekt nur für kleine Werte von n anschaulich erkennbar. Eine Schätzung der Anzahl der zu verwendenden Faktoren Si wird deshalb im Allgemeinen nicht aus der Auswertung der Gesamtheit der Beobachtungsdaten gelingen, zumal sich die globale Approximationsgüte verschiedener Modelle nur unzureichend quantitativ differenzieren lässt.

Um die zwei Funktionsäste detektieren zu können, wird deshalb eine lokale Analyse der Verteilungsfunktionen vorgeschlagen. Mit einer so genannten Fensterfunktion werden dafür nur ausgewählte Bereiche für die Verteilungsanpassung herausgefiltert und analysiert. Lokale Veränderung in der Verteilungsfunktion werden dadurch bei parametrischen Verteilungsansätzen bei Fensterverschiebungen als Parameterveränderung sichtbar.

Diskussion

Der beschriebene Zugang zur Modellierung der Expressionssignale über die Fließgleichgewichte von Syntheserate und Abbaukonstante ermöglicht interessante Simulationsexperimente. Insbesondere lassen sich an derart erzeugten Daten die Potenziale und die Grenzen bekannter und oft als Alternativen vorgeschlagener Verteilungen demonstrieren. Es werden erste Anwendungsergebnisse des Ansatzes auf reale Microarray-Daten vorgestellt.


Literatur

1.
Monod J, Pappenheimer A, Cohen-Bazaire G. La cinétique de la biosynthese de la ß-galactosidase chez E. coli considerée comme fonction de la croissance (The kinetics of the biosynthesis of beta-galactosidase in Escherichia coli as a function of growth). Biochim Biophys Acta 1952; 9: 648-660
2.
Hargrove J. Microcomputer-assisted kinetic modelling of mam-malian gene expression. FASEB J 1993; 7: 1163-1170.
3.
Ross J. mRNA stability in mammalian cells. Microbiol Rev 1995; 59: 423-450.
4.
Hoffmann G et al. SimChip - Computer Simulation of mRNA Steady States. Clin Lab 2008; 54:19-24.
5.
Hoffmann G. Ein mathematisches Modell des Transkriptoms. Klin Chem Mitteilungen 2006; 37(3): 64-72 (http://www.simchip.de/). Externer Link