gms | German Medical Science

50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds)
12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie (dae)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie
Deutsche Arbeitsgemeinschaft für Epidemiologie

12. bis 15.09.2005, Freiburg im Breisgau

Aufbau einer Bioinformatik-Plattform für Mutationen im FBN1-Gen zur Genotyp-Phänotyp Korrelation beim Marfan-Syndrom

Meeting Abstract

  • Christian Baumgartner - Forschungsgruppe für biomedizinische Datenanalyse, Private Universität für Gesundheitswissenschaften, Medizinische Informatik und Technik, Hall
  • Daniela Baumgartner - Universitätsklinik für Kinder- und Jugendheilkunde, Medizinische Universität Innsbruck, Innsbruck
  • Martin Eberle - Forschungsgruppe für biomedizinische Datenanalyse, Private Universität für Gesundheitswissenschaften, Medizinische Informatik und Technik, Hall
  • Gábor Mátyás - Abteilung für Stoffwechsel und Molekulare Pädiatrie, Universitätskinderspital Zürich, Zürich
  • Beate Steinmann - Abteilung für Stoffwechsel und Molekulare Pädiatrie, Universitätskinderspital Zürich, Zürich

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie. Deutsche Arbeitsgemeinschaft für Epidemiologie. 50. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds), 12. Jahrestagung der Deutschen Arbeitsgemeinschaft für Epidemiologie. Freiburg im Breisgau, 12.-15.09.2005. Düsseldorf, Köln: German Medical Science; 2005. Doc05gmds058

Die elektronische Version dieses Artikels ist vollständig und ist verfügbar unter: http://www.egms.de/de/meetings/gmds2005/05gmds404.shtml

Veröffentlicht: 8. September 2005

© 2005 Baumgartner et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielf&aauml;ltigt, verbreitet und &oauml;ffentlich zug&aauml;nglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Einleitung und Fragestellung

Mutationen im FBN1-Gen (OMIM #134797) sind klinisch mit dem Marfan-Syndrom (MFS, OMIM #154700) assoziiert, einer autosomal dominant vererbten Bindegewebskrankheit mit klinisch relevanten Manifestationen im kardiovaskulären System, im Skelettsystem und am Auge [1], [2]. Haupttodesursache bei MFS stellen Komplikationen im kardiovaskulären System dar, wobei meistens die Bindegewebsschwäche der Aortenwand zur lebensbedrohlichen Dissektion bzw. Ruptur führt [3]. Die Diagnose wird auf Basis von international erarbeiteten klinischen Kriterien, der sog. Genter Nosologie, gestellt [4]. Bei rund 70-90% der MFS Patienten konnte eine FBN1-Mutation nachgewiesen werden [5], [6]. Molekulargenetische Untersuchungen liefern zwar einen wichtigen Beitrag, können die klinische Diagnosik von MFS jedoch nicht ersetzen. Die Identifikation einer FBN1-Mutation stellt aber in Hinblick auf Schweregrad und therapeutisches Management nur einen begrenzten prognostischen Wert dar, wenn kein fundiertes Wissen über den Zusammenhang von Mutation und Phänotyp vorliegt. Derzeit sind wenige gültige Genotyp-Phänotyp Korrelationen für das MFS bekannt [7], [8], [9].

Ziel ist der Aufbau einer FBN1-Forschungsplattform zur Sammlung, Verwaltung und Analyse von genetischer und klinischer Information, um die Identifikation neuer Genotyp-Phänotyp Korrelationen zu ermöglichen, und das daraus erworbene Wissen zuverlässig und zielgerecht für das therapeutische Management am Patienten einzusetzen.

Material und Methoden

Die FBN1-Forschungsplattform besteht aus einem relationalen Datenbank-Managementsystem (RDBMS) zur Datenspeicherung und Verwaltung als zentrale Komponente, sowie einer integrierten Bioinformatik-Plattform zur Datenanalyse. Mittels erweiteter Datenbankanfragen können Datensätze auf unterschiedlichen Ebenen genetischer und klinischer Information extrahiert und mit geeigneten Data Mining Verfahren auf Genotyp-Phänotyp Korrelationen untersucht werden. Um Datenbankanfragen für unsere Fragestellungen durchzuführen, wurde ein Datenbankschema implementiert, das DNA und Proteinsequenzänderungen des FBN1-Gens berücksichtigt. Hierzu wurden sämtliche Mutationsklassen sowie deren Unterklassen (Nukleotid-Substitutionen wie Missense-, Nonsense-, Silent oder Splice Site-Mutationen, Deletionen, Insertionen, Duplikationen sowie komplexere Mutationsformen, wobei letztere oft Rasterverschiebungen mit einem Premature Termination Stop Codon (PTC) oder Exon Skipping verursachen, auf DNA- und Proteinebene modelliert. Auf ähnliche Weise erfolgte die Modellierung des klinischen Phänotyps, wofür die standardisierten diagnostischen Kriterien gemäß der Genter Nosologie als Grundlage dienten. Die betroffenen Organsysteme wie das Skelettsystem, das Auge, das kardiovaskuläre System, die Lunge, die Haut und die Dura mater wurden auf der Ebene der Organbeteiligungen sowie auf der Ebene der einzelnen klinischen Manifestationen getrennt nach sog. Haupt- und Nebenkriterien im Schema berücksichtigt [4].

Zur Durchführung von Genotyp-Phänotyp Untersuchungen wurden folgende Data Mining Verfahren eingesetzt bzw. neu entwickelt:

a) Ein Matching Verfahren wurde zur Klassifikation von klinischen Phänotypen bei unbekannter Mutation sowie für Ähnlichkeitsanfragen bekannter Mutationen an die Datenbank, um Mutationen verwandten Phänotyps zu identifizieren, entwickelt. Um die Effizienz des Matchings zu erhöhen, entwickelten wir Mutations(klassen)-spezifische Scoresets auf Basis des Entropiemaßes und setzten diese für gewichtete Ähnlichkeitsanfragen ein.
b) Zur Identifikation von Mutations-spezifischen diagnostischen Markern verwendeten wir einen genetischen Ansatz, der den Attributraum vorwärtsgerichtet durchsucht (forward selection) und den Informationsgehalt der untersuchten Unterräume mit Hilfe eines maschinellen Lernverfahrens bewertet. Als Lernverfahren wurde die logistische Regressionsanalyse gewählt. Als Ergebnis der Feature Selektion liegt nun ein probabilistisches Modell für den ausgewählten Unterraum mit optimierter Klassifikationsgenauigkeit vor, das dem Kliniker durch Angabe der Wahrscheinlichkeit für die Klassenzugehörigkeit für prognostische und diagnostische Fragestellungen zur Verfügung steht.
c) Die Clusteranalyse wurde eingesetzt, um die Vielfalt der klinischen Manifestationen in Unterklassen (Cluster) sinnvoll zu gruppieren und diese mit entsprechenden Mutationstypen/klassen zu korrelieren. Für die vorliegende Applikation eignet sich besonders das hierarchische Clustering, da es dem Anwender ermöglicht, die gewonnene hierarchische Clusterstruktur mit visuellem Feedback interaktiv zu variieren.

Ergebnisse

Derzeit verfügt unsere Datenbank über 163 Eintragungen mit 127 unterschiedlichen Mutationen: 78 Missense-Mutationen, 27 Nonsense-Mutationen, 14 Splice Site-Substitutionen, 44 Deletionen, Insertionen, Duplikationen oder Indel-Mutationen, wobei die größte Untergruppe Deletionen mit Rasterverschiebung und PTC (n=31) darstellen. Unter Verwendung unserer Data Mining-Plattform konnten auf den bisher vorliegenden Daten folgende Korrelationen auf Basis von 14 Gent-Kriterien gefunden werden: Deletionen mit Rasterverschiebung und PTC zeigten große phänotypische Ähnlichkeit zu Nonsense-Mutationen. Beide Mutationstypen bewirken einen vorzeitigen Abbruch der Proteinsynthese, wobei der Ort der Mutation im Gen keine Rolle zu spielen scheint, und führen zu schweren Ausprägungen des Syndroms. Im Gegensatz dazu wiesen Missense-Mutationen die mildesten phänotypischen Ausprägungen auf und unterschieden sich somit signifikant von den beiden vorherigen Mutationstypen. Ein erhöhtes Risiko hinsichtlich lebensbedrohlicher kardiovaskulärer Komplikationen zeigten Nonsense-Mutationen. Phänotypische Schlüssel-Marker innerhalb dieser drei Mutationsklassen stellten die Ektopia lentis sowie mehrere Skelett-Haupt- und Nebenkriterien dar.

Diskussion und Ausblick

Das Entdecken von Korrelationen zwischen FBN1-Mutation und klinischem Phänotyp stellt eine große Herausforderung für die klinische Bioinformatik der Zukunft dar. Insbesondere die Pleiotropie des klinischen Phänotyps beim MFS lässt diese Aufgabe nahezu unbewältigbar erscheinen.

Die Entwicklung einer Forschungsplattform zur systematischen Sammlung und Verwaltung genetischer und klinischer Daten unter Einbindung geeigneter Datenanalyse-Verfahren ermöglicht nun, sich dieser schwierigen Aufgabe zu stellen und – wie unsere ersten Ergebnisse zeigen – neues Wissen für Diagnostik und Therapie daraus zu generieren. Insbesondere die Vernetzung detaillierter genetischer und klinischer Information ist unumgänglich und erfordert die Entwicklung solcher Forschungsplattformen, wobei für deren Umsetzung eine interdisziplinäre Zusammenarbeit von Klinikern, Genetikern und Informatikern zwingend erforderlich ist. Das sich derzeit im Aufbau befindliche Informationssystem wird in Zukunft via Webportal für Forschungszwecke öffentlich zugänglich sein, um der Untersuchung komplexer klinischer Erscheinungsbilder genetischer Natur wie des MFS durch geeigneten Wissenstransfer besser dienen zu können.


Literatur

1.
OMIM: http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM
2.
Pyeritz RE, Dietz HC. Marfan syndrome and other microfibrillar disorders. In: Royce PM, Steinmann B. editors. Connective tissue and its heritable disorders: molecular. genetic and medical aspects. 2nd ed. New York: Wiley-Liss; 2002. p. 585-626.
3.
Baumgartner D, Baumgartner C, Matyas G, Steinmann B, Löffler J, Schermer E, Schweigmann U, Baldissera I, Frischhut B, Hess J, Hammerer I. Diagnostic power of aortic elastic properties in young patients with Marfan syndrome. J Thorac Cardiovasc Surg 2005; 129: 730-739.
4.
De Paepe A, Devereux RB, Dietz HC, Hennekam RCM, Pyeritz RE. Revised diagnostic criteria for the Marfan syndrome. Am J Med Genet 1996; 62: 417-426.
5.
http://archive.uwcm.ac.uk/uwcm/mg/search/127115.html
6.
Mátyás G, De Paepe A, Halliday D, Boileau C, Pals G, Steinmann B. Evaluation and application of denaturing HPLC for mutation detection in Marfan syndrome: Identification of 20 novel mutations and two novel polymorphisms in the FBN1 gene. Hum Mutat 2002; 19: 443-456.
7.
Baumgartner C, Mátyás G, Steinmann B, Baumgartner D. Marfan syndrome: A diagnostic challenge caused by phenotypic and genetic heterogeneity. Methods Inf Med 2005 (in press).
8.
Tiecke F, Katzke S, Booms P, Robinson PN, Neumann L, Godfrey M, Mathews KR, Scheuner M, Hinkel GK, Brenner RE, Hovels-Gurich HH, Hagemeier C, Fuchs J, Skovby F, Rosenberg T. Classic, atypically severe and neonatal Marfan syndrome: Twelve mutations and genotype-phenotype correlations in FBN1 exons 24-40, Eur J Hum Genet 2001; 9: 13-21.
9.
Pepe G, Giusti B, Evangelisti L, Porcini MC, Brunelli T, Giurlani L, Attanasio M, Fattori R, Bagni C, Comeglio P, Abbate R, Genuini GF. Fibrillin-1 (FBN1) gene frameshift mutations in Marfan patients: Genotype-phenotype correlation. Clin Genet 2001; 59: 444-450.