gms | German Medical Science

GMDS 2012: 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

16. - 20.09.2012, Braunschweig

ATOMIC – Ein R-Paket zur automatisierten Beurteilung von Genotyp-Callings

Meeting Abstract

Suche in Medline nach

  • Arne Schillert - Universität zu Lübeck, Universitätsklinikum Schleswig-Holstein, Campus Lübeck, Deutschland
  • Andreas Ziegler - Universität zu Lübeck, Universitätsklinikum Schleswig-Holstein, Campus Lübeck, Deutschland

GMDS 2012. 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Braunschweig, 16.-20.09.2012. Düsseldorf: German Medical Science GMS Publishing House; 2012. Doc12gmds129

DOI: 10.3205/12gmds129, URN: urn:nbn:de:0183-12gmds1298

Veröffentlicht: 13. September 2012

© 2012 Schillert et al.
Dieser Artikel ist ein Open Access-Artikel und steht unter den Creative Commons Lizenzbedingungen (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.de). Er darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden, vorausgesetzt dass Autor und Quelle genannt werden.


Gliederung

Text

Fehlerhafte Genotypzuweisung während des Genotyp-Callings kann die Ergebnisse genomweiter Assoziationsstudien verfälschen. Wir haben kürzlich einen Algorithmus entwickelt, um fehlgeschlagene Genotypzuweisungen automatisch zu detektieren [1]. Dabei haben wir Ellipsen um die Genotyp-Cluster konstruiert und die Anzahl der Punkte gezählt, die zu dicht an einem fremden Cluster lagen. Dieses Verfahren haben wir jetzt substantiell verbessert und erweitert. Zum einen betrachten wir nun die Kontraste der Intensitäten gegen die Summe, was eine robustere Auswertung ermöglicht. Zum anderen verwenden wir Tests auf Unimodalität [2], [3], um die Homogenität der Genotyp-Cluster zu beurteilen. Die Handhabung der Signalintensitäten stellt aufgrund der Dateigröße eine Herausforderung dar. Wir teilen die Datei in beliebig viele Stücke auf, um paralleles Rechnen zu ermöglichen. Die Konvertierung dieser Stücke in das DatABEL-Format ermöglicht die einfache Verknüpfung mit den Genotypinformationen, die als GenABEL-Objekte [4] gespeichert werden. Wir haben den Algorithmus auf verschiedene Datensätze und Genotypisierungs-Chips angewandt und werden die Ergebnisse hinsichtlich der Häufung bestimmter SNPs vorstellen.


Literatur

1.
Schillert, et al. BMC Proc. 2009;3:S58.
2.
Larkin. Behav Res Meth Instr. 1979;11:467-8.
3.
Engelman, Hartigan. J Am Stat Assoc. 1969;64:1647-8.
4.
Aulchenko. Bioinformatics. 2007;23:1294-6.