gms | German Medical Science

GMDS 2012: 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

16. - 20.09.2012, Braunschweig

ATOMIC – Ein R-Paket zur automatisierten Beurteilung von Genotyp-Callings

Meeting Abstract

Search Medline for

  • Arne Schillert - Universität zu Lübeck, Universitätsklinikum Schleswig-Holstein, Campus Lübeck, Deutschland
  • Andreas Ziegler - Universität zu Lübeck, Universitätsklinikum Schleswig-Holstein, Campus Lübeck, Deutschland

GMDS 2012. 57. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Braunschweig, 16.-20.09.2012. Düsseldorf: German Medical Science GMS Publishing House; 2012. Doc12gmds129

DOI: 10.3205/12gmds129, URN: urn:nbn:de:0183-12gmds1298

Published: September 13, 2012

© 2012 Schillert et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution License (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). You are free: to Share – to copy, distribute and transmit the work, provided the original author and source are credited.


Outline

Text

Fehlerhafte Genotypzuweisung während des Genotyp-Callings kann die Ergebnisse genomweiter Assoziationsstudien verfälschen. Wir haben kürzlich einen Algorithmus entwickelt, um fehlgeschlagene Genotypzuweisungen automatisch zu detektieren [1]. Dabei haben wir Ellipsen um die Genotyp-Cluster konstruiert und die Anzahl der Punkte gezählt, die zu dicht an einem fremden Cluster lagen. Dieses Verfahren haben wir jetzt substantiell verbessert und erweitert. Zum einen betrachten wir nun die Kontraste der Intensitäten gegen die Summe, was eine robustere Auswertung ermöglicht. Zum anderen verwenden wir Tests auf Unimodalität [2], [3], um die Homogenität der Genotyp-Cluster zu beurteilen. Die Handhabung der Signalintensitäten stellt aufgrund der Dateigröße eine Herausforderung dar. Wir teilen die Datei in beliebig viele Stücke auf, um paralleles Rechnen zu ermöglichen. Die Konvertierung dieser Stücke in das DatABEL-Format ermöglicht die einfache Verknüpfung mit den Genotypinformationen, die als GenABEL-Objekte [4] gespeichert werden. Wir haben den Algorithmus auf verschiedene Datensätze und Genotypisierungs-Chips angewandt und werden die Ergebnisse hinsichtlich der Häufung bestimmter SNPs vorstellen.


Literatur

1.
Schillert, et al. BMC Proc. 2009;3:S58.
2.
Larkin. Behav Res Meth Instr. 1979;11:467-8.
3.
Engelman, Hartigan. J Am Stat Assoc. 1969;64:1647-8.
4.
Aulchenko. Bioinformatics. 2007;23:1294-6.