Artikel
Statistische Analyse zum 500K-SNP Scan im KORA-Kollektiv
Suche in Medline nach
Autoren
Veröffentlicht: | 6. September 2007 |
---|
Gliederung
Text
Einleitung / Hintergrund: Während in Vergangenheit Assoziationsstudien darauf zielten, nach den Krankheitsvarianten innerhalb bekannter Kopplungsregionen oder biologisch plausibler Gene zu suchen, ermöglicht die weiter fortschreitende Genotypisierungstechnologie, diese Suche genomweit mit bis zu 500000 SNPs zu betreiben. Aufgrund der hohen Anzahl an SNPs bedarf es einer geeigneten Korrektur der statistischen Signifikanzgrenze. Bonferroni Korrektur ist oft zu konservativ und beeinträchtigt somit die Power der Studie. Am Beispiel der KORA-500K-SNP-Daten mit BMI als Zielphänotyp stellen wir Strategien vor für die statistische Analyse genomweiter Assoziationsstudien vor.
Material und Methoden: 1644 unverwandte Probanden (Frauenanteil 50.5% , Durchschnittsalter 62.5+/-10.1 , Durchschnitts-BMI 28.1+/-4.5) aus dem KORA-S3-Kollektiv wurden genomweit mittels 500K Affymetrix SNPchip typisiert. SNPs mit niedriger Call-Rate (<90%) oder SNPs im Hardy-Weinberg-Ungleichgewicht (p<0.001) wurden von der Analyse ausgeschlossen.
Statistische Auswertung erfolgte in Form von Test auf Korrelation zwischen Genotyp und BMI unter Verwendung eines additiven, rezessiven und dominaten genetischen Modells hinsichtlich des selteneren Allels. Die entsprechenden für Geschlecht und Alter adjustierten BMI-Effekte der SNPs wurden geschätzt. Wir stellen ein Monte-Carlo-basiertes, mulitples Testverfahren vor, mit dessen Hilfe das multiple Signifikanzniveau auf 5% beschränkt bleibt [Ref. 1]. Im Rahmen eines zweistufigen Ansatzes sollen im nächsten Schritt die aussichtsreichsten SNPs in familienbasierten Assoziationsstudien „validiert“ werden.
Ergebnisse: Momentan ist die Auswertung noch im Gange. Etwa 9% der SNPs wurden wegen schlechter Qualität (s. Methodenteil) ausgeschlossen. Wir erhalten 59 SNPs mit Nominal-P-Wert <0.0001.
Diskussion: Wir werden den explorativen Charakter unserer Analyse eingehen, da der mehrstufige Ansatz lediglich zur Reduzierung der Genotypisierungskosken und nicht zur Absicherung der Befunde beiträgt. Unabhängige Replikationsstudien sind deshalb unabdingbar. Wir diskutieren an diesem Beispiel den häufig unpräzise verwendeten Begriff der „Validierung“.
Referenzen:
Lin DY. An efficient Monte Carlo approach to assessing statistical significance in genomic studies. Bioinformatics. 2005 Mar;21(6):781-7. Epub 2004 Sep 28.