gms | German Medical Science

GMDS 2015: 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e. V. (GMDS)

Deutsche Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie

06.09. - 09.09.2015, Krefeld

Die genetische Prädisposition für häufige Erkrankungen: Bildung von genetischen Risiko-Scores als Ansatz zur Erhöhung der Power bei kleinen Studienpopulationen

Meeting Abstract

  • Anke Hüls - IUF - Leibniz-Institut für umweltmedizinische Forschung, Deutschland
  • Katja Ickstadt - Technische Universität Dortmund, Dortmund, Deutschland
  • Tamara Schikowski - IUF - Leibniz-Institut für umweltmedizinische Forschung, Deutschland
  • Andrea Vierkötter - IUF - Leibniz-Institut für umweltmedizinische Forschung, Deutschland
  • Ursula Krämer - IUF - Leibniz-Institut für umweltmedizinische Forschung, Deutschland

GMDS 2015. 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Krefeld, 06.-09.09.2015. Düsseldorf: German Medical Science GMS Publishing House; 2015. DocAbstr. 082

doi: 10.3205/15gmds147, urn:nbn:de:0183-15gmds1471

Published: August 27, 2015

© 2015 Hüls et al.
This is an Open Access article distributed under the terms of the Creative Commons Attribution 4.0 License. See license information at http://creativecommons.org/licenses/by/4.0/.


Outline

Text

Einleitung: Eine Grundvoraussetzung zur Entdeckung der Assoziation zwischen verschiedenen Einzelnukleotid-Polymorphismen (SNPs) und dem Auftreten einer häufigen Erkrankung sind sehr große Datenmengen aus populationsbasierten Studien mit mehreren tausenden oder gar zehntausenden Probanden, da das multiple Testproblem zu einer sehr starken Verringerung der Teststärke (Power) führt. Da jedoch die meisten europäischen Kohorten-Studien nur einige hundert oder einige tausend Probanden umfassen, wird eine Methode benötigt, um die genetische Prädisposition für häufige Erkrankungen auch in kleineren Studien analysieren zu können.

In genomweiten Assoziationsstudien wurde nachgewiesen, dass nicht nur einzelne SNPs mit dem Auftreten häufiger Erkrankungen assoziiert sind, sondern eher eine Kombination aus verschiedenen SNPs. Ein aus inhaltlicher und methodischer Sicht vielversprechender Ansatz zur Erhöhung der Power in solchen Assoziationsstudien ist es daher, statt einzelner SNPs einen genetischen Risiko-Score zu verwenden, bei dem eine gewichtete Summe aus möglichen Risikoallelen gebildet wird [1]. Zur Gewinnung der Gewichte werden zunächst alle SNPs, bei denen ein Einfluss auf die Erkrankung angenommen wird (zum Beispiel nach einer Literaturrecherche), in einem Regressionsmodel zur Analyse des gemeinsamen Einflusses auf die Erkrankung zusammengefasst. Die Gewichte zur Bildung der Risiko-Scores ergeben sich dann aus den daraus geschätzten Koeffizienten. Das klassische Regressionsmodell zur Berechnung der Koeffizienten ist hierbei die Logistische Regression [2]. Bei einer großen Anzahl oder einer hohen Korrelation (hohes Linkage-Disequilibrium) der berücksichtigten SNPs können die Verwendung von Shrinkage-Methoden wie die Ridge- oder LASSO-Regression jedoch von Vorteil sein, da durch diese zugleich eine Art Variablenselektion durchgeführt wird [3]. Der resultierende gewichtete genetische Risiko-Score wird dann als Einflussvariable in ein logistisches Regressionsmodell aufgenommen, um den Effekt des Risiko-Scores auf das Auftreten der Erkrankung zu schätzen.

Wir führten eine Simulationsstudie durch, um die Power unterschiedlich gewichteter Risiko-Scores, mit der bekannte genetische Prädispositionen entdeckt werden können, zu bewerten. Außerdem erfolgt ein Vergleich mit der klassischen Analyse von einzelnen SNPs in separaten logistischen Regressionsmodellen mit Bonferroni-Adjustierung.

Material und Methoden: Als Ausgangsdatensatz für die Simulationsstudie dient der Beispieldatensatz aus dem R-Paket PredictABEL [2]. Dieser wurde in Anlehnung an eine empirische Studie zur altersbedingten Makuladegeneration (AMD) konstruiert, was die Hauptursache einer Erblindung bei über Fünfzigjährigen ist. Der Datensatz beinhaltet für 10.000 Probanden je sechs unkorrelierte genetische Risikofaktoren (SNPs) und 6 nicht-genetische Kovariablen für die Entstehung einer AMD. Für die Berechnung der Power wurden aus diesem Datensatz wiederholt zufällige Stichproben unterschiedlicher Größe (100-1000 Probanden) gezogen und anschließend wurde berechnet, wie oft die oben beschriebenen Modelle die signifikanten Effekte der genetischen Risikofaktoren aufdecken konnten. Alle Modelle wurden dabei für die nicht-genetischen Kovariablen adjustiert. Um zu bewerten, welchen Einfluss die Anzahl und die Korrelation der berücksichtigten SNPs auf die Power der unterschiedlich gewichteten Risiko-Scores haben, wurde der Beispieldatensatz zudem um unterschiedlich stark korrelierte SNPs erweitert.

Ergebnisse und Diskussion: Unsere Simulationsstudie zeigt, dass die Bildung von genetischen Risiko-Scores zu einer deutlichen Erhöhung der Power führt, wodurch eine genetische Prädisposition für häufige Erkrankungen selbst in kleinen Studienpopulationen entdeckt werden kann. Bei sechs unkorrelierten SNPs, deren Einfluss auf eine Erkrankung in separaten logistischen Regressionsmodellen mit Bonferroni-Adjustierung nur mit einer Power von 0.03 bis 35.31% aufgedeckt werden konnte, führte die Bildung von genetischen Risiko-Scores beispielsweise zu einer Erhöhung der Power auf 94% (Stichprobengröße n=200, 10.000 Wiederholungen, Gewichtung durch Koeffizienten der logistischen Regression). Die am besten geeignete Gewichtung der Risiko-Scores hängt von der Anzahl und der Korrelation der berücksichtigten SNPs ab. Bei einer großen Anzahl hoch korrelierter SNPs sind Shrinkage-Methoden von Vorteil.


Literatur

1.
Paynter NP, Chasman DI, Pare G, Buring JE, Cook NR, Miletich JP, et al. Association between a literature-based genetic risk score and cardiovascular events in women. J Am Med Assoc. 2010;303:631–7.
2.
Kundu S, Aulchenko YS, van Duijn CM, Janssens a CJW. PredictABEL: an R package for the assessment of risk prediction models. Eur J Epidemiol. 2011;26:261–4.
3.
Waldmann P, Mészáros G, Gredler B, Fuerst C, Sölkner J. Evaluation of the lasso and the elastic net in genome-wide association studies. Front Genet. 2013;4:1–11.