Modèles extrêmement rares de déséquilibre de liaison dans des études d'associations ancestrales diverses
Nature Genetics (2023)Citer cet article
293 Accès
30 Altmétrique
Détails des métriques
Le déséquilibre de liaison (LD) est la corrélation entre des variantes génétiques proches. Dans les études d'association génétique, la LD est souvent modélisée à l'aide de grandes matrices de corrélation, mais cette approche est inefficace, en particulier dans les études ancestrales diverses. Dans la présente étude, nous introduisons des modèles graphiques LD (LDGM), qui constituent une représentation extrêmement clairsemée et efficace de LD. Les LDGM sont dérivés de généalogies pangénomiques ; les relations statistiques entre les allèles du LDGM correspondent aux relations généalogiques entre les haplotypes. Nous avons publié des LDGM et des matrices de précision LDGM spécifiques à l'ascendance pour 18 millions de variantes courantes (fréquence des allèles mineurs > 1 %) dans cinq groupes d'ascendance, validé leur précision et démontré des améliorations de l'ordre de grandeur du temps d'exécution pour les calculs de matrice LD couramment utilisés. Nous avons mis en œuvre une méthode de prédiction polygénique multi-ascendance extrêmement rapide, BLUPx-ldgm, qui fonctionne mieux qu'une méthode similaire basée sur la matrice de corrélation LD de référence. Les LDGM permettront d’utiliser des méthodes sophistiquées qui s’adapteront aux données d’associations génétiques ancestrales diverses sur des millions de variantes et d’individus.
Ceci est un aperçu du contenu de l'abonnement, accès via votre institution
Accédez à Nature et à 54 autres revues Nature Portfolio
Obtenez Nature+, notre abonnement d'accès en ligne au meilleur rapport qualité-prix
29,99 $ / 30 jours
annuler à tout moment
Abonnez-vous à cette revue
Recevez 12 numéros imprimés et un accès en ligne
189,00 $ par année
seulement 15,75 $ par numéro
Louer ou acheter cet article
Les prix varient selon le type d'article
à partir de 1,95 $
à 39,95 $
Les prix peuvent être soumis aux taxes locales qui sont calculées lors du paiement
Les LDGM, les matrices de précision LDGM et les séquences d'arbres sont disponibles auprès de Zenodo (réf. 84 ; https://doi.org/10.5281/zenodo.8157131). Des données sur le génotype de 1 000 génomes par phases à couverture élevée sont disponibles sur http://ftp.1000genomes.ebi.ac.uk/vol1/ftp/data_collections/1000G_2504_high_coverage/working/20201028_3202_phased. Les blocs indépendants de LD sont disponibles sur https://github.com/jmacdon/LDblocks_GRCh38. Les statistiques récapitulatives et LD de la biobanque britannique sont disponibles sur s3://broad-alkesgroup-ukbb-ld/UKBB_LD/. Les états ancestraux sont disponibles via la version 100 d'Ensembl et peuvent être téléchargés à partir de ftp://ftp.ensembl.org/pub/release-100/fasta/ancestral_alleles (réf. 83).
Nous avons publié un progiciel open source, ldgm v.0.1, implémenté en python et MATLAB. ldgm permet l'inférence de LDGM et de matrices de précision LDGM, ainsi que des analyses informatiques efficaces des statistiques récapitulatives GWAS à l'aide de LDGM. Il est disponible sur https://github.com/awohns/ldgm et est déposé auprès de Zenodo85 (https://doi.org/10.5281/zenodo.8161389). Toutes les fonctions d'analyse des statistiques récapitulatives GWAS avec les LDGM, y compris BLUPx-ldgm, sont actuellement implémentées dans MATLAB ; une implémentation Python est prévue. BLUPx-ldgm est également implémenté dans bcftools, disponible sur https://github.com/freeseek/score ; tskit est disponible sur https://github.com/tskit-dev/tskit. Des scripts pour reproduire les résultats de ce manuscrit sont disponibles sur https://github.com/awohns/ldgm_paper.
Consortium international HapMap. Une carte d'haplotypes du génome humain. Nature 437, 1299-1320 (2005).
Article Google Scholar
Reich, DE et coll. Déséquilibre de liaison dans le génome humain. Nature 411, 199-204 (2001).
Article CAS PubMed Google Scholar
Abécasis, GR et al. Étendue et répartition du déséquilibre de liaison dans trois régions génomiques. Suis. J. Hum. Genet. 68, 191-197 (2001).
Article CAS PubMed Google Scholar
Finucane, HK et al. Partitionnement de l'héritabilité par annotation fonctionnelle à l'aide de statistiques récapitulatives d'association à l'échelle du génome. Nat. Genet. 47, 1228-1235 (2015).