Modèles extrêmement rares de déséquilibre de liaison dans des études d'associations ancestrales diverses
MaisonMaison > Blog > Modèles extrêmement rares de déséquilibre de liaison dans des études d'associations ancestrales diverses

Modèles extrêmement rares de déséquilibre de liaison dans des études d'associations ancestrales diverses

Aug 24, 2023

Nature Genetics (2023)Citer cet article

293 Accès

30 Altmétrique

Détails des métriques

Le déséquilibre de liaison (LD) est la corrélation entre des variantes génétiques proches. Dans les études d'association génétique, la LD est souvent modélisée à l'aide de grandes matrices de corrélation, mais cette approche est inefficace, en particulier dans les études ancestrales diverses. Dans la présente étude, nous introduisons des modèles graphiques LD (LDGM), qui constituent une représentation extrêmement clairsemée et efficace de LD. Les LDGM sont dérivés de généalogies pangénomiques ; les relations statistiques entre les allèles du LDGM correspondent aux relations généalogiques entre les haplotypes. Nous avons publié des LDGM et des matrices de précision LDGM spécifiques à l'ascendance pour 18 millions de variantes courantes (fréquence des allèles mineurs > 1 %) dans cinq groupes d'ascendance, validé leur précision et démontré des améliorations de l'ordre de grandeur du temps d'exécution pour les calculs de matrice LD couramment utilisés. Nous avons mis en œuvre une méthode de prédiction polygénique multi-ascendance extrêmement rapide, BLUPx-ldgm, qui fonctionne mieux qu'une méthode similaire basée sur la matrice de corrélation LD de référence. Les LDGM permettront d’utiliser des méthodes sophistiquées qui s’adapteront aux données d’associations génétiques ancestrales diverses sur des millions de variantes et d’individus.

Ceci est un aperçu du contenu de l'abonnement, accès via votre institution

Accédez à Nature et à 54 autres revues Nature Portfolio

Obtenez Nature+, notre abonnement d'accès en ligne au meilleur rapport qualité-prix

29,99 $ / 30 jours

annuler à tout moment

Abonnez-vous à cette revue

Recevez 12 numéros imprimés et un accès en ligne

189,00 $ par année

seulement 15,75 $ par numéro

Louer ou acheter cet article

Les prix varient selon le type d'article

à partir de 1,95 $

à 39,95 $

Les prix peuvent être soumis aux taxes locales qui sont calculées lors du paiement

Les LDGM, les matrices de précision LDGM et les séquences d'arbres sont disponibles auprès de Zenodo (réf. 84 ; https://doi.org/10.5281/zenodo.8157131). Des données sur le génotype de 1 000 génomes par phases à couverture élevée sont disponibles sur http://ftp.1000genomes.ebi.ac.uk/vol1/ftp/data_collections/1000G_2504_high_coverage/working/20201028_3202_phased. Les blocs indépendants de LD sont disponibles sur https://github.com/jmacdon/LDblocks_GRCh38. Les statistiques récapitulatives et LD de la biobanque britannique sont disponibles sur s3://broad-alkesgroup-ukbb-ld/UKBB_LD/. Les états ancestraux sont disponibles via la version 100 d'Ensembl et peuvent être téléchargés à partir de ftp://ftp.ensembl.org/pub/release-100/fasta/ancestral_alleles (réf. 83).

Nous avons publié un progiciel open source, ldgm v.0.1, implémenté en python et MATLAB. ldgm permet l'inférence de LDGM et de matrices de précision LDGM, ainsi que des analyses informatiques efficaces des statistiques récapitulatives GWAS à l'aide de LDGM. Il est disponible sur https://github.com/awohns/ldgm et est déposé auprès de Zenodo85 (https://doi.org/10.5281/zenodo.8161389). Toutes les fonctions d'analyse des statistiques récapitulatives GWAS avec les LDGM, y compris BLUPx-ldgm, sont actuellement implémentées dans MATLAB ; une implémentation Python est prévue. BLUPx-ldgm est également implémenté dans bcftools, disponible sur https://github.com/freeseek/score ; tskit est disponible sur https://github.com/tskit-dev/tskit. Des scripts pour reproduire les résultats de ce manuscrit sont disponibles sur https://github.com/awohns/ldgm_paper.

Consortium international HapMap. Une carte d'haplotypes du génome humain. Nature 437, 1299-1320 (2005).

Article Google Scholar

Reich, DE et coll. Déséquilibre de liaison dans le génome humain. Nature 411, 199-204 (2001).

Article CAS PubMed Google Scholar

Abécasis, GR et al. Étendue et répartition du déséquilibre de liaison dans trois régions génomiques. Suis. J. Hum. Genet. 68, 191-197 (2001).

Article CAS PubMed Google Scholar

Finucane, HK et al. Partitionnement de l'héritabilité par annotation fonctionnelle à l'aide de statistiques récapitulatives d'association à l'échelle du génome. Nat. Genet. 47, 1228-1235 (2015).

0.01. c and f show the alternative mean-squared error, defined as m−2 Tr((I−PR)(I−RP)). This measures the difference between PR, the product of the LD correlation matrix and the LDGM precision matrix, and the identity matrix (see Supplementary Note, section 4). Compared with the MSE, the alternative MSE is less sensitive to large eigenvalues of R, probably explaining why it is not elevated for AMR. For the identity matrix, the alternative MSE and the MSE are identical. In all plots, the lower whisker, lower hinge, center, upper hinge and upper whisker correspond to (lower hinge − 1.5× interquartile range (IQR)) and the 25th percentile, median, 75th percentile, and (upper hinge + 1.5× IQR), respectively./p>