小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

GWAS中的genotype imputation簡介

 生信修煉手冊 2019-12-24

GWAS用于尋找與疾病或者特定性狀相關聯(lián)的SNP位點,為了更加有效的挖掘信息,GWAS需要大樣本量和高密度的SNP分型結(jié)果,最佳的分型方案當然是全基因組測序,然而成百上千個樣本的全基因組測序其成本依然是巨大的,目前更加經(jīng)濟有效的方案是GWAS芯片,針對特定人群,利用tag SNP的思想設計探針,覆蓋的SNP位點在幾十M的數(shù)量級。

相比全基因組測序,GWAS芯片確實更加經(jīng)濟,但是其缺點也是顯而易見的,只能夠分析挖掘已知的SNP位點,而且位點數(shù)據(jù)量相對較少,要知道一個全基因組測序分析得到的SNP位點在幾百M左右。為了解決這個問題,科學家提出了基因型填充的思想。

genotype imputation,稱之為基因型填充,基本思想是利用單倍型來推斷芯片未覆蓋到的SNP位點的分型結(jié)果,在家系數(shù)據(jù)和獨立樣本的分析中都適用。家系樣本基因型填充的過程示意如下

部分樣本具有較為完整的SNP分型結(jié)果,依據(jù)這些樣本的分型結(jié)果構(gòu)建在家系樣本中共享的單倍型,對應圖中方框標記的完整分型結(jié)果,針對基因型缺失的樣本,根據(jù)親緣關系推斷該樣本可能的單倍型,對于基因型缺失的位點,直接使用對應單倍型中的分型結(jié)果進行填充。

獨立樣本的基因型填充過程示意如下

首先需要有一個參照的單倍型,根據(jù)樣本已有的分型結(jié)果,與參照的單倍型進行比較,確定其可能所屬的單倍型,然后進行填充。

以上示意圖來自下列文獻

Genotype Imputation
https://www.ncbi.nlm./pmc/articles/PMC2925172/

從以上示意圖可以看出,基因型填充有兩個必要條件,第一個條件就是參照的單倍型,對于獨立樣本,可以采用hapmap或者1000G等項目的單倍型作為參照,第二個條件就是已知分型結(jié)果位點的比例和分布,對于需要填充的樣本,要保證一定密度的分型結(jié)果,需要根據(jù)已有的分型結(jié)果來推斷該樣本可能的單倍型,分型結(jié)果已知的位點越多,其單倍型推斷的準確性越高,填充的準確性才會越高,根據(jù)這個條件來看,GWAS芯片最適合進行基因型填充,因為其覆蓋的SNP位點的數(shù)量和分布更有助于推測樣本的單倍型。

目前已經(jīng)有很多用于基因型填充的軟件,部分列表如下

  1. Beagle

  2. IMPUTE2

  3. MACH

后續(xù)會詳細介紹各自的用法。

·end·

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多