全基因組關(guān)聯(lián)分析(GWAS)可以闡明基因組變異與表型之間的關(guān)系,其中CpG二核苷酸的甲基化與常見疾病之間的關(guān)系,體現(xiàn)了表觀遺傳調(diào)控DNA甲基化的重要性,DNA甲基化數(shù)據(jù)庫與其他組學(xué)數(shù)據(jù)一起將有助于研究人員深入研究疾病的表觀遺傳機制。 iMETHYL是DNA甲基化、 SNP和RNA_seq的多組學(xué)聯(lián)合數(shù)據(jù)庫。iMETHYL從近100名志愿者中提取3種類型的細胞,并分別進行WGS, WGBS, RNA_seq測序分析,將最終的數(shù)據(jù)存儲到iMETHYL 數(shù)據(jù)庫中。通過提供CD4 + T淋巴細胞,單核細胞和嗜中性粒細胞的全DNA甲基化(?2400萬個常染色體CpG位點),全基因組(?900萬個單核苷酸變體)和全轉(zhuǎn)錄組(> 14000個基因)數(shù)據(jù)。通過提供多組學(xué)數(shù)據(jù)和QTL信息,整合SNP, DNA甲基化和RNA表達譜的數(shù)據(jù),進行兩兩之間的關(guān)聯(lián)分析,iMETHYL將用作綜合參考數(shù)據(jù),還將幫助研究人員推斷DNA甲基化,基因組變異和基因表達之間的調(diào)控機制。 iMETHYL http://imethyl./index.html 主頁上提供了三種搜索方式,分別是Gene Symbol、dbSNP rsID、Position chr。 以dbSNP rsID的rs671為例進行搜索,展現(xiàn)結(jié)果如下: 在多個位置找到“ rs671”, iMETHYL讓我們選擇選擇要查看的位置,這里我們選第一個,chr12:112241765..112241766,點擊show,檢索的結(jié)果通過基因組瀏覽器展示如下: 頂部紅黃藍方塊對應(yīng)參考序列,我們可以在基因區(qū)域的細胞類型中找到差異甲基化的CpG位點。單擊CpG軌道中的欄,可以在彈出窗口中查看每個CpG站點的甲基化水平分布。RNA_seq的數(shù)據(jù),通過FPKM進行展示,在基因組瀏覽器中會給出每種細胞,檢測到的轉(zhuǎn)錄本。 左側(cè)可以看到DNA甲基化,轉(zhuǎn)錄組數(shù)據(jù)和SNV數(shù)據(jù)在基因組瀏覽器中的展示方式。IMM:3 cell-types用于顯示每個細胞系甲基化,基因表達量和SNV的結(jié)果。 IMM:3種細胞類型信息內(nèi)涵如下: CpG_CD4T,CpG_Mono,CpG_Neu:每個CpG站點的信息。 CpG_CD4T_avg,CpG_Mono_avg,CpG_Neu_avg:每個CpG位點的平均甲基化水平。 CpG_CD4T_sd,CpG_Mono_sd,CpG_Neu_sd:每個CpG位點甲基化水平的SD(標(biāo)準(zhǔn)差)。 CpG_CD4T_RI,CpG_Mono_RI,CpG_Neu_RI:每個CpG位點甲基化水平的RI(參考間隔)。 FPKM_CD4T,F(xiàn)PKM_Mono,F(xiàn)PKM_Neu:每個轉(zhuǎn)錄本的FPKM(外顯子每千堿基的片段/所映射的百萬個片段)值。 SNV_CD4T,SNV_Mono,SNV_Neu:SNV(單核苷酸變體,次要等位基因計數(shù)> 1,檢出率≥50%)。 圖中左側(cè)打鉤的內(nèi)容分別對應(yīng)右側(cè)的橫條狀: 點擊FPKM-CD4T藍色條狀之后會展示數(shù)據(jù)的名稱、位置chr12、長度、類型、每個基因的表達水平分布、ID、對數(shù)刻度-fpkm_sd、Seq_id、區(qū)域序列,具體如下:
單擊SNV軌道中的欄,可以在彈出窗口中查看每個SNV的詳細信息。 對于3種組學(xué)的數(shù)據(jù),imethy還通過QTL分析兩兩之間的關(guān)聯(lián)。 IMM All tracks是指:從20個人的WGBS獲得的每個細胞群的每個CpG位點的平均甲基化水平。 IMM:QTL分析概念解釋: eQTL:eQTL分析的結(jié)果(僅顯示FDR≤0.05的結(jié)果)。 eQTM:eQTM分析的結(jié)果(僅顯示FDR≤0.05的結(jié)果)。 mQTL:mQTL分析的結(jié)果(僅顯示FDR≤0.05的結(jié)果)。 基因型和基因表達譜之間的關(guān)聯(lián)分析通過cis-eQTL來實現(xiàn),DNA甲基化和基因表達譜之間的關(guān)聯(lián)分析通過cis-eQTM來實現(xiàn),DNA甲基化與基因型之間的關(guān)聯(lián)分析通過cis-mQTL來實現(xiàn)。imethy針對每個數(shù)據(jù)集(單核細胞,CD4 + T細胞,中性粒細胞和PBMC)測試了基因型和基因表達(cis-eQTL),DNA甲基化和基因表達(cis-eQTM)和基因型和DNA甲基化(cis-mQTL)之間的關(guān)聯(lián)。將順式鄰近度定義為距離±5kb,并將簡單線性回歸擬合在每個分析中。 在STATISTICS頁面,提供了以下關(guān)于數(shù)據(jù)源基本信息。 人口統(tǒng)計資料和QTL分析的統(tǒng)計數(shù)據(jù): 我們可以從iMETHYL下載一些數(shù)據(jù)集:單核細胞、CD4T和中性粒細胞的DNA甲基化摘要數(shù)據(jù)、單核苷酸變異總結(jié)數(shù)據(jù)、基因表達摘要數(shù)據(jù)、8種血細胞類型中X染色體的性別特異性DNA甲基化摘要數(shù)據(jù)這些數(shù)據(jù)庫……都可以下載。 總而言之,iMETHYL是一個以DNA甲基化為中心,提供全面的多組學(xué)數(shù)據(jù)庫,里面的數(shù)據(jù)可以作為表觀遺傳研究等的基礎(chǔ)或參考。有興趣的可以記得收藏起來,以免迷路走失~
1.Iwate Tohoku Medical Megabank Organization, iMETHYL Database; over 100 Japanese whole genome DNA methylation database from monocytes, CD4+ T cells, and neutrophils, (access date), http://imethyl./2.T. Hachiya et al. "Genome-wide identification of inter-individually variable DNA methylation sites improves the efficacy of epigenetic association studies" NPJ Genom Med. 2017. 2:11
|