之前我們講到,既然孟德?tīng)栯S機(jī)化在臨床研究中出現(xiàn),注定這種研究方法以后就不會(huì)缺席,未來(lái)它可能作為單獨(dú)角色存在,也可能更多作為研究中的一部分,起到發(fā)現(xiàn)或驗(yàn)證的作用。 盡管目前孟德?tīng)栯S機(jī)化已經(jīng)發(fā)展了各種類型,但要學(xué)習(xí)孟德?tīng)栯S機(jī)化,搞懂兩樣本是最基本的。 本節(jié)內(nèi)容我們談?wù)勅绾瓮瓿梢粋€(gè)簡(jiǎn)單的兩樣本孟德?tīng)栯S機(jī)化分析。 一 孟德?tīng)栯S機(jī)化分析流程 01 數(shù)據(jù)獲取 進(jìn)行孟德?tīng)栯S機(jī)化研究時(shí),需要首先確定所選用的暴露與結(jié)局?jǐn)?shù)據(jù)。 可以選擇在相關(guān)的GWAS數(shù)據(jù)庫(kù)如GWAS catalog數(shù)據(jù)庫(kù)(https://www./gwas/)和IEU數(shù)據(jù)庫(kù)(https://gwas./)等中查找,也可以選擇從GWAS原文中獲取或者從已經(jīng)發(fā)表的MR文章中獲取。 02 選擇工具變量 在暴露數(shù)據(jù)中挑選符合孟德?tīng)栯S機(jī)化假設(shè)的工具變量,一般步驟包括: ①通過(guò)關(guān)聯(lián)性分析,挑選與暴露因素強(qiáng)相關(guān)的SNP作為工具變量,篩選條件為p <5e-08); ②進(jìn)一步去除連鎖不平衡的SNP,連鎖不平衡是指基因組位置相近的遺傳變異更傾向于共同遺傳,導(dǎo)致分屬兩個(gè)或兩個(gè)以上基因座位的等位基因同時(shí)出現(xiàn)在一條染色體上的幾率,高于隨機(jī)出現(xiàn)的頻率。 如果看不懂,就記住一句話,連鎖代表著非隨機(jī),而我們要的是隨機(jī)! ②進(jìn)一步去除連鎖不平衡的SNP,連鎖不平衡是指基因組位置相近的遺傳變異更傾向于共同遺傳,導(dǎo)致分屬兩個(gè)或兩個(gè)以上基因座位的等位基因同時(shí)出現(xiàn)在一條染色體上的幾率,高于隨機(jī)出現(xiàn)的頻率。 如果看不懂,就記住一句話,連鎖代表著非隨機(jī),而我們要的是隨機(jī)! ③去除弱工具變量,即去除與暴露因素不具有強(qiáng)相關(guān)性,或只能解釋小部分表型變異的工具變量,篩選標(biāo)準(zhǔn)一般為F檢驗(yàn)值>10; ④根據(jù)混雜因素進(jìn)一步篩選工具變量,一般通過(guò)PhenoScanner網(wǎng)站(http://www.phenoscanner.medschl./)進(jìn)行。 03 進(jìn)行孟德?tīng)栯S機(jī)化分析 兩樣本研究通常使用匯總數(shù)據(jù),簡(jiǎn)單說(shuō),每個(gè)SNP對(duì)應(yīng)一個(gè)計(jì)算的暴露與結(jié)局的關(guān)聯(lián)分析值(β、se),當(dāng)有多個(gè)工具變量(SNP)時(shí),需要的是最后的匯總結(jié)果(薈萃結(jié)果),這里有點(diǎn)Meta分析數(shù)據(jù)合并的意思。 一共有18種方法(18般武藝?。?,我們最常用的分析方法(最權(quán)威的方法)為逆方差加權(quán)(inverse-variance weighted, IVW)方法,其特點(diǎn)為回歸時(shí)不考慮截距項(xiàng)的存在并且用結(jié)局方差(se的二次方)的倒數(shù)作為權(quán)重來(lái)進(jìn)行擬合。 MR-Egger法與IVW最大的區(qū)別就是回歸時(shí)考慮截距項(xiàng)的存在,其他的方法還包括加權(quán)中位數(shù)估計(jì)(Weighted median, WM),為所有的個(gè)體SNP效應(yīng)值按照權(quán)重排序后得到的分布函數(shù)的中位數(shù)。 MR-PRESSO法,可以通過(guò)排除異常值排除特定的SNP以獲得更加接近真實(shí)值的估計(jì)值。 04 進(jìn)行敏感性分析 (1)敏感性分析旨在評(píng)估結(jié)果的可靠性,主要目的有三: ①判斷結(jié)果的穩(wěn)定性和可信度; ②探究潛在的偏倚,如基因的多效性或數(shù)據(jù)的異質(zhì)性; ③評(píng)估某個(gè)工具變量是否顯著影響結(jié)局變量。 (2)廣義的敏感性分析方法包括: 基因多效性檢驗(yàn);異質(zhì)性檢驗(yàn);“l(fā)eave-one-out”法。 1)基因多效性檢驗(yàn) MR-PRESSO是2018年在Nature Genetics上發(fā)布的一個(gè)方法(https://www./articles/s41588-018-0099-7),用于檢測(cè)孟德?tīng)栯S機(jī)化中的水平多效性。 孟德?tīng)栯S機(jī)化分析基于三個(gè)核心假設(shè),其中之一是工具變量(通常是遺傳標(biāo)記)應(yīng)僅通過(guò)暴露變量(exposure)來(lái)影響結(jié)果變量(outcome)。 如果工具變量能夠繞過(guò)暴露變量直接影響結(jié)果,那么就違反了孟德?tīng)栯S機(jī)化的基本原則,這種情況被稱為水平多效性。 水平多效性描述的是在暴露因素為0的情況下,工具變量仍對(duì)結(jié)果產(chǎn)生影響,這通常是因?yàn)榇嬖谄渌幕祀s因素。 直觀來(lái)說(shuō),就是散點(diǎn)圖中的y軸截距是否為0。如果水平多效性檢驗(yàn)顯著,意味著工具變量不僅與暴露變量有關(guān),還與其他潛在的混雜因素有關(guān)。 此時(shí)孟德?tīng)栯S機(jī)化研究結(jié)論會(huì)變得不夠穩(wěn)健。 在R語(yǔ)言中,可以采用mr_pleiotropy_test(此方法核心分析方法)或者M(jìn)R-PRESSO global test來(lái)檢測(cè)水平多效性。 01_mr_pleiotropy_test: 代碼:mr_pleiotropy_test(dat) 結(jié)果解讀:MR-Egger的截距項(xiàng)egger_intercept和0進(jìn)行統(tǒng)計(jì)檢驗(yàn),若無(wú)統(tǒng)計(jì)學(xué)差異,即pval > 0.05,可以認(rèn)為不存在水平多效性。 02_MR-PRESSO: MR-PRESSO global test也可以用來(lái)檢測(cè)水平多效性 2)異質(zhì)性檢驗(yàn) 兩樣本孟德?tīng)栯S機(jī)化分析時(shí)暴露和結(jié)局?jǐn)?shù)據(jù)源于不同的樣本,可能存在人群異質(zhì)性,需要進(jìn)行異質(zhì)性檢驗(yàn),此時(shí)檢驗(yàn)p <0.05。 異質(zhì)性并不會(huì)影響研究的結(jié)論,但在文章中應(yīng)明確其是否存在。 可以通過(guò)命令mr_heterogeneity(dat)進(jìn)行異質(zhì)性檢驗(yàn),結(jié)果主要查看Cochran’s Q test的P值,即第二行method-Inverse variance weighted的Q_pval,當(dāng)P < 0.05時(shí),說(shuō)明存在顯著異質(zhì)性。 異質(zhì)性在孟德?tīng)栯S機(jī)化中比較常見(jiàn),尤其是SNP比較多時(shí)。 這是可以接受的,但它的存在可能會(huì)影響我們選擇的估計(jì)方法。 在沒(méi)有顯著異質(zhì)性的情況下,隨機(jī)效應(yīng)和固定效應(yīng)的估計(jì)結(jié)果是一致的,沒(méi)有精度損失。 然而,當(dāng)存在較大異質(zhì)性時(shí),固定效應(yīng)可能會(huì)過(guò)于精確,應(yīng)考慮到這種異質(zhì)性。 如果隨機(jī)效應(yīng)分析顯示有因果效應(yīng),這意味著有證據(jù)支持暴露與結(jié)果之間的因果關(guān)系,并解釋了異質(zhì)性的存在。 簡(jiǎn)而言之: 當(dāng)P > 0.05時(shí),可以選擇mr_ivw_fe()或mr_ivw_mre();當(dāng)存在異質(zhì)性時(shí),推薦使用mr_ivw_mre()。 3)“l(fā)eave-one-out”法 “l(fā)eave-one-out”方法逐一剔除每個(gè)SNP,然后計(jì)算剩余SNP的meta效應(yīng),從而觀察結(jié)果在移除特定SNP后是否會(huì)有顯著變動(dòng)。 如果某一特定SNP的移除導(dǎo)致結(jié)果發(fā)生明顯變化,這意味著該SNP對(duì)整體結(jié)果有很大影響,這通常是我們不愿看到的情況。 我們希望在逐一移除任何SNP后,結(jié)果仍然保持相對(duì)穩(wěn)定,即在去除任意SNP后,整體的誤差線變動(dòng)范圍較小。 例如,若所有誤差線始終在0的右側(cè)或左側(cè),就說(shuō)明結(jié)果是可靠的。 “l(fā)eave-one-out”分析的結(jié)果以效應(yīng)森林圖呈現(xiàn),不直接提供p值。 默認(rèn)使用IVW方法計(jì)算效應(yīng)值,其核心在于觀察beta值的方向。 如果所有的beta值方向(即>0或<0)都保持一致,這意味著在移除任何單一SNP后,暴露和結(jié)局之間的正向因果關(guān)系仍然存在。 二 孟德?tīng)栯S機(jī)化的核心圖表解讀 01 散點(diǎn)圖 散點(diǎn)圖中的每個(gè)點(diǎn)對(duì)應(yīng)一個(gè)遺傳變異(如SNP),展示了該遺傳變異與暴露(Exposure)及結(jié)果(Outcome)之間的關(guān)聯(lián)。 不同顏色的線條表示通過(guò)不同模型進(jìn)行的擬合,展現(xiàn)了基于遺傳變異(如SNP)與暴露的關(guān)系來(lái)預(yù)測(cè)其與結(jié)果的關(guān)聯(lián)。 02 森林圖 標(biāo)準(zhǔn)森林圖展示了每個(gè)SNP的效應(yīng)大小及其95%置信區(qū)間。 從圖中可以明確看出每個(gè)SNP與結(jié)果之間的關(guān)聯(lián)強(qiáng)度以及相應(yīng)的不確定性(參見(jiàn)下圖),我們關(guān)心的其實(shí)是最后的匯總結(jié)果(紅色線條)。 而留一法分析的森林圖在上文中已有解讀。 03 漏斗圖 漏斗圖是用來(lái)檢測(cè)遺傳變異間的異質(zhì)性。 若漏斗圖呈現(xiàn)對(duì)稱形狀,這通常意味著沒(méi)有明顯的異質(zhì)性,也即研究效應(yīng)與其準(zhǔn)確性之間不存在系統(tǒng)性偏差。 在進(jìn)行孟德?tīng)栯S機(jī)化分析時(shí),若存在異質(zhì)性,這可能意味著選定的遺傳變異不只與暴露有關(guān),還可能與其他潛在混淆因素相關(guān),這種相關(guān)性有可能對(duì)因果解釋產(chǎn)生影響。 三 總結(jié) 總之,在完成兩樣本孟德?tīng)栯S機(jī)化中,篩選與暴露相關(guān)的SNP是關(guān)鍵,少一些異質(zhì)性,沒(méi)有多效性是相對(duì)比較可靠的結(jié)果。 四 PS 我們?yōu)槭裁磮?jiān)持線上理論 線下實(shí)操的孟德?tīng)栒n程學(xué)習(xí)路徑? 因?yàn)榛诩韧慕虒W(xué)經(jīng)驗(yàn)和學(xué)習(xí)孟德?tīng)栯S機(jī)化需要的實(shí)操要求綜合考慮的,理論知識(shí)大家線上聽(tīng)懂完全沒(méi)有問(wèn)題,但基于R的實(shí)操,對(duì)于0基礎(chǔ)的小白來(lái)說(shuō),的確有那么一點(diǎn)不友好。 線上的操作視頻,終究比不過(guò)線下的2天課程,可以0基礎(chǔ)上手、熟練。 我們開(kāi)辦此專題課程的目的在于惠及老黑屋,讓大家別掉隊(duì),既然新的臨床研究方法出來(lái),就有義務(wù)教會(huì)大家,注意是教會(huì)大家,而不是僅僅教給大家。 不過(guò)介于大家的呼聲,我們還是發(fā)起一個(gè)投票,調(diào)研一下需求: 感興趣的掃描入群吧! 附:2022-2023年幾個(gè)孟德?tīng)栯S機(jī)化國(guó)自然課題(你沒(méi)看錯(cuò)!孟德爾隨機(jī)化也可以申請(qǐng)國(guó)自然!) |
|
來(lái)自: Symphonizz0jez > 《孟德?tīng)枴?/a>