TOC 什么是Mendelian randomization?研究背景?名稱(chēng)的由來(lái)?設(shè)計(jì)的初衷是什么? Mendelian randomization的基本原理? Mendelian randomization的應(yīng)用場(chǎng)景?實(shí)例分析
什么是Mendelian randomization?研究背景?名稱(chēng)的由來(lái)?設(shè)計(jì)的初衷是什么?基本背景 醫(yī)學(xué)科研中,隨處可見(jiàn)“關(guān)聯(lián)性”研究。毫不夸張的說(shuō),關(guān)聯(lián)性研究構(gòu)成了醫(yī)學(xué)科研的基礎(chǔ),比如經(jīng)典的研究吸煙和肺癌的關(guān)系,以及十年前十分火熱的全基因組關(guān)聯(lián)研究(GWAS)。這些研究雖然“流于表面”,但為后續(xù)的機(jī)制探索和功能研究提供了最初的證據(jù)。隨著醫(yī)學(xué)科研的日漸深入,關(guān)聯(lián)性研究開(kāi)始飽受詬病,其中最大的槽點(diǎn)莫過(guò)于相關(guān)性并不等于因果關(guān)系。association != causality 正是由于這個(gè)原因,關(guān)聯(lián)性研究提供的證據(jù)有限,有些時(shí)候由于“混雜因素”的存在,極有可能出現(xiàn)“虛假關(guān)聯(lián)”。比如說(shuō),你小時(shí)候在院子里種了一棵桃樹(shù),隨著時(shí)間的推移,你的個(gè)子在長(zhǎng),桃樹(shù)也在變高,如果你說(shuō)“我長(zhǎng)桃樹(shù)也長(zhǎng)”是有關(guān)系的,這就落入了虛假關(guān)聯(lián)的陷阱,因?yàn)樵谶@里,時(shí)間是一個(gè)混雜因素。 基本問(wèn)題 既然相關(guān)性不等于因果性,那么如果去探索醫(yī)學(xué)科研中的“暴露”與“結(jié)局”之間的因果性呢? 隊(duì)列雖好,卻是可望不可及的。而更加省時(shí)省力的病例對(duì)照研究,受限于其研究設(shè)計(jì),只能得到相關(guān)系,而無(wú)法得到因果性。為了解決這一問(wèn)題,統(tǒng)計(jì)學(xué)家們就設(shè)計(jì)了孟德?tīng)栯S機(jī)化(Mendelian Randomization, MR)。
Mendelian randomization的基本原理?名稱(chēng)由來(lái) 簡(jiǎn)單來(lái)說(shuō),MR是基于最基本的孟德?tīng)栠z傳規(guī)律,即親代的等位基因會(huì)隨機(jī)分配給子代,而基因型決定表型(疾病當(dāng)然也是一種表型)。 方法特點(diǎn) 此處基因型AA和aa決定了某種我們感興趣的表型(可以看作是“暴露”,比如血液中維生素D的含量),“暴露”又進(jìn)一步影響了我們關(guān)心的結(jié)局。由于基因型是先天的,在時(shí)間上必然領(lǐng)先于結(jié)局發(fā)生的時(shí)間,且它不受后天的環(huán)境等各種混雜因素的影響,因此能夠作為研究暴露和結(jié)局因果關(guān)系的有力工具! MR最大的優(yōu)點(diǎn)在于遺傳變異都是可以直接測(cè)量的,比如通過(guò)SNP芯片或者全基因組測(cè)序,而且不受外界環(huán)境的影響。遺傳變異與“暴露”的因果關(guān)系一般是經(jīng)過(guò)明確證實(shí)的。 基本的數(shù)學(xué)原理 待續(xù)~
Mendelian randomization的應(yīng)用場(chǎng)景?實(shí)例分析Circulating vitamin D concentration and risk of seven cancers: Mendelian randomisation study 這是發(fā)表在BMJ上的一篇MR研究,研究的是血清中循環(huán)維生素D含量與7種不同腫瘤的關(guān)系。我們以結(jié)直腸癌為例。其基本的思路大致如下: 我們的目的是研究X與Y的因果關(guān)系,即維生素D含量與結(jié)直腸癌的關(guān)系,此處我們不直接測(cè)量X(VitD含量),而是測(cè)量Z(SNP rs2282679和rs10741657)。Z已經(jīng)明確證實(shí)與X相關(guān)(rs2282679與維生素D結(jié)合蛋白含量相關(guān),rs10741657影響維生素D3向25(OH)D轉(zhuǎn)化)。此處,需要測(cè)量的Z是幾種不同的SNP,這些SNP一般是前人通過(guò)GWAS研究得到的,我們通過(guò)測(cè)量Z,觀察Y,就可以得到X和Y的關(guān)系。但是,大家可能有個(gè)疑問(wèn),即便得到了X和Y的關(guān)聯(lián),如何去量化它呢? 方法有很多,其中最簡(jiǎn)單直接的是采用基因評(píng)分法。簡(jiǎn)單來(lái)說(shuō),就是以前人得到的SNP和X的關(guān)聯(lián)(即OR值)作為每一個(gè)SNP的權(quán)重,然后構(gòu)建一個(gè)X和Y之間的加權(quán)線性回歸模型。或者使用Wald比值法先進(jìn)行單個(gè)SNP的關(guān)聯(lián)分析,然后再利用meta分析的思路將所有研究的SNP進(jìn)行綜合。不過(guò)這兩種方法都要求所有SNP之間是完全獨(dú)立的,連鎖不平衡的SNP需要剔除掉。 MR的原理并不復(fù)雜,但是在實(shí)際操作中,還是需要注意幾點(diǎn),其中最重要的是找到合適的基因變異作為工具變量。該工具變量必須與我們關(guān)心的“暴露”明確相關(guān)且不能與混雜因素相關(guān)。此外,還要注意的是工具變量只能通過(guò)一條途徑影響結(jié)局,即我們關(guān)心的“暴露”這條途徑,而不能通過(guò)其他途徑影響結(jié)局。
參考: 沒(méi)有隊(duì)列,也可以有“因果”——省時(shí)省力省錢(qián)的孟德?tīng)栯S機(jī)化了解下 - 超級(jí)科普,本文部分copy了該文章。 MendelianRandomization: Mendelian Randomization Package - 有R包,跑一遍教程,理解程度會(huì)有本質(zhì)提升。 A robust and efficient method for Mendelian randomization with hundreds of genetic variants - NC 有相關(guān)性就有因果關(guān)系嗎,教你玩轉(zhuǎn)孟德?tīng)栯S機(jī)化分析(mendelian randomization )- 實(shí)戰(zhàn) 以NEJM一篇新文為例,聊聊孟德?tīng)栯S機(jī)化研究 - 實(shí)例
|
|