DNA是一部史書,記錄著本物種與大自然的斗爭(zhēng)過(guò)程,也記錄著與其他物種的恩怨情仇。 逆轉(zhuǎn)錄病毒顆粒包含了整個(gè)病毒基因組RNA。一旦其進(jìn)入到靶標(biāo)細(xì)胞,就可以通過(guò)逆轉(zhuǎn)錄將病毒RNA轉(zhuǎn)錄為雙鏈DNA,然后整合到宿主基因組上。被整合到宿主基因組上這一個(gè)病毒序列稱之為原病毒 一般而言,逆轉(zhuǎn)錄病毒常感染體細(xì)胞,但是會(huì)有一定的概率,使得逆轉(zhuǎn)錄病毒感染生殖系細(xì)胞,并以此進(jìn)入宿主基因池。此時(shí)原病毒變成為了內(nèi)源性逆轉(zhuǎn)錄病毒(ERVs) 逆轉(zhuǎn)錄病毒的內(nèi)源化并不是逆轉(zhuǎn)錄病毒本身的屬性,其在生殖系細(xì)胞中整合的概率很低。盡管如此,在數(shù)百萬(wàn)年的進(jìn)化中,脊椎動(dòng)物的基因組中仍然累積了成千上萬(wàn)的ERVs位點(diǎn)。這些位點(diǎn)為我們研究病毒對(duì)脊椎動(dòng)物進(jìn)化的影響提供了很好的材料。 盡管這些ERVs通常不具有病毒活性,但是有時(shí)候卻可以被激活,比如,其他病毒感染(HIV),改變表觀修飾的藥物等。研究還發(fā)現(xiàn),在細(xì)胞培養(yǎng)和實(shí)驗(yàn)室小鼠中,ERVs能夠和其他ERVs,或者和外源性逆轉(zhuǎn)錄病毒重組,從而形成具有致病能力的病毒毒株。 本綜述描述了ERVs,以及其和外源性逆轉(zhuǎn)錄病毒的關(guān)系,追溯逆轉(zhuǎn)錄病毒的起源,ERVs基因?qū)λ拗鞯挠绊憽?/p> ERVs的多樣性所有的逆轉(zhuǎn)錄病毒都有相似的基因組構(gòu)成。通過(guò)逆轉(zhuǎn)錄和整合,其能夠在宿主基因組上形成5Kb-10Kb長(zhǎng)的原病毒序列,其兩端通常含有長(zhǎng)末端重復(fù)序列(LTR)。這些LTR序列提供了原病毒表達(dá)的啟動(dòng)子、調(diào)控元件以及整合所需的順式作用結(jié)構(gòu)域。 逆轉(zhuǎn)錄病毒的基因通常有:
LTR的末端重復(fù)序列通常包含三部分,從5'端到3'端依次為:U3, , 在5'端,U3-R
ERVs起源于原病毒,可以是比較完整的原病毒序列,也可以是高度碎片化的原病毒殘存序列。即便是這些序列比較完整,即便是含有 早在50余年之前,人們就已經(jīng)在基因組中發(fā)現(xiàn)了ERVs,其后對(duì)ERVs的研究主要集中于脊椎動(dòng)物中。根據(jù)ERVs序列的不同,可以將其劃分為不同群組。這些群組反映了同一種逆轉(zhuǎn)錄病毒在生殖系細(xì)胞中的多次插入整合,當(dāng)然也有可能是逆轉(zhuǎn)錄病毒內(nèi)源化以后在宿主基因組上進(jìn)行了擴(kuò)增。 逆轉(zhuǎn)錄酶的氨基酸序列在逆轉(zhuǎn)錄病毒、逆轉(zhuǎn)座子中高度保守??梢杂眠@些氨基酸序列建立進(jìn)化關(guān)系樹。研究發(fā)現(xiàn),通過(guò)逆轉(zhuǎn)錄酶的這些氨基酸序列對(duì)逆轉(zhuǎn)錄病毒科的病毒進(jìn)行建樹,其結(jié)果可以分為3個(gè)主要支系。 除了逆轉(zhuǎn)錄酶,還可以根據(jù)病毒包膜糖蛋白的跨膜區(qū)進(jìn)行建樹,該區(qū)域氨基酸序列也是相當(dāng)保守的。當(dāng)然,如果病毒發(fā)生了重組,那么根據(jù)逆轉(zhuǎn)錄酶和根據(jù)糖蛋白建的樹可能會(huì)存在差異。 根據(jù)目前的研究,宿主基因組中發(fā)現(xiàn)的ERVs的分支要比逆轉(zhuǎn)錄病毒的分支還要多。這說(shuō)明很多逆轉(zhuǎn)錄病毒已經(jīng)滅絕了,但是很多逆轉(zhuǎn)錄病毒的遺跡還殘留在宿主基因組中。 通過(guò)逆轉(zhuǎn)錄酶建樹發(fā)現(xiàn),ERVs和逆轉(zhuǎn)錄病毒關(guān)系并非獨(dú)立的,而是存在交叉。這說(shuō)明內(nèi)源化并非僅僅局限在少數(shù)幾種逆轉(zhuǎn)錄病毒中,多數(shù)逆轉(zhuǎn)錄病毒都具有內(nèi)源化的潛力。不過(guò)在不同的物種中,內(nèi)源化可能有所差異。比如在很多脊椎動(dòng)物中,ERVs多是由于gamma逆轉(zhuǎn)錄病毒內(nèi)源化形成的;而在一些蝙蝠基因組中,只發(fā)現(xiàn)了delta逆轉(zhuǎn)錄病毒的內(nèi)源化。 遠(yuǎn)古逆轉(zhuǎn)錄病毒ERVs作為逆轉(zhuǎn)錄病毒在基因組上的遺跡,記錄著逆轉(zhuǎn)錄病毒和宿主基因組的進(jìn)化過(guò)程。可以用來(lái)研究逆轉(zhuǎn)錄病毒對(duì)宿主進(jìn)化的影響。 比如名為HERV-K (HML-2)的ERV在當(dāng)今人類基因組、尼安德特人基因組和丹尼索瓦人基因組中都有發(fā)現(xiàn),說(shuō)明其對(duì)應(yīng)的逆轉(zhuǎn)錄病毒已經(jīng)出現(xiàn)在人類共同祖先上。而其在大猩猩基因組中還未固定(處于基因分離狀態(tài)),并且序列比較完整,說(shuō)明在大猩猩中,該類逆轉(zhuǎn)錄病毒仍然屬于活躍狀態(tài),能夠形成新的具有感染性的病毒顆粒。 在海洋動(dòng)物中發(fā)現(xiàn)的和spumavirus相關(guān)的ERVs說(shuō)明了該類病毒在古生代已經(jīng)感染了海洋動(dòng)物。在鹿中發(fā)現(xiàn)的尚未固定的ERVs(比如CrERV-gamma)能夠幫助我們了解內(nèi)源化的早期過(guò)程。再比如,在考拉中,逆轉(zhuǎn)錄病毒 ERVs也可以用來(lái)作為分子時(shí)鐘,來(lái)估計(jì)整合的時(shí)間,推測(cè)遠(yuǎn)古逆轉(zhuǎn)錄病毒的出現(xiàn)和擴(kuò)散過(guò)程。 內(nèi)源性病毒的馴化這兒的“馴化”,或者
ERVs的編碼序列,如env基因,是研究馴化的很好的例子。 對(duì)于逆轉(zhuǎn)錄病毒而言,其Env基因的表達(dá)干擾了正常細(xì)胞表面受體的表達(dá),形成了細(xì)胞對(duì)逆轉(zhuǎn)錄病毒再次通過(guò)糖蛋白進(jìn)入細(xì)胞的抗性,也即“超感染干擾” 【a: 逆轉(zhuǎn)錄病毒Env基因的表達(dá)能夠促使病毒侵染其他未感染的細(xì)胞,但是卻阻止了再次感染本細(xì)胞的可能。b:ERVs病毒Env基因的表達(dá)阻止了病毒入侵。c:Syncytins介導(dǎo)的細(xì)胞融合】 宿主對(duì)Env基因的馴化包含了兩個(gè)方面:一方面是通過(guò)syncytins(合成素?);另一個(gè)方面是通過(guò)上面提到的超感染干擾。 Syncytins: ERVs編碼的糖蛋白,能夠促進(jìn)細(xì)胞滋養(yǎng)層的融合,在哺乳動(dòng)物胎盤形成過(guò)程中有重要作用。其融合過(guò)程類似于病毒的侵入細(xì)胞的過(guò)程。syncytins在不同的哺乳動(dòng)物中是獨(dú)立起源的,說(shuō)明了syncytins的馴化是一種趨同進(jìn)化。Syncytins形成于上千萬(wàn)年前,產(chǎn)生它們的逆轉(zhuǎn)錄病毒可能已經(jīng)滅絕了。 超感染干擾:宿主細(xì)胞有很多阻止病毒侵染的限制性因子,比如限制逆轉(zhuǎn)錄病毒的 此外,還有一些Env編碼的糖蛋白出現(xiàn)變異,丟失了跨膜結(jié)合域,形成了分泌型,但其同樣具有組織病毒侵染細(xì)胞的能力。 研究還發(fā)現(xiàn),即便有些病毒現(xiàn)在已經(jīng)滅絕了,ERVs的Env基因編碼產(chǎn)物仍然能夠?qū)@些已經(jīng)滅絕病毒產(chǎn)生抵抗能力。 雖然在人類基因中已經(jīng)發(fā)現(xiàn)了數(shù)十個(gè)
目前發(fā)現(xiàn),最古老的ERVs的完整env基因存在于鰭刺類魚的 絕大多數(shù)逆轉(zhuǎn)錄病毒編碼的Env蛋白可以分為兩種:gamma型和beta型。 gamma型主要分布于脊椎動(dòng)物中,而beta型主要在哺乳動(dòng)物中發(fā)現(xiàn)。 目前關(guān)于Env基因的馴化主要集中于gamma型,可能是因?yàn)間amma型的env基因不容易導(dǎo)致細(xì)胞融合,使得宿主更容易將其馴化。
除了上述 羊的EnjS56A1位點(diǎn)同樣編碼了一個(gè) 不過(guò),在人類中,尚未發(fā)現(xiàn) 有些ERVs中還會(huì)存在一些其他輔助基因,特別當(dāng)這些ERVs來(lái)源于含有復(fù)雜基因組的外源性逆轉(zhuǎn)錄病毒時(shí)。比如小鼠的
在ERVs序列中,賦予宿主病毒抗性的env基因通常伴隨著斷續(xù)的gag基因,pro基因和pol基因。這一方面說(shuō)明env基因具有較高的保守性,受到負(fù)向自然選擇的作用;另一方面也說(shuō)明其他幾個(gè)基因積累了大量的隨機(jī)替換。 一些關(guān)于自然選擇的方法可以用來(lái)識(shí)別這些位點(diǎn),比如 如果Env基因?qū)ξ锓N的發(fā)育有重要作用,那么其應(yīng)該高度保守,長(zhǎng)期受到負(fù)向選擇壓力。如果其僅僅是為了抑制外源逆轉(zhuǎn)錄病毒侵入, 那么這種對(duì)抗病毒的選擇壓力應(yīng)該是周期性的,隨著外源病毒的出現(xiàn)而形成,隨著外源病毒的滅絕而消失或者改變。研究結(jié)果也證實(shí)了上述假設(shè),比如syncytins(和胎盤形成發(fā)育有關(guān))形成時(shí)間很早,有1200萬(wàn)-8000萬(wàn)年;而用于抵抗病毒入侵的一些Env基因則相當(dāng)年輕,形成事件晚于2000萬(wàn)年。 非編碼元件的馴化原病毒和ERVs能夠影響周邊數(shù)Kb范圍內(nèi)的基因的調(diào)節(jié)表達(dá)。ERVs中的LTR能夠作為啟動(dòng)子或者轉(zhuǎn)錄因子結(jié)合位點(diǎn)來(lái)調(diào)控基因,也可能會(huì)提供一些lncRNA作為調(diào)節(jié)序列。從宿主的角度來(lái)看,在進(jìn)化過(guò)程中,不斷地獲得和丟失ERVs調(diào)控序列,使得即便兩個(gè)進(jìn)化關(guān)系很近的物種也能表現(xiàn)出較高的表型多樣性。 ERVs的幾個(gè)特性能夠促進(jìn)宿主基因調(diào)節(jié)網(wǎng)絡(luò)的進(jìn)化。 首先,LTR序列含有高密度的調(diào)控序列,包括啟動(dòng)子和轉(zhuǎn)錄因子結(jié)合位點(diǎn),這些序列的性質(zhì)實(shí)際上是反映了最初病毒整合時(shí)的特性,比如不同病毒對(duì)宿主的選擇性和組織選擇性。 其次,盡管逆轉(zhuǎn)錄病毒的整合沒(méi)有嚴(yán)格的靶標(biāo)序列特異性,但是其也并非完全隨機(jī)地插入整合,而是傾向于選擇宿主基因組的轉(zhuǎn)錄單元或者包含啟動(dòng)子的區(qū)域。所以內(nèi)源化產(chǎn)生的插入序列在基因組上的分布并不隨機(jī)。其中有些受到遺傳漂變的作用或者負(fù)向選擇作用,而逐漸被移除出群體;有些受到自然選擇可以在種群中固定,并長(zhǎng)期存在。 第三,相似性的LTR序列可以誘導(dǎo)染色體異位重組或者基因轉(zhuǎn)換。 第四,solo-LTR只保留了逆轉(zhuǎn)錄病毒的LTR序列,而丟失掉了編碼序列,避免了由這些編碼序列導(dǎo)致的基因組表觀修飾,保留了LTR序列的調(diào)控能力。 以上是ERVs非編碼序列對(duì)宿主基因調(diào)控的特點(diǎn),更具體的關(guān)于非編碼調(diào)控的參見(jiàn)上一篇文章。 總結(jié)目前關(guān)于內(nèi)源性病毒ERVs的研究還主要是在小鼠和人類身上;而且對(duì)ERVs的性質(zhì)的了解要主要集中在集中常見(jiàn)的ERVs家族中。 在其他動(dòng)物,特別是非哺乳類動(dòng)物中的情況還需要我們進(jìn)一步研究。 另外,目前還尚不清楚LTR對(duì)宿主基因調(diào)控的程度,即在多大程度上影響了宿主基因的表達(dá)。為什么有些物種支系會(huì)出現(xiàn)ERVs拷貝數(shù)暴增?大量的擴(kuò)增和內(nèi)源化是否能夠解釋脊椎動(dòng)物進(jìn)化過(guò)程中出現(xiàn)的多樣性?這些擴(kuò)增是否會(huì)影響到新物種的形成或者新表型的出現(xiàn)? 人們對(duì)逆轉(zhuǎn)錄病毒研究已經(jīng)有百余年歷史,分子進(jìn)化遺傳學(xué)的發(fā)展也有六七十年的歷史了。內(nèi)源性病毒成了病毒和和進(jìn)化遺傳學(xué)的交匯點(diǎn),對(duì)內(nèi)源性病毒的研究有助于我們理解發(fā)育和形態(tài)進(jìn)化的多樣性,同時(shí)其在腫瘤和自身免疫病等領(lǐng)域也有一定程度的應(yīng)用。未來(lái)關(guān)于ERVs的研究,應(yīng)該在現(xiàn)有病毒學(xué)知識(shí)體系下,更多地融入群體遺傳學(xué)的理論。 資料來(lái)源:Johnson, W. E. (2019). Origins and evolutionary consequences of ancient endogenous retroviruses. Nature Reviews Microbiology, 17(6), 355-370. |
|
來(lái)自: 醫(yī)學(xué)abeycd > 《病毒天地》