表達(dá)分析、分子生物學(xué)研究以及新的分析軟件工具將會推進(jìn)生物系統(tǒng)水平的研究。 文/EricChan西雅圖RosettaBiosoftware數(shù)據(jù)分析師譯/李亞萍 在基因表達(dá)研究中,廣泛的基因分析可以對生理狀態(tài)或者是一個細(xì)胞表型有關(guān)的基因進(jìn)行系統(tǒng)監(jiān)測??梢岳酶咄糠治鲈跀?shù)據(jù)輸出和獲取數(shù)據(jù)快捷兩方面的優(yōu)勢,對藥物發(fā)現(xiàn)過程中的藥靶候選基因進(jìn)行鑒定,在假設(shè)驅(qū)動的研究中,該技術(shù)也提供了必須的系統(tǒng)背景知識。一旦微陣列技術(shù)成熟,研究人員就能進(jìn)行轉(zhuǎn)錄組研究,尋找感興趣的標(biāo)記基因。正如腫瘤基因表達(dá)對各種來源的組織和患者存活結(jié)果的相關(guān)性分析例子一樣,通過微陣列技術(shù)進(jìn)行的基因表達(dá)分析研究將在生物標(biāo)記發(fā)現(xiàn)過程中繼續(xù)扮演重要作用。 盡管微陣列的分析能力很強(qiáng)大,轉(zhuǎn)錄組學(xué)研究平臺只包括那些適應(yīng)生長條件變化細(xì)胞的轉(zhuǎn)錄物。大多數(shù)細(xì)胞內(nèi)和細(xì)胞間的生物化學(xué)過程都會受到蛋白質(zhì)-蛋白質(zhì)或者其他蛋白質(zhì)-底物相互作用的影響。蛋白質(zhì)組水平的基因表達(dá)分析提供了一個快速的可控制生物合成的快照過程,其中大部分是由轉(zhuǎn)錄組學(xué)平臺調(diào)控的。同時,轉(zhuǎn)錄組本身通過表達(dá)的蛋白質(zhì)或者是細(xì)胞生化狀態(tài)下其他的變化,進(jìn)行反饋控制。 換句話說,基因表達(dá)不僅僅是從轉(zhuǎn)錄組到蛋白質(zhì)組的單向流動,而是兩者的相互連接。對這種功能調(diào)控的了解通常只限于特殊的信號途徑,或者是新陳代謝途徑。要了解轉(zhuǎn)錄組和蛋白質(zhì)組之間的相互調(diào)控作用,需要對RNA和蛋白質(zhì)的表達(dá)進(jìn)行同步監(jiān)測。 正如RNA可作為部分生物學(xué)功能的酶反應(yīng)的效益物一樣,蛋白質(zhì)也是大多數(shù)生物學(xué)功能的效益物。因此,蛋白質(zhì)水平廣泛的基因組分析是基因表達(dá)更直接的反映。而且,根據(jù)基因組范圍設(shè)計(jì)的商業(yè)化微陣列靶標(biāo)集合很有限,可能無法為近期哺乳動物的發(fā)現(xiàn)提供足夠的轉(zhuǎn)錄物,因?yàn)檗D(zhuǎn)錄物的數(shù)量可能要比基因的數(shù)量多10倍或者更多。 質(zhì)譜技術(shù)的進(jìn)展,使得定量的蛋白組學(xué)研究成為可能。然而,當(dāng)細(xì)胞適應(yīng)了轉(zhuǎn)錄水平(例如,轉(zhuǎn)錄因子結(jié)合、染色質(zhì)結(jié)構(gòu)改變)、轉(zhuǎn)錄后(例如,核與質(zhì)的輸出或者是信使RNA的剪接,特定的核糖體負(fù)荷)、翻譯后(蛋白降解和輸出)的精細(xì)調(diào)控機(jī)制后,轉(zhuǎn)錄物和蛋白質(zhì)豐度測量結(jié)果可能會不一致。因此,定量的轉(zhuǎn)錄物和蛋白質(zhì)豐度測量可作為相互的標(biāo)準(zhǔn),為高通量分析得出的基因表達(dá)數(shù)據(jù)做出合理的解釋。正如蛋白質(zhì)和RNA之間類似點(diǎn)可以增加我們對新的生物標(biāo)記的信任度一樣,差異也能暗示我們“其他的轉(zhuǎn)錄后調(diào)控結(jié)合點(diǎn)可作為治療的候選靶點(diǎn)”。 研究現(xiàn)狀 通過分析細(xì)胞培養(yǎng)和細(xì)菌、酵母、小鼠以及人類的整體動物模型的mRNA和蛋白質(zhì)豐度情況,可以實(shí)現(xiàn)轉(zhuǎn)錄物和蛋白質(zhì)表達(dá)的整體定量分析(如表1)。在蛋白組學(xué)分析過程中,一些研究選擇了雙向凝膠電泳(2-DE)分析蛋白質(zhì)混合物。要么是對不同的凝膠染色,要么是讓不同的細(xì)胞與不同的染料相結(jié)合,通過斑點(diǎn)染色亮度可以看到蛋白質(zhì)的亮度。隨后用質(zhì)譜儀對分離出的定量凝較斑點(diǎn)進(jìn)行鑒定,與轉(zhuǎn)錄組學(xué)分析不同的是,雙向凝膠電泳分析的鑒定結(jié)果與定量分析是散耦合(de-coupled)。 雙向凝膠電泳的一大優(yōu)點(diǎn)是,它能將翻譯后已修改的蛋白質(zhì)分解為一連串的斑點(diǎn),當(dāng)與單個的母本轉(zhuǎn)錄物相比較時,它提供的信息就會派上大用場。依照這個步驟,就可以將化學(xué)誘導(dǎo)后的若干人類細(xì)胞培養(yǎng)模型的蛋白質(zhì)組和轉(zhuǎn)錄組信息區(qū)別開來??傊?,蛋白質(zhì)和轉(zhuǎn)錄物之間的相關(guān)性很弱??轉(zhuǎn)錄組學(xué)中的測量誤差被認(rèn)為是由微陣列(與TaqMan定量實(shí)時PCR有關(guān))、2-DE本身的蛋白質(zhì)染料飽和染色、共遷移造成的抑制作用,與低豐度蛋白質(zhì)隨后的顯像和定量,鑒定一樣困難。 液相色譜法(LC)是作為一種替代2-DE的蛋白質(zhì)分析方法而出現(xiàn)的。LC-MS分析是典型的“自下而上(Bottom-Up)”分析方法,通常要用特異的蛋白酶(如胰島素)將蛋白質(zhì)裂解為肽段。與2-DE不同,LC-MS對肽的定量和鑒定是同時進(jìn)行的,例如,根據(jù)離子阱質(zhì)譜儀碰撞誘導(dǎo)裂解CID)過程中產(chǎn)生的裂解譜,可以選擇定量的MS峰(m/z)用于鑒定,通過肽片斷的信息推測對應(yīng)蛋白質(zhì)的定量信息。 到目前為止,在已發(fā)表的整合分析文章中,大多數(shù)LC-MS分析是與穩(wěn)定同位素標(biāo)記聯(lián)合使用的,尤其是ICAT試劑。然而,與非標(biāo)簽方法一樣,18O/16O和15N/14N標(biāo)記近期有可能替代ICAT標(biāo)記法。目前,在出版的ICAT標(biāo)記的LC-MS轉(zhuǎn)錄組學(xué)-蛋百組學(xué)整合分析的文章中,已經(jīng)增加了與2-DE有關(guān)的蛋白質(zhì)組范圍。在最近的一次小鼠模型研究中,在將150份mRNA-蛋白質(zhì)對進(jìn)行表達(dá)水平和轉(zhuǎn)錄水平的比較后,發(fā)現(xiàn)蛋白水平的最佳預(yù)測力為41%(r=0.64)。通過相似分析,與初期的整合分析相比較的相關(guān)度已經(jīng)很高了,對此的解釋是??隨著技術(shù)的成熟,蛋白質(zhì)組和轉(zhuǎn)錄組的范圍都有所增加。值得注意的是,蛋白質(zhì)組范圍很可能會隨著最近的非標(biāo)記定量分析的進(jìn)展而增加,該技術(shù)利用了MS的微量級靈敏度。 在將蛋白質(zhì)組和多核糖體轉(zhuǎn)錄組與預(yù)期的核糖體轉(zhuǎn)錄物相比較后,研究人員發(fā)現(xiàn),原來預(yù)期的核糖體轉(zhuǎn)錄物翻譯很活躍,并且與對應(yīng)蛋白質(zhì)組的關(guān)系要比總的轉(zhuǎn)錄組更接近。在對JurkatT細(xì)胞的一項(xiàng)研究中,監(jiān)測的11個蛋白質(zhì)-轉(zhuǎn)錄物對,只有一對蛋白質(zhì)和多聚核糖體mRNA變化呈現(xiàn)出一致性。 蛋白質(zhì)與多核糖體,蛋白質(zhì)與總的mRNAs之間表現(xiàn)出的較高的一致性與酵母中觀察到的完全不同豐度的轉(zhuǎn)錄物、ORF長度和在不同翻譯效率下的密碼子適應(yīng)指數(shù)相同,因此影響了合成蛋白質(zhì)產(chǎn)物的豐度。核糖體裝載調(diào)控可能是機(jī)制之一,能解釋“觀察到的轉(zhuǎn)錄物和蛋白水平不一致現(xiàn)象”,其實(shí)是對分子生物學(xué)中心法則的挑釁。作為翻譯的一種抑制機(jī)制,microRNAs也展示了另一種可能性。 雖然采用的技術(shù)不同,迄今為止公開發(fā)表的整合分析都指出了轉(zhuǎn)錄組學(xué)和蛋白組學(xué)的重要性。轉(zhuǎn)錄組學(xué)或蛋白組學(xué)通常只考慮調(diào)節(jié)系統(tǒng)和分解作用平衡態(tài)的凈效應(yīng),實(shí)際上,出現(xiàn)的不一致性只是合成與降解兩種替換過程中的一種反映??茖W(xué)家可能對變化過程中的機(jī)制更感興趣。 面臨的挑戰(zhàn) 其實(shí),很難對蛋白組學(xué)和轉(zhuǎn)錄組學(xué)表達(dá)的差異性進(jìn)行細(xì)微的比較。在基因組范圍,微陣列為目標(biāo)轉(zhuǎn)錄物提供了有限的豐度測量,但是典型的質(zhì)譜分析可能與通常的2-DE操作一樣,無法檢測出可溶蛋白,尤其是那些高豐度和非極限pI值的蛋白;另一方面,即使有多維的液相色譜分析,LC-MS仍然會遭遇肽段共洗脫(LC的局限性)和采樣過疏(掃描速度和靈敏度局限性)的限制。 此外,商業(yè)化基因組微陣列研究還沒有完成,很難對蛋白組學(xué)和轉(zhuǎn)錄組學(xué)進(jìn)行比較,因?yàn)榉治霰旧頃蛟诘鞍姿缴细哓S度或者其他更容易檢測到的基因上。 蛋白質(zhì)與轉(zhuǎn)錄物的相互參照是一個主要障礙。轉(zhuǎn)錄組學(xué)方面,拼接亞型的存在會導(dǎo)致多重探針與同一個目標(biāo)雜交,導(dǎo)致錯誤的定量。即使我們假設(shè)“在蛋白質(zhì)序列數(shù)據(jù)庫中,這些亞型已經(jīng)被正確的鑒定為單獨(dú)的路徑”,拿轉(zhuǎn)錄組亞型與對應(yīng)的蛋白質(zhì)亞型比較,仍是困難重重。異源序列數(shù)據(jù)庫的利用也是一個難題:微陣列靶子通常都是用NIH的基因序列數(shù)據(jù)庫(GenBank)和NCBI參考序列(RefSeq)標(biāo)示符進(jìn)行注解,蛋白組學(xué)通常是用編輯更少的NCBI免費(fèi)數(shù)據(jù)庫蛋白質(zhì)搜索引擎EntrezProtein(NCBInr)或者是國際蛋白索引(IPI)數(shù)據(jù)庫注解。雖然IPI數(shù)據(jù)庫為更多內(nèi)容的數(shù)據(jù)庫(例如RefSeq和Swiss-Prot)提供相關(guān)參照,但那些相關(guān)參照通常是不完善的,并且IPI數(shù)據(jù)庫通常將較小的序列變異體排除在外。 除了以上提到的與整合分析有關(guān)的技術(shù)難題之外,生物學(xué)研究系統(tǒng)也面臨挑戰(zhàn)。根據(jù)序列和亞細(xì)胞定位,mRNA的半衰期壽命從幾分鐘到幾小時;受N端殘基的影響,蛋白質(zhì)部分壽命范圍從幾分鐘到幾天。因?yàn)榈湫偷霓D(zhuǎn)錄組學(xué)和蛋白組學(xué)分析一次只分析一個點(diǎn),所以缺乏足夠的分辨力將新合成的轉(zhuǎn)錄物或蛋白質(zhì)與以往積累下來的部分區(qū)別開。 另一方面,蛋白質(zhì)和轉(zhuǎn)錄物表達(dá)之間的差異,可能會導(dǎo)致細(xì)胞的蛋白質(zhì)組與轉(zhuǎn)錄組不一致。轉(zhuǎn)錄后,特殊序列或者是次級折疊結(jié)構(gòu)可能會影響翻譯率,后者可能影響mRNA衰退,與核糖體的裝載和加工一樣,這些轉(zhuǎn)錄后機(jī)制都將證明蛋白質(zhì)合成中的變化??傊?,合成的蛋白質(zhì)也可能會遭受翻譯后修飾,這些修飾將管理蛋白質(zhì)的降解或分泌。 正如中心法則預(yù)測的那樣,在轉(zhuǎn)錄物和蛋白質(zhì)水平,如果只能通過嚴(yán)格的轉(zhuǎn)錄調(diào)控去控制蛋白質(zhì)的合成,細(xì)胞是不太可能選擇精細(xì)調(diào)節(jié)機(jī)制的。當(dāng)點(diǎn)對點(diǎn)進(jìn)行比較時,蛋白質(zhì)和轉(zhuǎn)錄物之間的一致性通常很弱,正如在酵母中顯示的那樣,特定生物學(xué)路徑的組成基因的一致性或不一致性會更強(qiáng)。這些觀察說明了“從個體基因座的局部分析擴(kuò)展到功能途徑系統(tǒng)分析”的重要性。 轉(zhuǎn)錄組學(xué)和蛋白組學(xué)都是了解研究系統(tǒng)的生理化學(xué)狀態(tài)的有用工具。當(dāng)然,沒有一種工具可以為系統(tǒng)提供完全的覆蓋范圍及相應(yīng)的精確度。問題的核心,不是用工具找出mRNA和蛋白質(zhì)之間一對一的相互關(guān)系,而是要用它們區(qū)別出真陽性和假陽性,即區(qū)別出真正的mRNA-蛋白質(zhì)一致性或者是不一致性。沒有這些整體分析,就無法觀察到真正的mRNA-蛋白質(zhì)不一致性,并且這些不一致性要比一致性更吸引科學(xué)家,因?yàn)樗鼈兺嘎冻龅母嗟霓D(zhuǎn)錄后干涉情況,可以進(jìn)一步去研發(fā)治療方法。 哺乳動物晝夜節(jié)律鐘的不一致就是時移不一致的一個例子,調(diào)節(jié)蛋白如Period(mPER)在蛋白質(zhì)和轉(zhuǎn)錄物表達(dá)之間顯示了4~8小時的延遲??傮w不一致的一個例子是Ras/Akt信號在成膠質(zhì)細(xì)胞瘤中顯示出的不一致,其中總mRNA變化很小。更多的變化發(fā)生在翻譯起始的核糖體裝載期間,依次更改了蛋白質(zhì)性質(zhì)。 |
|