1.研究背景 在孟德爾遺傳規(guī)律于1900年被再次證實之后,許多科學家投入到遺傳問題的研究上來,試圖揭示基因的本質和作用原理。 1941年比德爾(G.Beadle)和塔特姆(E.Tatum)的工作則強有力地證明了基因突變引起了酶的改變,而且每一種基因一定控制著一種特定酶的合成,從而提出了一個基因一種酶的假說。人們逐步地認識到基因和蛋白質的關系。 “中心法則”提出后更為明確地指出了遺傳信息傳遞的方向,總體上來說是從DNA→RNA→蛋白質。那DNA和蛋白質之間究竟是什么關系?或者說DNA是如何決定蛋白質?這個有趣而深奧的問題在五十年代末就開始引起了一批研究者的極大興趣。 1944年,理論物理學家薛定諤發(fā)表的《什么是生命》一書中就大膽地預言,染色體是由一些同分異構的單體分子連續(xù)所組成。這種連續(xù)體的精確性組成了遺傳密碼。他認為同分異構單體可能作為一般民用的莫爾斯電碼的兩個符號:“· ”“—”,通過排列組合來儲存遺傳信息。 那什么是莫爾斯電碼呢?我們來看下面的資料: 莫爾斯電碼,是由美國畫家和電報發(fā)明人莫爾斯于1838年發(fā)明的一套有“點”和“劃”構成的系統,通過“點”和“劃”間隔的不同排列順序來表達不同的英文字母、數字和標點符號。1844年在美國國會的財政支持下,莫爾斯開設了從馬里蘭州的巴爾地摩到美國首都華盛頓的第一條使用“莫爾斯碼”通信的電報線路,1851年,在歐洲國家有關方面的支持下,莫爾斯碼經過簡化,以后就一直成為國際通用標準通信電碼。電報的發(fā)明、莫爾斯碼的使用改變了人類社會的面貌。隨著社會的進步、科學的發(fā)展,有更先進的通信方式在等待著我們使用,但電報“莫爾斯”碼通信在業(yè)余無線電中占有重要的地位。國際電信聯盟制定的“無線電規(guī)則”中明確指出:任何人請求領取使用業(yè)余電臺設備執(zhí)照,都應該證明其能夠準確地用手發(fā)和用耳接收“莫爾斯”電碼信號組成的電文。雖然今天計算機技術給自動或半自動收發(fā)電報創(chuàng)造了條件,但每一位真正的愛好者仍必須并且也可以通過自我訓練掌握人工收發(fā)報技術。莫爾斯電碼本身并無機密可言,它僅僅只是一種工具。 · :短音念作“滴(di)” —:長音念作“答(da)” 字碼: A:·— B:—··· C:—·—· D:—·· E:· F:··—· G:— —· H:···· I:·· J:·— — — K:—·— L:·—·· M:— — N:—· O:— — — P:·— —· Q:— — ·— R:·—· S:··· T:— U:··— V:···— W:·— — X:—··— Y:—·— — Z:— —·· ?:··— —·· /:—··—· —:—····— 數碼(長碼): 1:·— — — — 2.··— — — 3:···— — 4.····— 5:····· 6:— ···· 7:— — ··· 8:— — — ·· 9:— — — —· 0:— — — — — 通過莫爾斯電碼大致體驗了“翻譯”的過程,無論從電文譯成英文還是從英文譯成電文都離不開莫爾斯密碼表,而我們知道后來被確認的蛋白質的合成過程中也正是有類似這樣的密碼子。 而當時遺傳物質的化學本質是尚未明確的,十年后DNA雙螺旋模型才得以建立,在這樣的背景下能將遺傳信息設想成一種電碼式的遺傳密碼形式,實在是一種超越時代的遠見卓識。到1953年雙螺旋模型的建立,給予科學家們以很大的激勵。破譯遺傳密碼也就成了勢在必行的工作。 要破譯一個未知的密碼,一般的思路就是比較編碼的信息,即密碼和相應的譯文。對于遺傳密碼來說最簡單的破譯方法應是將DNA順序或mRNA順序和多肽相比較。但和一般破譯密碼不同的是,遺傳信息的譯文——蛋白質的順序是已知的,未知的都是密碼。1954年Sanger用紙層析分析了胰島素的結構后,對蛋白質的氨基酸序列了解得越來越多。但是直到1965年前后經歷了十年時間,多位科學家的執(zhí)著研究才破譯了密碼,其中最為重要的幾項工作其思路之新穎、方法之精巧都閃爍著科學的智慧之光。 2.遺傳密碼的試拼與閱讀方式的探索 1954年科普作家伽莫夫G.Gamor對破譯密碼首先提出了挑戰(zhàn)。他以著有《奇異王國的湯姆金斯》等優(yōu)秀的科學幻想作品而著稱,具有豐富的想象力,但他不是一位實驗科學家,所以只能從理論上來嘗試密碼的解讀。當年,他在《自然Nature》雜志首次發(fā)表了遺傳密碼的理論研究的文章,指出“氨基酸正好按DNA的螺旋結構進入各自的洞穴”。他設想: 若一種堿基與一種氨基酸對應的話,那么只可能產生4種氨基酸,而已知天然的氨基酸約有20種,因此不可由一個堿基編碼一種氨基酸。 若2個堿基編碼一種氨基酸的話,4種堿基共有42=16種不同的排列組合,也不足以編碼20種氨基酸。 因此他認為3個堿基編碼一種氨基酸的就可以解決問題。雖然4個堿基組成三聯密碼,經排列組合可產生43=64種不同形式,要比20種氨基酸大兩倍多。 但若是四聯密碼,就會產生44=256種排列組合。 相比之下只有三聯體(triplet)較為符合20種氨基酸。 伽莫夫是用數學的排列組合的方法在理論上作出推測的,后來的實驗證實這一推測是完全正確的。 接下來,人們不禁又要問在三聯體中的每個堿基作為信息只讀一次還是重復閱讀呢?以重疊和非重疊方式閱讀DNA序列會有什么不同呢? 伽莫夫也許是考慮到效率的問題,認為一個堿基可能被重復讀多次,也就是說遺傳密碼的閱讀是完全重疊的,因此氨基酸數目和核苷酸數目存在著一對一的關系。這一假定非常簡潔地解釋了核苷酸間距和多肽鏈上鄰接氨基酸的間距(0.36 nm)之間顯示了明顯的相關性。 若真如此,重疊密碼對多肽鏈上氨基酸的序列就形成了一種限制。例如,具有完全重疊密碼的密碼子ATC,后面接著的密碼子一定是TC開頭,那么相應的氨基酸的順序也會受到限制。再者若是重疊密碼,那么任何一個堿基的突變都會影響到相連的3個重疊密碼子,即三個氨基酸都會發(fā)生改變,但事實并非如此。 1957年Brenner.S發(fā)表了一篇令人興奮的理論文章,他通過蛋白質的氨基酸順序分析,發(fā)現不存在氨基酸的鄰位限制作用,從而否定了遺傳密碼重疊閱讀的可能性。同時人們也發(fā)現在鐮刀型細胞貧血的例子中,血紅蛋白中僅有一個氨基酸發(fā)生改變。說明伽莫夫的后一推論是錯誤的。這就是智者千慮,必有一失。很多著名的科學家也有過類似的失誤。在資料較少的情況下,對未知的真理作出推斷,難免會發(fā)生偏差,但瑕不掩瑜,人們對他們的那種敏銳、大膽、睿智和創(chuàng)新的精神,巧妙的構思仍敬佩不已。 3. 遺傳密碼子的破譯 (1)Paul Zamecnik等人證實細胞中蛋白質合成的場所。他們把放射性標記的氨基酸注射到大鼠體內,經過一段時間后收獲其肝臟,進行蔗糖梯度沉淀并分析各種細胞成份中的放射性蛋白質。 如果注射后經數小時(或數天)收獲肝臟,所有細胞成份中都帶有放射性標記的蛋白質; 如果注射后幾分鐘內即收獲肝臟,那么,放射性標記只存在于含有核糖體顆粒的細胞質成份中。 (2)1957年克里克Crick等為了解釋這個問題提出了一個設想。首先認為如AAA,GGG,CCC,TTT這四個三聯體,分別由相同的堿基構成,解讀的起始位置有可能發(fā)生差錯,因此可能是“無義”密碼子。這樣余下的只有60個密碼子。接著他們又設想,例如ATT和GCA若分別編碼氨基酸a和b,若這兩個密碼子連續(xù)排列成ATTGCAATT……在起讀時若發(fā)生錯位就會產生TTG,TGC,CAA和AAT等順序就是錯讀,這些錯讀的重疊密碼也是無意義的,也就是說一個順序有3種讀法,其中只有一種是有意義的,而其余的兩種都是無義密碼,這樣(60×1/3=20)有義密碼子只有20個,似乎是很圓滿地解釋了氨基酸數目和密碼子總數之間的矛盾,但后來的實驗證明,此設想也是重蹈Gemor的覆轍。 直到1961年克里克Crick和Brenner.S等設計了一個實驗,有力地證實了三聯密碼的真實性。他們用T4噬菌體染色體上的一個基因通過用原黃素處理,可以使DNA脫落或插入單個堿基,插入叫“加字”突變,脫落叫“減字”突變,無論加字和減字都可以引起移碼突變。Crick小組用這種方法獲得一系列的T4噬菌體“加字”和“減字”突變,再進行雜交來獲得加入或減少一個、兩個、三個的不同堿基數的系列突變。 通過這樣的方法他們發(fā)現加入或減少一個和兩個堿基都會引起噬菌體突變,無法產生正常功能的蛋白,而加入或減少3個堿基時卻可以合成正常功能的蛋白質,為什么會這樣呢?我們結合課本P74上的有關句子中插入英語字母對語句產生的變化來理解,進行類比分析。 克里克用實驗的結果證明每個密碼的確是由3個堿基組成的??死锟藢z傳密碼提出了4個特點:a 3個堿基一組,編碼一個氨基酸。b 密碼是不重疊的。c 堿基的順序是從固定起點解讀的。d 密碼是簡并的,即某個特定的氨基酸可以由幾個堿基三聯體來編碼。否定了他們以前的解釋,即64種密碼子中只有20種編碼,其余的44種都是無意的這一推測。從他們的實驗結果來看,如果以前的解釋是正確的話,那么任何移碼突變都將是無義突變,那么T4噬菌體突變體的那個區(qū)域應當很小,但其實不然,發(fā)生移碼仍可翻譯,只不過肽鏈的順序發(fā)生很大的改變,而不是產生很短的肽鏈。 (3)那如何找出64種密碼子到底對應哪種氨基酸呢?在美國國立衛(wèi)生研究院(NIH)從事研究工作的青年科學家尼倫伯格M.W.Nirenberg在讀到第一篇發(fā)現mRNA的報道之后,就決定計劃建立一種無細胞反應系統,來揭開遺傳密碼之謎。 他們的方法和思路與克里克的完全不同,他們采用的體外合成蛋白質的技術 a去模板:用DNA酶處理細胞抽提物,使DNA降解,除去原有的細胞模板。在抽提物含有核糖體、ATP及各種氨基酸,除mRNA以外,是一個完整的翻譯系統。由于DNA被降解,所以不再轉錄新的mRNA,即使原來殘留的mRNA因其半衰期很短,也很快會降解掉。 b 加入polyU:Nirenberg成功地破壞了翻譯系統中的內源mRNA,這樣從理論上來說若加入任何外源mRNA就可以按新的信息合成蛋白。他們采用了多核苷酸磷酸化酶,僅以尿苷二磷酸為底物,人工合成polyU。當他們把人工合成的polyU加入這種無細胞系統中代替天然的mRNA時,驚喜地發(fā)現果真合成了單一的多肽,即多聚苯丙氨酸,它的氨基酸殘基全是苯丙氨酸,這一結果不僅證實了無細胞系統的成功,同時還表明UUU是苯丙氨酸的密碼子。 這是第一個遺傳密碼子被破譯。尼倫伯格的實驗巧妙之處在于利用無細胞系統進行體外合成蛋白質,他這富有創(chuàng)新的實驗方法為他帶來了重大的成功!尼倫伯格也用同樣的方法分別加入polyA、polyC和polyG結果相應地獲得了多聚賴氨酸、多聚脯氨酸和多聚甘氨酸。Nirenberg利用無細胞系統體外合成蛋白質不僅順利地破譯了4個密碼子,同時了證實了Crick等原先認為AAA,UUU,GGG,CCC是無義密碼子的推測是錯誤的。
c 按比例加入2種核苷混合的多聚物 由于當時還未分離RNA pol酶,無法按設計的模板來合成RNA,但除了UUU,CCC,AAA,GGG以外,還必須破譯其它的密碼,Nirenberg又想出了一種新的方法,就是按一定的堿基比例來合成RNA。比如在底物中加5份的UDP和1份的GDP,堿基比為U:G=5:1,它們能組成的三1聯體不外乎8種:UUU,UUG,UGU,GUU,GGG,GGU,GUG,UGG。U和G將隨機地加入到三聯體中,這樣按比例各個位于上進入U和G 的概率不同,如UUU:UGG=(5′5′5):(5′1′1)=25:1;同理UUU:UUG=5:1,根據這樣的推測,在無細胞系統中以這種比例合成的mRNA產生的氨基酸的比例也應是相應的,這樣可以推測出密碼子的組成。如氨基酸測定結果: 苯丙氨酸(UUU):半胱氨酸(UGU)= 5:1 苯丙氨酸(UUU):纈氨酸(GUU) = 5:5 苯丙氨酸(UUU):甘氨酸(GUU) =24:1 苯丙氨酸的密碼子是已知的,由3個U組成那么半胱氨酸一定是由2個U,1個G組成;纈氨酸同樣如此;甘氨酸應是由一個U兩個G組成。S.Ochoa及其合作者獲悉Nirenberg用polyU大獲成功之后,利用身邊保存著多種多聚核苷酸也開展了破譯密碼的研究,采用的方法也是加入不同比例的混合多核苷酸兩組展開了激烈的競爭,經過兩個組一年多的努力,結果搞清了各種氨基酸的堿基組成,但是并不知其序列。Nirenberg于1964年又采用三聯體結合實驗,一舉破譯了所有密碼,取得了重大的突破。 d 三聯體結合實驗 從上面的實驗結果不難看出,按比例合成RNA的方法不能解決最關鍵的序列問題,此時擅長RNA合成的G.Khorana就擔負起直接合成有序多核苷酸的難題,1964年正當Khorara剛剛奮力完成了第一批排列的核糖多核苷酸時,Nirenberg又有新的突破,使破譯密碼的艱難工作迅速達到了光輝的頂點,這種新的突破就是建立了三聯體結合的新方法。這個方法的思路是建立在兩項基礎上的:Ⅰ tRNA和氨基酸及三聯體的結合是特異的;Ⅱ 上述結合的復合體大分子是不能通過硝酸纖維濾膜的微孔,而tRNA- 氨基酸的復合體是可以通過的。 Nirenberg采用了一把鑰匙開一把鎖的思路,進行破譯密碼。他們首先發(fā)現當簡單的特定的核苷酸加入到E.coli的核糖體上時,它們并不促使蛋白質的合成,而引起了特定的tRNA及其攜帶的氨基酸結合到核糖體上,形成大的復合體。因此他們每次在無細胞系統中僅加一種已知序列的三聯體RNA(如ACA),同時在氨基酸中只用14C標記一種氨基酸(如Ser),若ACA進入核糖體后,與其結合tRNA上攜帶的不是所標記的Ser,那么tRNASer和其攜帶的Ser就會從NC上透過,所以通過測定透過NC的tRNA-aa 復合體是否帶有標記,如帶有標記就可以確定輸入的三聯體ACA不是Ser的密碼子;那么就可重新輸入另外的三聯體RNA,一直到tRNA所帶有的標記的氨基酸不透過NC,說明此三聯體RNA正好是標記氨基酸的密碼子.雖然所有64個三核苷酸(密碼子)都可按設想的序列合成,但并不是全部密碼子均能以這種方法決定因為有一些三核苷酸序列與核糖體結合并不象UUU或GUU等那樣有效,以致不能確定它們是否能為特異的氨基酸編碼。 (4)1965年Khorara以不同的思路和方法也巧妙地破譯了全部的密碼,他發(fā)揮了自己合成RNA的特長,用已知堿基組成兩個、三個或四個堿基合成重復順序的mRNA,在體外翻譯系統中加入同位素標記的氨基酸,然后分析所合成多肽的氨基酸順序,再進行比較分析。Khorara采用了有機合成一條短的單鏈DNA重復順序,然后用DNA pol1合成其互補鏈,然后用RNA pol及不同的底物合成兩條重復的RNA共聚物,作為翻譯的mRNA,加入到體外表達系統中,根據合成的肽鏈(以同位素標記)的相應順序來推測各氨基酸的密碼子。如表所示,當重復順序為(UC)n時,組成的重復RNA無論怎么閱讀,只可能是UCU-CUC,翻譯的多肽也是由絲氨酸和亮氨酸之間排列的順序,但尚不能確定這兩種氨基酸的相應密碼子。當重復順序為(UUC)n時,無論怎么閱讀,都只產生三種多聚氨基酸,即poly Ser、poly Leu和polyPhe,和第一次比較,只有一個密碼子UCU相同,但同樣都有Ser和Leu,所以仍不能確定。再看第三行重復順序(UUAC)n,無論怎么讀法,只會是四個密碼子的循環(huán):UUA-CUU-ACU-UAC,但合成的肽鏈中氨基酸三種,-Leu-Leu-Thr-Tyr。將密碼子和氨基酸與第二次作對照,彼此共有密碼子CUU和Leu,所以可以確定CUU是Leu的密碼子。那么第二欄中既然CUU已知是亮氨酸,毫無疑問UCU是絲氨酸。第一欄中原來UCU-CUC難以確定哪一個是Ser,哪一個是Leu,現已確定UCU是Ser,那么余下的CUC定是亮氨酸了。Khorara就用這種方法將所有的61種遺傳密碼都破譯了。這項實驗還同時證實了三聯密碼的正確性,以及簡并性的存在。 (5)終止密碼子的破譯 1962 年 Benzer 和他的學生 S.Champe 對 T4 r Ⅱ突變的研究時發(fā)現野生型的 T4rⅡ這段有兩個順反子 rⅡA 和 rⅡB,共同轉錄一個多順反子 mRNA,但翻譯成兩個分開的蛋白 A 和 B。當發(fā)生缺失突變時,其中有一個突變型為rl589,證明是缺失所造成,缺失的區(qū)域含 rⅡA 基因右邊的大部分,和 rⅡB左邊的小部分。互補實驗表明 rl589 的產物是一條多肽,但無蛋白 A 的活性,但有 B 蛋白的活性。Benzer 認為,這種缺失可能使 mRNA 失去了 A 蛋白合成“終止”和“B”蛋白合成“起始”的密碼子,因此翻譯時沿著一條mRNA 閱讀下去,產生了一條長的肽鏈。1964 年 Brenner 及其同事獲得了 T4 噬菌體編碼頭部蛋白基因的琥珀突變(amber),并進行了精細作圖,并分離研究了各種突變型的多肽。突變型的肽鏈比野生型的要短,因此可以推測琥珀突變可能產生終止密碼子,使肽的合成在中途停止下來;由于突變位點越靠近基因的左端,所產生的肽鏈越短,越靠近右端越接近野生型,據此可以推測翻譯的過程是從 mRNA的 5’端向 3’閱讀。肽鏈的合成是從 N 端向 C 端延伸。由于頭部蛋白 80%是由新合成的蛋白質組成。因此他們將各種突變型及野生型 T4 噬菌體侵染 E.coli 后 10 分鐘,把 14C 標記的氨基酸加到培養(yǎng)基中,過一段時間,從感染的 E.coli 中抽提蛋白,頭部蛋白可以通過 14C標記來加以鑒別。他們的實驗方法不是對各種突變型的產物測序,而是先將野生型的頭部蛋白用胰蛋白酶和糜蛋白酶來處理,消化后所產生的極復雜的混合物中,通過電泳能分離、鑒定出 8 個各有特征的頭部蛋白片段,分別是 Cys,T7C(His), C12b(Tyr), T6(Trp), T2a(Pro), T2(Trp), C2(Tyr)和 C5(His)片段。然后再測出各 T4 頭部蛋白突變型產物含有幾個以上的肽段來排序。表示排序的結果和精細作圖的序列相一致,不僅表明了基因和蛋白質的共線性關系,同時證明突變型頭部蛋白基因內有無義突變的存在,其位置應在各種突變產物的末端。直到 1965 年 Weigert,M.和 Ggaren,A 由堿性磷酸酶基因中色氨酸位點的氨基酸的置換證明 E.coli 中無義密碼子的堿基組成揭示了琥珀和赭石(ochre)突變基因分別是終止密碼子 UAG 和 UAA。當時 64 個密碼中的 61個已破譯,只留下了 UAA、UAG 和 UGA 有待確定。Garen 等為了鑒定無義密碼子采用了和 Brenner 相似的策略。他們從 E.coli 的堿性磷酸酯酶基因(pho A)中的一個無義突變品系中分離了大量的回復突變株,然后來探察每一個無義突變中在多肽中相當于已回復的無義密碼子位置上的氨基酸究竟是什么氨基酸。可以看出無義密碼子是從該基因的色氨酸位點的密碼子產生的。在回復突變中,無義密碼子變成了 Trp、Ser、Tyr、Leu、Glu、Gln和 Lys 的相應密碼子。僅有 Trp 的 UGG 變成 UAG,然后在此基礎上回復突變成 7 種氨基酸,因此 Trp 產生的無義突變的密碼子就是 UAG。最后 1967 年Brennr 和 Crick 證明 UGA 是第三個無義密碼子。根據無義突變的三種昵稱,三個終止密碼子 UAA 叫赭石(ochre)密碼子(相應于赭石突變);UAG 叫琥珀密碼子(相應于琥珀突變);UGA 叫蛋白石(opal)密碼子(相應于蛋白石突變 我們注意整個破譯過程中科學家思維的變化,薛定諤是以富有遠見卓識的大膽的想象來預測遺傳密碼的形式的,伽莫夫通過數學的排列組合的計算來推測密碼子是由三個堿基組成的,同時他也預測了密碼的閱讀方式,盡管智者千慮,必有一失,但巧妙的構思依然顯示了其睿智和創(chuàng)新??死锟藙t是巧妙地設計實驗,利用原黃素處理噬菌體,使DNA脫落或插入單個堿基的方法從實驗上證明了伽莫夫的三聯體密碼子的推測,由理論走向實驗,為密碼子的破譯邁出重要的一步。而尼倫伯格的實驗則更富有創(chuàng)新性,他建立巧妙的無細胞系統進行體外蛋白質合成,成功地破譯了第一個密碼子,隨后的方法不斷創(chuàng)新最終破譯了所有的密碼子。他的貢獻不僅僅在于對遺傳密碼的破譯,更重要的也在對生物研究方法上開啟了新的思維方式。 歸結起來,我們看到,敏銳、大膽、睿智和創(chuàng)新是科學家的重要素養(yǎng),也正如尼倫伯格在1968年獲得諾貝爾生理學或醫(yī)學獎時說過:一個善于捕捉細節(jié)的人才是能領略事物真諦的人。 |
|