有評(píng)論認(rèn)為,AlphaFold對(duì)人類(lèi)蛋白質(zhì)組的結(jié)構(gòu)進(jìn)行“準(zhǔn)確”預(yù)測(cè)所帶來(lái)的沖擊是 “革命性” 的 | 圖源:pixabay.com 過(guò)去兩周,生物學(xué)界因《自然》先后發(fā)表的兩篇論文陷入“狂歡”。一篇是DeepMind公司公布了其開(kāi)發(fā)的人工智能(AI)軟件AlphaFold的源代碼,另外一篇稱(chēng)AlphaFold實(shí)現(xiàn)了對(duì)人類(lèi)蛋白質(zhì)組的準(zhǔn)確結(jié)構(gòu)預(yù)測(cè),其數(shù)據(jù)集涵蓋了人類(lèi)蛋白質(zhì)組近60%氨基酸的結(jié)構(gòu)位置預(yù)測(cè),且預(yù)測(cè)結(jié)果具有可信度,并將通過(guò)歐洲生物信息研究所(EMBL-EBI)托管的公用數(shù)據(jù)庫(kù)免費(fèi)開(kāi)放。 有評(píng)論認(rèn)為這一技術(shù)帶來(lái)的沖擊是“革命性”的,是本世紀(jì)最重要的科學(xué)突破之一,將深刻地改變生命科學(xué)的進(jìn)程和工作范式;也有科學(xué)家認(rèn)為,AlphaFold在工程上確實(shí)做得令人印象深刻,但從基本概念和思想上來(lái)說(shuō),有一些創(chuàng)新,但不是很多,其影響究竟如何,等過(guò)幾年評(píng)價(jià)會(huì)更客觀。 ● ● ● 2017年,谷歌旗下DeepMind公司開(kāi)發(fā)的AlphaGo機(jī)器人戰(zhàn)勝了世界圍棋冠軍柯潔。在一年之后的演講中,柯潔回憶當(dāng)時(shí)的場(chǎng)景說(shuō),在第三局AlphaGo下出令他絕望的一步棋,內(nèi)心知道獲勝無(wú)望后,他感到渾身寒冷的顫抖。不過(guò),柯潔最終釋然,這是人類(lèi)新智慧戰(zhàn)勝了古老智慧的標(biāo)志,他希望人類(lèi)實(shí)現(xiàn)更多這樣的自我超越。 在過(guò)去的幾年里,各個(gè)行業(yè)都在拓展人工智能(AI)的能力邊界,圖片視頻的搜索、語(yǔ)音識(shí)別、人臉識(shí)別、自動(dòng)駕駛、醫(yī)療影像,其中也包括了科研領(lǐng)域——天文學(xué)家已經(jīng)用深度學(xué)習(xí)(Deep Learning)對(duì)海量的天體自動(dòng)分類(lèi)、發(fā)現(xiàn)稀有的天體、探測(cè)引力波、發(fā)現(xiàn)系外行星。如今,傳統(tǒng)上被認(rèn)為是實(shí)驗(yàn)科學(xué)的生物學(xué)也因人工智能迎來(lái)了巨變。 這一次,源頭正是DeepMind團(tuán)隊(duì)的人工智能軟件系統(tǒng)AlphaFold。 7月23日,DeepMind團(tuán)隊(duì)和歐洲生物信息研究所(EMBL-EBI)合作,發(fā)布由人工智能系統(tǒng)AlphaFold預(yù)測(cè)的蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)(AlphaFold Protein Structure Database),供科學(xué)家免費(fèi)使用。如同人類(lèi)基因組圖譜的公布代表著基因組學(xué)革命的起點(diǎn),這一數(shù)據(jù)庫(kù)的發(fā)布很快被認(rèn)為有望為生命科學(xué)帶來(lái)革命性的變化。 不過(guò),發(fā)布后初步試用過(guò)這一系統(tǒng)的科學(xué)家,在接受《知識(shí)分子》采訪時(shí)對(duì)其評(píng)價(jià)不一。有科學(xué)家認(rèn)為在其解析蛋白結(jié)構(gòu)預(yù)測(cè)上給了自己更多的靈感,但也有科學(xué)家在對(duì)比AlphaFold預(yù)測(cè)的結(jié)果和自己已經(jīng)解析出結(jié)構(gòu)但未發(fā)表文章的數(shù)據(jù)之后,發(fā)現(xiàn)AlphaFold預(yù)測(cè)的大部分結(jié)果不對(duì),因此認(rèn)為AlphaFold對(duì)自己的工作(幫助)作用不大。 “革命性的改變”,文章一經(jīng)發(fā)布,在和業(yè)內(nèi)多位結(jié)構(gòu)生物學(xué)家聊過(guò)后,這是《知識(shí)分子》聽(tīng)到的最多的描述。一向桀驁不馴的結(jié)構(gòu)生物學(xué)家,似乎要謙虛接受這一行業(yè)因?yàn)槿斯ぶ悄芏鴺O大加速的事實(shí)。 此次公布的AlphaFold蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù),覆蓋了人類(lèi)以及20種生物學(xué)研究中常用模式生物(大腸桿菌、果蠅、斑馬魚(yú)、小鼠等)約35萬(wàn)個(gè)蛋白結(jié)構(gòu),其中包括98.5%的人類(lèi)蛋白結(jié)構(gòu)預(yù)測(cè)結(jié)果。 此前,科學(xué)家們?cè)跀?shù)十年的努力之后,解析的蛋白結(jié)構(gòu)只覆蓋了人類(lèi)蛋白序列中17%的氨基酸。在《自然》雜志發(fā)表的論文中,研究人員指出,AlphaFold能夠?qū)θ祟?lèi)蛋白質(zhì)組中58%的氨基酸的結(jié)構(gòu)位置做出可信預(yù)測(cè)(confident prediction),對(duì)35.7%的氨基酸的結(jié)構(gòu)預(yù)測(cè)達(dá)到很高的置信度(very high confidence)。 DeepMind和歐洲生物信息研究所還表示,雙方將不斷為這一數(shù)據(jù)庫(kù)添加新的蛋白三維預(yù)測(cè)結(jié)構(gòu)。到今年年底,數(shù)據(jù)庫(kù)可能包含1.3億個(gè)蛋白結(jié)構(gòu)。DeepMind團(tuán)隊(duì)的目標(biāo)是為所有具有已知序列的蛋白提供預(yù)測(cè)結(jié)構(gòu)。 “我覺(jué)得這個(gè)對(duì)結(jié)構(gòu)生物學(xué)而言又是一次革命,將大大提升結(jié)構(gòu)生物學(xué)研究的水平和速度。目前短期來(lái)看實(shí)驗(yàn)手段還是金標(biāo)準(zhǔn),但是這個(gè)標(biāo)準(zhǔn)是否消失或者被取代還要看今后一段時(shí)間的情況。” 西湖大學(xué)特聘研究員周強(qiáng)告訴《知識(shí)分子》。 生物學(xué)一直以來(lái)是以實(shí)驗(yàn)為基礎(chǔ)的學(xué)科,實(shí)驗(yàn)手段測(cè)定的數(shù)據(jù)因此成為認(rèn)知的金標(biāo)準(zhǔn)(gold standard)。周強(qiáng)認(rèn)為,如果預(yù)測(cè)的結(jié)果屢次被實(shí)驗(yàn)證實(shí)的話,那么預(yù)測(cè)所用的工具或者規(guī)律將上升到定律的高度,從而改變研究者的認(rèn)知和研究的范式。 歷史上,伴隨著解析蛋白結(jié)構(gòu)的工具的日益強(qiáng)大,結(jié)構(gòu)生物學(xué)也獲得了重大發(fā)展。最早是X射線晶體衍射,之后是冷凍電鏡。第三次是結(jié)合了強(qiáng)大計(jì)算力和算法的新一代人工智能技術(shù),而這一切來(lái)的如此之快。 2020年11月30日,AlphaFold在第14屆國(guó)際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽(CASP)中摘得桂冠,在接受檢驗(yàn)的近100個(gè)蛋白靶點(diǎn)中,AI系統(tǒng)對(duì)三分之二的蛋白靶點(diǎn)給出的預(yù)測(cè)結(jié)構(gòu)與實(shí)驗(yàn)手段獲得的結(jié)構(gòu)相差無(wú)幾。 當(dāng)時(shí),DeepMind在官網(wǎng)發(fā)布新聞稿,稱(chēng)對(duì)于困擾生物學(xué)界50年的 “蛋白質(zhì)折疊” 難題,AlphaFold系統(tǒng)已成為業(yè)內(nèi)專(zhuān)家認(rèn)可的解決方案;Nature 新聞更是以 “it will change everything”(將改變一切)作為標(biāo)題,指出DeepMind在解決蛋白結(jié)構(gòu)問(wèn)題上 “邁出一大步”。 僅僅過(guò)了半年,2021年7月16日,DeepMind團(tuán)隊(duì)就在《自然》雜志上發(fā)表論文,公開(kāi)了優(yōu)化后的AlphaFold人工智能系統(tǒng)的源代碼,并詳細(xì)描述了其設(shè)計(jì)框架和訓(xùn)練方法。如今,一個(gè)包含了預(yù)測(cè)的約35萬(wàn)個(gè)蛋白結(jié)構(gòu)預(yù)測(cè)信息的數(shù)據(jù)庫(kù)問(wèn)世。 專(zhuān)注于使用深度學(xué)習(xí)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的芝加哥大學(xué)豐田計(jì)算技術(shù)研究所終身教授許錦波認(rèn)為,做分子生物學(xué)的很多人一直都在用人工智能手段預(yù)測(cè)出來(lái)蛋白結(jié)構(gòu),“現(xiàn)在(AlphaFold)有更準(zhǔn)確的預(yù)測(cè),對(duì)他們的幫助應(yīng)當(dāng)會(huì)更大”。 專(zhuān)注于使用深度學(xué)習(xí)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的芝加哥大學(xué)豐田計(jì)算技術(shù)研究所終身教授許錦波認(rèn)為,做分子生物學(xué)的很多人一直都在用人工智能手段預(yù)測(cè)蛋白結(jié)構(gòu),“現(xiàn)在(AlphaFold)有更準(zhǔn)確的預(yù)測(cè),對(duì)他們的幫助應(yīng)當(dāng)會(huì)更大”。 許錦波解釋?zhuān)珹lphaFold在預(yù)測(cè)一個(gè)目標(biāo)蛋白質(zhì)的結(jié)構(gòu)的時(shí)候,會(huì)先在已有的蛋白質(zhì)序列和結(jié)構(gòu)數(shù)據(jù)庫(kù)里面尋找這個(gè)目標(biāo)蛋白質(zhì)的同源蛋白。這些同源蛋白跟目標(biāo)蛋白在序列上可能不太一樣,但是結(jié)構(gòu)是相似的。這些同源蛋白構(gòu)成了AlphaFold神經(jīng)網(wǎng)絡(luò)的輸入。 通過(guò)使用基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)以及現(xiàn)有實(shí)驗(yàn)結(jié)構(gòu)的訓(xùn)練,AlphaFold可以從同源蛋白中預(yù)測(cè)出目標(biāo)蛋白氨基酸之間的相互作用強(qiáng)度圖。然后AlphaFold利用另外的神經(jīng)網(wǎng)絡(luò)以及蛋白質(zhì)結(jié)構(gòu)固有的物理約束從氨基酸之間的相互作用強(qiáng)度生成目標(biāo)蛋白質(zhì)原子的三維坐標(biāo)。 對(duì)于AlphaFold的預(yù)測(cè)精度,許錦波稱(chēng),這依賴(lài)于同源蛋白的數(shù)量和相似性,以及同源蛋白是否已經(jīng)有實(shí)驗(yàn)結(jié)構(gòu)。如果同源蛋白數(shù)量很少又沒(méi)有實(shí)驗(yàn)結(jié)構(gòu),那么AlphaFold一般就很難做出準(zhǔn)確的預(yù)測(cè)(當(dāng)然也有例外)。 “至于是不是本世紀(jì)最重要的科學(xué)突破之一 ,每個(gè)人的看法不一樣,再過(guò)幾年評(píng)價(jià)會(huì)更客觀一些?!?許錦波說(shuō)。他指出,人類(lèi)蛋白質(zhì)結(jié)構(gòu)對(duì)很多問(wèn)題很重要,但并不是說(shuō)有了結(jié)構(gòu)其他問(wèn)題就能很容易解決,比如說(shuō)藥物發(fā)現(xiàn)和設(shè)計(jì), 蛋白相互作用等等,這些問(wèn)題依然存在。 他評(píng)價(jià),從基本概念和思想上來(lái)說(shuō),Alphafold有一些創(chuàng)新,但不是很多,在工程上確實(shí)做得非常 “impressive”(令人印象深刻)。 “這場(chǎng)蛋白結(jié)構(gòu)預(yù)測(cè)的革命其實(shí)是從我2017年1月份發(fā)表的一篇論文開(kāi)始的。DeepMind 把這個(gè)過(guò)程加速了,沒(méi)有他們(DeepMind團(tuán)隊(duì)),學(xué)術(shù)界可能還需要5,6年或更長(zhǎng)時(shí)間?!?許錦波說(shuō)。 2017年1月,許錦波首次提出使用全局性的深度卷積殘差神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Residual Neural Network)的方法去預(yù)測(cè)接觸圖或者距離圖,以預(yù)測(cè)蛋白的三維結(jié)構(gòu),而這是AlphaFold系統(tǒng)運(yùn)行的重要基礎(chǔ)。不同的是,AlphaFold把卷積換成注意力機(jī)制,也把氨基酸之間的距離圖換成相互作用圖。 “使用基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)預(yù)測(cè)蛋白結(jié)構(gòu),之前已經(jīng)有很多人在做,但是DeepMind把它做到了極致,證明人工智能預(yù)測(cè)蛋白結(jié)構(gòu)可行?!鼻迦A大學(xué)生命科學(xué)學(xué)院教授王宏偉也評(píng)價(jià)稱(chēng),“(AlphaFold)更多的是一種工程層面的組織”。 王宏偉指出,這種新型的科研范式,與大學(xué)實(shí)驗(yàn)室一兩個(gè)人或者幾個(gè)人去做研究非常不同?!八鋵?shí)是通過(guò)一種公司的組織方式,把相關(guān)的不同多個(gè)領(lǐng)域的專(zhuān)家,包括結(jié)構(gòu)生物學(xué)專(zhuān)家、生物信息學(xué)的專(zhuān)家,結(jié)構(gòu)預(yù)測(cè)的專(zhuān)家,計(jì)算機(jī)的專(zhuān)家,人工智能的專(zhuān)家,把他們組合到一塊,一起通過(guò)這種新的組織方式去做這樣的事情,然后利用公司的非常強(qiáng)大的資源作為支撐去做”。 值得注意的是,DeepMind公布Alpahfold源代碼這天(7月16日),華盛頓大學(xué)David Baker團(tuán)隊(duì)也公布了自己的人工智能預(yù)測(cè)蛋白結(jié)構(gòu)的系統(tǒng)RoseTTAFold源代碼。 不管是否因?qū)W術(shù)界的壓力公布源代碼,王宏偉說(shuō),DeepMind最終沒(méi)有把Alpahfold作為公司自己的獨(dú)有的技術(shù)封存起來(lái),這次完全公開(kāi),“我覺(jué)得對(duì)于整個(gè)人類(lèi)來(lái)講是一個(gè)很重要的貢獻(xiàn)”。 搶飯碗還是賦能結(jié)構(gòu)生物學(xué)?伴隨著AlphaFold強(qiáng)大的預(yù)測(cè)能力,也許,今后解析一個(gè)蛋白結(jié)構(gòu)不再那么難。 “計(jì)算驗(yàn)證生物學(xué)時(shí)代羞羞答答地正式開(kāi)啟?!?清華大學(xué)生命科學(xué)學(xué)院教授楊茂君評(píng)論說(shuō)。 他所說(shuō)的計(jì)算驗(yàn)證生物學(xué),可以理解為在人工智能完成蛋白結(jié)構(gòu)的預(yù)測(cè)后,科學(xué)家再用實(shí)驗(yàn)的方法進(jìn)行驗(yàn)證。 “以前要想看到結(jié)構(gòu),再去闡述的話很困難,因?yàn)楂@取結(jié)構(gòu)的過(guò)程比較困難,但如果有這個(gè)軟件,兩三分鐘就可以給出一個(gè)大致的模型,就可以很容易進(jìn)行闡述,然后做幾個(gè)蛋白突變,就可以驗(yàn)證你的想法,所以說(shuō)叫做結(jié)構(gòu)驗(yàn)證學(xué)?!睏蠲f(shuō)。 而僅僅驗(yàn)證的話,工作量就要低很多。可以預(yù)見(jiàn)的是,結(jié)構(gòu)生物學(xué)會(huì)越來(lái)越簡(jiǎn)單了。 “上手做結(jié)構(gòu)的人會(huì)越來(lái)越多,對(duì)其他的學(xué)科的研究肯定會(huì)有很強(qiáng)的促進(jìn)作用,也會(huì)越來(lái)越重視結(jié)構(gòu)生物學(xué),以前解結(jié)構(gòu)實(shí)在太困難了?!? 楊茂君說(shuō)。 AlphaFold開(kāi)源后,清華大學(xué)醫(yī)學(xué)院教授李海濤很快就嘗試測(cè)試了這一系統(tǒng)。他的判斷是,AlphaFold作為一種蛋白結(jié)構(gòu)預(yù)測(cè)工具,可以更早地啟迪新發(fā)現(xiàn)。 李海濤向《知識(shí)分子》展示了AlphaFold預(yù)測(cè)的一種表觀調(diào)控蛋白的三維結(jié)構(gòu),這個(gè)蛋白有兩個(gè)間隔甚遠(yuǎn)的結(jié)構(gòu)域,它們各自的結(jié)構(gòu)先前己分別得到解析,但沒(méi)有數(shù)據(jù)表明二者有直接關(guān)聯(lián),而AlphaFold的預(yù)測(cè)啟示這兩個(gè)結(jié)構(gòu)域可以相互倚靠,形成更高級(jí)的結(jié)構(gòu),極可能對(duì)應(yīng)著全新的調(diào)控功能。 李海濤說(shuō),盡管這一點(diǎn)仍待實(shí)驗(yàn)驗(yàn)證,但這已經(jīng)帶給他莫大的驚喜?!霸具@要?dú)v經(jīng)數(shù)年探索加上機(jī)遇才能夠意識(shí)到的發(fā)現(xiàn),現(xiàn)在有了人工智能結(jié)構(gòu)預(yù)測(cè),讓我超前意識(shí)到了?!?/span> 接下來(lái),李海濤團(tuán)隊(duì)要做的,就是對(duì)這一啟示進(jìn)行生化與結(jié)構(gòu)驗(yàn)證,然后設(shè)計(jì)下一步的功能實(shí)驗(yàn),探究這一發(fā)現(xiàn)的生理和病理意義。 在李海濤看來(lái),高質(zhì)量的AI預(yù)測(cè)結(jié)構(gòu),將充分釋放結(jié)構(gòu)生物學(xué)的學(xué)科能量,使其能更高效地服務(wù)于闡明結(jié)構(gòu)如何決定功能這一根本宗旨。與此同時(shí),這對(duì)單純靠蛋白結(jié)構(gòu)解析發(fā)高影響力論文的研究模式造成了沖擊一一AI預(yù)測(cè)所帶來(lái)的研究范式轉(zhuǎn)變開(kāi)啟了一個(gè)發(fā)現(xiàn)與功能導(dǎo)向的結(jié)構(gòu)生物學(xué)新時(shí)代。 清華大學(xué)生命科學(xué)學(xué)院教授王宏偉也認(rèn)為,人工智能極大地釋放了勞動(dòng)力,使得結(jié)構(gòu)生物學(xué)家未來(lái)可以把更多的精力放在理解更加復(fù)雜的復(fù)合體的結(jié)構(gòu),分析生物大分子結(jié)構(gòu)的動(dòng)態(tài),以及分子機(jī)制的研究上,而不是花費(fèi)大量精力和時(shí)間在解結(jié)構(gòu)的過(guò)程中。 李海濤和王宏偉還不約而同地表示,冷凍電鏡將在驗(yàn)證人工智能預(yù)測(cè)發(fā)揮更大的作用,正是因?yàn)轭A(yù)測(cè)蛋白結(jié)構(gòu)的準(zhǔn)確率和速度越來(lái)越快,會(huì)有更多的驗(yàn)證工作要去做。另外,冷凍電鏡最重要的優(yōu)勢(shì)就是在解析復(fù)合體的結(jié)構(gòu)和解決溶液與原位狀態(tài)不同構(gòu)象的分子機(jī)器的結(jié)構(gòu),而這是人工智能目前無(wú)法做到的。 “毋庸置疑的是,近年來(lái)隨著AI和算力的快速發(fā)展,生命科學(xué)的各個(gè)領(lǐng)域?qū)⒚媾R逐步智能化的升級(jí)。從AI的角度,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)在一定程度上是生命活動(dòng)中相對(duì)比較容易建模的過(guò)程,較少依賴(lài)大數(shù)據(jù)。隨著AI進(jìn)入生命科學(xué)的深水區(qū),我預(yù)計(jì)各種生理病理狀態(tài)下的蛋白質(zhì)組大數(shù)據(jù)水平的累積將對(duì)AI廣泛用于生命健康有至關(guān)重要的作用。” 西湖大學(xué)特聘研究員郭天南告訴《知識(shí)分子》。 不過(guò),AlphaFold預(yù)測(cè)的結(jié)構(gòu)仍然有很多局限。 論文作者指出,很多蛋白通過(guò)與其它蛋白、核苷酸或配體結(jié)合來(lái)行使功能,AlphaFold尚且不能預(yù)測(cè)復(fù)雜復(fù)合體的三維結(jié)構(gòu)。 此外,蛋白構(gòu)象很多情況下是動(dòng)態(tài)過(guò)程,同一個(gè)蛋白可能根據(jù)環(huán)境和其它因素,變換成不同的構(gòu)像并且具有不同的功能,而AlphaFold通常只能預(yù)測(cè)出一個(gè)最優(yōu)構(gòu)象,也不能預(yù)測(cè)蛋白的動(dòng)態(tài)過(guò)程。 “AlphaFold的確是非常強(qiáng)大,可以把幾分鐘就把一個(gè)結(jié)構(gòu)給預(yù)測(cè)出來(lái),但是蛋白分子的構(gòu)象在體內(nèi),其實(shí)它是在不停的變化的,是一個(gè)動(dòng)態(tài)過(guò)程。變化才是主題,再?gòu)?qiáng)的算法也很難達(dá)到精準(zhǔn)預(yù)測(cè)。” 楊茂君說(shuō)。 對(duì)于AlphaFold,在經(jīng)歷了短暫的興奮之后,楊茂君發(fā)現(xiàn),AlphaFold帶給結(jié)構(gòu)生物學(xué)家的沖擊,可能沒(méi)有想象中那么大。 他告訴《知識(shí)分子》,他的實(shí)驗(yàn)室有十多個(gè)已經(jīng)解出來(lái)但未發(fā)表文章的蛋白結(jié)構(gòu),但與AlphaFold的預(yù)測(cè)對(duì)比之后,“差別太大了,預(yù)測(cè)的結(jié)果沒(méi)什么用。” 楊茂君說(shuō),AlphaFold對(duì)已經(jīng)有結(jié)構(gòu)的同源蛋白質(zhì)的預(yù)測(cè)相對(duì)來(lái)說(shuō)準(zhǔn)確度會(huì)高一些,但因?yàn)樗麄儗?shí)驗(yàn)室做的蛋白結(jié)構(gòu),很多都是別人以前沒(méi)解析過(guò)的,“所以說(shuō)它(DeepMind團(tuán)隊(duì))才預(yù)測(cè)出來(lái)就不準(zhǔn)嘛,這個(gè)也是它的局限性所在?!?/span> "人工智能只能預(yù)測(cè)有結(jié)構(gòu)的序列的結(jié)構(gòu),而對(duì)于沒(méi)結(jié)構(gòu)的氨基酸序列,AlphaFold也無(wú)從做出結(jié)構(gòu)預(yù)測(cè)。"清華大學(xué)醫(yī)學(xué)院教授李海濤表示,蛋白質(zhì)特定結(jié)構(gòu)的形成有著嚴(yán)謹(jǐn)?shù)纳瓌t約束,這就像特定語(yǔ)法約束著語(yǔ)言形成一樣,并不是任何文字組合都有語(yǔ)義。 而AlphaFold做的,就是把自然界中經(jīng)億萬(wàn)年進(jìn)化而選擇下來(lái)的擁有特定結(jié)構(gòu)的氨基酸序列的結(jié)構(gòu)預(yù)測(cè)出來(lái)。這顯然受惠于測(cè)序大數(shù)據(jù)的建立,它使得我們知道哪些氨基酸的排列組合是自然選擇下來(lái)能形成特定結(jié)構(gòu)、行使特定功能的序列精華。對(duì)于隨機(jī)序列而言,絕大部分情況下,一級(jí)序列并不能決定三維結(jié)構(gòu),AlphaFold當(dāng)然也就“無(wú)能為力”去預(yù)測(cè)結(jié)構(gòu)了。 "從某種意義上講,AI結(jié)構(gòu)預(yù)測(cè)突破帶來(lái)的一個(gè)全新挑戰(zhàn)其實(shí)是一一哪段序列有結(jié)構(gòu)?在AI的輔助下,人類(lèi)認(rèn)知有望全面實(shí)現(xiàn)從大自然的序列啟示到人工結(jié)構(gòu)設(shè)計(jì)的升華。"李海濤說(shuō)。 “這一里程碑式的進(jìn)展,距離人類(lèi)完全解析生命活動(dòng)的奧秘仍有較大的距離。首先,蛋白質(zhì)組具有高度復(fù)雜的結(jié)構(gòu)和動(dòng)態(tài),復(fù)雜蛋白質(zhì)復(fù)合體的結(jié)構(gòu)解析仍是一個(gè)挑戰(zhàn);其次,蛋白質(zhì)結(jié)構(gòu)在不同生理病理狀態(tài)下的動(dòng)態(tài)也是尚未解決的難題?!蔽骱髮W(xué)特聘研究員郭天南說(shuō),“除了結(jié)構(gòu)解析,蛋白質(zhì)組在不同組織細(xì)胞和生理病理狀態(tài)下的表達(dá)和功能活性,則需要更多的技術(shù)手段進(jìn)行研究,比如質(zhì)譜技術(shù)?!?nbsp; 參考文獻(xiàn) 1. Tunyasuvunakool, K., Adler, J., Wu, Z. et al. Highly accurate protein structure prediction for the human proteome. Nature (2021). https:///10.1038/s41586-021-03828-1 2. Jumper, J., Evans, R., Pritzel, A. et al. Highly accurate protein structure prediction with AlphaFold. Nature (2021). https:///10.1038/s41586-021-03819-2 3. Baek, Minkyung, Frank DiMaio, Ivan Anishchenko, Justas Dauparas, Sergey Ovchinnikov, Gyu Rie Lee, Jue Wang et al. 'Accurate prediction of protein structures and interactions using a three-track neural network.' Science (2021).DOI: 10.1126/science.abj8754
|