▎藥明康德內(nèi)容團(tuán)隊(duì)編輯近一段時(shí)間,ChatGPT可謂是火遍全網(wǎng)。這款基于人工智能的工具在聊天上幾乎可以以假亂真,讓人分辨不出和自己在說(shuō)話的究竟是人還是AI。更夸張的是,誕生不到2個(gè)月,它已經(jīng)撼動(dòng)了許多領(lǐng)域:因?yàn)樗鼘懗龅恼撐馁|(zhì)量極高,教育系統(tǒng)甚至已經(jīng)開始考慮“封殺”這個(gè)程序,以防學(xué)生利用它作弊;也因?yàn)榧幢闶菍<乙搽y以區(qū)分這些內(nèi)容是否來(lái)自AI,《自然》在內(nèi)的多家科學(xué)雜志也要求論文中需要明確指出是否使用了ChatGPT。此外,它還通過(guò)了美國(guó)商學(xué)院、法學(xué)院和醫(yī)學(xué)院的資格考試。盡管分?jǐn)?shù)并不頂尖,卻也足以讓人感嘆AI有多強(qiáng)。 而類似的AI工具,可能將要變革生物醫(yī)藥領(lǐng)域…… 日前,科學(xué)家們利用與ChatGPT背后AI模型類似的算法,創(chuàng)建了一款能從頭生成人工蛋白的AI系統(tǒng),在實(shí)驗(yàn)檢測(cè)中,它生成的蛋白酶雖然氨基酸序列與大自然中發(fā)現(xiàn)的天然酶迥然不同,但是功能卻可與之媲美。文章作者表示,這個(gè)AI系統(tǒng)就好比“生物學(xué)的ChatGPT”,將顛覆創(chuàng)新蛋白的生成模式。
ChatGPT背后的大型語(yǔ)言模型利用對(duì)海量人類語(yǔ)言數(shù)據(jù)的分析,學(xué)習(xí)人類語(yǔ)言的語(yǔ)法和其它特征。在這項(xiàng)研究中,研究人員同樣使用了深度學(xué)習(xí)語(yǔ)言模型,與ChatGPT不同的是,他們給這款名為ProGen的模型輸入的不是人類的語(yǔ)言和文字,而是約2.8億個(gè)蛋白質(zhì)序列,它們來(lái)自近兩萬(wàn)個(gè)蛋白家族,并且包括描述蛋白特征的信息。從中,ProGen學(xué)習(xí)到了蛋白中氨基酸排序的規(guī)律,以及它們與蛋白結(jié)構(gòu)和功能的關(guān)系。研究人員表示,這就像是在學(xué)習(xí)蛋白結(jié)構(gòu)和生物學(xué)的“語(yǔ)言”。研究人員在這一研究中讓ProGen生成能夠殺死細(xì)菌的溶菌酶。從AI模型生成的上百萬(wàn)個(gè)蛋白序列中,他們基于人工蛋白與自然蛋白的相似程度,以及AI蛋白模擬自然氨基酸排列“語(yǔ)法”的相似度選出了100個(gè)候選蛋白。再?gòu)倪@100個(gè)蛋白中進(jìn)一步篩選出5個(gè)人工蛋白,對(duì)它們的溶菌活性進(jìn)行檢測(cè)。結(jié)果顯示,其中兩款人工合成的溶菌酶能夠溶解細(xì)菌的細(xì)胞壁,而且活性與大自然中出現(xiàn)的雞蛋清溶菌酶(HEWL)類似。然而,這兩款人工蛋白的氨基酸序列與任何已知蛋白之間只有90%和70%的重復(fù),代表著在大自然中從未出現(xiàn)過(guò)的全新蛋白。研究人員表示這一新技術(shù)可能比獲得諾貝爾獎(jiǎng)的定向進(jìn)化(directed evolution)蛋白設(shè)計(jì)技術(shù)更有威力,給蛋白工程學(xué)領(lǐng)域注入新的活力。基于ProGen系統(tǒng),文章的第一作者Ali Madani博士聯(lián)合創(chuàng)建的新銳公司Profluent也在日前浮出水面。在接受行業(yè)媒體Endpoints News采訪時(shí),他表示未來(lái)的新藥開發(fā)將不再以實(shí)驗(yàn)驅(qū)動(dòng)為主,AI只起到輔助作用。當(dāng)AI能夠充當(dāng)?shù)鞍缀蜕飳W(xué)“語(yǔ)言”的翻譯官時(shí),我們將不再需要在大自然中無(wú)窮無(wú)盡的尋找,或者受到傳統(tǒng)蛋白工程學(xué)的局限。“語(yǔ)言模型學(xué)習(xí)了進(jìn)化的知識(shí),但是它與普通的進(jìn)化過(guò)程不同?!闭撐牡淖髡咧唬又荽髮W(xué)舊金山分校的James S. Fraser博士說(shuō),“我們現(xiàn)在有能力生成具有特定性質(zhì)的蛋白,比如生成熱穩(wěn)定性極高的蛋白,或者讓它與特定蛋白結(jié)合。”▲ProGen等AI系統(tǒng)能夠從頭設(shè)計(jì)具有特定功能的全新蛋白(圖片來(lái)源:參考資料[2])2022年是人工智能設(shè)計(jì)全新分子屢獲突破的一年。在AlphaFold精準(zhǔn)解析蛋白質(zhì)三維結(jié)構(gòu)之后,華盛頓大學(xué)David Baker教授團(tuán)隊(duì)去年接連在《自然》、《細(xì)胞》上發(fā)文,介紹AI設(shè)計(jì)全新藥物的新途徑。Generate Biomedicine公司也推出了基于新算法的AI平臺(tái),能夠按照研究人員要求,定制具有特定特征的全新蛋白結(jié)構(gòu)?!端幟骺档隆返淖x者也將人工智能設(shè)計(jì)全新分子選為2022年生物醫(yī)藥年度突破榜單之首。利用語(yǔ)言模型生成全新蛋白,為蛋白設(shè)計(jì)和新藥開發(fā)增添了基于AI的新策略。在日前結(jié)束的第41屆JP摩根醫(yī)療健康大會(huì)上,科技公司Nvidia的報(bào)告指出,AI生物學(xué)領(lǐng)域近年來(lái)突飛猛進(jìn),能夠像人類一樣輸出創(chuàng)新內(nèi)容的生成式人工智能(generative AI)和在ChatGPT和ProGen背后的大型語(yǔ)言模型(LLM)將促進(jìn)生物學(xué)的工程化?!?strong>到2025年,生成式AI技術(shù)將系統(tǒng)性發(fā)現(xiàn)超過(guò)30%的新藥和新材料!”在日前結(jié)束的2023藥明康德全球論壇上,多位專家在談及產(chǎn)業(yè)創(chuàng)新時(shí)共同指出,將研發(fā)模式從“試錯(cuò)型”轉(zhuǎn)變?yōu)椤邦A(yù)測(cè)型”,是創(chuàng)新的關(guān)鍵之一。而大數(shù)據(jù)和先進(jìn)算法是其中不可或缺的元素。期待人工智能在新藥發(fā)現(xiàn)和開發(fā)領(lǐng)域迎來(lái)更多成功,讓更多好藥新藥加速問(wèn)世,造福全球病患! 藥明康德為全球生物醫(yī)藥行業(yè)提供一體化、端到端的新藥研發(fā)和生產(chǎn)服務(wù),服務(wù)范圍涵蓋化學(xué)藥研發(fā)和生產(chǎn)、生物學(xué)研究、臨床前測(cè)試和臨床試驗(yàn)研發(fā)、細(xì)胞及基因療法研發(fā)、測(cè)試和生產(chǎn)等領(lǐng)域。如您有相關(guān)業(yè)務(wù)需求,歡迎點(diǎn)擊下方圖片填寫具體信息。▲如您有任何業(yè)務(wù)需求,請(qǐng)長(zhǎng)按掃描上方二維碼,或點(diǎn)擊文末“閱讀原文/Read more”,即可訪問(wèn)業(yè)務(wù)對(duì)接平臺(tái),填寫業(yè)務(wù)需求信息▲欲了解更多前沿技術(shù)在生物醫(yī)藥產(chǎn)業(yè)中的應(yīng)用,請(qǐng)長(zhǎng)按掃描上方二維碼,即可訪問(wèn)“藥明直播間”,觀看相關(guān)話題的直播討論與精彩回放[1] Madani et al., (2023). Large language models generate functional protein sequences across diverse families. Nature Biotechnology, https:///10.1038/s41587-022-01618-2[2] Profluent debuts to design proteins with machine learning in bid to move past 'AI sprinkled on top'. Retrieved January 27, 2023, from https:///exclusive-profluent-debuts-to-design-proteins-with-machine-learning-in-bid-to-move-past-ai-sprinkled-on-top/[3] AI Technology Generates Original Proteins from Scratch. Retrieved January 27, 2023, from https://www./news/2023/01/424641/ai-technology-generates-original-proteins-scratch[4] Tools such as ChatGPT threaten transparent science; here are our ground rules for their use. Retrieved January 27, 2023, from https://www./articles/d41586-023-00191-1[5] NVIDIA Highlights AI, Large Language Model Advances in Life Sciences. Retrieved January 27, 2023, from https://www./news/2023/01/20/nvidia-highlights-ai-large-language-model-advances-in-life-sciences[6] JP Morgan Health 2023. Retrieved January 27, 2023, from https://s201./141608511/files/doc_presentations/2023/JPM23_Keynote_vFinal_IR.pdf[7] Profluent. Retrieved January 27, 2023, from https://www.o/technology
|