庫恩還發(fā)現(xiàn),科學(xué)的發(fā)展并不是一種平滑的線性發(fā)展模式,而是會(huì)像走臺(tái)階一樣,隔一個(gè)階段上一個(gè)臺(tái)階,這種情況就被庫恩叫做“范式轉(zhuǎn)換”。后來,他寫書的時(shí)候,就用了一個(gè)更加有沖擊力的詞——科學(xué)革命。他想表達(dá)的是,科學(xué)的發(fā)展每隔一個(gè)時(shí)期,就會(huì)迎來一場(chǎng)革命,很多舊有的范式會(huì)被新的范式所取代,每當(dāng)革命之后,科學(xué)又會(huì)取得新一輪突飛猛進(jìn)的發(fā)展 。
說實(shí)話,以前我對(duì)庫恩的這套理論并不是十分認(rèn)同。我認(rèn)為,總結(jié)過去,不代表就能預(yù)測(cè)未來?,F(xiàn)代的科研活動(dòng)已經(jīng)發(fā)展得相當(dāng)成熟,科學(xué)方法也差不多都定型,我實(shí)在想不出還能有什么可以取代現(xiàn)代科學(xué)方法,簡(jiǎn)言之就是“理論推理+系統(tǒng)實(shí)驗(yàn)”這一套方法。
> 未來范式或?qū)⒁I(lǐng)科學(xué)革命 <
但是最近這一年以來,看到 GPT 這個(gè)人工智能模型的快速迭代發(fā)展,我突然發(fā)現(xiàn),庫恩所說的科學(xué)革命,很可能就在不遠(yuǎn)的將來,再次到來。人類社會(huì)又將迎來一次史無前例的深刻變革,這場(chǎng)變革的劇烈程度,很可能不亞于工業(yè)革命對(duì)社會(huì)的沖擊。
為了讓你感受到最近一段時(shí)間我內(nèi)心受到的那種沖擊和震撼,我需要一層層展開跟你講。為了敘述的方便,我把目前最成熟的科學(xué)研究范式稱為“現(xiàn)代范式 ”,而這一場(chǎng)科學(xué)革命后的范式稱為“未來范式 ”。
現(xiàn)代范式遵循這樣的過程:不論我們做什么樣的科研項(xiàng)目,總是先要找到一套指導(dǎo)性的理論,這個(gè)理論未必成熟,也不一定完全正確,但總是先要有理論。然后,根據(jù)這套理論做出一些假設(shè)或者猜想,然后再設(shè)計(jì)實(shí)驗(yàn)來證實(shí)或者證偽,如此循環(huán)往復(fù),直到找到滿意的答案為止。
我舉個(gè)例子。用現(xiàn)代范式來研發(fā)一款靶向新藥,科學(xué)家們要怎么做呢?大概可以分成這樣幾個(gè)步驟:
【 第一步:發(fā)現(xiàn)新靶點(diǎn) 】
所謂的靶點(diǎn),即藥物會(huì)攻擊的點(diǎn),比如癌細(xì)胞的某個(gè)位置。怎么找到它們呢?就要通過現(xiàn)有的理論,比如生物信息學(xué)、分子生物學(xué)等,找出可能與某種疾病相關(guān)的蛋白質(zhì)分子上的靶點(diǎn)。
【 第二步:藥物設(shè)計(jì) 】
在現(xiàn)有理論的指導(dǎo)下,設(shè)計(jì)出一種有可能成功攻擊靶點(diǎn)的分子結(jié)構(gòu)。
【 第三步:合成 】
通過化學(xué)方法合成出想要的分子結(jié)構(gòu)。
【 第四步:實(shí)驗(yàn) 】
包括動(dòng)物實(shí)驗(yàn)、臨床試驗(yàn)等。
實(shí)驗(yàn)有可能成功也有可能失敗,如果失敗就跳回第一步,如此循環(huán)往復(fù),花上個(gè)十多年找到一款新藥就已經(jīng)非常幸運(yùn)了。但是,當(dāng) AI 出現(xiàn)后,尤其是用神經(jīng)網(wǎng)絡(luò)構(gòu)建的機(jī)器學(xué)習(xí)模型出現(xiàn)后,這種現(xiàn)代范式開始面臨挑戰(zhàn)。
第一個(gè)讓科學(xué)界感到震驚的例子出現(xiàn)在 2020 年,當(dāng)時(shí)麻省理工學(xué)院的科研團(tuán)隊(duì)研發(fā)出了一種新的抗生素,叫 Halicin。稍微了解一些抗生素研發(fā)歷史的人都知道,要找到一種新型的有效的抗生素是極其困難的。但是,令科學(xué)界震驚的并不是這種抗生素的效果,它的效果當(dāng)然也很不錯(cuò),真正令科學(xué)家們震驚的是 Halicin 的研發(fā)過程,可以說,它已經(jīng)半跳出了現(xiàn)代范式。
photo_wakeup' data-position='2'>
Halicin(第一行)阻止了大腸桿菌中抗生素的耐藥性,而環(huán)丙沙星(第二行)則沒有。
Image: courtesy of the Collins Lab at MIT
我們來看一下這次研究人員是怎么做的。
【 第一步:AI 學(xué)習(xí) 】
他們先讓 AI 去學(xué)習(xí)大約 2000 個(gè)分子結(jié)構(gòu),這些分子結(jié)構(gòu)和作用都是已知的,它們有的無效,有的有效。
【 第二步:總結(jié)規(guī)律 】
通過神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí),AI 自己會(huì)去總結(jié)這些分子結(jié)構(gòu)是不是有效的規(guī)律。
但是請(qǐng)你注意,AI 總結(jié)出來的規(guī)律是無法用我們?nèi)祟惉F(xiàn)有的自然語言描述的。AI 并不會(huì)總結(jié)出一套我們?nèi)丝梢宰x懂的公式,只要套用這個(gè)公式就會(huì)知道,哪個(gè)分子結(jié)構(gòu)有效,哪個(gè)無效。AI 有它自己的一套連開發(fā)者也搞不懂到底是怎么運(yùn)作的判定規(guī)則。對(duì)于人類來說,AI 就是個(gè)黑盒 ,我們只知道,給它一個(gè)輸入值,它能返回一個(gè)輸出值,至于過程是怎樣的,對(duì)不起,人類語言無法描述。
【 第三步:打分 】
有了這個(gè) AI 之后,研究者把另外 61000 個(gè)已知的可能會(huì)有效的分子結(jié)構(gòu)一個(gè)個(gè)輸進(jìn)去,讓 AI 按照有效性、副作用等,對(duì)這些分子結(jié)構(gòu)進(jìn)行打分,得分最高的那個(gè)分子就是 Halicin。
【 第四步:實(shí)驗(yàn) 】
最后,研究者們?cè)儆?Halicin 做動(dòng)物實(shí)驗(yàn)和人體臨床試驗(yàn),發(fā)現(xiàn)它的效果果然非常好。一款新的抗生素就這樣被研發(fā)出來。
你發(fā)現(xiàn)沒,這是一種非常不同于現(xiàn)代范式的研究方法。假如按照現(xiàn)代范式,我們只能老老實(shí)實(shí)地做實(shí)驗(yàn)去測(cè)試這 61000 種分子結(jié)構(gòu),就好像屠呦呦當(dāng)年尋找有效的抗瘧藥物一樣,這需要花費(fèi)的時(shí)間和金錢成本都極其巨大。
聽完這個(gè)例子,我不知道你有什么樣的感想,但我受到的震撼是巨大的。它讓我突然意識(shí)到,AI 可以發(fā)現(xiàn)人不能理解的規(guī)律,但那又的的確確是一種規(guī)律 ,因?yàn)樗娴脑?61000 種分子中找到了唯一一個(gè)有效的分子,這肯定不能用運(yùn)氣來解釋。
> 人腦已無法理解黑盒化的 AI <
黃金時(shí)代的科學(xué)家們有一種理想,用數(shù)學(xué)模型去總結(jié)或者模擬這個(gè)世界上的所有規(guī)律。但是,現(xiàn)在 AI 告訴我們,至少它們掌握了一種不是用一個(gè)或一組數(shù)學(xué)公式,而是用一套通用的算法加海量的參數(shù)來描繪的自然規(guī)律 。換句話說,我們?nèi)祟惱斫庾匀灰?guī)律是一一對(duì)應(yīng)的,一個(gè)規(guī)則對(duì)應(yīng)一個(gè)數(shù)學(xué)模型,而 AI 則是以不變應(yīng)萬變。它只有一個(gè)數(shù)學(xué)模型(假如神經(jīng)網(wǎng)絡(luò)算法也看成是一個(gè)數(shù)學(xué)模型的話),這個(gè)數(shù)學(xué)模型似乎可以描述所有的自然規(guī)律。但人類卻無法理解它到底是怎么找到答案的。這套算法只有 AI 能用,人腦用不了。
現(xiàn)在用戶量已經(jīng)突破 1 億、人人都在談?wù)摰?ChatGPT,其實(shí)只是 GPT-3.5 這個(gè) AI 模型的一個(gè)應(yīng)用而已。它的參數(shù)已經(jīng)突破 1750 億個(gè),相當(dāng)于銀河系中恒星的數(shù)量。它是一個(gè)人類的大腦永遠(yuǎn)也無法真正理解的“小宇宙”。
剛才說的 Halicin 只是用 AI 做新藥研發(fā)的一個(gè)例子。AI 能做的科研還遠(yuǎn)遠(yuǎn)不止這些 。比如說,還可以用 AI 來預(yù)測(cè)新材料的性能,用 AI 來解讀基因的功能等等。
photo_wakeup' data-position='3'>
“生根發(fā)芽”的 AI 應(yīng)用
所有這些 AI 做科研的模式,都已經(jīng)不再是現(xiàn)代范式,至少不完全是現(xiàn)代范式了。它們的一個(gè)共同特征就是:AI 相對(duì)于人類科學(xué)家來說,是一個(gè)黑盒,我們無法理解黑盒內(nèi)的原理,或者說,黑盒內(nèi)的原理是一種只有 AI 能理解的形式。人類大腦的生理結(jié)構(gòu)決定了,這種形式我們無法真正理解。這并不是我的過度夸張,事實(shí)上,OpenAI 和 ChatGPT 的開發(fā)者也搞不清 ChatGPT 為什么能表現(xiàn)成現(xiàn)在這樣子。
是不是有些細(xì)思極恐?說實(shí)話,講到這里,我的背脊已經(jīng)有一絲絲涼意。但這還沒有完,更令我感到震驚的還在后面。
> OpenAI 的終極目標(biāo) <
2023 年 2 月 24 日,ChatGPT 的開發(fā)公司 OpenAI 在官網(wǎng)上發(fā)布了一則聲明,英文標(biāo)題是Planning for AGI and Beyond 。你可能不知道 AGI 是什么意思,它是 Artificial General Intelligence 的首字母縮寫,翻譯成中文就是“通用型人工智能 ”或者“強(qiáng)人工智能”。所以,那則聲明的標(biāo)題可以翻譯 為《強(qiáng)人工智能及超人工智能的路線圖》 。我們可以這么理解 AGI :只要是人類用智力能完成的任務(wù),AGI 就能完成。過去,我們的 AI 都是專用型的,翻譯的管翻譯,畫圖的管畫圖,人臉識(shí)別的管人臉識(shí)別。但AGI 將是通用型的,它什么都能干 ,一個(gè)算法加上幾千億個(gè)參數(shù),就能完成一切通過智力能完成的任務(wù),甚至是超越人類智力的任務(wù)。
這則聲明寫得很長(zhǎng)。說實(shí)話,當(dāng)我讀完這則聲明全文,我產(chǎn)生了一種強(qiáng)烈的不真實(shí)感。我要揉揉眼睛才敢相信這真的是 OpenAI 的官方聲明,而不是某個(gè)科幻小說中的選段。這則幾千字的聲明分成兩部分,第一部分叫“短期來看 ”,這部分內(nèi)容可以總結(jié)為一句話:
'隨著系統(tǒng)越來越接近 AGI,我們對(duì)模型的創(chuàng)建和部署也越來越謹(jǐn)慎。' 第二部分叫“長(zhǎng)遠(yuǎn)來看 ”,讓我擦汗和產(chǎn)生不真實(shí)感的正是這一部分,我給你選讀其中的幾段,你來體會(huì)一下:
我們認(rèn)為,人類的未來應(yīng)該由人類自己決定,與公眾分享有關(guān) AI 進(jìn)步的信息至關(guān)重要。所有建立 AGI 的嘗試都應(yīng)該受到嚴(yán)格審查,這方面的重大決策應(yīng)當(dāng)接受公眾咨詢。
第一個(gè) AGI 不過是人工智能連續(xù)發(fā)展過程中的一個(gè)點(diǎn)。我們認(rèn)為,AGI 依然會(huì)繼續(xù)進(jìn)化,速度與過去十年相同。如果真如所料,世界可能會(huì)變得截然不同,這其中也隱藏著巨大的風(fēng)險(xiǎn)。因?yàn)橐粋€(gè)立場(chǎng)錯(cuò)位的超級(jí)智能可能會(huì)對(duì)世界造成嚴(yán)重的傷害,想象一下一個(gè)果敢的超級(jí)智能領(lǐng)導(dǎo)的獨(dú)裁政權(quán)帶來的后果吧。
人工智能加速科學(xué)進(jìn)步的能力是一個(gè)值得深思的特例,它的影響力或許超過其他所有事物之和。AGI 有足夠的能力來加速自己的進(jìn)程,這可能導(dǎo)致世界以驚人的速度發(fā)生重大變化(即使轉(zhuǎn)變并沒有如預(yù)料的那么快,但我們預(yù)計(jì)它會(huì)在最后階段迅速發(fā)生)。我們認(rèn)為,開始得慢一些更容易守護(hù)住安全,并且通過協(xié)調(diào),努力讓 AGI 在關(guān)鍵時(shí)刻減速發(fā)展也很重要。即使我們的世界不需要就它的定位去解決技術(shù)問題,慢速發(fā)展也很重要,因?yàn)樾枰艚o社會(huì)足夠的時(shí)間去適應(yīng)。
成功過渡到一個(gè)擁有超級(jí)智能的世界,可能是人類歷史上最重要、最有前途、同時(shí)也是最可怕的項(xiàng)目。成功絕非一蹴而就,賭注,即天堂還是地獄,有望將我們所有人團(tuán)結(jié)起來。
一個(gè)人類繁榮到我們都無法想象的世界,或許不再是天方夜譚,因?yàn)槲覀優(yōu)槭澜缣峁┝艘粋€(gè)與之匹配的 AGI。
不知你看完后什么感覺?OpenAI 竟然要刻意減慢強(qiáng)人工智能的研發(fā)速度。這可能是歷史上第一次有科技公司認(rèn)為自己的研發(fā)進(jìn)度太快了,需要人為減慢,否則人類社會(huì)將猝不及防。
> 你必須學(xué)會(huì)與 AGI 溝通 <
我不知道你有沒有看過或者聽過我 2020 年寫的一部科幻小說《哪》。在那部小說中,我描寫了一個(gè)在云中覺醒的人工智能。寫小說的時(shí)候,我認(rèn)為這是一個(gè)遠(yuǎn)未來的科幻小說。哪里想的到,僅僅過去了3 年,這就已經(jīng)不再是科幻,而是正在發(fā)生中的事實(shí)了。就像崔健在一首歌中唱的:不是我不明白,這世界變化快。
有消息說,OpenAI 的下一代模型 GPT-4 已經(jīng)訓(xùn)練完成,現(xiàn)在正在訓(xùn)練的是 GPT-5,它或許就是人類歷史上的第一個(gè) AGI,即第一個(gè)真正意義上能通過圖靈測(cè)試的 AI。我的天哪,未來真的已來。
現(xiàn)在,我們已經(jīng)幾乎可以肯定,一個(gè)智力遠(yuǎn)勝于人類的超級(jí)智能體在技術(shù)上已經(jīng)不再是障礙,它唯一的障礙是法律和倫理。
photo_wakeup' data-position='4'>
超級(jí)智能體的誕生已不再遙遠(yuǎn)
在不遠(yuǎn)的未來,科學(xué)的現(xiàn)代范式將成為低效的代名詞。未來范式的科研將會(huì)變成什么樣子?我的想法是,一個(gè)材料科學(xué)家的研發(fā)過程很可能變成這樣:第一步,科學(xué)家向 AGI 詳細(xì)描述自己需要的材料的各種性質(zhì),比如密度、導(dǎo)電性、導(dǎo)熱性、是否透明等等。這種描述本身也需要專業(yè)知識(shí),否則很可能你描述的材料要么已經(jīng)存在,要么根本不可能制造出來。第二步,AGI 會(huì)告訴你什么樣的分子結(jié)構(gòu)或者混合物能達(dá)成目標(biāo)。第三步,科學(xué)家與 AGI 進(jìn)一步探討制造工藝,不斷地修正需求,降低制造成本。第四步,AGI 設(shè)計(jì)出最優(yōu)化的量產(chǎn)方案。第五步,科學(xué)家按照 AGI 給出的方案去找工廠實(shí)現(xiàn)。
在這個(gè)過程中,科學(xué)家更像是一個(gè)魔法師,科研的過程有點(diǎn)像是一種文字游戲。網(wǎng)上現(xiàn)在把 AI 畫師就稱為“魔法師”,把輸入的過程叫做“念咒”,說實(shí)話,還挺形象的。我現(xiàn)在不知道什么樣的人可以更好地掌握未來范式,我只知道,問出一個(gè)好問題或者說掌握與 AGI 溝通的能力,才是最重要的。這將是一場(chǎng)摧枯拉朽式的科學(xué)革命。
> AI 給你的最大驚喜是什么?<
當(dāng)這場(chǎng)革命來臨時(shí),世界的科技、政治、經(jīng)濟(jì)格局很可能面臨重新洗牌。 舉個(gè)例子,人類目前所能制造的最復(fù)雜的機(jī)器是用來生產(chǎn)芯片的光刻機(jī)。一臺(tái)荷蘭 ASML 公司生產(chǎn)的最先進(jìn)的極紫外光刻機(jī),有幾十萬個(gè)零部件,依賴全球 300 多個(gè)供應(yīng)商提供零部件。這個(gè)世界上沒有任何一個(gè)國家能完全靠自己制造出一臺(tái)光刻機(jī),因?yàn)樗鼘?shí)在是太復(fù)雜了。
photo_wakeup' data-position='5'>
ASML 最先進(jìn)的極紫外光刻機(jī)
Source: IMEC
但未來有一天,你對(duì)著 AGI 說一句話:請(qǐng)幫我設(shè)計(jì)一臺(tái)極紫外光刻機(jī),要用盡可能少的零部件,而且你需要寫出每一個(gè)零部件的詳細(xì)制造工藝,畫出所有用于生產(chǎn)零部件的機(jī)器的設(shè)計(jì)圖。 幾天之后,AGI 真的設(shè)計(jì)出了一臺(tái)全新原理的極紫外光刻機(jī)。所需要的零部件是人類設(shè)計(jì)的光刻機(jī)的十分之一,并且每一個(gè)零部件的詳細(xì)制造工藝都寫得清清楚楚,并且它還告訴你,這臺(tái)機(jī)器生產(chǎn)出的芯片的所有的性能指標(biāo),都將超過現(xiàn)有最好的芯片。
像這樣的超人工智能一旦出現(xiàn),我難以想象人類的社會(huì)形態(tài)將發(fā)生怎樣的巨變。這意味著,AI 真的可以完成從軟件到硬件的自我進(jìn)化 ,成為神一樣的存在。第一個(gè)擁有這種超級(jí)人工智能的組織,會(huì)迅速獲得別人無法匹敵,可以用降維打擊來形容的能力。而從 OpenAI 的這則最新聲明來看,超人工智能的技術(shù)障礙似乎已經(jīng)被掃清了。
聽到這里,我很想知道你對(duì)強(qiáng)人工智能和超人工智能的看法。我想請(qǐng)你注意一點(diǎn),你要思考的已經(jīng)不再是不知道能不能實(shí)現(xiàn)的科幻,而是正在向我們走來的未來。
最后再說點(diǎn)兒題外話,這是我第一次嘗試在 ChatGPT 的幫助下來完成的文稿 。在我動(dòng)筆前,我只是看到這樣一句話:2020 年,麻省理工的科研團(tuán)隊(duì)利用人工智能研發(fā)出了一種新的抗生素 Halicin。
然后,我開始連續(xù)向 ChatGPT 提問:
麻省理工宣布發(fā)現(xiàn)了一種新的抗生素,叫Halicin。這件事情你知道嗎? 還有沒有類似的例子,靠 AI 幫助完成科研? 我需要一個(gè)像 Halicin 一樣非常具體的例子。 你剛才說研究人員可以利用機(jī)器學(xué)習(xí)算法來分析大規(guī)模的基因數(shù)據(jù),以識(shí)別與特定疾病相關(guān)的基因突變和表達(dá)模式。這種方法在癌癥研究等領(lǐng)域有著重要的應(yīng)用。這個(gè)有具體的案例嗎? 現(xiàn)代新藥研發(fā)一般有哪些步驟? OpenAI 自己怎么看待 AI 的未來? AGI 何時(shí)會(huì)出現(xiàn)? 你知道 OpenAI 的 AGI 計(jì)劃嗎? 請(qǐng)幫我全文翻譯 Planning for AGI and beyond 這篇文章。 荷蘭 ASML 的極紫外光刻機(jī)有多少個(gè)零部件?依賴多少個(gè)供應(yīng)商? 上面這些問題并不是我全部的提問,只是我選取的最重要的幾個(gè)。我基本上用中英文雙語都問了一遍,很有意思的是,有些問題的中英文回答甚至是截然相反的。比如某一種抗癌新藥,中文版說這是通過 AI 研發(fā)出的,但英文版說不是。ChatGPT 目前一本正經(jīng)胡說八道的本事是非常強(qiáng)悍的,尤其是用中文回答時(shí)?,F(xiàn)在,我還不能相信它給出的任何一個(gè)答案,只能把它看成是一個(gè)參考和線索。真正要寫進(jìn)文章中,還得通過傳統(tǒng)方法去核實(shí)。但即便這樣,它依然大大提高了我的寫作效率。這篇 5000 字左右的文章,我差不多只用了一個(gè)晚上就完成,而在過去,同樣的選題,我大概需要 1 天 1 夜的時(shí)間才能完成。ChatGPT 帶給我的驚喜和震撼已經(jīng)足夠大。