來(lái)源丨創(chuàng)業(yè)邦(ID:ichuangyebang) 作者丨巴里 編輯丨子鉞 這幾天,一個(gè)名為ChatGPT的聊天機(jī)器人徹底破圈了,火遍全網(wǎng)。 它寫(xiě)得了代碼,修復(fù)得了bug,還能幫你寫(xiě)工作周報(bào)、寫(xiě)小說(shuō)、進(jìn)行高考答題,甚至你還可以誘騙它規(guī)劃如何毀滅人類(lèi)。 盡管市面上已經(jīng)有了大量的聊天機(jī)器人,但馬斯克仍然對(duì)此感嘆:“很多人瘋狂地陷入了ChatGPT循環(huán)中,我們離強(qiáng)大到危險(xiǎn)的人工智能不遠(yuǎn)了。” 這個(gè)看似無(wú)所不能的ChatGPT是由美國(guó)OpenAI開(kāi)發(fā)的大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型,馬斯克曾是這家公司的創(chuàng)始人之一。 12月5日,OpenAI首席執(zhí)行官Sam Altman在社交媒體上發(fā)文表示,ChatGPT于上周三推出,截至目前已突破100萬(wàn)用戶(hù)。 甚至免費(fèi)公測(cè)版本的服務(wù)器很快就被熱情的測(cè)試用戶(hù)擠爆了。 聯(lián)想集團(tuán)副總裁、聯(lián)想創(chuàng)投集團(tuán)高級(jí)合伙人宋春雨告訴創(chuàng)業(yè)邦,AI預(yù)訓(xùn)練大模型的出現(xiàn),成為了近三年以來(lái)AI算法創(chuàng)新最受關(guān)注的投資機(jī)會(huì)。 睿獸分析顯示,2022年以來(lái),國(guó)內(nèi)大規(guī)模預(yù)訓(xùn)練模型賽道出現(xiàn)多筆大額融資,單筆融資金額高達(dá)10億元,其中不乏聯(lián)想創(chuàng)投、君聯(lián)資本、啟明創(chuàng)投、創(chuàng)新工場(chǎng)等知名投資機(jī)構(gòu)。 被網(wǎng)友玩壞了的ChatGPT到底是什么?其背后的大規(guī)模預(yù)訓(xùn)練模型是怎樣一條賽道,為何會(huì)受到眾多投資機(jī)構(gòu)的追捧?融資熱背后,又離真正大規(guī)模商用落地還有多遠(yuǎn)? AI如何攻破人類(lèi),發(fā)人深省的回答 AI教你怎么找男朋友 幫你寫(xiě)份周報(bào)應(yīng)付老板 試一下python寫(xiě)個(gè)判斷閏年,還有詳細(xì)的解釋?zhuān)贿^(guò)看上去像是在某個(gè)程序網(wǎng)站抄的 AI是如何一本正經(jīng)地胡說(shuō)八道的 “新晉網(wǎng)紅”ChatGPT到底是什么? 簡(jiǎn)單來(lái)說(shuō),預(yù)訓(xùn)練模型(Pre-trained Model)是前人為了解決問(wèn)題所創(chuàng)造出來(lái)的模型。后人在解決類(lèi)似問(wèn)題的時(shí)候,無(wú)需再?gòu)牧汩_(kāi)始訓(xùn)練一個(gè)新模型,而是可以利用此前在類(lèi)似問(wèn)題中訓(xùn)練過(guò)的模型來(lái)解決現(xiàn)有問(wèn)題。 與人們熟悉的語(yǔ)音助手不同,ChatGPT在與人們的對(duì)話(huà)中可以理解較為復(fù)雜的語(yǔ)句內(nèi)容,比如有多層語(yǔ)法嵌套的句子。同時(shí),ChatGPT擁有一定聯(lián)系上下文理解語(yǔ)境的能力,可以針對(duì)一個(gè)問(wèn)題不斷深入交流。令人驚訝的是,ChatGPT既能承認(rèn)錯(cuò)誤、質(zhì)疑不正確的前提,還能拒絕不恰當(dāng)?shù)恼?qǐng)求。 這就意味著,ChatGPT已經(jīng)可以實(shí)現(xiàn)圍繞某個(gè)話(huà)題,與人類(lèi)展開(kāi)一段談話(huà)討論的可能。 OpenAI官方稱(chēng),ChatGPT是在人類(lèi)的幫助下創(chuàng)建并訓(xùn)練的,人類(lèi)訓(xùn)練師對(duì)該AI早期版本回答查詢(xún)的方式進(jìn)行排名和評(píng)級(jí)。然后,這些信息被反饋到系統(tǒng)中,系統(tǒng)會(huì)根據(jù)訓(xùn)練師的偏好來(lái)調(diào)整答案。這是一種訓(xùn)練人工智能的標(biāo)準(zhǔn)方法,被稱(chēng)為強(qiáng)化學(xué)習(xí)。 據(jù)國(guó)盛證券研報(bào),ChatGPT有著多達(dá)1750億個(gè)模型參數(shù),OpenAI主要使用的公共爬蟲(chóng)數(shù)據(jù)集是有著超過(guò)萬(wàn)億單詞的人類(lèi)語(yǔ)言數(shù)據(jù)集。 該研報(bào)指出,ChatGPT在尋找答案、解決問(wèn)題的效率上已經(jīng)部分超越了如今的搜索引擎。ChatGPT或許在未來(lái)會(huì)改變我們獲取信息、輸出內(nèi)容的方式,AIGC(AI生成內(nèi)容)有望成為數(shù)字經(jīng)濟(jì)時(shí)代驅(qū)動(dòng)需求爆發(fā)的殺手級(jí)應(yīng)用。 不過(guò),ChatGPT也并非上知天文下知地理的“最強(qiáng)懂哥”。 據(jù)官網(wǎng)顯示,ChatGPT目前存在著一些局限性,包括有時(shí)會(huì)給出看上去正確但荒謬的答案、微調(diào)提問(wèn)的方式會(huì)得到完全不同的答案、有時(shí)會(huì)反復(fù)使用某些句子等。 網(wǎng)友也發(fā)現(xiàn),ChatGPT有兩個(gè)明顯的缺點(diǎn):輸入不能有錯(cuò),解釋不夠人性化。 所以,這個(gè)五天用戶(hù)突破百萬(wàn)的模型突然遭到編程問(wèn)答社區(qū)Stack Overflow的封禁。 目前,ChatGPT的研究團(tuán)隊(duì)也表示將根據(jù)用戶(hù)反饋持續(xù)改進(jìn)模型,未來(lái)還有很長(zhǎng)的道路要走。 盡管如此,OpenAI依然被視為全球AI領(lǐng)域的頂級(jí)機(jī)構(gòu)。 OpenAI在2020年推出的上一代GPT-3在當(dāng)時(shí)就被稱(chēng)之為人工智能領(lǐng)域的一個(gè)重要里程碑。 在此之后,OpenAI也開(kāi)始嘗試對(duì)GPT-3進(jìn)行商業(yè)化。目前,OpenAI以API的形式向開(kāi)發(fā)者客戶(hù)有償提供GPT-3模型,并根據(jù)token使用量來(lái)收費(fèi)。目前,基于GPT-3產(chǎn)生的App已經(jīng)達(dá)到300多個(gè)。 今年大火的AI繪畫(huà)也與OpenAI密不可分。 最早,OpenAI曾推出一款DALL-E低代碼工具,用戶(hù)只要提出想法、輸入?yún)?shù),電腦就會(huì)自動(dòng)生成藝術(shù)級(jí)別的畫(huà)作。在這一波AI繪畫(huà)熱潮中,還涌現(xiàn)了Midjourney、Stable AI等初創(chuàng)公司,有些公司已經(jīng)成為獨(dú)角獸。 正是預(yù)感到了大模型的巨大價(jià)值,在GPT-3推出的前一年,也就是2019年,微軟向OpenAI進(jìn)行了高達(dá)10億美元的投資。 這也為微軟大力推進(jìn)的云戰(zhàn)略吸引來(lái)了不少客戶(hù)。 例如,美國(guó)最大的汽車(chē)零售平臺(tái)CarMax利用OpenAI的開(kāi)發(fā)工具把10萬(wàn)條客戶(hù)評(píng)論直接進(jìn)行了分析,根據(jù)客戶(hù)的表達(dá)情緒分類(lèi)成正面、中性和負(fù)面,還提取了關(guān)鍵字摘要,對(duì)于公司的戰(zhàn)略決策起到了很大的幫助。 CarMax首席技術(shù)官甚至表示,如果沒(méi)有人工智能,這項(xiàng)工作靠人工編輯團(tuán)隊(duì)需要耗費(fèi)11年才能完成。 可以說(shuō),OpenAI帶給了人們巨大的想象空間。 融資火熱背后,離真正大規(guī)模商用還有多遠(yuǎn)? 實(shí)際上,不僅是最近破圈的ChatGPT,近兩年國(guó)內(nèi)也迎來(lái)了“大練模型”和“練大模型”的軍備競(jìng)賽熱潮。 其中,自然少不了行業(yè)巨頭和高??蒲袡C(jī)構(gòu)。 百度發(fā)布了產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型“文心”(參數(shù)規(guī)模達(dá)2600億),并基于“文心”模型形成了產(chǎn)業(yè)全景圖。同時(shí),華為聯(lián)合鵬程實(shí)驗(yàn)室等也發(fā)布了“盤(pán)古”大模型,阿里巴巴達(dá)摩院發(fā)布了中文語(yǔ)言模型 PLUG。 此外,由北京智源人工智能研究院牽頭,匯聚清華、北大、人大、中科院和相關(guān)企業(yè)共同研發(fā)的超大規(guī)模預(yù)訓(xùn)練模型“悟道”(悟道2.0參數(shù)規(guī)模達(dá)1.75萬(wàn)億)也于2021年亮相。 “AI預(yù)訓(xùn)練大模型的出現(xiàn),成為了近三年以來(lái)AI算法創(chuàng)新最受關(guān)注的投資機(jī)會(huì)?!甭?lián)想集團(tuán)副總裁、聯(lián)想創(chuàng)投集團(tuán)高級(jí)合伙人宋春雨表示,隨著超大規(guī)模AI預(yù)訓(xùn)練模型的技術(shù)突破,在自然語(yǔ)言理解方面已經(jīng)展現(xiàn)出超高程度的可用性,簡(jiǎn)而言之就是“機(jī)器真的懂人了”。 他認(rèn)為,大規(guī)模預(yù)訓(xùn)練模型是AI大數(shù)據(jù)要走的必然之路。從學(xué)術(shù)界和產(chǎn)業(yè)界的角度來(lái)看,AI和大數(shù)據(jù)技術(shù)的變化也會(huì)非常大。未來(lái)兩年、最多三年,AI將會(huì)有很大能力的提升。 回溯歷史,從最早Deep Learning到Alpha go,到Zero 自訓(xùn)練,到Transformer,再到GPT-3, AI在突飛猛進(jìn)的發(fā)展,并不斷落地在應(yīng)用場(chǎng)景中,比如 AI制藥、預(yù)測(cè)化學(xué)分子都極大地提高了所在行業(yè)的生產(chǎn)力。 啟明創(chuàng)投合伙人周志峰也表示,人工智能過(guò)去10年發(fā)展集中在感知智能,特別是視覺(jué)和語(yǔ)音技術(shù)的突破。下一個(gè)十年,人工智能將走向認(rèn)知智能,預(yù)訓(xùn)練大模型是其核心技術(shù)推動(dòng)力和關(guān)鍵基礎(chǔ)設(shè)施,讓AI吸收更多的知識(shí)去理解和思考,最終實(shí)現(xiàn)接近人類(lèi)水平的認(rèn)知。同時(shí),預(yù)訓(xùn)練大模型使得AI從依賴(lài)手工調(diào)參建模走向可大規(guī)模復(fù)制的工業(yè)化階段。 大規(guī)模預(yù)訓(xùn)練模型被投資人看好,也直接反映在了投融資的熱度上。 睿獸分析顯示,2022年以來(lái),尤其是下半年,大規(guī)模預(yù)訓(xùn)練模型領(lǐng)域出現(xiàn)了多筆大額融資。 2月10日,瀾舟科技完成近億元Pre-A輪融資,由聯(lián)想創(chuàng)投、斯道資本共同領(lǐng)投,創(chuàng)新工場(chǎng)跟投。9月26日,智譜AI宣布獲得數(shù)億元B輪融資,由君聯(lián)資本和啟明創(chuàng)投聯(lián)合領(lǐng)投。11月7日,小冰公司宣布完成10億元新融資。12月6日,聆心智能完成數(shù)千萬(wàn)元天使+輪融資,由連星資本領(lǐng)投,圖靈創(chuàng)投和智譜AI跟投。 這些企業(yè)均將商業(yè)落地作為融資后的發(fā)力重點(diǎn),但其落地的側(cè)重點(diǎn)各有不同。 瀾舟科技研發(fā)的“孟子”模型,用更小的模型規(guī)模(10億參數(shù)量)實(shí)現(xiàn)了比肩超大模型的性能,能夠具備靈活的領(lǐng)域和場(chǎng)景適應(yīng)能力,在機(jī)器翻譯、文本生成、行業(yè)搜索等場(chǎng)景更利于快速、低成本地落地。 2021年9月,瀾舟科技和傳神合作的第一個(gè)基于孟子預(yù)訓(xùn)練模型的“任度”翻譯引擎正式發(fā)布上線(xiàn),截至目前瀾舟科技已完成了各行業(yè)垂直領(lǐng)域20余個(gè)翻譯模型的開(kāi)發(fā),覆蓋新聞、金融、汽車(chē)等領(lǐng)域。 聆心智能目前則主要側(cè)重于游戲、營(yíng)銷(xiāo)、情感三個(gè)領(lǐng)域。 聆心智能在12月推出了圖靈世界的首個(gè)產(chǎn)品“AI烏托邦”,用戶(hù)可快速定制 AI 角色,只需要輸入簡(jiǎn)單的角色描述,就可以召喚出相應(yīng)人設(shè)的 AI ,與之進(jìn)行深度對(duì)話(huà),還可以命令A(yù)I完成相應(yīng)的任務(wù)。 此外,聆心智能還打造了Emohaa情緒療愈機(jī)器人,并與精神心理平臺(tái)好心情達(dá)成合作,落地了國(guó)內(nèi)首款人工智能心理陪伴數(shù)字人;還與高端豪華電動(dòng)車(chē)品牌Beyonca合作,打造了新一代智能駕艙助手。 新一輪融資公布當(dāng)天,小冰公司啟動(dòng)了對(duì)旗下人工智能數(shù)字員工(AI Being Employee)產(chǎn)品線(xiàn)的年度升級(jí),其中之一就是加強(qiáng)大模型對(duì)話(huà)引擎。 AI小冰 據(jù)悉,目前小冰框架中運(yùn)行了30萬(wàn)名數(shù)字員工,包括萬(wàn)科集團(tuán)年度優(yōu)秀員工“崔筱盼”、紅杉中國(guó)首位虛擬分析師“Hóng”、虛擬歌手“洛天依”等。由小冰框架生成的“小堂妹”等數(shù)名虛擬主播,全網(wǎng)播放量均已破億。 盡管各家的“大煉模型”已經(jīng)在商業(yè)落地上取得了一些成績(jī),但實(shí)際應(yīng)用情況如何、能解決哪些實(shí)際問(wèn)題仍然在遭受著用戶(hù)的質(zhì)疑。 平安科技前沿技術(shù)部門(mén)負(fù)責(zé)人王磊就曾公開(kāi)指出,當(dāng)前大規(guī)模預(yù)訓(xùn)練模型在垂直領(lǐng)域存在“致命”問(wèn)題。 他認(rèn)為,大規(guī)模預(yù)訓(xùn)練模型在垂直領(lǐng)域性能達(dá)不到要求的原因可能是:大規(guī)模預(yù)訓(xùn)練模型的訓(xùn)練語(yǔ)料庫(kù)規(guī)模很大,既包含了該領(lǐng)域的關(guān)鍵信息也包含了其他無(wú)關(guān)信息,使得模型缺少對(duì)關(guān)鍵信息的關(guān)注。同時(shí),當(dāng)前大規(guī)模預(yù)訓(xùn)練模型的機(jī)制改進(jìn)也很少涉及對(duì)關(guān)鍵信息的提取。 不同于網(wǎng)友在ChatGPT上的“自?shī)首詷?lè)”,大規(guī)模預(yù)訓(xùn)練模型一旦商用,假如出現(xiàn)錯(cuò)誤,或?qū)?huì)造成難以挽回的實(shí)際損失。這也是客戶(hù)最大的擔(dān)心之處。 特別是金融行業(yè)的客戶(hù)對(duì)上線(xiàn)模型的精度要求很高,不少場(chǎng)景直接使用預(yù)加載模型往往很難滿(mǎn)足需求。 有投資人也表示,“盡管可以通過(guò)置信度評(píng)估方法等方式來(lái)提升模型的靠譜程度,但距離商用真正意義上的'好用’仍有很長(zhǎng)一段路要走?!?/span> |
|