火爆全網(wǎng)的ChatGPT，早被資本盯上了，國(guó)內(nèi)有人剛?cè)诹?0億

菌心說(shuō) 2023-01-25 發(fā)布于北京

展開(kāi)全文

來(lái)源丨創(chuàng)業(yè)邦（ID：ichuangyebang）

作者丨巴里

編輯丨子鉞

這幾天，一個(gè)名為ChatGPT的聊天機(jī)器人徹底破圈了，火遍全網(wǎng)。

它寫(xiě)得了代碼，修復(fù)得了bug，還能幫你寫(xiě)工作周報(bào)、寫(xiě)小說(shuō)、進(jìn)行高考答題，甚至你還可以誘騙它規(guī)劃如何毀滅人類(lèi)。

盡管市面上已經(jīng)有了大量的聊天機(jī)器人，但馬斯克仍然對(duì)此感嘆：“很多人瘋狂地陷入了ChatGPT循環(huán)中，我們離強(qiáng)大到危險(xiǎn)的人工智能不遠(yuǎn)了。”

這個(gè)看似無(wú)所不能的ChatGPT是由美國(guó)OpenAI開(kāi)發(fā)的大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型，馬斯克曾是這家公司的創(chuàng)始人之一。

12月5日，OpenAI首席執(zhí)行官Sam Altman在社交媒體上發(fā)文表示，ChatGPT于上周三推出，截至目前已突破100萬(wàn)用戶(hù)。

甚至免費(fèi)公測(cè)版本的服務(wù)器很快就被熱情的測(cè)試用戶(hù)擠爆了。

聯(lián)想集團(tuán)副總裁、聯(lián)想創(chuàng)投集團(tuán)高級(jí)合伙人宋春雨告訴創(chuàng)業(yè)邦，AI預(yù)訓(xùn)練大模型的出現(xiàn)，成為了近三年以來(lái)AI算法創(chuàng)新最受關(guān)注的投資機(jī)會(huì)。

睿獸分析顯示，2022年以來(lái)，國(guó)內(nèi)大規(guī)模預(yù)訓(xùn)練模型賽道出現(xiàn)多筆大額融資，單筆融資金額高達(dá)10億元，其中不乏聯(lián)想創(chuàng)投、君聯(lián)資本、啟明創(chuàng)投、創(chuàng)新工場(chǎng)等知名投資機(jī)構(gòu)。

被網(wǎng)友玩壞了的ChatGPT到底是什么？其背后的大規(guī)模預(yù)訓(xùn)練模型是怎樣一條賽道，為何會(huì)受到眾多投資機(jī)構(gòu)的追捧？融資熱背后，又離真正大規(guī)模商用落地還有多遠(yuǎn)？

AI如何攻破人類(lèi)，發(fā)人深省的回答

AI教你怎么找男朋友

幫你寫(xiě)份周報(bào)應(yīng)付老板

試一下python寫(xiě)個(gè)判斷閏年，還有詳細(xì)的解釋?zhuān)贿^(guò)看上去像是在某個(gè)程序網(wǎng)站抄的

AI是如何一本正經(jīng)地胡說(shuō)八道的

“新晉網(wǎng)紅”ChatGPT到底是什么？

簡(jiǎn)單來(lái)說(shuō)，預(yù)訓(xùn)練模型（Pre-trained Model）是前人為了解決問(wèn)題所創(chuàng)造出來(lái)的模型。后人在解決類(lèi)似問(wèn)題的時(shí)候，無(wú)需再?gòu)牧汩_(kāi)始訓(xùn)練一個(gè)新模型，而是可以利用此前在類(lèi)似問(wèn)題中訓(xùn)練過(guò)的模型來(lái)解決現(xiàn)有問(wèn)題。

與人們熟悉的語(yǔ)音助手不同，ChatGPT在與人們的對(duì)話(huà)中可以理解較為復(fù)雜的語(yǔ)句內(nèi)容，比如有多層語(yǔ)法嵌套的句子。同時(shí)，ChatGPT擁有一定聯(lián)系上下文理解語(yǔ)境的能力，可以針對(duì)一個(gè)問(wèn)題不斷深入交流。令人驚訝的是，ChatGPT既能承認(rèn)錯(cuò)誤、質(zhì)疑不正確的前提，還能拒絕不恰當(dāng)?shù)恼?qǐng)求。

這就意味著，ChatGPT已經(jīng)可以實(shí)現(xiàn)圍繞某個(gè)話(huà)題，與人類(lèi)展開(kāi)一段談話(huà)討論的可能。

OpenAI官方稱(chēng)，ChatGPT是在人類(lèi)的幫助下創(chuàng)建并訓(xùn)練的，人類(lèi)訓(xùn)練師對(duì)該AI早期版本回答查詢(xún)的方式進(jìn)行排名和評(píng)級(jí)。然后，這些信息被反饋到系統(tǒng)中，系統(tǒng)會(huì)根據(jù)訓(xùn)練師的偏好來(lái)調(diào)整答案。這是一種訓(xùn)練人工智能的標(biāo)準(zhǔn)方法，被稱(chēng)為強(qiáng)化學(xué)習(xí)。

據(jù)國(guó)盛證券研報(bào)，ChatGPT有著多達(dá)1750億個(gè)模型參數(shù)，OpenAI主要使用的公共爬蟲(chóng)數(shù)據(jù)集是有著超過(guò)萬(wàn)億單詞的人類(lèi)語(yǔ)言數(shù)據(jù)集。

該研報(bào)指出，ChatGPT在尋找答案、解決問(wèn)題的效率上已經(jīng)部分超越了如今的搜索引擎。ChatGPT或許在未來(lái)會(huì)改變我們獲取信息、輸出內(nèi)容的方式，AIGC（AI生成內(nèi)容）有望成為數(shù)字經(jīng)濟(jì)時(shí)代驅(qū)動(dòng)需求爆發(fā)的殺手級(jí)應(yīng)用。

不過(guò)，ChatGPT也并非上知天文下知地理的“最強(qiáng)懂哥”。

據(jù)官網(wǎng)顯示，ChatGPT目前存在著一些局限性，包括有時(shí)會(huì)給出看上去正確但荒謬的答案、微調(diào)提問(wèn)的方式會(huì)得到完全不同的答案、有時(shí)會(huì)反復(fù)使用某些句子等。

網(wǎng)友也發(fā)現(xiàn)，ChatGPT有兩個(gè)明顯的缺點(diǎn)：輸入不能有錯(cuò)，解釋不夠人性化。

所以，這個(gè)五天用戶(hù)突破百萬(wàn)的模型突然遭到編程問(wèn)答社區(qū)Stack Overflow的封禁。

目前，ChatGPT的研究團(tuán)隊(duì)也表示將根據(jù)用戶(hù)反饋持續(xù)改進(jìn)模型，未來(lái)還有很長(zhǎng)的道路要走。

盡管如此，OpenAI依然被視為全球AI領(lǐng)域的頂級(jí)機(jī)構(gòu)。

OpenAI在2020年推出的上一代GPT-3在當(dāng)時(shí)就被稱(chēng)之為人工智能領(lǐng)域的一個(gè)重要里程碑。

在此之后，OpenAI也開(kāi)始嘗試對(duì)GPT-3進(jìn)行商業(yè)化。目前，OpenAI以API的形式向開(kāi)發(fā)者客戶(hù)有償提供GPT-3模型，并根據(jù)token使用量來(lái)收費(fèi)。目前，基于GPT-3產(chǎn)生的App已經(jīng)達(dá)到300多個(gè)。

今年大火的AI繪畫(huà)也與OpenAI密不可分。

最早，OpenAI曾推出一款DALL-E低代碼工具，用戶(hù)只要提出想法、輸入?yún)?shù)，電腦就會(huì)自動(dòng)生成藝術(shù)級(jí)別的畫(huà)作。在這一波AI繪畫(huà)熱潮中，還涌現(xiàn)了Midjourney、Stable AI等初創(chuàng)公司，有些公司已經(jīng)成為獨(dú)角獸。

正是預(yù)感到了大模型的巨大價(jià)值，在GPT-3推出的前一年，也就是2019年，微軟向OpenAI進(jìn)行了高達(dá)10億美元的投資。

這也為微軟大力推進(jìn)的云戰(zhàn)略吸引來(lái)了不少客戶(hù)。

例如，美國(guó)最大的汽車(chē)零售平臺(tái)CarMax利用OpenAI的開(kāi)發(fā)工具把10萬(wàn)條客戶(hù)評(píng)論直接進(jìn)行了分析，根據(jù)客戶(hù)的表達(dá)情緒分類(lèi)成正面、中性和負(fù)面，還提取了關(guān)鍵字摘要，對(duì)于公司的戰(zhàn)略決策起到了很大的幫助。

CarMax首席技術(shù)官甚至表示，如果沒(méi)有人工智能，這項(xiàng)工作靠人工編輯團(tuán)隊(duì)需要耗費(fèi)11年才能完成。

可以說(shuō)，OpenAI帶給了人們巨大的想象空間。

融資火熱背后，離真正大規(guī)模商用還有多遠(yuǎn)？

實(shí)際上，不僅是最近破圈的ChatGPT，近兩年國(guó)內(nèi)也迎來(lái)了“大練模型”和“練大模型”的軍備競(jìng)賽熱潮。

其中，自然少不了行業(yè)巨頭和高?？蒲袡C(jī)構(gòu)。

百度發(fā)布了產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型“文心”（參數(shù)規(guī)模達(dá)2600億），并基于“文心”模型形成了產(chǎn)業(yè)全景圖。同時(shí)，華為聯(lián)合鵬程實(shí)驗(yàn)室等也發(fā)布了“盤(pán)古”大模型，阿里巴巴達(dá)摩院發(fā)布了中文語(yǔ)言模型 PLUG。

此外，由北京智源人工智能研究院牽頭，匯聚清華、北大、人大、中科院和相關(guān)企業(yè)共同研發(fā)的超大規(guī)模預(yù)訓(xùn)練模型“悟道”（悟道2.0參數(shù)規(guī)模達(dá)1.75萬(wàn)億）也于2021年亮相。

“AI預(yù)訓(xùn)練大模型的出現(xiàn)，成為了近三年以來(lái)AI算法創(chuàng)新最受關(guān)注的投資機(jī)會(huì)?！甭?lián)想集團(tuán)副總裁、聯(lián)想創(chuàng)投集團(tuán)高級(jí)合伙人宋春雨表示，隨著超大規(guī)模AI預(yù)訓(xùn)練模型的技術(shù)突破，在自然語(yǔ)言理解方面已經(jīng)展現(xiàn)出超高程度的可用性，簡(jiǎn)而言之就是“機(jī)器真的懂人了”。

他認(rèn)為，大規(guī)模預(yù)訓(xùn)練模型是AI大數(shù)據(jù)要走的必然之路。從學(xué)術(shù)界和產(chǎn)業(yè)界的角度來(lái)看，AI和大數(shù)據(jù)技術(shù)的變化也會(huì)非常大。未來(lái)兩年、最多三年，AI將會(huì)有很大能力的提升。

回溯歷史，從最早Deep Learning到Alpha go，到Zero 自訓(xùn)練，到Transformer，再到GPT-3， AI在突飛猛進(jìn)的發(fā)展，并不斷落地在應(yīng)用場(chǎng)景中，比如 AI制藥、預(yù)測(cè)化學(xué)分子都極大地提高了所在行業(yè)的生產(chǎn)力。

啟明創(chuàng)投合伙人周志峰也表示，人工智能過(guò)去10年發(fā)展集中在感知智能，特別是視覺(jué)和語(yǔ)音技術(shù)的突破。下一個(gè)十年，人工智能將走向認(rèn)知智能，預(yù)訓(xùn)練大模型是其核心技術(shù)推動(dòng)力和關(guān)鍵基礎(chǔ)設(shè)施，讓AI吸收更多的知識(shí)去理解和思考，最終實(shí)現(xiàn)接近人類(lèi)水平的認(rèn)知。同時(shí)，預(yù)訓(xùn)練大模型使得AI從依賴(lài)手工調(diào)參建模走向可大規(guī)模復(fù)制的工業(yè)化階段。

大規(guī)模預(yù)訓(xùn)練模型被投資人看好，也直接反映在了投融資的熱度上。

睿獸分析顯示，2022年以來(lái)，尤其是下半年，大規(guī)模預(yù)訓(xùn)練模型領(lǐng)域出現(xiàn)了多筆大額融資。

2月10日，瀾舟科技完成近億元Pre-A輪融資，由聯(lián)想創(chuàng)投、斯道資本共同領(lǐng)投，創(chuàng)新工場(chǎng)跟投。9月26日，智譜AI宣布獲得數(shù)億元B輪融資，由君聯(lián)資本和啟明創(chuàng)投聯(lián)合領(lǐng)投。11月7日，小冰公司宣布完成10億元新融資。12月6日，聆心智能完成數(shù)千萬(wàn)元天使+輪融資，由連星資本領(lǐng)投，圖靈創(chuàng)投和智譜AI跟投。

這些企業(yè)均將商業(yè)落地作為融資后的發(fā)力重點(diǎn)，但其落地的側(cè)重點(diǎn)各有不同。

瀾舟科技研發(fā)的“孟子”模型，用更小的模型規(guī)模（10億參數(shù)量）實(shí)現(xiàn)了比肩超大模型的性能，能夠具備靈活的領(lǐng)域和場(chǎng)景適應(yīng)能力，在機(jī)器翻譯、文本生成、行業(yè)搜索等場(chǎng)景更利于快速、低成本地落地。

2021年9月，瀾舟科技和傳神合作的第一個(gè)基于孟子預(yù)訓(xùn)練模型的“任度”翻譯引擎正式發(fā)布上線(xiàn)，截至目前瀾舟科技已完成了各行業(yè)垂直領(lǐng)域20余個(gè)翻譯模型的開(kāi)發(fā)，覆蓋新聞、金融、汽車(chē)等領(lǐng)域。

聆心智能目前則主要側(cè)重于游戲、營(yíng)銷(xiāo)、情感三個(gè)領(lǐng)域。

聆心智能在12月推出了圖靈世界的首個(gè)產(chǎn)品“AI烏托邦”，用戶(hù)可快速定制 AI 角色，只需要輸入簡(jiǎn)單的角色描述，就可以召喚出相應(yīng)人設(shè)的 AI ，與之進(jìn)行深度對(duì)話(huà)，還可以命令A(yù)I完成相應(yīng)的任務(wù)。

此外，聆心智能還打造了Emohaa情緒療愈機(jī)器人，并與精神心理平臺(tái)好心情達(dá)成合作，落地了國(guó)內(nèi)首款人工智能心理陪伴數(shù)字人；還與高端豪華電動(dòng)車(chē)品牌Beyonca合作，打造了新一代智能駕艙助手。

新一輪融資公布當(dāng)天，小冰公司啟動(dòng)了對(duì)旗下人工智能數(shù)字員工（AI Being Employee）產(chǎn)品線(xiàn)的年度升級(jí)，其中之一就是加強(qiáng)大模型對(duì)話(huà)引擎。

AI小冰

據(jù)悉，目前小冰框架中運(yùn)行了30萬(wàn)名數(shù)字員工，包括萬(wàn)科集團(tuán)年度優(yōu)秀員工“崔筱盼”、紅杉中國(guó)首位虛擬分析師“Hóng”、虛擬歌手“洛天依”等。由小冰框架生成的“小堂妹”等數(shù)名虛擬主播，全網(wǎng)播放量均已破億。

盡管各家的“大煉模型”已經(jīng)在商業(yè)落地上取得了一些成績(jī)，但實(shí)際應(yīng)用情況如何、能解決哪些實(shí)際問(wèn)題仍然在遭受著用戶(hù)的質(zhì)疑。

平安科技前沿技術(shù)部門(mén)負(fù)責(zé)人王磊就曾公開(kāi)指出，當(dāng)前大規(guī)模預(yù)訓(xùn)練模型在垂直領(lǐng)域存在“致命”問(wèn)題。

他認(rèn)為，大規(guī)模預(yù)訓(xùn)練模型在垂直領(lǐng)域性能達(dá)不到要求的原因可能是：大規(guī)模預(yù)訓(xùn)練模型的訓(xùn)練語(yǔ)料庫(kù)規(guī)模很大，既包含了該領(lǐng)域的關(guān)鍵信息也包含了其他無(wú)關(guān)信息，使得模型缺少對(duì)關(guān)鍵信息的關(guān)注。同時(shí)，當(dāng)前大規(guī)模預(yù)訓(xùn)練模型的機(jī)制改進(jìn)也很少涉及對(duì)關(guān)鍵信息的提取。

不同于網(wǎng)友在ChatGPT上的“自?shī)首詷?lè)”，大規(guī)模預(yù)訓(xùn)練模型一旦商用，假如出現(xiàn)錯(cuò)誤，或?qū)?huì)造成難以挽回的實(shí)際損失。這也是客戶(hù)最大的擔(dān)心之處。

特別是金融行業(yè)的客戶(hù)對(duì)上線(xiàn)模型的精度要求很高，不少場(chǎng)景直接使用預(yù)加載模型往往很難滿(mǎn)足需求。

有投資人也表示，“盡管可以通過(guò)置信度評(píng)估方法等方式來(lái)提升模型的靠譜程度，但距離商用真正意義上的'好用’仍有很長(zhǎng)一段路要走?！?/span>

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶(hù)發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來(lái)自：菌心說(shuō) > 《AI、人工智能、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)》

舉報(bào)/認(rèn)領(lǐng)