AI大模型洞察系列之一：百度文心一言，繁花未開冬已至

智瑾財(cái)經(jīng) 2024-01-18 發(fā)布于遼寧

展開全文

2023年，對(duì)國(guó)產(chǎn)大模型而言，是一個(gè)激情澎湃，充滿壯志豪言，但唯獨(dú)缺乏現(xiàn)象級(jí)產(chǎn)品誕生的年頭；在海外ChatGPT為代表的大模型不斷進(jìn)化的推動(dòng)下，國(guó)產(chǎn)大模型匆匆沖入了2024年，也就是所謂的“大模型應(yīng)用落地元年”。

在這場(chǎng)代表更高生產(chǎn)力的技術(shù)革命浪潮中，國(guó)產(chǎn)大模型將扮演什么角色？從百度到三六零，從科大訊飛到后起之秀百川智能，從字節(jié)跳動(dòng)的“豆包”到阿里巴巴的“通義千問”，誰(shuí)會(huì)成為最先進(jìn)技術(shù)與應(yīng)用的破壁者或涅槃?wù)?，誰(shuí)又是在技術(shù)與資本的喧囂中“趕時(shí)髦”的泡沫？

百度大模型成色不足

第一個(gè)接受考驗(yàn)的當(dāng)然是國(guó)產(chǎn)大模型排頭兵“文心一言”。

沒人懷疑百度對(duì)AI的熱情。早在2016年，李彥宏就曾公開宣布ALL IN AI，并由此吸引了大佬陸奇2017年初加盟；但僅僅一年后（2018年5月），陸奇便掛冠而去；而幾乎就在同時(shí)，在地球的另一側(cè)，OpenAI研發(fā)小組靜悄悄地發(fā)布了GPT-1的初始模型。

那時(shí)候，李彥宏尚沒意識(shí)到，百度錯(cuò)過了成為AI先驅(qū)的歷史機(jī)遇。等到2022年末，ChatGPT爆火出圈后，李彥宏突然回過神，再次掉頭撿起ALL IN AI戰(zhàn)略。

問題是，在戰(zhàn)略問題上搖擺不定的百度，這一次是真的ALL IN大模型還是說說而已？

具體到產(chǎn)品層面，從2023年初緊急推出“文心一言”，到目前已進(jìn)化至4.0版本，盡管百度聲稱“文心4.0版本綜合水平與GPT相比毫不遜色”，但是否能夠媲美GPT仍然存疑，就連李彥宏自己也承認(rèn)，文心一言也許永遠(yuǎn)也追不上ChatGPT。

讓百度更為膽寒的是，元旦后GPT應(yīng)用商店正式上線，不僅將重塑AI服務(wù)與應(yīng)用格局，也會(huì)拉開Agent浪潮的帷幕，有極大概率會(huì)誕生李彥宏口中的“殺手級(jí)應(yīng)用”。

李彥宏曾多次表示，進(jìn)入AI時(shí)代的標(biāo)志是產(chǎn)生很多的AI原生應(yīng)用，而不是很多的大模型。他質(zhì)疑國(guó)內(nèi)大模型太多了，AI原生應(yīng)用卻非常少，國(guó)外則正好相反，“僅有幾十個(gè)基礎(chǔ)大模型，AI原生應(yīng)用已經(jīng)上千個(gè)”，這令人“焦慮且慌張”。

顯然，“文心一言”希望成為能夠誕生“殺手級(jí)應(yīng)用”的那個(gè)底座，但OpenAI憑借其用戶創(chuàng)建的超300萬個(gè)GPTs構(gòu)建了初步的Agent生態(tài)，率先完成了從模型提供商向平臺(tái)的轉(zhuǎn)變。而百度大模型，則面臨著繁花未開冬已至的境況。

盡管不斷有國(guó)內(nèi)機(jī)構(gòu)測(cè)評(píng)稱，文心一言已超越GPT-4（附加詞“中文語(yǔ)境”），但認(rèn)真講，文心一言遠(yuǎn)未完成從追隨者向引領(lǐng)者的角色轉(zhuǎn)變。

作為首批通過官方“大模型標(biāo)準(zhǔn)符合性測(cè)試”的文心一言4.0去年剛上線時(shí)，文生圖曾鬧出很多笑話，一度被質(zhì)疑“套殼”國(guó)外大模型。不過，在過去一年的快速迭代下，文心一言還是有了一些進(jìn)步。

例如，去年文心一言畫“胸有成竹的男人”、“起重機(jī)”時(shí)都曾鬧過笑話。用戶要求畫起重機(jī)時(shí)，文心一言直接畫了一幅仙鶴圖；用戶要求畫 “土耳其”，文心一言卻畫成了“火雞”。這些錯(cuò)誤讓很多人質(zhì)疑文心一言文生圖涉嫌套殼國(guó)外英文大模型，因?yàn)槠鹬貦C(jī)在英文里對(duì)應(yīng)的是CRANE，后者也有仙鶴的意思；土耳其和火雞的英文都是turkey。文心一言在作畫時(shí)顯然是先把中文指令轉(zhuǎn)化成英文，然后再生成圖像，極可能調(diào)用了國(guó)外的英文大模型。

新經(jīng)濟(jì)IPO今年元旦后對(duì)文心一言圖像生成能力再次進(jìn)行測(cè)試，發(fā)現(xiàn)這次無論是“胸有成竹的男人”還是“起重機(jī)”，文心一言已不再犯去年的錯(cuò)誤。

2023年和2024年初文心一言文生圖實(shí)測(cè)結(jié)果對(duì)比。

此外，新經(jīng)濟(jì)IPO基于理解、生成、邏輯、記憶四個(gè)維度對(duì)文心一言各方面能力進(jìn)行了測(cè)評(píng)。

記者分別輸入“畫一袋雞精、畫一個(gè)驢肉火燒、畫一張?zhí)撇Ⅻc(diǎn)秋香、夫妻肺片”等關(guān)鍵詞，發(fā)現(xiàn)給出的答案依然一言難盡，魚香肉絲、夫妻肺片等圖像勉強(qiáng)過關(guān)，但“一袋雞精”、“大頭娃娃菜”的畫像有的很詭異，有的看上去不倫不類。

2024年1月初，文心一言文生圖實(shí)測(cè)結(jié)果。

當(dāng)然，過去這一年，文心一言的跨模態(tài)理解與生成能力的確有了較大提升，并形成了初步的情感分析能力，可以識(shí)別文本中的情感傾向和情感表達(dá)，并能夠生成具有情感色彩的繪圖。

此外，文心一言還擁有了更豐富的知識(shí)庫(kù)，并能夠根據(jù)用戶的問題進(jìn)行常規(guī)性的回答和解釋。但在邏輯能力上，文心一言依然無法令人滿意。如詢問“秋冬穿搭街拍”，文心一言并沒有生成圖片，而是輸出了一大堆文字；但輸入“春夏穿搭街拍”，生成的就是風(fēng)格迥異的圖片。

這說明，在相同屬性的關(guān)鍵詞下，文心一言的邏輯導(dǎo)向并不一致，仍然有待于優(yōu)化提高。

2024年1月初，文心一言實(shí)測(cè)結(jié)果。

當(dāng)記者詢問“明天去深圳，應(yīng)該穿什么衣服”時(shí)，文心一言并沒有主動(dòng)搜集天氣信息（不具備互聯(lián)網(wǎng)查詢能力），而是給出了以下模糊信息。從答案看，文心一言在語(yǔ)言理解能力及精準(zhǔn)回復(fù)上還存在較大缺陷，和ChatGPT的語(yǔ)義理解及解答能力相比，文心一言落后的遠(yuǎn)不止李彥宏所說的“兩個(gè)月”。

2024年1月初，文心一言實(shí)測(cè)結(jié)果。

去年11月，百度開始面向C端收費(fèi)，在國(guó)內(nèi)算是第一家，很多應(yīng)用如百度文庫(kù)也都基于C端進(jìn)行了重構(gòu)。但從評(píng)測(cè)結(jié)果看，文心一言4.0的C端收費(fèi)用戶數(shù)量可能并不理想。如果文心一言被大量付費(fèi)用戶高頻使用，擁有自我學(xué)習(xí)能力的大模型會(huì)在海量用戶數(shù)據(jù)基礎(chǔ)上，快速?gòu)浹a(bǔ)之前的缺陷。Chatgpt之所以迭代越來越快，越來越精準(zhǔn)，最重要的原因就是全球數(shù)十億用戶在不斷向其提供免費(fèi)訓(xùn)練數(shù)據(jù)。

而文心一言在產(chǎn)品尚未成熟時(shí)就急匆匆收費(fèi)，反而阻礙了其獲取更為寶貴的用戶使用數(shù)據(jù)，可以說“因小失大”；李彥宏對(duì)文心一言快速商業(yè)化賺錢的急切心態(tài)，可能也會(huì)讓文心一言與國(guó)外競(jìng)爭(zhēng)對(duì)手的差距越來越大。李彥宏對(duì)Office365推出的30美元/月的Copilot套餐羨慕不已，但他忽略了一個(gè)至關(guān)重要的細(xì)節(jié)：2019年以來，微軟向OpenAI投資了110億美元。反觀百度和李彥宏在文心一言上又投了多少呢？OpenAI推出大模型花費(fèi)了數(shù)年時(shí)間，但百度文心一言推出不到一年就宣稱趕超ChatGPT，可信度有多少？

對(duì)于中文大模型，目前業(yè)內(nèi)有一些比較權(quán)威的評(píng)測(cè)標(biāo)準(zhǔn)，如SuperCLUE、C-Eval、MMLU等。有業(yè)內(nèi)人士曾從基礎(chǔ)知識(shí)、信息搜集能力、總結(jié)歸納能力、創(chuàng)作能力四個(gè)方面對(duì)包括ChatGPT 4、通義千問、文心一言、豆包、百川等十幾個(gè)大模型進(jìn)行評(píng)測(cè)，結(jié)果文心一言敗給ChatGPT 4，在全部測(cè)評(píng)模型中也僅排中上水平。

當(dāng)然這一比較不代表最終結(jié)果，實(shí)際上這些也都不重要。核心問題在于，在大模型發(fā)展方向上，百度在目前為止更像是一個(gè)追隨者，距離真正的創(chuàng)新還有較遠(yuǎn)的距離？

應(yīng)用生態(tài)落后于人

談到大模型時(shí)，李彥宏喜歡強(qiáng)調(diào)“文心大模型一家的API調(diào)用量，比其他200多家大模型的調(diào)用量加起來還要多”，它們即使“上了這個(gè)榜單、進(jìn)了那個(gè)排名”，也是在浪費(fèi)社會(huì)資源。

然而，百度大模型未來面臨的最大競(jìng)爭(zhēng)是海外競(jìng)爭(zhēng)對(duì)手在應(yīng)用層面的降維打擊，這是繼搜索引擎時(shí)代后的又一次“全球性”競(jìng)爭(zhēng)，它并將直接決定百度這些傳統(tǒng)互聯(lián)網(wǎng)巨頭的生死存亡。

在這場(chǎng)競(jìng)爭(zhēng)中，AI應(yīng)用生態(tài)將成為互聯(lián)網(wǎng)巨頭的爭(zhēng)奪焦點(diǎn)。

李彥宏曾多次提及，“因?yàn)榇竽Ｐ捅旧聿⒉恢苯赢a(chǎn)生價(jià)值，基于基礎(chǔ)大模型開發(fā)出來的AI原生應(yīng)用才是模型存在的意義”。AI原生應(yīng)用有三個(gè)特點(diǎn)：第一，能用自然語(yǔ)言交互；第二，能充分利用理解、生成、推理、記憶等；第三，每個(gè)應(yīng)用的交互都不超過兩級(jí)菜單。第三個(gè)特點(diǎn)，其實(shí)就是 Agent的典型技術(shù)特性——能夠跨應(yīng)用程序完成任務(wù)。作為一個(gè)AI“新主體”，Agent不僅可以獨(dú)立完成工作，也可以去尋找其他 Agent合作，組成新的工作流程，共同完成復(fù)雜工作。

釘釘總裁葉軍曾把這一技術(shù)特性解釋為“一鍵拉起所有AI應(yīng)用”。

百度目前的軟肋在于，文心一言尚停留在寫報(bào)告、做計(jì)劃、文生圖等文本處理層面，這只是AIGC的第一階段，在這個(gè)層面，全球大模型第一梯隊(duì)的各家實(shí)力差距都不大。

真正拉開差距的是第二階段，譬如圖生文、文生視頻；以及第三階段—大一統(tǒng)模態(tài)（人工智能體），即用一個(gè)模型鏈接一切，能夠自由地串聯(lián)表達(dá)。

需要指出的是，雖然目前GPTs還不是完全自動(dòng)的智能體,但它已經(jīng)向人們展示了一個(gè)AI智能體可以觸及的未來—有能力串聯(lián)起任何產(chǎn)品與服務(wù)，因此GPTs被認(rèn)為最有希望引領(lǐng)下一波AI浪潮。

國(guó)內(nèi)類似的產(chǎn)品包括釘釘最近發(fā)布的“AI超級(jí)助理”以及百度的“文心大模型智能體平臺(tái)”。后者于去年9月上線，目前能查到的公開資料顯示，截至2023年12月18日，超2000個(gè)智能體上線。而去年11月官宣的GPT商店，由用戶創(chuàng)建的“定制”ChatGPT已經(jīng)超過300萬個(gè)。兩者完全不在一個(gè)數(shù)量級(jí)上。

百度大模型生態(tài)與海外巨頭差距懸殊，背后原因很多，但過于“實(shí)用主義”、營(yíng)銷思維過重?zé)o疑阻礙了百度技術(shù)生態(tài)的成長(zhǎng)。

在百度多位AI技術(shù)主管的公開演講或受訪中，付費(fèi)率、成本、投放效率成為關(guān)鍵詞，幫助某某集團(tuán)實(shí)現(xiàn)轉(zhuǎn)化量提升多少，ROI提升多少的案例也不鮮見，聽上去受訪者不是技術(shù)主管，而是營(yíng)銷總監(jiān)。

這或許是百度廣告基因決定的，但沿著舊地圖，如何能找到新大陸？更為關(guān)鍵的是，去年12月Pika的出現(xiàn)，代表AIGC邁入了第二階段。在Pika的官方宣傳片中，僅憑一句話，就生成了動(dòng)畫版的馬斯克，不但神形兼?zhèn)?，背景和?dòng)作都合理連貫，面部一致性也驚人得完美。

隨著大模型從單一文本邁向多模態(tài)，視頻就像之前文字、圖像生成一樣，成為大模型身上長(zhǎng)出來的一項(xiàng)功能，一旦成為生產(chǎn)力，AI應(yīng)用落地的商業(yè)化困境便迎刃而解。為此，谷歌、阿里、字節(jié)、騰訊都競(jìng)相下場(chǎng)，多模態(tài)也將成為大模型的標(biāo)配。

更令人激動(dòng)的是，第二階段的到來，意味著第三階段的Agent也觸手可及，在這場(chǎng)“超級(jí)入口”之爭(zhēng)的關(guān)鍵節(jié)點(diǎn)上，百度似乎又沒跟上創(chuàng)新的步伐。

新入口之爭(zhēng)

Agent將是最佳AI應(yīng)用入口已然成為業(yè)界共識(shí)，但為何是“超級(jí)入口”呢？

在傳統(tǒng)互聯(lián)網(wǎng)時(shí)代，搜索引擎幾乎是唯一的壟斷性入口。到了移動(dòng)互聯(lián)網(wǎng)時(shí)代，蘋果借助“iOS+App Store”，重新定義了入口形式，人機(jī)交互不再通過搜索引擎進(jìn)行，取而代之的是以微信、抖音、Uber為代表的眾多獨(dú)立App載體，對(duì)應(yīng)著如新聞、社交、辦公、網(wǎng)購(gòu)等不同的內(nèi)容。

在大模型時(shí)代，取代它們的則是AI原生應(yīng)用—Agent，并且一個(gè)終端可能只需要一個(gè)就夠了，因?yàn)锳gent可以連接一切。

自然語(yǔ)言會(huì)成為Agent的使用界面，Agent調(diào)出功能后會(huì)攔截SaaS界面，包括很多其他APP也會(huì)被攔截掉，只保留交互層，所以Agent才會(huì)被稱為“超級(jí)入口”。

“新入口之爭(zhēng)”早已展開。Open AI大張旗鼓地公布GPTs，姍姍來遲的Google將Gemini Nano塞進(jìn)手機(jī)，蘋果開發(fā)新版Siri引入Ajax，阿里布局AI助理試圖連接B端所有生態(tài)；為了“新入口”，華為、小米、vivo、OPPO相續(xù)發(fā)布了“端側(cè)大模型”，甚至騰訊開發(fā)的Agent已經(jīng)可以模仿人類在手機(jī)上操作APP。

曾經(jīng)錯(cuò)過移動(dòng)互聯(lián)網(wǎng)時(shí)代的百度似乎還沉浸在昔日的信息流廣告邏輯中，文心一言APP迄今也沒有給出現(xiàn)象級(jí)的迭代更新。

多年來，百度一直在尋找除搜索以外的第二增長(zhǎng)曲線，從汽車到電商到直播到教育到外賣，但至今沒有一款產(chǎn)品能扛起大旗，簡(jiǎn)直成了“魔咒”。百度也曾試圖追趕自動(dòng)駕駛的風(fēng)口，但始終沒找到突破點(diǎn)。這一次，百度能乘上大模型的東風(fēng)嗎？從目前的發(fā)展看，前景并不樂觀。

百度打贏應(yīng)用之戰(zhàn)、建設(shè)AI生態(tài)的前提是，“文心一言”自身要足夠強(qiáng)大、足夠創(chuàng)新，而不是亦步亦趨，隨人起舞。只有這樣，才有機(jī)會(huì)在大模型淘汰賽中贏得一線生機(jī)。

來源：新經(jīng)濟(jì)IPO

來源：IPO君

聲明：本文僅作為知識(shí)分享，只為傳遞更多信息！本文不構(gòu)成任何投資建議，任何人據(jù)此做出投資決策，風(fēng)險(xiǎn)自擔(dān)。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

AI大模型洞察系列之一：百度文心一言，繁花未開冬已至

AI大模型洞察系列之一：百度文心一言，繁花未開冬已至