小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

AI大模型洞察系列之一:百度文心一言,繁花未開冬已至

 智瑾財(cái)經(jīng) 2024-01-18 發(fā)布于遼寧

2023年,對(duì)國(guó)產(chǎn)大模型而言,是一個(gè)激情澎湃,充滿壯志豪言,但唯獨(dú)缺乏現(xiàn)象級(jí)產(chǎn)品誕生的年頭;在海外ChatGPT為代表的大模型不斷進(jìn)化的推動(dòng)下,國(guó)產(chǎn)大模型匆匆沖入了2024年,也就是所謂的“大模型應(yīng)用落地元年”。

在這場(chǎng)代表更高生產(chǎn)力的技術(shù)革命浪潮中,國(guó)產(chǎn)大模型將扮演什么角色?從百度到三六零,從科大訊飛到后起之秀百川智能,從字節(jié)跳動(dòng)的“豆包”到阿里巴巴的“通義千問”,誰(shuí)會(huì)成為最先進(jìn)技術(shù)與應(yīng)用的破壁者或涅槃?wù)?,誰(shuí)又是在技術(shù)與資本的喧囂中“趕時(shí)髦”的泡沫?

百度大模型成色不足

第一個(gè)接受考驗(yàn)的當(dāng)然是國(guó)產(chǎn)大模型排頭兵“文心一言”。

沒人懷疑百度對(duì)AI的熱情。早在2016年,李彥宏就曾公開宣布ALL IN AI,并由此吸引了大佬陸奇2017年初加盟;但僅僅一年后(2018年5月),陸奇便掛冠而去;而幾乎就在同時(shí),在地球的另一側(cè),OpenAI研發(fā)小組靜悄悄地發(fā)布了GPT-1的初始模型。

那時(shí)候,李彥宏尚沒意識(shí)到,百度錯(cuò)過了成為AI先驅(qū)的歷史機(jī)遇。等到2022年末,ChatGPT爆火出圈后,李彥宏突然回過神,再次掉頭撿起ALL IN AI戰(zhàn)略。

問題是,在戰(zhàn)略問題上搖擺不定的百度,這一次是真的ALL IN大模型還是說說而已?

具體到產(chǎn)品層面,從2023年初緊急推出“文心一言”,到目前已進(jìn)化至4.0版本,盡管百度聲稱“文心4.0版本綜合水平與GPT相比毫不遜色”,但是否能夠媲美GPT仍然存疑,就連李彥宏自己也承認(rèn),文心一言也許永遠(yuǎn)也追不上ChatGPT。

讓百度更為膽寒的是,元旦后GPT應(yīng)用商店正式上線,不僅將重塑AI服務(wù)與應(yīng)用格局,也會(huì)拉開Agent浪潮的帷幕,有極大概率會(huì)誕生李彥宏口中的“殺手級(jí)應(yīng)用”。

李彥宏曾多次表示,進(jìn)入AI時(shí)代的標(biāo)志是產(chǎn)生很多的AI原生應(yīng)用,而不是很多的大模型。他質(zhì)疑國(guó)內(nèi)大模型太多了,AI原生應(yīng)用卻非常少,國(guó)外則正好相反,“僅有幾十個(gè)基礎(chǔ)大模型,AI原生應(yīng)用已經(jīng)上千個(gè)”,這令人“焦慮且慌張”。

顯然,“文心一言”希望成為能夠誕生“殺手級(jí)應(yīng)用”的那個(gè)底座,但OpenAI憑借其用戶創(chuàng)建的超300萬個(gè)GPTs構(gòu)建了初步的Agent生態(tài),率先完成了從模型提供商向平臺(tái)的轉(zhuǎn)變。而百度大模型,則面臨著繁花未開冬已至的境況。

盡管不斷有國(guó)內(nèi)機(jī)構(gòu)測(cè)評(píng)稱,文心一言已超越GPT-4(附加詞“中文語(yǔ)境”),但認(rèn)真講,文心一言遠(yuǎn)未完成從追隨者向引領(lǐng)者的角色轉(zhuǎn)變。

作為首批通過官方“大模型標(biāo)準(zhǔn)符合性測(cè)試”的文心一言4.0去年剛上線時(shí),文生圖曾鬧出很多笑話,一度被質(zhì)疑“套殼”國(guó)外大模型。不過,在過去一年的快速迭代下,文心一言還是有了一些進(jìn)步。

例如,去年文心一言畫“胸有成竹的男人”、“起重機(jī)”時(shí)都曾鬧過笑話。用戶要求畫起重機(jī)時(shí),文心一言直接畫了一幅仙鶴圖;用戶要求畫 “土耳其”,文心一言卻畫成了“火雞”。這些錯(cuò)誤讓很多人質(zhì)疑文心一言文生圖涉嫌套殼國(guó)外英文大模型,因?yàn)槠鹬貦C(jī)在英文里對(duì)應(yīng)的是CRANE,后者也有仙鶴的意思;土耳其和火雞的英文都是turkey。文心一言在作畫時(shí)顯然是先把中文指令轉(zhuǎn)化成英文,然后再生成圖像,極可能調(diào)用了國(guó)外的英文大模型。

新經(jīng)濟(jì)IPO今年元旦后對(duì)文心一言圖像生成能力再次進(jìn)行測(cè)試,發(fā)現(xiàn)這次無論是“胸有成竹的男人”還是“起重機(jī)”,文心一言已不再犯去年的錯(cuò)誤。

2023年和2024年初文心一言文生圖實(shí)測(cè)結(jié)果對(duì)比。

此外,新經(jīng)濟(jì)IPO基于理解、生成、邏輯、記憶四個(gè)維度對(duì)文心一言各方面能力進(jìn)行了測(cè)評(píng)。

記者分別輸入“畫一袋雞精、畫一個(gè)驢肉火燒、畫一張?zhí)撇Ⅻc(diǎn)秋香、夫妻肺片”等關(guān)鍵詞,發(fā)現(xiàn)給出的答案依然一言難盡,魚香肉絲、夫妻肺片等圖像勉強(qiáng)過關(guān),但“一袋雞精”、“大頭娃娃菜”的畫像有的很詭異,有的看上去不倫不類。

2024年1月初,文心一言文生圖實(shí)測(cè)結(jié)果。

當(dāng)然,過去這一年,文心一言的跨模態(tài)理解與生成能力的確有了較大提升,并形成了初步的情感分析能力,可以識(shí)別文本中的情感傾向和情感表達(dá),并能夠生成具有情感色彩的繪圖。

此外,文心一言還擁有了更豐富的知識(shí)庫(kù),并能夠根據(jù)用戶的問題進(jìn)行常規(guī)性的回答和解釋。但在邏輯能力上,文心一言依然無法令人滿意。如詢問“秋冬穿搭街拍”,文心一言并沒有生成圖片,而是輸出了一大堆文字;但輸入“春夏穿搭街拍”,生成的就是風(fēng)格迥異的圖片。

這說明,在相同屬性的關(guān)鍵詞下,文心一言的邏輯導(dǎo)向并不一致,仍然有待于優(yōu)化提高。

2024年1月初,文心一言實(shí)測(cè)結(jié)果。

當(dāng)記者詢問“明天去深圳,應(yīng)該穿什么衣服”時(shí),文心一言并沒有主動(dòng)搜集天氣信息(不具備互聯(lián)網(wǎng)查詢能力),而是給出了以下模糊信息。從答案看,文心一言在語(yǔ)言理解能力及精準(zhǔn)回復(fù)上還存在較大缺陷,和ChatGPT的語(yǔ)義理解及解答能力相比,文心一言落后的遠(yuǎn)不止李彥宏所說的“兩個(gè)月”。

2024年1月初,文心一言實(shí)測(cè)結(jié)果。

去年11月,百度開始面向C端收費(fèi),在國(guó)內(nèi)算是第一家,很多應(yīng)用如百度文庫(kù)也都基于C端進(jìn)行了重構(gòu)。但從評(píng)測(cè)結(jié)果看,文心一言4.0的C端收費(fèi)用戶數(shù)量可能并不理想。如果文心一言被大量付費(fèi)用戶高頻使用,擁有自我學(xué)習(xí)能力的大模型會(huì)在海量用戶數(shù)據(jù)基礎(chǔ)上,快速?gòu)浹a(bǔ)之前的缺陷。Chatgpt之所以迭代越來越快,越來越精準(zhǔn),最重要的原因就是全球數(shù)十億用戶在不斷向其提供免費(fèi)訓(xùn)練數(shù)據(jù)。

而文心一言在產(chǎn)品尚未成熟時(shí)就急匆匆收費(fèi),反而阻礙了其獲取更為寶貴的用戶使用數(shù)據(jù),可以說“因小失大”;李彥宏對(duì)文心一言快速商業(yè)化賺錢的急切心態(tài),可能也會(huì)讓文心一言與國(guó)外競(jìng)爭(zhēng)對(duì)手的差距越來越大。李彥宏對(duì)Office365推出的30美元/月的Copilot套餐羨慕不已,但他忽略了一個(gè)至關(guān)重要的細(xì)節(jié):2019年以來,微軟向OpenAI投資了110億美元。反觀百度和李彥宏在文心一言上又投了多少呢?OpenAI推出大模型花費(fèi)了數(shù)年時(shí)間,但百度文心一言推出不到一年就宣稱趕超ChatGPT,可信度有多少?

對(duì)于中文大模型,目前業(yè)內(nèi)有一些比較權(quán)威的評(píng)測(cè)標(biāo)準(zhǔn),如SuperCLUE、C-Eval、MMLU等。有業(yè)內(nèi)人士曾從基礎(chǔ)知識(shí)、信息搜集能力、總結(jié)歸納能力、創(chuàng)作能力四個(gè)方面對(duì)包括ChatGPT 4、通義千問、文心一言、豆包、百川等十幾個(gè)大模型進(jìn)行評(píng)測(cè),結(jié)果文心一言敗給ChatGPT 4,在全部測(cè)評(píng)模型中也僅排中上水平。

當(dāng)然這一比較不代表最終結(jié)果,實(shí)際上這些也都不重要。核心問題在于,在大模型發(fā)展方向上,百度在目前為止更像是一個(gè)追隨者,距離真正的創(chuàng)新還有較遠(yuǎn)的距離?

應(yīng)用生態(tài)落后于人

談到大模型時(shí),李彥宏喜歡強(qiáng)調(diào)“文心大模型一家的API調(diào)用量,比其他200多家大模型的調(diào)用量加起來還要多”,它們即使“上了這個(gè)榜單、進(jìn)了那個(gè)排名”,也是在浪費(fèi)社會(huì)資源。

然而,百度大模型未來面臨的最大競(jìng)爭(zhēng)是海外競(jìng)爭(zhēng)對(duì)手在應(yīng)用層面的降維打擊,這是繼搜索引擎時(shí)代后的又一次“全球性”競(jìng)爭(zhēng),它并將直接決定百度這些傳統(tǒng)互聯(lián)網(wǎng)巨頭的生死存亡。

在這場(chǎng)競(jìng)爭(zhēng)中,AI應(yīng)用生態(tài)將成為互聯(lián)網(wǎng)巨頭的爭(zhēng)奪焦點(diǎn)。

李彥宏曾多次提及,“因?yàn)榇竽P捅旧聿⒉恢苯赢a(chǎn)生價(jià)值,基于基礎(chǔ)大模型開發(fā)出來的AI原生應(yīng)用才是模型存在的意義”。AI原生應(yīng)用有三個(gè)特點(diǎn):第一,能用自然語(yǔ)言交互;第二,能充分利用理解、生成、推理、記憶等;第三,每個(gè)應(yīng)用的交互都不超過兩級(jí)菜單。第三個(gè)特點(diǎn),其實(shí)就是 Agent的典型技術(shù)特性——能夠跨應(yīng)用程序完成任務(wù)。作為一個(gè)AI“新主體”,Agent不僅可以獨(dú)立完成工作,也可以去尋找其他 Agent合作,組成新的工作流程,共同完成復(fù)雜工作。

釘釘總裁葉軍曾把這一技術(shù)特性解釋為“一鍵拉起所有AI應(yīng)用”。

百度目前的軟肋在于,文心一言尚停留在寫報(bào)告、做計(jì)劃、文生圖等文本處理層面,這只是AIGC的第一階段,在這個(gè)層面,全球大模型第一梯隊(duì)的各家實(shí)力差距都不大。

真正拉開差距的是第二階段,譬如圖生文、文生視頻;以及第三階段—大一統(tǒng)模態(tài)(人工智能體),即用一個(gè)模型鏈接一切,能夠自由地串聯(lián)表達(dá)。

需要指出的是,雖然目前GPTs還不是完全自動(dòng)的智能體,但它已經(jīng)向人們展示了一個(gè)AI智能體可以觸及的未來—有能力串聯(lián)起任何產(chǎn)品與服務(wù),因此GPTs被認(rèn)為最有希望引領(lǐng)下一波AI浪潮。

國(guó)內(nèi)類似的產(chǎn)品包括釘釘最近發(fā)布的“AI超級(jí)助理”以及百度的“文心大模型智能體平臺(tái)”。后者于去年9月上線,目前能查到的公開資料顯示,截至2023年12月18日,超2000個(gè)智能體上線。而去年11月官宣的GPT商店,由用戶創(chuàng)建的“定制”ChatGPT已經(jīng)超過300萬個(gè)。兩者完全不在一個(gè)數(shù)量級(jí)上。

百度大模型生態(tài)與海外巨頭差距懸殊,背后原因很多,但過于“實(shí)用主義”、營(yíng)銷思維過重?zé)o疑阻礙了百度技術(shù)生態(tài)的成長(zhǎng)。

在百度多位AI技術(shù)主管的公開演講或受訪中,付費(fèi)率、成本、投放效率成為關(guān)鍵詞,幫助某某集團(tuán)實(shí)現(xiàn)轉(zhuǎn)化量提升多少,ROI提升多少的案例也不鮮見,聽上去受訪者不是技術(shù)主管,而是營(yíng)銷總監(jiān)。

這或許是百度廣告基因決定的,但沿著舊地圖,如何能找到新大陸?更為關(guān)鍵的是,去年12月Pika的出現(xiàn),代表AIGC邁入了第二階段。在Pika的官方宣傳片中,僅憑一句話,就生成了動(dòng)畫版的馬斯克,不但神形兼?zhèn)?,背景和?dòng)作都合理連貫,面部一致性也驚人得完美。

隨著大模型從單一文本邁向多模態(tài),視頻就像之前文字、圖像生成一樣,成為大模型身上長(zhǎng)出來的一項(xiàng)功能,一旦成為生產(chǎn)力,AI應(yīng)用落地的商業(yè)化困境便迎刃而解。為此,谷歌、阿里、字節(jié)、騰訊都競(jìng)相下場(chǎng),多模態(tài)也將成為大模型的標(biāo)配。

更令人激動(dòng)的是,第二階段的到來,意味著第三階段的Agent也觸手可及,在這場(chǎng)“超級(jí)入口”之爭(zhēng)的關(guān)鍵節(jié)點(diǎn)上,百度似乎又沒跟上創(chuàng)新的步伐。

新入口之爭(zhēng)

Agent將是最佳AI應(yīng)用入口已然成為業(yè)界共識(shí),但為何是“超級(jí)入口”呢?

在傳統(tǒng)互聯(lián)網(wǎng)時(shí)代,搜索引擎幾乎是唯一的壟斷性入口。到了移動(dòng)互聯(lián)網(wǎng)時(shí)代,蘋果借助“iOS+App Store”,重新定義了入口形式,人機(jī)交互不再通過搜索引擎進(jìn)行,取而代之的是以微信、抖音、Uber為代表的眾多獨(dú)立App載體,對(duì)應(yīng)著如新聞、社交、辦公、網(wǎng)購(gòu)等不同的內(nèi)容。

在大模型時(shí)代,取代它們的則是AI原生應(yīng)用—Agent,并且一個(gè)終端可能只需要一個(gè)就夠了,因?yàn)锳gent可以連接一切。

自然語(yǔ)言會(huì)成為Agent的使用界面,Agent調(diào)出功能后會(huì)攔截SaaS界面,包括很多其他APP也會(huì)被攔截掉,只保留交互層,所以Agent才會(huì)被稱為“超級(jí)入口”。

“新入口之爭(zhēng)”早已展開。Open AI大張旗鼓地公布GPTs,姍姍來遲的Google將Gemini Nano塞進(jìn)手機(jī),蘋果開發(fā)新版Siri引入Ajax,阿里布局AI助理試圖連接B端所有生態(tài);為了“新入口”,華為、小米、vivo、OPPO相續(xù)發(fā)布了“端側(cè)大模型”,甚至騰訊開發(fā)的Agent已經(jīng)可以模仿人類在手機(jī)上操作APP。

曾經(jīng)錯(cuò)過移動(dòng)互聯(lián)網(wǎng)時(shí)代的百度似乎還沉浸在昔日的信息流廣告邏輯中,文心一言APP迄今也沒有給出現(xiàn)象級(jí)的迭代更新。

多年來,百度一直在尋找除搜索以外的第二增長(zhǎng)曲線,從汽車到電商到直播到教育到外賣,但至今沒有一款產(chǎn)品能扛起大旗,簡(jiǎn)直成了“魔咒”。百度也曾試圖追趕自動(dòng)駕駛的風(fēng)口,但始終沒找到突破點(diǎn)。這一次,百度能乘上大模型的東風(fēng)嗎?從目前的發(fā)展看,前景并不樂觀。

百度打贏應(yīng)用之戰(zhàn)、建設(shè)AI生態(tài)的前提是,“文心一言”自身要足夠強(qiáng)大、足夠創(chuàng)新,而不是亦步亦趨,隨人起舞。只有這樣,才有機(jī)會(huì)在大模型淘汰賽中贏得一線生機(jī)。

來源:新經(jīng)濟(jì)IPO

來源:IPO君

聲明:本文僅作為知識(shí)分享,只為傳遞更多信息!本文不構(gòu)成任何投資建議,任何人據(jù)此做出投資決策,風(fēng)險(xiǎn)自擔(dān)。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多