王小川首個(gè)AI應(yīng)用來了！一手測(cè)評(píng)：有特點(diǎn)，但不完美

烏鴉智能說 2024-05-23 發(fā)布于北京

展開全文

昨天，百川智能發(fā)布了新一代的基座大模型 Baichuan 4，同時(shí)推出了首款 AI 應(yīng)用——百小應(yīng)。

與市場(chǎng)上大部分大模型廠商一樣，百川智能瞄準(zhǔn)的是AI智能助手。有意思的地方是，雖然定位于AI 智能助手，但百小應(yīng)主打的特點(diǎn)卻是「懂搜索、會(huì)提問」。這點(diǎn)又與目前很火的 AI 搜索應(yīng)用類似。

強(qiáng)調(diào)搜索特點(diǎn)，并不意外。王小川可以說是國(guó)內(nèi)最懂搜索的人之一，其創(chuàng)立的搜狗長(zhǎng)期穩(wěn)坐搜索行業(yè)第二把交椅。AI搜索又是AI應(yīng)用的三大場(chǎng)景，連OpenAI都在布局。

令人好奇的是，從移動(dòng)互聯(lián)網(wǎng)到生成式AI，王小川是如何理解搜索產(chǎn)品的變化？百小應(yīng)與市面上的AI搜索產(chǎn)品又有什么不同？在百小應(yīng)上線的第一時(shí)間，烏鴉君就上手用了下。今天，大家可以跟著烏鴉君，先來探探水。

/ 01 / 懂搜索，但又不止搜索

從定位上，百川推出的“百小應(yīng)”是一款類似于ChatGPT、Kimi的智能助手產(chǎn)品，不僅可以隨時(shí)回答用戶提出的各種問題，速讀文件、整理資料、輔助創(chuàng)作等，還具備多輪搜索、定向搜索等搜索能力。

產(chǎn)品本身也具備多模態(tài)相關(guān)功能，用戶可以上傳圖片、pdf等文檔，讓百小應(yīng)辨別其中的內(nèi)容，并且完成相應(yīng)指令，如撰寫文案等。

要說百小應(yīng)與市面上智能助手產(chǎn)品最大的不同，還得是搜索功能。用王小川的話說，“百小應(yīng)”的一大特點(diǎn)在于，可以讓模型學(xué)會(huì)“多輪搜索”。

什么是“多輪搜索”？多輪搜索就是指，針對(duì)用戶提出的問題，百小應(yīng)能夠更進(jìn)一步，探究問題的核心答案。相比單輪搜索，在市場(chǎng)調(diào)研、產(chǎn)業(yè)分析等復(fù)雜場(chǎng)景下，多輪搜索能夠有效地獲取更專業(yè)、更有深度的信息。

在搜索結(jié)果呈現(xiàn)方面，與其他在單次搜索后簡(jiǎn)單總結(jié)網(wǎng)頁信息的應(yīng)用不同，百小應(yīng)將能夠搜索結(jié)果作為觀點(diǎn)、論據(jù)直接應(yīng)用到問答結(jié)果中，能夠?qū)⑺阉鹘Y(jié)果以表格等結(jié)構(gòu)化形式呈現(xiàn)，優(yōu)化信息布局，便于用戶快速定位、解讀所需信息。

盡管以“搜索“功能作為特點(diǎn)，但百川并不希望將其看做一款搜索+AI的產(chǎn)品。用王小川的話說，“如果是將搜索結(jié)果簡(jiǎn)單總結(jié)，搜索公司自己就可以做，不是創(chuàng)業(yè)公司做的事。”長(zhǎng)期來看，AI助手將會(huì)從AI“工具”升級(jí)到“伙伴”。

也就是說，比起市面上直接給到搜索結(jié)果的搜索產(chǎn)品，百小應(yīng)更愿意將搜索作為與用戶互動(dòng)的場(chǎng)景。

/ 02 / 搜索功能一手測(cè)評(píng)：有特點(diǎn)，但并不完美

打開百小應(yīng)應(yīng)用，會(huì)直接出現(xiàn)一個(gè)對(duì)話框，這也是搜索功能的入口。

為了更好感受百小應(yīng)與市面上AI搜索產(chǎn)品的差異，我們通過三個(gè)問題對(duì)百小應(yīng)的AI 搜索實(shí)用能力進(jìn)行了一個(gè)測(cè)試。

第一個(gè)問題是，楊立昆對(duì)AGI的看法。對(duì)于這個(gè)看似并不難的問題，百小應(yīng)的回答令人意外：

楊立昆教授是中國(guó)科學(xué)院自動(dòng)化研究所的研究員。同時(shí)，百小應(yīng)也沒辦法給出楊立昆的觀點(diǎn)，原因是：由于無法訪問最新資料庫，其無法提供最新觀點(diǎn)。

對(duì)比之下，秘塔AI和Perplexity的表現(xiàn)要好很多。

秘塔不僅給出了楊立昆的部分核心觀點(diǎn)，還對(duì)觀點(diǎn)進(jìn)行了梳理，形成了大綱。在回答的后面，還有與楊立昆相關(guān)的信息、事件科普。

Perplexity盡管不能做到像秘塔一樣詳細(xì)，但至少能給到一些核心觀點(diǎn)，算是基本合格。

就算是與同樣定位于AI助手的Kimi，至少給出了楊立昆的一些基本資料和籠統(tǒng)的觀點(diǎn)。

問題二是，AI搜索與傳統(tǒng)搜索相比有什么不同？對(duì)于這個(gè)問題，秘塔的表現(xiàn)一如既往地穩(wěn)定，既有整體的總結(jié)，又有要點(diǎn)的分類。

Perplexity則直接給出了AI搜索與傳統(tǒng)搜索的6個(gè)不同點(diǎn)，從要點(diǎn)總結(jié)來看，Perplexity與秘塔略有差異。

再來看百小應(yīng)的表現(xiàn)，百小應(yīng)同樣給出了五點(diǎn)不同分別是：搜索結(jié)果的相關(guān)性、交互方式、學(xué)習(xí)與優(yōu)化、搜索結(jié)果呈現(xiàn)、搜索引擎的智能化程度。

不僅如此，百小應(yīng)還基于用戶AI搜索的信息需求更進(jìn)一步，給出了百度、谷歌在AI搜索領(lǐng)域的實(shí)際應(yīng)用案例。至少在這個(gè)問題上，百小應(yīng)在與秘塔和Perplexity的對(duì)比中沒有落于下風(fēng)。

在這里，烏鴉君還多問了一句：在AI搜索上，秘塔和百度誰更有優(yōu)勢(shì)？百小應(yīng)并沒有直接給出結(jié)論，反而分別給出了秘塔和百度各自的優(yōu)勢(shì)，甚至還做了表格。更多樣的結(jié)構(gòu)化呈現(xiàn)形式，也是百小應(yīng)的一大特色。

從前兩個(gè)問題看，相比秘塔和Perplexity，百小應(yīng)在信息準(zhǔn)確性上表現(xiàn)很不穩(wěn)定。要想把 AI 搜索真正用到工作里，比起什么連續(xù)對(duì)話和實(shí)時(shí)性，答案的準(zhǔn)確度才是優(yōu)先考慮項(xiàng)。

所以，最后的測(cè)驗(yàn)里，烏鴉君特地挖了一個(gè)坑，問了一個(gè)根本不存在的數(shù)據(jù)：拼多多2010年的用戶數(shù)量？

百小應(yīng)不僅沒有上套，還直接點(diǎn)破了這個(gè)套路：拼多多成立于2015年9月，所以2010年沒有用戶數(shù)據(jù)。

Perplexity也沒有上套，不僅給出了正確信息，還圍繞拼多多用戶表現(xiàn)這一信息點(diǎn)，給出了更多的相關(guān)信息。

讓烏鴉君沒有想到的是，之前表現(xiàn)很不錯(cuò)的秘塔，卻在這個(gè)問題上犯暈了。雖然秘塔在總結(jié)里說的是，沒辦法給到拼多多2010年的數(shù)據(jù)，但在概括里仍然給到了一個(gè)錯(cuò)誤事實(shí)：拼多多成立于2010年。

三輪測(cè)試下來，除了Perplexity表現(xiàn)穩(wěn)定外，百小應(yīng)與秘塔在信息準(zhǔn)確性都“翻了車“，相比之下，百小應(yīng)的錯(cuò)誤要更嚴(yán)重一些。

百小應(yīng)對(duì)楊立昆AGI觀點(diǎn)的事實(shí)錯(cuò)誤，一部分原因是模型知識(shí)庫造成的信息實(shí)時(shí)性不足。

比如，當(dāng)我向百小應(yīng)提問，評(píng)價(jià)一下GPT-4o？百小應(yīng)會(huì)回答，數(shù)據(jù)知識(shí)更新日期為2023年，沒有相關(guān)資料。但如果你把同樣的問題給到秘塔和Perplexity，它們卻能夠給出有關(guān)GPT-4o的最新資料。

這與百小應(yīng)產(chǎn)品定位有很大關(guān)系。百小應(yīng)的定位是類似于ChatGPT的個(gè)人助手，這意味著其信息獲取依賴于模型的訓(xùn)練數(shù)據(jù)，而AI搜索則可以實(shí)時(shí)抓取最新的網(wǎng)絡(luò)信息，因此在信息實(shí)時(shí)性上更有優(yōu)勢(shì)。同樣的Kimi也沒辦法給出GPT-4o的評(píng)價(jià)。

根據(jù)其他媒體的說法，在對(duì)百小應(yīng)進(jìn)行提問的時(shí)候，不一定會(huì)觸發(fā)搜索功能。不過這樣設(shè)計(jì)多少令人感到奇怪：

雖然定位于個(gè)人助手，但百小應(yīng)在對(duì)外宣傳時(shí)強(qiáng)調(diào)的是，搜索技術(shù)和大模型深度融合?！岸阉鞯腁I助手”，也是百小應(yīng)的Slogan。但在實(shí)際使用過程中，無法像市面上AI搜索一樣完成實(shí)時(shí)信息的獲取，對(duì)用戶體驗(yàn)影響極大。

當(dāng)然，考慮百小應(yīng)剛剛上線，這些不完善也能夠理解，期待后面產(chǎn)品有進(jìn)一步改善。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：烏鴉智能說 > 《待分類》

舉報(bào)/認(rèn)領(lǐng)