小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

王小川首個(gè)AI應(yīng)用來了!一手測(cè)評(píng):有特點(diǎn),但不完美

 烏鴉智能說 2024-05-23 發(fā)布于北京

昨天,百川智能發(fā)布了新一代的基座大模型 Baichuan 4,同時(shí)推出了首款 AI 應(yīng)用——百小應(yīng)。

與市場(chǎng)上大部分大模型廠商一樣,百川智能瞄準(zhǔn)的是AI智能助手。有意思的地方是,雖然定位于AI 智能助手,但百小應(yīng)主打的特點(diǎn)卻是「懂搜索、會(huì)提問」。這點(diǎn)又與目前很火的 AI 搜索應(yīng)用類似。

強(qiáng)調(diào)搜索特點(diǎn),并不意外。王小川可以說是國(guó)內(nèi)最懂搜索的人之一,其創(chuàng)立的搜狗長(zhǎng)期穩(wěn)坐搜索行業(yè)第二把交椅。AI搜索又是AI應(yīng)用的三大場(chǎng)景,連OpenAI都在布局。

令人好奇的是,從移動(dòng)互聯(lián)網(wǎng)到生成式AI,王小川是如何理解搜索產(chǎn)品的變化?百小應(yīng)與市面上的AI搜索產(chǎn)品又有什么不同?在百小應(yīng)上線的第一時(shí)間,烏鴉君就上手用了下。今天,大家可以跟著烏鴉君,先來探探水。

/ 01 / 懂搜索,但又不止搜索

從定位上,百川推出的“百小應(yīng)”是一款類似于ChatGPT、Kimi的智能助手產(chǎn)品,不僅可以隨時(shí)回答用戶提出的各種問題,速讀文件、整理資料、輔助創(chuàng)作等,還具備多輪搜索、定向搜索等搜索能力。

產(chǎn)品本身也具備多模態(tài)相關(guān)功能,用戶可以上傳圖片、pdf等文檔,讓百小應(yīng)辨別其中的內(nèi)容,并且完成相應(yīng)指令,如撰寫文案等。

要說百小應(yīng)與市面上智能助手產(chǎn)品最大的不同,還得是搜索功能。用王小川的話說,“百小應(yīng)”的一大特點(diǎn)在于,可以讓模型學(xué)會(huì)“多輪搜索”。

什么是“多輪搜索”?多輪搜索就是指,針對(duì)用戶提出的問題,百小應(yīng)能夠更進(jìn)一步,探究問題的核心答案。相比單輪搜索,在市場(chǎng)調(diào)研、產(chǎn)業(yè)分析等復(fù)雜場(chǎng)景下,多輪搜索能夠有效地獲取更專業(yè)、更有深度的信息。

在搜索結(jié)果呈現(xiàn)方面,與其他在單次搜索后簡(jiǎn)單總結(jié)網(wǎng)頁信息的應(yīng)用不同,百小應(yīng)將能夠搜索結(jié)果作為觀點(diǎn)、論據(jù)直接應(yīng)用到問答結(jié)果中,能夠?qū)⑺阉鹘Y(jié)果以表格等結(jié)構(gòu)化形式呈現(xiàn),優(yōu)化信息布局,便于用戶快速定位、解讀所需信息。

盡管以“搜索“功能作為特點(diǎn),但百川并不希望將其看做一款搜索+AI的產(chǎn)品。用王小川的話說,“如果是將搜索結(jié)果簡(jiǎn)單總結(jié),搜索公司自己就可以做,不是創(chuàng)業(yè)公司做的事。”長(zhǎng)期來看,AI助手將會(huì)從AI“工具”升級(jí)到“伙伴”。

也就是說,比起市面上直接給到搜索結(jié)果的搜索產(chǎn)品,百小應(yīng)更愿意將搜索作為與用戶互動(dòng)的場(chǎng)景。

/ 02 / 搜索功能一手測(cè)評(píng):有特點(diǎn),但并不完美

打開百小應(yīng)應(yīng)用,會(huì)直接出現(xiàn)一個(gè)對(duì)話框,這也是搜索功能的入口。

為了更好感受百小應(yīng)與市面上AI搜索產(chǎn)品的差異,我們通過三個(gè)問題對(duì)百小應(yīng)的AI 搜索實(shí)用能力進(jìn)行了一個(gè)測(cè)試。

第一個(gè)問題是,楊立昆對(duì)AGI的看法。對(duì)于這個(gè)看似并不難的問題,百小應(yīng)的回答令人意外:

楊立昆教授是中國(guó)科學(xué)院自動(dòng)化研究所的研究員。同時(shí),百小應(yīng)也沒辦法給出楊立昆的觀點(diǎn),原因是:由于無法訪問最新資料庫,其無法提供最新觀點(diǎn)。

對(duì)比之下,秘塔AI和Perplexity的表現(xiàn)要好很多。

秘塔不僅給出了楊立昆的部分核心觀點(diǎn),還對(duì)觀點(diǎn)進(jìn)行了梳理,形成了大綱。在回答的后面,還有與楊立昆相關(guān)的信息、事件科普。

Perplexity盡管不能做到像秘塔一樣詳細(xì),但至少能給到一些核心觀點(diǎn),算是基本合格。

就算是與同樣定位于AI助手的Kimi,至少給出了楊立昆的一些基本資料和籠統(tǒng)的觀點(diǎn)。

問題二是,AI搜索與傳統(tǒng)搜索相比有什么不同?對(duì)于這個(gè)問題,秘塔的表現(xiàn)一如既往地穩(wěn)定,既有整體的總結(jié),又有要點(diǎn)的分類。

Perplexity則直接給出了AI搜索與傳統(tǒng)搜索的6個(gè)不同點(diǎn),從要點(diǎn)總結(jié)來看,Perplexity與秘塔略有差異。

再來看百小應(yīng)的表現(xiàn),百小應(yīng)同樣給出了五點(diǎn)不同分別是:搜索結(jié)果的相關(guān)性、交互方式、學(xué)習(xí)與優(yōu)化、搜索結(jié)果呈現(xiàn)、搜索引擎的智能化程度。

不僅如此,百小應(yīng)還基于用戶AI搜索的信息需求更進(jìn)一步,給出了百度、谷歌在AI搜索領(lǐng)域的實(shí)際應(yīng)用案例。至少在這個(gè)問題上,百小應(yīng)在與秘塔和Perplexity的對(duì)比中沒有落于下風(fēng)。

在這里,烏鴉君還多問了一句:在AI搜索上,秘塔和百度誰更有優(yōu)勢(shì)?百小應(yīng)并沒有直接給出結(jié)論,反而分別給出了秘塔和百度各自的優(yōu)勢(shì),甚至還做了表格。更多樣的結(jié)構(gòu)化呈現(xiàn)形式,也是百小應(yīng)的一大特色。

從前兩個(gè)問題看,相比秘塔和Perplexity,百小應(yīng)在信息準(zhǔn)確性上表現(xiàn)很不穩(wěn)定。要想把 AI 搜索真正用到工作里,比起什么連續(xù)對(duì)話和實(shí)時(shí)性,答案的準(zhǔn)確度才是優(yōu)先考慮項(xiàng)。

所以,最后的測(cè)驗(yàn)里,烏鴉君特地挖了一個(gè)坑,問了一個(gè)根本不存在的數(shù)據(jù):拼多多2010年的用戶數(shù)量?

百小應(yīng)不僅沒有上套,還直接點(diǎn)破了這個(gè)套路:拼多多成立于2015年9月,所以2010年沒有用戶數(shù)據(jù)。

Perplexity也沒有上套,不僅給出了正確信息,還圍繞拼多多用戶表現(xiàn)這一信息點(diǎn),給出了更多的相關(guān)信息。

讓烏鴉君沒有想到的是,之前表現(xiàn)很不錯(cuò)的秘塔,卻在這個(gè)問題上犯暈了。雖然秘塔在總結(jié)里說的是,沒辦法給到拼多多2010年的數(shù)據(jù),但在概括里仍然給到了一個(gè)錯(cuò)誤事實(shí):拼多多成立于2010年。

三輪測(cè)試下來,除了Perplexity表現(xiàn)穩(wěn)定外,百小應(yīng)與秘塔在信息準(zhǔn)確性都“翻了車“,相比之下,百小應(yīng)的錯(cuò)誤要更嚴(yán)重一些。

百小應(yīng)對(duì)楊立昆AGI觀點(diǎn)的事實(shí)錯(cuò)誤,一部分原因是模型知識(shí)庫造成的信息實(shí)時(shí)性不足。

比如,當(dāng)我向百小應(yīng)提問,評(píng)價(jià)一下GPT-4o?百小應(yīng)會(huì)回答,數(shù)據(jù)知識(shí)更新日期為2023年,沒有相關(guān)資料。但如果你把同樣的問題給到秘塔和Perplexity,它們卻能夠給出有關(guān)GPT-4o的最新資料。

這與百小應(yīng)產(chǎn)品定位有很大關(guān)系。百小應(yīng)的定位是類似于ChatGPT的個(gè)人助手,這意味著其信息獲取依賴于模型的訓(xùn)練數(shù)據(jù),而AI搜索則可以實(shí)時(shí)抓取最新的網(wǎng)絡(luò)信息,因此在信息實(shí)時(shí)性上更有優(yōu)勢(shì)。同樣的Kimi也沒辦法給出GPT-4o的評(píng)價(jià)。

根據(jù)其他媒體的說法,在對(duì)百小應(yīng)進(jìn)行提問的時(shí)候,不一定會(huì)觸發(fā)搜索功能。不過這樣設(shè)計(jì)多少令人感到奇怪:

雖然定位于個(gè)人助手,但百小應(yīng)在對(duì)外宣傳時(shí)強(qiáng)調(diào)的是,搜索技術(shù)和大模型深度融合?!岸阉鞯腁I助手”,也是百小應(yīng)的Slogan。但在實(shí)際使用過程中,無法像市面上AI搜索一樣完成實(shí)時(shí)信息的獲取,對(duì)用戶體驗(yàn)影響極大。

當(dāng)然,考慮百小應(yīng)剛剛上線,這些不完善也能夠理解,期待后面產(chǎn)品有進(jìn)一步改善。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多