【原】“混戰(zhàn)”大模型，知乎、小紅書、快手各有所長(zhǎng)

劉曠V 2023-06-12 發(fā)布于海南

展開全文

配圖來(lái)自Canva可畫

一直以來(lái)，追逐風(fēng)口都是互聯(lián)網(wǎng)企業(yè)的天性。因此，繼元宇宙風(fēng)口之后，橫空出世并火遍全國(guó)的AIGC和ChatGPT，便又成為了各行業(yè)企業(yè)追逐的焦點(diǎn)。在此背景下，無(wú)論是國(guó)內(nèi)互聯(lián)網(wǎng)大廠，還是科技公司，亦或是內(nèi)容平臺(tái)，但凡有些實(shí)力的玩家都紛紛下場(chǎng)，圍繞AI大模型展開了一場(chǎng)激烈角逐，“千模大戰(zhàn)”也就此拉開了帷幕。

一場(chǎng)基于大模型的創(chuàng)業(yè)浪潮開始席卷開來(lái)，國(guó)內(nèi)陸續(xù)布局大模型的企業(yè)也如雨后春筍般爭(zhēng)相涌現(xiàn)。只不過(guò)，與百度、阿里、華為這類打造通用大模型的“高端”玩家不同，知乎、小紅書、快手等則選擇了另辟蹊徑。而作為內(nèi)容問(wèn)答、短圖文、短視頻等主流內(nèi)容形式的代表，知乎、小紅書、快手這些小巨頭們對(duì)大模型的探索，自然也就成為了外界關(guān)注的重點(diǎn)。

競(jìng)逐大模型

大模型無(wú)疑是今年最熱的風(fēng)口，國(guó)內(nèi)企業(yè)早就陸續(xù)宣布對(duì)大模型展開探索，而不管是投資還是自建，已經(jīng)開始進(jìn)場(chǎng)分羹的不在少數(shù)，知乎、小紅書、快手自然也不會(huì)錯(cuò)過(guò)這班“列車”。眾所周知，互聯(lián)網(wǎng)大廠對(duì)大模型展開研發(fā)及相關(guān)布局，是高度符合其產(chǎn)業(yè)互聯(lián)網(wǎng)戰(zhàn)略的，而相比之下，知乎、小紅書、快手這三個(gè)平臺(tái)的進(jìn)場(chǎng)，雖是意料之外，卻也依舊在情理之中。

一方面，AI技術(shù)逐漸普及，玩家們充分受益于人工智能技術(shù)浪潮，自然不想錯(cuò)過(guò)這個(gè)時(shí)代的變革。AI技術(shù)的發(fā)展將會(huì)帶來(lái)產(chǎn)業(yè)的進(jìn)步和新機(jī)遇的誕生，而伴隨著人工智能技術(shù)不斷取得突破，AI大模型也呈現(xiàn)蓬勃發(fā)展態(tài)勢(shì)。AI大模型浪潮席卷全球，只有先上牌桌，才能抓住規(guī)則這張“王牌”，因此，知乎、小紅書、快手等玩家進(jìn)軍大模型就變得刻不容緩了。

另外，對(duì)于這些玩家來(lái)說(shuō)，一旦別家的大模型落地，或會(huì)對(duì)其構(gòu)成一定的威脅，而為了防范風(fēng)險(xiǎn)，入局就變得順理成章了。進(jìn)入AIGC時(shí)代，基于深度學(xué)習(xí)的大模型將極大提升內(nèi)容生產(chǎn)的速度和數(shù)量。在此背景下，擁有了“技術(shù)優(yōu)勢(shì)”的競(jìng)爭(zhēng)對(duì)手很可能會(huì)迅速突破知乎、小紅書、快手的護(hù)城河，因此，布局大模型就變成了這些小巨頭們保持競(jìng)爭(zhēng)力的一種方式。

另一方面，在移動(dòng)互聯(lián)網(wǎng)紅利消退的背景下，選擇擁抱大模型，可以讓這些玩家的內(nèi)容變得更加多元化，有望帶來(lái)新的增長(zhǎng)點(diǎn)。由決策式AI到生成式AI的演變正在將大模型應(yīng)用推向更加多元化的場(chǎng)景，知乎、小紅書、快手等平臺(tái)推出大模型產(chǎn)品，則可以提高內(nèi)容生產(chǎn)的速度和質(zhì)量，以拓展更多新內(nèi)容；還可以更好地滿足用戶的需求，從而吸引更多用戶留存。

另外，這些玩家都或多或少地面臨著商業(yè)化困境，而利用大模型，有望助其更好地實(shí)現(xiàn)商業(yè)化。一直以來(lái)，小紅書都困于“站內(nèi)種草，站外拔草”，商業(yè)化閉環(huán)難構(gòu)建；知乎和快手也分別因?yàn)殡y抵廣告收入下滑和營(yíng)業(yè)成本高昂，以及深陷直播電商競(jìng)爭(zhēng)，而常年處于虧損之中。而其對(duì)AI大模型的訓(xùn)練，能給內(nèi)容社區(qū)帶來(lái)一波紅利，從而反哺業(yè)務(wù)增長(zhǎng)以及商業(yè)化加速。

從以上角度來(lái)看，布局大模型，似乎已經(jīng)成為了知乎、小紅書、快手等小眾玩家不得不打的一場(chǎng)仗。只不過(guò)，由于每家的商業(yè)邏輯和入場(chǎng)角度不同，每家在大模型上的優(yōu)勢(shì)和表現(xiàn)也是不盡相同。而憑借著自身在AI技術(shù)和內(nèi)容上的積累，這些平臺(tái)們也開始在大模型領(lǐng)域各顯神通。

知乎快人一步

作為國(guó)內(nèi)領(lǐng)先的問(wèn)答社區(qū)及原創(chuàng)內(nèi)容平臺(tái)，知乎早就將大模型能力應(yīng)用到了平臺(tái)中。據(jù)悉，4月，知乎發(fā)布了大語(yǔ)言模型“知海圖AI”，并內(nèi)測(cè)首個(gè)站內(nèi)大模型應(yīng)用功能“熱榜摘要”；隨后，又發(fā)布了一款大模型智能應(yīng)用功能“搜索聚合”。得益于此，知乎已經(jīng)成為國(guó)內(nèi)首批具備大語(yǔ)言模型能力的公司，而知乎之所以能加入生成式AI的戰(zhàn)局，自然是具備了一些特色和優(yōu)勢(shì)。

一是，知乎大規(guī)模、高質(zhì)量的中文數(shù)據(jù)池是訓(xùn)練大模型的良好素材，將大幅度提升訓(xùn)練效率。知乎PUGC的運(yùn)營(yíng)模式為其積累了海量、優(yōu)質(zhì)的數(shù)據(jù)。據(jù)悉，截至2022年第四季度，知乎社區(qū)上累計(jì)內(nèi)容達(dá)6.5億條，其中包括5.1億條問(wèn)答，就連微軟NewBing都將其視作中文數(shù)據(jù)源之一。可見，知乎對(duì)于訓(xùn)練大模型類的AI來(lái)說(shuō)，無(wú)疑是一個(gè)非常優(yōu)秀的數(shù)據(jù)庫(kù)資源。更何況，這些數(shù)據(jù)從形式上就十分契合大模型輸入、輸出的訓(xùn)練方式，能有效提升訓(xùn)練效率。

二是，知乎基于問(wèn)答的討論場(chǎng)是大模型天然的應(yīng)用場(chǎng)景，能夠快速精準(zhǔn)地為用戶提供大模型服務(wù)。眾所周知，知乎是國(guó)內(nèi)最有名的知識(shí)問(wèn)答社區(qū)，這些年知乎積累了海量的問(wèn)答資源，而提供這一資源的用戶來(lái)自各行各業(yè)，擁有不同的知識(shí)背景和經(jīng)驗(yàn)，他們的答案通常會(huì)更為專業(yè)、詳細(xì)和科學(xué)，可以有效確保內(nèi)容的準(zhǔn)確性和深度。而這也就意味著，知乎大模型可以從多個(gè)角度學(xué)習(xí)和理解問(wèn)題，并對(duì)用戶進(jìn)行更精準(zhǔn)的推薦和問(wèn)答。

三是，知乎與面壁智能的合作，能助其在訓(xùn)練人工智能模型時(shí)，獲得更專業(yè)、更先進(jìn)的技術(shù)支持。由于沒有大廠的雄厚實(shí)力，知乎這類中廠便開始通過(guò)聯(lián)合研發(fā)與戰(zhàn)略投資的方式，與國(guó)內(nèi)大模型團(tuán)隊(duì)共同開發(fā)中文大模型。知乎的合作伙伴——面壁智能是一家專注于大模型研發(fā)的企業(yè)，其在自然語(yǔ)言處理和機(jī)器學(xué)習(xí)領(lǐng)域擁有深厚的技術(shù)積累。與面壁智能的合作，可以為知乎AI大模型的研發(fā)提供更加專業(yè)和及時(shí)的技術(shù)支持。

小紅書穩(wěn)步推進(jìn)

事實(shí)上，除知乎之外，小紅書已秘密籌備了“大模型”團(tuán)隊(duì)，搶先參與到大模型技術(shù)的研發(fā)布局中。有消息報(bào)道稱，小紅書在4月悄然上線了一款名為“Trik”的AI創(chuàng)作應(yīng)用，主打AI繪畫。

顯然，與大廠相比，小紅書的資金儲(chǔ)備和技術(shù)實(shí)力都不夠雄厚，而鑒于大模型研發(fā)需要高昂的算力、數(shù)據(jù)以及人力成本，小紅書參與大模型研發(fā)的概率并不高，更多地可能會(huì)聚焦大模型應(yīng)用環(huán)節(jié)，圍繞平臺(tái)內(nèi)用戶運(yùn)營(yíng)，以及創(chuàng)作者工具提供等方向展開。盡管如此，小紅書布局大模型，依舊有著自己的底氣。

一來(lái)，小紅書多類型數(shù)據(jù)的內(nèi)容社區(qū)，是大模型極佳的實(shí)踐場(chǎng)景。經(jīng)過(guò)多年積累，小紅書的社區(qū)內(nèi)容生態(tài)中的內(nèi)容量豐富且多樣，據(jù)悉，小紅書已經(jīng)成長(zhǎng)為一個(gè)月活超2億的UGC內(nèi)容社區(qū)，涵蓋了視頻、圖片、文字、筆記、用戶評(píng)論等多個(gè)類型的數(shù)據(jù)。而這些數(shù)據(jù)也將會(huì)為自然語(yǔ)言處理、AI輔助內(nèi)容的生成提供多模態(tài)的數(shù)據(jù)基礎(chǔ)和應(yīng)用場(chǎng)景。

二來(lái)，小紅書結(jié)構(gòu)化的筆記內(nèi)容，更方便大模型進(jìn)行套路的學(xué)習(xí)和輸出。根據(jù)小紅書在“WILL商業(yè)大會(huì)2023”上公布數(shù)據(jù)顯示，通過(guò)將筆記、用戶行為數(shù)據(jù)結(jié)構(gòu)化，小紅書識(shí)別了26萬(wàn)的屬性詞、600萬(wàn)+的昵稱詞、700萬(wàn)+的情感描述詞。而小紅書可拆解、規(guī)律化的平臺(tái)屬性，更有利于大模型應(yīng)用的模仿，從而也能夠?yàn)槠脚_(tái)帶來(lái)生產(chǎn)效率的提升。

三來(lái)，小紅書千人千面的推薦系統(tǒng)，有望成為大模型訓(xùn)練的樣本。基于大規(guī)模的用戶行為的產(chǎn)生，小紅書團(tuán)隊(duì)根據(jù)用戶的特點(diǎn)去做了更加個(gè)性化的搜索。小紅書中的瀑布流或者內(nèi)容流，就是系統(tǒng)根據(jù)用戶行為中的規(guī)律，找出了用戶感興趣的內(nèi)容并推薦給了用戶。而針對(duì)小紅書平臺(tái)產(chǎn)生的海量數(shù)據(jù)參數(shù)，將有可能會(huì)被實(shí)時(shí)送到模型中去做預(yù)估，而且隨著樣本的不斷變化，模型參數(shù)也將會(huì)不斷更新。

快手躍躍欲試

知乎和小紅書一直在積極籌備，快手自然也不能落后。據(jù)程一笑介紹，快手目前已組建了大模型研發(fā)團(tuán)隊(duì)，并依托過(guò)去在AIGC算法和大規(guī)模語(yǔ)言模型方面的技術(shù)積累，按計(jì)劃推進(jìn)大模型開發(fā)和訓(xùn)練，只是當(dāng)前模型還處于訓(xùn)練階段。快手雖然暫時(shí)沒有對(duì)外發(fā)布大模型產(chǎn)品，但能看出其對(duì)大模型是持積極擁抱態(tài)度的。而在快手積極布局背后，自然也有著涉足大模型的驅(qū)動(dòng)力。

一方面，快手的視頻生成是生成式AI相對(duì)缺乏的細(xì)分領(lǐng)域，有助于形成差異化優(yōu)勢(shì)。入局大模型賽道的玩家有很多，但相比較而言，作為國(guó)民級(jí)短視頻應(yīng)用的快手的探索方向就顯得十分與眾不同。據(jù)了解，快手目前在大模型方面的嘗試包括大規(guī)模語(yǔ)言模型、多模態(tài)預(yù)訓(xùn)練大模型、智能創(chuàng)作工具等。除了文本之外，快手還在語(yǔ)音、圖像、視頻、3D圖形等各個(gè)模態(tài)的內(nèi)容生成方面均有所嘗試。

另一方面，快手短視頻平臺(tái)具有娛樂(lè)化屬性，能給予大模型一定的試錯(cuò)空間。據(jù)目前透露的消息來(lái)看，快手大模型目前主要由兩部分功能組成，一種是類似于Midjourney的文生圖功能，一種是類似于ChatGPT的對(duì)話式AI工具。而盡管快手稱“語(yǔ)言描述的精準(zhǔn)度不及Midjourney”，但相較于極度追求專業(yè)化的Midjourney，以UGC為主的快手本身對(duì)大模型的要求不會(huì)有太高。

作為各行業(yè)的代表企業(yè)，知乎、小紅書、快手爭(zhēng)相擁抱大模型，固然有其必要性和優(yōu)勢(shì)條件，但AI大模型所伴隨的深重危機(jī)感也不容忽視。上面所提到各個(gè)內(nèi)容平臺(tái)的表現(xiàn)，都只是其增加了一些有關(guān)大模型的“新功能”，其AI大模型產(chǎn)品距離成熟還有很遠(yuǎn)，實(shí)現(xiàn)商業(yè)化落地，更是難上加難。

目前來(lái)看，國(guó)內(nèi)大中小廠扎堆大模型的現(xiàn)象已經(jīng)是屢見不鮮，對(duì)于參賽的玩家而言，大模型的能力雖是比拼的重點(diǎn)，但具體的場(chǎng)景和落地應(yīng)用同樣關(guān)鍵。而最終誰(shuí)能在這場(chǎng)“大模型混戰(zhàn)”中存活下來(lái)，并拔得頭籌，也還需要時(shí)間來(lái)檢驗(yàn)。不過(guò)，可以肯定的是，知乎、小紅書、快手想要從中突圍，還有很長(zhǎng)的路要走。