配圖來(lái)自Canva可畫 一直以來(lái),追逐風(fēng)口都是互聯(lián)網(wǎng)企業(yè)的天性。因此,繼元宇宙風(fēng)口之后,橫空出世并火遍全國(guó)的AIGC和ChatGPT,便又成為了各行業(yè)企業(yè)追逐的焦點(diǎn)。在此背景下,無(wú)論是國(guó)內(nèi)互聯(lián)網(wǎng)大廠,還是科技公司,亦或是內(nèi)容平臺(tái),但凡有些實(shí)力的玩家都紛紛下場(chǎng),圍繞AI大模型展開了一場(chǎng)激烈角逐,“千模大戰(zhàn)”也就此拉開了帷幕。 一場(chǎng)基于大模型的創(chuàng)業(yè)浪潮開始席卷開來(lái),國(guó)內(nèi)陸續(xù)布局大模型的企業(yè)也如雨后春筍般爭(zhēng)相涌現(xiàn)。只不過(guò),與百度、阿里、華為這類打造通用大模型的“高端”玩家不同,知乎、小紅書、快手等則選擇了另辟蹊徑。而作為內(nèi)容問(wèn)答、短圖文、短視頻等主流內(nèi)容形式的代表,知乎、小紅書、快手這些小巨頭們對(duì)大模型的探索,自然也就成為了外界關(guān)注的重點(diǎn)。 競(jìng)逐大模型 大模型無(wú)疑是今年最熱的風(fēng)口,國(guó)內(nèi)企業(yè)早就陸續(xù)宣布對(duì)大模型展開探索,而不管是投資還是自建,已經(jīng)開始進(jìn)場(chǎng)分羹的不在少數(shù),知乎、小紅書、快手自然也不會(huì)錯(cuò)過(guò)這班“列車”。眾所周知,互聯(lián)網(wǎng)大廠對(duì)大模型展開研發(fā)及相關(guān)布局,是高度符合其產(chǎn)業(yè)互聯(lián)網(wǎng)戰(zhàn)略的,而相比之下,知乎、小紅書、快手這三個(gè)平臺(tái)的進(jìn)場(chǎng),雖是意料之外,卻也依舊在情理之中。 一方面,AI技術(shù)逐漸普及,玩家們充分受益于人工智能技術(shù)浪潮,自然不想錯(cuò)過(guò)這個(gè)時(shí)代的變革。AI技術(shù)的發(fā)展將會(huì)帶來(lái)產(chǎn)業(yè)的進(jìn)步和新機(jī)遇的誕生,而伴隨著人工智能技術(shù)不斷取得突破,AI大模型也呈現(xiàn)蓬勃發(fā)展態(tài)勢(shì)。AI大模型浪潮席卷全球,只有先上牌桌,才能抓住規(guī)則這張“王牌”,因此,知乎、小紅書、快手等玩家進(jìn)軍大模型就變得刻不容緩了。 另外,對(duì)于這些玩家來(lái)說(shuō),一旦別家的大模型落地,或會(huì)對(duì)其構(gòu)成一定的威脅,而為了防范風(fēng)險(xiǎn),入局就變得順理成章了。進(jìn)入AIGC時(shí)代,基于深度學(xué)習(xí)的大模型將極大提升內(nèi)容生產(chǎn)的速度和數(shù)量。在此背景下,擁有了“技術(shù)優(yōu)勢(shì)”的競(jìng)爭(zhēng)對(duì)手很可能會(huì)迅速突破知乎、小紅書、快手的護(hù)城河,因此,布局大模型就變成了這些小巨頭們保持競(jìng)爭(zhēng)力的一種方式。 另一方面,在移動(dòng)互聯(lián)網(wǎng)紅利消退的背景下,選擇擁抱大模型,可以讓這些玩家的內(nèi)容變得更加多元化,有望帶來(lái)新的增長(zhǎng)點(diǎn)。由決策式AI到生成式AI的演變正在將大模型應(yīng)用推向更加多元化的場(chǎng)景,知乎、小紅書、快手等平臺(tái)推出大模型產(chǎn)品,則可以提高內(nèi)容生產(chǎn)的速度和質(zhì)量,以拓展更多新內(nèi)容;還可以更好地滿足用戶的需求,從而吸引更多用戶留存。 另外,這些玩家都或多或少地面臨著商業(yè)化困境,而利用大模型,有望助其更好地實(shí)現(xiàn)商業(yè)化。一直以來(lái),小紅書都困于“站內(nèi)種草,站外拔草”,商業(yè)化閉環(huán)難構(gòu)建;知乎和快手也分別因?yàn)殡y抵廣告收入下滑和營(yíng)業(yè)成本高昂,以及深陷直播電商競(jìng)爭(zhēng),而常年處于虧損之中。而其對(duì)AI大模型的訓(xùn)練,能給內(nèi)容社區(qū)帶來(lái)一波紅利,從而反哺業(yè)務(wù)增長(zhǎng)以及商業(yè)化加速。 從以上角度來(lái)看,布局大模型,似乎已經(jīng)成為了知乎、小紅書、快手等小眾玩家不得不打的一場(chǎng)仗。只不過(guò),由于每家的商業(yè)邏輯和入場(chǎng)角度不同,每家在大模型上的優(yōu)勢(shì)和表現(xiàn)也是不盡相同。而憑借著自身在AI技術(shù)和內(nèi)容上的積累,這些平臺(tái)們也開始在大模型領(lǐng)域各顯神通。 知乎快人一步 作為國(guó)內(nèi)領(lǐng)先的問(wèn)答社區(qū)及原創(chuàng)內(nèi)容平臺(tái),知乎早就將大模型能力應(yīng)用到了平臺(tái)中。據(jù)悉,4月,知乎發(fā)布了大語(yǔ)言模型“知海圖AI”,并內(nèi)測(cè)首個(gè)站內(nèi)大模型應(yīng)用功能“熱榜摘要”;隨后,又發(fā)布了一款大模型智能應(yīng)用功能“搜索聚合”。得益于此,知乎已經(jīng)成為國(guó)內(nèi)首批具備大語(yǔ)言模型能力的公司,而知乎之所以能加入生成式AI的戰(zhàn)局,自然是具備了一些特色和優(yōu)勢(shì)。 一是,知乎大規(guī)模、高質(zhì)量的中文數(shù)據(jù)池是訓(xùn)練大模型的良好素材,將大幅度提升訓(xùn)練效率。知乎PUGC的運(yùn)營(yíng)模式為其積累了海量、優(yōu)質(zhì)的數(shù)據(jù)。據(jù)悉,截至2022年第四季度,知乎社區(qū)上累計(jì)內(nèi)容達(dá)6.5億條,其中包括5.1億條問(wèn)答,就連微軟NewBing都將其視作中文數(shù)據(jù)源之一。可見,知乎對(duì)于訓(xùn)練大模型類的AI來(lái)說(shuō),無(wú)疑是一個(gè)非常優(yōu)秀的數(shù)據(jù)庫(kù)資源。更何況,這些數(shù)據(jù)從形式上就十分契合大模型輸入、輸出的訓(xùn)練方式,能有效提升訓(xùn)練效率。 二是,知乎基于問(wèn)答的討論場(chǎng)是大模型天然的應(yīng)用場(chǎng)景,能夠快速精準(zhǔn)地為用戶提供大模型服務(wù)。眾所周知,知乎是國(guó)內(nèi)最有名的知識(shí)問(wèn)答社區(qū),這些年知乎積累了海量的問(wèn)答資源,而提供這一資源的用戶來(lái)自各行各業(yè),擁有不同的知識(shí)背景和經(jīng)驗(yàn),他們的答案通常會(huì)更為專業(yè)、詳細(xì)和科學(xué),可以有效確保內(nèi)容的準(zhǔn)確性和深度。而這也就意味著,知乎大模型可以從多個(gè)角度學(xué)習(xí)和理解問(wèn)題,并對(duì)用戶進(jìn)行更精準(zhǔn)的推薦和問(wèn)答。 三是,知乎與面壁智能的合作,能助其在訓(xùn)練人工智能模型時(shí),獲得更專業(yè)、更先進(jìn)的技術(shù)支持。由于沒有大廠的雄厚實(shí)力,知乎這類中廠便開始通過(guò)聯(lián)合研發(fā)與戰(zhàn)略投資的方式,與國(guó)內(nèi)大模型團(tuán)隊(duì)共同開發(fā)中文大模型。知乎的合作伙伴——面壁智能是一家專注于大模型研發(fā)的企業(yè),其在自然語(yǔ)言處理和機(jī)器學(xué)習(xí)領(lǐng)域擁有深厚的技術(shù)積累。與面壁智能的合作,可以為知乎AI大模型的研發(fā)提供更加專業(yè)和及時(shí)的技術(shù)支持。 小紅書穩(wěn)步推進(jìn) 事實(shí)上,除知乎之外,小紅書已秘密籌備了“大模型”團(tuán)隊(duì),搶先參與到大模型技術(shù)的研發(fā)布局中。有消息報(bào)道稱,小紅書在4月悄然上線了一款名為“Trik”的AI創(chuàng)作應(yīng)用,主打AI繪畫。 顯然,與大廠相比,小紅書的資金儲(chǔ)備和技術(shù)實(shí)力都不夠雄厚,而鑒于大模型研發(fā)需要高昂的算力、數(shù)據(jù)以及人力成本,小紅書參與大模型研發(fā)的概率并不高,更多地可能會(huì)聚焦大模型應(yīng)用環(huán)節(jié),圍繞平臺(tái)內(nèi)用戶運(yùn)營(yíng),以及創(chuàng)作者工具提供等方向展開。盡管如此,小紅書布局大模型,依舊有著自己的底氣。 一來(lái),小紅書多類型數(shù)據(jù)的內(nèi)容社區(qū),是大模型極佳的實(shí)踐場(chǎng)景。經(jīng)過(guò)多年積累,小紅書的社區(qū)內(nèi)容生態(tài)中的內(nèi)容量豐富且多樣,據(jù)悉,小紅書已經(jīng)成長(zhǎng)為一個(gè)月活超2億的UGC內(nèi)容社區(qū),涵蓋了視頻、圖片、文字、筆記、用戶評(píng)論等多個(gè)類型的數(shù)據(jù)。而這些數(shù)據(jù)也將會(huì)為自然語(yǔ)言處理、AI輔助內(nèi)容的生成提供多模態(tài)的數(shù)據(jù)基礎(chǔ)和應(yīng)用場(chǎng)景。 二來(lái),小紅書結(jié)構(gòu)化的筆記內(nèi)容,更方便大模型進(jìn)行套路的學(xué)習(xí)和輸出。根據(jù)小紅書在“WILL商業(yè)大會(huì)2023”上公布數(shù)據(jù)顯示,通過(guò)將筆記、用戶行為數(shù)據(jù)結(jié)構(gòu)化,小紅書識(shí)別了26萬(wàn)的屬性詞、600萬(wàn)+的昵稱詞、700萬(wàn)+的情感描述詞。而小紅書可拆解、規(guī)律化的平臺(tái)屬性,更有利于大模型應(yīng)用的模仿,從而也能夠?yàn)槠脚_(tái)帶來(lái)生產(chǎn)效率的提升。 三來(lái),小紅書千人千面的推薦系統(tǒng),有望成為大模型訓(xùn)練的樣本。基于大規(guī)模的用戶行為的產(chǎn)生,小紅書團(tuán)隊(duì)根據(jù)用戶的特點(diǎn)去做了更加個(gè)性化的搜索。小紅書中的瀑布流或者內(nèi)容流,就是系統(tǒng)根據(jù)用戶行為中的規(guī)律,找出了用戶感興趣的內(nèi)容并推薦給了用戶。而針對(duì)小紅書平臺(tái)產(chǎn)生的海量數(shù)據(jù)參數(shù),將有可能會(huì)被實(shí)時(shí)送到模型中去做預(yù)估,而且隨著樣本的不斷變化,模型參數(shù)也將會(huì)不斷更新。 快手躍躍欲試 知乎和小紅書一直在積極籌備,快手自然也不能落后。據(jù)程一笑介紹,快手目前已組建了大模型研發(fā)團(tuán)隊(duì),并依托過(guò)去在AIGC算法和大規(guī)模語(yǔ)言模型方面的技術(shù)積累,按計(jì)劃推進(jìn)大模型開發(fā)和訓(xùn)練,只是當(dāng)前模型還處于訓(xùn)練階段。快手雖然暫時(shí)沒有對(duì)外發(fā)布大模型產(chǎn)品,但能看出其對(duì)大模型是持積極擁抱態(tài)度的。而在快手積極布局背后,自然也有著涉足大模型的驅(qū)動(dòng)力。 一方面,快手的視頻生成是生成式AI相對(duì)缺乏的細(xì)分領(lǐng)域,有助于形成差異化優(yōu)勢(shì)。入局大模型賽道的玩家有很多,但相比較而言,作為國(guó)民級(jí)短視頻應(yīng)用的快手的探索方向就顯得十分與眾不同。據(jù)了解,快手目前在大模型方面的嘗試包括大規(guī)模語(yǔ)言模型、多模態(tài)預(yù)訓(xùn)練大模型、智能創(chuàng)作工具等。除了文本之外,快手還在語(yǔ)音、圖像、視頻、3D圖形等各個(gè)模態(tài)的內(nèi)容生成方面均有所嘗試。 另一方面,快手短視頻平臺(tái)具有娛樂(lè)化屬性,能給予大模型一定的試錯(cuò)空間。據(jù)目前透露的消息來(lái)看,快手大模型目前主要由兩部分功能組成,一種是類似于Midjourney的文生圖功能,一種是類似于ChatGPT的對(duì)話式AI工具。而盡管快手稱“語(yǔ)言描述的精準(zhǔn)度不及Midjourney”,但相較于極度追求專業(yè)化的Midjourney,以UGC為主的快手本身對(duì)大模型的要求不會(huì)有太高。 作為各行業(yè)的代表企業(yè),知乎、小紅書、快手爭(zhēng)相擁抱大模型,固然有其必要性和優(yōu)勢(shì)條件,但AI大模型所伴隨的深重危機(jī)感也不容忽視。上面所提到各個(gè)內(nèi)容平臺(tái)的表現(xiàn),都只是其增加了一些有關(guān)大模型的“新功能”,其AI大模型產(chǎn)品距離成熟還有很遠(yuǎn),實(shí)現(xiàn)商業(yè)化落地,更是難上加難。 目前來(lái)看,國(guó)內(nèi)大中小廠扎堆大模型的現(xiàn)象已經(jīng)是屢見不鮮,對(duì)于參賽的玩家而言,大模型的能力雖是比拼的重點(diǎn),但具體的場(chǎng)景和落地應(yīng)用同樣關(guān)鍵。而最終誰(shuí)能在這場(chǎng)“大模型混戰(zhàn)”中存活下來(lái),并拔得頭籌,也還需要時(shí)間來(lái)檢驗(yàn)。不過(guò),可以肯定的是,知乎、小紅書、快手想要從中突圍,還有很長(zhǎng)的路要走。 |
|