小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

大模型“618大促”,硝煙下的真相

 TechForWhat 2024-05-24 發(fā)布于河北

作者 | 萬泉河

編輯 | 阿文

看得見的硝煙

AI少閑月,五月人倍忙。

5月的AI行業(yè)格外熱鬧。國外,OpenAI、谷歌、微軟相繼發(fā)布了AI在多模態(tài)和端側(cè)應(yīng)用的新產(chǎn)品GPT-4o、Astra和AI PC ,賺足看客眼球的同時,競爭的硝煙也在彌漫。

而國內(nèi),大模型廠商的競爭則更直接和露骨,他們沒有征兆地開啟了價格戰(zhàn)。沒有鋪墊和試探,降價幅度堪比蹦極,仿佛置身“618大促”直播間,賣貨主播聲嘶力竭地喊:“幫家人們把大模型價格打下來!”。

很多人認(rèn)為價格戰(zhàn)的導(dǎo)火索是字節(jié)的豆包大模型降價,其實并不準(zhǔn)確。真正打響第一槍的是幻方旗下的大模型公司DeepSeek,它于5月6日開源了DeepSeek-V2,并將輸入價格定為1元/百萬tokens,僅為GPT-4-Turbo價格的近百分之一。

隨后智譜AI入局,宣布個人版GLM-3Turbo模型產(chǎn)品的調(diào)用價格下調(diào)80%,輸入價格也定為1元/百萬tokens。

接下來,云廠商的加入把戰(zhàn)斗推向高潮,這下整個“晉西北”正式亂成一鍋粥了。

5月15日,字節(jié)宣布豆包主力模型Doubao-pro-32k輸入價格定價0.8元/百萬tokens;5月21日,阿里云宣布旗下九款通義大模型全降價,其中對標(biāo)GPT-4的主力模型Qwen-Long價格直降97%,來到了0.5元/百萬tokens。

阿里云這邊剛起鍋燒水,百度過來就把爐子拆了。通義宣布降價僅幾小時后,百度可能懶得算那幾塊幾毛的賬了,直接把兩款文心輕量級模型ERNIE Speed和ERNIE Lite免費了。

百度把調(diào)子起高了,后邊上臺的選手也只能硬著頭皮唱。5月22日,科大訊飛宣布訊飛星火Lite API調(diào)用免費;“跟跑大師”騰訊云隨即也宣布旗下混元模型混元-lite免費、混元-standard-256k輸入價格下調(diào)87.5%,降至15元/百萬tokens。

透過現(xiàn)象看本質(zhì),國內(nèi)外的動作雖不相同,但都隱隱指明了當(dāng)下大模型廠商的發(fā)力方向——大模型應(yīng)用的落地。

降價空間從何而來?

阿里云智能集團(tuán)資深副總裁劉偉光明確指出,大幅降低大模型推理價格的目的,在于加速AI應(yīng)用的爆發(fā)。

從行業(yè)角度看的確如此,但降價幅度如此之大、且降價的均是API調(diào)用費而不是訂閱費等特點來看,本次價格戰(zhàn)廠商們爭奪的目標(biāo)就是B端客戶和開發(fā)者,一方面。通過降價甚至免費的方式增加自家大模型調(diào)用量,是一種推銷、引流手段。

另外,更多客戶使用大模型各自場景里做數(shù)據(jù)、做微調(diào)來優(yōu)化模型,也能促進(jìn)更多AI應(yīng)用的誕生,進(jìn)而與大模型更深層次綁定。

另一方面,大模型能如此大幅度的降價,其推理成本肯定通過某種方式實現(xiàn)了降低,推理成本的下降得益于模型優(yōu)化技術(shù)的快速迭代。

阿里云表示,通過構(gòu)建彈性的AI算力調(diào)度系統(tǒng)并結(jié)合百煉分布式推理加速引擎,阿里云優(yōu)化了大規(guī)模推理集群,大幅壓縮了模型推理成本并加快推理速度。

火山引擎總裁譚待在豆包大模型發(fā)布后表示,字節(jié)通過優(yōu)化模型結(jié)構(gòu)、將單機(jī)推理改為分布式推理、混合調(diào)度云計算算力等方式優(yōu)化了成本。

DeepSeek 相關(guān)負(fù)責(zé)人此前表示,DeepSeek-V2通過MoE模型架構(gòu)實現(xiàn)了模型結(jié)構(gòu)創(chuàng)新,成本降低的同時,功能也更加強(qiáng)大。

本次價格戰(zhàn),真正把戰(zhàn)火擴(kuò)大的是云廠商。云廠商具備算力集中和規(guī)模效應(yīng)優(yōu)勢,大模型落地是工程化實踐,工程化做得越好,大模型成本也就降得越低。

最后還有一點原因不得不提,宣布超低價、免費的很多都是輕量級模型。比如百度宣布免費的ERNIE Speed和ERNIE Lite,是兩款輕量級模型,支持8k和128k上下文長度。

雖有誠意不大的嫌疑,但大部分用戶的場景可能也不需要太大的參數(shù)。就像只玩掃雷,就沒必要給電腦配個4090顯卡。輕量級模型也許剛好能滿足使用場景,價格還更低,“效價比”拉滿。

不過從這里也能看出很多廠商既要流量,又要賺錢的心思。先用低價產(chǎn)品“請君入甕”,培養(yǎng)用戶粘性。后續(xù)就可以用各種方式刺激用戶使用高性能模型了,這些模型可并不便宜。就像網(wǎng)盤和下載工具,免費體驗付費才有的高速下載,久而久之有的用戶自然就忍不了免費但很慢的下載速度了。

嘗鮮大模型,或許有“坑”

這次的大模型的降價真正的誠意有多少呢?會不會像一些游戲廣告,宣傳“注冊送手機(jī)”,結(jié)果想要領(lǐng)取需要達(dá)成海量前置條件呢?

拿豆包大模型來看,其通用模型pro-32k版推理輸入價格為0.8元/百萬tokens,宣稱比行業(yè)低99.3%。乍一看很便宜,但這是輸入價格,其輸出價格為2元/百萬tokens,加權(quán)平均輸入輸出后,綜合收費為1元/百萬tokens。很多大模型和豆包一樣,降價公告著重宣傳輸入價格的低廉,而對輸出價格和綜合費用等閉口不談。

豆包的價格規(guī)則最離譜的地方是其限制RPM為60,意思是只有每分鐘60個請求的話,才是這個價格??稍谡鎸嵉臉I(yè)務(wù)場景中,如果用戶想高頻次調(diào)用模型,那抱歉,沒有這個優(yōu)惠了。

另外,如前所述,很多參與降價的輕量級模型,等于是給了用戶一個“閹割版”大模型,無論從參數(shù)、生成速度,還是功能上肯定都是大打折扣的。當(dāng)期無法滿足用戶需求時,用戶可能會選擇價格更昂貴的同廠商的高性能大模型。

雖說這些都是正常的商業(yè)宣傳行為,但勢必會對很多沒加入價格戰(zhàn)的創(chuàng)業(yè)公司帶來巨大打擊。不同于云廠商大模型的背靠大樹好乘涼,很多創(chuàng)業(yè)公司承受不住如此大的降價。

所以本次價格戰(zhàn)并沒有卷入太多創(chuàng)業(yè)公司,也有人對價格戰(zhàn)的行為表示不理解?!拔矣X得大模型公司不會這么不理智,因為技術(shù)是最重要的,如果技術(shù)不行,純粹靠貼錢方式去做生意,我們絕對不會跟這樣的定價做對標(biāo)。如果以后中國就這么卷,大家寧可賠光通輸都不讓你贏,那么我們就走海外市場?!绷阋蝗f物創(chuàng)始人李開復(fù)如是說。

這次的價格戰(zhàn)本質(zhì)上還是在技術(shù)遇到瓶頸、產(chǎn)品同質(zhì)化嚴(yán)重的大環(huán)境下,大模型廠商寧愿燒錢也要打淘汰賽,今年注定會再次上演大模型行業(yè)新一輪淘汰賽。

正如云計算市場的競爭,大模型的價格戰(zhàn)一經(jīng)開打就很難回頭,這種非良性的競爭狀態(tài)或許會長期持續(xù)。

硝煙散去,滿地狼藉,可能剩者為王,也可能全盤皆輸。

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多