【原】大模型“618大促”，硝煙下的真相

TechForWhat 2024-05-24 發(fā)布于河北

展開全文

作者 | 萬泉河

編輯 | 阿文

看得見的硝煙

AI少閑月，五月人倍忙。

5月的AI行業(yè)格外熱鬧。國外，OpenAI、谷歌、微軟相繼發(fā)布了AI在多模態(tài)和端側(cè)應(yīng)用的新產(chǎn)品GPT-4o、Astra和AI PC ，賺足看客眼球的同時，競爭的硝煙也在彌漫。

而國內(nèi)，大模型廠商的競爭則更直接和露骨，他們沒有征兆地開啟了價格戰(zhàn)。沒有鋪墊和試探，降價幅度堪比蹦極，仿佛置身“618大促”直播間，賣貨主播聲嘶力竭地喊：“幫家人們把大模型價格打下來！”。

很多人認(rèn)為價格戰(zhàn)的導(dǎo)火索是字節(jié)的豆包大模型降價，其實并不準(zhǔn)確。真正打響第一槍的是幻方旗下的大模型公司DeepSeek，它于5月6日開源了DeepSeek-V2，并將輸入價格定為1元/百萬tokens，僅為GPT-4-Turbo價格的近百分之一。

隨后智譜AI入局，宣布個人版GLM-3Turbo模型產(chǎn)品的調(diào)用價格下調(diào)80%，輸入價格也定為1元/百萬tokens。

接下來，云廠商的加入把戰(zhàn)斗推向高潮，這下整個“晉西北”正式亂成一鍋粥了。

5月15日，字節(jié)宣布豆包主力模型Doubao-pro-32k輸入價格定價0.8元/百萬tokens；5月21日，阿里云宣布旗下九款通義大模型全降價，其中對標(biāo)GPT-4的主力模型Qwen-Long價格直降97%，來到了0.5元/百萬tokens。

阿里云這邊剛起鍋燒水，百度過來就把爐子拆了。通義宣布降價僅幾小時后，百度可能懶得算那幾塊幾毛的賬了，直接把兩款文心輕量級模型ERNIE Speed和ERNIE Lite免費了。

百度把調(diào)子起高了，后邊上臺的選手也只能硬著頭皮唱。5月22日，科大訊飛宣布訊飛星火Lite API調(diào)用免費；“跟跑大師”騰訊云隨即也宣布旗下混元模型混元-lite免費、混元-standard-256k輸入價格下調(diào)87.5%，降至15元/百萬tokens。

透過現(xiàn)象看本質(zhì)，國內(nèi)外的動作雖不相同，但都隱隱指明了當(dāng)下大模型廠商的發(fā)力方向——大模型應(yīng)用的落地。

降價空間從何而來？

阿里云智能集團(tuán)資深副總裁劉偉光明確指出，大幅降低大模型推理價格的目的，在于加速AI應(yīng)用的爆發(fā)。

從行業(yè)角度看的確如此，但降價幅度如此之大、且降價的均是API調(diào)用費而不是訂閱費等特點來看，本次價格戰(zhàn)廠商們爭奪的目標(biāo)就是B端客戶和開發(fā)者，一方面。通過降價甚至免費的方式增加自家大模型調(diào)用量，是一種推銷、引流手段。

另外，更多客戶使用大模型各自場景里做數(shù)據(jù)、做微調(diào)來優(yōu)化模型，也能促進(jìn)更多AI應(yīng)用的誕生，進(jìn)而與大模型更深層次綁定。

另一方面，大模型能如此大幅度的降價，其推理成本肯定通過某種方式實現(xiàn)了降低，推理成本的下降得益于模型優(yōu)化技術(shù)的快速迭代。

阿里云表示，通過構(gòu)建彈性的AI算力調(diào)度系統(tǒng)并結(jié)合百煉分布式推理加速引擎，阿里云優(yōu)化了大規(guī)模推理集群，大幅壓縮了模型推理成本并加快推理速度。

火山引擎總裁譚待在豆包大模型發(fā)布后表示，字節(jié)通過優(yōu)化模型結(jié)構(gòu)、將單機(jī)推理改為分布式推理、混合調(diào)度云計算算力等方式優(yōu)化了成本。

DeepSeek 相關(guān)負(fù)責(zé)人此前表示，DeepSeek-V2通過MoE模型架構(gòu)實現(xiàn)了模型結(jié)構(gòu)創(chuàng)新，成本降低的同時，功能也更加強(qiáng)大。

本次價格戰(zhàn)，真正把戰(zhàn)火擴(kuò)大的是云廠商。云廠商具備算力集中和規(guī)模效應(yīng)優(yōu)勢，大模型落地是工程化實踐，工程化做得越好，大模型成本也就降得越低。

最后還有一點原因不得不提，宣布超低價、免費的很多都是輕量級模型。比如百度宣布免費的ERNIE Speed和ERNIE Lite，是兩款輕量級模型，支持8k和128k上下文長度。

雖有誠意不大的嫌疑，但大部分用戶的場景可能也不需要太大的參數(shù)。就像只玩掃雷，就沒必要給電腦配個4090顯卡。輕量級模型也許剛好能滿足使用場景，價格還更低，“效價比”拉滿。

不過從這里也能看出很多廠商既要流量，又要賺錢的心思。先用低價產(chǎn)品“請君入甕”，培養(yǎng)用戶粘性。后續(xù)就可以用各種方式刺激用戶使用高性能模型了，這些模型可并不便宜。就像網(wǎng)盤和下載工具，免費體驗付費才有的高速下載，久而久之有的用戶自然就忍不了免費但很慢的下載速度了。

嘗鮮大模型，或許有“坑”

這次的大模型的降價真正的誠意有多少呢？會不會像一些游戲廣告，宣傳“注冊送手機(jī)”，結(jié)果想要領(lǐng)取需要達(dá)成海量前置條件呢？

拿豆包大模型來看，其通用模型pro-32k版推理輸入價格為0.8元/百萬tokens,宣稱比行業(yè)低99.3%。乍一看很便宜，但這是輸入價格，其輸出價格為2元/百萬tokens，加權(quán)平均輸入輸出后，綜合收費為1元/百萬tokens。很多大模型和豆包一樣，降價公告著重宣傳輸入價格的低廉，而對輸出價格和綜合費用等閉口不談。

豆包的價格規(guī)則最離譜的地方是其限制RPM為60，意思是只有每分鐘60個請求的話，才是這個價格?？稍谡鎸嵉臉I(yè)務(wù)場景中，如果用戶想高頻次調(diào)用模型，那抱歉，沒有這個優(yōu)惠了。

另外，如前所述，很多參與降價的輕量級模型，等于是給了用戶一個“閹割版”大模型，無論從參數(shù)、生成速度，還是功能上肯定都是大打折扣的。當(dāng)期無法滿足用戶需求時，用戶可能會選擇價格更昂貴的同廠商的高性能大模型。

雖說這些都是正常的商業(yè)宣傳行為，但勢必會對很多沒加入價格戰(zhàn)的創(chuàng)業(yè)公司帶來巨大打擊。不同于云廠商大模型的背靠大樹好乘涼，很多創(chuàng)業(yè)公司承受不住如此大的降價。

所以本次價格戰(zhàn)并沒有卷入太多創(chuàng)業(yè)公司，也有人對價格戰(zhàn)的行為表示不理解?！拔矣X得大模型公司不會這么不理智，因為技術(shù)是最重要的，如果技術(shù)不行，純粹靠貼錢方式去做生意，我們絕對不會跟這樣的定價做對標(biāo)。如果以后中國就這么卷，大家寧可賠光通輸都不讓你贏，那么我們就走海外市場?！绷阋蝗f物創(chuàng)始人李開復(fù)如是說。

這次的價格戰(zhàn)本質(zhì)上還是在技術(shù)遇到瓶頸、產(chǎn)品同質(zhì)化嚴(yán)重的大環(huán)境下，大模型廠商寧愿燒錢也要打淘汰賽，今年注定會再次上演大模型行業(yè)新一輪淘汰賽。

正如云計算市場的競爭，大模型的價格戰(zhàn)一經(jīng)開打就很難回頭，這種非良性的競爭狀態(tài)或許會長期持續(xù)。

硝煙散去，滿地狼藉，可能剩者為王，也可能全盤皆輸。

贊賞

共11人贊賞

小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

【原】大模型“618大促”，硝煙下的真相

看得見的硝煙

降價空間從何而來？

嘗鮮大模型，或許有“坑”

【原】大模型“618大促”，硝煙下的真相

嘗鮮大模型，或許有“坑”