【原】同樣是做大模型的科技公司，為啥差距這么大呢？

阿明觀察 2023-05-12 發(fā)布于四川

展開全文

2022年OpenAI虧了30多億元，

站在風(fēng)口上，誰的壓力會小呢？

【科技明說｜每日看點】站在風(fēng)口上。OpenAI公司在2022年虧得十分“燦爛”，和往年同比幾乎翻了一倍，虧損約達(dá)5.4億美元，折合人民幣約31億元。

就算是這樣翻倍地虧損，OpenAI也沒有商湯科技SenseTime表現(xiàn)強(qiáng)烈，商湯科技財報顯示2022年虧損約61億元左右。

比燒錢速度，更要比創(chuàng)新速度

如果非得再對比一下年營收，商湯科技可謂贏得太漂亮了，OpenAI的2022年營收才多少錢？商湯科技2022年營收高達(dá)38億元，令OpenAI的老板們羨慕嫉妒恨了么？OpenAI雖然估值接近300億美元，約超2000億元人民幣，但2022年營收卻少得可憐，約3600萬美元，約合人民幣2.5億元，2023年預(yù)估能到2億美元，也就是約合人民幣不到14億元。

然而，虧了30多億元的OpenAI，引領(lǐng)著全球ChatGPT的AI大潮；虧了61億元的商湯科技，帶來了大家意想不到的“商量 SenseChat、秒畫 SenseMirage、如影 SenseAvatar、瓊宇 SenseSpace、格物 SenseThings，以及日日新SenseNova。

其名字確實非常亮眼，達(dá)到行業(yè)國際水平的同時，有一種趕超OpenAI，將ChatGPT踩在腳下磨擦的氣勢。但能否引領(lǐng)全球AI趨勢卻是一個大問題，不過，有著這樣豐富的大模型產(chǎn)品方向，我想商湯科技至少在中國應(yīng)是AI行業(yè)領(lǐng)先水平了吧？

業(yè)內(nèi)傳說商湯科技擁有有2.7萬張AI專用GPU。目前7000張GPU對外服務(wù)8家大型客戶，實現(xiàn)算力Infrastructure as a Service。其自然語言大模型Sense Chat已經(jīng)可以實現(xiàn)基本的語言交互、寫故事、法律專業(yè)領(lǐng)域的文本分析、代碼編程、醫(yī)療問診。當(dāng)然商湯科技不能算是一個公有云廠商，但已經(jīng)在著手提供類似云服務(wù)的算力與GPT輸出了。

我不禁想問一下：同樣是做大模型AI領(lǐng)域的科技公司，為啥差距這么大呢？

我只能這么說，大型人工智能(AI)語言模型是一項昂貴的業(yè)務(wù)，但貴有貴的道理，花了高價錢可以看到真正的技術(shù)引領(lǐng)，真金白銀換創(chuàng)新也是值得的。

然而更悲催的是，業(yè)界傳言說OpenAI雖然牛氣沖天，實際上是靠挖了一些谷歌、蘋果等科技公司AI領(lǐng)域的高手過來做ChatGPT。挖人成本高，所以虧損大。這個邏輯我感覺不對，靠挖人可以做到世界第一，我覺得是非常成功的了。就算虧得一塌糊涂也是可以看到未來的，畢竟微軟也不斷在給OpenAI輸血，據(jù)說累計投資OpenAI已經(jīng)高達(dá)130億美元了，這個投資節(jié)奏可能不會變化，還會繼續(xù)高投入，搶未來。

即便OpenAI燒錢速度快，但其GPT迭代速度也是驚人的，在GPT-4出來后不久，就已經(jīng)開啟了開源戰(zhàn)略?？梢韵胂笠幌?，未來的AI世界除了OpenAI，還會有誰呢？有誰還可以如OpenAI這樣吸金，這樣燒錢，這樣高速創(chuàng)新GPT呢？

你覺得還會有誰，請空了告訴我一下。謝謝。

字節(jié)跳動悄然在GPT上“練舞”

不過我們再看看另外一個科技公司：字節(jié)跳動ByteDance有啥GPT“動作”。

業(yè)內(nèi)也盛傳字節(jié)跳動在大模型上也在低調(diào)潛行，并且在2022年底專門組建了一個針對GPT模型研究的團(tuán)隊，主要研究人員也是來自字節(jié)跳動的搜索業(yè)務(wù)部門、AI Lab和AML(應(yīng)用機(jī)器學(xué)習(xí))等團(tuán)隊成員。在多模態(tài)場景下，字節(jié)跳動在視頻、圖片、語音等數(shù)據(jù)比較豐富，訓(xùn)練起來還是非常有基礎(chǔ)。基于技術(shù)研究的成熟度，字節(jié)跳動對外透露的消息稱，前期主要針對在語言和圖像兩種模態(tài)發(fā)力，后期針對視頻方面的研究也將是一個重要的目標(biāo)。

只是，字節(jié)跳動還有一條重要的發(fā)展路線就是火山引擎。2023年4月18日，火山引擎正式推出自研DPU等系列云產(chǎn)品，并推出新版機(jī)器學(xué)習(xí)平臺：支持萬卡級大模型訓(xùn)練、微秒級延遲網(wǎng)絡(luò)，彈性計算可節(jié)省70%算力成本。有著更豐富與更強(qiáng)大性能的自研DPU的GPU實例，對于后期在GPT領(lǐng)域的自研與探索將帶來很好的基礎(chǔ)支持，當(dāng)然火山引擎云也是字節(jié)跳動對外輸出AI能力的重要途徑之一。

業(yè)內(nèi)朋友評論說到，要做大模型，必須“背靠大數(shù)”（也是大樹）才可以。比如OpenAI背后的微軟，可以百億美元地投入眼睛都不眨一下。字節(jié)跳動不僅有海量數(shù)據(jù)的“大數(shù)”，也有龐大的技術(shù)團(tuán)隊“大樹”。

沒有對比就沒有鑒別。就此來看看，字節(jié)跳動的發(fā)展非常迅速，在2022年，字節(jié)跳動躋身“年營收5000億元俱樂部”，開始看齊三巨頭，京東、阿里巴巴和騰訊。

5000億元年營收，意味著什么呢？

縱觀2022年全年，年營收5000億元俱樂部的中國科技公司主要有，京東、阿里巴巴、騰訊和字節(jié)跳動。

京東集團(tuán)2022年全年凈收入10462億元人民幣(約1517億美元)，同比增長9.9%。歸屬于普通股股東的凈利潤為104億元，2021年為134億元，同比下降22%。

阿里巴巴2022年自然年營收為8645.39億元，因為財年與自然年出入比較大，這里僅作營收的自然年統(tǒng)計。對于凈利潤而言，業(yè)內(nèi)有數(shù)字在說息稅折舊及攤銷前利潤 (EBITDA)約為227億美元，但這個數(shù)字未得到正確途徑證實。

騰訊控股2022年營收5545.5億元(約796億美元)，同比下滑1%；歸屬于普通股股東全年凈利潤1882.4億元，同比下滑16%，

字節(jié)跳動2022年收入超800億美元，折合人民幣超5000億元。這比2021年的約600億美元增長了30%以上。由此字節(jié)跳動也正式入圍“年營收5000億元俱樂部”。同時業(yè)內(nèi)有傳言說，2022年字節(jié)跳動息稅折舊及攤銷前利潤 (EBITDA)約為250億美元(1718億元)，同比增長79%。如果這個數(shù)據(jù)是真實的話，對比阿里巴巴、京東、騰訊而言，在凈利潤表現(xiàn)上字節(jié)跳動穩(wěn)贏了。

據(jù)業(yè)內(nèi)分析，字節(jié)跳動的收入增長貢獻(xiàn)最大的來源于在中國大陸的核心廣告業(yè)務(wù)，2022這部分業(yè)務(wù)帶來的收入與2021年同比增長了2.5倍，達(dá)到100億美元左右。

除此之外，BAT中的百度2022年實現(xiàn)營收1236.75億元，歸屬百度的凈利潤（非美國通用會計準(zhǔn)則）206.8億元，同比增長10%。假如只是從年營收來看，百度距離京東、阿里巴巴、騰訊和字節(jié)跳動的距離還不小。

當(dāng)然，5000元年營收，意味著進(jìn)入這個階段的科技企業(yè)擁有更為全面的市場競爭力與影響力，大者恒大的效應(yīng)也將放大。

假如這個分析正確的話，那么小者會不會恒小呢？還是說小者求大？

對于大模型的研究投入，前衛(wèi)的OpenAI虧得嚇人，火力全開的商湯科技虧得也厲害。相對而言，字節(jié)跳動植根自己的數(shù)據(jù)基礎(chǔ)與研發(fā)隊伍，一步一步地嘗試，身體力行，從大模型軟件與DPU、GPU云產(chǎn)品雙管齊下，積極進(jìn)取不冒進(jìn)的這個思路值得一看。

公有云廠商的ChatGPT之變

大模型如此這般火熱，也引發(fā)了業(yè)界正在熱議的另外一個話題：ChatGPT發(fā)展大放異彩，公有云格局會不會大變？

首先得明確，AI風(fēng)暴來襲，云與ChatGPT到底啥關(guān)系？

在看到公有云廠商紛紛開始大模型發(fā)布，開始GPT的融入之時，我是在想AI風(fēng)暴來襲，在擔(dān)心AI帶給人類危險的同時，更想知道公有云與ChatGPT到底關(guān)系如何？

業(yè)內(nèi)有朋友說，公有云可能會吃掉ChatGPT，要不然就是ChatGPT會吃掉公有云。

也有業(yè)內(nèi)朋友指出，這最終云廠商賣的還是算力，核心還是GPU。

這么說還是商湯最牛了，業(yè)內(nèi)朋友傳說商湯科技至少手里握了上萬張英偉達(dá)的卡。有卡的不一定牛逼，可能是最大的韭菜。會賣韭菜也是能力，就看商湯科技的AI創(chuàng)新能力到底如何了。還有賣給誰很重要，像我這樣的人，肯定不喜歡吃韭菜。但不少人還是喜歡韭菜盒子，韭菜雞蛋餃子。羅卜白菜各有所愛，就看誰喜歡了吧？

但在算力上疊加GPT和模型，價值還是可以挖，只是我感覺很難。云廠商做通用GPT，搭上行業(yè)模型，還是有機(jī)會。只是比較難做，因為做行業(yè)模型就必須另外找團(tuán)隊，需要投資更多錢，現(xiàn)在云廠商盈利都難，這個事情很矛盾。

如果這個事情可以做通，再擴(kuò)展一下，專門提供有行業(yè)屬性GPT+行業(yè)模型的行業(yè)云打包賣。

現(xiàn)在，在ChatGPT與公有云結(jié)合上，公有云廠商怎么接招？拆招？

看看亞馬遜云科技AWS是這樣做的，宣布Amazon EC2 Trn1n 和 Amazon EC2 Inf2實例正式可用：最具成本效益的生成式AI云基礎(chǔ)設(shè)施，與此同時AWS亞馬遜云科技順應(yīng)潮流也推出了自己的大模型，Amazon Titan基礎(chǔ)模型目前包括了兩個全新的大語言模型。

騰訊云給出的實測結(jié)果顯示，新一代集群算力性能較前代提升3倍。而在2022年10月，騰訊完成首個萬億參數(shù)的AI大模型——混元NLP大模型訓(xùn)練。在同等數(shù)據(jù)集下，將訓(xùn)練時間由50天縮短到11天。如果基于新一代集群，訓(xùn)練時間將進(jìn)一步縮短至4天。目前針對新一代HCC高性能計算集群，用戶需要通過騰訊云的官方通道申請參與內(nèi)測，什么時候公開GA值得關(guān)注一下。

百度算是國內(nèi)發(fā)布大模型很早的科技公司了，文言一心并沒有為百度帶來意想不到的收獲，相反，更多的是邁向ChatGPT領(lǐng)域的教訓(xùn)與經(jīng)驗。當(dāng)然，至少對百度的中文搜索引擎帶來更貼身用戶的搜索結(jié)果，不過，很遺憾的是不少像我這樣的百度用戶卻對搜索結(jié)果中包含眾多軟性廣告感到十分麻煩。

雖然華為的大模型并沒有像百度的文言一心那樣高調(diào)發(fā)布，但華為大模型發(fā)布比百度還要早，2021年就公開了，從時間上來看華為領(lǐng)先了許多。盤古大模型由NLP大模型、CV大模型、多模態(tài)大模型、科學(xué)計算大模型等多個大模型構(gòu)成，這樣看來華為做事情還是講究專業(yè)，專業(yè)的事情做起來對旁觀者而言就顯得復(fù)雜。

另外，在ChatGPT與公有云結(jié)合路線上，業(yè)界大牛還是微軟莫屬，微軟投巨資支持的OpenAI公司在2023年4月推出了GPT-4，開始真正成就了一個大型多模態(tài)模型，能接受圖像和文本輸入，再輸出正確的文本回復(fù)。實驗表明，GPT-4 在各種專業(yè)測試和學(xué)術(shù)基準(zhǔn)上的表現(xiàn)與人類水平相當(dāng)。例如，它通過了模擬律師考試，且分?jǐn)?shù)在應(yīng)試者的前10%左右；相比之下，GPT-3.5的得分在倒數(shù)10%左右。

在過去的兩年里，OpenAI重建了整個深度學(xué)習(xí)堆棧，并與微軟Azure一起為ChatGPT工作負(fù)載從頭開始設(shè)計了一臺超級計算機(jī)。這臺超級計算機(jī)基于微軟的Azure云基礎(chǔ)設(shè)施，使用了上萬顆Nvidia H100和A100Tensor Core GPU，同時采用了Quantum-2 InfiniBand高速網(wǎng)絡(luò)架構(gòu)。不僅如此，微軟還將ChatGPT的能力全面加持在了全球著名的辦公軟件、搜索引擎bing等產(chǎn)品領(lǐng)域，微軟已經(jīng)走上了全面ChatGPT化。

不過就此分析，在GPT不斷融入公有云的進(jìn)程上，公有云廠商的業(yè)務(wù)本質(zhì)依然不變，還是賣資源。也有人對我問道，ChatGPT不斷融入云上，云服務(wù)會越來越便宜么？我認(rèn)為不會，而是越來越實惠。對于用戶來說，云帶來的只是實惠，而不是便宜。因為只有重度的公有云長期用戶就深有體會，公有云到底是便宜還是昂貴。

正因為如此，業(yè)內(nèi)有朋友一直認(rèn)為，ChatGPT與公有云沒有關(guān)系，一是一二是二，如果1+2可以結(jié)合的話，依然還是等于1+2而不是新的數(shù)字3。

由此分析來看，公有云想方設(shè)法將ChatGPT融入云服務(wù)之中，最終目的還是希望帶動云資源的銷售增長，更進(jìn)一步讓云的用戶成其為云的深度使用者。從這個角度來分析，公有云因ChatGPT而變化并非真正實現(xiàn)迭代的進(jìn)化，加持AI能力并不能代表公有云主流業(yè)務(wù)的本質(zhì)改變。

進(jìn)一步分析來看，對于用戶而言，將會更容易深度綁定在公有云之上，一旦業(yè)務(wù)發(fā)展變化需要下云落地之時，用戶需要付出的代價將會更高。當(dāng)然，對于自身業(yè)務(wù)必須架構(gòu)在公有云之上的用戶而言，這樣“云+GPT”的變化不存在這個方面的下云落地問題，反而更有利于其業(yè)務(wù)加速創(chuàng)新。

此外，對于開發(fā)者，利用AI平臺的便利性確實可以帶來很多幫助，節(jié)省開發(fā)流程的時間。亞馬遜云科技推了CodeWHisperer，這么好的AI編程工具，全開源全免費，可謂程序員的最佳日常伴侶，人見人愛花見花開……如果1000人采用無所謂改變啥，試想1000萬人使用了，將會怎樣？

科學(xué)客觀認(rèn)知GPT發(fā)展之勢

值得一提的是，最近埃森哲(Accenture)的研究指出，在現(xiàn)實世界和數(shù)字世界越來越密不可分的今天，生成式人工智能等技術(shù)的迅速演進(jìn)正在創(chuàng)造更為廣闊的全新商業(yè)未來。隨著ChatGPT的快速興起，生成式人工智能展現(xiàn)了其顯著增強(qiáng)人類能力的本領(lǐng)，成為了全球焦點。

據(jù)埃森哲測算，在各行業(yè)，有四成的工作時間可由基于語言的人工智能技術(shù)提供支持或得到增值。全球的受訪企業(yè)高管幾乎一致(98%)認(rèn)為，未來三至五年內(nèi)，人工智能基礎(chǔ)模型會對企業(yè)組織戰(zhàn)略產(chǎn)生極為關(guān)鍵的影響。

同時，埃森哲《技術(shù)展望2023》揭示了四大趨勢，幫助企業(yè)開啟數(shù)實融合的新發(fā)展歷程，即：通用智能、數(shù)字身份、數(shù)據(jù)透明和前沿探索。其中針對通用智能，無論是擔(dān)任個人助手、創(chuàng)意搭檔或者專業(yè)顧問，生成式人工智能將不斷提升人類能力。幾乎所有受訪高管都認(rèn)為，這類工具可以激發(fā)出巨大的創(chuàng)造力和創(chuàng)新力（比例達(dá)98%），開啟企業(yè)級智能的新時代（95%）。

由這個研究可以看到，ChatGPT雖然不能徹底革新公有云的主流業(yè)務(wù)，但改善改進(jìn)增加云服務(wù)的本身的價值還是很值得發(fā)展。

在Gartner的一份報告《2023 Gartner Emerging Technologies and Trends Impact Radar》新興技術(shù)及趨勢影響雷達(dá)中提到26項最具影響力的新興技術(shù)和趨勢可以看到，邊緣AI、基礎(chǔ)模型Foundation Models、Model Compression的發(fā)展將會更為迅猛，特別是模型壓縮(model compression)可以將大模型壓縮成小模型，壓縮后的小模型也能得到和大模型接近的性能，這對于ChatGPT進(jìn)入垂直行業(yè)領(lǐng)域帶來更大可能。

然后，我還在哈工大自然語言處理研究所（HIT-NLP）出品的《ChatGPT調(diào)研報告》，是現(xiàn)在為止我看到的對ChatGPT比較全面分析了。其中分析指出，從自然語言處理技術(shù)發(fā)展階段的角度看，可以發(fā)現(xiàn)一個有趣的現(xiàn)象，即每一個技術(shù)階段的發(fā)展時間，大概是上一個階段的一半。小規(guī)模專家知識發(fā)展了40年，淺層機(jī)器學(xué)習(xí)是20年，之后深度學(xué)習(xí)大概10年，預(yù)訓(xùn)練語言模型發(fā)展的時間是5年，那么以ChatGPT為代表的技術(shù)能持續(xù)多久呢?如果大膽預(yù)測，可能是2到3年，也就是到2025年大概又要更新?lián)Q代了。

經(jīng)過近70年的發(fā)展，自然語言處理技術(shù)先后經(jīng)歷了五次范式的變遷，隨著ChatGPT的產(chǎn)生，人們也看到了實現(xiàn)通用人工智能(AGI)的曙光。在這個過程中，自然語言處理技術(shù)呈現(xiàn)了明顯的“同質(zhì)化”和“規(guī)?；钡陌l(fā)展趨勢，使用參數(shù)量越來越大的模型，從越來越多的文本數(shù)據(jù)中進(jìn)行學(xué)習(xí)。同時分析指出，自然語言處理未來需要融入更多的多模態(tài)信息。此外，還需要智能體能夠同物理世界以及人類社會進(jìn)行交互，這樣才能真正理解現(xiàn)世界中的各種概念，從而實現(xiàn)真正的通用人工智能。

對于哈工大自然語言處理研究所（HIT-NLP）出品的《ChatGPT調(diào)研報告》有興趣的朋友，可以私信留言加阿明好友，阿明可以看情況私下分享業(yè)內(nèi)學(xué)習(xí)參考。

不過，現(xiàn)在在AI與大模型領(lǐng)域逐漸呈現(xiàn)出百花齊放的態(tài)勢。來自新浪數(shù)科COO于冬琪的幾段觀點在朋友圈傳播，他個人最喜歡這么幾個項目：如改善盲人讀屏效率和為盲人用戶讀出圖片上信息。幫助農(nóng)民找到地里的冬蟲夏草，提高挖掘效率。AI診斷皮膚問題。AI幫律師們快速整理法條、給出建議。幫助刑警們基于目擊者描述，繪制出嫌疑人畫像。幫助醫(yī)生們，把語音自動錄入成病例。

他沒想到的是，現(xiàn)在有很多團(tuán)隊有自研的技術(shù)和論文。甚至于有人做出來了可部署在個人電腦上、基于本地數(shù)據(jù)的丐版大模型。

綜合來看，AI風(fēng)暴來襲，公有云與ChatGPT關(guān)系越來越親密，也越來越復(fù)雜。到底該如何去發(fā)展，不管是微軟還是亞馬遜還是阿里云還是其他公有云廠商，都在摸著石頭過河，就看誰更會探索，更會迅速了吧。

未雨綢繆，如何看AI威脅論？

再進(jìn)一步看看針對AI的法律監(jiān)管領(lǐng)域。不少國家開始出臺法律法規(guī)監(jiān)管AI，隨著GPT發(fā)展越來越快，相關(guān)監(jiān)管規(guī)定也將加速出臺。

當(dāng)然，從通用大模型走向行業(yè)大模型，行業(yè)數(shù)據(jù)安全監(jiān)管也是需要重視。

對此，我們又不得不再討論一下AI的人類威脅論。

至少當(dāng)前要思考對AI能力邊界做一些框架限定，并有利于社會進(jìn)步與人類社會的發(fā)展。據(jù)外媒消息說，馬斯克(Elon Musk)、蘋果聯(lián)合創(chuàng)始人沃茲尼亞克(Steve Wozniak)等1000多名科技研究人員和高管呼吁“暫?！監(jiān)penAI的GPT等先進(jìn)人工智能系統(tǒng)的訓(xùn)練6個月，用來開發(fā)和實施一套協(xié)議，使這些強(qiáng)大的人工智能系統(tǒng)更加準(zhǔn)確、透明和值得信賴。

可能，這又是一次人類的覺醒，幸好馬斯克們在AI道路上沒有完全癡迷不悟！然后，也有非營利活動組織Future of Life Institute發(fā)表了一封公開信，在發(fā)表后幾小時，已有來自學(xué)術(shù)界和科技行業(yè)的1100多人簽名。所有簽名的人都十分擔(dān)心，AI系統(tǒng)的智能可以與人類相媲美，可能對社會和人類構(gòu)成嚴(yán)重威脅。

全球存儲觀察的阿明對此表示，“百年后，我們的子孫后代看到現(xiàn)在我們，他們會怎樣想現(xiàn)在的AI瘋狂？”

另有業(yè)內(nèi)人士分析指出，國內(nèi)現(xiàn)在還不用太擔(dān)心這個方面的問題，因為像國內(nèi)頂級“ChatGPT”啥時候和GPT-4一樣聰明了再說吧。

- END-

你

怎

么

看

？

歡迎文末評論補(bǔ)充！

【全球存儲觀察｜全球云觀察｜阿明觀察｜科技明說】專注科技公司分析，用數(shù)據(jù)說話，帶你看懂科技。本文和作者回復(fù)僅代表個人觀點，不構(gòu)成任何投資建議。

贊賞

共11人贊賞

小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

【原】同樣是做大模型的科技公司，為啥差距這么大呢？

【原】同樣是做大模型的科技公司，為啥差距這么大呢？