2022年OpenAI虧了30多億元, 站在風(fēng)口上,誰的壓力會小呢? 【科技明說 | 每日看點】站在風(fēng)口上。OpenAI公司在2022年虧得十分“燦爛”,和往年同比幾乎翻了一倍,虧損約達(dá)5.4億美元,折合人民幣約31億元。 就算是這樣翻倍地虧損,OpenAI也沒有商湯科技SenseTime表現(xiàn)強(qiáng)烈,商湯科技財報顯示2022年虧損約61億元左右。 比燒錢速度,更要比創(chuàng)新速度 如果非得再對比一下年營收,商湯科技可謂贏得太漂亮了,OpenAI的2022年營收才多少錢?商湯科技2022年營收高達(dá)38億元,令OpenAI的老板們羨慕嫉妒恨了么?OpenAI雖然估值接近300億美元,約超2000億元人民幣,但2022年營收卻少得可憐,約3600萬美元,約合人民幣2.5億元,2023年預(yù)估能到2億美元,也就是約合人民幣不到14億元。 然而,虧了30多億元的OpenAI,引領(lǐng)著全球ChatGPT的AI大潮;虧了61億元的商湯科技,帶來了大家意想不到的“商量 SenseChat、秒畫 SenseMirage、如影 SenseAvatar、瓊宇 SenseSpace、格物 SenseThings,以及日日新SenseNova。 其名字確實非常亮眼,達(dá)到行業(yè)國際水平的同時,有一種趕超OpenAI,將ChatGPT踩在腳下磨擦的氣勢。但能否引領(lǐng)全球AI趨勢卻是一個大問題,不過,有著這樣豐富的大模型產(chǎn)品方向,我想商湯科技至少在中國應(yīng)是AI行業(yè)領(lǐng)先水平了吧? 業(yè)內(nèi)傳說商湯科技擁有有2.7萬張AI專用GPU。目前7000張GPU對外服務(wù)8家大型客戶,實現(xiàn)算力Infrastructure as a Service。其自然語言大模型Sense Chat已經(jīng)可以實現(xiàn)基本的語言交互、寫故事、法律專業(yè)領(lǐng)域的文本分析、代碼編程、醫(yī)療問診。當(dāng)然商湯科技不能算是一個公有云廠商,但已經(jīng)在著手提供類似云服務(wù)的算力與GPT輸出了。 我不禁想問一下:同樣是做大模型AI領(lǐng)域的科技公司,為啥差距這么大呢? 我只能這么說,大型人工智能(AI)語言模型是一項昂貴的業(yè)務(wù),但貴有貴的道理,花了高價錢可以看到真正的技術(shù)引領(lǐng),真金白銀換創(chuàng)新也是值得的。 然而更悲催的是,業(yè)界傳言說OpenAI雖然牛氣沖天,實際上是靠挖了一些谷歌、蘋果等科技公司AI領(lǐng)域的高手過來做ChatGPT。挖人成本高,所以虧損大。這個邏輯我感覺不對,靠挖人可以做到世界第一,我覺得是非常成功的了。就算虧得一塌糊涂也是可以看到未來的,畢竟微軟也不斷在給OpenAI輸血,據(jù)說累計投資OpenAI已經(jīng)高達(dá)130億美元了,這個投資節(jié)奏可能不會變化,還會繼續(xù)高投入,搶未來。 即便OpenAI燒錢速度快,但其GPT迭代速度也是驚人的,在GPT-4出來后不久,就已經(jīng)開啟了開源戰(zhàn)略??梢韵胂笠幌?,未來的AI世界除了OpenAI,還會有誰呢?有誰還可以如OpenAI這樣吸金,這樣燒錢,這樣高速創(chuàng)新GPT呢? 你覺得還會有誰,請空了告訴我一下。謝謝。 字節(jié)跳動悄然在GPT上“練舞” 不過我們再看看另外一個科技公司:字節(jié)跳動ByteDance有啥GPT“動作”。 業(yè)內(nèi)也盛傳字節(jié)跳動在大模型上也在低調(diào)潛行,并且在2022年底專門組建了一個針對GPT模型研究的團(tuán)隊,主要研究人員也是來自字節(jié)跳動的搜索業(yè)務(wù)部門、AI Lab和AML(應(yīng)用機(jī)器學(xué)習(xí))等團(tuán)隊成員。在多模態(tài)場景下,字節(jié)跳動在視頻、圖片、語音等數(shù)據(jù)比較豐富,訓(xùn)練起來還是非常有基礎(chǔ)。基于技術(shù)研究的成熟度,字節(jié)跳動對外透露的消息稱,前期主要針對在語言和圖像兩種模態(tài)發(fā)力,后期針對視頻方面的研究也將是一個重要的目標(biāo)。 只是,字節(jié)跳動還有一條重要的發(fā)展路線就是火山引擎。2023年4月18日,火山引擎正式推出自研DPU等系列云產(chǎn)品,并推出新版機(jī)器學(xué)習(xí)平臺:支持萬卡級大模型訓(xùn)練、微秒級延遲網(wǎng)絡(luò),彈性計算可節(jié)省70%算力成本。有著更豐富與更強(qiáng)大性能的自研DPU的GPU實例,對于后期在GPT領(lǐng)域的自研與探索將帶來很好的基礎(chǔ)支持,當(dāng)然火山引擎云也是字節(jié)跳動對外輸出AI能力的重要途徑之一。 業(yè)內(nèi)朋友評論說到,要做大模型,必須“背靠大數(shù)”(也是大樹)才可以。比如OpenAI背后的微軟,可以百億美元地投入眼睛都不眨一下。字節(jié)跳動不僅有海量數(shù)據(jù)的“大數(shù)”,也有龐大的技術(shù)團(tuán)隊“大樹”。 沒有對比就沒有鑒別。就此來看看,字節(jié)跳動的發(fā)展非常迅速,在2022年,字節(jié)跳動躋身“年營收5000億元俱樂部”,開始看齊三巨頭,京東、阿里巴巴和騰訊。 5000億元年營收,意味著什么呢? 縱觀2022年全年,年營收5000億元俱樂部的中國科技公司主要有,京東、阿里巴巴、騰訊和字節(jié)跳動。 京東集團(tuán)2022年全年凈收入10462億元人民幣(約1517億美元),同比增長9.9%。歸屬于普通股股東的凈利潤為104億元,2021年為134億元,同比下降22%。 阿里巴巴2022年自然年營收為8645.39億元,因為財年與自然年出入比較大,這里僅作營收的自然年統(tǒng)計。對于凈利潤而言,業(yè)內(nèi)有數(shù)字在說息稅折舊及攤銷前利潤 (EBITDA)約為227億美元,但這個數(shù)字未得到正確途徑證實。 騰訊控股2022年營收5545.5億元(約796億美元),同比下滑1%;歸屬于普通股股東全年凈利潤1882.4億元,同比下滑16%, 字節(jié)跳動2022年收入超800億美元,折合人民幣超5000億元。這比2021年的約600億美元增長了30%以上。由此字節(jié)跳動也正式入圍“年營收5000億元俱樂部”。同時業(yè)內(nèi)有傳言說,2022年字節(jié)跳動息稅折舊及攤銷前利潤 (EBITDA)約為250億美元(1718億元),同比增長79%。 如果這個數(shù)據(jù)是真實的話,對比阿里巴巴、京東、騰訊而言,在凈利潤表現(xiàn)上字節(jié)跳動穩(wěn)贏了。 據(jù)業(yè)內(nèi)分析,字節(jié)跳動的收入增長貢獻(xiàn)最大的來源于在中國大陸的核心廣告業(yè)務(wù),2022這部分業(yè)務(wù)帶來的收入與2021年同比增長了2.5倍,達(dá)到100億美元左右。 除此之外,BAT中的百度2022年實現(xiàn)營收1236.75億元,歸屬百度的凈利潤(非美國通用會計準(zhǔn)則)206.8億元,同比增長10%。假如只是從年營收來看,百度距離京東、阿里巴巴、騰訊和字節(jié)跳動的距離還不小。 當(dāng)然,5000元年營收,意味著進(jìn)入這個階段的科技企業(yè)擁有更為全面的市場競爭力與影響力,大者恒大的效應(yīng)也將放大。 假如這個分析正確的話,那么小者會不會恒小呢?還是說小者求大? 對于大模型的研究投入,前衛(wèi)的OpenAI虧得嚇人,火力全開的商湯科技虧得也厲害。相對而言,字節(jié)跳動植根自己的數(shù)據(jù)基礎(chǔ)與研發(fā)隊伍,一步一步地嘗試,身體力行,從大模型軟件與DPU、GPU云產(chǎn)品雙管齊下,積極進(jìn)取不冒進(jìn)的這個思路值得一看。 公有云廠商的ChatGPT之變 大模型如此這般火熱,也引發(fā)了業(yè)界正在熱議的另外一個話題:ChatGPT發(fā)展大放異彩,公有云格局會不會大變? 首先得明確,AI風(fēng)暴來襲,云與ChatGPT到底啥關(guān)系? 在看到公有云廠商紛紛開始大模型發(fā)布,開始GPT的融入之時,我是在想AI風(fēng)暴來襲,在擔(dān)心AI帶給人類危險的同時,更想知道公有云與ChatGPT到底關(guān)系如何? 業(yè)內(nèi)有朋友說,公有云可能會吃掉ChatGPT,要不然就是ChatGPT會吃掉公有云。 也有業(yè)內(nèi)朋友指出,這最終云廠商賣的還是算力,核心還是GPU。 這么說還是商湯最牛了,業(yè)內(nèi)朋友傳說商湯科技至少手里握了上萬張英偉達(dá)的卡。有卡的不一定牛逼,可能是最大的韭菜。會賣韭菜也是能力,就看商湯科技的AI創(chuàng)新能力到底如何了。還有賣給誰很重要,像我這樣的人,肯定不喜歡吃韭菜。但不少人還是喜歡韭菜盒子,韭菜雞蛋餃子。羅卜白菜各有所愛,就看誰喜歡了吧? 但在算力上疊加GPT和模型,價值還是可以挖,只是我感覺很難。云廠商做通用GPT,搭上行業(yè)模型,還是有機(jī)會。只是比較難做,因為做行業(yè)模型就必須另外找團(tuán)隊,需要投資更多錢,現(xiàn)在云廠商盈利都難,這個事情很矛盾。 如果這個事情可以做通,再擴(kuò)展一下,專門提供有行業(yè)屬性GPT+行業(yè)模型的行業(yè)云打包賣。 現(xiàn)在,在ChatGPT與公有云結(jié)合上,公有云廠商怎么接招?拆招? 看看亞馬遜云科技AWS是這樣做的,宣布Amazon EC2 Trn1n 和 Amazon EC2 Inf2實例正式可用:最具成本效益的生成式AI云基礎(chǔ)設(shè)施,與此同時AWS亞馬遜云科技順應(yīng)潮流也推出了自己的大模型,Amazon Titan基礎(chǔ)模型目前包括了兩個全新的大語言模型。 騰訊云給出的實測結(jié)果顯示,新一代集群算力性能較前代提升3倍。而在2022年10月,騰訊完成首個萬億參數(shù)的AI大模型——混元NLP大模型訓(xùn)練。在同等數(shù)據(jù)集下,將訓(xùn)練時間由50天縮短到11天。如果基于新一代集群,訓(xùn)練時間將進(jìn)一步縮短至4天。目前針對新一代HCC高性能計算集群,用戶需要通過騰訊云的官方通道申請參與內(nèi)測,什么時候公開GA值得關(guān)注一下。 百度算是國內(nèi)發(fā)布大模型很早的科技公司了,文言一心并沒有為百度帶來意想不到的收獲,相反,更多的是邁向ChatGPT領(lǐng)域的教訓(xùn)與經(jīng)驗。當(dāng)然,至少對百度的中文搜索引擎帶來更貼身用戶的搜索結(jié)果,不過,很遺憾的是不少像我這樣的百度用戶卻對搜索結(jié)果中包含眾多軟性廣告感到十分麻煩。 雖然華為的大模型并沒有像百度的文言一心那樣高調(diào)發(fā)布,但華為大模型發(fā)布比百度還要早,2021年就公開了,從時間上來看華為領(lǐng)先了許多。盤古大模型由NLP大模型、CV大模型、多模態(tài)大模型、科學(xué)計算大模型等多個大模型構(gòu)成,這樣看來華為做事情還是講究專業(yè),專業(yè)的事情做起來對旁觀者而言就顯得復(fù)雜。 另外,在ChatGPT與公有云結(jié)合路線上,業(yè)界大牛還是微軟莫屬,微軟投巨資支持的OpenAI公司在2023年4月推出了GPT-4,開始真正成就了一個大型多模態(tài)模型,能接受圖像和文本輸入,再輸出正確的文本回復(fù)。實驗表明,GPT-4 在各種專業(yè)測試和學(xué)術(shù)基準(zhǔn)上的表現(xiàn)與人類水平相當(dāng)。例如,它通過了模擬律師考試,且分?jǐn)?shù)在應(yīng)試者的前10%左右;相比之下,GPT-3.5的得分在倒數(shù)10%左右。 在過去的兩年里,OpenAI重建了整個深度學(xué)習(xí)堆棧,并與微軟Azure一起為ChatGPT工作負(fù)載從頭開始設(shè)計了一臺超級計算機(jī)。這臺超級計算機(jī)基于微軟的Azure云基礎(chǔ)設(shè)施,使用了上萬顆Nvidia H100和A100Tensor Core GPU,同時采用了Quantum-2 InfiniBand高速網(wǎng)絡(luò)架構(gòu)。不僅如此,微軟還將ChatGPT的能力全面加持在了全球著名的辦公軟件、搜索引擎bing等產(chǎn)品領(lǐng)域,微軟已經(jīng)走上了全面ChatGPT化。 不過就此分析,在GPT不斷融入公有云的進(jìn)程上,公有云廠商的業(yè)務(wù)本質(zhì)依然不變,還是賣資源。也有人對我問道,ChatGPT不斷融入云上,云服務(wù)會越來越便宜么?我認(rèn)為不會,而是越來越實惠。對于用戶來說,云帶來的只是實惠,而不是便宜。因為只有重度的公有云長期用戶就深有體會,公有云到底是便宜還是昂貴。 正因為如此,業(yè)內(nèi)有朋友一直認(rèn)為,ChatGPT與公有云沒有關(guān)系,一是一二是二,如果1+2可以結(jié)合的話,依然還是等于1+2而不是新的數(shù)字3。 由此分析來看,公有云想方設(shè)法將ChatGPT融入云服務(wù)之中,最終目的還是希望帶動云資源的銷售增長,更進(jìn)一步讓云的用戶成其為云的深度使用者。從這個角度來分析,公有云因ChatGPT而變化并非真正實現(xiàn)迭代的進(jìn)化,加持AI能力并不能代表公有云主流業(yè)務(wù)的本質(zhì)改變。 進(jìn)一步分析來看,對于用戶而言,將會更容易深度綁定在公有云之上,一旦業(yè)務(wù)發(fā)展變化需要下云落地之時,用戶需要付出的代價將會更高。當(dāng)然,對于自身業(yè)務(wù)必須架構(gòu)在公有云之上的用戶而言,這樣“云+GPT”的變化不存在這個方面的下云落地問題,反而更有利于其業(yè)務(wù)加速創(chuàng)新。 此外,對于開發(fā)者,利用AI平臺的便利性確實可以帶來很多幫助,節(jié)省開發(fā)流程的時間。亞馬遜云科技推了CodeWHisperer,這么好的AI編程工具,全開源全免費,可謂程序員的最佳日常伴侶,人見人愛花見花開……如果1000人采用無所謂改變啥,試想1000萬人使用了,將會怎樣? 科學(xué)客觀認(rèn)知GPT發(fā)展之勢 值得一提的是,最近埃森哲(Accenture)的研究指出,在現(xiàn)實世界和數(shù)字世界越來越密不可分的今天,生成式人工智能等技術(shù)的迅速演進(jìn)正在創(chuàng)造更為廣闊的全新商業(yè)未來。隨著ChatGPT的快速興起,生成式人工智能展現(xiàn)了其顯著增強(qiáng)人類能力的本領(lǐng),成為了全球焦點。 據(jù)埃森哲測算,在各行業(yè),有四成的工作時間可由基于語言的人工智能技術(shù)提供支持或得到增值。全球的受訪企業(yè)高管幾乎一致(98%)認(rèn)為,未來三至五年內(nèi),人工智能基礎(chǔ)模型會對企業(yè)組織戰(zhàn)略產(chǎn)生極為關(guān)鍵的影響。 同時,埃森哲《技術(shù)展望2023》揭示了四大趨勢,幫助企業(yè)開啟數(shù)實融合的新發(fā)展歷程,即:通用智能、數(shù)字身份、數(shù)據(jù)透明和前沿探索。其中針對通用智能,無論是擔(dān)任個人助手、創(chuàng)意搭檔或者專業(yè)顧問,生成式人工智能將不斷提升人類能力。幾乎所有受訪高管都認(rèn)為,這類工具可以激發(fā)出巨大的創(chuàng)造力和創(chuàng)新力(比例達(dá)98%),開啟企業(yè)級智能的新時代(95%)。 由這個研究可以看到,ChatGPT雖然不能徹底革新公有云的主流業(yè)務(wù),但改善改進(jìn)增加云服務(wù)的本身的價值還是很值得發(fā)展。 在Gartner的一份報告《2023 Gartner Emerging Technologies and Trends Impact Radar》新興技術(shù)及趨勢影響雷達(dá)中提到26項最具影響力的新興技術(shù)和趨勢可以看到,邊緣AI、基礎(chǔ)模型Foundation Models、Model Compression的發(fā)展將會更為迅猛,特別是模型壓縮(model compression)可以將大模型壓縮成小模型,壓縮后的小模型也能得到和大模型接近的性能,這對于ChatGPT進(jìn)入垂直行業(yè)領(lǐng)域帶來更大可能。 然后,我還在哈工大自然語言處理研究所(HIT-NLP)出品的《ChatGPT調(diào)研報告》,是現(xiàn)在為止我看到的對ChatGPT比較全面分析了。其中分析指出,從自然語言處理技術(shù)發(fā)展階段的角度看,可以發(fā)現(xiàn)一個有趣的現(xiàn)象,即每一個技術(shù)階段的發(fā)展時間,大概是上一個階段的一半。小規(guī)模專家知識發(fā)展了40年,淺層機(jī)器學(xué)習(xí)是20年,之后深度學(xué)習(xí)大概10年,預(yù)訓(xùn)練語言模型發(fā)展的時間是5年,那么以ChatGPT為代表的技術(shù)能持續(xù)多久呢?如果大膽預(yù)測,可能是2到3年,也就是到2025年大概又要更新?lián)Q代了。 經(jīng)過近70年的發(fā)展,自然語言處理技術(shù)先后經(jīng)歷了五次范式的變遷,隨著ChatGPT的產(chǎn)生,人們也看到了實現(xiàn)通用人工智能(AGI)的曙光。在這個過程中,自然語言處理技術(shù)呈現(xiàn)了明顯的“同質(zhì)化”和“規(guī)?;钡陌l(fā)展趨勢,使用參數(shù)量越來越大的模型,從越來越多的文本數(shù)據(jù)中進(jìn)行學(xué)習(xí)。同時分析指出,自然語言處理未來需要融入更多的多模態(tài)信息。此外,還需要智能體能夠同物理世界以及人類社會進(jìn)行交互,這樣才能真正理解現(xiàn)世界中的各種概念,從而實現(xiàn)真正的通用人工智能。 對于哈工大自然語言處理研究所(HIT-NLP)出品的《ChatGPT調(diào)研報告》有興趣的朋友,可以私信留言加阿明好友,阿明可以看情況私下分享業(yè)內(nèi)學(xué)習(xí)參考。 不過,現(xiàn)在在AI與大模型領(lǐng)域逐漸呈現(xiàn)出百花齊放的態(tài)勢。來自新浪數(shù)科COO于冬琪的幾段觀點在朋友圈傳播,他個人最喜歡這么幾個項目:如改善盲人讀屏效率和為盲人用戶讀出圖片上信息。幫助農(nóng)民找到地里的冬蟲夏草,提高挖掘效率。AI診斷皮膚問題。AI幫律師們快速整理法條、給出建議。 幫助刑警們基于目擊者描述,繪制出嫌疑人畫像。幫助醫(yī)生們,把語音自動錄入成病例。 他沒想到的是,現(xiàn)在有很多團(tuán)隊有自研的技術(shù)和論文。甚至于有人做出來了可部署在個人電腦上、基于本地數(shù)據(jù)的丐版大模型。 綜合來看,AI風(fēng)暴來襲,公有云與ChatGPT關(guān)系越來越親密,也越來越復(fù)雜。到底該如何去發(fā)展,不管是微軟還是亞馬遜還是阿里云還是其他公有云廠商,都在摸著石頭過河,就看誰更會探索,更會迅速了吧。 未雨綢繆,如何看AI威脅論? 再進(jìn)一步看看針對AI的法律監(jiān)管領(lǐng)域。不少國家開始出臺法律法規(guī)監(jiān)管AI,隨著GPT發(fā)展越來越快,相關(guān)監(jiān)管規(guī)定也將加速出臺。 當(dāng)然,從通用大模型走向行業(yè)大模型,行業(yè)數(shù)據(jù)安全監(jiān)管也是需要重視。 對此,我們又不得不再討論一下AI的人類威脅論。 至少當(dāng)前要思考對AI能力邊界做一些框架限定,并有利于社會進(jìn)步與人類社會的發(fā)展。據(jù)外媒消息說,馬斯克(Elon Musk)、蘋果聯(lián)合創(chuàng)始人沃茲尼亞克(Steve Wozniak)等1000多名科技研究人員和高管呼吁“暫?!監(jiān)penAI的GPT等先進(jìn)人工智能系統(tǒng)的訓(xùn)練6個月,用來開發(fā)和實施一套協(xié)議,使這些強(qiáng)大的人工智能系統(tǒng)更加準(zhǔn)確、透明和值得信賴。 可能,這又是一次人類的覺醒,幸好馬斯克們在AI道路上沒有完全癡迷不悟! 然后,也有非營利活動組織Future of Life Institute發(fā)表了一封公開信,在發(fā)表后幾小時,已有來自學(xué)術(shù)界和科技行業(yè)的1100多人簽名。所有簽名的人都十分擔(dān)心,AI系統(tǒng)的智能可以與人類相媲美,可能對社會和人類構(gòu)成嚴(yán)重威脅。 全球存儲觀察的阿明對此表示,“百年后,我們的子孫后代看到現(xiàn)在我們,他們會怎樣想現(xiàn)在的AI瘋狂?” 另有業(yè)內(nèi)人士分析指出,國內(nèi)現(xiàn)在還不用太擔(dān)心這個方面的問題,因為像國內(nèi)頂級“ChatGPT”啥時候和GPT-4一樣聰明了再說吧。 - END- 你 怎 么 看 ? 歡迎文末評論補(bǔ)充! 【全球存儲觀察 | 全球云觀察 | 阿明觀察 |科技明說】專注科技公司分析,用數(shù)據(jù)說話,帶你看懂科技。本文和作者回復(fù)僅代表個人觀點,不構(gòu)成任何投資建議。 |