商湯ChatGPT「商量」炸場(chǎng)！秒生6K神圖代碼提速62%，現(xiàn)場(chǎng)直播懟臉

龍飛2020 2023-04-11 發(fā)布于廣東

展開全文

編輯：桃子好困

【新智元導(dǎo)讀】「日日新SenseNova」大模型體系發(fā)布，商湯正式官宣入局！

商湯正式加入ChatGPT戰(zhàn)局！

就在昨天，商湯在發(fā)布會(huì)現(xiàn)場(chǎng)一口氣來了個(gè)全套的，大模型文生圖、代碼生成、做視頻、2D/3D數(shù)字人....

話不多說，直接上圖。

一個(gè)人類站在非常有未來感的建筑面前，暢想平行宇宙種種可能。

只需5分鐘真人視頻素材，活靈活現(xiàn)的數(shù)字人就來了。

還有代碼翻譯實(shí)時(shí)演示，碼農(nóng)狂喜。

日日新，又日新

這些讓所有人驚呆的大模型能力，便來自商湯的「日日新SenseNova」大模型體系。

「日日新SenseNova」這一名字取自《禮記·大學(xué)》中，湯之盤銘曰「茍日新、日日新、又日新」。

它寓意著在模型的迭代速度及處理問題的能力上可以日日更新，不斷解鎖AGI更多可能。

在這一大模型體系中，商湯自研了中文語言大模型商量SenseChat、以及包括AI文生圖創(chuàng)作、2D/3D數(shù)字人生成、大場(chǎng)景/小物體生成等一系列生成式AI模型與應(yīng)用。

商量SenseChat：妙解復(fù)雜問題，創(chuàng)作一流文本

商量SenseChat是商湯最新研發(fā)的中文語言大模型。

模型訓(xùn)練使用了大量數(shù)據(jù)，并充分考慮了中文語境，能夠更好地理解和處理中文文本。

活動(dòng)現(xiàn)場(chǎng)，商量SenseChat不僅能進(jìn)行單輪對(duì)話，而且多輪對(duì)話，超長(zhǎng)文本理解能力上表現(xiàn)出色。

在單輪對(duì)話上，理解句子含義，判斷句子合理性不在話下。

另外，還能夠進(jìn)行邏輯推理，比如正確完成非命題和命題的邏輯問題。

問它旺仔的爸爸有三個(gè)孩子，老大叫大毛，老二叫二毛，老三叫什么？

在多輪對(duì)話中，商量SenseChat還具備出色的語義理解、創(chuàng)造力和共情能力。

能夠?yàn)槟闾峁┣楦猩系膿嵛?，比如「如何提高自我認(rèn)識(shí)，更好地了解自己？」

它還可以進(jìn)行共同創(chuàng)作，比如與人一人一句共同創(chuàng)作兒童故事。

最后，在超長(zhǎng)文本理解上，商量SenseChat能夠幫助用戶快速通過與大模型互動(dòng)來獲取知識(shí)、尋找答案。比如，讓它快速閱讀理解《專利法》。

此外，商湯直接把商量SenseChat用在了代碼開發(fā)上，推出了AI代碼助手。

更刺激一點(diǎn)在于，他們這次竟然上了現(xiàn)場(chǎng)實(shí)時(shí)演示，而且還是鏡頭直接懟屏幕的那種。

據(jù)了解，全新的AI代碼助手為碼農(nóng)提供了代碼補(bǔ)全、注釋生成代碼、測(cè)試代碼生成、代碼翻譯、代碼修正、代碼重構(gòu)、復(fù)雜度分析等功能。

與此同時(shí)，AI代碼助手還支持中英文，以及多種編程語言，并能夠快速適應(yīng)碼農(nóng)個(gè)性化編碼風(fēng)格。

在內(nèi)部實(shí)測(cè)中，AI代碼助手可以讓代碼編寫效率提升62%，HumanEval測(cè)試集一次通過率40.2%。

商湯科技董事長(zhǎng)兼CEO徐立稱，下一代軟件開發(fā)范式是AI for AI，并提出了全新的二八定律：代碼= 80% AI生成+20%人工。

除了寫代碼，商量SenseChat已經(jīng)用在醫(yī)療場(chǎng)景中，比如問診分診、醫(yī)療知識(shí)科普、疾病鑒別診斷。

未來，將繼續(xù)拓展在藥物治療、手術(shù)方案等方面的問診能力，幫助醫(yī)生進(jìn)一步提升診療效率。

真·全能AI

除了發(fā)布中文語言大模型，當(dāng)前，最火的就是生成式AI了，商湯在該領(lǐng)域也展開了全方位的布局。

基于「日日新SenseNova」大模型體系，商湯自研了包括秒畫SenseMirage、如影SenseAvatar、瓊宇SenseSpace、格物SenseThings等一系列生成式AI模型及應(yīng)用。

文生圖創(chuàng)作平臺(tái)「秒畫SenseMirage」

文生圖有多強(qiáng)，其實(shí)你剛剛也見證到了。秒畫SenseMirage能夠展現(xiàn)光影真實(shí)、細(xì)節(jié)豐富、風(fēng)格多變，還能支持6K高清圖的生成。

該模型基于超10億參數(shù)自研文生圖生成模型，支持二次元、三次元等多種生成風(fēng)格。

另外，用戶還可以自主訓(xùn)練，可基于單卡，5分鐘內(nèi)定制屬于自己的LoRA 模型@20張訓(xùn)練圖片。

對(duì)創(chuàng)作者來說，生成模型開源社區(qū)匯聚了1萬+開源模型，結(jié)合自研模型及訓(xùn)練能力，為其提供了更加完善的內(nèi)容生產(chǎn)工具。

AI數(shù)字人視頻生成平臺(tái)「如影SenseAvatar」

談到元宇宙，就需要數(shù)字化分身Avatar。

如今，無需專業(yè)拍攝設(shè)備，通過文字驅(qū)動(dòng)，你就可以快速、高效打造一個(gè)高度逼真的數(shù)字形象。

如影SenseAvatar僅需要5分鐘的真人視頻素材，就可以生成出來聲音及動(dòng)作自然、口型準(zhǔn)確、多語種精通的數(shù)字人分身。

甚至，只需提供一個(gè)粗略的想法，文案也有了。此外，它還能支持百種語言，讓你輕松創(chuàng)作跨國(guó)際化內(nèi)容。

除了打造短視頻，「如影SenseAvatar」還可以輕松制作教育、企業(yè)，娛樂文化等領(lǐng)域的視頻。

3D內(nèi)容生成平臺(tái)「瓊宇SenseSpace/格物SenseThings」

格物SenseThings可基于3D內(nèi)容生成技術(shù)實(shí)現(xiàn)對(duì)空間和物體的復(fù)刻與交互，并支持再編輯再創(chuàng)作。

除了數(shù)字人，基于NeRF，商湯的瓊宇SenseSpace可以進(jìn)行場(chǎng)景生成，復(fù)刻和還原真實(shí)空間。

瓊宇SenseSpace生成的場(chǎng)景不僅支持自由漫游，還支持實(shí)時(shí)交互和編輯。

比如進(jìn)行城市生成，高度還原場(chǎng)景細(xì)節(jié)。

甚至有厘米級(jí)的重建精度，可通過實(shí)時(shí)渲染和互動(dòng)帶來超真實(shí)感的場(chǎng)景。

多源數(shù)據(jù)融合帶來超精細(xì)化的清晰度和細(xì)節(jié)效果。

另外，格物SenseThings可以進(jìn)行物體3D內(nèi)容生成。

它能夠良好支持復(fù)雜結(jié)構(gòu)物體復(fù)刻，并做到光照精準(zhǔn)復(fù)刻，材質(zhì)完美還原。

以上是日日新SenseNova大模型體系帶來的強(qiáng)大內(nèi)容生成能力，不論在圖片、還是數(shù)字人、視頻上，直接打破了人類創(chuàng)意天花板，將重塑行業(yè)生態(tài)。

釋放大模型這么多能力，商湯的底氣在哪？

5年磨一劍，直指AGI

2023年，由AIGC及ChatGPT引領(lǐng)的新一輪人工智能熱潮已箭在弦上。

其實(shí)，早在2018年，商湯就開始著手AI大模型研發(fā)。只不過，這個(gè)概念，今年才被炒火。

到現(xiàn)在，這家AI公司已經(jīng)5年多的技術(shù)沉淀和實(shí)踐經(jīng)驗(yàn)。已經(jīng)打造了CV、NLP、AIGC多個(gè)AI大模型。

2019年，商湯最先推出了10億參數(shù)量規(guī)模的視覺模型，實(shí)現(xiàn)了當(dāng)時(shí)業(yè)界最好的算法效果。

那時(shí)，商湯已經(jīng)具備了千卡并行的系統(tǒng)能力，使用了上千張GPU卡進(jìn)行單任務(wù)訓(xùn)練。

在2021-2022年，商湯還訓(xùn)練了百億參數(shù)規(guī)模的超大視覺模型，這相當(dāng)于千億參數(shù)語言模型的訓(xùn)練量。

目前，商湯已成功研發(fā)了320億參數(shù)量的全球最大的通用視覺模型。

該模型已經(jīng)實(shí)現(xiàn)了高性能的目標(biāo)檢測(cè)、圖像分割和多物體識(shí)別算法，并在自動(dòng)駕駛、工業(yè)質(zhì)檢、醫(yī)療影像等多個(gè)領(lǐng)域得到廣泛應(yīng)用。

今年3月，商湯還開源了多模態(tài)多任務(wù)通用大模型書生（INTERN）2.5，有30億參數(shù)。

商湯這家前沿AI科技公司，不僅有著深厚的算法積淀，最重要的是還有強(qiáng)大的基礎(chǔ)設(shè)施——SenseCore AI大裝置。

在急需算力的當(dāng)下，商湯SenseCore AI大裝置以5000 Petaflops超大規(guī)模算力和出色的并行計(jì)算能力，為大模型研發(fā)提供強(qiáng)大的算力基礎(chǔ)設(shè)施。

現(xiàn)有27000塊GPU，可輸出5000 PetaFlops算力，能夠以最大4000卡規(guī)模集群進(jìn)行單任務(wù)訓(xùn)練，并可做到7天以上不間斷的穩(wěn)定訓(xùn)練。

算法，算力有了，數(shù)據(jù)怎么來？

一直以來，商湯在智慧城市、智慧商業(yè)等領(lǐng)域的長(zhǎng)期耕耘，積累了海量真實(shí)世界的高質(zhì)量視覺數(shù)據(jù)。

徐立表示，模型的能力應(yīng)考量包括參數(shù)量和數(shù)據(jù)量。而參數(shù)量和數(shù)據(jù)量的乘積即計(jì)算量，即模型的能力可以用所依賴計(jì)算量來做標(biāo)定。這就是新時(shí)代下，算法、數(shù)據(jù)和算力的新公式。

發(fā)布會(huì)現(xiàn)場(chǎng)，商湯基于「日日新SenseNova」大模型體系和AI大裝置SenseCore，面向商業(yè)伙伴提供API。

其中包括圖片生成，自然語言生成，視覺感知通用任務(wù)與標(biāo)注服務(wù)，客戶可以根據(jù)自己想要的內(nèi)容進(jìn)行調(diào)用。

在推進(jìn)AGI布局上，商湯向所有人展示了大模型+大算力的戰(zhàn)略布局。

未來，商湯還將繼續(xù)推進(jìn)「日日新SenseNova」大模型體系的建設(shè)，將AGI作為核心發(fā)展目標(biāo)。

日復(fù)一日，在大模型研發(fā)實(shí)現(xiàn)AGI突破，讓AI惠及每個(gè)人。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：龍飛2020 > 《ChatGPT》

舉報(bào)/認(rèn)領(lǐng)