編輯:桃子 好困 【新智元導(dǎo)讀】「日日新SenseNova」大模型體系發(fā)布,商湯正式官宣入局! 商湯正式加入ChatGPT戰(zhàn)局! 就在昨天,商湯在發(fā)布會(huì)現(xiàn)場(chǎng)一口氣來了個(gè)全套的,大模型文生圖、代碼生成、做視頻、2D/3D數(shù)字人.... 話不多說,直接上圖。 一個(gè)人類站在非常有未來感的建筑面前,暢想平行宇宙種種可能。 只需5分鐘真人視頻素材,活靈活現(xiàn)的數(shù)字人就來了。 還有代碼翻譯實(shí)時(shí)演示,碼農(nóng)狂喜。 日日新,又日新 這些讓所有人驚呆的大模型能力,便來自商湯的「日日新SenseNova」大模型體系。 「日日新SenseNova」這一名字取自《禮記·大學(xué)》中,湯之盤銘曰「茍日新、日日新、又日新」。 它寓意著在模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI更多可能。 在這一大模型體系中,商湯自研了中文語言大模型商量SenseChat、以及包括AI文生圖創(chuàng)作、2D/3D數(shù)字人生成、大場(chǎng)景/小物體生成等一系列生成式AI模型與應(yīng)用。 商量SenseChat:妙解復(fù)雜問題,創(chuàng)作一流文本 商量SenseChat是商湯最新研發(fā)的中文語言大模型。 模型訓(xùn)練使用了大量數(shù)據(jù),并充分考慮了中文語境,能夠更好地理解和處理中文文本。 活動(dòng)現(xiàn)場(chǎng),商量SenseChat不僅能進(jìn)行單輪對(duì)話,而且多輪對(duì)話,超長(zhǎng)文本理解能力上表現(xiàn)出色。 在單輪對(duì)話上,理解句子含義,判斷句子合理性不在話下。 另外,還能夠進(jìn)行邏輯推理,比如正確完成非命題和命題的邏輯問題。 問它旺仔的爸爸有三個(gè)孩子,老大叫大毛,老二叫二毛,老三叫什么? 在多輪對(duì)話中,商量SenseChat還具備出色的語義理解、創(chuàng)造力和共情能力。 能夠?yàn)槟闾峁┣楦猩系膿嵛?,比如「如何提高自我認(rèn)識(shí),更好地了解自己?」 它還可以進(jìn)行共同創(chuàng)作,比如與人一人一句共同創(chuàng)作兒童故事。 最后,在超長(zhǎng)文本理解上,商量SenseChat能夠幫助用戶快速通過與大模型互動(dòng)來獲取知識(shí)、尋找答案。比如,讓它快速閱讀理解《專利法》。 此外,商湯直接把商量SenseChat用在了代碼開發(fā)上,推出了AI代碼助手。 更刺激一點(diǎn)在于,他們這次竟然上了現(xiàn)場(chǎng)實(shí)時(shí)演示,而且還是鏡頭直接懟屏幕的那種。 據(jù)了解,全新的AI代碼助手為碼農(nóng)提供了代碼補(bǔ)全、注釋生成代碼、測(cè)試代碼生成、代碼翻譯、代碼修正、代碼重構(gòu)、復(fù)雜度分析等功能。 與此同時(shí),AI代碼助手還支持中英文,以及多種編程語言,并能夠快速適應(yīng)碼農(nóng)個(gè)性化編碼風(fēng)格。 在內(nèi)部實(shí)測(cè)中,AI代碼助手可以讓代碼編寫效率提升62%,HumanEval測(cè)試集一次通過率40.2%。 商湯科技董事長(zhǎng)兼CEO徐立稱,下一代軟件開發(fā)范式是AI for AI,并提出了全新的二八定律:代碼= 80% AI生成+20%人工。 除了寫代碼,商量SenseChat已經(jīng)用在醫(yī)療場(chǎng)景中,比如問診分診、醫(yī)療知識(shí)科普、疾病鑒別診斷。 未來,將繼續(xù)拓展在藥物治療、手術(shù)方案等方面的問診能力,幫助醫(yī)生進(jìn)一步提升診療效率。 真·全能AI 除了發(fā)布中文語言大模型,當(dāng)前,最火的就是生成式AI了,商湯在該領(lǐng)域也展開了全方位的布局。 基于「日日新SenseNova」大模型體系,商湯自研了包括秒畫SenseMirage、如影SenseAvatar、瓊宇SenseSpace、格物SenseThings等一系列生成式AI模型及應(yīng)用。 文生圖創(chuàng)作平臺(tái)「秒畫SenseMirage」 文生圖有多強(qiáng),其實(shí)你剛剛也見證到了。秒畫SenseMirage能夠展現(xiàn)光影真實(shí)、細(xì)節(jié)豐富、風(fēng)格多變,還能支持6K高清圖的生成。 該模型基于超10億參數(shù)自研文生圖生成模型,支持二次元、三次元等多種生成風(fēng)格。 另外,用戶還可以自主訓(xùn)練,可基于單卡,5分鐘內(nèi)定制屬于自己的LoRA 模型@20張訓(xùn)練圖片。 對(duì)創(chuàng)作者來說,生成模型開源社區(qū)匯聚了1萬+開源模型,結(jié)合自研模型及訓(xùn)練能力,為其提供了更加完善的內(nèi)容生產(chǎn)工具。 AI數(shù)字人視頻生成平臺(tái)「如影SenseAvatar」 談到元宇宙,就需要數(shù)字化分身Avatar。 如今,無需專業(yè)拍攝設(shè)備,通過文字驅(qū)動(dòng),你就可以快速、高效打造一個(gè)高度逼真的數(shù)字形象。 如影SenseAvatar僅需要5分鐘的真人視頻素材,就可以生成出來聲音及動(dòng)作自然、口型準(zhǔn)確、多語種精通的數(shù)字人分身。 甚至,只需提供一個(gè)粗略的想法,文案也有了。此外,它還能支持百種語言,讓你輕松創(chuàng)作跨國(guó)際化內(nèi)容。 除了打造短視頻,「如影SenseAvatar」還可以輕松制作教育、企業(yè),娛樂文化等領(lǐng)域的視頻。 3D內(nèi)容生成平臺(tái)「瓊宇SenseSpace/格物SenseThings」 格物SenseThings可基于3D內(nèi)容生成技術(shù)實(shí)現(xiàn)對(duì)空間和物體的復(fù)刻與交互,并支持再編輯再創(chuàng)作。 除了數(shù)字人,基于NeRF,商湯的瓊宇SenseSpace可以進(jìn)行場(chǎng)景生成,復(fù)刻和還原真實(shí)空間。 瓊宇SenseSpace生成的場(chǎng)景不僅支持自由漫游,還支持實(shí)時(shí)交互和編輯。 比如進(jìn)行城市生成,高度還原場(chǎng)景細(xì)節(jié)。 甚至有厘米級(jí)的重建精度,可通過實(shí)時(shí)渲染和互動(dòng)帶來超真實(shí)感的場(chǎng)景。 多源數(shù)據(jù)融合帶來超精細(xì)化的清晰度和細(xì)節(jié)效果。 另外,格物SenseThings可以進(jìn)行物體3D內(nèi)容生成。 它能夠良好支持復(fù)雜結(jié)構(gòu)物體復(fù)刻,并做到光照精準(zhǔn)復(fù)刻,材質(zhì)完美還原。 以上是日日新SenseNova大模型體系帶來的強(qiáng)大內(nèi)容生成能力,不論在圖片、還是數(shù)字人、視頻上,直接打破了人類創(chuàng)意天花板,將重塑行業(yè)生態(tài)。 釋放大模型這么多能力,商湯的底氣在哪? 5年磨一劍,直指AGI 2023年,由AIGC及ChatGPT引領(lǐng)的新一輪人工智能熱潮已箭在弦上。 其實(shí),早在2018年,商湯就開始著手AI大模型研發(fā)。只不過,這個(gè)概念,今年才被炒火。 到現(xiàn)在,這家AI公司已經(jīng)5年多的技術(shù)沉淀和實(shí)踐經(jīng)驗(yàn)。已經(jīng)打造了CV、NLP、AIGC多個(gè)AI大模型。 2019年,商湯最先推出了10億參數(shù)量規(guī)模的視覺模型,實(shí)現(xiàn)了當(dāng)時(shí)業(yè)界最好的算法效果。 那時(shí),商湯已經(jīng)具備了千卡并行的系統(tǒng)能力,使用了上千張GPU卡進(jìn)行單任務(wù)訓(xùn)練。 在2021-2022年,商湯還訓(xùn)練了百億參數(shù)規(guī)模的超大視覺模型,這相當(dāng)于千億參數(shù)語言模型的訓(xùn)練量。 目前,商湯已成功研發(fā)了320億參數(shù)量的全球最大的通用視覺模型。 該模型已經(jīng)實(shí)現(xiàn)了高性能的目標(biāo)檢測(cè)、圖像分割和多物體識(shí)別算法,并在自動(dòng)駕駛、工業(yè)質(zhì)檢、醫(yī)療影像等多個(gè)領(lǐng)域得到廣泛應(yīng)用。 今年3月,商湯還開源了多模態(tài)多任務(wù)通用大模型書生(INTERN)2.5,有30億參數(shù)。 商湯這家前沿AI科技公司,不僅有著深厚的算法積淀,最重要的是還有強(qiáng)大的基礎(chǔ)設(shè)施——SenseCore AI大裝置。 在急需算力的當(dāng)下,商湯SenseCore AI大裝置以5000 Petaflops超大規(guī)模算力和出色的并行計(jì)算能力,為大模型研發(fā)提供強(qiáng)大的算力基礎(chǔ)設(shè)施。 現(xiàn)有27000塊GPU,可輸出5000 PetaFlops算力,能夠以最大4000卡規(guī)模集群進(jìn)行單任務(wù)訓(xùn)練,并可做到7天以上不間斷的穩(wěn)定訓(xùn)練。 算法,算力有了,數(shù)據(jù)怎么來? 一直以來,商湯在智慧城市、智慧商業(yè)等領(lǐng)域的長(zhǎng)期耕耘,積累了海量真實(shí)世界的高質(zhì)量視覺數(shù)據(jù)。 徐立表示,模型的能力應(yīng)考量包括參數(shù)量和數(shù)據(jù)量。而參數(shù)量和數(shù)據(jù)量的乘積即計(jì)算量,即模型的能力可以用所依賴計(jì)算量來做標(biāo)定。這就是新時(shí)代下,算法、數(shù)據(jù)和算力的新公式。 發(fā)布會(huì)現(xiàn)場(chǎng),商湯基于「日日新SenseNova」大模型體系和AI大裝置SenseCore,面向商業(yè)伙伴提供API。 其中包括圖片生成,自然語言生成,視覺感知通用任務(wù)與標(biāo)注服務(wù),客戶可以根據(jù)自己想要的內(nèi)容進(jìn)行調(diào)用。 在推進(jìn)AGI布局上,商湯向所有人展示了大模型+大算力的戰(zhàn)略布局。 未來,商湯還將繼續(xù)推進(jìn)「日日新SenseNova」大模型體系的建設(shè),將AGI作為核心發(fā)展目標(biāo)。 日復(fù)一日,在大模型研發(fā)實(shí)現(xiàn)AGI突破,讓AI惠及每個(gè)人。 |
|