在今年兩會政府工作報告中,明確提出了深化大數(shù)據(jù)、人工智能等研發(fā)應(yīng)用,開展“人工智能+”行動,打造具有國際競爭力的數(shù)字產(chǎn)業(yè)集群。伴隨著“人工智能+”首次被寫入政府工作報告,各個行業(yè)、各個領(lǐng)域競相展開了對AI技術(shù)的探索與追尋,AI技術(shù)的發(fā)展熱情達到了全新高度。 在目前階段,AI技術(shù)是發(fā)展新質(zhì)生產(chǎn)力的重要引擎,已經(jīng)成為社會各界的高度共識。而如何讓AI技術(shù)源源不斷導(dǎo)入各個生產(chǎn)場景,成為產(chǎn)業(yè)界、學(xué)術(shù)界的發(fā)展源動力,也就成為最受關(guān)注的話題。 這里我們必須看到,任何技術(shù)的普遍發(fā)展都離不開技術(shù)的茁壯成長。比如“互聯(lián)網(wǎng)+”時代的到來,離不開IP網(wǎng)絡(luò)等技術(shù),以及社會化的網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)?!叭斯ぶ悄?”行動的開展,也有賴于多種新型AI基礎(chǔ)設(shè)施的建設(shè)。其中在軟件層面,最為重要的一項就是AI框架。 AI框架是大模型的軟件底座,是各行業(yè)、各領(lǐng)域接觸人工智能技術(shù)、開發(fā)大模型的第一站,也是推動產(chǎn)業(yè)智能化發(fā)展的核心力量。AI框架如何面向新時代,新任務(wù)長足發(fā)展?如何將框架的技術(shù)能力轉(zhuǎn)化為產(chǎn)學(xué)應(yīng)用的行動力、生態(tài)發(fā)展的凝聚力?這些問題在今天都迫切需要答案。 近日,以“為智而昇,思創(chuàng)之源”為主題的昇思人工智能框架峰會2024在北京國家會議中心舉辦。會上公布了全新升級的昇思MindSpore 2.3版本,并展示了昇思在產(chǎn)學(xué)應(yīng)用,生態(tài)賦能多方面的最新進展。 如何打通一條從技術(shù)領(lǐng)先,到深入產(chǎn)學(xué)應(yīng)用,賦能生態(tài)加速發(fā)展的AI之路? 在這場峰會中,昇思已經(jīng)給出了自己的答案。 降本增效筑通道 如何提升AI源動力? 所謂AI之路,應(yīng)該是一條將底層技術(shù)高效引申到上層應(yīng)用、開發(fā)生態(tài)當中,從而讓社會經(jīng)濟各個層面從基礎(chǔ)技術(shù)中汲取營養(yǎng)的道路。只有這條路通暢、便捷、低成本,AI技術(shù)才能全面開花結(jié)果,“人工智能+”行動才能夠價值最大化。 而在目前階段,想要實現(xiàn)這樣的AI之路還面臨著一系列挑戰(zhàn)。技術(shù)與產(chǎn)業(yè)經(jīng)濟、學(xué)術(shù)研究、開發(fā)者生態(tài)之間還存在卡點和堵點。比如大模型開發(fā)成本大,難度高,各行業(yè)、各領(lǐng)域還難以完全掌握,再比如一些專業(yè)性強,較為復(fù)雜的領(lǐng)域還無法實現(xiàn)技術(shù)的深層滲透??傮w而言,想要將AI技術(shù)變?yōu)樯鐣?jīng)濟發(fā)展的源動力,需要從三個層面來進行升級: 1.底座層。需要實現(xiàn)大模型訓(xùn)練效率更高,推理部署成本更低且全面提升開發(fā)易用性,實現(xiàn)訓(xùn)推能力全面升級,開發(fā)效率全面提升。而這尤其需要深度學(xué)習(xí)開發(fā)框架的升級與發(fā)展,在訓(xùn)練、推理與開發(fā)工具等方面實現(xiàn)持續(xù)進化。 2.應(yīng)用層。AI技術(shù)需要與行業(yè)場景、科研領(lǐng)域進行深刻互動,實現(xiàn)人工智能技術(shù)與行業(yè)專精知識的立體結(jié)合,使能行業(yè)智能化升級,從而拓展AI技術(shù)的應(yīng)用邊界,提升場景化復(fù)制能力。尤其在AI for Science等關(guān)鍵領(lǐng)域,需要AI技術(shù)與基礎(chǔ)學(xué)科研究者緊密配合、共同探索。 3.生態(tài)層。AI技術(shù)就像其他軟件技術(shù)一樣,沒有生態(tài)不成規(guī)模,生態(tài)繁榮能達到技術(shù)越用越好的效果。而生態(tài)發(fā)展需要技術(shù)平臺與產(chǎn)學(xué)研用各界以及無數(shù)開發(fā)者的有效互動,持續(xù)賦能。 由此可見,AI技術(shù)成為社會經(jīng)濟發(fā)展的源動力,需要構(gòu)筑一條從底層技術(shù)到產(chǎn)學(xué)應(yīng)用,再到生態(tài)賦能的完整通道。而這,也正是昇思正在踐行的AI之路。 AI框架 昇思MindSpore 2.3全新升級 首先一個問題,是如何讓AI技術(shù)持續(xù)創(chuàng)新,滿足產(chǎn)學(xué)各界對AI基礎(chǔ)軟件的期待和要求。 在這方面,昇思不斷精進。在訓(xùn)練、推理以及模型開發(fā)等方面實現(xiàn)立體化、協(xié)同化的能力升級。這一思路充分體現(xiàn)在了最新發(fā)布的昇思MindSpore 2.3版本當中。通過一系列升級,昇思讓大模型開發(fā)訓(xùn)練更簡、更穩(wěn)、更高效。 在訓(xùn)練方面,昇思可以支撐大模型實現(xiàn)原生高效訓(xùn)練。通過原創(chuàng)的多副本、多流水交織等8種并行技術(shù),使集群線性度達到90%,遠遠超過了業(yè)界不足60%的平均水平;通過整圖優(yōu)化及下沉執(zhí)行等,使得算力利用率達到55%,大幅超越了業(yè)界不足40%的平均水準;針對集群故障率高,恢復(fù)時間長的普遍問題,通過編譯快照,昇思通過確定性CKPT技術(shù)實現(xiàn)20分鐘完成故障恢復(fù)。 在今天的大模型時代,大規(guī)模集群化的模型訓(xùn)練已經(jīng)成了業(yè)界的最大痛點。昇思通過一系列基礎(chǔ)能力的升級,全方位破解了集群線性度、AI算力利用效率、訓(xùn)練故障恢復(fù)等核心難題,讓大模型訓(xùn)練不再充滿挑戰(zhàn)。 而在部署方面,昇思通過訓(xùn)推一體的架構(gòu)升級腳本、分布式策略,以及運行時的統(tǒng)一,讓Baichuan2-13B推理部署在1天內(nèi)就可以完成;在大模型推理上,通過LLM Serving 實現(xiàn)推理吞吐提升2倍多;通過升級模型壓縮工具金箍棒2.0,實現(xiàn)千億大模型壓縮至十倍。這些能力確保了AI大模型不僅可訓(xùn)練,還能夠順利推理應(yīng)用,打通了AI落地的最后一公里。 除此之外,昇思還通過持續(xù)升級MindSpore TransFormers大模型套件,提供MindSpore One生成式套件等方式,全面提升開發(fā)者效率,讓開發(fā)者一周即可完成大模型全流程的開發(fā)。在重點的AI for Science領(lǐng)域,昇思聯(lián)合頂級科研機構(gòu)和伙伴打造了AI生物計算套件,包含蛋白質(zhì)結(jié)構(gòu)預(yù)測、生成等20多個SOTA模型,加速相關(guān)領(lǐng)域的科學(xué)創(chuàng)新。 從訓(xùn)練到推理,再到一系列開發(fā)套件的升級,昇思持續(xù)深耕AI技術(shù),讓AI基礎(chǔ)能力穩(wěn)固發(fā)展。 只有基礎(chǔ)軟件技術(shù)能夠源源不斷提供養(yǎng)分,才能實現(xiàn)AI應(yīng)用發(fā)芽,AI生態(tài)開花。 產(chǎn)學(xué)應(yīng)用之芽 以昇思構(gòu)筑AI for Science新范式 夯實了AI底座技術(shù)之后,需要將技術(shù)能力與應(yīng)用場景進行深入結(jié)合。尤其是在復(fù)雜、關(guān)鍵的領(lǐng)域,比如AI for Science當中,更需要AI技術(shù)與科研工作進行跨越式探索,以此讓AI框架在無數(shù)個行業(yè),無數(shù)個領(lǐng)域發(fā)芽生長。 在峰會當中,我們可以看到昇思如何與氣動外形設(shè)計這一關(guān)鍵領(lǐng)域進行結(jié)合,打通了AI for Science的新范式。所謂氣動外形設(shè)計,是指飛機、船舶、汽車等交通工具的氣動外形設(shè)計。這一領(lǐng)域事關(guān)國計民生,并且研究、驗證的成本巨大。非常適合AI大模型作為新研究工具的加入。在此前,我們經(jīng)??吹紸I大模型在蛋白質(zhì)折疊、材料分析相關(guān)研究領(lǐng)域的應(yīng)用,昇思與氣動外形設(shè)計的結(jié)合,又一次拓寬了AI for Science的邊界。 中國科學(xué)院院士、中國空氣動力學(xué)會理事長唐志共表示:基于昇思MindSpore,生成式氣動設(shè)計大模型平臺打破傳統(tǒng)設(shè)計范式,設(shè)計時長由月級縮短到分鐘級,滿足概念設(shè)計要求。未來該平臺將擴展到航空、航天、船舶、高鐵、能源、汽車等多個氣動領(lǐng)域的行業(yè),引領(lǐng)大型工業(yè)裝備的設(shè)計和制造能力跨越式發(fā)展。 據(jù)了解,生成式氣動設(shè)計大模型平臺基于昇思AI框架完成了自主創(chuàng)新開發(fā)。在模型開發(fā)階段,昇思框架和流體力學(xué)套件MindSpore Flow提供全面的科學(xué)計算算法庫和模型通用接口,提升模型開發(fā)效率。在模型的訓(xùn)練階段,使用MindSpore多維分布式并行接口,基于成都智算中心算力支撐,模型和數(shù)據(jù)得以高效擴展。在模型部署階段,使用昇思大模型套件,可以將專業(yè)知識融入氣動設(shè)計大模型平臺。 通過串聯(lián)大語言模型、氣動外形設(shè)計模型、氣動預(yù)測模型和風(fēng)雷軟件等非AI工具,氣動設(shè)計大模型平臺可以支撐多種氣動外形設(shè)計場景,為一系列關(guān)鍵領(lǐng)域提供基礎(chǔ)科研支撐。 在各個行業(yè),各個科研領(lǐng)域,都可以看到昇思的AI技術(shù)上,長出了AI應(yīng)用的新芽。假以時日,這些新芽會變成參天大樹。 AI技術(shù)也就由此開花結(jié)果,潤澤四方。 生態(tài)發(fā)展之花 全面賦能學(xué)術(shù)與生態(tài) 從產(chǎn)學(xué)應(yīng)用這層再向上看,AI技術(shù)的未來發(fā)展,有賴于廣袤而繁榮的開發(fā)者生態(tài)。這就需要AI框架與產(chǎn)學(xué)各界積極合作,不斷強化人才培養(yǎng)與生態(tài)賦能等工作。在這一領(lǐng)域,昇思采取了全面賦能學(xué)術(shù)與生態(tài)的策略,通過多管齊下的方式,讓昇思的技術(shù)能力融入開發(fā)者需求,助力AI人才培養(yǎng)。 峰會當中,昇思MindSpore開源社區(qū)理事長丁誠公布了昇思賦能學(xué)術(shù)與生態(tài)的四項行動。 其中包括,昇思和中國人工智能學(xué)會、鵬城實驗室合作的學(xué)術(shù)論文基金2.0,將在未來3年內(nèi)攜手50多家全球AI學(xué)者,在學(xué)術(shù)領(lǐng)域不斷探索;昇思開發(fā)板應(yīng)用創(chuàng)新行動,基于香橙派開發(fā)板,提供系統(tǒng)化的案例、教程與支持,幫助開發(fā)者快速上手、快速入門、快速打造個性化應(yīng)用;昇思加速原生大模型孵化,通過激勵、專項技術(shù)支持和市場聯(lián)合推廣,支持更多伙伴從昇思遷移適配走向原生開發(fā);昇思開源社區(qū)實習(xí)活動,通過代碼實踐,讓開發(fā)者真正地實踐成長。 除了以轉(zhuǎn)型行動賦能生態(tài)發(fā)展,昇思還積極推動開源事業(yè)創(chuàng)新,凝聚開源生態(tài)。2020年3月,開源昇思MindSpore AI框架正式推出,其后得到了廣大AI開發(fā)者的積極回饋,總訪問量已經(jīng)達到了數(shù)千,有超過687萬下載安裝使用,在碼云開源項目中綜合排名第一,服務(wù)企業(yè)數(shù)量超過5500家,合作高校360所。 2023年以來,基于昇思框架發(fā)表的頂級會議論文數(shù)量超過1200篇,在所有AI框架中排名中國第一,全球第二,已成為國內(nèi)最具創(chuàng)新活力的AI開源社區(qū)。Gitee是國內(nèi)第一大開源代碼托管平臺,根據(jù)Gitee 指數(shù) 2.0 , MindSpore在各類指標中表現(xiàn)優(yōu)異,成為Gitee-AI領(lǐng)域分類下全品類指數(shù) NO.1。由此,昇思MindSpore成為“Gitee中國最佳開源貢獻項目”,被開源中國董事長馬越譽為“Gitee珍視的瑰寶”。 怒放的生態(tài)之花,開源之花,印證了昇思AI之路已經(jīng)全線貫通。從AI基礎(chǔ)技術(shù)到各個行業(yè)應(yīng)用,再到萬千開發(fā)者的信任,昇思已經(jīng)構(gòu)建出了全方位、立體化的AI開發(fā)底座。 在AI技術(shù)的時代浪潮里,社會經(jīng)濟希望智能化能力能夠兼容高效與穩(wěn)定,既好又快發(fā)展。 昇思的AI之路,是讓技術(shù)更加扎實,應(yīng)用茁壯發(fā)芽,生態(tài)向上開花。以此為基礎(chǔ),AI才能生長為參天大樹,變?yōu)闂澚褐?。也只有如此,時代對智能的呼喚才能變?yōu)楝F(xiàn)實,AI技術(shù)才能夠新質(zhì)生產(chǎn)力的源泉。 |
|