前不久,中興結(jié)束5年合規(guī)檢查期的消息,在科技圈引發(fā)不小波瀾。 在這樣一個(gè)特殊的時(shí)間節(jié)點(diǎn)下,“缺芯少魂”方面的自主自強(qiáng)問(wèn)題,再次成為全社會(huì)關(guān)注的焦點(diǎn)。 芯片,代表著底層算力;魂則是指系統(tǒng)。 如今,AI被視為高精尖技術(shù)競(jìng)賽角逐的戰(zhàn)場(chǎng),其最核心的系統(tǒng)便是深度學(xué)習(xí)框架。 國(guó)際兩大主流深度學(xué)習(xí)框架TensorFlow、PyTorch之外,中國(guó)的開(kāi)源框架,發(fā)展怎么樣了? 具體都有哪些玩家入場(chǎng)?其背后技術(shù)實(shí)力如何?是否能夠自主自立、不會(huì)重蹈“缺芯”覆轍? 今天,我們就來(lái)試著找尋這些問(wèn)題的答案。 國(guó)產(chǎn)開(kāi)源框架情況在問(wèn)題的最開(kāi)始,我們來(lái)盤(pán)一盤(pán)如今市面上有哪些主流國(guó)產(chǎn)開(kāi)源框架。 百度飛槳(PaddlePaddle),深度學(xué)習(xí)開(kāi)源框架的先頭兵,在2016年就已率先對(duì)外發(fā)布。 而后在2020年,國(guó)內(nèi)開(kāi)源框架迎來(lái)了第一波集中爆發(fā)。 獨(dú)角獸曠視拿出工業(yè)級(jí)深度學(xué)習(xí)框架天元(MegEngine),一流科技OneFlow、華為昇思(MindSpore)也在同年登場(chǎng)。 學(xué)界方面,清華大學(xué)開(kāi)源了支持即時(shí)編譯的深度學(xué)習(xí)框架計(jì)圖(Jittor)。 顯然,過(guò)去幾年中,“開(kāi)源”、“AI底層”成為了國(guó)內(nèi)AI廠商們十分重視的發(fā)展戰(zhàn)略。 其背后原因可大致歸結(jié)為兩點(diǎn)。 第一,在深度學(xué)習(xí)迎來(lái)高速發(fā)展的大背景下,傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)向智能化,AI的注入是關(guān)鍵因素之一。 小到一次人臉識(shí)別、大到一座城市的智能化管理,深度學(xué)習(xí)已經(jīng)滲透到我們的日常生活之中,成為社會(huì)高速發(fā)展的一條重要紐帶。 第二,盡管TensorFlow、PyTorch在技術(shù)上發(fā)展已經(jīng)非常成熟,但是外部環(huán)境變化,使得我國(guó)擁有自主創(chuàng)新的AI底層能力成為眼下之剛需,這也為國(guó)內(nèi)深度學(xué)習(xí)開(kāi)源框架帶來(lái)了發(fā)展的土壤。 實(shí)際上,從2016年至今,國(guó)內(nèi)深度學(xué)習(xí)開(kāi)源框架在經(jīng)歷多年積累、沉淀、探索后,一些成果已經(jīng)初步涌現(xiàn)。 根據(jù)IDC中國(guó)公開(kāi)發(fā)布的深度學(xué)習(xí)開(kāi)源框架市場(chǎng)研究報(bào)告,截至2021年上半年,TensorFLow、PyTorch以及百度飛槳成為國(guó)內(nèi)最高頻使用的開(kāi)源框架; 百度飛槳已凝聚406萬(wàn)開(kāi)發(fā)者,服務(wù)15.7萬(wàn)企事業(yè)單位,開(kāi)發(fā)模型達(dá)47.6萬(wàn)個(gè)。 市場(chǎng)份額方面,百度飛槳在國(guó)內(nèi)綜合市場(chǎng)份額已超越TensorFlow和PyTorch,位居中國(guó)第一。 那么,它是如何一步步發(fā)展至如今這一水平的?其背后經(jīng)驗(yàn)是否值得參考借鑒? 作為國(guó)產(chǎn)頭雁,以百度飛槳為例,或許能厘清一條中國(guó)自研開(kāi)源框架發(fā)展之路。 自主技術(shù)系統(tǒng)需要怎樣煉成?當(dāng)下,我們已經(jīng)處于以深度學(xué)習(xí)為核心的第三次AI浪潮,新興技術(shù)迎來(lái)集中爆發(fā)期。在這樣一個(gè)百舸爭(zhēng)流的環(huán)境中,如何開(kāi)拓出自己的一席之地? 瞄準(zhǔn)技術(shù)核心底層,大廠們深諳此道。 正如前文所提及的,框架被視為深度學(xué)習(xí)的核心靈魂,在推動(dòng)人工智能進(jìn)入工業(yè)大生產(chǎn)上,具有舉足輕重的作用。 在此背景下,如何為自家深度學(xué)習(xí)開(kāi)源框架開(kāi)辟出一席之地? 參考飛槳,連點(diǎn)成線總結(jié)概括,大概需要4方面的努力:
缺一不可。 首先,及時(shí)起步、搶占身位。 這里最典型的案例,便是谷歌TensorFlow。 2015年,TensorFlow先聲奪人,迅速在工業(yè)界內(nèi)贏得開(kāi)發(fā)者們的青睞,由此奠定了它全球兩大主流框架的地位。 百度飛槳幾乎是同一時(shí)間站在了起跑線上。 2016年,百度飛槳便先以PaddlePaddle的名字在GitHub上對(duì)外開(kāi)源,并且提供中英文雙語(yǔ)技術(shù)文檔。 而如果從籌備、研發(fā)期算起,百度飛槳的起點(diǎn)還要更早,可追溯到2010-2013年。 起跑早、發(fā)力早,帶來(lái)的優(yōu)勢(shì)也十分明顯——可以有更加充足的時(shí)間積累底層技術(shù)。 目前,百度AI方面專(zhuān)利申請(qǐng)數(shù)量超過(guò)1.3萬(wàn)件,連續(xù)四年位列中國(guó)第一,其中深度學(xué)習(xí)專(zhuān)利數(shù)量位居全球第一。 將專(zhuān)利技術(shù)握在自己手里,意味著中國(guó)深度學(xué)習(xí)技術(shù)可以更加自主自強(qiáng);同時(shí),更早積累技術(shù)也為中國(guó)團(tuán)隊(duì)參與到行業(yè)標(biāo)準(zhǔn)建立,提供了機(jī)會(huì)。 如今,百度飛槳的核心框架貫穿開(kāi)發(fā)、訓(xùn)練、推理部署三個(gè)環(huán)節(jié),基礎(chǔ)模型庫(kù)覆蓋CV、NLP、推薦、語(yǔ)音、知識(shí)增強(qiáng)的文心大模型。 第二,深度學(xué)習(xí)框架要能夠解決行業(yè)中的實(shí)際問(wèn)題。 工業(yè)界出身的深度學(xué)習(xí)框架,對(duì)理解行業(yè)場(chǎng)景有著先天優(yōu)勢(shì)。 加之飛槳誕生于中國(guó),還能更加了解中國(guó)企業(yè)的實(shí)際需求,也為開(kāi)拓海外市場(chǎng)提供豐富經(jīng)驗(yàn)參考。 過(guò)去幾年來(lái),百度飛槳官方發(fā)布的產(chǎn)業(yè)級(jí)開(kāi)源算法模型已經(jīng)超過(guò)了500個(gè),并發(fā)布13個(gè)精度與性能平衡的產(chǎn)業(yè)級(jí)PP系列模型,覆蓋工業(yè)、農(nóng)業(yè)、交通、科學(xué)計(jì)算等20多個(gè)行業(yè)領(lǐng)域。 在此我們可以看一些具體實(shí)例。 農(nóng)業(yè)增產(chǎn)方面,百度飛槳聯(lián)合京東方后稷打造了智慧水培植物工廠; 煤礦生產(chǎn)領(lǐng)域,華夏信天機(jī)器人公司基于飛槳的目標(biāo)檢測(cè)工具套件PaddleDetection,開(kāi)發(fā)出輸煤膠帶智能巡檢機(jī)器人。 當(dāng)然還有更為前沿的應(yīng)用場(chǎng)景。 前不久,百度生物計(jì)算方面研究登上Nature子刊,這一成果的底層技術(shù)支持便來(lái)自百度飛槳。 基于飛槳,百度開(kāi)發(fā)出了一個(gè)可用于生物計(jì)算的工具組件螺旋槳(PaddleHelix),涉及領(lǐng)域包括藥物研發(fā)、疫苗設(shè)計(jì)和精準(zhǔn)醫(yī)療等。 還有此前東京奧運(yùn)會(huì)上,中國(guó)跳水夢(mèng)之隊(duì)背后的隱形AI教練——國(guó)內(nèi)首個(gè)云端3D+AI跳水訓(xùn)練系統(tǒng),底層能力同樣來(lái)自飛槳。 第三,協(xié)同上下游共同推動(dòng)自主創(chuàng)新。 在實(shí)際應(yīng)用層面,企業(yè)由于框架與硬件不適配,總是會(huì)帶來(lái)額外的人力物力成本。 在這方面,百度飛槳實(shí)現(xiàn)了國(guó)產(chǎn)芯片適配量第一,同時(shí)還是英偉達(dá)三大支持框架之一——也是其中唯一深度適配的中國(guó)框架。 除了自研昆侖芯之外,飛槳已經(jīng)和英特爾、英偉達(dá)等在內(nèi)的22家國(guó)內(nèi)外硬件廠商,完成了31種芯片的適配和優(yōu)化。 值得一提的是,深度學(xué)習(xí)開(kāi)源框架對(duì)底層硬件的適配,反過(guò)來(lái)也會(huì)開(kāi)拓國(guó)產(chǎn)硬件的使用場(chǎng)景,促進(jìn)國(guó)產(chǎn)硬件的發(fā)展。 第四,深度學(xué)習(xí)開(kāi)源框架能否發(fā)展更為長(zhǎng)遠(yuǎn),良好的開(kāi)發(fā)者生態(tài)也是關(guān)鍵之一。 有人用、越用越好,可以看作是評(píng)判一個(gè)深度學(xué)習(xí)框架的標(biāo)準(zhǔn)。 飛槳在這方面已經(jīng)初具規(guī)模。 其中,百度飛槳在開(kāi)源社區(qū)的影響力位居國(guó)內(nèi)第一,在GitHub上總star位于全球第三、中國(guó)第一。 《2021中國(guó)開(kāi)源年度報(bào)告》顯示,2021年GitHub中國(guó)項(xiàng)目活躍度Top 30中,飛槳占據(jù)了5個(gè)項(xiàng)目,其中飛槳框架位列第一。 中國(guó)自研開(kāi)源框架如何突圍?綜上,便是百度飛槳為中國(guó)深度學(xué)習(xí)框架發(fā)展提供的一些思考。 如今,全球深度學(xué)習(xí)框架“PPT”格局初現(xiàn),百度飛槳PaddlePaddle與TensorFlow、PyTorch已展開(kāi)正面交鋒。 但不可否認(rèn)的是,前路仍舊漫長(zhǎng),中國(guó)深度學(xué)習(xí)框架能夠提升的空間還非常廣闊。 最近,百度方面也提出了自己的見(jiàn)解。 百度AI技術(shù)生態(tài)總經(jīng)理馬艷軍博士表示,當(dāng)前中國(guó)深度學(xué)習(xí)框架的發(fā)展有三大關(guān)鍵點(diǎn):
技術(shù)實(shí)力,不難理解。 技術(shù)創(chuàng)新的源頭,說(shuō)到底還是人才。目前,我國(guó)在AI底層技術(shù)人才的儲(chǔ)備上,仍有不足。 飛槳也是在邊研發(fā)邊培養(yǎng)這方面的人才。同時(shí)還打造了AI Studio學(xué)習(xí)與實(shí)訓(xùn)社區(qū),讓更多對(duì)AI感興趣的人有機(jī)會(huì)入門(mén)、進(jìn)階和快速提升。 飛槳還與高校“產(chǎn)教融合”:合作人工智能相關(guān)教材、提供人工智能教育資源,超過(guò)700所高校的3000多名AI專(zhuān)業(yè)教師從飛槳舉辦的深度學(xué)習(xí)師資培訓(xùn)中受益。 其次,在功能體驗(yàn)上。 中國(guó)是全球產(chǎn)業(yè)鏈最完整的國(guó)家,但同時(shí)產(chǎn)業(yè)體系也相當(dāng)復(fù)雜,尤其是中小企業(yè)方面,如何快速向智能化轉(zhuǎn)型,已經(jīng)成為國(guó)家、行業(yè)都在重點(diǎn)關(guān)注的問(wèn)題。 那么,如何讓各行各業(yè)的專(zhuān)業(yè)人才,即使沒(méi)有AI專(zhuān)業(yè)知識(shí)和背景也能順利使用AI,便是AI產(chǎn)業(yè)需要從底層技術(shù)上思考的問(wèn)題。 低門(mén)檻,儼然是眾望所需。 這也是百度飛槳的特色之一。 無(wú)論是TensorFlow還是PyTorch,都未在易用性方面下大功夫,對(duì)初學(xué)者友好度不高。而百度飛槳正好彌補(bǔ)了這一市場(chǎng)痛點(diǎn)。 最后,還是要說(shuō)回到開(kāi)發(fā)者生態(tài)上。 馬艷軍博士提到,百度飛槳與開(kāi)發(fā)者們一直保持緊密聯(lián)系,比如遇到問(wèn)題可以直接通過(guò)QQ交流群反饋給內(nèi)部工作人員。 同時(shí),百度飛槳還經(jīng)常開(kāi)展線上直播福利課程,畢竟自學(xué)嘛,也是程序員必備自我修養(yǎng)了。 從這些動(dòng)作中也不難看出,與谷歌、Meta讓開(kāi)源框架“野蠻生長(zhǎng)”的路線不同,百度飛槳不僅僅是為開(kāi)發(fā)者提供一個(gè)好用的底層框架,還投入了大量人力、物力來(lái)打造一個(gè)友好度更高、適用性更強(qiáng)的生態(tài)。 最后的最后,我們?cè)賮?lái)放眼瞭望一下整體人工智能產(chǎn)業(yè)的大環(huán)境。 去年4月,在首屆濟(jì)南國(guó)家級(jí)人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)高端峰會(huì)上,中國(guó)工程院院士潘云鶴就指出:
另一方面,IDC報(bào)告指出,安全性開(kāi)始成為開(kāi)發(fā)者使用開(kāi)源框架的考量因素之一。 而值得慶幸的是,潘云鶴院士表示,這方面中國(guó)也開(kāi)始慢慢形成自己的優(yōu)勢(shì),百度飛槳便是最好的證明之一。 正如馬艷軍博士所說(shuō):
十年技術(shù)投入,百度飛槳站穩(wěn)中國(guó)市場(chǎng),未來(lái)的挑戰(zhàn)依然艱巨,挑戰(zhàn)總是與機(jī)會(huì)并存,相信心懷技術(shù)信仰的百度,可以不斷推動(dòng)中國(guó)的人工智能走在世界的前列。 — 完 —
|
|