以前看一部戰(zhàn)爭片的時候,對一位軍工廠領(lǐng)導的臺詞印象深刻。他是這么說的:前方的戰(zhàn)士看見我們運過去的炮彈,心里比看見麻花都甜。 在一項事業(yè)或者工程進行當中,從業(yè)者對核心生產(chǎn)資源的那種期待,是外人難以估量和理解的。無論是戰(zhàn)爭、醫(yī)療還是工程,在現(xiàn)代工業(yè)體系中,毫無疑問資源就是一切。這種對基礎資源的期待,如今也發(fā)生在AI產(chǎn)業(yè)當中。 AI的核心資源當然有很多。但毫無疑問,深度學習框架是其中之一。毋庸諱言,中國的深度學習框架發(fā)展比歐美要晚,起步階段的失位和整個產(chǎn)業(yè)的高速發(fā)展,造成了中國AI開發(fā)者和創(chuàng)業(yè)公司們某種程度的“框架饑渴癥”。 好在這種情況正在被積極“治療”中。近兩年我們可以看到百度PaddlePaddle不斷進行重大升級。而剛剛傳來消息,百度宣布成立深度學習技術(shù)平臺部,其隸屬AI技術(shù)平臺體系(AIG),由兩位AI技術(shù)專家于佃海、馬艷軍分任總架構(gòu)師和部門負責人。 成立專門部門進行打造,毫無疑問意味著PaddlePaddle的戰(zhàn)略地位進一步提升。從一個技術(shù)平臺到一個獨立部門,這個中國深度學習框架史上的首次操作,應該可以看做AI產(chǎn)業(yè)的一次飛躍。 這次起跳意味著什么?有什么前因和后果? 讓我們把PaddlePaddle的幸福時刻定格在這里,看一看深度學習框架的中國之旅,背后都有怎樣的辛秘。 一個巨大的需求 PaddlePaddle之所以不斷上升,從技術(shù)資源、人才資源,再到今天的企業(yè)架構(gòu)資源,相繼往這個有點萌的名字上傾斜,背后的道理很簡單:PaddlePaddle卡住了一個巨大而且必需的市場需求。 百度于2013年成立深度學習實驗室,并推出自主研發(fā)的深度學習平臺,即PaddlePaddle的前身;2016 年 8 月,PaddlePaddle正式開源。該平臺對標谷歌TensorFlow,是中國首個、也是當前國內(nèi)唯一開源開放的深度學習框架。而這個首個,也映射著當時中國AI開發(fā)者三個難以搞定的真實需求: 一、中文需求 TensorFlow、caffe這樣的框架,當然是沒有中文文檔和訓練數(shù)據(jù)的。但是語言又是AI世界中的重中之重??偛荒茏屩袊袌錾系腁I系統(tǒng)都說英語吧?在PaddlePaddle開源之前,還有個更痛苦的情況是,如果中文AI開發(fā)者訓練的算法出問題了,他就必須越洋電話和郵件去找歐美的客服。這其中的溝通成本和效率可想而知。 所以當PaddlePaddle開源,百度開始大規(guī)模為開發(fā)者提供中文訓練文檔,以及中文客服,并不斷共享百度在語音交互這個強勢領(lǐng)域的數(shù)據(jù)與算法技術(shù),這對于中國AI開發(fā)者當然是雪中送炭。僅僅靠這一點,在AI開發(fā)的興起時刻,PaddlePaddle就確立了存在的意義與必要性。 二、大規(guī)模應用需求 據(jù)說開發(fā)PaddlePaddle,最早在百度內(nèi)部的目的就是應對TF等框架,不適應大規(guī)模訓練的問題。由于TF這樣的框架更偏于學院化和深層開發(fā),這就導致企業(yè)級AI應用非常難適應。而中國恰恰是一個流量大、數(shù)據(jù)多、用戶存量大的市場,歐美的小而精模式當然水土不服。于是當PaddlePaddle高舉大規(guī)模應用的旗幟出現(xiàn),中國AI開發(fā)者,甚至不少歐美開發(fā)者當然蜂擁而至。如今PaddlePaddle在持續(xù)升級下,系統(tǒng)穩(wěn)定性已經(jīng)可以支持工業(yè)界服務的規(guī)模,這在業(yè)界中也是首屈一指的,更加適合了中國市場AI與傳統(tǒng)行業(yè)結(jié)合、大規(guī)?;ヂ?lián)網(wǎng)AI應用的真實情況。 三、國家安全需求 中興事件已經(jīng)可以看出,底層技術(shù)掌握在其他國家手中是相當可怕的一件事。一言不合就給你掐斷上游,簡直沒地方講理去。 試想一下,安防、軍事等領(lǐng)域的AI應用,假如用歐美框架訓練那是多么可怕的一件事?這種情況下,完全自主掌握的AI框架變得格外重要。 而到目前為止PaddlePaddle已經(jīng)完成了從芯片到文檔,從框架到應用工具的全面自主化。其還在NLP、知識圖譜、語音圖像等領(lǐng)域進行了深度布局,能夠滿足從產(chǎn)業(yè)界到社會服務的不同AI開發(fā)需求,這也就讓整個國家經(jīng)濟體的AI發(fā)展安全系數(shù)大為飆升。所謂最適合中國國情的深度學習框架,并不只是說說而已。 占領(lǐng)了這些核心需求,PaddlePaddle開始了不斷積累升級,并在適當時刻準備沖刺與跳躍。這次百度成立深度學習技術(shù)平臺部,可以看做PaddlePaddle產(chǎn)業(yè)根基來到了全新階段。 日漸穩(wěn)固的根基 想要贏得未來,就必須穩(wěn)固住現(xiàn)在的優(yōu)勢與地位。而PaddlePaddle來到可獨立成為部門的節(jié)點上,實際也標志著百度對PaddlePaddle目前產(chǎn)業(yè)根基與身位優(yōu)勢的判斷。 可以看到,三方面的領(lǐng)先優(yōu)勢支撐了PaddlePaddle可以獨立出來,擴大招兵買馬規(guī)格,走上產(chǎn)業(yè)快速迭代的快車道: 一、技術(shù)已經(jīng)積累充足 深度學習框架的好壞,除了開發(fā)基礎之外,主要有幾個方面的技術(shù)來評定:工具是否健全而充足;顆粒精細程度能否滿足深度開發(fā)需求;社區(qū)建設與數(shù)據(jù)資源的建設水平。這些領(lǐng)域,中國的深度學習框架是一個必須快速追趕歐美,必須在緊迫時間完成連續(xù)升級的過程。好在PaddlePaddle基本已經(jīng)證明了技術(shù)建設速度可以被信任。 2016年開源之后,2017 年 11 月,百度發(fā)布更細粒度的新一代深度學習框架——PaddlePaddle Fluid;2018年7月的百度AI開發(fā)者大會(Baidu Create 2018)上,百度發(fā)布PaddlePaddle 3.0,包括完整的核心框架,以及AI Studio、AutoDL、EasyDL等可以讓開發(fā)者平等便捷獲取頂尖AI能力的組件。 到目前為止,PaddlePaddle已經(jīng)組成了數(shù)據(jù)、工具、框架上的全面技術(shù)優(yōu)勢,可以與歐美一線框架看齊。 二、人才優(yōu)勢不斷擴大 這次成立深度學習技術(shù)平臺部,據(jù)說PaddlePaddle將一舉成為40人的研發(fā)團隊。而且兩位領(lǐng)頭人都在百度AI業(yè)務最前線奮戰(zhàn)多年,不僅對深度學習的理論和算法有深刻理解,還具有超強的產(chǎn)品和工程能力。 資料顯示,早在2010年,于佃海作為核心成員之一推動了百度搜索使用機器學習的排序算法;2012年,百度開始深度學習的研究,于佃海是第一批研究人員,他帶頭研發(fā)的深度學習技術(shù)被百度多個產(chǎn)品廣泛應用。馬艷軍曾獲國家科技進步獎,并曾經(jīng)負責百度信息流內(nèi)容的技術(shù)研發(fā),大幅提升了信息流的用戶體驗,支撐了百度信息流實現(xiàn)高速增長。 兩位T10級別業(yè)界領(lǐng)軍人物帶隊,展現(xiàn)出了百度豪華的AI人才儲備。圍繞PaddlePaddle,無論是人才成長還是人才吸引力,都已經(jīng)達成了國際水準。 三、身位優(yōu)勢不斷加強 在AI產(chǎn)業(yè)發(fā)展上行到新局面,AI與IoT結(jié)合不斷加深、傳統(tǒng)行業(yè)應用AI潛力被釋放、無人駕駛等領(lǐng)域風口來臨的時候,AI基礎設施的價值也相應地被放大。但是就國內(nèi)市場而言,想要在短期內(nèi)再出現(xiàn)可開源,并且工具化相應完善的深度學習框架,基本已經(jīng)是極小概率事件。而且社群建設與生態(tài)建設更是需要時間。早投入早回報,已經(jīng)開始讓PaddlePaddle呈現(xiàn)出產(chǎn)業(yè)周期紅利。 戰(zhàn)略資源不斷升級,百度體系內(nèi)的地位不斷明晰,國際影響力與吸引力不斷增強。等等優(yōu)勢讓PaddlePaddle值得被加大投入力度,達成更高水準的產(chǎn)業(yè)聚合。而與此同時,PaddlePaddle的未來要走向哪里,似乎也再愈發(fā)的明晰了起來。 已然清晰的方向 成立專門部門之后,PaddlePaddle會走向何方,這或許是一個大眾比較關(guān)心的問題。但是就PaddlePaddle的過往發(fā)展歷程而推斷,其發(fā)展方向其實一直非常明確。所做的是在推動產(chǎn)業(yè)迭代速率,為已經(jīng)清晰明確的方向添柴加火。 從過往分析,“兩化一目標”似乎可以被視作PaddlePaddle的未來。 一、基礎設施化 PaddlePaddle自誕生之日起,到不斷的重大升級和產(chǎn)業(yè)迭代,都是以成為中國AI產(chǎn)業(yè)與廣大開發(fā)者的基礎設施為目標。而在今天的獨立特性確立,生態(tài)化基礎牢固之后,PaddlePaddle勢必將進一步加強自身成為AI產(chǎn)業(yè)基礎設施的優(yōu)勢,與產(chǎn)業(yè)深度結(jié)合,不斷向開發(fā)者開放新的資源與產(chǎn)業(yè)優(yōu)勢。伴隨著百度在無人駕駛、對話式AI,以及AI技術(shù)綜合應用領(lǐng)域的擴展,PaddlePaddle也將持續(xù)加深行業(yè)下沉力,完成其成為基礎開發(fā)必經(jīng)之路的產(chǎn)業(yè)使命。 二、生態(tài)化 AI不能閉環(huán),必須無功利地開放和共享,造就持續(xù)有生命力的AI開發(fā)環(huán)境,這是已經(jīng)在世界AI開發(fā)舞臺上得到印證的判斷。但中國的AI開發(fā)生態(tài)僅剛剛起步,必須有更強的生態(tài)賦能方案出臺,催化開發(fā)生態(tài)的成熟。 這是PaddlePaddle的第二個目標,也是其成立專門部門的核心支撐因素:提高生態(tài)賦能能力,建設縱深度和生命力更強的AI開發(fā)群落。 目前我們看到PaddlePaddle對開發(fā)者的全方位扶持已經(jīng)不僅局限于技術(shù)框架。公開課、AI大賽、與高校合辦師資培訓班等等方式都成為常態(tài)。而穩(wěn)固的生態(tài)會堆積成雪球效應,這也是AI產(chǎn)業(yè)的必須要求。 在百度AI開發(fā)者大會上,我們已經(jīng)看到PaddlePaddle生態(tài)化的成果。比如北京工業(yè)大學的四位學生利用PaddlePaddle制造了一臺智能桃子分揀機,實現(xiàn)桃子的自動分揀;援藏醫(yī)生陳靜飛借助基于PaddlePaddle的定制化訓練與服務平臺EasyDL,進行顯微鏡下寄生蟲蟲卵識別。這些能夠改變產(chǎn)業(yè)效率,甚至承擔社會責任的AI開發(fā),都是從PaddlePaddle的生態(tài)化進程中汲取而來。 三、目標專精于工業(yè)應用 AI的未來在于與經(jīng)濟體結(jié)合,成為工業(yè)體系換發(fā)活力的再生藥水。那么對深度學習開發(fā)框架的最高要求,就是能夠全面賦能工業(yè)體系,提高工業(yè)級應用AI的可能性,降低準入門檻。 厲兵秣馬的PaddlePaddle,已經(jīng)將目標對準了工業(yè)級應用。目前PaddlePaddle已經(jīng)開放近20種工業(yè)級模型,各項AI技術(shù)被廣泛應用于生產(chǎn)中。 從PaddlePaddle的明晰目標中可以看出,中國AI開發(fā)的大任只是剛剛開始而已。有了基礎,還需要有不斷的投入和社會意愿的激發(fā)。但無論怎么說,PaddlePaddle都是一種開始。 美妙的開始,是一切想象力與恢弘故事的源頭。 |
|