無人豬場,需要EasyDL。 “母豬正在生產(chǎn)中,無法實(shí)時(shí)知道有幾只豬仔,健康情況如何”,一位坐擁上數(shù)千頭豬的河南養(yǎng)豬大戶最近總是陷入這樣的焦慮。 席卷全國各地的豬瘟剛剛過去,為了加強(qiáng)防護(hù),他的豬場幾乎開啟了無人養(yǎng)殖的模式,這也為他帶來了很多頭疼的問題。 工作人員進(jìn)出一次豬棚,需要消毒、檢測,全副武裝,對于大規(guī)模養(yǎng)殖來說,成本、耗時(shí)不說,更重要的風(fēng)險(xiǎn)很高,他清楚地記得一頭豬感染豬瘟,導(dǎo)致豬棚內(nèi)上百只豬死亡的畫面。 在嚴(yán)格的控制人員進(jìn)出的情況下,像“豬口普查”,“健康檢查”等工作也變更難了。 回想起去年這個(gè)時(shí)候的焦慮,這位養(yǎng)豬大戶輕松了不少?,F(xiàn)在的他通過AI技術(shù),可以在家中實(shí)時(shí)監(jiān)控豬棚內(nèi)的狀況、判斷豬崽的健康狀態(tài)。 不僅降低了管理的風(fēng)險(xiǎn)和成本,提高了效率,而且還避免了因其他工作人員經(jīng)驗(yàn)不足,而對豬崽健康狀況的判斷失誤,這也是大規(guī)模養(yǎng)殖普遍存在的一個(gè)痛點(diǎn)。 而這項(xiàng)AI技術(shù)就是百度的零門檻AI開發(fā)平臺—EasyDL。 1 “零代碼”搞定AI需求 EasyDL是基于百度飛槳深度學(xué)習(xí)平臺推出的高效易用的零門檻、一站式AI開發(fā)平臺,支持智能數(shù)據(jù)、模型開發(fā)、服務(wù)部署等全流程服務(wù)。目前已經(jīng)支持圖像分類、物體檢測、圖像分割、音視頻分類、語音識別自訓(xùn)練、表格數(shù)據(jù)預(yù)測、文本分類、情感傾向分析等任務(wù)類型,可以幫助中小企業(yè)結(jié)合業(yè)務(wù)需求,解決效率和成本的問題。 怎么理解呢? 比如,上述豬崽體檢方面,用戶只需將病豬的圖像數(shù)據(jù)導(dǎo)入EasyDL平臺,訓(xùn)練定制化AI模型,就可以將“人為診斷經(jīng)驗(yàn)”復(fù)制為機(jī)器學(xué)習(xí)經(jīng)驗(yàn),再經(jīng)過物體檢測技術(shù),無需人眼觀察也可以準(zhǔn)確判斷豬崽的健康狀態(tài)。 如此來說,EasyDL可以理解成:根據(jù)定制化場景需求,通過學(xué)習(xí)“有經(jīng)驗(yàn)的專家知識”,來代替人類解決規(guī)模化的復(fù)雜問題,進(jìn)而提升成本和效益。 值得一提的是,百度AI平臺研發(fā)部總經(jīng)理忻舟,在接受雷鋒網(wǎng)采訪時(shí)多次提到:
這一點(diǎn)在AI養(yǎng)豬、肉牛稱重,工業(yè)質(zhì)檢、橋梁檢修等諸多成功案例中都有所體現(xiàn),而且也普遍受到了用戶的好評。 但忻舟也強(qiáng)調(diào):
自2017年底上線,到如今近三年的技術(shù)研發(fā)和迭代,EasyDL在數(shù)據(jù)服務(wù)、模型精度、部署服務(wù)等方面不斷升級,已經(jīng)能夠處理更多、更復(fù)雜的應(yīng)用場景。 在這里,忻舟為我們分享了一個(gè)典型案例:EasyDL幫助一家專業(yè)獵頭公司解決了其核心業(yè)務(wù)問題。 這家公司名為瀚才獵頭,自創(chuàng)立以來一直面臨著一個(gè)核心問題:200萬條數(shù)據(jù)的人才庫,利用率只有不到10%。 作為一家獵頭公司,如何高效地為客戶推薦合適的人才是他們的核心業(yè)務(wù),也是其在行業(yè)發(fā)展中的核心競爭力。 瀚才獵頭有5位創(chuàng)始人,在業(yè)務(wù)發(fā)展過程中積累了很多重要的客戶資源和龐大的人才庫,但其非結(jié)構(gòu)化數(shù)據(jù)庫和傳統(tǒng)簡歷初篩方法,讓這些資源和優(yōu)勢沒有得到很好的發(fā)揮和利用。 而這個(gè)局面在使用EasyDL后發(fā)生了改變。以前按照關(guān)鍵詞搜索的方法,每天只能找到60-70份合適的候選者簡歷,現(xiàn)在經(jīng)過數(shù)據(jù)結(jié)構(gòu)化處理后,20分鐘就可能達(dá)到600-1000份,而且精準(zhǔn)度達(dá)到了95%以上。 整個(gè)效率提升了200倍,節(jié)省了時(shí)間、人力成本的同時(shí),200萬簡歷庫也得到了充分的利用。 一位創(chuàng)始人坦言,他們之所以選用EasyDL,不僅是因?yàn)閿?shù)據(jù)結(jié)構(gòu)化的效果好,更重要的是其零開發(fā)門檻、一站式服務(wù)的特性,節(jié)省了自己配置技術(shù)團(tuán)隊(duì),做數(shù)據(jù)處理、算法研發(fā)和算力支持的成本。 那么,無任何開發(fā)經(jīng)驗(yàn)的HR是如何完成AI模型訓(xùn)練和部署的呢? EasyDL操作流程只需以下四步:創(chuàng)建模型、數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練和應(yīng)用部署。 他們根據(jù)業(yè)務(wù)需求,按照“職級”和“職能”兩級分類對200萬數(shù)據(jù)的人才庫進(jìn)行了結(jié)構(gòu)化處理:
可以看到,以上操作過程無需任何代碼基礎(chǔ),只要按照業(yè)務(wù)需求,完成數(shù)據(jù)處理和提交,選擇部署方式即可,而且精準(zhǔn)度很高。不過1小時(shí)的AI模型訓(xùn)練,幫助他們解決了自創(chuàng)業(yè)以來最頭疼的業(yè)務(wù)問題。 另外,需要強(qiáng)調(diào)的是,以上看似簡單,易操作的背后,是其內(nèi)部復(fù)雜、先進(jìn)的AI技術(shù)支持。 2 降本增效,一站式AI服務(wù) 在數(shù)據(jù)處理環(huán)節(jié),EasyData提供了數(shù)據(jù)采集、清洗、擴(kuò)充、標(biāo)注全方位服務(wù)。 根據(jù)2019年AI機(jī)器學(xué)習(xí)項(xiàng)目調(diào)研的報(bào)告,96%的企業(yè)都在“數(shù)據(jù)”一環(huán)遇到了難題,尤其是數(shù)據(jù)標(biāo)注,耗時(shí),而且準(zhǔn)確度不高。 針對這一問題,忻舟介紹稱,EasyData提供了豐富的智能標(biāo)注方案,支持物體檢測、圖像分割和文本分類三種數(shù)據(jù)類型的智能標(biāo)注,只需標(biāo)注少量數(shù)據(jù),其余便可通過“智能標(biāo)注”自動完成。在相同任務(wù)和同等模型效果下,數(shù)據(jù)標(biāo)注量平均可以減少70%。 在上述簡歷庫的文本分類中,員工手動標(biāo)記了1萬條,其余199萬全部是自動完成。 另外,在數(shù)據(jù)采集、清洗和擴(kuò)充方面也經(jīng)常出現(xiàn)問題。忻舟介紹稱,一家做果蔬智能識別系統(tǒng)的創(chuàng)業(yè)公司,他們的果蔬電子秤,在超市試運(yùn)營時(shí),經(jīng)常會出現(xiàn)因物體遮擋、光線不足,導(dǎo)致數(shù)據(jù)采集質(zhì)量差的問題。 在使用EasyDL后,通過對圖像數(shù)據(jù)進(jìn)行相似度的去重去模糊,剪裁,旋轉(zhuǎn),鏡像以及數(shù)據(jù)增強(qiáng)等處理,在50種水果的測試中,準(zhǔn)確率達(dá)到了95%以上。 同時(shí),EasyDL還在數(shù)據(jù)采集方面,提前對端設(shè)備進(jìn)行了測評和適配,免除了使用者在設(shè)別選型、調(diào)試和集成開發(fā)工作上的成本,將采集效率從“周級”提升到了“小時(shí)級”。 最后,忻舟重點(diǎn)強(qiáng)調(diào)稱,EasyDL根據(jù)實(shí)際的用戶需求還提供了數(shù)據(jù)回流功能,在數(shù)據(jù)處理上形成了一個(gè)完整閉環(huán),使數(shù)據(jù)處理更加高效。
瀚才的簡歷文本分類采用文心(ERNIE)預(yù)訓(xùn)練模型,訓(xùn)練效果達(dá)到了95%+。預(yù)訓(xùn)練相當(dāng)提前學(xué)習(xí)了大量NLP語料,在一定的背景知識下,再通過持續(xù)學(xué)習(xí)的語義理解框架,對輸入數(shù)據(jù)進(jìn)行識別,可以有效提高識別的精準(zhǔn)度。 在模型訓(xùn)練上,百度還融合了自研的高性能自動數(shù)據(jù)增強(qiáng)(Auto Augment)、自動超參搜索(Auto Finetuner)和NAS(自動網(wǎng)絡(luò)架構(gòu)搜索)等自動化建模技術(shù),可以進(jìn)行模型自動調(diào)優(yōu),降低算法工程師的調(diào)優(yōu)成本,同時(shí),模型精度也可以平均提升10%以上。
其中,設(shè)備端 SDK,適配了NV Jetson 系列、Intel 神經(jīng)加速棒、華為 NPU、華為 Atlas、高通 DSP、RK 等十幾種業(yè)界主流的端設(shè)備。 在軟硬件一體部署上,EasyDL適配了市面上6種高性價(jià)比的軟硬件,覆蓋高中低全矩陣,模型識別速度可提升十倍,例如EasyDL加小體積低功耗的英特爾芯片,在輕量級模型MobileNet V2上,25毫秒就可以完成端到端的預(yù)測和推理;英偉達(dá)Jason可以滿足中高性能和超高性能的場景化需求,而它在V2模型上只需要4毫秒。 3 加速AI落地,直擊各行各業(yè) 2020年,EasyDL開始走向加速AI場景化落地的階段。 AI落地,是近些年人工智能產(chǎn)業(yè)發(fā)展的主旋律。一方面,計(jì)算機(jī)視覺、自然語言處理等技術(shù)已逐漸趨于成熟,急需走向現(xiàn)實(shí)場景發(fā)揮價(jià)值,另一方面,隨著社會的快速發(fā)展,中小企業(yè)的AI需求空間也在進(jìn)一步突顯。 但要想在AI和需求之間達(dá)到最佳匹配,還存在很多挑戰(zhàn)。 從2017年正式上線,實(shí)現(xiàn)從0到1的躍遷,到2018年成功案例的大量出現(xiàn),EasyDL在AI落地方面已經(jīng)初見成效。忻舟表示,2020年,隨著技術(shù)的逐步成熟,EasyDL會加快落地速度,進(jìn)一步提升AI落地能力。 具體來講,將繼續(xù)從以下三個(gè)難點(diǎn)入手: AI門檻:這是所有企業(yè)尋求智能化轉(zhuǎn)型的首要痛點(diǎn),尤其是對于中小企業(yè)而言,一方面不懂技術(shù),不知道哪些場景需求可以通過AI來實(shí)現(xiàn)。即使了解,對于復(fù)雜的AI技術(shù),學(xué)會應(yīng)用也是一大難點(diǎn)。 另一方面,對于有技術(shù)團(tuán)隊(duì)的企業(yè)來講,AI底層基礎(chǔ)設(shè)施要求很高,需要大量的資源、成本投入,而且最終達(dá)成的效果可能也未必能夠滿足需求。 從這兩點(diǎn)出發(fā),EasyDL一直致力于開發(fā)零算法基礎(chǔ),人人可用的AI開發(fā)平臺,同時(shí),基于百度的海量數(shù)據(jù)和研發(fā)優(yōu)勢提升模型訓(xùn)練性能,打造從端到端的一站式服務(wù),滿足算法工程師們的應(yīng)用需求。 目前EasyDL的零門檻、專業(yè)性強(qiáng)等特性已經(jīng)被中小企業(yè)廣泛接收,其官網(wǎng)顯示,使用EasyDL的用戶數(shù)已經(jīng)超過70萬,覆蓋20多個(gè)行業(yè)場景,包括互聯(lián)網(wǎng)、工業(yè)、農(nóng)業(yè)、醫(yī)療、物流、零售、教育、交通等; 定制化需求:各行各業(yè)有著豐富的定制化場景需求,其中,最為明顯可以說是零售行業(yè),如商品檢測中的相似、遮擋檢測,智能結(jié)算中的 SKU 快速更新等,都需要定制化的AI解決方案。 在這方面,EasyDL除了提供通用版本外,還開發(fā)了零售行業(yè)版。 為了應(yīng)對更復(fù)雜場景的檢測需求,零售版主要新增了以下核心功能:
基于以上技術(shù),零售版已經(jīng)在商品陳列審核、無人藥柜等多個(gè)場景下被廣泛使用。百度團(tuán)隊(duì)透露,接下來,還會針對農(nóng)業(yè)、工業(yè)等行業(yè)推出更多定制化版本。 AI技術(shù)能力:它是任何AI產(chǎn)品應(yīng)用落地的基礎(chǔ),也是核心。在這方面,基于百度飛槳開源深度學(xué)習(xí)平臺的EasyDL具備獨(dú)特的領(lǐng)先優(yōu)勢。 一般來講,市場上AutoDL產(chǎn)品的核心競爭力,無外乎兩個(gè)方面:一是效率問題,AI應(yīng)用最基礎(chǔ)的訴求就是如何幫助企業(yè)降低時(shí)間成本,搶占市場先機(jī)。 圍繞這一點(diǎn),EasyDL在模型方面,基于飛槳的超大規(guī)模預(yù)訓(xùn)練、并行訓(xùn)練,顯著提升模型訓(xùn)練速度;在數(shù)據(jù)服務(wù)方面,為數(shù)據(jù)采集提前適配主流硬件,并提供從采集到回流的完整解決方案,節(jié)省數(shù)據(jù)處理時(shí)間。EasyDL是業(yè)內(nèi)首個(gè)提供一站式智能數(shù)據(jù)服務(wù)的產(chǎn)品。 最后值得一體的是,設(shè)備端的部署服務(wù)。忻舟介紹稱,邊緣端部署因?yàn)樗懔Φ?、?nèi)存小的特性,近些年在行業(yè)內(nèi)非常火爆,用戶需求非常大。因此,為企業(yè)提供高性能的邊緣端部署方案也是EasyDL的重點(diǎn)研發(fā)方向。 二是使用效果,這是滿足企業(yè)AI需求的關(guān)鍵性指標(biāo)。從技術(shù)層面來看,可以具體理解為文本分類的準(zhǔn)確性,物體檢測的精準(zhǔn)度。 在這方面,EasyDL內(nèi)置的基于飛槳的文心ERNIE和超大規(guī)模圖像預(yù)訓(xùn)練模型發(fā)揮了獨(dú)特優(yōu)勢,經(jīng)檢測,在視覺任務(wù)中,通過百度數(shù)據(jù)庫10萬+分類、6500萬張圖片訓(xùn)練的預(yù)訓(xùn)練模型,平均精度可提升 3.24%-7.73%;在物體檢測任務(wù)中,經(jīng)過800+標(biāo)簽、170萬圖片,1000萬+檢測框訓(xùn)練的預(yù)訓(xùn)練模型,平均精度可提升1.78%-4.53%。 除此之外,百度團(tuán)隊(duì)還升級了模型壓縮技術(shù),通過降低端側(cè)模型體積,進(jìn)一步提升模型性能。 最后談到EasyDL的進(jìn)一步研發(fā)方向,忻舟表示,將繼續(xù)圍繞簡單、但更專業(yè)的理念來開展,具體來說涉及以下幾個(gè)方面:
另外,忻舟還重點(diǎn)提及了EasyDL的共享生態(tài)建設(shè)。他表示,希望更多企業(yè)能夠加入到EasyDL落地中來,通過真實(shí)的業(yè)務(wù)需求,探索更多AI應(yīng)用空間,由此,EasyDL也能夠根據(jù)實(shí)際場景,不斷提升技術(shù)能力,為更多企業(yè)賦能。 出于這一目的,百度團(tuán)隊(duì)近日還推出了“萬有引力計(jì)劃”,進(jìn)一步降低AI門檻,助力中小企業(yè)降本增效。 4 削平“AI門檻”,挖掘潛在場景 毋庸置疑的是,AI應(yīng)用場景巨大且豐富,但需要深度的探索和挖掘。 此次,為了顛覆各行各業(yè)對AI高門檻的認(rèn)知,百度EasyDL面向所有中小企業(yè)推出了——萬有引力計(jì)劃。 該計(jì)劃旨在為萬家有AI需求的企業(yè)各提供一萬元專項(xiàng)基金,推動其智能化轉(zhuǎn)型。 通過EasyDL經(jīng)典版免費(fèi)完成模型定制、部署與應(yīng)用,即可領(lǐng)取萬元專項(xiàng)代金券。 無需了解算法細(xì)節(jié),最快10分鐘就可以訓(xùn)練出高精度AI模型。如果AI落地效果突出,還有機(jī)會獲得最高十萬元的特殊補(bǔ)貼! |
|