主講導(dǎo)師 | 趙鵬昊 本文編輯 | 師僥去年3月,智東西公開課推出超級(jí)公開課NVIDIA專場(chǎng),目前已講解完12場(chǎng),共12位主講導(dǎo)師參與。本次講解為超級(jí)公開課NVIDIA百度聯(lián)合專場(chǎng),也是超級(jí)公開課NVIDIA專場(chǎng)第11講,由百度AI技 ...
主講導(dǎo)師 | 趙鵬昊 本文編輯 | 師僥
去年3月,智東西公開課推出超級(jí)公開課NVIDIA專場(chǎng),目前已講解完12場(chǎng),共12位主講導(dǎo)師參與。
本次講解為超級(jí)公開課NVIDIA&百度聯(lián)合專場(chǎng),也是超級(jí)公開課NVIDIA專場(chǎng)第11講,由百度AI技術(shù)生態(tài)部高級(jí)算法工程師趙鵬昊主講,主題為《如何借助GPU集群搭建AI訓(xùn)練和推理平臺(tái)——零算法基礎(chǔ)的百度EasyDL定制化圖像識(shí)別揭秘》。
趙鵬昊老師對(duì)百度EasyDL定制化訓(xùn)練和服務(wù)平臺(tái)進(jìn)行了全面講解。EasyDL是基于大規(guī)模NVIDIA Tesla P4,P40為主的GPU集群搭建而成,使得算法小白也能通過這一平臺(tái)最快五分鐘完成一些小規(guī)模數(shù)據(jù)集的訓(xùn)練,獲得一個(gè)90%以上的高精度的定制化模型。目前EasyDL主要開放了圖像分類、物體檢測(cè)和聲音分類能力。
以下是趙鵬昊老師的主講實(shí)錄與大綱,共計(jì)9418字,預(yù)計(jì)10分鐘讀完。
大綱
1.AI賦能行業(yè)的痛點(diǎn)
2.EasyDL服務(wù)端和設(shè)備端技術(shù)解析
3.GPU集群加速EasyDL訓(xùn)練與推理
4.EasyDL賦能行業(yè)案例分享
主講實(shí)錄
趙鵬昊:大家好,我是百度的工程師,趙鵬昊。今天晚上給大家講解我們是如何利用GPU集群搭建的一些EasyDL平臺(tái)的。我們今天會(huì)從以下四點(diǎn)給大家進(jìn)行講解。第一點(diǎn)是:AI賦能行業(yè)的痛點(diǎn);第二點(diǎn):我們EasyDL平臺(tái)的服務(wù)端和設(shè)備端的技術(shù)解析,第三點(diǎn):我們?nèi)绾卫肎PU集群來加速EasyDL的訓(xùn)練和推理。最后是我們EasyDL對(duì)行業(yè)的一些案例的分享。
AI已經(jīng)是大家耳熟能詳?shù)拿~了,像我們生活中都能見到像人臉識(shí)別的技術(shù)、像我們百度出的小度在家、小度智能音箱這種智能語音的技術(shù)、多輪對(duì)話的技術(shù)還有我們百度與金龍客車合作的無人駕駛技術(shù)。這些都已經(jīng)慢慢的進(jìn)入到我們尋常人家并在改變我們的生活。近十幾年來,我們?cè)诶碚撋?、框架上、芯片上等等各個(gè)方面上技術(shù)的發(fā)展,AI正在成為新時(shí)代的電力。
為了讓AI成為新時(shí)代的電力,百度AI開放平臺(tái)開放了一些通用的模型來解決一些通用的需求,比方說,我們已經(jīng)開放了OCR技術(shù)、圖像識(shí)別、自然語言處理等技術(shù)。百度AI開放平臺(tái)使用通用的模型去解決一些同樣的問題,比如OCR技術(shù)里面會(huì)有一些身份證、銀行卡的OCR識(shí)別。這些技術(shù)運(yùn)用了我們百度內(nèi)部長(zhǎng)期積累的數(shù)據(jù)和算法,我們希望通過我們積累的這些數(shù)據(jù)和算法,能夠提供高質(zhì)量的模型來給用戶使用。
有些客戶會(huì)有一些像右邊這些圖中的需求:比方說:他們想要通過圖片去識(shí)別出這是哪種中草藥,以此來幫助他們的工作人員去進(jìn)行藥品鑒定。再比如說:品牌的零售廣告主,他們會(huì)簽約一些小超市和小賣部,讓他們把自己的產(chǎn)品擺放在貨架大部分的位置,所以就有了巡檢員去巡檢擺放合不合規(guī)。
但是通用模型解決不了這些需求,這就涉及到AI定制化需求時(shí)碰到一些難題,這些客戶的核心訴求,第一:通用的API不能夠滿足他們的業(yè)務(wù)需求,需要根據(jù)他們自己的數(shù)據(jù)去訓(xùn)練他們獨(dú)特的模型。第二:這些客戶往往對(duì)自己的專業(yè)的領(lǐng)域知識(shí)很了解,但是他們不了解深度學(xué)習(xí)的理論和模型訓(xùn)練的方法,而且他們也不希望去面對(duì)繁瑣的訓(xùn)練、部署、運(yùn)維等工作。第三:他們希望快速的去驗(yàn)證這個(gè)模型的效果。
用戶在驗(yàn)證效果滿意之后,還希望能夠拿到一個(gè)定制化服務(wù)的API或者想要做自由化的部署,拿到一個(gè)離線的SDK,去結(jié)合他們的產(chǎn)品做成一整套自己的產(chǎn)品和服務(wù)。
EasyDL平臺(tái)正是看到了AI賦能行業(yè)的痛點(diǎn),看到了用戶在做定制化需求時(shí)的訴求,所以開發(fā)了這樣一個(gè)定制化訓(xùn)練模型和服務(wù)的平臺(tái),左圖是EasyDL平臺(tái)的整體架構(gòu),用戶提供自己的數(shù)據(jù),這些數(shù)據(jù)可能是圖片、文本、聲音或者視頻等等。然后放入平臺(tái)中,由平臺(tái)做加工學(xué)習(xí)、部署和服務(wù)。最終給用戶提供一個(gè)云端獨(dú)立的RestAPI或者是一個(gè)離線SDK,讓用戶能夠補(bǔ)充到自己的終端智能設(shè)備中。
我們跟普通機(jī)器學(xué)習(xí)和深度學(xué)習(xí)工具的差異,跟TensorFlow或跟百度自己的PaddlePaddle這些工具的差異是:提供從數(shù)據(jù)到服務(wù)的一站式平臺(tái),不需要用戶有任何機(jī)器學(xué)習(xí)或深度學(xué)習(xí)基礎(chǔ),并且我們按能力劃分:比如圖像分類能力、物體檢測(cè)能力、聲音分類能力以及剛上線的聲音分類能力后面還會(huì)有更多能力。我們不僅提供了一個(gè)云端的RestAPI的服務(wù),還提供了設(shè)備端SDK的服務(wù)。
并且EasyDL平臺(tái)使用方便、訓(xùn)練模型更加輕快、精度更高,而且我們有強(qiáng)安全的策略能夠保護(hù)用戶的數(shù)據(jù)和模型。
下面給大家介紹EasyDL平臺(tái)服務(wù)端和設(shè)備端的技術(shù)。首先是服務(wù)端的核心技術(shù),下面從四個(gè)方面給大家介紹。第一個(gè)是說我們?nèi)绾翁峁臄?shù)據(jù)到模型到接口的一站式服務(wù)。里面就是主要涉及到我們開發(fā)的AIworkflow的分布式引擎以及百度的PaddlePaddle深度學(xué)習(xí)框架。第二是在數(shù)據(jù)較少的情況下如何做到訓(xùn)練效率的提高,主要涉及到我們遷移學(xué)習(xí)技術(shù)。第三:如何做到更高的精度。主要是Auto Model Search和Early Stopping的機(jī)制。最后給大家介紹一下我們EasyDL平臺(tái)模型效果評(píng)估的功能。
一般的深度學(xué)習(xí)工作流程如下:將大量標(biāo)注好的數(shù)據(jù)存在數(shù)據(jù)倉(cāng)庫中。然后通過一些數(shù)據(jù)清洗工具做ETL。清洗數(shù)據(jù)并提取需要的特征,可能還會(huì)做一些訓(xùn)練及驗(yàn)證集切分等。用這些清洗好的數(shù)據(jù)做分布式訓(xùn)練,之后對(duì)得到的模型去做一個(gè)效果評(píng)估。如果滿意,最終會(huì)把它去做一個(gè)部署,然后可以讓它上線服務(wù)。
我們AI的訓(xùn)練集往往很大。在大數(shù)據(jù)領(lǐng)域,大家都知道經(jīng)典的3V原則,無論是數(shù)據(jù)容量、數(shù)據(jù)增長(zhǎng)速度以及數(shù)據(jù)多樣性都非常大。所以我們?cè)诠こ躺?,加入了一個(gè)大數(shù)據(jù)工程系統(tǒng)作為基礎(chǔ)設(shè)施來提高我們整個(gè)EasyDL的效率和便利性。右圖是EasyDL的AIworkflow的分布式引擎的解決方案,左圖是我們用mongoDB Hadoop HDFS來做的一個(gè)分布式存儲(chǔ)。
我們后面會(huì)用spark集群去對(duì)數(shù)據(jù)做分布式的預(yù)處理和模型最后的分布式評(píng)估。在訓(xùn)練階段我們是用kubernetes集群來做調(diào)度。模型是用paddlepaddle寫的。最后呢,我們把訓(xùn)練好的模型通過docker技術(shù)在平臺(tái)上做一個(gè)服務(wù)。
我們?cè)趐addlepaddle框架的API上做進(jìn)一步的封裝。我們對(duì)數(shù)據(jù)的預(yù)處理、模型的訓(xùn)練、模型的評(píng)估等階段,做了進(jìn)一步的抽象。這樣使得工作流可以完全的實(shí)現(xiàn)配置化和自動(dòng)化。
剛才我們也提到了paddlepaddle這種百度開源的深度學(xué)習(xí)的框架。paddlepaddle上面開源了我們百度一系列的成熟的模型和數(shù)據(jù)。并且他還有大量的中文的文檔視頻培訓(xùn)課程等。所以說他可以說是最適合我們中國(guó)的開發(fā)者的一個(gè)框架,以及paddle mobile、可伸縮擴(kuò)展EDL和可視化VisualDL插件等可伸縮的擴(kuò)展的、可視化組件等這些功能。右邊是我們EasyDL使用paddlepaddle的一個(gè)應(yīng)用事例。從這個(gè)事例中我們可以看出來,用paddlepaddle做我們模型的定義和訓(xùn)練是非常方便的。
一般而言,深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需要大量的標(biāo)注數(shù)據(jù),但是有定制化需求的客戶擁有的標(biāo)注數(shù)據(jù)往往有限。而且從頭訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)是很花時(shí)間的,但是客戶希望更快地得到訓(xùn)練的模型。
為了解決這樣的矛盾,我們采用了遷移學(xué)習(xí)技術(shù)。遷移學(xué)習(xí)通過源領(lǐng)域數(shù)據(jù)學(xué)習(xí)到知識(shí),然后將其應(yīng)用到相關(guān)的目標(biāo)領(lǐng)域中,幫助目標(biāo)領(lǐng)域的任務(wù)完成訓(xùn)練。比如,我們可以在一個(gè)通用的植物分類模型中學(xué)習(xí)到一些識(shí)別植物的知識(shí),然后將這種知識(shí)應(yīng)用到前面提到的中草藥識(shí)別任務(wù)中,幫助它更快更好的訓(xùn)練。
舉個(gè)例子,比如說我們剛才提到的中草藥識(shí)別。如果說我們有一個(gè)通用的植物分類模型。那么我們就可以將這個(gè)模型中學(xué)習(xí)到的一些識(shí)別植物的知識(shí)運(yùn)用到中草藥分類的任務(wù)當(dāng)中,來幫助他更好的去做訓(xùn)練。具體來說,我們是將百度大規(guī)模的標(biāo)注數(shù)據(jù)集在深度神經(jīng)網(wǎng)絡(luò)上去做預(yù)訓(xùn)練,然后我們得到訓(xùn)練的參數(shù),然后我們將這種預(yù)測(cè)訓(xùn)練的參數(shù)加載到我們這個(gè)網(wǎng)絡(luò)中,根據(jù)用戶的數(shù)據(jù)在網(wǎng)絡(luò)得到用戶自己的一個(gè)模型。
具體的,我們將百度大規(guī)模的標(biāo)注數(shù)據(jù)集在深度神經(jīng)網(wǎng)絡(luò)上做預(yù)訓(xùn)練,得到預(yù)訓(xùn)練參數(shù),然后將用戶的數(shù)據(jù)在預(yù)訓(xùn)練模型中做微調(diào),最終得到用戶的定制化模型。訓(xùn)練時(shí)間從幾十小時(shí)降到分鐘級(jí)別。此外,我們還支持多領(lǐng)域預(yù)訓(xùn)練、數(shù)據(jù)閉環(huán)、持續(xù)訓(xùn)練等機(jī)制。
為了更好的去匹配不同的數(shù)據(jù),我們利用Auto model search設(shè)施對(duì)模型的結(jié)構(gòu)調(diào)整,和超參數(shù)、優(yōu)化器等等這些去做自動(dòng)的搜索,去選取一個(gè)最佳的模型。另外,用戶提供的數(shù)據(jù)量有時(shí)候比較小,在我們深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,往往就會(huì)出現(xiàn)一個(gè)過擬合的現(xiàn)象,對(duì)應(yīng)為了應(yīng)對(duì)這種過擬合的現(xiàn)象,我們就采取了Early Stopping機(jī)制來降低過擬合的風(fēng)險(xiǎn),提高模型的可能性。目前。我們圖像分類絕大部分模型的準(zhǔn)確率在百分之八十以上。
我們提供了全面的模型效果的評(píng)估功能。我們有一個(gè)整體模型評(píng)估的頁面去展現(xiàn)出我們整個(gè)模型的像準(zhǔn)確率、正確率等指標(biāo)。比如說圖像分類中每個(gè)分類的精確度,比如說在物體檢測(cè)中,我們會(huì)展示這個(gè)不同閾值下的F1Score。我們會(huì)幫助我們的用戶去選擇一個(gè)閾值。我們還提供了BadCase的展示,然后通過BadCase展示我們的模型哪個(gè)圖片識(shí)別錯(cuò)了,然后有一個(gè)感性的認(rèn)識(shí),去發(fā)現(xiàn)自己數(shù)據(jù)當(dāng)中可能存在的問題,或者去補(bǔ)充一些效果比較差的一些分類的數(shù)據(jù)。
以上是我們服務(wù)端的核心技術(shù)。大家也知道我們不僅提供云端的API服務(wù),也提供離線SDK。那么我們?yōu)槭裁匆鲞@樣的一個(gè)設(shè)備端計(jì)算呢,這其實(shí)是IoT領(lǐng)域提出的一個(gè)概念,在智能家居領(lǐng)域里面,每個(gè)家庭的局域網(wǎng)內(nèi)有很多智能的設(shè)備。有些計(jì)算自己可能就可以在自己的設(shè)備上完成。然后,但是計(jì)算力不夠的時(shí)候,有可能需要中間有一層叫做霧計(jì)算的結(jié)構(gòu)。所以需要去做一些運(yùn)算和協(xié)調(diào)計(jì)算。如果再不能滿足,便再向上請(qǐng)求到云計(jì)算的服務(wù)器去做計(jì)算和協(xié)調(diào)這樣的一個(gè)多層的計(jì)算網(wǎng)絡(luò)的結(jié)構(gòu)。
就是因?yàn)樵朴?jì)算和設(shè)備端計(jì)算他們有不同的特性,就向右邊這張表格所展示的,云計(jì)算在計(jì)算能力方面非常的強(qiáng)大,而且系統(tǒng)的架構(gòu)非常的開放,非常的集中在一些機(jī)房里,而且研發(fā)成本相對(duì)較低。因?yàn)榛ヂ?lián)網(wǎng)時(shí)代已經(jīng)有非常這樣的開發(fā)經(jīng)驗(yàn)。但是設(shè)備端計(jì)算也有自己的一些優(yōu)點(diǎn),雖然算力有限但是可以做到比如模型的前向推理,沒有網(wǎng)絡(luò)的依賴,可以做到實(shí)時(shí)的響應(yīng),而且它的功耗非常的低。
正是由于設(shè)備端有這樣的響應(yīng)、沒有網(wǎng)絡(luò)開銷,而且方便私有化部署、保護(hù)隱私等等這樣的優(yōu)勢(shì)。所以說我們也支持了設(shè)備端計(jì)算的能力,并且非??粗剡@個(gè)方向。目前我們EasyDL的平臺(tái),已經(jīng)支持了iOS 利用MPS實(shí)現(xiàn)GPU加速和ARM芯片通過NEON技術(shù)加速和android方面支持NPU的加速計(jì)算,并且還會(huì)有計(jì)劃去支持更多的系統(tǒng)和計(jì)算平臺(tái)。
目前我們提供設(shè)備端能力是通過下面兩種方式。首先,提供了一個(gè)默認(rèn)的app,用戶掃碼就可以安裝并使用。在這個(gè)app里面內(nèi)嵌了定制模型,還有一些基本的UI界面用戶就可以在里面去操作去試使用。另外一種方式是我們提供了離線的SDK,這個(gè)SDK里面封裝了完善的接口,可以滿足開發(fā)者去做靈活的二次開發(fā)。下面給大家簡(jiǎn)單介紹一下我們EasyDL設(shè)備端的技術(shù)。我們的EasyDL設(shè)備端也是基于Paddle Mobile設(shè)備端深度學(xué)習(xí)計(jì)算框架去做的,并且我們已經(jīng)廣泛支持主流的設(shè)備操作系統(tǒng)和芯片,并且還做了設(shè)備的模型的轉(zhuǎn)換壓縮優(yōu)化。在設(shè)備端計(jì)算加速這塊,我們就是充分利用的設(shè)備端芯片進(jìn)行加速,比如說我們?cè)贗OS上用了MPS庫,可以更好的利用IOS上面的GPU進(jìn)行加速。我們還在ARM芯片上通過NEON技術(shù)來做加速。
除了速度時(shí)間這個(gè)因素之外,我們?cè)谠O(shè)備端去部署模型還要考慮的一個(gè)問題是模型的體積。在服務(wù)器上,我們都到的機(jī)器學(xué)習(xí)模型往往大小在兩百兆到五百兆或者說更大。因?yàn)樯疃葘W(xué)習(xí)網(wǎng)絡(luò)的模型會(huì)比較復(fù)雜,而且,尤其是如果說你有很多全連接層,參數(shù)就會(huì)更多,但是設(shè)備端的內(nèi)存容量,計(jì)算能力一般都遠(yuǎn)遠(yuǎn)低于服務(wù)端。我們手機(jī)的內(nèi)存可能就兩G,這已經(jīng)很大了,而且我們也不可能把這個(gè)全部都占滿,所以說我們必須得做模型壓縮,然后減少內(nèi)存占用,提高計(jì)算的效率。
目前,我們通過一些模型加速的技術(shù)可以把這個(gè)移動(dòng)端的模型的體積壓縮到二、三十兆。我們采用的壓縮技術(shù)包括把一些不重要的參數(shù)去掉,量化,將一些浮點(diǎn)數(shù)量化成8bit的數(shù)值或者4bit的數(shù)值。或者是采用一些更輕量化的網(wǎng)絡(luò)。
下面呢,給大家介紹一下我們?nèi)绾卫肎PU集群去加速EasyDL的訓(xùn)練和推理。我們EasyDL平臺(tái)主要就是利用英偉達(dá)的特斯拉系列的GPU去做去深度學(xué)習(xí)的平臺(tái)。目前主力是p4和p40這樣的GPU,我們還用到了這樣像V100這樣的高端的GPU來做模型的訓(xùn)練實(shí)驗(yàn)等。我們用這樣的大規(guī)模集群去做并發(fā)的訓(xùn)練來支撐我們大規(guī)模的深度神經(jīng)網(wǎng)絡(luò)的并發(fā)的訓(xùn)練。能夠大幅度縮減我們訓(xùn)練的周期。像這個(gè)p4有5.5t的單精度的計(jì)算能力。
P40的有12tfloat單精度計(jì)算的能力,并且p40的顯存是24G,P4的顯存只有8GB。所以我們?cè)赑4做我們這個(gè)模型的部署和服務(wù),在P40,V100上去做模型的訓(xùn)練。
我們模型的線上推理階段采用了大規(guī)模的P4為主的集群。通過我們這里的數(shù)據(jù)可以看到,利用GPU集群的性能遠(yuǎn)遠(yuǎn)超過了CPU的集群。在我們典型的一個(gè)業(yè)務(wù)場(chǎng)景下,我們對(duì)集群?jiǎn)吸c(diǎn)的承載和實(shí)驗(yàn)的性能進(jìn)行了壓力的測(cè)試,大家可以看到我GPU集群的顯著優(yōu)于CPU的集群。
由于基于GPU集群的訓(xùn)練和服務(wù)都足夠的快,所以說在用戶體驗(yàn)方面,我們EasyDL的用戶最快五分鐘就可以完成一些小規(guī)模的數(shù)據(jù)集的訓(xùn)練并且獲得服務(wù)。我們比同樣的需求通常需要數(shù)天的訓(xùn)練的周期相比我們大幅的提升了效率。這樣的就解決了我們定制化模型訓(xùn)練和服務(wù)中的一些效率的挑戰(zhàn)。
我們用剛才所說的kubernetes來完成了我們GPU集群的搭建。這樣我們可以對(duì)訓(xùn)練和服務(wù)做到統(tǒng)一的資源調(diào)度來高效的利用我們的資源。并且也有很好的擴(kuò)展性,我們還可以通過擴(kuò)展我們GPU的集群的規(guī)模來拓展訓(xùn)練的能力,擴(kuò)展我們服務(wù)的能力。并且我們有這個(gè)高可用的特性,如果有故障了,也不會(huì)影響到我們集群的一個(gè)服務(wù)能力,保證我們服務(wù)的一個(gè)穩(wěn)定性。
最后,跟大家分享一下我們EasyDL行業(yè)的一些案例。目前,我們可以解決兩個(gè)問題。其實(shí)現(xiàn)在已經(jīng)是三類的問題了,就是后面我會(huì)給大家介紹我們第三類的能力。這兩個(gè)問題是說我們有圖像分類的能力,我們可以通過一張圖片去識(shí)別它到底是屬于客廳還是餐廳。這樣的話可以方便我們互聯(lián)網(wǎng)內(nèi)容的平臺(tái)去做圖片的自動(dòng)打標(biāo)簽的一些功能。我們還有物品檢測(cè)的能力,就是說我們可以識(shí)別出來這張圖片里面有沒有空調(diào),空調(diào)在什么地方。我們可以將這種能力的應(yīng)用到我們零售倉(cāng)儲(chǔ)行業(yè)的商品貨品,檢測(cè)統(tǒng)計(jì)等等這樣的場(chǎng)景中。
我們EasyDL平臺(tái),從去年十月份上線一測(cè)以來就支持了剛才所說的圖像分類能力,在今年四月份我們又開放的物品檢測(cè)的能力。在今年五月底我們支持了剛才介紹的設(shè)備端計(jì)算能力也就是離線SDK能力。剛剛大家跟大家想到我們有第三個(gè)能力,這也就是我們昨天剛剛上線的聲音定制化識(shí)別的能力,大家有興趣就可以去我們平臺(tái)上試用。
第一個(gè)給大家分享的案例是蝶魚科技的案例。這是一家制造鍵盤的制造商,然后他們的場(chǎng)景是說在鍵盤的制造過程當(dāng)中會(huì)有一些缺陷或者錯(cuò)裝以及不符合規(guī)格的情況。他們要把這些識(shí)別出來的跟正常的做區(qū)別然后再出場(chǎng)。之前這都是通過人工去做的。在利用了我們EasyDL平臺(tái)去訓(xùn)練了三千多張圖片之后,識(shí)別率達(dá)到了百分之九十九以上。他們就讓我們的EasyDL接口和他們自己的供應(yīng)攝像頭做了一個(gè)綜合的檢測(cè)系統(tǒng)來幫助他們的生產(chǎn)線每年節(jié)省了十二萬的人工檢測(cè)成本。
第二個(gè)案例是美國(guó)的零售安防的供應(yīng)商,他在美國(guó)的紐約州,新澤西州等等七個(gè)州一百多個(gè)超市里面有一千多臺(tái)攝像頭設(shè)備,主要就是來監(jiān)控購(gòu)物車下層有沒有沒付款的商品。之前他們都是通過傳感器去判斷的,但是傳感器對(duì)于一些殘疾人購(gòu)物車或者兒童購(gòu)物車這些錯(cuò)誤的識(shí)別率很高,所以他們利用我們的平臺(tái)去做一個(gè)EasyDL模型的訓(xùn)練。最后的準(zhǔn)確率能夠達(dá)到百分之九十五以上,遠(yuǎn)遠(yuǎn)超過了這個(gè)客戶的預(yù)期。
前面介紹的都是圖像分類的一些案例,這個(gè)是物品檢測(cè)的案例。這家客戶是叫做惠合科技,他們有個(gè)產(chǎn)品叫做e店佳。就是通過零售部門店去做拍照,然后去看這個(gè)擺放的商品合不合規(guī)。之前的他們都是巡檢員去巡檢,然后用人工的方式去統(tǒng)計(jì)。這樣一方面成本很高,另一方面。作弊的現(xiàn)象也比較多,利用我們EasyDL平臺(tái)去做這樣的一個(gè)物品檢測(cè)的模型訓(xùn)練之后,他們接入了這樣的一個(gè)自動(dòng)化的審核的方案使得他們審核效率提升了百分之三十。
最后一個(gè)案例,那來自于我們百度的合作伙伴CELLA,CELLA是面向企業(yè)客戶的一個(gè)系統(tǒng)集成商,這是他為圣象地板做的解決方案,圣象地板會(huì)有一些瑕疵。利用我們百度EasyDL平臺(tái),他對(duì)前面兩種瑕疵去做圖像的分類,對(duì)后面兩個(gè)去做物體檢測(cè),整體的測(cè)試識(shí)別準(zhǔn)確率能達(dá)到百分之九十五以上。然后。我們將這樣的一個(gè)方案的離線SDK移植到我們客戶的智能攝像頭里面,去做成了一個(gè)軟硬一體的方案。這樣的話提高了我們單片木板的產(chǎn)能,現(xiàn)在的處理時(shí)間僅為原來的一個(gè)四分之一。
EasyDL平臺(tái)如此多成功的案例。那么他復(fù)雜嗎?一點(diǎn)都不復(fù)雜,只需要簡(jiǎn)單四個(gè)步驟,只需要十分鐘就可以獲得自己建立模型。第一步就是創(chuàng)建我們的數(shù)據(jù)和模型。第二個(gè)就是模型的訓(xùn)練,第三步是驗(yàn)證模型的效果,第四部是發(fā)布模型的服務(wù)。在我們EasyDL的首頁里面有用戶的說明文檔,還有教學(xué)的視頻,大家感興趣可以去??纯次覀冞@些這個(gè)教學(xué)的內(nèi)容去嘗試一下使用我們的EasyDL。
提問環(huán)節(jié)
問題一
朱俊-炙倫云計(jì)算-總經(jīng)理
1、EasyDL是一個(gè)教學(xué)或?qū)W習(xí)平臺(tái)還是一個(gè)生產(chǎn)平臺(tái)?
2、訓(xùn)練后獲得的算法,是否可以在離線環(huán)境下使用?離線環(huán)境需要具備哪些條件
3、EasyDL是否提供訓(xùn)練用的數(shù)據(jù)集?用戶是否可以上傳數(shù)據(jù)集,對(duì)上傳的內(nèi)容是否有限制?
趙鵬昊:1、我們沒有定義EasyDL平臺(tái)一定是一個(gè)什么樣的平臺(tái)。EasyDL平臺(tái)無論是針對(duì)普通的開發(fā)者還是商家都是可以用的,如果你是一個(gè)學(xué)生,你可以在上面去做些實(shí)驗(yàn)或者去跑一些好玩的東西。如果你是一個(gè)傳統(tǒng)行業(yè)的從業(yè)者,你也可以去發(fā)現(xiàn)有哪些是希望借助人工智能去解決的問題,在我們平臺(tái)上去尋求一個(gè)模型的解決方案。因此,它是什么平臺(tái)取決于用戶怎么用,同時(shí)目前也是完全免費(fèi)的。
2、目前支持離線環(huán)境下的使用,我們已經(jīng)有了提供離線SDK服務(wù)的能力,用戶不需要在網(wǎng)絡(luò)環(huán)境上去請(qǐng)求云端的API,完全可以把離線的SDK集成到自己的環(huán)境中去做私有化的部署。
3、EasyDL平臺(tái)沒有提供數(shù)據(jù)集的,因?yàn)槲覀兪轻槍?duì)那些有定制化需求的用戶,這些用戶有自己特有的數(shù)據(jù)集,我們提供的是上傳數(shù)據(jù)集功能的,可以根據(jù)他們自己行業(yè)里面或者自己需要解決的問題去上傳屬于自己的數(shù)據(jù)集。另外,我們對(duì)上傳內(nèi)容的限制也僅僅是圖片的大小,比如每張圖片小于四兆。
問題二
李平-中油瑞飛-工程師
1.EasyDL能否訓(xùn)練模型,識(shí)別閥門開關(guān)狀態(tài),數(shù)字儀表的示數(shù),以及指針儀表讀數(shù)?
2.還有個(gè)問題,就是EasyDL和百度的boteye一體機(jī)是什么關(guān)系,兩者怎么協(xié)同工作?能否根據(jù)設(shè)備指示燈判斷設(shè)備工作狀態(tài)?
趙鵬昊:1、這個(gè)是可以識(shí)別的。比如,你可以把這個(gè)數(shù)字儀表都拍下來,用物體檢測(cè)模型將上面的示數(shù)1、2、3、4、5框起來,然后給它一個(gè)對(duì)應(yīng)的類別,是類別一還是類別二或者是類別三。當(dāng)后面有新的數(shù)字儀表的圖片進(jìn)來放到物體檢測(cè)時(shí),就可以直接給你返回相應(yīng)的示數(shù)和對(duì)應(yīng)示數(shù)的位置。當(dāng)然,百度AI平臺(tái)還有其他相關(guān)的識(shí)別,你也可以了解下這方面相關(guān)的一些技術(shù)。
2、Boteye是百度視覺技術(shù)部門做的一個(gè)智能攝像頭,主要是用于視覺巡航。目前來說我們還沒有跟Boteye有深度的結(jié)合,但是我們跟Boteye的團(tuán)隊(duì)做的另外一款產(chǎn)品叫做Xeye有一些后面的合作,因?yàn)閄eye是做端上的AI相機(jī),我們可以用端的能力去做一些比如圖像分類、物體檢測(cè)等工作。大家也可以去關(guān)注一下我們后面跟Xeye的一些合作。
問題三
王紹迪-知存科技-CEO
EasyDL未來的發(fā)展定位是什么?提供更多樣數(shù)據(jù),支持更多的算法開發(fā),甚至支持其他非深度學(xué)習(xí)類腦算法開發(fā)?
趙鵬昊:對(duì)于EasyDL平臺(tái)未來的發(fā)展肯定是要提供更多的模型和能力。目前已經(jīng)有了圖像能力,包括圖像分類、圖像檢測(cè)等,另外,我們也提供了聲音分類的能力。后面還需要去支持更多的能力,比方,文字分類、情感分析以及視頻監(jiān)控等等的能力。
這是在我們平臺(tái)內(nèi)部的發(fā)展,另外我們還想與外部(百度其他的部門)有更多的合作。比方,我們百度有AutoDL部門,我們不需要用人工去設(shè)計(jì)一個(gè)網(wǎng)絡(luò)了,而是用算法去自動(dòng)搜索一個(gè)網(wǎng)絡(luò),這跟我們定制化地去訓(xùn)練模型有一些共同之處,我們正在打算跟他們?nèi)贤ê献鳎绾螌utoDL的能力應(yīng)用到EasyDL上來,幫助用戶更好地去訓(xùn)練他們的數(shù)據(jù),得到一個(gè)更好的模型。同時(shí),我們百度開放平臺(tái)會(huì)提供一個(gè)叫做AIstore的平臺(tái),在上面,可以讓開發(fā)者去做開發(fā),也可以讓一些有需求的買家去購(gòu)買算法應(yīng)用到自己的平臺(tái)上。而我們EasyDL平臺(tái)會(huì)跟AI市場(chǎng)有進(jìn)一步的合作,將整個(gè)上下游的關(guān)系都打通,建立起一個(gè)整體的生態(tài)。
問題四
王猛-大華-開發(fā)
EasyDL對(duì)模型和數(shù)據(jù)安全保護(hù)方面有什么措施,如何保證訓(xùn)練結(jié)果與數(shù)據(jù)的安全?
趙鵬昊:目前對(duì)用戶上傳的數(shù)據(jù)是有多重的保護(hù)的。一方面我們會(huì)對(duì)請(qǐng)求的數(shù)據(jù)做多方的鑒權(quán),去核實(shí)你是不是當(dāng)前對(duì)應(yīng)的用戶;另外一方面,我們?cè)跀?shù)據(jù)保存的時(shí)候也會(huì)做進(jìn)一步的加密。因此我們對(duì)數(shù)據(jù)和模型的安全性是非??粗氐?,而且也做了非常多的保護(hù)工作。
問題五
涂文哲-電子科技大學(xué)-研究生
EasyDL與其他平臺(tái)有什么突出優(yōu)勢(shì)?
趙鵬昊:就像剛才所說的,EasyDL平臺(tái)已經(jīng)提供了設(shè)備端能力,目前為止,我們的一些競(jìng)品平臺(tái),比如Google的平臺(tái)還沒有提供設(shè)備端能力的一種解決方案,而且EasyDL平臺(tái)非常的簡(jiǎn)單易用,只需要十分鐘就可以去完成,不需要任何的機(jī)器學(xué)習(xí)基礎(chǔ)。
問題六
王慧麗-湖南飛騰-工程師
EasyDL定制化平臺(tái),主要是軟件算法定制嗎?還是支持針對(duì)特定應(yīng)用和算法加速的硬件定制?
趙鵬昊:EasyDL平臺(tái)主要是模型的定制,而剛才我們也介紹了EasyDL平臺(tái)設(shè)備端的能力,我們會(huì)根據(jù)一些設(shè)備端異構(gòu)的芯片去做一些特定的加速。因此,也可以認(rèn)為會(huì)針對(duì)這個(gè)特點(diǎn)支持硬件定制。
問題七
文奴-中科智能-產(chǎn)品總監(jiān)
工業(yè)檢測(cè)中,檢測(cè)目標(biāo)更有多樣性,比如:裂痕、劃痕、凹陷。且檢測(cè)目標(biāo)的大小不一,深度學(xué)習(xí)方式的分類訓(xùn)練樣本如何高質(zhì)量獲得,又如何準(zhǔn)確具有高泛化能力?
趙鵬昊:EasyDL平臺(tái)提供了目標(biāo)檢測(cè)的能力以及數(shù)據(jù)標(biāo)注的能力,但是訓(xùn)練的樣本還是需要我們客戶自己來進(jìn)行標(biāo)注,如果您在行業(yè)里面碰到了裂痕、劃痕和凹陷等問題,相對(duì)而言,您對(duì)這個(gè)方面最為了解,那么你就需要把您自己的情況將圖片拍下來,然后去我們平臺(tái)上進(jìn)行標(biāo)注。當(dāng)然,由于標(biāo)注成本比較高,因此,后續(xù)也會(huì)有跟一些眾包商進(jìn)行合作,為大家提供眾包的標(biāo)注服務(wù)。
關(guān)于模型的性能,在物體檢測(cè)中,我們有很多優(yōu)秀的模型,從最開始的FastR-CNN到SSD、YOLO、FPN、RetinaNet等等,EasyDL平臺(tái)也會(huì)緊跟學(xué)界最先進(jìn)的模型去做開發(fā),讓我們的用戶能夠體驗(yàn)到深度學(xué)習(xí)最前沿的發(fā)展帶給大家的便利。
問題八
姜毅-中科院-算法
1.EasyDL云端訓(xùn)練好的模型及參數(shù)可否導(dǎo)出,并部署到其它系統(tǒng)中?如何進(jìn)行?
2.關(guān)于Easy AI Workflow Solution,其中以下幾點(diǎn)是否有專門的設(shè)計(jì)用意?PaddlePaddle使用kuberbetes容器,Inget task使用hadoop和mongodb,Pre&Eval task使用Spark框架。
3.PaddlePaddle框架在定義網(wǎng)絡(luò)模型時(shí)支持動(dòng)態(tài)圖嗎?
4.PaddlePaddle框架相對(duì)TensorFlow,Caffe等開源框架有什么顯著的優(yōu)點(diǎn)?
趙鵬昊:1、像我剛才所說,EasyDL支持設(shè)備端的SDK,用戶可以利用設(shè)備端的SDK來部署到你自己的服務(wù)中,只要有SDK的開發(fā)能力就可以了,但是目前我們不支持模型參數(shù)的導(dǎo)出。
2、關(guān)于Easy AI Workflow Solution的設(shè)計(jì),我們主要考慮到穩(wěn)定性、可擴(kuò)展性以及成熟性等方面。在數(shù)據(jù)存儲(chǔ)上,我們用的是hdfs,mongodb,這些都是在分布式系統(tǒng)和分布式DB中比較公認(rèn)的,而且有很多實(shí)踐經(jīng)驗(yàn)的系統(tǒng),在數(shù)據(jù)處理方面,spark也是這樣的一個(gè)分布式系統(tǒng)。我們之所以使用Kubernetes和PaddlePaddle,是由于它們有很成熟的解決方案,同時(shí)也非常穩(wěn)定和易用。
于祥:3、4:PaddlePaddle是我們國(guó)產(chǎn)的一個(gè)框架,和其他行業(yè)相比,它的設(shè)計(jì)最大優(yōu)勢(shì)在于易學(xué)易用,首先是易學(xué),我們官方已經(jīng)上線了將近四百套相關(guān)的課程,這些課程從底層的數(shù)學(xué)理論到最后實(shí)戰(zhàn)項(xiàng)目和一些可以落地應(yīng)用的項(xiàng)目。整個(gè)流程都是非常完善的,按照這個(gè)課程,一步一步入門Paddle,也不會(huì)是一條很陡的學(xué)習(xí)曲線。
其次,Paddle周邊的生態(tài)環(huán)境非常的豐富,對(duì)于剛?cè)腴T的同學(xué)來說,我們可以有n種方式去安裝Paddle,最簡(jiǎn)單的方式就是使用一個(gè)Docker,但對(duì)于學(xué)生群體來說,會(huì)有一個(gè)問題,就是我們沒有那么多的錢去買云的GPU服務(wù)器或者帶GPU自用服務(wù)器,那么就可以使用我們的AI Studio平臺(tái),它直接提供了免費(fèi)的計(jì)算資源供我們使用,而且還免去了安裝這一步。易用是指它的編程范式拋棄了像TensorFlow中一些新的概念,它還是用原有的一些過程性的程序編程范式,比如循環(huán)、判斷、分支等來構(gòu)建神經(jīng)網(wǎng)絡(luò),這樣就會(huì)比較貼近我們學(xué)習(xí)編程時(shí)的一些思維,也不會(huì)去學(xué)習(xí)很多新的概念。 |
|