今天,騰訊正式發(fā)布了旗下深度學(xué)習(xí)平臺 DI-X(Data Intelligence X),這是繼今年 1 月推出 FPGA 云服務(wù)器之后,騰訊在人工智能領(lǐng)域的又一重大舉措。據(jù)雷鋒網(wǎng)了解,DI-X 將基于騰訊云的大數(shù)據(jù)存儲與處理能力,為其用戶提供一站式的機器學(xué)習(xí)和深度學(xué)習(xí)服務(wù)。 馬化騰曾表示:“人工智能、物聯(lián)網(wǎng),甚至未來的無人駕駛、機器人等等,它的后臺的核心一定有一顆在云端的大腦?!?而對于騰訊而言,馬化騰所提及的云端大腦正是構(gòu)建與其騰訊云服務(wù)之上。 隨著 DI-X 深度學(xué)習(xí)平臺已經(jīng)上線,騰訊云在人工智能領(lǐng)域產(chǎn)品線已經(jīng)覆蓋了 IaaS 基礎(chǔ)設(shè)施、AI 平臺服務(wù)、AI 基礎(chǔ)服務(wù)、AI 應(yīng)用服務(wù)以及垂直解決方案。 那么最新推出的 DI-X 和騰訊去年開源的大數(shù)據(jù)框架 Angel 以及 Mariana 究竟有何聯(lián)系?和其它平臺相比,DI-X 又有何特點呢?為此,雷鋒網(wǎng)采訪了騰訊 T4 專家、騰訊云機器學(xué)習(xí)平臺技術(shù)負責(zé)人 Andy。 騰訊云深度學(xué)習(xí)平臺 DI-X 誕生的背景雷鋒網(wǎng):深度學(xué)習(xí)平臺項目是什么時候開始啟動的?做 DI-X 的初衷是什么?騰訊內(nèi)部有一個機器學(xué)習(xí)平臺,從 2015 年的 10 月份就開始啟動了。因為公司有很多的算法工程師和數(shù)據(jù)科學(xué)家,大家做的事情都很類似,迫切需要一個這樣的平臺來承載大家的需求,在上面方便的進行各種組件,算法和模型的配置,快速的判斷模型效果,并應(yīng)用到生產(chǎn)上。之前公司內(nèi)部的大數(shù)據(jù)平臺,包括存儲,計算和分析…… 都已經(jīng)日趨成熟了,在此之上,需要往上再走一步,進行機器學(xué)習(xí)和人工智能,所以這樣的平臺就應(yīng)運而生了。 平臺在內(nèi)部運行 1 年左右之后,效果還不錯,于是騰訊云就啟動了這個項目(DI-X),將內(nèi)部平臺遷移到騰訊云上。在今年的 3 月份上旬,GPU 云服務(wù)器產(chǎn)品也對外開放了,所以 DI-X 剛好和它對接上,主攻深度學(xué)習(xí),希望能幫助到更多的騰訊云的中小用戶,接入 AI 的快車道。 雷鋒網(wǎng):DI-X 項目由哪個團隊主導(dǎo)?現(xiàn)在有多少人?項目是由 SNG 騰訊云的數(shù)據(jù)產(chǎn)品團隊和 TEG 數(shù)據(jù)平臺部的機器學(xué)習(xí)團隊聯(lián)合而成,人不多,就十幾個。我們相信小團隊比較適合快速的迭代,產(chǎn)品現(xiàn)在還很年輕,需要快速的成長。 雷鋒網(wǎng):在 DI-X 研發(fā)的過程中,遇到最大的挑戰(zhàn)是什么?機器學(xué)習(xí)平臺的設(shè)計,其實即便是 Azure,都有很多不完善的地方,而這個平臺是一開始就是要服務(wù)內(nèi)部用戶的,所以會面對很多用戶奇奇怪怪的需求,而這時如何去將這些需求化解為真正對平臺有通用意義的功能,是需要有很強的理解力和把控力的,這個是對這個產(chǎn)品最大的挑戰(zhàn)之一。 這個平臺面對的另外一個挑戰(zhàn),就是人工智能和機器學(xué)習(xí)的發(fā)展太快了,很多新的功能和需求,不停的出現(xiàn),也有新的更好的平臺值得借鑒。我們需要更快的走完前人走的路,還要跟上后來者的節(jié)奏,這個對團隊的快速迭代能力,也有很高的要求。 深度揭秘 DI-X雷鋒網(wǎng):DI-X 的設(shè)計理念是什么?和類似數(shù)加、Azure 這樣的系統(tǒng)平臺有什么區(qū)別?DI-X 的設(shè)計理念是打造一個一站式的機器學(xué)習(xí)平臺,集開發(fā)、調(diào)試、訓(xùn)練、預(yù)測、部署于一體, 讓算法工程師和數(shù)據(jù)科學(xué)家,無須關(guān)注機器學(xué)習(xí)(尤其是深度學(xué)習(xí))的底層工程繁瑣的細節(jié)和資源,專注于模型和算法調(diào)優(yōu)。 DI-X 的最終目的是成為一個時尚,強大而智能的機器學(xué)習(xí)平臺,讓機器學(xué)習(xí)充滿樂趣,助力人工智能。 伴隨著機器學(xué)習(xí)和人工智能的發(fā)展,對騰訊這樣大體量的公司來說需要一個這樣的平臺來支持內(nèi)部算法工程師的需求。DI-X 目前已經(jīng)在騰訊內(nèi)部廣泛使用,一開始的目的也是支撐內(nèi)部。隨著系統(tǒng)成熟,我們覺得可以通過騰訊云,把這個能力開放出來。 整體上來看,DI-X 和阿里數(shù)加,Azure 是競品,大家會各有所長。 雷鋒網(wǎng):DI-X 的架構(gòu)有何特點?主要體現(xiàn)在以下三個方面: 1. 易用性:可視化的拖拽式任務(wù)流設(shè)計界面,配備了輸入、組件、算法、模型、輸出 5 類模塊,靈活組合,可以做到無須任何編碼而完成復(fù)雜機器學(xué)習(xí)任務(wù)。 2. 靈活性:用戶既支持使用集成的機器學(xué)習(xí)算法,也能在業(yè)界的各種機器學(xué)習(xí)組件上提交自己算法。 3. 重點支持深度學(xué)習(xí):目前支持 TensorFlow,Caffe,Torch3 種框架組件,后續(xù)會提供更多深度學(xué)習(xí)框架和針對性優(yōu)化。 雷鋒網(wǎng):去年 12 月,騰訊開放了自研的大數(shù)據(jù)平臺 Angel,并且支持上述深度學(xué)習(xí)框架,那么 Angel 對 DI-X 是否有深度的優(yōu)化?DI-X、Angel 與此前的 Mariana 深度學(xué)習(xí)平臺有何關(guān)系?Angel 是一個高緯度的機器學(xué)習(xí)框架,可以作為一個獨立的機器學(xué)習(xí)組件,也可以作為 PS-Service(參數(shù)服務(wù)器服務(wù)),支持 Spark 和其它深度學(xué)習(xí)框架。內(nèi)部已經(jīng)在試用了,開源之后也會發(fā)布到 DI-X 上面,讓用戶方便的使用和接入。 Mariana 主要是一個針對 GPU,基于 Caffe 進行了數(shù)據(jù)并行和模型并行能力升級的一個分布式 GPU 計算框架,也是可以在 DI-X 上運行的一個框架組件。我們在內(nèi)部版本的 TeslaML 上,都有這個組件的存在,但是對外的話,我們計劃是將它融合到 Angel 之中,作為一個整體開放。 雷鋒網(wǎng):工業(yè)界和學(xué)術(shù)界,DI-X 會更側(cè)重哪一塊?DI-X 在騰訊內(nèi)部服務(wù)一段時間了,大部分的場景都是比較大的數(shù)據(jù)量的,所以會適合工業(yè)界一些。對于學(xué)術(shù)界是否合適,我覺得要用戶來評判。當(dāng)然我們很歡迎學(xué)術(shù)界的朋友來試用。 雷鋒網(wǎng):相比其它平臺,DI-X 的優(yōu)劣勢是什么?在算法和模型的訓(xùn)練上有哪些突破?DI-X 目前剛剛推出,比起之前的產(chǎn)品有一些的時間距離,這是劣勢,也是優(yōu)勢。相比之下,成熟度會弱一點,但是我們借鑒了之前產(chǎn)品的特點和經(jīng)驗,并做了一些改進和創(chuàng)新。尤其是算法的 “小尾巴” 設(shè)計上,和之前的產(chǎn)品設(shè)計都不太一樣,在模型的收藏,使用,預(yù)測,部署上,都會有很多的優(yōu)勢,對深度學(xué)習(xí)更加的友好。 目前的各個深度學(xué)習(xí)組件,我們都是使用業(yè)界的開源最新版本,打通和 COS 的交互。后續(xù)在多機多卡的加速上,我們會借助 Angel,提供更強的性能支持。 雷鋒網(wǎng):DI-X 主要解決了哪些問題,它的應(yīng)用場景有哪些?目前 DI-X 給騰訊云的業(yè)務(wù)做了哪些貢獻?DI-X 解決的問題,主要是用戶在騰訊云有了資源之后,可以降低開發(fā)和使用機器學(xué)習(xí)的門檻。假如你購買了 GPU 的計算集群,你需要到上面自己去安裝各種組件,上傳作業(yè),調(diào)度運行,關(guān)注告警;但是有了 DI-X,你只要點幾下鼠標,對接上 GPU 資源后,就能把一個深度學(xué)習(xí)算法跑起來了,無論是你自己開發(fā)的還是業(yè)界現(xiàn)有的,這樣的一站式平臺,都能夠降低算法工程師和數(shù)據(jù)科學(xué)家的門檻,他們不用操心很多工程上的細節(jié),可以專心的調(diào)算法和參數(shù),把模型訓(xùn)練好。 目前 DI-X 在騰訊內(nèi)部,應(yīng)用廣泛,例如游戲流失率預(yù)測、用戶標簽傳播以及廣告點擊行為預(yù)測,這些應(yīng)用背后都有 DI-X 的支持。以用戶行為預(yù)測為例,借助 DI-X 平臺,可以方便的拖拽出一個 BRNN Encoder 模型(雙向循環(huán)神經(jīng)網(wǎng)絡(luò)編碼器),從用戶自身和用戶圈子好友的行為序列數(shù)據(jù)中提取出基礎(chǔ)特征,進行棧式自編碼(Stacked Auto-Encoder)模型的訓(xùn)練,充分利用 RNN 的模型特點,得到比常規(guī)模型更精準的行為預(yù)測效果。 對于騰訊云來說,DI-X 是補上了重要的一環(huán),讓騰訊云的智能云能力,更加的完備,并充分發(fā)揮 GPU 計算集群的產(chǎn)品能力,是一對很好的搭檔產(chǎn)品。 雷鋒網(wǎng):使用騰訊云上的 DI-X,對企業(yè)以及開發(fā)者來說意味著什么?使用 DI-X,對于中小企業(yè)來說,某種程度上是開上了機器學(xué)習(xí)和人工智能的快車道,這個是我們的期望。不需要重復(fù)的搭建類似的系統(tǒng),可以一鍵式的完成算法和模型的開發(fā)、調(diào)試、評估、部署和預(yù)測,快速的完成閉環(huán),并對接生產(chǎn)系統(tǒng)。 未來,我們希望能夠幫助到更多的 AI 創(chuàng)業(yè)公司和客戶,降低他們的創(chuàng)業(yè)門檻,更快的專注于有創(chuàng)意的業(yè)務(wù)上,而無須擔(dān)心底層。另外我們也希望能夠?qū)Ⅱv訊的成熟的數(shù)據(jù),算法,模型開放出來,幫助到需要的小公司,讓它們能夠快速成長。 總結(jié)當(dāng)然,DI-X 仍然不是一款成熟的產(chǎn)品,和現(xiàn)有的平臺相比顯然還有一定的差距,這對產(chǎn)品團隊的技術(shù)水平是一次考驗。Andy 告訴雷鋒網(wǎng),在后續(xù)的版本當(dāng)中,他們還會做一系列的優(yōu)化:
毋庸置疑,人工智能基礎(chǔ)服務(wù)已經(jīng)成為互聯(lián)網(wǎng)巨頭必爭之地,作為騰訊 “云端大腦” 的一部分,DI-X 上線后的表現(xiàn)如何,我們拭目以待!
|
|
來自: 昵稱71360118 > 《待分類》