摘要: 在機(jī)器學(xué)習(xí)領(lǐng)域,除了谷歌AlphaGo的“在線學(xué)習(xí)”,還有一種效率更高并且直接在硬件端完成機(jī)器學(xué)習(xí)的方式——片上學(xué)習(xí)。 今年初谷歌AlphaGo與圍棋冠軍李世石的人機(jī)大戰(zhàn),讓人們對(duì)人工智能的關(guān)注度提升到了前所未有的高度,正所謂“外行看熱鬧、內(nèi)行看門(mén)道”,AlphaGo獲勝的背后離不開(kāi)谷歌開(kāi)發(fā)的深度神經(jīng)網(wǎng)絡(luò),而這正是人工智能機(jī)器學(xué)習(xí)當(dāng)中重要的組成部分。 AlphaGo在對(duì)戰(zhàn)時(shí),是采用一種“在線學(xué)習(xí)”(On-Line Learning)的模式,意思就是說(shuō)AlphaGo的服務(wù)器在美國(guó)中西部,通過(guò)谷歌云服務(wù)連接到韓國(guó)首爾的對(duì)局室,谷歌總部團(tuán)隊(duì)必須確保AlphaGo與谷歌的服務(wù)器連接順利。 ,簡(jiǎn)單講就是字面所傳達(dá)的意思,在芯片上進(jìn)行機(jī)器學(xué)習(xí)。 在了解“片上學(xué)習(xí)”之前,我們有必要回顧一下計(jì)算機(jī)的工作結(jié)構(gòu)。
“馮·諾依曼體系”沿用了半個(gè)世紀(jì),但在接下來(lái)的人工智能時(shí)代,計(jì)算機(jī)需要盡可能地模擬人類(lèi)大腦神經(jīng)元和突觸處理信息的方式,如視覺(jué)、聽(tīng)覺(jué),隨后,接受到的信息、圖片和聲音又能改變神經(jīng)元之間的聯(lián)系,這整個(gè)過(guò)程就是機(jī)器學(xué)習(xí)的過(guò)程。 機(jī)器學(xué)習(xí)的過(guò)程只有通過(guò)神經(jīng)網(wǎng)絡(luò)的計(jì)算才能實(shí)現(xiàn),為了處理神經(jīng)網(wǎng)絡(luò)所帶來(lái)的指數(shù)級(jí)數(shù)據(jù)增長(zhǎng),人們開(kāi)始研發(fā)專(zhuān)門(mén)的芯片,才有了后來(lái)的“片上學(xué)習(xí)”。 “片上學(xué)習(xí)”的進(jìn)化歷程 從全球范圍內(nèi)來(lái)看,已有多家公司致力于“在線學(xué)習(xí)”的算法研究,在視覺(jué)、聲音、大數(shù)據(jù)等領(lǐng)域人工智能均有一些落地的案例,相比之下“片上學(xué)習(xí)”在嚴(yán)苛的硬件環(huán)境中依舊研究進(jìn)展緩慢。 比如IBM的TrueNorth項(xiàng)目,這個(gè)以神經(jīng)形態(tài)工程學(xué)設(shè)計(jì)的CMOS芯片,包含了4096個(gè)硬件核心,每個(gè)核心包含256個(gè)可編程的神經(jīng)元芯片,擁有超過(guò)100萬(wàn)的神經(jīng)元。 在鈦媒體創(chuàng)新產(chǎn)品平臺(tái)“我造社區(qū)”當(dāng)中,有一家名為“西井科技”的神經(jīng)形態(tài)實(shí)驗(yàn)室同樣致力于此。今年5月份,這家公司宣布研發(fā)出了全球首塊5000萬(wàn)“神經(jīng)元”類(lèi)腦芯片——Westwell Brain,可模擬出5000萬(wàn)級(jí)別的“神經(jīng)元”,總計(jì)有50多億“神經(jīng)突觸”。 作為對(duì)比,人類(lèi)大腦的神經(jīng)元大約800億--1000億個(gè),有5000萬(wàn)個(gè)神經(jīng)元的電腦雖然不能與人類(lèi)大腦相提并論,但它已經(jīng)可以實(shí)現(xiàn)一些淺層的“片上學(xué)習(xí)”了,比如分辨畫(huà)作流派這種事情。 2014年,加州理工大學(xué)Sergey Karayev 等人收集了Wiki-paintings畫(huà)作,以此來(lái)檢驗(yàn)機(jī)器學(xué)習(xí)的成果。Westwell Brain“片上學(xué)習(xí)”Wiki系統(tǒng)的測(cè)試成績(jī)?yōu)?秒自動(dòng)完成1000多張圖片的分類(lèi),正確率接近100%。 打個(gè)比方,“片上學(xué)習(xí)”Wiki系統(tǒng)就好像學(xué)生身邊時(shí)刻跟隨著一位“私教”,直接在芯片上邊學(xué)習(xí)邊測(cè)試訓(xùn)練成果,最大的優(yōu)勢(shì)是實(shí)現(xiàn)“無(wú)網(wǎng)絡(luò)”情況下的“自我學(xué)習(xí)、自我實(shí)時(shí)提高”。 而“在線學(xué)習(xí)”則好比學(xué)生定期去“學(xué)?!鄙险n,回家后做作業(yè)來(lái)測(cè)試學(xué)習(xí)效果,再將優(yōu)化過(guò)的模型灌輸在硬件中,每一次新的學(xué)習(xí)都需通過(guò)網(wǎng)絡(luò)、云端等手段重新進(jìn)行傳輸、遷移。 因?yàn)椤捌蠈W(xué)習(xí)”可以實(shí)現(xiàn)本地化學(xué)習(xí),從而幫助機(jī)器大幅度提升效率,提高運(yùn)算速度。在網(wǎng)絡(luò)環(huán)境相對(duì)嚴(yán)苛或有限的情況下,“片上學(xué)習(xí)”的芯片消耗的帶寬和流量更少,大幅降低云端服務(wù)器的通訊成本,且耗時(shí)更少。 從技術(shù)角度來(lái)看,“片上學(xué)習(xí)”的芯片的確有很多優(yōu)勢(shì),它可以直接在硬件上完成學(xué)習(xí)與測(cè)試,進(jìn)而讓基礎(chǔ)算法的研發(fā)迭代,產(chǎn)品的升級(jí)有著更短的周期和更高的效率,并且消耗更少的能源。 但另一方面,“片上學(xué)習(xí)”還沒(méi)有特定的標(biāo)準(zhǔn),據(jù)西井科技相關(guān)負(fù)責(zé)人介紹,全球從事此領(lǐng)域研究的公司僅在個(gè)位數(shù),相關(guān)從業(yè)人員也極為緊缺,如何使用“片上學(xué)習(xí)”芯片的技術(shù)進(jìn)行具體場(chǎng)景的商業(yè)化落地還存在很大挑戰(zhàn)。 真極客有鈦度,大開(kāi)腦洞黑科技 更多精彩關(guān)注微信號(hào):鈦極客(TiGeek) (原標(biāo)題:類(lèi)似谷歌AlphaGo的深度神經(jīng)網(wǎng)絡(luò),未來(lái)可能通過(guò)“片上學(xué)習(xí)”實(shí)現(xiàn)) |
|