“二十一世紀(jì)的計算”學(xué)術(shù)研討會是微軟亞洲研究院自成立之初便開始舉辦的年度學(xué)術(shù)盛會。作為中國及亞太地區(qū)規(guī)模最大、最具影響力的計算機科學(xué)教育與研究盛會之一,迄今為止該大會已在中國、日本、韓國、新加坡等多個國家和地區(qū)成功舉辦了17屆,參會人數(shù)累計超過40,000人。 11月3日,以“Human and Machine Working as a Team”(人機協(xié)作)為主題的第18屆“二十一世紀(jì)的計算”學(xué)術(shù)研討會于韓國首爾舉行,包括2002年圖靈獎獲得者Adi Shamir、微軟全球資深副總裁Peter Lee、微軟全球資深副總裁,微軟亞太研發(fā)集團主席兼微軟亞洲研究院院長洪小文博士在內(nèi)的眾多計算機領(lǐng)域頂級大師,分享了他們各自獨特且深遠(yuǎn)的見解。 以下是微軟全球資深副總裁Peter Lee的演講精選,由微軟亞洲研究院首席研究員劉鐵巖博士擔(dān)任現(xiàn)場點評。其他演講亦將陸續(xù)發(fā)布,敬請期待。 演講者簡介 作為微軟全球資深副總裁,Peter Lee博士負(fù)責(zé)微軟研究院新體驗與新技術(shù)部門(New Experiences and Technologies, 簡稱MSR NExT)。NExT匯集世界頂尖研究者、工程師和設(shè)計師,致力于為微軟和世界創(chuàng)造顛覆性創(chuàng)新技術(shù)。NExT不僅將持續(xù)推動計算機科學(xué)領(lǐng)域的前沿技術(shù)發(fā)展,對學(xué)術(shù)界產(chǎn)生深刻影響,更將通過技術(shù)研發(fā)助力微軟公司長遠(yuǎn)發(fā)展并惠及全世界。
作為NExT的負(fù)責(zé)人,Peter Lee全面負(fù)責(zé)微軟亞洲研究院、微軟研究院新技術(shù)部(MSR Technologies)、FUSE實驗室、微軟研究院特別項目部(MSR Special Projects)以及多個孵化項目團隊。 點評人簡介 劉鐵巖博士,微軟亞洲研究院首席研究員,美國卡內(nèi)基梅隆大學(xué)(CMU)客座教授、英國諾丁漢大學(xué)榮譽教授、中國科技大學(xué)、中山大學(xué)、南開大學(xué)博士生導(dǎo)師。劉博士的研究興趣包括:人工智能、機器學(xué)習(xí)、信息檢索、數(shù)據(jù)挖掘等。他的先鋒性工作促進(jìn)了機器學(xué)習(xí)與信息檢索之間的融合,被國際學(xué)術(shù)界公認(rèn)為“排序?qū)W習(xí)”領(lǐng)域的代表人物,他在該領(lǐng)域的學(xué)術(shù)論文已被引用萬余次,并受Springer出版社之邀撰寫了該領(lǐng)域的首部學(xué)術(shù)專著(并成為Springer計算機領(lǐng)域華人作者的十大暢銷書之一)。
近年來,劉博士在博弈機器學(xué)習(xí)、深度學(xué)習(xí)、分布式機器學(xué)習(xí)等方面也頗有建樹,他的研究工作多次獲得最佳論文獎、最高引用論文獎、研究突破獎,被廣泛應(yīng)用在微軟的產(chǎn)品和在線服務(wù)中,并通過DMTK、Graph Engine等項目開源。他曾受邀擔(dān)任了包括SIGIR、WWW、NIPS、KDD、AAAI、WINE等在內(nèi)的十余個頂級國際會議的組委會主席、程序委員會主席或領(lǐng)域主席;以及若干頂級國際期刊的副主編。他是美國計算機學(xué)會(ACM)杰出科學(xué)家、國際電子電氣工程師學(xué)會(IEEE)和中國計算機學(xué)會(CCF)的高級會員,中國計算機學(xué)會的杰出演講者和學(xué)術(shù)工委。 為什么頂級公司都關(guān)注研究? Peter Lee 很高興有機會在這么多聰明的學(xué)生面前發(fā)言,談?wù)勓芯窟@件事,哪怕要說清楚到底什么是研究其實并不容易。
愛因斯坦說過,“如果我們知道自己在做什么,這事就不會被稱為研究,對不對?“
聰明如愛因斯坦也覺得解釋什么是研究并不容易。
但我可以試試在這次演講中,說說我為什么認(rèn)為研究是如此令人興奮,以及為什么說我們正處在計算機科學(xué)研究的“黃金時代”。
今天的計算機研究每天都在發(fā)現(xiàn)新的東西,而這些東西往往是一些精彩的理論。但與此同時這些研究也非常實用,最終都將幫人們過上更好的生活。因此,一個有趣的現(xiàn)象是世界各地的大學(xué)和頂尖公司都在投入大量的人力物力從事計算機的基礎(chǔ)研究。
像蘋果、Facebook這樣的大型科技公司正在建立大型研究實驗室。甚至像Uber這樣的初創(chuàng)公司在逐步變大時,也會在研究上投入金錢,物力。而在不斷涌現(xiàn)的科技進(jìn)步中,我認(rèn)為有三點特別重要,分別是超大規(guī)模的計算能力、無處不在的大數(shù)據(jù)、機器學(xué)習(xí),尤其是深度學(xué)習(xí)算法和理論的發(fā)展,即將催生一種人工智能能力。
結(jié)果是科技產(chǎn)業(yè)比以往更離不開研究??萍籍a(chǎn)業(yè)對研究的投入比以往任何時候都大。這到底是什么情況,為什么會出現(xiàn)這種情況?這就是我今天演講的主題。
計算對我們生活的影響正在迅速增長。它也發(fā)生得很自然,有時我們甚至沒有注意到。 上面這張圖,這位女士正帶著一臺小型計算機Microsoft Band,上面有十幾臺傳感器。在她運動的過程中,這些傳感器在測量她的心率、跟蹤她的路線等等……海量的數(shù)據(jù)由此產(chǎn)生。
而當(dāng)這臺設(shè)備與她的手機等其他設(shè)備進(jìn)行同步,在云端可能有更多設(shè)備在為她服務(wù),這就是云計算。
云計算的能力包括核心CPU、內(nèi)存、存儲和網(wǎng)絡(luò),通常位于大型數(shù)據(jù)中心,這些數(shù)據(jù)中心基本上是包含大量計算設(shè)備的大型建筑,具有高度優(yōu)化和精心管理的電源和冷卻功能。
微軟在世界各地?fù)碛谐^110個數(shù)據(jù)中心,我們的客戶對我們的數(shù)據(jù)中心的使用正以每年一倍的速度增長。我們每個月都要向我們的數(shù)據(jù)中心添加更多計算機。這是我們一個數(shù)據(jù)中心的航拍照片:
涉及到數(shù)據(jù)中心這種大規(guī)模的工程背后還有許多棘手的科學(xué)問題有待解決,網(wǎng)絡(luò)、分布式計算、容錯、資源分配和調(diào)度,以及一系列基本算法問題等。所以,實現(xiàn)超大規(guī)模的計算能力是微軟等頂尖公司的研究目標(biāo)。
摩爾定律如今正在接近一些物理的限制,若要保持這一部分的增長,就必須為數(shù)據(jù)中心找到新的增長方法來提高計算能力。 今天,在微軟的數(shù)據(jù)中心,我們正在部署基于現(xiàn)場可編程門陣列FPGA的新處理元件,以期實現(xiàn)人工智能超級計算機的計算需求。
此外,我們還在努力研究如何以環(huán)境可持續(xù)的方式驅(qū)動數(shù)據(jù)中心。 我們做了一些有趣的早期試驗。 劉鐵巖博士:Peter提到,為了推動計算機行業(yè)的持續(xù)高速發(fā)展,不僅要從事軟件研究,也要反思硬件的局限性,發(fā)明更新型的硬件體系結(jié)構(gòu)。這幾年,微軟在硬件方面的投入很多,包括用FPGA武裝云計算的數(shù)據(jù)中心。FPGA是一種非常靈活的低功耗硬件,可以適應(yīng)豐富的計算需求。我們研究院最近做了很多關(guān)于如何利用FPGA來加速深度學(xué)習(xí)的工作,讓硬件的研究和人工智能研究無縫接軌。
數(shù)據(jù)中心的維護(hù)費用耗資巨大,如何降低服務(wù)器降溫過程中的能耗問題十分關(guān)鍵。微軟研究院的Project Natick項目創(chuàng)新地把數(shù)據(jù)中心置入大海,利用寒冷的海水冷卻服務(wù)器,并用海浪為之提供電能,還可能減少近海大城市數(shù)據(jù)傳輸?shù)难舆t。
除了云計算之外,大數(shù)據(jù)和算法的進(jìn)步也格外重要。特別是機器學(xué)習(xí)算法對人工智能的推動作用。
【延伸閱讀】:海洋深處的“云” 這張圖我們顯示了機器學(xué)習(xí)的簡化流程圖。機器學(xué)習(xí)的一個應(yīng)用方向是賦予機器理解人類語言的能力。我們搜集了大量音頻數(shù)據(jù)及對應(yīng)的文本數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),輸入到機器學(xué)習(xí)算法中。該算法將“學(xué)習(xí)”訓(xùn)練數(shù)據(jù)中的模式,并從中創(chuàng)建稱為“模型“的新算法,最終將該算法投入語音作為輸入的系統(tǒng)中實用,并輸出對應(yīng)的語音翻譯。
目前,這一技術(shù)已經(jīng)成功應(yīng)用在了微軟實時語音翻譯Skype Translator上了,目前已支持8種語言的實時語音翻譯和50種語言的文本翻譯。
劉鐵巖博士:利用深度學(xué)習(xí)技術(shù),微軟研究院最近在語音識別上有了新的突破,識別了已經(jīng)超過了人類的水平。而且也在積極推動這項技術(shù)的產(chǎn)業(yè)化。
“神經(jīng)語音識別+神經(jīng)機器翻譯”是Skype Translator背后的秘密武器。我們亞洲研究院的自然語言處理組在神經(jīng)機器翻譯方面做了非常前沿的工作,也把翻譯的范圍拓展到了包括粵語在內(nèi)的相對小的語種之中。我所在的機器學(xué)習(xí)組最近也在關(guān)注神經(jīng)機器翻譯,我們在今年的NIPS上發(fā)表了一篇通過增強學(xué)習(xí)(reinforcement learning)技術(shù)、從無標(biāo)簽數(shù)據(jù)中自動獲得翻譯能力的論文,它利用了機器翻譯的對偶結(jié)構(gòu),取得了非常好的翻譯精度。我們把這項技術(shù)成為Dual learning(對偶學(xué)習(xí))。有興趣的同學(xué)們可以關(guān)注一下。 【延伸閱讀】微軟對話語音識別技術(shù)達(dá)至人類專業(yè)水平,開啟人工智能新征程 劉鐵巖博士:現(xiàn)場在放一個視頻,關(guān)于Skype Translator如何幫助有聽力障礙的孩子進(jìn)行交流。當(dāng)Skype Translator把世界兩端、從前幾乎無法交流的人實時鏈接在一起、進(jìn)行幾乎無縫的交談時,確實有一種科幻小說的即視感。
英語里有一個單詞Serendipity,意思是偶然發(fā)生的快樂事件。這對于研究來說是時常發(fā)生的。當(dāng)你開始研究一些東西,最終很有可能得到一些意想不到的精彩,這意味著我們需要對意想不到的事件保持開放心態(tài)。
劉鐵巖博士:Peter在展示使用微軟的WordFlow技術(shù),如何在手機上僅用十幾秒鐘,輸入一段非常復(fù)雜的文字。
機器學(xué)習(xí)也正在為計算機賦予“看”的能力。只需要訪問https://www./ 上傳照片,我們的系統(tǒng)就能“看到”并向你“解釋”看到了什么。
微軟在計算機視覺方面有著非常領(lǐng)先的技術(shù)。大家應(yīng)該都知道獲得去年ImageNet比賽5項冠軍的ResNet吧?今年我們研究院的小伙伴再接再厲,又取得了COCO比賽中物體分割的冠軍。 機器學(xué)習(xí)也給予計算機“看”的能力。 深度神經(jīng)網(wǎng)絡(luò)的進(jìn)步越來越大,加上越來越多的訓(xùn)練數(shù)據(jù)和更好和更好的算法,讓機器有能力“理解”一張照片。
這意味著我們越來越好。 大家可以從這些圖像看到物體鎖定和識別的能力有多大。
如果你想試用我們的計算機視覺DNN,只要拿起你的智能手機,去,就可以用您的相機,讓我們的系統(tǒng)“看到”和“解釋”您正在看的是什么……
對許多人來說,言語和視覺是非常有趣的,因為它們是人類可以做的事情。但我認(rèn)為機器學(xué)習(xí)和AI會為我們做的很多事情將更加“隱形”。
舉例:這是一個演示視頻,我們稱為“全息傳輸”。你在這張圖片中看到的是我們一位前研究者,叫Shahram Izadi。圍繞他的是幾個特殊的用于捕獲3D圖像的相機。來自這8個攝像機的3D信息是一大份數(shù)據(jù),大約每秒2G規(guī)模,為在互聯(lián)網(wǎng)上做到實時傳輸數(shù)據(jù),我們必須做大比例的數(shù)據(jù)壓縮。如果這能做到,就可以創(chuàng)造驚人的體驗。 劉鐵巖博士:現(xiàn)在,Peter通過視頻向大家展示了HoloLens的“全息傳輸”技術(shù),這也是機器學(xué)習(xí)能力的另一個體現(xiàn)。視頻在此: 實時虛擬3D傳送 劉鐵巖博士:最后,Peter Lee博士向現(xiàn)場在座的大學(xué)生分享了一些想法,指導(dǎo)大家如何參與到人工智能的大潮中。最重要的是努力學(xué)習(xí)。微軟也為大家提供了Microsoft Cognitive Services(微軟認(rèn)知服務(wù))和Microsoft Cognitive Toolkit(微軟認(rèn)知工具包),這是用于人工智能非常強大的工具。這種有趣的人臉識別應(yīng)用就是基于微軟認(rèn)知服務(wù)開發(fā)的:http:/// |
|