小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

微軟芮勇人工智能時代,我們能做什么?

 天道酬勤YXJ1 2016-05-15

微軟芮勇人工智能時代,我們能做什么?

C新智元推薦

微軟芮勇人工智能時代,我們能做什么?

微軟芮勇人工智能時代,我們能做什么?

芮勇博士現(xiàn)任微軟亞洲研究院常務(wù)副院長。在此之前,芮勇博士在美國微軟總部工作了7年,先后擔(dān)任微軟亞太研發(fā)集團(tuán)首任戰(zhàn)略總監(jiān)、研發(fā)總監(jiān),以及微軟亞洲工程院副院長及微軟亞太研發(fā)集團(tuán)中國創(chuàng)新孵化部總經(jīng)理。芮勇在微軟的17年涵蓋了企業(yè)研發(fā)的四大支柱:戰(zhàn)略制定、基礎(chǔ)科研、創(chuàng)新孵化及產(chǎn)品開發(fā)。芮勇是國際電氣電子工程學(xué)會會士(IEEE Fellow)、國際模式識別學(xué)會會士(IAPR Fellow)、國際光學(xué)工程學(xué)會會士(SPIE Fellow)和國際計算機(jī)協(xié)會杰出科學(xué)家(ACM Distinguished Scientist)。芮勇?lián)螄H多媒體權(quán)威學(xué)刊IEEE Multimedia Magazine主編,他還是許多一流國際會議的組織委員會和程序委員會主席。

微軟亞洲研究院的人工智能2015

人工智能的春天又回來了。

近幾年,大數(shù)據(jù)、機(jī)器學(xué)習(xí)和云計算等新興技術(shù)的發(fā)展讓人工智能的影響力日益壯大,業(yè)界關(guān)于人工智能的討論和嘗試也非常多樣。身為在計算機(jī)領(lǐng)域探索多年的研究人員,我認(rèn)為這一現(xiàn)象非常鼓舞人心,我們誠然生活在一個“技術(shù)的黃金時代”。

人工智能的英文是Artificial Intelligence,簡稱AI。1956年,在達(dá)特茅斯學(xué)院舉行的一次會議上正式確立了人工智能(Artificial Intelligence)的名稱,以及研究領(lǐng)域和任務(wù)。這次會議影響深遠(yuǎn),該會議的組織者包括馬文·明斯基(Marvin Minsky)和約翰·麥卡錫(John McCarthy)等人,他們和這次會議的其他與會者們一起成為了人工智能最早的一批研究先驅(qū)。

微軟芮勇人工智能時代,我們能做什么?

今年是2016年,距離達(dá)特茅斯會議已經(jīng)過去了整整60年。中國古代紀(jì)年法中,用十天干和十二地支相組合,60年便是一個輪回,稱為六十甲子。人工智能在誕生之后經(jīng)歷了黃金年代,經(jīng)歷了20世紀(jì)70年代中后期的低谷,經(jīng)歷了短暫的繁榮,也經(jīng)歷了人工智能的寒冬。如今,人工智能再次回春,六十甲子一輪回,因此對于我們來說,2016年更是人工智能技術(shù)的一個新的開端,我最大的心愿便是在2016年這個新輪回開始的第一年,能看到劃時代的研究進(jìn)展和突破。

如今,人工智能已經(jīng)不是一個僅屬于研究機(jī)構(gòu)和學(xué)者們的概念,而是逐步進(jìn)入我們的生活,這些技術(shù)大多數(shù)時候默默地站在幕后,悄無聲息地改善著人們的計算體驗(yàn)。過去的2015年,在微軟眾多對外發(fā)布的產(chǎn)品和服務(wù)中,我們都能找到人工智能的影子,這也離不開微軟亞洲研究院在計算機(jī)基礎(chǔ)研究領(lǐng)域日復(fù)一日的耕耘,用一次又一次的研究突破,用開放的心態(tài)積極與社會各界展開合作,一起共同推動整個計算機(jī)行業(yè)的技術(shù)進(jìn)步與革新。

人機(jī)交互的第一入口:語音識別

人工智能都可以幫助人做些什么呢?長久以來,語言一直都是人與人之間交流的障礙,那么能否讓人工智能充當(dāng)人與人之間的翻譯呢?微軟推出的Skype Translator 實(shí)時語音翻譯系統(tǒng)就成功滿足了這一類需求。

微軟芮勇人工智能時代,我們能做什么?

早在2012年10月25日,在由微軟亞洲研究院主辦的第十四屆“二十一世紀(jì)的計算大會”現(xiàn)場,我們首次公開演示了微軟實(shí)時語音翻譯技術(shù)。時任微軟研究院全球負(fù)責(zé)人的Rick Rashid在用英語演講時,現(xiàn)場的國內(nèi)觀眾們卻借助了神奇的實(shí)時語音翻譯工具,聽到了用Rashid的原音講述的漢語普通話。當(dāng)時的語音識別系統(tǒng)在演示中實(shí)現(xiàn)了小于7%的誤差率,幾乎與真人做字對字筆錄時的水平相當(dāng)。

這次展示很明確地預(yù)示了深層神經(jīng)網(wǎng)絡(luò)語音識別和實(shí)時語音翻譯時代的到來。隨后,這一技術(shù)原型便迅速被轉(zhuǎn)化成產(chǎn)品,成功應(yīng)用到了Skype Translator中。在微軟亞洲研究院的團(tuán)隊和美國的同事們的密切合作下,2015年4月,Skype Translator 實(shí)時語音翻譯的中文預(yù)覽版登錄中國,讓英文和中文普通話之間的實(shí)時語音對話變?yōu)楝F(xiàn)實(shí)。

在Skype Translator上我們可以看到深度學(xué)習(xí)技術(shù)對語音識別準(zhǔn)確度毋庸置疑地提升。如今在較為理想的環(huán)境中,語音識別的準(zhǔn)確度已經(jīng)在95%以上,與人類的識別能力相差無幾。但對于語音識別領(lǐng)域的研究來說,仍有一些亟待解決的問題。當(dāng)計算機(jī)處于較為嘈雜的環(huán)境,或是麥克風(fēng)收音效果較弱的情況下,識別準(zhǔn)確度便大大降低。

一個被稱為“雞尾酒會效應(yīng)”的問題能夠很好地描述這種情況。如果我們正在參加一場雞尾酒會,和七八個人同時交談,那么如果我們想主要聽某一個人的發(fā)言時,我們?nèi)祟惥湍茏詣舆^濾其他人的發(fā)言,讓我們的注意力集中在這個人的發(fā)言內(nèi)容上??墒钱?dāng)計算機(jī)處于這種環(huán)境下時,面對多個聲音交織的情況,想要辨別出特定某人的聲音并識別出來還是十分困難的。

其實(shí),語音識別只是一個開始。計算機(jī)把人類的語音識別出來,將音頻信號轉(zhuǎn)化成文字信號的這個過程必然意義重大,但這并不代表計算機(jī)真正理解了這句話的意思。因此語音識別的下一步便是對語義的理解。我所提到的這個語義理解可能比我們通常所說的自然語言理解層次更高一些、難度更大一些。因?yàn)槊鎸ν痪湓挘纭拔蚁腱o靜”或者“他要請我吃飯”,不同的語調(diào)、語氣、重音都會帶來不一樣的理解。因此我說的語言理解是包括從語音到語義,直至理解句子的言外之意這一整套過程的,這在技術(shù)實(shí)現(xiàn)上還有一條很長的路要走。

說起語音識別,其實(shí)不僅是微軟,行業(yè)內(nèi)各大公司都會把它放在一個首要的基礎(chǔ)位置上。如果說實(shí)現(xiàn)人工智能是我們的最終目標(biāo),那么語音識別技術(shù)很可能就是人工智能的一個關(guān)鍵入口。為什么我會這么說呢?對于技術(shù)公司來說,成為平臺型公司一直是努力的目標(biāo)。例如,操作系統(tǒng)就是一個很好的平臺。時下我們也能看到一些很好的平臺,如電商平臺、搜索平臺,還有人與人之間交流的平臺等,與之對應(yīng)的國內(nèi)有BAT,國外的微軟、谷歌、Facebook、亞馬遜,都擁有自己的核心平臺。那么下一個平臺會是什么呢?

我認(rèn)為,人工智能時代,一個人工智能助手將會成為一個很好的平臺,就像《星球大戰(zhàn)》中的BB-8,或者鋼鐵俠中的賈維斯(Jarvis)。人們與人工智能助手最常見的交互方式就包括語言的交互。那么想要做好人工智能助手,語音識別和自然語言處理可能就會成為這個平臺入口的核心。

借一雙慧眼:計算機(jī)視覺

近年來,深層神經(jīng)網(wǎng)絡(luò)的復(fù)興為計算機(jī)帶來的革命突破不僅是語音識別,還有計算機(jī)視覺。人類所獲取的外部信息70%都來自于視覺,人類與周圍世界的溝通和交互極其依賴圖像。當(dāng)計算機(jī)也能“睜開雙眼”看懂世界,計算機(jī)離智能也就更近了一步。

那么,目前計算機(jī)視覺系統(tǒng)有多精確呢?2015年1月,微軟亞洲研究院的一個四人計算視覺小組成員在ImageNet計算視覺識別挑戰(zhàn)賽中便實(shí)現(xiàn)里程碑式突破,計算機(jī)識別物體的能力首次超過人眼,系統(tǒng)錯誤率已經(jīng)低至4.94%。而在此前同樣的實(shí)驗(yàn)中,人眼辨識的錯誤率大概為5.1%。

ImageNet計算機(jī)視覺挑戰(zhàn)賽由來自全球頂尖高校和公司的研究員組織舉辦,近年來已經(jīng)成為計算機(jī)視覺領(lǐng)域的標(biāo)桿,其比賽結(jié)果總能十分直觀地反映出計算機(jī)視覺這一熱門領(lǐng)域中各研究機(jī)構(gòu)的研究進(jìn)展和突破。在ImageNet比賽中成功登頂并超越人類,在計算機(jī)視覺研究上意義重大。

當(dāng)然研究員們并不僅以超越人類的識別能力為目標(biāo)。到了2015年12月,在微軟亞洲研究院首席研究員孫劍的帶領(lǐng)下,這個四人研究小組再次做出突破,以絕對優(yōu)勢獲得圖像分類、圖像定位及圖像檢測全部三個主要項目的冠軍,該系統(tǒng)識別錯誤率已經(jīng)低至3.57%。同一時刻,他們在另一項圖像識別挑戰(zhàn)賽MS COCO(Microsoft Common Objects in Context,常見物體圖像識別)中同樣成功登頂,在圖像檢測和圖像分割項目上擊敗了來自學(xué)界、企業(yè)和研究機(jī)構(gòu)的眾多參賽者。

這兩個挑戰(zhàn)賽的側(cè)重點(diǎn)各有不同:ImageNet 傾向于評測識別圖像中顯著物體的能力,而MS COCO傾向于評測識別復(fù)雜場景中各類物體的能力。能同時在兩個世界級的比賽中獲得冠軍,足以說明研究組的技術(shù)突破是通用的,那么是何種技術(shù)讓他們在計算機(jī)視覺領(lǐng)域中的研究屢獲突破呢?

微軟芮勇人工智能時代,我們能做什么?

答案是研究員們構(gòu)建了一個152層的深層殘差網(wǎng)絡(luò)(Deep Residual Networks),他們還使用了一個全新的“殘差學(xué)習(xí)”原則來指導(dǎo)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計。殘差學(xué)習(xí)最重要的突破在于重構(gòu)了學(xué)習(xí)的過程,并重新定向了深層神經(jīng)網(wǎng)絡(luò)中的信息流。殘差學(xué)習(xí)很好地解決了此前深層神經(jīng)網(wǎng)絡(luò)層級與準(zhǔn)確度之間的矛盾。這個深層殘差網(wǎng)絡(luò)顯示出了非常強(qiáng)的通用性,藉由此次的突破,相信會有更多的研究人員們能夠從中汲取靈感。

微軟芮勇人工智能時代,我們能做什么?

聚沙成塔:牛津計劃,開放的人工智能技術(shù)平臺

假設(shè)我們現(xiàn)在有一位開發(fā)人員,他想開發(fā)出一個健身類的應(yīng)用,他有很多新奇的想法,想要開發(fā)出很多有趣的功能放進(jìn)自己的應(yīng)用中,如從照片中識別出用戶,或者理解鍛煉者的語音指令。但是這些多樣的功能都只能通過復(fù)雜先進(jìn)的機(jī)器學(xué)習(xí)來實(shí)現(xiàn),而這位開發(fā)人員卻沒有實(shí)現(xiàn)它們所需的時間或資源。在這個時候,如果有一個這樣的智能平臺把這些技術(shù)開放出來就會非常高效。

微軟在人工智能、語音識別、計算機(jī)視覺上投入巨大,并已經(jīng)在相關(guān)領(lǐng)域取得了很多優(yōu)秀的研究成果,我們也非常想把一些核心技術(shù)放在這樣一個智能平臺上,使得第三方的開發(fā)者更容易站在巨人的肩膀上,而不再是從零開始,他們可以更專注于他們想開發(fā)的應(yīng)用,而人工智能的核心技術(shù)就直接從我們的平臺上使用就可以了?,F(xiàn)在我們開放出了這樣的一個平臺,我們稱為Project Oxford,牛津計劃。

微軟芮勇人工智能時代,我們能做什么?

微軟牛津計劃是由一系列基于云的機(jī)器學(xué)習(xí)相關(guān)的API、SDK和相關(guān)服務(wù)等組成,自2015年4月推出以來,這個平臺目前已經(jīng)涵蓋了很多人工智能的方向,包括視覺、語音和語言等。在視覺方面,我們有對圖形的理解、分析和處理。有對人臉的識別、檢測、驗(yàn)證等,甚至包括人臉面部情緒的分析。此外還有視頻中的人臉追蹤、運(yùn)動檢測等。在語音方面,有語音識別、聲紋識別。在語言方面,有拼寫檢查、語言理解等功能。

2015年,有一個火爆全球的“顏齡”測試應(yīng)用叫“How-old.net”,它會基于你上傳的照片,利用人臉定位技術(shù)檢測照片中人臉的特征點(diǎn),根據(jù)特征點(diǎn)猜測人的顏齡。這個應(yīng)用其實(shí)就是微軟的兩位工程師利用牛津計劃中人臉識別API開發(fā)的,整套解決方案也就花了幾個小時的時間,代碼也才不到20行,搭建起來十分迅速。于是在網(wǎng)站建成后的幾小時時間里,成千上萬的用戶瘋狂傳播,席卷全球,它的受歡迎程度也完全超乎我們的想象。牛津計劃中的面部表情分析也十分有用,它能讓計算機(jī)學(xué)會“察言觀色”,觀察出你面部表情的變化來計算出你情緒的變化,開發(fā)人員就可以基于此輕松開發(fā)出許多有趣的應(yīng)用了。

微軟芮勇人工智能時代,我們能做什么?

微軟牛津計劃自2015年的Build開發(fā)者大會首次推出以來經(jīng)歷了多次更新,更多的功能被逐步添加進(jìn)來,這其中也少不了包括微軟亞洲研究院在內(nèi)多個技術(shù)團(tuán)隊的支持。2016年3月在Build開發(fā)者大會上,也推出了更多的功能更新。

聚合的智能:微軟AI姐妹花小冰小娜

1991年,微軟研究院創(chuàng)立時,比爾·蓋茨希望研究院能夠致力于讓未來的計算機(jī)能夠看、聽、學(xué),能用自然語言與人類進(jìn)行交流。這是一個與AI研究關(guān)聯(lián)緊密的夢想。二十多年來,我們時刻在為之努力。當(dāng)計算機(jī)對人類多種感官的模擬不斷完善聚合,一個聚合智能的人工智能助手就這樣誕生了。

在微軟,有一對人工智能姐妹花叫小冰和小娜。小冰是微軟(亞洲)互聯(lián)網(wǎng)工程院開發(fā),集合了微軟亞洲研究院眾多研究成果的一款人工智能聊天機(jī)器人。微軟小娜則是微軟(亞洲)互聯(lián)網(wǎng)工程院基于Cortana,深度本地化再創(chuàng)新的一款人工智能個人助理,扮演的是知書達(dá)理的女秘書形象,幫助用戶做好日常的行程計劃安排。

小冰和小娜可謂是集大成的人工智能機(jī)器人,她們將看、聽、說等類似于感官所獲得的信息融為一體,共同形成接近于人的感知和一定程度的認(rèn)知。而對于這種集大成的智能,我們稱為聚合的智能。你可能覺的這些技能看著很簡單,其實(shí)在她的背后融合了計算機(jī)圖像識別、語音識別、自然語言處理、文本轉(zhuǎn)語音、機(jī)器學(xué)習(xí)、社交網(wǎng)絡(luò)情感計算等不同方向的人工智能技術(shù)多年來的累積和沉淀。而這些能力的組合,便是人工智能的智力集合。微軟亞洲研究院的技術(shù)更像是幕后的隱形人,你雖然看不見他們的運(yùn)作流程,但在和小冰對話的過程中卻能潛移默化地感受到技術(shù)的神奇。

以圖片識別為例,小冰就采用了微軟亞洲研究院視覺計算組開發(fā)的基于深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)的計算機(jī)視覺算法系統(tǒng),將我們在ImageNet挑戰(zhàn)賽中的成功經(jīng)驗(yàn)用于其中。在語義分析環(huán)節(jié),小冰通過深層神經(jīng)網(wǎng)絡(luò)等的機(jī)器學(xué)習(xí)算法,不斷學(xué)習(xí)過去的歷史信息,建立相應(yīng)的數(shù)學(xué)模型。通過機(jī)器學(xué)習(xí)互聯(lián)網(wǎng)和社交平臺等文本內(nèi)容,進(jìn)行數(shù)據(jù)挖掘得出相關(guān)的主題,這是機(jī)器學(xué)習(xí)和文本理解的基礎(chǔ)。在決策環(huán)節(jié),小冰采用了多種聯(lián)合決策機(jī)制,以實(shí)現(xiàn)帶有情感的高效機(jī)器決策。這其中采用了分布式詞向量訓(xùn)練模型算法,更好地計算兩個詞之間的“情感距離”,以關(guān)系的“遠(yuǎn)近”幫助小冰更好地決策。在輸出環(huán)節(jié),小冰大量學(xué)習(xí)人類的表達(dá)方式,從中識別出帶有不同情感色彩的表達(dá)方式,再結(jié)合不同對話的上下文語境,以個性化的語言方式表達(dá)出來。

正是大數(shù)據(jù)、深度神經(jīng)網(wǎng)絡(luò)等技術(shù)的發(fā)展與突破,讓小冰兼具“有趣”與“有用”,實(shí)現(xiàn)了超越簡單人機(jī)對話的自然交互,并以此與用戶建立了強(qiáng)烈的情感紐帶?,F(xiàn)在微軟小冰從最初不到100萬的使用人數(shù)到現(xiàn)在的4000萬人,而人類用戶與小冰的平均每次對話輪數(shù)也高達(dá)23輪。而此前最領(lǐng)先的同類人工智能機(jī)器人,平均對話輪數(shù)僅有1.5~2輪。你可以設(shè)想一下,在平時,大部分情況下人與人的溝通回合也未必能達(dá)到23次,但跟小冰這個機(jī)器人竟能聊這么久,可見用戶和小冰之間有著非常強(qiáng)烈的情感聯(lián)系。

目前微軟小冰和小娜已經(jīng)登錄了多個平臺,也包括 iOS 和 Android 平臺。所以目前小冰和小娜是支持跨平臺、跨設(shè)備的,你在一臺設(shè)備下設(shè)定任務(wù),另外一個設(shè)備能夠同步為你服務(wù)。今天微軟可能是唯一一家有跨設(shè)備、跨平臺助手的公司。

那么未來像小冰和小娜這樣的人工智能助理應(yīng)該如何發(fā)展呢?對于人工智能助理又應(yīng)該有哪些衡量標(biāo)準(zhǔn)呢?我認(rèn)為這其中有三個“度”,分別是廣度、深度和溫度。

第一是有廣度,它的知識面越來越寬了,可能上到天文地理,下到日常生活,無論是什么話題,她都能和你聊起來。第二是深度,它不僅什么東西都知道,在一些專門的領(lǐng)域還能做得特別深入,就像我們?nèi)祟愐粯?。人類都有自己不同的專長,幾年之后人工智能助手也能像人一樣“有所長”,如能夠擔(dān)任你的工作助理,或是醫(yī)療助理、語言學(xué)習(xí)助理等。第三個度是溫度,人工智能助手和你能有情感層面的交流,它知道在你生日的時候?yàn)槟銣?zhǔn)備驚喜,也知道如果你之前睡眠質(zhì)量不好或睡太晚,今天會提醒你早點(diǎn)休息,或是給一些助眠建議。

當(dāng)人工智能助理有了廣度、深度和溫度,我們理想的人工智能便離我們不遠(yuǎn)了。

2016年,人工智能的新紀(jì)元

人工智能的春天再次來臨,關(guān)于人工智能的過論也越來越多。對于大眾來說,對人工智能技術(shù)的發(fā)展現(xiàn)狀還是一知半解的。人工智能威脅論,比如他們會取代人類的很多工作,如好萊塢電影中常見的人工智能最后反過來控制人類等,大家對人工智能有種陌生的敬畏感。但反過來人們也是非常期待人工智能的,因此在接觸到現(xiàn)實(shí)生活中的人工智能產(chǎn)品時,又往往會產(chǎn)生落差感。

為了方便大家理解人工智能發(fā)展到了什么程度,有人提議以人的年齡作為評判依據(jù),試圖找到現(xiàn)在人工智能的智力水平究竟相當(dāng)于人類多少歲的智力水平。事實(shí)上這個問題是無法回答的,因?yàn)槟壳暗娜斯ぶ悄芸梢詰?zhàn)勝50多歲的國際象棋特級大師,但人工智能目前的學(xué)習(xí)能力與正在每天吸收新知識的5歲入學(xué)兒童是完全無法相提并論的。那么我們究竟應(yīng)該認(rèn)為人工智能現(xiàn)在是50歲呢,還是5歲都不到呢?

我們從上面這個問題可以看到,人工智能發(fā)展目前所面臨的挑戰(zhàn)和障礙巨大,實(shí)現(xiàn)人工智能道阻且長,但歸根結(jié)底制約人工智能研究的有3個主要因素

實(shí)現(xiàn)人工智能,道阻且長

首先是理論框架的制約,目前在理論和算法上我們還有很大的提升空間。例如,以今天最成功的深度學(xué)習(xí)為例,它的理論框架也存在一定的問題。例如,深度學(xué)習(xí)今天都用的是BP算法,它的網(wǎng)絡(luò)結(jié)構(gòu)都是往前連接的,目標(biāo)函數(shù)也都只有一個。但機(jī)器學(xué)習(xí)中有很多別的理論不是這樣的結(jié)構(gòu),它們的目標(biāo)函數(shù)也是不一樣的,它的梯度下降算法也是不一樣的。為什么深度學(xué)習(xí)就始終保持著一個結(jié)構(gòu)、一個目標(biāo)函數(shù)來做呢?這里面其實(shí)有更多的理論值得我們研究。

其次是運(yùn)算能力的制約。雖然我們已經(jīng)有GPU的Farm,但想訓(xùn)練一個大的網(wǎng)絡(luò)其實(shí)還是會耗費(fèi)大量的時間,此次ImageNet比賽中我們就在很多GPU上跑了很長的時間。開發(fā)一個新算法需要調(diào)試很多不同的參數(shù)結(jié)構(gòu)等,如果我們能一分鐘的時間內(nèi)測試一個算法的話,我們就會有機(jī)會嘗試各種不同的算法,也許我們在有限的時間內(nèi),在ImageNet挑戰(zhàn)賽中能夠取得更好的成績。

最后是數(shù)據(jù)量的制約。我們目前還沒有開發(fā)出像人類一樣擁有自主學(xué)習(xí)能力的算法,目前的機(jī)器學(xué)習(xí)還需要大量的訓(xùn)練樣本來支撐。機(jī)器學(xué)習(xí)中的參數(shù)越多,我們需要的訓(xùn)練樣本就越多,最終的算法才會越精確。擴(kuò)大訓(xùn)練數(shù)據(jù)的樣本量有沒有好的解決辦法呢?可以從兩個方面來考慮:一個方面是行業(yè)和行業(yè)之間建立一個協(xié)議標(biāo)準(zhǔn),通過一個接口讓不同行業(yè)之間的數(shù)據(jù)可以共享。另外一個方面就是智能設(shè)備和不同的傳感器之間數(shù)據(jù)的輸出和機(jī)器學(xué)習(xí)算法的輸入也應(yīng)該有個協(xié)議。有了這兩方面的協(xié)助,機(jī)器學(xué)習(xí)的數(shù)據(jù)量就會迅速擴(kuò)大,最終訓(xùn)練模型也會更為準(zhǔn)確。

把握人工智能的脈搏:規(guī)劃產(chǎn)業(yè)布局

如今人工智能的春天再次回歸,這對整個的技術(shù)產(chǎn)業(yè)也提出了新的要求。我認(rèn)為未來人工智能的產(chǎn)業(yè)布局將大致會分為6個環(huán)節(jié),其中人工智能的應(yīng)用將會發(fā)展為針對普通用戶的交互和用于工業(yè)界使用的兩大分支。

首先是最底層的模擬人腦的芯片的開發(fā)環(huán)節(jié)。今天的計算機(jī)芯片基本上還是基于馮諾依曼架構(gòu),這種架構(gòu)對于一般的邏輯計算和存儲都十分實(shí)用,但想實(shí)現(xiàn)人工智能,這樣的架構(gòu)可能就不那么理想了。目前有不少公司正在嘗試能否開發(fā)出像人腦一樣的芯片。

那么從底層往上走的第二個環(huán)節(jié)是介于硬件芯片和上層開發(fā)之間的類腦計算的結(jié)構(gòu)和模塊。有了模擬人腦的芯片硬件之后,研究人員就能夠基于這類芯片開發(fā)出一些模擬人腦及思維方式的一些算法或者模塊。目前無論是語音識別還是計算機(jī)視覺,都是在GPU上模擬神經(jīng)元,模擬出很多層,但由于芯片的限制,層與層之間的反饋基本上是往前單向反饋的。今天的芯片需要大量的服務(wù)器和GPU才能模擬出人腦很容易就能做到的事情,這是遠(yuǎn)遠(yuǎn)不夠的。

再往上一個環(huán)節(jié)是開發(fā)出分布式的、大規(guī)模的、雙向前后反饋的機(jī)器學(xué)習(xí)的算法。微軟亞洲研究院不久前開源的分布式機(jī)器學(xué)習(xí)工具包DMTK就屬于這一類。

之后一個環(huán)節(jié)就是基于這些大規(guī)模的分布式算法,對人的看、聽、說等各種感官的模擬,如計算機(jī)視覺、語音識別、語音合成,甚至人的一些思維等。現(xiàn)在做智能家居、可穿戴設(shè)備等公司的技術(shù)創(chuàng)新也主要集中在這個環(huán)節(jié)進(jìn)行創(chuàng)新。

如果再往上,第五個環(huán)節(jié)是什么呢?我們的人工智能在這個時候已經(jīng)能完成一些基本的任務(wù),有了在某種程度上的智能(IQ),接下來就要去完善EQ,進(jìn)行情感計算。例如,你的人工智能助手知道什么時候應(yīng)該說真話,什么時候說“善意的謊言”。

人工智能最頂端,也就是第六個環(huán)節(jié),我會稱為增強(qiáng)智能(Augmented Intelligence)。計算機(jī)擅長的是記憶存儲、邏輯推理、演算分析等目前可編程的工作,這與人類負(fù)責(zé)邏輯思考的“左腦”十分相似,其實(shí)人工智能就像是一個負(fù)責(zé)推理演算的“左腦”,它與人類的右腦相配合,便能夠充分利用人類才有的創(chuàng)造力,延伸出無限可能,進(jìn)而實(shí)現(xiàn)增強(qiáng)的智能。【相關(guān)閱讀:從人工智能到增強(qiáng)智能】

微軟芮勇人工智能時代,我們能做什么?

人工智能時代,我們能做什么

人工智能是一個特別復(fù)雜的概念,他擁有非常多層的維度,如果只憑一些單獨(dú)的個體,是沒法把這件事情做成的。因此對于企業(yè)來說,非常重要的一點(diǎn)便是合作。大家都在期待人工智能實(shí)現(xiàn)技術(shù)的指數(shù)爆炸,實(shí)現(xiàn)這個一定是有一大批的研究者、企業(yè)和機(jī)構(gòu)之間的相互溝通和相互合作。

我們非常高興地看到,越來越多的科技公司都在開放或開源核心的人工智能技術(shù)。微軟已經(jīng)開放了很多人工智能技術(shù),包括我在上文中提到的牛津計劃,還包括Azure Machine Learning,以及不久前亞洲研究院開源的分布式機(jī)器學(xué)習(xí)工具包DMTK。我們不僅僅是開源某一個具體的算法,我們其實(shí)開源了一整套的分布式訓(xùn)練框架,使得任何別的機(jī)器學(xué)習(xí)的算法能在一個更大規(guī)模的分布式的系統(tǒng)上更加便利地進(jìn)行計算。我們也相信,開放會是未來的趨勢,因?yàn)橹挥写蠹蚁嗷ズ献?,最后人工智能技術(shù)才可能整體地、穩(wěn)健地向前邁進(jìn)。

對于個人來說,在人工智能時代我們也有很多參與其中的方法。毫無疑問,人工智能一定是今后整個IT產(chǎn)業(yè)幾個大的發(fā)展趨勢中至關(guān)重要的一個。對于信息領(lǐng)域的在校學(xué)生來說,需要通過學(xué)習(xí)一些基礎(chǔ)理論課程打好堅實(shí)的基礎(chǔ)。對于目前的從業(yè)人員們來說,則需要保持好終生學(xué)習(xí)的習(xí)慣,IT產(chǎn)業(yè)日新月異,需要時刻包括整個產(chǎn)業(yè)的大趨勢。

把握產(chǎn)業(yè)大趨勢的方式有很多,如了解國家的發(fā)展方向和戰(zhàn)略方向,和整個產(chǎn)業(yè)的發(fā)展方向相結(jié)合,從而找到自己的方向。其次是多參加一些產(chǎn)業(yè)界最前沿的會議,這是一種很好的吸取營養(yǎng)的方式。最后就是經(jīng)常接觸一些初創(chuàng)企業(yè),如美國的硅谷、中國的中關(guān)村和一些產(chǎn)業(yè)園區(qū)和孵化器等,因?yàn)檫@些地方經(jīng)常是一些最前沿想法發(fā)生的地方。

因此對于個人來說,把握好這四點(diǎn)至關(guān)重要:產(chǎn)業(yè)的發(fā)展趨勢、國家政策的發(fā)展趨勢、最前沿的一流學(xué)術(shù)會議,以及多接觸初創(chuàng)企業(yè)。

2016年已至,未來已來。在新的開始,讓我們一同攜手擁抱人工智能,一同開拓人工智能的無限可能!

附錄

微軟芮勇人工智能時代,我們能做什么?

新智元之《機(jī)器+人類=超智能時代》書籍封面

  • 原文標(biāo)題:《從密歇根湖畔到“中國硅谷”中關(guān)村——訪微軟亞太研發(fā)集團(tuán)總監(jiān)芮勇博士》(發(fā)布時有改動)

  • 選自:楊靜《新智元:人工智能 + 機(jī)器人 = 超智能時代》

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多