導(dǎo)讀 劍橋2019年度《AI全景報告》全方位總結(jié)過去一年來AI領(lǐng)域的研究成果與突破、人才形勢、產(chǎn)業(yè)動態(tài)、政府政策以及中國在AI方面的成就,并做出未來預(yù)測,具有重要參考價值。有鑒于此,筆者將其中的要點進行整理編譯如下,以饗讀者。 關(guān)鍵詞: 人工智能(Artificial Intelligence,AI)、機器學(xué)習(xí)(Machine Learning,ML)、強化學(xué)習(xí)(Reinforcement Learning,RL)、深度學(xué)習(xí)(Deep Learning,DL)、聯(lián)邦學(xué)習(xí)(Federated Learning)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)、自然語言處理(Natural Language Processing,NLP)、自動機器學(xué)習(xí)(Auto ML)、生成對抗網(wǎng)絡(luò)(Generative Adversarial Nets) 一 研究和技術(shù)突破 01 RL征服新領(lǐng)域 1.《蒙特祖瑪?shù)膹?fù)仇》 OpenAI在其中所展現(xiàn)出的“隨機網(wǎng)絡(luò)蒸餾(RND)”,技術(shù)激勵RL代理探索不可預(yù)測的狀態(tài)。 2.《星際爭霸2》 AlphaStar使用了多智能體訓(xùn)練算法,有效地創(chuàng)建了一個相互競爭的智能體聯(lián)盟,共同探索巨大的戰(zhàn)略空間。最終的阿爾法星智能體是由納什平均產(chǎn)生的,它結(jié)合了個體智能體開發(fā)的最有效的策略組合。 3.《雷神之錘III競技場奪旗》 通過使多個代理獨立學(xué)習(xí)并采取行動來相互協(xié)作和競爭,可以實現(xiàn)人員水平的績效。代理僅使用像素和游戲點作為輸入。 4.OpenAI5性能進一步提高 OpenAI的Dota2的每個機器人都是一個單層,4,096個單元的LSTM,可讀取游戲狀態(tài)并通過自彈式RL進行訓(xùn)練(相對于自身為80%,較舊版本為20%)。 5.計算方面的改進是OpenAI5競爭性能的當(dāng)關(guān) 02 RL的下一步 1.游戲訓(xùn)練單個機器人來執(zhí)行許多復(fù)雜的任務(wù) 2.計算機視覺預(yù)測模擬和真實世界來學(xué)習(xí)靈活性 加州大學(xué)創(chuàng)建的7自由度手臂機器人。OpenAI的機械手,以驚人的敏捷度洗凈物理對象。 3.好奇心驅(qū)動的探索 通過反復(fù)試驗來學(xué)習(xí)任務(wù)。在探索(嘗試新的行為)與探索(重復(fù)有效的行為)之間取得平衡。 4.學(xué)習(xí)用于在線規(guī)劃的動力學(xué)模型 從圖像中學(xué)習(xí)環(huán)境動態(tài)模型,并通過快速預(yù)測多個時間步長的收益,通過快速的在線計劃選擇行動。與最新的A3C和D4PG算法相比,模擬環(huán)境之間的交互作用減少了50倍,并且計算時間相似。 5. 應(yīng)用RL來優(yōu)化大規(guī)模生產(chǎn)環(huán)境中的系統(tǒng) 03 自然語言處理的關(guān)鍵年 1. 在非常大量的公開可用(即來自網(wǎng)絡(luò)的無標簽文本)上進行預(yù)訓(xùn)練的語言模型 2.研究人員開始制定GLUE(通用語言理解評估基準)用于評估NLP系統(tǒng)在一系列跨邏輯,常識理解和詞匯語義的任務(wù)。 3.無bitexts的機器翻譯發(fā)展迅速 4.各大企業(yè)對用于實際產(chǎn)品的聯(lián)邦學(xué)習(xí)的研究興趣日益濃厚 5.越來越重視數(shù)據(jù)隱私并保護已部署的ML系統(tǒng)免受攻擊 04 深度學(xué)習(xí)在醫(yī)療中的應(yīng)用 1.診斷眼疾 專家級診斷和治療推薦建議是通過兩階段基于深度學(xué)習(xí)的分類網(wǎng)絡(luò)實現(xiàn)的。 2.使用心電圖檢測和分類心律不齊 使用針對患者的端到端深度學(xué)習(xí),以原始格式處理動態(tài)環(huán)境中的心電圖軌跡,以檢測心律。 3.從腦電波中解讀想法 與機器學(xué)習(xí)線性回歸方法相比,深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)方法將人腦電波中語音的清晰度提高了65%。 4.恢復(fù)殘疾人的肢體控制 通過電刺激和神經(jīng)網(wǎng)絡(luò)解碼器對四肢癱瘓患者的前臂進行長期修復(fù)。 5.合成化學(xué)分子 將神經(jīng)網(wǎng)絡(luò)與蒙特卡洛樹搜索結(jié)合使用,通過訓(xùn)練1,240萬個反應(yīng)來解決逆合成。這種方法比最先進的計算機輔助綜合計劃要快得多。 05 AutoML新發(fā)展 1.用于神經(jīng)網(wǎng)絡(luò)架構(gòu)和超參數(shù)的進化算法 聯(lián)合優(yōu)化超參數(shù),在最大程度降低復(fù)雜性和尺寸的同時,最大化網(wǎng)絡(luò)性能。 2.設(shè)計具有實際設(shè)備性能反饋的資源受限的網(wǎng)絡(luò) Google展示了一種基于RL的多目標方法(MnasNet),以找到具有低真實世界推理延遲的高精度CNN模型。Facebook提出了一種可區(qū)分的神經(jīng)體系結(jié)構(gòu)搜索(DNAS)框架,該框架使用基于梯度的方法在分層搜索空間上優(yōu)化CNN體系結(jié)構(gòu)。 06 GANs新發(fā)展 1.從粒狀到GANgsta 較大的模型和大量的培訓(xùn)進一步提高了使用GAN生成的圖像的質(zhì)量。 2.從面孔到全身合成 電影放映一次,然后通過將面部與口語單詞匹配(左),以不同的語言生成相同的視頻。下一步是從頭到腳生成整個身體,目前用于零售目的(右)。 07 圖像、視頻、語音處理 1.從單個圖像學(xué)習(xí)對象的3D形狀 2.對過去25年中對16,625篇AI論文的分析顯示,出版物輸出的巨大增長以ML和RL最受歡迎 二 人才 01 人才形勢 1.谷歌在2018年首屆學(xué)術(shù)AI學(xué)術(shù)會議NeurIPS上繼續(xù)保持統(tǒng)治地位,并且在研究論文輸出量最高的組織中名列前茅。 2.在NeurIPS,ICML或ICLR發(fā)表論文的4,000位研究人員中,有88%是男性 3.大型科技公司高級工程師的薪酬接近1,000,000美元。另一方面,每小時$1.47的數(shù)據(jù)標簽工作大幅增長。 4.與復(fù)雜的電子供應(yīng)鏈(例如富士康)類似,用于AI應(yīng)用程序的“數(shù)據(jù)標簽工廠”也有了大幅增長。 5.神經(jīng)網(wǎng)絡(luò)的先驅(qū)者獲得了圖靈獎,這是計算機科學(xué)領(lǐng)域的最高獎項。 02 論文 歐洲發(fā)表AI論文最多,但只有中國的平均被引用率在增長。 03 教育 1.麻省理工學(xué)院在計算和AI領(lǐng)域的新10億美元投資 2.AI的大學(xué)課程入學(xué)人數(shù)正在增長,中國更是突出 3.AI教授和學(xué)生的性別差異仍然存在 04 Element.AI人才調(diào)查2019 1.只有19%的學(xué)術(shù)作者和16%的行業(yè)作者是女性. 2.44%的作者從美國獲得博士學(xué)位,從中國獲得11%,從美國獲得6%英國。 3.五個國家(美國,中國,英國,德國和加拿大)占作者總數(shù)的72%。 4.AI人才的流入和流出 加拿大,英國和瑞士是“平臺國家”,既吸引外國人才,又出口本地培訓(xùn)的人才。美國和中國的生態(tài)系統(tǒng)更加成熟-流入量和流出量都很低。 05 企業(yè)需要更多的應(yīng)用人才將研究投入生產(chǎn) 三 AI產(chǎn)業(yè) 01 形勢 1.對AI主題的全球風(fēng)險資本投資以每年超過$27B的速度增長 2.大型科技公司繼續(xù)吞噬AI優(yōu)先初創(chuàng)公司 3.機器人流程自動化:一夜之間的企業(yè)成功(15年的醞釀) 出生于歐洲的RPA市場領(lǐng)導(dǎo)者UiPath的客戶同比增長4倍。 02 現(xiàn)實世界中的機器人 1.清潔和店內(nèi)操作 2.波士頓動力公司機器人的進步 3.大企業(yè)用機器人制造機器人 4.全棧初創(chuàng)企業(yè)進入制造市場 5.應(yīng)用機器人支持的全渠道、自動化執(zhí)行供應(yīng)鏈 6.亞馬遜推出了更多用于物流和分揀的倉儲機器人 03 自動駕駛汽車行業(yè) 1.當(dāng)現(xiàn)場視音頻飛行員在加利福尼亞乃至世界各地成長時,有幾名玩家撤退,導(dǎo)致錯過了幾個發(fā)布日期以及其他玩家的沉默 2.Waymo在2018年行駛了超過100萬英里,是2.8倍的下一個最佳性能(GMCruise)和16倍的第3最佳性能(Apple) 3. 2018年,自動駕駛汽車公司的行駛里程達到了人類行駛里程的0.00066% 通用/Cruise的問題包括每英里一次的“嚴重駕駛不適”,自動駕駛路線比人類駕駛的同類路線要長80%,以及在備受矚目的投資者測試中出現(xiàn)的故障。 04 需求預(yù)測 1.信息以數(shù)字形式提供,使其可用ML來預(yù)測需求。 2.ML的有效利用 能源、洪水預(yù)測 、旅行、本地企業(yè)、后勤、零售 3.閱讀機器的改進和普及 4.制藥公司與AI驅(qū)動的藥物開發(fā)公司合作 05 AI專利 1.AI專利家族的增長速度超過了AI科學(xué)出版物。 2.計算機視覺是最受歡迎的專利領(lǐng)域。在計算機視覺中最受歡迎的領(lǐng)域是生物識別(與生物數(shù)據(jù)相關(guān)的應(yīng)用)。 3.大型科技公司通過云計算獲利,但未通過托管的AI服務(wù)獲利。通過托管的AI服務(wù)獲利還處于初期。 06 AI硬件:巨頭和初創(chuàng)企業(yè)蓬勃發(fā)展的全球格局 1.對移動芯片組執(zhí)行AI任務(wù)的性能進行基準測試 高通的Snapdragon通過為浮點和量化神經(jīng)網(wǎng)絡(luò)展示非常強大的性能和硬件加速而獲勝。 2.對移動設(shè)備執(zhí)行AI任務(wù)的性能進行基準測試 三星、華為和小米位居榜首,而谷歌的Pixel3排在第22位。 3.將計算和競爭推向邊緣 到2025年,谷歌和NVIDIA將在連接設(shè)備產(chǎn)生的40萬億字節(jié)數(shù)據(jù)中應(yīng)用AI計算。亞馬遜使開發(fā)人員可以在其云上訓(xùn)練ML模型,并導(dǎo)出針對特定邊緣硬件平臺量身定制的優(yōu)化模型。 4.5G作為無處不在的連接和AI計算的骨干 5G為更快,更穩(wěn)定的信息傳輸提供了潛力。擁有5G的組織或國家將為世界其他地區(qū)設(shè)定標準。目前,中國遠遠領(lǐng)先于美國。 四 政治 01 公眾對AI的態(tài)度 1.公平競爭和雙重標準。 美國人不贊成以競爭為目的的AI技術(shù),但是一旦對手開始開發(fā)AI技術(shù),這種情況就會改變。 2.治理 公眾不知道如何衡量AI的開發(fā)和部署的責(zé)任者和方式。 3.企業(yè)道德 64%的人認為企業(yè)應(yīng)該設(shè)立一個AI審查委員會,定期討論企業(yè)的道德決策。 4.人口屬性的激勵 人口屬性對開發(fā)高級機器智能的支持差異很大。 02 各國政策 1.“德國制造的AI” 計劃宣布到2025年投資30億歐元。、 2.芬蘭的“1%”AI計劃 芬蘭正在對其1%的人口進行ML的基礎(chǔ)培訓(xùn),力求在AI的實際應(yīng)用方面占據(jù)世界領(lǐng)先地位。 3.歐盟AI計劃 通過專注于“合乎道德的AI”及其“安全和高質(zhì)量產(chǎn)品”的聲譽,實現(xiàn)差異化。 4.美國新對策 將出口管制應(yīng)用于機器學(xué)習(xí),包括“深度學(xué)習(xí)”、“強化學(xué)習(xí)”和“計算機視覺”。并暗示美國制裁名單上的組織成員(例如華為)不能擔(dān)任論文審閱者。 03 新挑戰(zhàn) 1.大規(guī)模監(jiān)測監(jiān)視技術(shù)日趨成熟 2.武器化自然語言處理導(dǎo)致的欺詐和計算式宣傳 3.深度偽造影響政治議程 4.旨在讓開發(fā)者限制軟件使用的AI許可證 5.機器算法中的性別偏見 6.AI的倫理道德問題 五 中國 01 人臉識別的應(yīng)用發(fā)展迅速 02 中國互聯(lián)網(wǎng)公司向農(nóng)業(yè)領(lǐng)域擴張,阿里巴巴和京東都進入了畜牧業(yè) 03 研發(fā)支出 中國企業(yè)研發(fā)支出增長迅速,但在市場份額方面存在明顯滯后。中國企業(yè)的研發(fā)支出同比增長34%,但美國企業(yè)仍占全球科技支出的61%。中國的半導(dǎo)體貿(mào)易逆差正在(緩慢)擴大. 04 中國的工業(yè)自動化和工作崗位的轉(zhuǎn)移正在增加。某些中國工業(yè)企業(yè)在過去3年里自動化了40%的勞動力 05 機器貨倉 在中國,機器人正在推動自動化倉儲。京東的上海物流中心每天使用自動化倉庫機器人來組織、挑選和運送20萬份訂單。工廠由4名工人照管。京東的倉庫數(shù)量和表面積同比增長了45%。 06 中國公司仍繼續(xù)在美國公開市場進行IPO(首次公開募股) 07 專利 1. 中國企業(yè)擁有的專利最多,但2017年只有23%是“發(fā)明專利” 2.中國的雙重專利制度使其專利領(lǐng)先于其他國家。 中國的發(fā)明者讓他們的大部分專利在被授予5年后失效。91%的5年設(shè)計專利和61%的5年實用新型專利被放棄。相比之下,美國5年專利的維護費占85.6%。 08 學(xué)術(shù)研究 中國公布的ML研究報告數(shù)量已經(jīng)超過美國。艾倫研究所最近的一項分析顯示,中國在質(zhì)量方面的差距也在迅速縮小。 六 預(yù)測 1.利用NLP研究的最新突破,涌現(xiàn)出一批新的創(chuàng)業(yè)公司在接下來的12個月內(nèi)共籌集了超過1億美元。 2.無人駕駛技術(shù)在很大程度上仍處于研發(fā)階段。 3.數(shù)據(jù)安全性和用戶隱私策略研究突破。 4.高等教育機構(gòu)建立專門建立的AI本科學(xué)位以填補人才空缺。 5.量子計算硬件方面取得重大突破。 6.對AI的治理將有初步實質(zhì)性進展。 |
|