引子 人工智能引發(fā)的奇跡恐怕早就不再是新聞了,這熱潮當(dāng)然是在去年三月李世乭與AlphaGo(阿法狗)的對弈開始廣為世人知道。前天(10月19日),一篇Nature重磅論文“Mastering the game of Go without human knowledge”引發(fā)國內(nèi)廣泛熱議,人工智能再次刷新人們的認(rèn)識。 新一代的AlphaGo Zero,被翻譯為阿法元,不依賴于任何人類的棋譜,不參考人類任何先驗知識,完全靠自己強(qiáng)化學(xué)習(xí)(reinforcement learning)和參悟,它花三天時間就可以自己左右互博490萬棋局。阿法元棋藝增長遠(yuǎn)超阿法狗,以100:0,百戰(zhàn)百勝。此前,阿法狗曾花了幾個月時間,學(xué)習(xí)人類三千萬棋局,才打敗人類。 阿法元不再被人類認(rèn)知所局限,能夠發(fā)現(xiàn)新知識,開發(fā)新策略,它讓深度學(xué)習(xí)用于復(fù)雜決策更加方便可行。美國杜克大學(xué)人工智能專家陳怡然說:我覺得最有趣的是證明了人類經(jīng)驗由于樣本空間大小的限制,往往都收斂于局部而不自知(或無法發(fā)現(xiàn)),機(jī)器學(xué)習(xí)可以突破這個限制。 無怪乎紐約客最近的封面文章《人類未來只能給機(jī)器人打下手》,并配了一幅人類向機(jī)器人乞討的場景的圖片。 這篇文章,就著重說一下,人類要向人工智能學(xué)習(xí)的三堂課。 深度學(xué)習(xí) 事實上,帶動這波人工智能背后的關(guān)鍵技術(shù)——深度學(xué)習(xí)(deep learning),早在2012年就開始在各種國際舞臺上發(fā)光發(fā)熱。在全球最知名的ImageNet機(jī)器視覺舞臺上,由深度學(xué)習(xí)之父Hinton領(lǐng)軍的團(tuán)隊,首次參賽就讓原本停滯難以再進(jìn)步的正確率大幅提升。(2010為72%,2011年為74%,2012年為85%)。不僅如此,這個數(shù)字進(jìn)步的速度令人咋舌,在短短三年的時間內(nèi),微軟研究院用了高達(dá)152層的神經(jīng)網(wǎng)絡(luò)讓正確率提升到95.06%,這個數(shù)字背后的意義在于,機(jī)器終于跨過了人類視覺的94.9%的壁壘。 從此之后,深度學(xué)習(xí)就一再創(chuàng)造奇跡,2017年在語音轉(zhuǎn)文字上,以95.51%的正確率贏過了人力速記員的單詞正確率94.9%(這數(shù)字的確跟視覺的壁壘是一樣的,人類為何常??ㄔ?5%這關(guān),值得研究)。DeepMind團(tuán)隊則是在唇語領(lǐng)域上以超高的93.4%贏過了人類79.6%的水平。來自卡耐基梅隆大學(xué)操刀的Libratus,也在一對一不限注的德州撲克國際競賽中,擊敗所有的人類參賽者。 在看到這一波波的機(jī)器的勝績之后,大家首先會擔(dān)憂工作是否會不保,但是讓我們今天先把這件事放一邊,我們從算法原理(放心,后方無致人昏睡的數(shù)學(xué))的角度來看看,到底是什么關(guān)鍵點造就了這些成果。身為深度學(xué)習(xí)的從業(yè)人員的我,有時覺得這些神經(jīng)網(wǎng)絡(luò)不僅是單單模仿人類,在某些地方甚至是人類沒有做到位的部分,卻能在深度學(xué)習(xí)身上看到。 第一堂課:分享、共享 深度學(xué)習(xí)是從機(jī)器視覺領(lǐng)域開始展露頭角的,可是要知道,神經(jīng)網(wǎng)絡(luò)(neural network)這項技術(shù)至今已經(jīng)將近80年了。我依然記憶猶新的是我之前在教授機(jī)器學(xué)習(xí)的課程中,常常告訴學(xué)生神經(jīng)網(wǎng)絡(luò)的權(quán)重又多又復(fù)雜、缺乏好的方式進(jìn)行優(yōu)化,所以耗費時間極長,沒事不建議使用……之類云云。但是為何現(xiàn)在更深更復(fù)雜的網(wǎng)絡(luò)卻能夠處理,除了現(xiàn)在是一個前所未有充滿計算力的時代,大家手上任何一臺智能手機(jī)的計算力其實都超過當(dāng)初阿波羅號登月美國太空總署后臺的超級計算機(jī),這些計算力當(dāng)然也是助力之一。但是其實真正關(guān)鍵則是來自于“共享權(quán)重”的概念,分享正是人工智能要教人類的第一堂課。 拿人類的視覺來說,當(dāng)一只貓不管出現(xiàn)在我們視野的哪個位置,他始終就是一只貓,不會變成任何其他的動物。這個現(xiàn)象意味著我們?nèi)祟愐暰W(wǎng)膜的1.2億個視桿細(xì)胞,其實都是用同一套規(guī)則在解讀世界的。所以現(xiàn)代的深度學(xué)習(xí)有別于以往神經(jīng)網(wǎng)絡(luò)每個神經(jīng)元各自學(xué)習(xí)的做法,而改為同深度神經(jīng)元共享權(quán)重(在此各位可以把權(quán)重視為學(xué)習(xí)到的特征)。如此一來不但節(jié)省了數(shù)億倍的運算量,而且每個神經(jīng)元都能學(xué)習(xí)到比過去各自學(xué)習(xí)時更完整的特征。 回頭看看人類,共享難道不是推動人類進(jìn)步的一大助力嗎?現(xiàn)在人工智能風(fēng)潮能夠比過往來的更強(qiáng)烈,其實跟現(xiàn)在所有主流分析框架都是開源有著密不可分的關(guān)系,對,全部都是開源且免費….。2008年,全球最大的面向開源軟件項目的托管平臺Github問世(我們常戲稱這是全球最大的同性交友平臺),帶動了程序代碼分享的風(fēng)氣,而這些分享其實也是人類文明在近期能夠以前所未有的速度進(jìn)步的主因。對許多人來說分享往往會變成濫好人的同義詞,我們先跳開那些共享單車、共享充電寶這些前景還不明確的商業(yè)模式,若是仔細(xì)解讀這兩年硅谷拿到高額投資的初創(chuàng)企業(yè),有一半以上都有將技術(shù)開源。把視為公司核心競爭力的技術(shù)開源是否意味著公司貶值?但是事實上透過開源冷啟動所獲得的用戶基數(shù),以及透過開源來提升代碼與產(chǎn)品的質(zhì)量,這些新創(chuàng)公司從開源上得到的好處其實是遠(yuǎn)超過敝帚自珍的。 第二堂課:專注 除了共享權(quán)重之外,另一個概念“感知域”也是深刻地影響機(jī)器視覺的效果。在以前的神經(jīng)網(wǎng)絡(luò)中,我們總是企圖要讓每個神經(jīng)元學(xué)習(xí)與全體所有神經(jīng)元之間的關(guān)聯(lián),這個想法造成計算量膨脹到人類無法解決,但是想想我們?nèi)嗽诳礀|西時,總是把目光聚焦在一處,其他周遭的畫面就變得模糊,這個概念被用在了深度學(xué)習(xí)帶來了感知域的觀念,也就是說只需要專注在周遭的神經(jīng)元就可以,其他較遠(yuǎn)的都可以不用管他,專注,正是人工智能要教人類的第二堂課。 再來我們把角度從視覺換成聽覺,語音識別是大家最普遍使用的人工智能應(yīng)用之一,從早期的語音轉(zhuǎn)文本,到現(xiàn)在更進(jìn)一步的去理解句子中的語意,用的是我們稱之為遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的技術(shù)。它一樣有著共享權(quán)重的特性,而且它具備了本次的輸出就是下一次的輸入這樣的遞歸結(jié)構(gòu),很適合用來處理本質(zhì)就是序列的語音與語言。像是神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)就是廣為人知的,但是畢竟語言的本質(zhì)比圖像抽象很多,所以早期深度學(xué)習(xí)處理語意這塊并不能得到很好的成果,這個問題一直到了一個新的技術(shù)觀念問世為止,那就是“注意力(attention)”。這個技術(shù)概念其實非常直接,當(dāng)我們在翻譯一段英文時,通常是看完整句后,然后除了要翻譯的字詞之外,還會推敲一下上下文,有些字是特別重要的,會造成語意的極大差異,而有些字則是有或沒有都不至于造成嚴(yán)重的影響。評估這些特定范圍的字的影響力的機(jī)制就被稱為“注意力”。 人類世界也是這樣,就像是有些新創(chuàng)公司急著每種商業(yè)模式都想碰一碰鉆一鉆,但是往往只會落到徒勞無功的下場。唯有專注,不僅要在特定領(lǐng)域中做到最好,而且要具備強(qiáng)大的“注意力”機(jī)制,才能夠從千絲萬縷的信息中,找出真正值得全心投入的領(lǐng)域。 第三堂課:全局觀 人工智能要教人類的第三堂課是“全局觀”。還記得柯杰在人機(jī)大戰(zhàn)后談到AlphaGo說到,“感覺AlphaGo和去年判若兩人,當(dāng)時覺得他的棋很接近人,現(xiàn)在感覺越來越像圍棋上帝……”。為何會讓人感到不像人而像神,而這中間的差別是什么,我認(rèn)為巴菲特的名言在此分外貼切——“人們總是在該恐懼的時候貪婪,在該貪婪的時候恐懼”,我想這就是人性的一個很好的批注。說人工智能像神其實有點言過其實,但是若是說到讓人感受到神性的部分,恐怕在于人類總是會被當(dāng)下的情勢、被自己心中的貪嗔癡所束縛而做出錯誤的決定,而機(jī)器卻能夠完全不被影響,只往最后目標(biāo)前進(jìn)。 在每個深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中,我們都會給予它一個損失函數(shù),神經(jīng)網(wǎng)絡(luò)的任務(wù)就是要想辦法透過學(xué)習(xí)來讓損失降低。那如果兩個任務(wù)不同且損失不同的神經(jīng)網(wǎng)絡(luò)銬在一起時(我們稱之為聯(lián)合學(xué)習(xí)),會發(fā)生甚么事。如果是人類的世界,恐怕兩個人都會著眼于自己的損失最小化,而做出錯誤的決定,最后導(dǎo)致雙輸。那深度學(xué)習(xí)呢?下面這張圖是我之前在處理這種聯(lián)合學(xué)習(xí)的截圖,當(dāng)時看到這個景象其實整個人是深受感動的。神經(jīng)網(wǎng)絡(luò)的做法是,它們可以一起接受短期的損失增加,甚至像圖中是短期損失高到嚇人,但是他們卻能攜手度過,一起邁向整體損失更低的新境界,在深度學(xué)習(xí)的眼中,只有全局目標(biāo),不會受短期損失影響。仔細(xì)想想人類的文明,多少資源都浪費在大家為了鞏固自己的短期利益,而造成全體眾人皆輸?shù)膽K境,有時想想也荒謬,在商業(yè)世界失去了的人性,反而能在人工智能身上找回來。 我不知道未來的世界會如何,我只知道現(xiàn)在是站在新的工業(yè)革命的起點,既然分享、專注、全局觀,能將沒用的神經(jīng)網(wǎng)絡(luò)改頭換面,我相信人類也能再次進(jìn)化,創(chuàng)造新的文明奇跡,更何況這些本來就是我們曾擁有但是丟失的初心…… |
|