什么叫人工智能呢?人工智能是人類智能的一個計算機的實現(xiàn),從對決的角度,它永遠不可能超過人類智能,只是說在某一個特定的方面它可能勝出,但從智能本身它沒辦法勝出。其實,智能有很多方面,包括邏輯能力,語言能力、空間能力、感知能力、包括音樂感知的能力,肢體的控制能力。 后面這幾個是比較難的,包括人的內(nèi)省、自我反省,包括人際關(guān)系的能力,包括自然探索的能力,比如發(fā)現(xiàn)一些新的東西,完全沒有任何線索,你能想出我要做這個,我把這個問題解決掉。自然探索的能力,包括圖像、圖形的感知能力。 智能分為九個能力,而現(xiàn)在的人工智能在這九個方面只有三個做得還可以,有六個方面還相當(dāng)?shù)倪h,所以我們說現(xiàn)在的人工智能要想挑戰(zhàn)人類智能,路還很長。 以史為鑒 回顧發(fā)展歷程 1956年,達特茅斯會議是一個里程碑。當(dāng)時,人工智能的元老們還很年輕,他們集聚到一起開了兩個月的會,討論怎么樣讓機器具有人的智能、定出了人工智能的最終目標(biāo)以及什么叫人工智能。 現(xiàn)在看起來1956年定義的人工智能的白皮書,到現(xiàn)在一點都不過時。這次會議開了以后,全世界很多學(xué)校都開始跨入到人工智能熱潮當(dāng)中,典型的像斯坦福大學(xué)、CMU、MIT、哈佛大學(xué)很多人都在做相關(guān)的研究,那個階段大家采用的技術(shù)手段,主要是邏輯主義或者符號主義。 什么叫邏輯或者符號呢?實際上就是認為一切的推理,都可以用邏輯演算的方式來實現(xiàn),只要定義了整個邏輯演算的體系,做一個規(guī)則,就可以完成任何事。比如可以進行推理、數(shù)學(xué)證明,可以創(chuàng)作、奏樂等。 目前,主要的自然科學(xué)定理都是用演繹推理的方式來完成的。比如說亞里士多德的三段論體系就是非常典型的演繹推理。 所有演繹推理的基礎(chǔ)是滿足三段論方程,什么叫三段論,有一個大前提,這是一個一般的原理,有一個小前提是要研究的特殊情況,根據(jù)大前提、小前提得到一個結(jié)論,這個結(jié)論是根據(jù)一般情況,對特殊情況做出一個判斷,這就完成了演繹推理,這就叫三段演繹推理。所有的基礎(chǔ)邏輯的方法都是這樣做的,為了做這個當(dāng)時設(shè)計了很多的人工智能語言,用這種語言可以寫人工智能的方程,機器就可以去證明。 當(dāng)然這聽起來很好,當(dāng)時大家都認為十年之內(nèi)人工智能一定可以完成很多事,但一直到1976年前后,大家發(fā)現(xiàn)一開始定的那么高調(diào)的東西絕大多數(shù)都實現(xiàn)不了。1973年有一個英國人發(fā)了一個報告,給AI潑一大盆冷水。他把AI研究分為三類系統(tǒng),A是指自動機、B是機器人、C為中央神經(jīng)系統(tǒng)。自動機和中央神經(jīng)系統(tǒng)研究是有價值的,但進展太慢;機器人的研究毫無價值,而且非常令人失望,所以他建議把所有的機器人研究都取消掉;A和C因為它本身令人失望,所以也是非常低調(diào)。 這個報告出來以后各國政府把對人工智能投入的經(jīng)費全部砍掉,人工智能馬上就進入了嚴(yán)冬。所以1976年實際上是人工智能第一次的嚴(yán)冬的到來。 1976年之后盡管沒有經(jīng)費,但學(xué)者的可愛之處是給錢也做,不給錢也做。因為做邏輯的,前面已經(jīng)把自己的體量拉得很大。當(dāng)時做神經(jīng)網(wǎng)絡(luò)的,基本上沒有得到什么錢,所以本身就是教授帶幾個學(xué)生在玩,這個領(lǐng)域雖然面臨寒冬了,但對他來講沒有變化,盛夏的時候沒有錢,寒冬的時候還是沒錢,所以帶著學(xué)生繼續(xù)玩。 這一玩玩出花樣來,1976年開始有很多做神經(jīng)元網(wǎng)絡(luò)的,不停地寫東西、發(fā)東西,一直到1986年出來一個讓人眼睛一亮的東西,這個東西叫BP算法(即誤差反傳網(wǎng)絡(luò))。 以往的神經(jīng)元網(wǎng)絡(luò)只能做非常小的事,做不了大事。但這個東西出來以后可以做大事了,所以就推動了這個領(lǐng)域發(fā)展。 但它也只能解決一部分問題。一開始人們也期待要解決很多問題,但遙遙無期,到最后又來了第二次的低谷,包括日本第五代機的失敗,當(dāng)時在斯坦福大學(xué)要建一個知識百科全書的項目都失敗了,使得第二次人工智能又跌入了低谷。 第三次是從2006年開始的,現(xiàn)在人工智能的三個大牛,一位多倫多大學(xué)地Geoffrey Hinton,一位是蒙特利爾大學(xué)的Yoshua Bingeo,一位是紐約大學(xué)的Yann LeCun,這一年他們分別發(fā)表了三篇文章在講一件事。這個文章出來了以后,當(dāng)時大家并不知道這個東西要怎么用,這個東西被誰給激活了?李凱和李飛飛做的ImageNet,主要操刀是李飛飛。 ImageNet是一個全球的圖像識別比賽,在2012年以前都是用常規(guī)的方法,2012年開始有一個參賽隊用了這個方法,比別的隊錯誤率馬上降低了一半。到2013年其它方法全部退出,全都是深度學(xué)習(xí),2014年不停地改進。2015年,錯誤率已經(jīng)降得非常多,深度學(xué)習(xí)的網(wǎng)絡(luò)也非常多。到2016年的時候幾乎做到不光人沒法比,錯誤率已經(jīng)低到不需要再做了,所以李飛飛選擇2017年宣布這個比賽停止,不再做了,因為其實已經(jīng)沒有太大促進意義了。 所以,由于深度學(xué)習(xí)的發(fā)展,由于產(chǎn)業(yè)界的熱情參與,產(chǎn)生了很多新的企業(yè),有很多新的機遇,這是非常好的事。 人工智能發(fā)展機遇 在這個機遇下,中國干了什么?中國有一個中國人工智能2.0的發(fā)展戰(zhàn)略研究,這是中國工程院一起來搞的,并發(fā)布了一個重大研究計劃,主要是做五個關(guān)鍵技術(shù)和一批應(yīng)用。 第一個是大數(shù)據(jù)智能。第二個是群體智能,依靠群體的力量推進智能的研究。第三個是跨媒體智能,要把聲音、圖像、文字、自然語言所有這些東西聯(lián)結(jié)在一起來研究智能,這是跨媒體智能未來所希望達到的目標(biāo)。第四個是人機混合增強智能,人和機器混合起來怎么讓智能更高能力更強。第五個是自主智能系統(tǒng),其實就是無人機。我們有五個支柱,上面是應(yīng)用,下面是基礎(chǔ)支撐。 這個輪廓和布局看起來很圓滿,但遠遠不夠。如果看整個人工智能學(xué)科的輪廓,包括計算機視覺、語言識別、自然語言、人機交互、機器人學(xué)習(xí)等方向,目前大的布局是沉浸到應(yīng)用這個方面。 涉及到人的九類智能,我們在邏輯語言文字和圖形圖像來說現(xiàn)在已經(jīng)做得相當(dāng)不錯,中間六類還是有相當(dāng)?shù)木嚯x需要探索。 歷史總是這樣螺旋前進的,人工智能的三次浪潮也是從符號主義到連接主義。這個符號主義到現(xiàn)在為止已經(jīng)有寂寞了30多年,但它作為人類智能的一個高等抽象,應(yīng)該是發(fā)揮作用的,所以怎么發(fā)揮作用,未來大家可以慢慢觀察。 連接主義,就是神經(jīng)元網(wǎng)絡(luò)、深度學(xué)習(xí),目前是非常大行其道的,但怎么樣解決小數(shù)據(jù)甚至沒有數(shù)據(jù)的學(xué)習(xí)?實際還是有相當(dāng)大的挑戰(zhàn),特別是很多的學(xué)習(xí)結(jié)果是不可解釋的,這是最大的挑戰(zhàn)。行為主義是注重自適應(yīng)和進化,這是從人從猴子演化過來,它可能更接近。它怎么樣在學(xué)習(xí)方面做得更好,還是需要探索的。 不管是企業(yè)、國家投資,大家利用好天時地利要好好干一場。人工智能至少還有10年到20年左右的好日子過,大家要珍惜這個機會。 當(dāng)然人工智能既然是一個少年,少年主要的成長靠什么?靠學(xué)習(xí),靠知其所以然的學(xué)習(xí)研究,中國下一代人工智能也會在這個方面進行一些布局,知道今后的方向,也許對大家有點幫助。 (本文根據(jù)中國工程院院士高文公開演講整理而成,未經(jīng)本人確認。) |
|