機器之心專欄 作者:李航 字節(jié)跳動科技有限公司
前言 1950 年,圖靈發(fā)表論文《計算機器與智能》 (Computing machinery and intelligence),提出著名的 圖靈測試。這段時間里,圖靈關(guān)注的主要問題是, 在計算機上是否可以實現(xiàn)人的思考 (thinking) [1]。他 的基本觀點是,只要進行適當(dāng)?shù)木幊蹋嬎銠C可以 像人腦一樣工作。我們不需要給思考一個嚴格定義 1, 可以通過圖靈測試判斷計算機的“思考”能力是否 達到了人的水平。 1957 年,馮·諾伊曼去世,次年他的遺作《計算機與人腦》(The computer and the brain) 出版。該書是他在離世前的兩年時間里準(zhǔn)備的演講草稿,討 論他當(dāng)時最關(guān)心的研究課題:計算機和人腦。馮·諾伊曼把計算機和人腦都看作是計算機器 (automata), 對兩者進行了比較,試圖為建立統(tǒng)一的計算機器理 論奠定基礎(chǔ)。 人的思考是不是計算,是怎樣的計算?計算機 是否可以實現(xiàn)人的思考?這個問題是認知科學(xué)、人工智能的一個核心問題,這一點從計算機領(lǐng)域兩位 巨人對這個問題的關(guān)注程度就可見一斑。 本文對計算與思考(或智能)這個話題進行簡單綜述與討論。必須申明,筆者是計算機科學(xué)家, 對腦科學(xué)、認知科學(xué)等是外行。因為人工智能的目標(biāo)是要構(gòu)建能夠“思考”和“行動”的機器,所以作為人工智能的研究人員又不能不對這些問題進行 關(guān)注與思考,進而斗膽執(zhí)筆,寫出本篇文章,希望能拋磚引玉,引發(fā)大家的思索與辯論。 腦科學(xué)告訴我們的 人腦是由千億級的數(shù)百種神經(jīng)元(神經(jīng)細胞) 通過千萬億級的突觸連接形成的神經(jīng)網(wǎng)絡(luò),能夠?qū)?現(xiàn)各種智能性功能,包括感知、認知、語言、情感、 創(chuàng)造、意識。腦科學(xué)研究雖然取得了一定的成果, 但離探明人腦的工作機理還相差甚遠 [2]。 圖1 大腦主要區(qū)域 在宏觀層面,腦科學(xué)研究對大腦各個腦區(qū)的結(jié) 構(gòu)與功能有一定的認識。人腦由大腦、小腦、腦干 組成。大腦最重要的部位是大腦皮層,人類與動物 的主要區(qū)別在于人類擁有極其發(fā)達的大腦皮層,可以說大腦皮層造就了人類的智慧。大腦皮層不同區(qū) 域掌管不同的功能,包括視覺皮層、聽覺皮層、味 覺皮層、體感皮層、運動皮層、語言區(qū)等(見圖 1)。 在微觀層面,腦科學(xué)研究對神經(jīng)元的信息處理 機制有比較清楚的了解[3]。神經(jīng)元通常由一個細胞體、 一個軸突和多個樹突組成。樹突接入信號,軸突接 出信號,神經(jīng)元與神經(jīng)元之間由突觸連接(見圖 2)。 現(xiàn)神經(jīng)元從多個前神經(jīng)元得到輸入信號,當(dāng)輸入信 號超過一定閾值時被激活,產(chǎn)生輸出信號,傳遞到 多個后神經(jīng)元。神經(jīng)元之間的信號傳遞通過突觸進 行。前神經(jīng)元在軸突末梢釋放化學(xué)物質(zhì),通過突觸 傳到現(xiàn)神經(jīng)元的樹突,打開現(xiàn)神經(jīng)元的離子通道 (ion channel),促使其細胞內(nèi)外離子流動,形成現(xiàn)神經(jīng)元 的輸入信號。現(xiàn)神經(jīng)元的輸出信號通過軸突以離子 流的形式傳遞到軸突末梢,繼續(xù)向后神經(jīng)元傳遞。 圖2 神經(jīng)元 在介觀層面,腦科學(xué)研究對神經(jīng)環(huán)路的信息處 理原理有一些認識。神經(jīng)可塑性是神經(jīng)網(wǎng)絡(luò)的重要 特點,有所謂的赫伯法則(Hebbian rule),認為同 時被激活的神經(jīng)元之間的連接被強化,產(chǎn)生新的鏈 路,形成新的記憶 (fire together, wire together)。對 概念的記憶存儲于由密切連接的神經(jīng)元組成的細胞 群中,激活其中的部分神經(jīng)元可以喚起對整個概念 的記憶。 可以看出人腦是一個由龐大復(fù)雜網(wǎng)絡(luò)組成的信 息處理系統(tǒng)。它通過神經(jīng)元之間的信號傳遞實現(xiàn)信 息處理,具有以下特點 :處理速度并不很快,進行 的是并行處理,計算與存儲融合在一起,擁有自學(xué) 習(xí)能力。 心智的計算理論 心智的計算理論 (computational theory of mind) 認 為,人的思考是計算,人腦或心智是計算系統(tǒng)。這 里說的計算不是比喻,而是實質(zhì)上的 [4]。這個認知 科學(xué)、腦科學(xué)、人工智能等領(lǐng)域的理論,在20 世紀(jì) 60~70 年代占據(jù)主流地位,代表人物包括認知科學(xué)家 福多 (Jerry Fodor)和平克 (Steven Pinker)、腦科學(xué)家 馬爾 (David Marr)、哲學(xué)家丹奈特 (Daniel Dennett) 等。 計算系統(tǒng) 馬爾提出了計算的層次概念,認為無論是計算 機還是心智都是計算系統(tǒng),需要從三個不同且相關(guān) 的層次理解,包括計算層、表征層、實現(xiàn)層。計算 層決定系統(tǒng)的輸入與輸出,對應(yīng)計算的功能 ;表征 層決定系統(tǒng)內(nèi)部的表征與算法,對應(yīng)計算的軟件; 實現(xiàn)層決定系統(tǒng)的物理實現(xiàn),對應(yīng)計算的硬件。 心智的計算理論把心智看作是圖靈式計算機 (Turing style machine),認為人的思考(感知、認知等) 是這種機器上的計算。這一點與圖靈和馮·諾伊曼 的觀點一脈相承。有許多理由讓人相信這個想法的 正確性。給定一個輸入,產(chǎn)生一個輸出,至少從功 能的角度,心智做的是信息處理,可以把心智看作 是一種計算系統(tǒng)。神經(jīng)元對輸入的多個信號進行處 理,輸出一個信號,進而傳遞信息,從實現(xiàn)的角度, 是一種計算器件。 心智的計算理論中,心智的表征理論是重要的 一個分支,從表征的角度進一步推進心智是計算系 統(tǒng)的想法。 心智的表征理論 心智的表征理論(representational theory of mind) 認為思考是在心智中(圖靈式計算機上)的符號操 作 [5,6]。人的思考和行動是基于常識的,由信念或愿 望驅(qū)動。信念是對事實的描述,愿望是對目標(biāo)的描 述,常識是對世界的描述,而這些描述是通過內(nèi)心 的語言進行的,稱為“心智語言”(mentalese)。也 就是說,心智中的符號操作基于心智語言。 心智語言同自然語言一樣,由符號和語法組成。 符號有簡單的,也有復(fù)雜的,語法規(guī)則決定符號的 組合方式以及產(chǎn)生的語義。聽別人講一段話,人一 般不能復(fù)述原話,但可以把內(nèi)容講述出來,對這個 現(xiàn)象的解釋是,人理解自然語言時把它轉(zhuǎn)化成了心 智語言。自然語言有歧義(多個語義),但心智語 言沒有,原因是人能夠區(qū)別自然語言的歧義,說明 人用不同的心智語言表達了不同的語義。 有一些認知學(xué)實驗支持心智語言存在的假說。 比如,讓受驗者坐在電腦屏幕前,屏幕上瞬間閃出 兩個英文字母,根據(jù)內(nèi)容快速按下兩個按鈕中的一 個。如果兩個英文字母相同,按其中的一個,如果 兩個字母不相同,按另外一個。有時出現(xiàn)的是同一 個字母且大小寫相同(如“A A”“ a a”),有時出現(xiàn) 的是同一個字母但大小寫不同(如“A a”“ a A”)。 結(jié)果發(fā)現(xiàn),大小寫相同時,受驗者按按鈕的速度更 快,準(zhǔn)確率更高。說明在第二種情況,人需要做某 種處理把視覺中的符號轉(zhuǎn)換成心智語言中的符號。 中文房間 圖3 中文房間 哲學(xué)家塞爾(John Searle)用著名的中文房間 (Chinese room) 思想實驗,對“心智是計算系統(tǒng),思 考是符號操作”的想法提出質(zhì)疑 [7]。 中文房間思想實驗是說,有一個不懂中文的人 被放到一個房間里,其他人從房間外塞進寫著中文 的紙條。房間里有一本書,寫著中文會話的規(guī)則。 他根據(jù)書上的規(guī)則,對著紙條上的中文符號,找出 相應(yīng)的中文符號畫在紙條上,把紙條塞出房間外(見 圖 3)。從房間外的人看,這個人能夠用中文對話, 會說中文,但是事實上他完全不會。基于符號操作 的計算機器,和中文房間里的人一樣,看似在使用 語言,其實完全沒有理解語言。說明語言理解乃至 思考,不是計算和符號操作。 中文房間的論點引起了極大的反響,各種支持和 反對的意見接踵而至。比如有一個代表性的反對意見 是:確實這個人不會講中文,但是整個房間會講中文。 因為從功能的角度來說這個房間整體可以完成中文的 對話,這個人只是會講中文的系統(tǒng)的一部分。塞爾對 此的反駁是:這個人可以把所有的規(guī)則都記住,也可 以離開這個房間,但是只要他不能把語義附加到符號 上,就不能認為他會講中文。塞爾的主要論點是符號 操作只能代表語法,不能代表語義。 體驗認知理論 體驗認知 (embodied cognition)理論 2 是近二十 年來興起的理論,認為生命體(包括人和其他動 物)的身體是感知和認知的基礎(chǔ),身體的體驗對感 知和認知起著決定性的作用 [8]。代表人物包括認知 科學(xué)家雷可夫 (George Lakoff)、腦科學(xué)家達馬西奧 (Antonio Damasio)、哲學(xué)家克拉克 (Andy Clark) 等。 可以說,體驗認知理論對心智的計算理論提出了一 定的挑戰(zhàn)。 腦科學(xué)的假說 達馬西奧認為,思考是能夠在意識中產(chǎn)生表象 (image)的,在下意識中進行的對神經(jīng)表征 (neural representation) 的操作 [9]。神經(jīng)表征是人腦的神經(jīng)活 動(神經(jīng)網(wǎng)絡(luò)中的信號傳遞)產(chǎn)生的狀態(tài)。表象是 指人的意識中對事物形象的認識,包括視覺、聽覺、 體感等的表象。比如,提到“黃色的帽子”,我們會 在腦海里聯(lián)想到黃色的帽子,這就是它的視覺表象。 腦和身體是不可分割的有機體(這里說的身體指除去腦之外的身體部位)。腦和身體的相互作用, 形成一個整體,與外界相互作用,產(chǎn)生人的行為。 通過神經(jīng)系統(tǒng),外界信號可以從身體器官傳到大腦, 指令信號也可以從大腦傳到身體器官。大腦發(fā)出的 指令未必都經(jīng)過思考,有很多屬于被動的反應(yīng)。經(jīng) 過思考的指令,會在意識中產(chǎn)生表象,成為人的主 動的命令。達馬西奧指出“我們未必是思考機器, 其實我們是思考的感覺機器 (We are not necessarily thinking machines; we are feeling machines that think)”。 思考也使用單詞和符號。單詞和符號作為表征 被記憶,人在說出或?qū)懗鲆痪湓捴?,單詞和符號 相關(guān)的聽覺表象、視覺表象等浮現(xiàn)于意識中。人的 邏輯和數(shù)學(xué)思維也基于表象,而不是符號。一個證 據(jù)是,許多數(shù)學(xué)家、物理學(xué)家,包括愛因斯坦,都 將自己的抽象思維過程描述為表象的操作過程。 這里談到意識,這也是認知科學(xué)、腦科學(xué)和哲 學(xué)關(guān)注的一個重要問題,至今仍是一個很大的疑團。 因為涉及的內(nèi)容較多,本文不作討論。 體驗?zāi)M假說 體驗?zāi)M假說 (embodied simulation hypothesis) 是關(guān)于語言理解的體驗認知理論,認為人的語言理 解是在心智中進行的,基于自己過去的視覺、聽覺、 運動等體驗的模擬 [10,11]。 人進行語言理解時既使用語言相關(guān)的大腦部 位,又使用感知和運動相關(guān)的大腦部位。理解語 言描述的概念時,會聯(lián)想到概念相關(guān)的圖像,這 時大腦視覺皮層變得活躍 ;會聯(lián)想到概念相關(guān)的 聲音,這時大腦聽覺皮層變得活躍 ;會聯(lián)想到概 念相關(guān)的運動,這時大腦運動皮層變得活躍。語 言理解的過程就是,喚起大腦各個部位相關(guān)體驗 的記憶,基于這些記憶在心智中生成語言所描述 的內(nèi)容的過程。 語言理解大多發(fā)生在下意識,在意識層面,會 產(chǎn)生相關(guān)的表象。比如,問:“大猩猩有沒有鼻子?”要回答這個問題,我們會在腦里先浮現(xiàn)出大猩猩的 視覺表象,然后根據(jù)這個表象去回答問題。再比如, 聽到 :“ flying pig(飛豬)”,不同的人會根據(jù)自己對 飛的概念的理解(飛的表象),以及對豬的概念的 理解(豬的表象)組合成不同的新的表象。 如果認為語言理解不是基于符號,而是基于體驗 模擬,那么中文房間中的人確實沒有理解語言,塞爾 的觀點可能是正確的。語義不是由符號定義出來的, 而是從人與外界交互的體驗中積累抽象出來的。 有很多認知學(xué)實驗證明體驗?zāi)M假說的正確 性。有這樣的實驗,讓受驗者先聽一句話,然后看 一張圖片,之后快速按下兩個按鈕中的一個。如果 圖片中出現(xiàn)了句子中描述的物體,按其中的一個按 鈕,否則按另一按鈕。例如,句子有“木匠把釘子 釘進墻里”(常識中這時釘子的方向是水平的),“木 匠把釘子釘進地板”(常識中這時釘子的方向是垂直 的),圖片中顯示的物體有水平方向的釘子,也有 垂直方向的。結(jié)果發(fā)現(xiàn)句子中釘子的方向和圖片中 釘子的方向一致時受驗者的反應(yīng)速度更快,判斷準(zhǔn) 確率更高。更一般地,語言中描述的和圖像中顯示 的同種物體,當(dāng)方向、形狀、顏色相同時 3,人能 更快地判斷其同一性。說明人在理解語言時,根據(jù) 自己的經(jīng)驗在視覺上想象出了對應(yīng)的場景。 比較與評論 兩個理論 心智的計算理論與體驗認知理論在思考即計算 問題上有相似的觀點,但在思考是怎樣的計算問題 上觀點完全不同 4。從近年的研究成果來看,體驗 認知理論對人的感知與認知機制能夠給出更好的解 釋,有很多理由讓人相信這個理論的正確性,雖然 現(xiàn)在還不能完全否定心智的計算理論。 心智的計算理論以意識為主要對象,基本不考慮下意識 ;只關(guān)心人腦或心智,而不關(guān)心身體,對 這個理論來說,身心是可以分開的,智能可以獨立 于身體而存在。體驗認知理論關(guān)注的是人腦和身體 的統(tǒng)一體,強調(diào)下意識對意識的影響,身體對人腦 或心智的影響 ;對這個理論來說,身心是不能分開 的,(人的)智能不可能獨立于身體而存在。心智 的計算理論中的計算是意識中的符號特征的操作。 體驗認知理論中的計算是下意識中的神經(jīng)表征的操 作,其結(jié)果浮現(xiàn)于意識中成為表象。圖4 給出了兩 個理論的對比。 圖 4 心智的計算理論與體驗認知理論的對比 人工智能 在人工智能 60 多年的歷史中,一直有符號主義 (symbolism)和連接主義 (connectionism)之爭。前 30 年研究的重點是知識與推理,占主導(dǎo)地位的是符 號主義,后30 年特別是近十年研究的重點是機器 學(xué)習(xí),特別是深度學(xué)習(xí),占主導(dǎo)地位的是連接主義。 這與心智的計算理論與體驗認知理論的發(fā)展在時間 上有一定的對應(yīng)關(guān)系。認知科學(xué)和人工智能本來就 是相互影響的兩個學(xué)科。 深度學(xué)習(xí)的重要概念是人工神經(jīng)網(wǎng)絡(luò)和神經(jīng)表 征。神經(jīng)表征將圖像、語音和語言的內(nèi)容都表示為 實數(shù)向量。人工神經(jīng)網(wǎng)絡(luò)是對各種表征進行操作, 從而完成各種感知、認知的模式識別任務(wù)的機器學(xué) 習(xí)模型。深度學(xué)習(xí)的“神經(jīng)表征”與體驗感知理論 的“神經(jīng)表征”不盡相同,但也有相通之處。人工 神經(jīng)網(wǎng)絡(luò)和生物神經(jīng)網(wǎng)絡(luò)具有不同的機制,后者借 鑒了前者的原理。 結(jié)語 思考即計算這一命題是認知科學(xué)與人工智能的核 心問題。圖靈和馮·諾伊曼時代以來,其正確性就不 斷被一些事實所佐證。計算機在數(shù)值計算上早已超過 人類,近年在智力競賽、圍棋上又完勝人類,在圖像 分類、語音識別、機器翻譯上也接近人類。這些說明 對人類來說屬于思考的問題,在計算機上都可以實現(xiàn)。 由此看來,圖像理解、語言理解等現(xiàn)在看來還非常困 難的問題,未來將有希望在計算機上實現(xiàn)或部分實現(xiàn), 原因是這些問題的本質(zhì)也是人的思考。 心智的計算理論和體驗認知理論從不同角度對 “思考是怎樣的計算”給出了答案。前者認為思考 是符號計算,后者認為思考是神經(jīng)計算。雖然現(xiàn)在 沒有確定性的結(jié)論,但體驗認知理論似乎對人的思 考機制給出了一個令人信服的解釋。近年深度學(xué)習(xí) 的巨大成功說明基于神經(jīng)計算(人工神經(jīng)網(wǎng)絡(luò))的 信息處理能更好地實現(xiàn)人的感知與認知能力。希望 體驗感知理論的研究取得更大的進展,為人工智能 提供更多的啟發(fā)和引導(dǎo)。 如果智能和身體不可分割的假說成立,那么構(gòu)建 像人一樣的智能系統(tǒng)就需要從開發(fā)智能系統(tǒng)的“身體” 入手,讓它們在與環(huán)境的互動中獲得智能,這似乎意 味著要走一條非常遙遠而艱難的路徑。但現(xiàn)實中往往 并不需要構(gòu)建像人一樣的智能系統(tǒng),很多情況下能 得到輔助人的智能工具就足矣,所以問題可以被簡 化,這時體驗認知理論仍然具有借鑒意義。 注釋
參考文獻
作者介紹 李航:中國計算機學(xué)會(CCF)高級會員,《中國計算機學(xué)會通訊》(CCCF)特邀專欄作家。 字節(jié)跳動科技有限公司人工智能實驗室總監(jiān)(Director of AI Lab)。主要研究方向為自然語言處理、信息檢索、機器學(xué)習(xí)等。 本文為機器之心專欄,轉(zhuǎn)載請聯(lián)系原作者獲得授權(quán)。 ?------------------------------------------------ 加入機器之心(全職記者 / 實習(xí)生):hr@jiqizhixin.com 投稿或?qū)で髨蟮溃?strong>content@jiqizhixin.com 廣告 & 商務(wù)合作:bd@jiqizhixin.com |
|
來自: taotao_2016 > 《計算機》