如今的AI已經(jīng)能夠在Dota2這樣的對戰(zhàn)游戲中戰(zhàn)勝人類了,但游戲主播和解說卻不需要擔(dān)心自己失業(yè),因為當(dāng)前的神經(jīng)網(wǎng)絡(luò)還無法解釋自己為何做出決定。我們可以訓(xùn)練另一個神經(jīng)網(wǎng)絡(luò),對前一個神經(jīng)網(wǎng)絡(luò)做出的每一個決定,來預(yù)測人類會給予其什么樣的解釋。還拿Dota2舉例子,可以訓(xùn)練一個神經(jīng)網(wǎng)絡(luò),對操作游戲的AI點的每一個技能,買的每一個裝備,去猜測人類會給予怎么解釋。但當(dāng)AI進化出人類想不到的策略時,就像圍棋中Alpha Go已經(jīng)能夠走出人類棋手想不出的套路,上述策略就不行了。 本文是《Possible Mind》(點擊查看相關(guān)的讀書筆記)系列讀書筆記的第三篇,圍繞因果推理的創(chuàng)始人,《The book of why》的作者Judea Pearl的題為“The limitation of opaque machine learning”,延伸而寫成。當(dāng)前神經(jīng)網(wǎng)絡(luò)缺少解釋性,其成功的原理是如魔法一般的黑盒子。當(dāng)前提升模型解釋性的方法,無論是注意力機制,對模型進行壓縮,用線性的淺層的模型來模擬深層的模型,還是對隱藏層的權(quán)重可視化展示,都只是隔靴搔癢,無法帶來質(zhì)變。本文基于Judea Pearl的隨筆以及他去年12月的一篇論文整合而成,先說明可解釋的重要性,再討論因果推理帶來的本質(zhì)改變,再詳述因果推理對深度學(xué)習(xí)帶來的八大助力。 當(dāng)掃地機器人遇到上圖的情況,卡住了,如果其內(nèi)部的AI能夠正確的給出為何會卡住的解釋,那下次機器人就會避免不平的環(huán)境,不管造成不平的是地毯還是掉在地上的衣物,這就提高了模型的可擴展性。能夠給出解釋,還可以幫助人更好與AI協(xié)作,假設(shè)每次掃地機器人能夠告訴人自己今天因為那種原因卡住了,從而多花了多少分鐘才掃完屋子,那這家的主人就可以下一次避免讓家里出現(xiàn)地面不平的情況,從而讓機器人能夠更高效的工作,節(jié)約能源。而機器具有因果推理后,還會學(xué)到是自己清掃地毯的角度,使得地毯打折從而使得地面不平的,從而下次用其他的角度去清掃地毯覆蓋的地方。 這些都是實際的好處,而在《Possible mind》這本書中,借用哲學(xué)家Stephen Toulmin在1961年的書《Foresight and Understanding》中的對比,引入了巴比倫和雅典科學(xué)的區(qū)別,同樣是預(yù)測天體的運行,四季的節(jié)律,巴比倫的預(yù)測在精確程度和一致性上都好過同時代的雅典人,但雅典的預(yù)測背后有神話去提供解釋,并且當(dāng)一種解釋比另一種解釋更符合時,前者會戰(zhàn)勝后者,巴比倫式的精準(zhǔn)預(yù)測,沒有帶給這個文明天文學(xué),而古希臘則孕育了現(xiàn)代科學(xué)。 類似的還有李約瑟之問,為何古代中國沒有發(fā)展出科學(xué),盡管其很長的一段時間中技術(shù)是領(lǐng)先全球的。比如勾股定理,明明中國人早在《周髀算經(jīng)》中就有所記錄,但西方人卻稱之為畢達哥拉斯定理。這里的區(qū)別在于前者只是從經(jīng)驗的層面記錄了這個現(xiàn)象,而后者是對此給予了普遍化的證明。用機器學(xué)習(xí)的視角來看,前者無法確定這個規(guī)律的可擴展性如何,而后者保證了在所有的宇宙中,該規(guī)律都是適用的。 借用這個對比,當(dāng)前的深度學(xué)習(xí),盡管取得了突飛猛進的進展,但由于其缺少可解釋性,不透明,還是屬于巴比倫式的。即使其在所有的游戲上,都戰(zhàn)勝了人類,都需要花更少的能源即時間去訓(xùn)練,也不能算是能匹敵人腦的強人工智能。雅典的天文學(xué)者,可以根據(jù)自己的理論,去設(shè)計一個實驗,來估算地球的半徑,還和真實的結(jié)果相差不多,而巴比倫式的不透明的“天文知識”,則根本不會問出這樣的問題。當(dāng)今的大數(shù)據(jù),不會用虛假的概念來講故事,而根據(jù)《人類簡史》中的論述,正是想象出的共同體,使得人類走進了文明時代。 按照J(rèn)udea Peral的分類,認(rèn)識世界分三個層次,最低的是關(guān)聯(lián),只需要觀察就好,例如那些癥狀告訴醫(yī)生這個人患病了,那些行為告訴我這個人容易被促銷打動;再上一層是干預(yù),也就是去通過行為去改變世界之后,看會發(fā)生什么,這個層次要回答的問題是吃藥能不能治病,而最高的層次是反事實的推理,要達到這一層,需要想象力,需要反思,要回答的問題是如果我之前多一些鍛煉,現(xiàn)在是不是就不會生病。 當(dāng)前的有監(jiān)督學(xué)習(xí),是站在了認(rèn)知階梯的第一層,強化學(xué)習(xí)由于和壞境有所互動,是站在了第二層上,通過無監(jiān)督學(xué)習(xí),去預(yù)測下一秒會發(fā)生什么,根據(jù)類比來推測位置的情況,也是介于第一層和第二層之間的。不論是那種學(xué)習(xí)范式,都是基于統(tǒng)計的,得出的結(jié)論是概率性的。正如同不懂得證明勾股定理,永遠(yuǎn)也無法百分之百打包票說這個規(guī)律是普世的,當(dāng)前基于統(tǒng)計的機器學(xué)習(xí),如同三體中被智子鎖死的地球科技,看似進步神速,但總會碰到天花板。 Judea Pearl給出的解藥是他發(fā)明的公理化式的因果推理圖,想要詳細(xì)了解的推薦下面的免費課程,edx平臺上的,名為Causal Diagrams: Draw Your Assumptions Before Your Conclusions。 那如何機器學(xué)習(xí)在中加入因果推理了?回答是結(jié)構(gòu)化因果模型(Structural Causal Models,下文簡稱SCM),通過有向圖的形式,對常識中的因果作用方向的假設(shè)做結(jié)構(gòu)化的建模,例如下圖中x代表是否采取實驗療法,y代表從癌癥中康復(fù),z代表性別,那么對世界的模型就是性別可以決定一個人是否更可能會選擇實驗療法,是否更容易從癌癥中康復(fù),但反方向的因果卻是不現(xiàn)實的。 有了因果圖,那SCM就可以根據(jù)提問,來計算一個和因果推理的問題,究竟有多少數(shù)據(jù)的支持,不管這個問題位于上述的認(rèn)知階梯的第幾層,都能夠給予回答。這里的,也就是考慮不同性別下是否采取實驗療法對癌癥康復(fù)的概率,而根據(jù)深度學(xué)習(xí)的模型,可以估算出真實的狀況下的概率,如果發(fā)現(xiàn)倆者的差距很大,那因果推斷的模型就可以對實驗療法導(dǎo)致癌癥康復(fù)這個因果論斷給予反駁,說明這是沒有事實依據(jù)的,而不是只說明實驗療法和癌癥治愈缺少統(tǒng)計顯著性。 那這對于解決當(dāng)前機器學(xué)習(xí)缺少解釋性的問題,又什么本質(zhì)的改變了?這里列出Judea Pearl的八條回答: 首先是讓機器做的假設(shè)以人類容易理解的方式(因果圖)呈現(xiàn)出來,從而讓模型更加透明,也讓測試模型的推論的后人能夠更精準(zhǔn)的去檢驗?zāi)P偷聂敯粜?。可以說只有能夠解釋清楚自己每一步的推理的邏輯,模型才算具有了可證偽性,否則即使有一個不符合模型預(yù)測的事件,由于不確定其和模型的因果假設(shè)有什么關(guān)系,又該怎么區(qū)分這究竟是應(yīng)該被去除的噪音還是能推翻整個認(rèn)知模型的反例。 第二點是通過因果推斷,去除混雜因素的影響。當(dāng)前的機器學(xué)習(xí),重要先進性數(shù)據(jù)清洗,特征提取,往往花在特征工程上的時間占到了全流程的大頭。有了因果推斷,就不必人,來根據(jù)常識去掉那些可能影響相關(guān)性的混雜因素,從而在更復(fù)雜的壞境下,做到端對端的學(xué)習(xí)。這使得模型能夠超越建模者的認(rèn)知局限,從而模擬真實壞境更復(fù)雜的相互作用。 第三點是算法化的回答反事實的問題。人類能夠區(qū)分出充分條件和必要條件,能區(qū)分cause of effect與effect of cause,例如小明酒后游泳溺水而死,游戲是小明死亡的必要而不是充分條件,要回答這樣的問題,就需要進行反事實的思考,去幻想如果小明沒有游泳會怎樣,如果游泳時小明沒有喝酒會怎樣。如果機器能夠做這樣的思考,那AI思考的模塊化程度就會進一步提高,需要的訓(xùn)練數(shù)據(jù)也會減少,對于跨領(lǐng)域的遷移學(xué)習(xí)也會有所助力。 第四個助力是區(qū)分直接和間接的誘因,如果只有關(guān)聯(lián)分析,那在較長的時間尺度上,就會面臨如何區(qū)分是否之前的決定帶來了獎勵的問題,但如果能夠?qū)⒁蚬P(guān)系描述出來,并且根據(jù)數(shù)據(jù)來評價每一條因果鏈條的堅固程度,那就能夠去解決強化學(xué)習(xí)中在較長的時間尺度上,該如何分配獎勵的問題。區(qū)分了直接的誘因與通過第三方作用間接的影響,就能夠判定數(shù)據(jù)中那些異常點處在間接影響的鏈條上,受到未知因素的影響,屬于噪音,而對于處于直接因果鏈條上的,則異常不應(yīng)該被視作是噪音,而是可以證偽模型的“黑天鵝”。 第五個助力是模型具有跨領(lǐng)域的適用性,還能夠通過其他領(lǐng)域來驗證該模型的魯棒性。如果一個通過強化學(xué)習(xí)的智能體在一種游戲中表現(xiàn)優(yōu)異,那預(yù)期換一個游戲,該模型也不會表現(xiàn)的太差,這種能力被稱為domain adaptation,人類就有這個能力,例如dota玩的好的人,玩英雄聯(lián)盟也不差。如果智能體是通過因果推理,來決定下一回合的policy,那這個思考過程就更像人類做決定時的所思所想,由此類比推出,智能體也會具有更好的domain adaptation。 第六個助力避免sampling bias,正如人類的認(rèn)知偏見會讓人丟掉那些對支持自己結(jié)論不適合的數(shù)據(jù),人類在對機器建模時,也會展現(xiàn)出類似的認(rèn)知偏見。如果機器具有了公理化的因果推理,那通過反事實的問題,就可以指出人類可能受到了采樣偏見的影響。這指出了人機協(xié)作的新的可能性,不是機器只懂得找出相關(guān)性,從而指數(shù)級的放大人的認(rèn)知偏見,而是機器根據(jù)人對世界的建模,去幫助人做人類不擅長的用數(shù)據(jù)找出偏見,從而帶來一個更公平的模型。 第七個助力是通過因果模型,來判定數(shù)據(jù)集中是否存在數(shù)據(jù)缺失的問題。例如建模者以為女性不擅長數(shù)學(xué),那用來訓(xùn)練該錄取那個學(xué)生的分類器時女性申請者的樣本就會很少,從而使得基于統(tǒng)計相關(guān)的模型預(yù)測女生不應(yīng)該錄取到數(shù)理相關(guān)的專業(yè)。但對于基于因果判定的模型,那只要對世界的假設(shè)中包含性別會影響是否報名數(shù)理相關(guān)專業(yè)這個因果聯(lián)系,那模型就能夠根據(jù)數(shù)據(jù)判定出這里存在著可能的數(shù)據(jù)缺失,從而提醒建模者注意。 第八個助力是去發(fā)現(xiàn)因果關(guān)系,例如遺傳學(xué)中的孟德爾隨機,就是利用了基因在有性生殖中自然會發(fā)生重組,來區(qū)別到底基因的差距與人身體表現(xiàn)出來的胖瘦高矮這樣的表型到底是因果性還是相關(guān)性?,F(xiàn)實中存在著諸多類似孟德爾隨機的自然形成的與隨機雙盲實驗等價的場景,通過讓模型具有因果推斷能力,就能夠發(fā)現(xiàn)未知的因果關(guān)系。 附圖是孟德爾隨機的示意圖 總結(jié)全文,當(dāng)前的深度學(xué)習(xí),這樣model free的模式,無法達到人類水平的智力,只有增加了因果推斷,才能像科學(xué)的精神孕育出持續(xù)不斷的發(fā)現(xiàn)那樣,讓機器學(xué)習(xí)走到之前無法企及之地,例如上文列出的八種具體任務(wù),都需要更高層次的思考。當(dāng)前的深度學(xué)習(xí),模型缺少解釋性,可遷移性,也不夠魯棒,會由于一個像素的改變而徹底改變分類的結(jié)果。所有的指數(shù)級增長都會有盡頭,當(dāng)前深度學(xué)習(xí)取得的成就,大多只是依賴計算資源和訓(xùn)練數(shù)據(jù)的指數(shù)化增加,只有不斷站在更高的認(rèn)知階梯,通過自我指稱獲得的遞歸式的思考,才是無限的增長模式。因此將因果模型引入下一代人工智能中,是充分且必要的。 需要注意的是,因果推斷的模型,依賴與建模者去根據(jù)常識或本領(lǐng)域背景,給定對因果關(guān)系運行的方向,如果這個假設(shè)有問題,那模型是無法從數(shù)據(jù)中發(fā)現(xiàn)人類建模者犯了因果倒置的問題的,這說明不管多么先進的模型,都需要建模者的智慧參與其中。 參考文獻:The Seven Tools of Causal Inference with Reflections on Machine Learning 更多閱讀 |
|