人工智能帶來了一類我們永遠無法理解的知識——暗知識,人類的未來取決于我們?nèi)绾螌W會和暗知識相處 近年來人工智能的相關書籍可以說是汗牛充棟,有闡述人工智能基本工作原理與核心應用的,有介紹其發(fā)展歷史的,有分析市場趨勢和商業(yè)機會的,也有探討人工智能帶來的倫理挑戰(zhàn)、社會政治經(jīng)濟影響以及其深遠哲學意義的,當然還有大多數(shù)人無法企及的面向?qū)I(yè)人員的硬核技術類書籍。各種著作繁雜不堪、無從下手,讀者也往往被含混不清似是而非的描述所困擾。 如果你沒有時間去閱讀大量的書籍,想通過一兩本書來了解這個領域的主要脈絡,那么王維嘉博士所著的《暗知識:機器認知如何顛覆商業(yè)和社會》是一個非常好的選擇。本書深入淺出、精煉明晰的覆蓋討論了上面關于人工智能這些最重要的話題。作者原來在斯坦福大學攻讀博士期間便做過人工智能方面的研究,后來在硅谷和中國創(chuàng)辦高科技公司,現(xiàn)在硅谷專注人工智能領域的投資。 有關人工智能的對話所面臨的一個挑戰(zhàn)是,不同領域的人士往往在用不可通約的語言來進行討論,結(jié)果往往是雞同鴨講。大家讀到斯坦福的人工智能專家李飛飛教授和《未來簡史》作者赫拉利近期的對話,可能多少就會有這種感受。例如關于人工智能是否會威脅到人類生存這樣的問題,多數(shù)業(yè)內(nèi)人士持否定態(tài)度,并且堅定的認為業(yè)外人士的焦慮完全是出于對人工智能的憑空想象和誤解,是杞人憂天式的無稽之談。 當然對這類問題回答也并非絕對以業(yè)內(nèi)業(yè)外為分水嶺,業(yè)內(nèi)也有很多像Stuart Russell這樣的專家呼吁對人工智能的威脅持謹慎態(tài)度,而很多像霍金這樣的外行科學家對生存風險的擔憂也并非來自好萊塢科幻片式的漫無邊際的想象,更何況你并不需要是一個核物理學家才有資格去擔憂和抗議核武器有可能給人類帶來的滅絕威脅,歷史的教訓讓我們需要警惕盲目樂觀的技術烏托邦主義??梢姰斀裎覀冃枰粓鲫P于人工智能跨學科、跨領域的討論,《暗知識》正是試圖架起這樣一座橋梁,為不同背景的人探討基本問題建立了一個共同的話語體系。
當然,書中最引人入勝的話題,還是提出了“暗知識”的概念,本書以此命名,也正是因為這是讓其脫穎而出的亮點。人工智能帶來最大的沖擊,可能不只是像赫拉利描述的那樣在未來會顛覆眾多行業(yè)、完全代替我們的工作,導致出現(xiàn)龐大的“無用階級”;而是可能從更根本上改變?nèi)祟惖恼J知,我們需要重新審視“什么是知識”,人工智能的崛起,讓機器可以發(fā)現(xiàn)人類永遠無法理解的一類新知識—“暗知識”。 什么是“暗知識”呢?作者按照“可否表達”、“可否感受”兩個維度把知識分成了四類: 第一類是即可表達也可感受的知識,我們大部分的常識,經(jīng)典科學中的命題知識(propositional knowledge)或陳述性知識(descriptive knowledge),以及可描述的人文知識都屬于這類范疇。比如“作用力等于反作用力”,“地球有四十六億年的歷史”,“巴黎是法國的首都”等等。 第二類知識可表達不可感受,我們都可以認出三角形、四邊形、五邊形、六邊形… 但是你可以表達一個正一千邊形的概念,卻無法直覺感受到它,因為對人的分辨力來講,正一千邊形和圓形沒什么區(qū)別,正一千邊形屬于可想象(conceivable)但不可感受(non-perceivable)的范疇。作者認為,抽象數(shù)學、以及可以由數(shù)學精準描述但無法被直覺所理解的現(xiàn)代物理學、如相對論和量子力學,也都屬于這個范疇。 第三類知識不可表達但可感受,這就是我們常說的“默會知識”(tacit knowledge),比如說你會騎自行車,但是你無法描述清楚你為什么會騎,也無法僅通過表達教給另一個人。前兩類知識都是可以用語言或公式表達、屬于知道某物某事是怎樣的“know-that”知識,而這第三類知識是知道怎么做的“know-how”知識,也就是所謂能力知識或?qū)嵺`知識。 第四類知識即不可表達也不可感受,這是一類原來被我們完全忽略了的知識,是被人工智能挖掘出來的“暗知識”。人類的認知能力只可以表達和感受相對清晰和簡單的數(shù)據(jù)及關系,當遇到多變量非線性的復雜系統(tǒng)時,我們的大腦就無能為力了。心理學家喬治·米勒(George Miller)提出人類短期記憶可以至多關注處理7個事物(相當于我們大腦的計算機只有7個寄存器) ;人類學家羅賓·鄧巴(Robin Dunbar)則發(fā)現(xiàn)人類作為能處理復雜關系的社交動物,我們能處理穩(wěn)定社會關系的上限也就是150人;可見人類的認知能力存在著許多天然的極限。機器則可以通過學習發(fā)現(xiàn)高維高階海量數(shù)據(jù)中隱藏的相關性,遠遠超出了人類個體的腦力所可以理解的范圍。 “暗知識”遠遠要比人類能掌握的明知識和默會知識要大得多。人類2000多年來保留下來的圍棋棋局不過是3000萬個,這在機器自我對弈能夠遍歷學習的可能棋局中不過是大海中的一滴水,難怪AlphaGo可以走出連人類棋圣都無法理解的棋路。 機器診斷程序?qū)碗s病癥的判斷準確度已經(jīng)超過人類醫(yī)生,這似乎和我們以下的想象剛好相反:我們直覺認為機器至多可以對簡單病癥進行邏輯分類、而人類醫(yī)生才可以憑經(jīng)驗和感覺對疑難雜癥做出正確判斷。正是因為機器能夠?qū)W習的數(shù)據(jù)量遠遠超過一個醫(yī)生一生可以接觸到的案例,所以才能發(fā)現(xiàn)復雜數(shù)據(jù)中更深層隱秘的相關性。我們?nèi)祟惪梢愿惺芑虮磉_的知識,只是浮在水面上的冰山一角。 認知論一直是兩千多年來西方哲學最關注的問題,“蘇格拉底轉(zhuǎn)向”使哲學的主題從研究自然轉(zhuǎn)向了對人本身的研究,關于“思考之思考”的高階思維也被看作是軸心文明的標志。我們一直在試圖論證什么是可靠的知識,而“暗知識”的出現(xiàn),將從根本上底顛覆我們對認知的理解。 其實計算機科學的發(fā)展一直在影響著我們對認知的討論,歷史上著名的“四色問題”(任何一張地圖只用四種顏色就可以把所有的國家分開標記)曾經(jīng)讓數(shù)學家們絞盡腦汁,直到1976年通過兩臺計算機、花了1200小時,作了100億次判斷,靠暴力窮舉才證明了四色定理。 地圖上的四色定理 但是關于四色定理證明的哲學爭論一直沒有停止過,經(jīng)典意義上的證明應該是“可檢驗的”(surveyable),即可以由一個數(shù)學家一步步檢驗其證明過程,但機器輔助的四色問題證明光是人類部分解釋算法的證明部分就包括700頁,計算機完成的窮舉計算部分如果打印出來會有4尺高,沒有任何一個人的大腦可以理解如此復雜的證明。 我們只能被動相信機器給出的黑箱結(jié)果,但有誰能夠保證程序沒有bug?我們是在什么意義上完成了證明呢?哲學家Thomas Tymoczkor認為,四色問題機器證明帶來對認知論最大的沖擊,是在先驗的數(shù)學中引入了經(jīng)驗的成分,讓數(shù)學背離了柏拉圖式的純粹。 如果說四色問題的機器證明只是沖擊了數(shù)學這樣的先驗知識,那么當人工智能運用到經(jīng)驗知識中,就會產(chǎn)生更多細思極恐的場景。如果機器告訴金融機構(gòu)哪些人不能獲得貸款服務,或者告訴你和誰結(jié)婚會最幸福,但又無法給出人類可以理解的原因,我們是否只能被動的接受這些黑箱結(jié)果? 如果有一天像科幻電影《少數(shù)人報告》中那樣,機器告訴警察哪些人有很高概率在不久的未來犯罪,是否應該立即把這些可疑人逮捕?(畢竟酒駕的人也往往是在還未造成危害前就可以被抓的)。如果機器告訴領導人必須先發(fā)制人發(fā)動核打擊才可以拯救人類,是否應該立即按下核按鈕? 邁克斯·泰格馬克(Max Tegmark)在其著作《生命3.0》設想了人工智能未來可能的12種結(jié)果,這些結(jié)果大多很有爭議,離我們也很遙遠,但不妨作為引發(fā)討論的思想實驗。其中有一種結(jié)果是“善意的獨裁者”,超級人工智能并沒有消滅人類,但其掌管了一切事物,替我們做所有的決定。人工智能“獨裁者”通過研究我們的基因中展現(xiàn)的進化偏好來了解人類最理想的社會是如何的,以實現(xiàn)人類幸福的最大化。我們的所有欲望都會得到滿足,生命就此變得愉快卻又毫無意義。 所有靠人類智力可能企及的科學研究發(fā)現(xiàn),機器都早已知道答案了,我們至多是人為的制造些挑戰(zhàn),像解習題一樣重新發(fā)現(xiàn)一遍知識,以滿足一下好奇心,但這只能算是娛樂和游戲。幾乎全部的科學研究都是作為“暗知識”被機器所掌握。當機器不但可以替我們作出生活中的所有決定,也發(fā)現(xiàn)了一切人類可發(fā)現(xiàn)的知識,我們?nèi)祟愐詾楹赖乃枷氲淖饑烙衷诤翁帲?/p> 如何避免這種“暗知識”可能帶來的人類完全被算法統(tǒng)治的反烏托邦? 或許“可解釋的人工智能”(XAI)是一種有益的嘗試。通過解釋模型讓機器決策變得更透明,使人類與機器可以建立起更好的信任關系,讓我們更可以信賴機器替我們作出的選擇,更能適應并習慣與智能機器共處。近期歐盟關于數(shù)據(jù)保護權(quán)益的立法,也再次強調(diào)了這種可解釋權(quán)。但“可解釋的AI”是一項極大的挑戰(zhàn),是否能夠真正化解“暗知識”帶來的威脅,還有待探討。 從另一方面講,我們其實已經(jīng)一直在與廣義的“暗知識”共處了。任何自下而上、去中心化的復雜網(wǎng)絡,都蘊含不可理解和不可控制的“暗知識”?;ヂ?lián)網(wǎng)本身就是一個例子,沒有任何一個人或機構(gòu)可以完全控制互聯(lián)網(wǎng),也沒有任何人可以掌握全部的信息、預測或掌控網(wǎng)絡所涌現(xiàn)出的復雜趨勢,因為互聯(lián)網(wǎng)的本質(zhì)是去中心化、“失控”的。 某種意義上講,市場中“看不見的手”就是一種暗知識,哈耶克在《知識在社會中的運用》中論證到,沒有任何中心化的理性計劃可以比得上開放市場對資源配置的效率,因為沒有任何一個單一的主體能夠掌握和理解市場中的全部信息,這些知識是分布存在于整個市場中的。市場是一個去中心化自下而上的網(wǎng)絡。當我們說不能依靠計劃經(jīng)濟而應該相信市場的力量,我們實際上已經(jīng)承認了市場里蘊含著某種不可表達也無法計算的暗知識。 神經(jīng)科學的發(fā)展也越來越揭示了大腦本身更接近于一個去中心化網(wǎng)絡的模型,大腦沒有中心,并不存在一個像CPU一樣的中央處理器、一個能掌握一切的小精靈(homunculus)。每一個神經(jīng)元都非常簡單也并沒有智能,但是神經(jīng)元連接起來的網(wǎng)絡卻可以自下而上的涌現(xiàn)出智能和意識。顯然沒有哪個神經(jīng)元能夠控制整個大腦,我們自己也無法理解和用公式或算法表達智能涌現(xiàn)的過程。 人工智能的發(fā)展歷史也是越來越趨于去中心化、自下而上的模式。早期的專家系統(tǒng)(expert system)試圖自上而下的重復人類思考的過程,比如要給病人看病,就會用算法模擬醫(yī)生的決策樹(體溫大于多少則如何處理)。而今天基于神經(jīng)網(wǎng)絡的深度學習系統(tǒng)是靠數(shù)據(jù)自下而上驅(qū)動的,用海量的數(shù)據(jù)訓練機器讓其發(fā)現(xiàn)潛在的相關性,比如什么樣的體溫變化和哪類疾病會有正相關。專家系統(tǒng)可以理解(因為模擬人的思考),但無法擴展(因為算法是固定的);而深度學習無法理解(數(shù)據(jù)中隱藏的相關性和模式),但可以擴展(只要有更多的數(shù)據(jù))。 凱文凱利在《失控》中所講到的“蜂群”邏輯,同樣是基于“連接”和“涌現(xiàn)”的去中心化網(wǎng)絡。每一只蜜蜂的行為都很簡單,但是大量蜜蜂組成的蜂群卻可以表現(xiàn)出非常復雜的行為,仿佛有一只看不見的手讓智能涌現(xiàn)出來。沒有任何一只個體蜜蜂可以控制蜂群,也沒有領導,蜂王只是負責生育的傀儡。生物界里的“蜂群”現(xiàn)象比比皆是。 而物種進化本身也像一個去中心化的網(wǎng)絡,生物界形形色色的物種并不是像創(chuàng)世論或智能設計論描述的那樣,被一個中心化的造物主自上而下設計創(chuàng)造出來的,而是靠著不完美的遺傳中隨機的變異和收斂的選擇迭代演化而來的,并沒有預先設好的目的,我們也不可能提前知道結(jié)果。 在互聯(lián)網(wǎng)、市場、大腦、神經(jīng)網(wǎng)絡、生命體和進化的背后有一個共同的邏輯:一個由相對簡單的組件連接成的復雜系統(tǒng)(或簡單步驟迭代成的復雜歷史序列),往往會自下而上的涌現(xiàn)出某種功能和秩序,但并沒有一個中心化能理解一切的控制者,系統(tǒng)所表現(xiàn)出的復雜行為往往不能被簡單的公式所表達,其結(jié)果也往往是不可計算的。 美國當代哲學家丹尼爾·丹尼特(Daniel Dennett)指出,“只有能力而沒有理解力” (Competence without Comprehension)是生物進化中的普遍現(xiàn)象,這是一個類似于“暗知識”的美妙概念。蝙蝠知道如何用超聲波定位來感知這個世界,能夠在黑暗中導航從容的飛行,但是它們不可能像物理學家一樣理解超聲波導航的工作原理;物理學家雖然理解超聲波定位的明知識,但人類作為視覺動物卻永遠不可能親身感受到蝙蝠用聽力來導航的那種默會知識。 如果說蝙蝠還可以談得上感受,最原始的動物如草履蟲、細菌等單細胞動物都根本沒有能用來感受的神經(jīng),卻仍可以表現(xiàn)出趨利避害的反應能力甚至復雜的社會行為,它們看上去就像是被有智慧的主體設計出來的能夠進行信息處理的智能系統(tǒng)(遠遠比我們設計的掃地機器人更有智能更靈活應變)。 按照丹尼特的看法,這些生命體能夠應對環(huán)境賴以生存的復雜能力,都是被億萬年的進化過程編碼在系統(tǒng)中的“知識”,這些生命體可能完全無法理解自己的能力,也不存在一個中心化的造物主能夠理解一切而自上而下的設計出這些生命體,但這并不妨礙生命體自如的運用這些能力,這就是所謂的“有能力而無理解”。 因為復雜性是在網(wǎng)絡和時間中自下而上“涌現(xiàn)”出來的,知識是去中心化分布式的存在于復雜系統(tǒng)進化的歷史中的(不僅是橫向的分布在子系統(tǒng)中,還是縱向的分布在進化史中),無法用公式解析的表達出來,除非你重演一遍進化。 或許對于自然界涌現(xiàn)出的種種復雜的生命系統(tǒng)來說,“暗知識”本來就是一種常態(tài),人類所擁有的可表達知識,只是我們作為符號語言動物產(chǎn)生的一個副產(chǎn)品和特例,是茫茫知識海洋中一座小小的孤島。 |
|