王培 美國天普大學(xué)計算機與信息科學(xué)系對一個系統(tǒng)(不論是人還是機器)中的概念(如“鳥”)來說,其主要語義問題是如何確定其意義(見《“意思”是什么意思?》),但對陳述(如“鳥會飛”)來說,除了意義的問題之外還有真值的問題。具體說來,主要是 1) 真值可能取那些值? 2) 真值刻畫了陳述的什么性質(zhì)? 在這些問題上,傳統(tǒng)的觀點是眾所周知的: 1) 每個陳述非“真”即“假”。 2) 真值刻畫了陳述是否符合事實。 這個“符合論”真理觀和前文介紹的“指稱論”意義觀一起構(gòu)成了“模型論語義學(xué)”的基礎(chǔ)。這種語義學(xué)及其變種在邏輯學(xué)中占統(tǒng)治地位,并被大量人工智能系統(tǒng)所采用。按照這種觀點,如果一個系統(tǒng)中有一個符號化語句R(E,S),則在其中符號獲得指稱之前,該語句沒有意義。如果E指“地球”,S指“太陽”,R(x,y)指關(guān)系“x繞y轉(zhuǎn)動”,則R(E,S)有意義且為“真”。如果R和E指稱不變,S指“月亮”,則R(E,S)有意義但為“假”。在哲學(xué)里,類似的觀點可見于實證論、實在論、反映論等關(guān)于人類認識的理論中,其特征是強調(diào)真理的客觀性。一個認識主體(不論是人還是機器)可以發(fā)現(xiàn)真理,但是不能發(fā)明真理??茖W(xué)知識就是那些已經(jīng)被證實了的陳述,是“不以人的意志為轉(zhuǎn)移的客觀規(guī)律”。 盡管這個“客觀真理觀”源遠流長且成就非凡,歷史上卻也沒少遇到來自各方面的挑戰(zhàn),而且這些挑戰(zhàn)的來源逐漸從哲學(xué)領(lǐng)域擴散到科學(xué)領(lǐng)域,并且出現(xiàn)在多個學(xué)科之中。 物理學(xué)曾經(jīng)是最強調(diào) “描述世界的本來面貌”的,但量子力學(xué)卻對這種經(jīng)典的世界觀發(fā)起了挑戰(zhàn)。一方面,這個理論和實驗數(shù)據(jù)高度吻合,但另一方面,其流行解釋卻把觀察結(jié)果和觀察者聯(lián)系了起來。關(guān)于這一方面的介紹和討論,可參看《賽先生》近期刊載的《霍金:“萬物理論”不存在》。 認知科學(xué)從另一個角度得出了類似的結(jié)論。一個觀察者能直接接收的外部信號取決于其感官,而且感知過程是一個多層抽象過程,其結(jié)果不僅取決于收到的外部信號,同時也取決于觀察者對此信號的加工方式。在這個過程中,觀察者的背景知識、觀察動機、心理預(yù)期、注意分配、情緒狀態(tài)等因素都會影響觀察結(jié)果。我們對于外部世界的認識常常不能被當做世界在我們心靈中的被動“反映”,而應(yīng)被看作我們在和世界相互作用的過程中的主動構(gòu)造產(chǎn)物。 這種觀點并不否認認識過程中客觀性因素。首先,外部世界依然可以被看作獨立于觀察者的“客觀存在”,而且觀察者所接收到的外部信號也仍是“不以其意志為轉(zhuǎn)移的”。進一步來說,認知系統(tǒng)內(nèi)部的概念一般也來源于外部世界中的相對穩(wěn)定的成分和過程,而非系統(tǒng)自身臆造的。這里的關(guān)鍵是把“世界自身”和“對世界的描述”區(qū)分開。前者可以和觀察者無關(guān),但后者必定會或多或少地打上描述者的印記。沒有一種“上帝的語言”可以描述“世界的本來面目”,所以我們也無法通過“和上帝對筆記”來檢驗我們信念的正確性。 我們信念的客觀性因素的另一個來源是社會性。在個體認知系統(tǒng)通過通訊形成共享信念以獲得間接經(jīng)驗的過程中,個體差異被在很大程度上排除了。當我們說科學(xué)結(jié)論比個人信念“更客觀”時,我們是說前者總結(jié)了很多人的經(jīng)驗,因而基本擺脫了個人的偏見。但這種“客觀”仍然受限于這個群體的共同認識方式,因此只不過是一種“集體主觀”。在這里“主觀”和“客觀” 之別應(yīng)當被解讀成“主人的觀點”和“客人們的觀點”之別,而非“主體的觀點”和“客體的觀點”之別,因為客體根本無“觀點”可言。這一點在機器人研究中尤為明顯。因為機器人有不同于人類的感知運動系統(tǒng),其對環(huán)境的表述不會和人類的描述相同,但這不意味著它就是錯的。 實證論的真理觀在科學(xué)哲學(xué)研究中也受到了挑戰(zhàn)。因為科學(xué)結(jié)論大都是關(guān)于普遍情形的,一次具體檢驗的成功不能說明其普遍成立,但一次具體檢驗的失敗卻能說明其并非普遍成立。基于這一不對稱性,波普爾提出了“科學(xué)理論無法證實,但可以證偽”的理論?!白C偽主義”產(chǎn)生了廣泛的影響,尤其在抨擊那些自封為“顛撲不破的真理”和那些似乎什么都說了,但其實什么也沒說的“理論”時殺傷力頗大。但在另一方面,“證偽論”本身卻面臨被科學(xué)史“證偽”的尷尬局面。如果我們考察任何研究領(lǐng)域,都不難發(fā)現(xiàn)多個相互競爭的理論,而每個都有其尚不能解釋的現(xiàn)象。不論在科學(xué)研究中還是日常生活中,我們都極少因為發(fā)現(xiàn)了一個反例就判定一個一般性陳述為“偽”并拋棄它,盡管可能會減少對它的信任和依賴。 如果“證實”和“證偽”均不可得,還有沒有辦法得到確定的結(jié)論了?似乎唯一的辦法是人為地確定它們,并使其免于來自經(jīng)驗的挑戰(zhàn)。一個常見情況是使用抽象的約定性前提。一個數(shù)學(xué)理論中的公理(比如平面幾何中的公設(shè))是被約定為真的,因此既不需要被證實,也不可能被證偽?;谶@些公理,形形色色的定理可以被證明出來。因此定理的“真”實際上是和公理的邏輯一致性。當一個數(shù)學(xué)理論被應(yīng)用于一個具體領(lǐng)域時,這種邏輯一致性告訴我們,如果該理論的公理在某個解釋下(即把理論中的抽象概念對應(yīng)于領(lǐng)域中的具體概念)可以被接受,那么其所有定理也都應(yīng)當在相同的解釋下被接受。但是即使一個結(jié)論是已經(jīng)被證明了的,這也不意味著它應(yīng)該在某個特定領(lǐng)域中被接受,因為它所屬的理論在該領(lǐng)域中的適用性本身就是可能是有問題的,而在一個抽象理論之外是不能談“證明”的。當我們聽到某個結(jié)論已經(jīng)“被證明了”的時候,我們應(yīng)當首先檢查這個證明的前提及其解釋,以此決定是否接受它。 另一個把信念確定化的方式是把它奉為信仰。當然,在漢語中“信念”和“信仰”并沒有嚴格區(qū)別,而這里我把它們區(qū)分開,是為了用“信仰”特指那些被認知系統(tǒng)本身當成“已經(jīng)被證實,不可能再被證偽”的陳述。和公理或定理不同,信仰不是抽象的,而是和系統(tǒng)經(jīng)驗直接相聯(lián)系的,因此無須解釋。信仰不被證偽,是因為一旦信仰和其它認識和想法相沖突,系統(tǒng)總是有意識地試圖通過各種手段(如懷疑其它想法、調(diào)整概念意義、增加輔助假說等等)來維護它。從認知的角度來說,信仰的存在為系統(tǒng)提供了穩(wěn)定性,但一旦系統(tǒng)只有修改信仰才能適應(yīng)環(huán)境變化時,所需的努力以致代價也是巨大的。很多人已經(jīng)從自己的生活經(jīng)歷中認識到了這一點。 對其它“經(jīng)驗性”信念(如“鳥會飛”)來說,如果上述種種辦法均不適用,我們還能在什么意義下談?wù)撈洹罢嬷怠蹦?我們還有“證據(jù)”。和前面提到的諸位“證字輩同門”相同,證據(jù)也是確定真值的常見手段之一,但它的特點是其“非判決性”。和證實、證偽、證明等“一勞永逸”的真值確定方法不同,一個陳述的每個證據(jù)都只是對該陳述的真值做一定程度上的貢獻,且不排除其它(相似或相反)證據(jù)的存在可能性。一個“基于證據(jù)的真值”所衡量的是陳述與已有證據(jù)的一致程度。不像固定的“事實”或“公理”,在一個開放系統(tǒng)中“證據(jù)”是逐漸收集到的,而且既可能是正例(支持該陳述)也可能是反例(反對該陳述)。這就是說“真”是個程度問題,而且這個程度會被系統(tǒng)的經(jīng)驗所修改。 允許陳述有除“真”和“假”之外的其它真值遠不是一個新想法,比如有若干種“多值邏輯”引入了“可能真”、“通常真”、“不確定”等真值作為對二值邏輯的擴充。盡管這些邏輯有其適用領(lǐng)域,對人工智能來說它們都太“弱”了,不足以為系統(tǒng)的決策提供支持。當系統(tǒng)比較多種可能性時,證據(jù)的量往往是至關(guān)重要的,而實現(xiàn)證據(jù)量一般可比性的最簡單方法就是用數(shù)量表示真值。盡管人類知識通常是表達為二值陳述的,允許信念強度在系統(tǒng)的內(nèi)部感受和外部表達上有不同的精確度仍是有理由的。 基于類似的考慮,有些“非經(jīng)典邏輯”把真值定義成0和1之間的一個實數(shù),而將“真”和“假”作為其極端情況。這些邏輯系統(tǒng)之間的根本差別是如何解釋這個數(shù)的意義和來源。模糊邏輯是最明確地以“真假是個程度問題”為口號的,但它一直沒說清這個程度測量的是什么,這就導(dǎo)致不同的人以不同的標準來使用它。這樣固然是提高了靈活性,但其代價是其結(jié)論的“權(quán)威性”失去了保障。概率邏輯的想法是讓概率論和數(shù)理邏輯“強強聯(lián)合”,但雙方在基本預(yù)設(shè)上的差異讓這場“包辦婚姻”很難和諧。尤其關(guān)鍵的是這些邏輯都沒有把真值完全放在證據(jù)的基礎(chǔ)上。有些讀者可能認為概率可以是完全由已知證據(jù)決定的,但經(jīng)過仔細的概念分析可以發(fā)現(xiàn)概率統(tǒng)計所能夠處理的“證據(jù)”是被樣本空間和先驗概率等因素所制約的,而且對概率的表示和處理也不完全滿足一個智能推理系統(tǒng)的要求。 讓我們看“鳥會飛”這個例子。為討論的簡單起見,我們假定系統(tǒng)可以完全確定一個對象是否是鳥和是否會飛,而忽略這些判斷本身所可能包含的不確定性。同時,我們假設(shè)這個陳述的真值是完全被直接觀察決定的。如果我們對“鳥會飛”進行了N次有效觀察,在其中有M次所觀察的鳥的確會飛(而N-M次所觀察的鳥不會飛),那么“鳥會飛”的概率就被設(shè)為M/N。這聽起來很自然,但嚴格地說概率應(yīng)該是該陳述的正確率M/N當N趨于無窮大時的極限,而當N有限時,只從N和M出發(fā)沒法確定M/N是否有極限,更不要說確定其范圍甚至準確值。在運用概率統(tǒng)計解決實際問題時,一般的辦法是借助各種假設(shè),比如假設(shè)證據(jù)(觀察)足夠多且有代表性。但既然它們是“假設(shè)”,那就有錯的可能。在實際應(yīng)用中,使用這個理論模型的人有責任檢查這些假設(shè)的合理性,并且只在它們成立時使用這個理論工具。但在智能推理系統(tǒng)中真值需要被附在每個陳述上,不論其證據(jù)是否很多或是否有代表性。用已知的成功率估計未知的概率,這本身也有個可靠性問題:如果M和N分別是1和2,M/N是0.5;如果M和N分別是1000和2000,M/N仍是0.5。直觀上我們會覺得后一種情況更“可靠”,但這種可靠性不體現(xiàn)在正確率M/N之中。在概率統(tǒng)計中自然有辦法表示這兩種情況的差別,但這又需要引入更多的假設(shè),而非只有賴于(由M和N所代表的)已有證據(jù)。 在智能系統(tǒng)中“知識和資源相對不足”的假設(shè)下(見《人工智能:何為“智”?》),參考資料[2]討論了一個完全基于已有證據(jù)的真值定義。對每個經(jīng)驗陳述(即不包括公理、定理等)而言,其真值由兩個0和1之間的實數(shù)表示。第一個就是上面提到的“正確率”M/N,第二個叫“可信度”,定義成N/(N+K),其中的N仍是該陳述被檢驗過的總次數(shù),而K是個不小于1的系統(tǒng)常數(shù)。 正確率刻畫的是由反例造成的不確定性。這里需要比較的雙方是“正例”和“反例”。對一個在知識不足的條件下工作的系統(tǒng)而言,有反例的陳述不能簡單地被標注為“假”。實際上一個有少量反例的陳述常常比一個尚未發(fā)現(xiàn)反例但太復(fù)雜或太空洞的陳述有用得多。正確率給出了正例和反例的比例,而且這種方式和我們?nèi)粘I钪斜硎敬祟愋畔⒌姆绞胶茴愃?像“有三成機會”、“十有八九”等等)。 可信度刻畫的是由未來證據(jù)造成的不確定性。這里需要比較的雙方是“已知”和“未知”。因為對一個開放系統(tǒng)來說未知證據(jù)量沒有上限,所以在這里是把已知證據(jù)的量(N)和定量(K)的未來證據(jù)相比。最直觀的選擇是令K=1,這時可信度就是當前證據(jù)的量在一個未來時刻(當一個新證據(jù)到達后)在總證據(jù)中的比例。在前面的例子中,N是2和2000分別相應(yīng)于可信度2/3和2000/2001,當然差別很大了。在已有證據(jù)量N有限的情況下,一個陳述的可信度總是小于1,盡管可以隨新證據(jù)的到來而繼續(xù)增長。這就是說在經(jīng)驗陳述中沒有絕對真理。 這個真值定義的最大特點是完全基于現(xiàn)有證據(jù),而不依賴于對“世界”或“未來”的任何假設(shè)。可信度高說明證據(jù)多,因此對新證據(jù)不敏感,故信念穩(wěn)固。但這并不意味著“更接近事實”。實際上如果一個系統(tǒng)的經(jīng)驗受很強的限制,其中的偏見也可能有很高的可信度。如果是這樣,這個值還有理由被叫做“真值”嗎?如同我在《人工智能:何為“智”?》中所解釋的,對一個知識不足的系統(tǒng)來說,“適應(yīng)”正是指 “以過去的知識應(yīng)對未來的情況”,即使在系統(tǒng)完全明白未來不可能完全和過去一樣時也是如此,因為除了過去經(jīng)驗之外,這樣的系統(tǒng)沒有其它可以依靠的。 “正確率 = M/N;可信度 = N/(N+K)”是這種真值的定義,說明這一對值在理想情況下和證據(jù)的關(guān)系。但在一個具體人工智能系統(tǒng)中,真值往往是需要在很多“很不理想” 的情況下被確定的(如證據(jù)本身有不確定性,且來自不同渠道,因而不能同等對待),因此不能直接使用上述定義。這就好像是1米的長度被定義為“光在真空中于1/299792458秒內(nèi)行進的距離”,但這不意味著裁縫要直接用這個標準量布料。在人工智能系統(tǒng)設(shè)計過程中,真值的定義只是為各種相關(guān)規(guī)則和函數(shù)確立設(shè)計依據(jù)。 系統(tǒng)信息加工資源的不足使得情況更加復(fù)雜。由于要在時間不足以考慮所有相關(guān)信息的情況下作出判斷,在一個真值背后的證據(jù)往往不是系統(tǒng)所知道的全部有關(guān)證據(jù),而只是系統(tǒng)在當下所考慮到的那些。其結(jié)果之一就是基于不同證據(jù)的結(jié)論可能互相沖突,因而系統(tǒng)無法保證其信念之間的一致性?!安灰恢隆笔莻鹘y(tǒng)的真理觀所不能容忍的,因為世界只能有一個“本來面目”,而且公理之間也不允許有矛盾。但如果真值是以證據(jù)為依據(jù)的,不同證據(jù)所導(dǎo)致的真值沖突是無法完全避免的,盡管系統(tǒng)必須要有辦法來處理這種情況以保證其正常工作。 現(xiàn)在我們可以來總結(jié)這個新的真值定義對本文開頭處提出的問題的回答: 1) 真值由一個“正確率”和一個“可信度”組成。 2) 真值刻畫了一個陳述和已有證據(jù)之間的關(guān)系。 盡管我提出這個真值定義的直接動因是人工智能研究,它也可以被用來解釋人的思維活動以及科學(xué)發(fā)展中的很多現(xiàn)象。這個“以證據(jù)為準”的真理觀和流行的“以事實為準”的真理觀頗為不同,但如果仔細考察我們平常所謂的“事實”,就不難發(fā)現(xiàn)它們其實也不是“世界的本來面目”,而是我們對世界的描述和認識,因此是依賴于我們的認知能力和認知過程的。因此,這個真理觀并沒有降低“真”對我們(或?qū)θ斯ぶ悄芟到y(tǒng))的價值。 參考資料[1] Peter Achinstein (Editor), The Concept of Evidence, Oxford University Press, 1983 [2] Pei Wang, Formalization of evidence: a comparative study, Journal of Artificial General Intelligence, 1: 25-53, 2009 關(guān)于作者 王培中文資料 http://cis-linux1./~pwang/ 關(guān)于人工智能科學(xué)之基礎(chǔ)問題的哲學(xué)反思(講座錄像) http://mooc.chaoxing.com/course/122769.html 人工智能的基本問題 通用人工智能的來龍去脈 認知邏輯之別于數(shù)理邏輯 翻譯:《哥德爾、埃舍爾、巴赫 -- 集異璧之大成》 [譯者之一] http://www./book/7-100-01323-2_41.html 人工智能專欄 |
|
來自: zhangbaili > 《形而上的思考》