人工智能專欄 | 證實、證偽、證明、證據(jù)：何以為“證”?

zhangbaili 2015-12-02

展開全文

王培美國天普大學(xué)計算機與信息科學(xué)系

對一個系統(tǒng)(不論是人還是機器)中的概念(如“鳥”)來說，其主要語義問題是如何確定其意義(見《“意思”是什么意思?》)，但對陳述(如“鳥會飛”)來說，除了意義的問題之外還有真值的問題。具體說來，主要是

1) 真值可能取那些值?

2) 真值刻畫了陳述的什么性質(zhì)?

在這些問題上，傳統(tǒng)的觀點是眾所周知的：

1) 每個陳述非“真”即“假”。

2) 真值刻畫了陳述是否符合事實。

這個“符合論”真理觀和前文介紹的“指稱論”意義觀一起構(gòu)成了“模型論語義學(xué)”的基礎(chǔ)。這種語義學(xué)及其變種在邏輯學(xué)中占統(tǒng)治地位，并被大量人工智能系統(tǒng)所采用。按照這種觀點，如果一個系統(tǒng)中有一個符號化語句R(E,S)，則在其中符號獲得指稱之前，該語句沒有意義。如果E指“地球”，S指“太陽”，R(x,y)指關(guān)系“x繞y轉(zhuǎn)動”，則R(E,S)有意義且為“真”。如果R和E指稱不變，S指“月亮”，則R(E,S)有意義但為“假”。在哲學(xué)里，類似的觀點可見于實證論、實在論、反映論等關(guān)于人類認識的理論中，其特征是強調(diào)真理的客觀性。一個認識主體(不論是人還是機器)可以發(fā)現(xiàn)真理，但是不能發(fā)明真理?？茖W(xué)知識就是那些已經(jīng)被證實了的陳述，是“不以人的意志為轉(zhuǎn)移的客觀規(guī)律”。

盡管這個“客觀真理觀”源遠流長且成就非凡，歷史上卻也沒少遇到來自各方面的挑戰(zhàn)，而且這些挑戰(zhàn)的來源逐漸從哲學(xué)領(lǐng)域擴散到科學(xué)領(lǐng)域，并且出現(xiàn)在多個學(xué)科之中。

物理學(xué)曾經(jīng)是最強調(diào) “描述世界的本來面貌”的，但量子力學(xué)卻對這種經(jīng)典的世界觀發(fā)起了挑戰(zhàn)。一方面，這個理論和實驗數(shù)據(jù)高度吻合，但另一方面，其流行解釋卻把觀察結(jié)果和觀察者聯(lián)系了起來。關(guān)于這一方面的介紹和討論，可參看《賽先生》近期刊載的《霍金：“萬物理論”不存在》。

認知科學(xué)從另一個角度得出了類似的結(jié)論。一個觀察者能直接接收的外部信號取決于其感官，而且感知過程是一個多層抽象過程，其結(jié)果不僅取決于收到的外部信號，同時也取決于觀察者對此信號的加工方式。在這個過程中，觀察者的背景知識、觀察動機、心理預(yù)期、注意分配、情緒狀態(tài)等因素都會影響觀察結(jié)果。我們對于外部世界的認識常常不能被當做世界在我們心靈中的被動“反映”，而應(yīng)被看作我們在和世界相互作用的過程中的主動構(gòu)造產(chǎn)物。

這種觀點并不否認認識過程中客觀性因素。首先，外部世界依然可以被看作獨立于觀察者的“客觀存在”，而且觀察者所接收到的外部信號也仍是“不以其意志為轉(zhuǎn)移的”。進一步來說，認知系統(tǒng)內(nèi)部的概念一般也來源于外部世界中的相對穩(wěn)定的成分和過程，而非系統(tǒng)自身臆造的。這里的關(guān)鍵是把“世界自身”和“對世界的描述”區(qū)分開。前者可以和觀察者無關(guān)，但后者必定會或多或少地打上描述者的印記。沒有一種“上帝的語言”可以描述“世界的本來面目”，所以我們也無法通過“和上帝對筆記”來檢驗我們信念的正確性。

我們信念的客觀性因素的另一個來源是社會性。在個體認知系統(tǒng)通過通訊形成共享信念以獲得間接經(jīng)驗的過程中，個體差異被在很大程度上排除了。當我們說科學(xué)結(jié)論比個人信念“更客觀”時，我們是說前者總結(jié)了很多人的經(jīng)驗，因而基本擺脫了個人的偏見。但這種“客觀”仍然受限于這個群體的共同認識方式，因此只不過是一種“集體主觀”。在這里“主觀”和“客觀” 之別應(yīng)當被解讀成“主人的觀點”和“客人們的觀點”之別，而非“主體的觀點”和“客體的觀點”之別，因為客體根本無“觀點”可言。這一點在機器人研究中尤為明顯。因為機器人有不同于人類的感知運動系統(tǒng)，其對環(huán)境的表述不會和人類的描述相同，但這不意味著它就是錯的。

實證論的真理觀在科學(xué)哲學(xué)研究中也受到了挑戰(zhàn)。因為科學(xué)結(jié)論大都是關(guān)于普遍情形的，一次具體檢驗的成功不能說明其普遍成立，但一次具體檢驗的失敗卻能說明其并非普遍成立。基于這一不對稱性，波普爾提出了“科學(xué)理論無法證實，但可以證偽”的理論?！白C偽主義”產(chǎn)生了廣泛的影響，尤其在抨擊那些自封為“顛撲不破的真理”和那些似乎什么都說了，但其實什么也沒說的“理論”時殺傷力頗大。但在另一方面，“證偽論”本身卻面臨被科學(xué)史“證偽”的尷尬局面。如果我們考察任何研究領(lǐng)域，都不難發(fā)現(xiàn)多個相互競爭的理論，而每個都有其尚不能解釋的現(xiàn)象。不論在科學(xué)研究中還是日常生活中，我們都極少因為發(fā)現(xiàn)了一個反例就判定一個一般性陳述為“偽”并拋棄它，盡管可能會減少對它的信任和依賴。

如果“證實”和“證偽”均不可得，還有沒有辦法得到確定的結(jié)論了?似乎唯一的辦法是人為地確定它們，并使其免于來自經(jīng)驗的挑戰(zhàn)。一個常見情況是使用抽象的約定性前提。一個數(shù)學(xué)理論中的公理(比如平面幾何中的公設(shè))是被約定為真的，因此既不需要被證實，也不可能被證偽?；谶@些公理，形形色色的定理可以被證明出來。因此定理的“真”實際上是和公理的邏輯一致性。當一個數(shù)學(xué)理論被應(yīng)用于一個具體領(lǐng)域時，這種邏輯一致性告訴我們，如果該理論的公理在某個解釋下(即把理論中的抽象概念對應(yīng)于領(lǐng)域中的具體概念)可以被接受，那么其所有定理也都應(yīng)當在相同的解釋下被接受。但是即使一個結(jié)論是已經(jīng)被證明了的，這也不意味著它應(yīng)該在某個特定領(lǐng)域中被接受，因為它所屬的理論在該領(lǐng)域中的適用性本身就是可能是有問題的，而在一個抽象理論之外是不能談“證明”的。當我們聽到某個結(jié)論已經(jīng)“被證明了”的時候，我們應(yīng)當首先檢查這個證明的前提及其解釋，以此決定是否接受它。

另一個把信念確定化的方式是把它奉為信仰。當然，在漢語中“信念”和“信仰”并沒有嚴格區(qū)別，而這里我把它們區(qū)分開，是為了用“信仰”特指那些被認知系統(tǒng)本身當成“已經(jīng)被證實，不可能再被證偽”的陳述。和公理或定理不同，信仰不是抽象的，而是和系統(tǒng)經(jīng)驗直接相聯(lián)系的，因此無須解釋。信仰不被證偽，是因為一旦信仰和其它認識和想法相沖突，系統(tǒng)總是有意識地試圖通過各種手段(如懷疑其它想法、調(diào)整概念意義、增加輔助假說等等)來維護它。從認知的角度來說，信仰的存在為系統(tǒng)提供了穩(wěn)定性，但一旦系統(tǒng)只有修改信仰才能適應(yīng)環(huán)境變化時，所需的努力以致代價也是巨大的。很多人已經(jīng)從自己的生活經(jīng)歷中認識到了這一點。

對其它“經(jīng)驗性”信念(如“鳥會飛”)來說，如果上述種種辦法均不適用，我們還能在什么意義下談?wù)撈洹罢嬷怠蹦?我們還有“證據(jù)”。和前面提到的諸位“證字輩同門”相同，證據(jù)也是確定真值的常見手段之一，但它的特點是其“非判決性”。和證實、證偽、證明等“一勞永逸”的真值確定方法不同，一個陳述的每個證據(jù)都只是對該陳述的真值做一定程度上的貢獻，且不排除其它(相似或相反)證據(jù)的存在可能性。一個“基于證據(jù)的真值”所衡量的是陳述與已有證據(jù)的一致程度。不像固定的“事實”或“公理”，在一個開放系統(tǒng)中“證據(jù)”是逐漸收集到的，而且既可能是正例(支持該陳述)也可能是反例(反對該陳述)。這就是說“真”是個程度問題，而且這個程度會被系統(tǒng)的經(jīng)驗所修改。

允許陳述有除“真”和“假”之外的其它真值遠不是一個新想法，比如有若干種“多值邏輯”引入了“可能真”、“通常真”、“不確定”等真值作為對二值邏輯的擴充。盡管這些邏輯有其適用領(lǐng)域，對人工智能來說它們都太“弱”了，不足以為系統(tǒng)的決策提供支持。當系統(tǒng)比較多種可能性時，證據(jù)的量往往是至關(guān)重要的，而實現(xiàn)證據(jù)量一般可比性的最簡單方法就是用數(shù)量表示真值。盡管人類知識通常是表達為二值陳述的，允許信念強度在系統(tǒng)的內(nèi)部感受和外部表達上有不同的精確度仍是有理由的。

基于類似的考慮，有些“非經(jīng)典邏輯”把真值定義成0和1之間的一個實數(shù)，而將“真”和“假”作為其極端情況。這些邏輯系統(tǒng)之間的根本差別是如何解釋這個數(shù)的意義和來源。模糊邏輯是最明確地以“真假是個程度問題”為口號的，但它一直沒說清這個程度測量的是什么，這就導(dǎo)致不同的人以不同的標準來使用它。這樣固然是提高了靈活性，但其代價是其結(jié)論的“權(quán)威性”失去了保障。概率邏輯的想法是讓概率論和數(shù)理邏輯“強強聯(lián)合”，但雙方在基本預(yù)設(shè)上的差異讓這場“包辦婚姻”很難和諧。尤其關(guān)鍵的是這些邏輯都沒有把真值完全放在證據(jù)的基礎(chǔ)上。有些讀者可能認為概率可以是完全由已知證據(jù)決定的，但經(jīng)過仔細的概念分析可以發(fā)現(xiàn)概率統(tǒng)計所能夠處理的“證據(jù)”是被樣本空間和先驗概率等因素所制約的，而且對概率的表示和處理也不完全滿足一個智能推理系統(tǒng)的要求。

讓我們看“鳥會飛”這個例子。為討論的簡單起見，我們假定系統(tǒng)可以完全確定一個對象是否是鳥和是否會飛，而忽略這些判斷本身所可能包含的不確定性。同時，我們假設(shè)這個陳述的真值是完全被直接觀察決定的。如果我們對“鳥會飛”進行了N次有效觀察，在其中有M次所觀察的鳥的確會飛(而N-M次所觀察的鳥不會飛)，那么“鳥會飛”的概率就被設(shè)為M/N。這聽起來很自然，但嚴格地說概率應(yīng)該是該陳述的正確率M/N當N趨于無窮大時的極限，而當N有限時，只從N和M出發(fā)沒法確定M/N是否有極限，更不要說確定其范圍甚至準確值。在運用概率統(tǒng)計解決實際問題時，一般的辦法是借助各種假設(shè)，比如假設(shè)證據(jù)(觀察)足夠多且有代表性。但既然它們是“假設(shè)”，那就有錯的可能。在實際應(yīng)用中，使用這個理論模型的人有責任檢查這些假設(shè)的合理性，并且只在它們成立時使用這個理論工具。但在智能推理系統(tǒng)中真值需要被附在每個陳述上，不論其證據(jù)是否很多或是否有代表性。用已知的成功率估計未知的概率，這本身也有個可靠性問題：如果M和N分別是1和2，M/N是0.5;如果M和N分別是1000和2000，M/N仍是0.5。直觀上我們會覺得后一種情況更“可靠”，但這種可靠性不體現(xiàn)在正確率M/N之中。在概率統(tǒng)計中自然有辦法表示這兩種情況的差別，但這又需要引入更多的假設(shè)，而非只有賴于(由M和N所代表的)已有證據(jù)。

在智能系統(tǒng)中“知識和資源相對不足”的假設(shè)下(見《人工智能：何為“智”?》)，參考資料[2]討論了一個完全基于已有證據(jù)的真值定義。對每個經(jīng)驗陳述(即不包括公理、定理等)而言，其真值由兩個0和1之間的實數(shù)表示。第一個就是上面提到的“正確率”M/N，第二個叫“可信度”，定義成N/(N+K)，其中的N仍是該陳述被檢驗過的總次數(shù)，而K是個不小于1的系統(tǒng)常數(shù)。

正確率刻畫的是由反例造成的不確定性。這里需要比較的雙方是“正例”和“反例”。對一個在知識不足的條件下工作的系統(tǒng)而言，有反例的陳述不能簡單地被標注為“假”。實際上一個有少量反例的陳述常常比一個尚未發(fā)現(xiàn)反例但太復(fù)雜或太空洞的陳述有用得多。正確率給出了正例和反例的比例，而且這種方式和我們?nèi)粘Ｉ钪斜硎敬祟愋畔⒌姆绞胶茴愃?像“有三成機會”、“十有八九”等等)。

可信度刻畫的是由未來證據(jù)造成的不確定性。這里需要比較的雙方是“已知”和“未知”。因為對一個開放系統(tǒng)來說未知證據(jù)量沒有上限，所以在這里是把已知證據(jù)的量(N)和定量(K)的未來證據(jù)相比。最直觀的選擇是令K=1，這時可信度就是當前證據(jù)的量在一個未來時刻(當一個新證據(jù)到達后)在總證據(jù)中的比例。在前面的例子中，N是2和2000分別相應(yīng)于可信度2/3和2000/2001，當然差別很大了。在已有證據(jù)量N有限的情況下，一個陳述的可信度總是小于1，盡管可以隨新證據(jù)的到來而繼續(xù)增長。這就是說在經(jīng)驗陳述中沒有絕對真理。

這個真值定義的最大特點是完全基于現(xiàn)有證據(jù)，而不依賴于對“世界”或“未來”的任何假設(shè)。可信度高說明證據(jù)多，因此對新證據(jù)不敏感，故信念穩(wěn)固。但這并不意味著“更接近事實”。實際上如果一個系統(tǒng)的經(jīng)驗受很強的限制，其中的偏見也可能有很高的可信度。如果是這樣，這個值還有理由被叫做“真值”嗎?如同我在《人工智能：何為“智”?》中所解釋的，對一個知識不足的系統(tǒng)來說，“適應(yīng)”正是指 “以過去的知識應(yīng)對未來的情況”，即使在系統(tǒng)完全明白未來不可能完全和過去一樣時也是如此，因為除了過去經(jīng)驗之外，這樣的系統(tǒng)沒有其它可以依靠的。

“正確率 = M/N;可信度 = N/(N+K)”是這種真值的定義，說明這一對值在理想情況下和證據(jù)的關(guān)系。但在一個具體人工智能系統(tǒng)中，真值往往是需要在很多“很不理想” 的情況下被確定的(如證據(jù)本身有不確定性，且來自不同渠道，因而不能同等對待)，因此不能直接使用上述定義。這就好像是1米的長度被定義為“光在真空中于1/299792458秒內(nèi)行進的距離”，但這不意味著裁縫要直接用這個標準量布料。在人工智能系統(tǒng)設(shè)計過程中，真值的定義只是為各種相關(guān)規(guī)則和函數(shù)確立設(shè)計依據(jù)。

系統(tǒng)信息加工資源的不足使得情況更加復(fù)雜。由于要在時間不足以考慮所有相關(guān)信息的情況下作出判斷，在一個真值背后的證據(jù)往往不是系統(tǒng)所知道的全部有關(guān)證據(jù)，而只是系統(tǒng)在當下所考慮到的那些。其結(jié)果之一就是基于不同證據(jù)的結(jié)論可能互相沖突，因而系統(tǒng)無法保證其信念之間的一致性?！安灰恢隆笔莻鹘y(tǒng)的真理觀所不能容忍的，因為世界只能有一個“本來面目”，而且公理之間也不允許有矛盾。但如果真值是以證據(jù)為依據(jù)的，不同證據(jù)所導(dǎo)致的真值沖突是無法完全避免的，盡管系統(tǒng)必須要有辦法來處理這種情況以保證其正常工作。

現(xiàn)在我們可以來總結(jié)這個新的真值定義對本文開頭處提出的問題的回答：

1) 真值由一個“正確率”和一個“可信度”組成。

2) 真值刻畫了一個陳述和已有證據(jù)之間的關(guān)系。

盡管我提出這個真值定義的直接動因是人工智能研究，它也可以被用來解釋人的思維活動以及科學(xué)發(fā)展中的很多現(xiàn)象。這個“以證據(jù)為準”的真理觀和流行的“以事實為準”的真理觀頗為不同，但如果仔細考察我們平常所謂的“事實”，就不難發(fā)現(xiàn)它們其實也不是“世界的本來面目”，而是我們對世界的描述和認識，因此是依賴于我們的認知能力和認知過程的。因此，這個真理觀并沒有降低“真”對我們(或?qū)θ斯ぶ悄芟到y(tǒng))的價值。

參考資料

[1] Peter Achinstein (Editor), The Concept of Evidence, Oxford University Press, 1983

[2] Pei Wang, Formalization of evidence: a comparative study, Journal of Artificial General Intelligence, 1: 25-53, 2009

關(guān)于作者

王培中文資料 http://cis-linux1./~pwang/

關(guān)于人工智能科學(xué)之基礎(chǔ)問題的哲學(xué)反思（講座錄像）

http://mooc.chaoxing.com/course/122769.html

人工智能的基本問題

通用人工智能的來龍去脈

認知邏輯之別于數(shù)理邏輯

翻譯：《哥德爾、埃舍爾、巴赫 -- 集異璧之大成》 [譯者之一]

http://www./book/7-100-01323-2_41.html

人工智能專欄

1、當你談?wù)撊斯ぶ悄軙r，到底在談?wù)撌裁矗?/a>

2、人工智能：何為“智”？

3、計算機能有創(chuàng)造性嗎？

4、“意思”是什么意思？

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊一鍵舉報。

小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

人工智能專欄 | 證實、證偽、證明、證據(jù)：何以為“證”?

王培 美國天普大學(xué)計算機與信息科學(xué)系

參考資料

人工智能專欄 | 證實、證偽、證明、證據(jù)：何以為“證”?

王培美國天普大學(xué)計算機與信息科學(xué)系