接著“1.23章1600頁(yè)的金融學(xué)手冊(cè)內(nèi)容無(wú)敵, 公司金融和金融市場(chǎng)及資產(chǎn)定價(jià)等全囊括,2.14年后, 2024年842頁(yè)最新勞動(dòng)經(jīng)濟(jì)學(xué)手冊(cè)出爐! 博士和勞動(dòng)經(jīng)濟(jì)學(xué)者必備工具, 發(fā)展太快了.” 文章全文內(nèi)容介紹,非常有趣,層層論證: 為什么概率可能并不存在(但假裝它存在很有用)
生活充滿(mǎn)了不確定性。我們無(wú)法確切知道未來(lái)會(huì)發(fā)生什么,對(duì)過(guò)去的事件以及當(dāng)前視野之外的事物也知之甚少。不確定性常被形容為“對(duì)無(wú)知的自覺(jué)認(rèn)識(shí)”:無(wú)論是對(duì)明天天氣的預(yù)測(cè)、下一屆英超冠軍的歸屬、2100年的氣候變化,還是我們遠(yuǎn)古祖先的身份,亦是如此。 在日常生活中,我們常用語(yǔ)言來(lái)表達(dá)不確定性,例如說(shuō)某件事“可能”、“也許”或“很有可能”會(huì)發(fā)生(或已經(jīng)發(fā)生)。然而,這些模糊的表達(dá)可能帶來(lái)風(fēng)險(xiǎn)。1961年,USA新當(dāng)選總統(tǒng)肯尼迪接到一項(xiàng)由中情局策劃的進(jìn)攻共產(chǎn)古巴的計(jì)劃,并委托軍方高層進(jìn)行評(píng)估。軍方得出的結(jié)論是,這次行動(dòng)成功的概率為30%,也就是說(shuō)失敗的概率為70%。然而,在呈交給總統(tǒng)的報(bào)告中,這一結(jié)論被表述為“有一定機(jī)會(huì)”。最終,豬灣入侵付諸(The Bay of Pigs invasion)實(shí)施,卻以慘敗告終,??。 如今,人們已經(jīng)建立了一些標(biāo)準(zhǔn),將不確定性的措辭轉(zhuǎn)換為大致的數(shù)值。例如,在英國(guó)情報(bào)界,使用“可能”(likely)一詞時(shí),通常指的是55%到75%的概率。 將不確定性和機(jī)會(huì)量化為數(shù)字,引領(lǐng)我們進(jìn)入概率的數(shù)學(xué)世界,這一領(lǐng)域如今已廣泛應(yīng)用于各個(gè)學(xué)科。隨便翻開(kāi)一本科學(xué)期刊,你會(huì)發(fā)現(xiàn)論文中頻繁出現(xiàn)P值、置信區(qū)間以及貝葉斯后驗(yàn)分布等概念,而這些概念都是建立在概率基礎(chǔ)之上的。 然而,我想強(qiáng)調(diào)的是,無(wú)論是在科學(xué)論文、天氣預(yù)報(bào)、體育比賽結(jié)果預(yù)測(cè),還是健康風(fēng)險(xiǎn)的量化評(píng)估中,任何數(shù)值化的概率都并非世界的客觀屬性,而是基于個(gè)人或集體的判斷以及(通常值得懷疑的)假設(shè)所構(gòu)建的。在大多數(shù)情況下,這些概率并不旨在估計(jì)某種潛在的“真實(shí)”數(shù)量。實(shí)際上,只有在極少數(shù)情況下,概率才能被視為“真實(shí)存在”的。 偶然的闖入者概率學(xué)是數(shù)學(xué)中的“遲到者”。盡管人們已經(jīng)用骰子和骨骰進(jìn)行賭博數(shù)千年,但直到17世紀(jì)50年代,法國(guó)數(shù)學(xué)家Blaise Pascal和Pierre de Fermat開(kāi)始通信,才對(duì)“偶然”事件進(jìn)行了嚴(yán)謹(jǐn)?shù)姆治?。從那時(shí)起,概率學(xué)如同洪水般迅速滲透到金融、天文學(xué)、法律等多個(gè)領(lǐng)域,更不用說(shuō)賭博了。 為了把握概率的微妙之處,我們可以觀察現(xiàn)代天氣預(yù)報(bào)是如何應(yīng)用這一概念的。氣象學(xué)家預(yù)測(cè)氣溫、風(fēng)速和降雨量,并常常給出特定時(shí)間和地點(diǎn)的降雨概率,比如70%。前三個(gè)參數(shù)可以與它們的“真實(shí)”值相對(duì)比,并通過(guò)觀測(cè)來(lái)測(cè)量。然而,降雨概率卻沒(méi)有一個(gè)“真實(shí)”值可以與預(yù)報(bào)員的評(píng)估相對(duì)照,畢竟,世界上并沒(méi)有所謂的“概率測(cè)量?jī)x”。雨要么下,要么不下,沒(méi)有中間狀態(tài)。 更重要的是,正如哲學(xué)家Ian Hacking所強(qiáng)調(diào)的,概率具有“雙面特征”:它既涉及偶然性,也涉及無(wú)知。想象一下,我擲了一枚硬幣,問(wèn)你這枚硬幣正面朝上的概率是多少。你可能會(huì)愉快地回答“50%”或“二分之一”。然后,我擲了硬幣,偷偷看了一眼結(jié)果,再將硬幣蓋住,問(wèn)你:現(xiàn)在這枚硬幣正面朝上的概率是多少? 請(qǐng)注意,我問(wèn)的是“你的”概率,而不是“這個(gè)”概率。大多數(shù)人此時(shí)會(huì)猶豫,然后勉強(qiáng)回答“50-50”。但實(shí)際上,這個(gè)事件已經(jīng)發(fā)生,不再存在隨機(jī)性,剩下的只是你的無(wú)知。這種情境從“偶然性”(aleatory)的不確定性——關(guān)于我們無(wú)法預(yù)測(cè)的未來(lái),轉(zhuǎn)變?yōu)椤爸R(shí)性”(epistemic)的不確定性——關(guān)于我們當(dāng)前不知道的事實(shí)。在這兩種情況下,數(shù)值概率都被用來(lái)進(jìn)行描述。 這里還有一個(gè)教訓(xùn)。即使存在關(guān)于結(jié)果的統(tǒng)計(jì)模型,它們也總是基于主觀假設(shè)。例如,在擲硬幣的情況下,我們會(huì)假設(shè)兩種結(jié)果的概率相等。為了向聽(tīng)眾演示這一點(diǎn),我有時(shí)會(huì)使用一枚雙面都是正面的硬幣,向他們展示,即使他們最初認(rèn)為“50-50”的判斷,也是基于對(duì)我的信任,而這種信任可能并不明智。 主觀性與科學(xué)我認(rèn)為,概率的實(shí)際應(yīng)用總是涉及主觀判斷。這并不意味著我可以隨意為自己的想法賦予一個(gè)數(shù)字。例如,如果我聲稱(chēng)自己以99.9%的確定性可以從屋頂飛翔,那么很快就會(huì)被證明是一個(gè)糟糕的概率評(píng)估者。雖然客觀世界在概率及其背后假設(shè)接受現(xiàn)實(shí)檢驗(yàn)時(shí)會(huì)發(fā)揮作用,但這并不意味著概率本身是客觀的。 一些人用來(lái)評(píng)估概率的假設(shè)可能比其他假設(shè)更為可靠。如果我在擲硬幣前仔細(xì)檢查過(guò)硬幣,并且硬幣落在堅(jiān)硬的表面上并以混亂的方式彈跳,那么我對(duì)“50-50”概率的判斷,會(huì)比某個(gè)可疑人物隨手掏出硬幣并隨意擲幾下時(shí)更有信心。然而,無(wú)論在何種情境中使用概率(包括科學(xué)領(lǐng)域),這些限制條件也同樣適用,而科學(xué)領(lǐng)域的概率更容易讓人相信其所謂的客觀性。 以下是一個(gè)具有重要科學(xué)和公共意義的例子。在新冠疫情初期,英國(guó)啟動(dòng)了RECOVERY試驗(yàn),以測(cè)試對(duì)住院患者的治療方案。在這項(xiàng)實(shí)驗(yàn)中,超過(guò)6000名患者被隨機(jī)分為兩組:一組接受醫(yī)院的標(biāo)準(zhǔn)治療,另一組在此基礎(chǔ)上加服一劑廉價(jià)的dexamethasone。在使用機(jī)械通氣的患者中,與僅接受標(biāo)準(zhǔn)治療的組相比,服用地塞米松(dexamethasone)的組經(jīng)年齡調(diào)整后每日死亡風(fēng)險(xiǎn)降低了29%(95%置信區(qū)間為19%到49%)。P值(即在假設(shè)無(wú)差異的零假設(shè)前提下,觀察到如此極端相對(duì)風(fēng)險(xiǎn)的概率)被計(jì)算出來(lái)為0.0001,即0.01%。 這是一種標(biāo)準(zhǔn)的分析方法。然而,精確的置信水平和P值不僅取決于零假設(shè)的前提,還依賴(lài)于統(tǒng)計(jì)模型中的所有假設(shè),例如觀測(cè)值之間相互獨(dú)立,即沒(méi)有因素會(huì)導(dǎo)致時(shí)間和空間上更接近的患者有更相似的治療結(jié)果。然而,實(shí)際上存在許多此類(lèi)因素,例如患者所在的醫(yī)院或不斷變化的護(hù)理方案。此外,這一精確值還假設(shè)每組所有參與者在28天內(nèi)存活的基礎(chǔ)概率相同,但實(shí)際上這種概率可能因各種原因而有所不同。 即便這些假設(shè)不完全準(zhǔn)確,也不一定意味著分析有缺陷。在這個(gè)案例中,信號(hào)非常強(qiáng)烈,即使模型中允許基礎(chǔ)風(fēng)險(xiǎn)因參與者不同而有所變化,這種調(diào)整也不會(huì)對(duì)總體結(jié)論產(chǎn)生太大的影響。然而,如果結(jié)果較為邊際化,那么對(duì)模型在不同假設(shè)下的敏感性進(jìn)行廣泛的分析就顯得尤為重要。 正如那句廣為流傳的格言所說(shuō),“所有模型都是錯(cuò)的,但有些是有用的”。地塞米松的分析尤其重要,因?yàn)樗拿鞔_結(jié)論改變了臨床實(shí)踐,挽救了數(shù)十萬(wàn)人的生命。然而,這些結(jié)論所依據(jù)的概率并非“真實(shí)”的,它們是主觀假設(shè)和判斷的產(chǎn)物(盡管這些假設(shè)是合理的)。 掉入兔子洞那么,這些數(shù)字是否是我們對(duì)某種潛在“真實(shí)”概率的主觀(可能存在缺陷的)估計(jì)?這種“真實(shí)”概率是否是世界的客觀屬性? 需要澄清的是,我并不是在討論量子世界。在亞原子層面,數(shù)學(xué)表明無(wú)因事件可能以固定概率發(fā)生,盡管至少有一種解釋認(rèn)為,這些概率僅反映量子對(duì)象與其他物體或觀察者之間的關(guān)系,而非量子對(duì)象的固有屬性。然而,這似乎對(duì)宏觀世界中日??捎^察到的事件幾乎沒(méi)有影響。 我同樣可以避開(kāi)關(guān)于非量子層面的世界是否本質(zhì)上是決定性的,以及我們是否擁有自由意志去影響事件發(fā)展的問(wèn)題(這些爭(zhēng)論已經(jīng)持續(xù)了數(shù)個(gè)世紀(jì))。無(wú)論答案如何,我們依然面臨著一個(gè)挑戰(zhàn),那就是需要明確定義所謂的客觀概率究竟指的是什么。 多年來(lái),眾多學(xué)者試圖界定客觀概率的內(nèi)涵,然而所有的嘗試似乎都存在缺陷或明顯的局限性。例如,頻率派frequentist probabilityt將概率定義為在無(wú)限多次相同條件下重復(fù)某一事件的理論比例,就好比在同一個(gè)人群中,以相同的條件反復(fù)進(jìn)行相同的臨床試驗(yàn)。顯然,這是不切實(shí)際的。英國(guó)統(tǒng)計(jì)學(xué)家費(fèi)雪(Ronald Fisher)提出,可以將一個(gè)具體的數(shù)據(jù)集視作一個(gè)假想的無(wú)限總體的樣本,但這種想法更像是一個(gè)思維實(shí)驗(yàn),而非客觀存在。再比如,有一種被稱(chēng)為傾向理論(propensity)的觀點(diǎn),它認(rèn)為在特定情境下,某個(gè)事件發(fā)生的潛在傾向是真實(shí)存在的,比如預(yù)測(cè)我在未來(lái)十年內(nèi)心臟病發(fā)作的概率。然而,這種理論在實(shí)際操作中幾乎無(wú)法得到驗(yàn)證。 在一些極其復(fù)雜且嚴(yán)格控制的可重復(fù)情境中,即便這些情境本質(zhì)上可能是確定性的,它們依然遵循頻率派的概率模型,因?yàn)樗鼈兙哂虚L(zhǎng)期內(nèi)可預(yù)測(cè)的概率分布特征。這些場(chǎng)景包括各種標(biāo)準(zhǔn)的隨機(jī)工具,如輪盤(pán)、洗牌后的撲克牌、旋轉(zhuǎn)的硬幣、投擲的骰子、抽取的彩票球,以及那些基于非線(xiàn)性混沌算法生成的、能夠通過(guò)隨機(jī)性測(cè)試的偽隨機(jī)數(shù)生成器。 在自然界中,還可以考慮大規(guī)模氣體分子的運(yùn)動(dòng),即便它們遵循牛頓物理學(xué),但依然符合統(tǒng)計(jì)力學(xué)的規(guī)律;或者在遺傳學(xué)中,染色體的選擇與重組所帶來(lái)的巨大復(fù)雜性導(dǎo)致了遺傳率的穩(wěn)定性。在這些有限的情境下,假設(shè)一種偽客觀概率(“那個(gè)”概率,而非“某種”主觀概率)可能是合理的。 然而,在概率被使用的其他所有情境中,從科學(xué)的廣泛領(lǐng)域到體育、經(jīng)濟(jì)、天氣、氣候、風(fēng)險(xiǎn)分析和災(zāi)難模型等,將我們的判斷視為“真實(shí)”概率的估計(jì)是沒(méi)有意義的。在這些情境中,我們只能?chē)L試基于已有的知識(shí)和判斷,用概率來(lái)表達(dá)我們個(gè)人或集體的不確定性。 判斷之事這一切無(wú)疑會(huì)引發(fā)更多的疑問(wèn):我們?cè)撊绾谓缍ㄖ饔^概率?如果概率法則是基于我們本質(zhì)上“憑空想象”的內(nèi)容,那么這些法則又為何顯得合理?這些問(wèn)題在學(xué)術(shù)界已經(jīng)討論了近一個(gè)世紀(jì),但至今尚未形成普遍共識(shí)。 1926年,英國(guó)劍橋大學(xué)的數(shù)學(xué)家拉姆齊(Frank Ramsey,經(jīng)濟(jì)學(xué)人無(wú)人不知,無(wú)人不曉)首次嘗試解答這一問(wèn)題。他是歷史上我最希望能見(jiàn)到的人物之一。他是一位天才,其在概率論、數(shù)學(xué)和經(jīng)濟(jì)學(xué)領(lǐng)域的工作至今仍被視為基礎(chǔ)性的貢獻(xiàn)。據(jù)說(shuō),他只在上午工作,而下午則用來(lái)陪伴妻子和情人、打網(wǎng)球、暢飲、參加熱鬧的派對(duì),并且“像河馬一樣”開(kāi)懷大笑。1930年,他年僅26歲便英年早逝。根據(jù)他的傳記作者Cheryl Misak的說(shuō)法,他可能是在劍河游泳時(shí)感染了鉤端螺旋體病。 拉姆齊證明了,所有概率法則都可以從對(duì)特定賭博的偏好中推導(dǎo)出來(lái)。在這個(gè)框架中,結(jié)果被賦予了效用值,而賭博的價(jià)值則通過(guò)其期望效用來(lái)總結(jié),期望效用則由表達(dá)我們部分信念的主觀數(shù)值,也就是我們個(gè)人的概率所決定。然而,這種解釋需要額外設(shè)定這些效用值。更近期的研究表明,通過(guò)采用合適的評(píng)分規(guī)則,以最大化期望表現(xiàn)的方式行動(dòng),同樣可以簡(jiǎn)潔地推導(dǎo)出概率法則。 定義概率的嘗試通常相當(dāng)模糊。例如,阿蘭·圖靈(Alan Turing)在1941-1942年撰寫(xiě)的關(guān)于《概率在密碼學(xué)中的應(yīng)用》的論文中提出,他的工作定義為“基于某些證據(jù)的事件概率是,在這些證據(jù)下,預(yù)計(jì)該事件發(fā)生的情況比例”。這一觀點(diǎn)承認(rèn),實(shí)際概率將基于預(yù)期,即人類(lèi)的判斷。然而,“情況”的定義是什么呢?圖靈是指相同觀察的實(shí)例,還是指相同判斷的實(shí)例? 后一種解釋與頻率派的客觀概率定義有些相似,只是將重復(fù)的相似觀察類(lèi)別替換為重復(fù)的相似主觀判斷類(lèi)別。從這一角度來(lái)看,如果判斷下雨的概率為70%,這意味著將其歸入一個(gè)類(lèi)別,在這個(gè)類(lèi)別中,預(yù)報(bào)員認(rèn)為事件在70%的情況下會(huì)發(fā)生。這可能是我最喜歡的定義。然而,概率的模糊性在于,經(jīng)過(guò)近四個(gè)世紀(jì),仍然有許多人對(duì)此持不同意見(jiàn),這一點(diǎn)得到了明顯的體現(xiàn)。 務(wù)實(shí)的方法在我作為學(xué)生的1970年代,我的導(dǎo)師、統(tǒng)計(jì)學(xué)家Adrian Smith正在翻譯意大利精算師Bruno de Finetti的著作《概率論》(Theory of Probability)。de Finetti幾乎與拉姆齊同時(shí)提出了主觀概率的概念,但完全是獨(dú)立完成的。(他們的性格大相徑庭:與拉姆齊堅(jiān)定的社會(huì)主義立場(chǎng)不同,de Finetti年輕時(shí)曾是意大利獨(dú)裁者墨索里尼式法西斯主義的熱情支持者,盡管他后來(lái)改變了立場(chǎng)。)這本書(shū)以一句挑釁性的聲明開(kāi)篇:“概率不存在。”這句話(huà)在過(guò)去的50年里深刻地影響了我的思維。 然而,在實(shí)踐中,我們或許并不需要確定客觀“機(jī)會(huì)”是否確實(shí)存在于日常的非量子世界中。相反,我們可以采取一種務(wù)實(shí)的方法。諷刺的是,de Finetti本人在1931年的“可交換性(ex-changeability)”研究中為這種方法提供了最有說(shuō)服力的論據(jù),他在這項(xiàng)研究中提出了一個(gè)以他名字命名的著名定理。如果一系列事件的主觀概率不因觀察順序而改變,那么這些事件就被認(rèn)為是可交換的。de Finetti巧妙地證明,這一假設(shè)在數(shù)學(xué)上等同于假設(shè)事件是獨(dú)立的,每個(gè)事件都有某種真實(shí)但未知的“發(fā)生機(jī)會(huì)”,而我們對(duì)這種未知機(jī)會(huì)的不確定性可以用主觀的、知識(shí)性的概率分布來(lái)表達(dá)。這一發(fā)現(xiàn)令人驚嘆:它表明,從一個(gè)特定但完全主觀的信念出發(fā),我們應(yīng)當(dāng)像事件是由客觀機(jī)會(huì)驅(qū)動(dòng)的一樣行事。 令人難以置信的是,這樣一個(gè)支撐著整個(gè)統(tǒng)計(jì)科學(xué)以及許多其他科學(xué)和經(jīng)濟(jì)活動(dòng)的龐大理論體系,竟然建立在一個(gè)如此難以捉摸的概念之上。因此,我想以自己的箴言作為總結(jié):在我們的日常世界中,概率可能并不真正存在,但裝作它存在通常是有益的。
下面這些短鏈接文章屬于合集,可以收藏起來(lái)閱讀,不然以后都找不到了。 7年,計(jì)量經(jīng)濟(jì)圈近2000篇不重類(lèi)計(jì)量文章, 可直接在公眾號(hào)菜單欄搜索任何計(jì)量相關(guān)問(wèn)題, Econometrics Circle 數(shù)據(jù)系列:空間矩陣 | 工企數(shù)據(jù) | PM2.5 | 市場(chǎng)化指數(shù) | CO2數(shù)據(jù) | 夜間燈光 | 官員方言 | 微觀數(shù)據(jù) | 內(nèi)部數(shù)據(jù) 計(jì)量系列:匹配方法 | 內(nèi)生性 | 工具變量 | DID | 面板數(shù)據(jù) | 常用TOOL | 機(jī)制調(diào)節(jié) | 時(shí)間序列 | RDD斷點(diǎn) | 合成控制 | 200篇合輯 | 因果識(shí)別 | 社會(huì)網(wǎng)絡(luò) | 空間DID 數(shù)據(jù)處理:Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 | 干貨系列:能源環(huán)境 | 效率研究 | 空間計(jì)量 | 國(guó)際經(jīng)貿(mào) | 計(jì)量軟件 | 商科研究 | 機(jī)器學(xué)習(xí) | SSCI | CSSCI | SSCI查詢(xún) | 名家經(jīng)驗(yàn) |
|
來(lái)自: 計(jì)量經(jīng)濟(jì)圈 > 《待分類(lèi)》