來源:一個(gè)準(zhǔn)博士的自我修養(yǎng)計(jì)量經(jīng)濟(jì)學(xué)是利用經(jīng)濟(jì)理論和統(tǒng)計(jì)學(xué)技術(shù)分析經(jīng)濟(jì)數(shù)據(jù)的一門科學(xué)。該學(xué)科強(qiáng)調(diào)對經(jīng)濟(jì)數(shù)據(jù)所反映的變量間因果關(guān)系的建模。例如, 在教育經(jīng)濟(jì)學(xué)中, 研究提供獎(jiǎng)學(xué)金能否提高學(xué)生的學(xué)習(xí)成績;在健康經(jīng)濟(jì)學(xué)中, 研究煙草稅可以在多大程度上減少吸煙。這些問題的回答都基于變量因果關(guān)系的定量分析。計(jì)量經(jīng)濟(jì)學(xué)專家發(fā)現(xiàn)心理學(xué)和醫(yī)學(xué)等眾多領(lǐng)域經(jīng)常應(yīng)用的隨機(jī)干預(yù)試驗(yàn)方法是理解因果關(guān)系的一項(xiàng)有效途徑。例如, 某種新藥被批準(zhǔn)上市銷售之前通常需要做臨床試驗(yàn), 即隨機(jī)選擇一些患者服用該藥物, 而另一些患者服用無害的替代藥品。只有當(dāng)這種隨機(jī)干預(yù)試驗(yàn)?zāi)芴峁┯辛Φ淖C據(jù)表明藥物是安全有效的, 才能最終批準(zhǔn)該藥物上市。著名計(jì)量經(jīng)濟(jì)學(xué)家Stock和Waston認(rèn)為, 有三個(gè)理由支持應(yīng)該在計(jì)量經(jīng)濟(jì)學(xué)課程中學(xué)習(xí)隨機(jī)干預(yù)試驗(yàn)方法。第一, 理想化隨機(jī)干預(yù)試驗(yàn)的概念提供了在實(shí)際中判斷因果效應(yīng)估計(jì)的標(biāo)準(zhǔn)。第二, 隨機(jī)干預(yù)試驗(yàn)的結(jié)果通常很有影響力, 因此了解實(shí)際試驗(yàn)的局限和優(yōu)點(diǎn)十分必要。第三, 試驗(yàn)經(jīng)濟(jì)學(xué)中得到的教訓(xùn)也適用于一些準(zhǔn)試驗(yàn)。基于以上背景, 本文著重介紹隨機(jī)干預(yù)試驗(yàn)方法在計(jì)量經(jīng)濟(jì)學(xué)中的應(yīng)用, 包括隨機(jī)干預(yù)試驗(yàn)的基本方法和操作步驟和隨機(jī)干預(yù)試驗(yàn)的結(jié)果分析, 最對隨機(jī)干預(yù)試驗(yàn)的優(yōu)缺點(diǎn)進(jìn)行討論。二、隨機(jī)干預(yù)試驗(yàn)方法概述隨機(jī)干預(yù)試驗(yàn)的核心問題是找到因果關(guān)系, 即找到與未接受政策 (或干預(yù)) 時(shí)在結(jié)果上的差別,影響程度的大小也隨時(shí)間而改變?nèi)缦聢D所示。隨機(jī)干預(yù)試驗(yàn)是在控制其他因素不變的情況下分解出哪些影響和變化是由于某項(xiàng)特定因素干預(yù)所引起的, 因此要借助于反事實(shí)分析。依據(jù)在于從統(tǒng)計(jì)學(xué)意義來講, 因果關(guān)系是可觀察到的“事實(shí)”與其“反事實(shí)”之間的差異。從反事實(shí)的框架出發(fā), 因果關(guān)系可以表示為:在這里Τ是指因果關(guān)系; π指所有調(diào)查對象在干預(yù)組中的比例; (1-π) 表示所有調(diào)查對象在對照組的比例; w是一個(gè)虛擬變量, 其中1代表個(gè)體在干預(yù)組,而0代表對照組;Y1和Y0分別指代干預(yù)組和對照組的成員在因變量上的取值; E則是取期望值的意思。上述公式中, E (Y1|w=1) 或E (Y0|w=0) 是可觀測到的事實(shí), 而E (Y1|w=0) 和E (Y0|w=1) 則是反事實(shí)。因果關(guān)系T就表示為干預(yù)組中的個(gè)體其“事實(shí)”與“反事實(shí)”之間的差異即E (Y1|w=1) -E (Y0|w=1) 與對照組中的個(gè)體其“事實(shí)”與“反事實(shí)”之間的差異。隨機(jī)干預(yù)試驗(yàn)中一直存在一個(gè)問題是我們永遠(yuǎn)也不可能觀測反事實(shí)是什么。因?yàn)樵谀稠?xiàng)特定的研究中, 某一群人只可能在干預(yù)組或?qū)φ战M, 而不能同時(shí)在兩組中出現(xiàn)。這被稱為“因果推論的基本問題” (Holland) 。為了做出因果推論, 我們希望能夠滿足以下條件, 這在統(tǒng)計(jì)學(xué)上稱為“非混淆假設(shè)” (unconfoundedness assumption) :如果滿足非混淆假設(shè), 因果推論公式就簡化為:如果公式右邊的兩項(xiàng)均能觀測到, 我們就能做出因果性結(jié)論。能否做出因果推論主要取決于非混淆假設(shè)是否滿足。隨機(jī)化是統(tǒng)計(jì)學(xué)中常用的辦法,由于干預(yù)個(gè)體是通過隨機(jī)方式分配到干預(yù)組和對照組中的, w本身就和最后的干預(yù)結(jié)果Y1或Y0沒有關(guān)系了。換句話說, 無論w=0還是w=1, E (Y1) 或E (Y0) 的值都是固定的, E (Y1|w=0) =E (Y1|w=1) 且E (Y0|w=0) =E (Y0|w=1)。但是我們通常做不到完美的隨機(jī)化, 能做的是盡可能控制混淆變量, 保證這些變量一旦被控制起來, w就能夠近似地和Y1或Y0保持獨(dú)立。換句話說, 我們希望做到:實(shí)踐中, 為了得到上述介紹的干預(yù)組人群和對照組人群在干預(yù)后的區(qū)別,研究人員需要通過隨機(jī)干預(yù)試驗(yàn)“三步曲”完成數(shù)據(jù)收集, 展開干預(yù), 進(jìn)行影響評估。“三步曲”的基本步驟包括:基線調(diào)查、干預(yù)試驗(yàn)和評估調(diào)查(張林秀, 2013) 。基線調(diào)查: 在項(xiàng)目干預(yù)之前將項(xiàng)目參與者的基本狀況了解清楚, 核心信息是收集主要結(jié)果變量以及可能影響結(jié)果變量的控制變量的信息。干預(yù)試驗(yàn): 將研究人群按照隨機(jī)分配原則分成干預(yù)組和對照組, 并要在干預(yù)的過程中進(jìn)行監(jiān)控以保證項(xiàng)目能夠正確實(shí)施。比如在項(xiàng)目執(zhí)行中, 有些參與者中途會退出, 但是要保證最后退出的參與者和剩余的參與者在基本狀況上沒有差異。評估調(diào)查: 等到干預(yù)完成預(yù)期已經(jīng)出現(xiàn)影響后, 評估調(diào)查就可以開始了, 評估調(diào)查只要重復(fù)基線調(diào)查時(shí)所調(diào)查的所有內(nèi)容就可以了。評估調(diào)查最經(jīng)常遇到的情況是參與者退出, 這時(shí)候就需要嚴(yán)格比對參與基線調(diào)查的人群, 完整地識別出共同參與基線和評估調(diào)查的人員。 三、隨機(jī)干預(yù)試驗(yàn)的結(jié)果分析在調(diào)查工作完成之后, 根據(jù)收集得到的數(shù)據(jù), 便可以對隨機(jī)干預(yù)試驗(yàn)結(jié)果進(jìn)行分析。利用基線和評估兩期數(shù)據(jù)、干預(yù)和對照組分類, 比較兩期數(shù)據(jù)的差即可。利用試驗(yàn)設(shè)計(jì)的干預(yù)組和對照組基線和評估兩期面板數(shù)據(jù),初步模型設(shè)計(jì)如下:上式中:Δyi為評估期的結(jié)果變量與基期結(jié)果變量的差;結(jié)果變量y是我們所要考察的變量;ΔTreati代表是否提供干預(yù)的虛擬變量, 缺省的是對照組;εi是隨機(jī)干擾項(xiàng);β1的估計(jì)量代表相比于對照組群體, 干預(yù)的影響效應(yīng)。 (7)式中可進(jìn)一步加入其他控制變量, 此時(shí)的回歸模型是:(8) 式中Y為ΔXi的系數(shù)變量, 對于那些基期和評估期不發(fā)生改變的控制變量, 兩期之間的差值為0, 因此不包含在式 (8) 中的ΔXi中。如果干預(yù)是嚴(yán)格的和有效的按照規(guī)定來實(shí)施, 同時(shí)沒有被其他因素影響, 那么計(jì)量模型估算的影響大小β1就是我們希望得到的干預(yù)的效果。雖然隨機(jī)干預(yù)試驗(yàn)理論上的優(yōu)越性被稱為影響評估的“黃金準(zhǔn)則”, 但是仍然面臨諸多挑戰(zhàn)。例如, 參與試驗(yàn)的人群會影響他們的行為 (霍桑效應(yīng)) ;中間退出的參與者的退出原因可能與干預(yù)本身相關(guān), 這就會造成OLS估計(jì)有偏。另外, 以人為主體的試驗(yàn)成本非常昂貴, 因此這類項(xiàng)目通常樣本不大。而樣本較小就可能帶來樣本代表性的問題。做試驗(yàn)?zāi)康木褪窍胪茝V干預(yù)的效果, 但是若在一個(gè)國家發(fā)現(xiàn)一項(xiàng)政策有效并不一定能在另一個(gè)國家有同樣的效果時(shí), 試驗(yàn)帶來的優(yōu)勢將不復(fù)存在。試驗(yàn)研究還經(jīng)常被批評存在有倫理問題。比如發(fā)現(xiàn)當(dāng)?shù)匦『⒋嬖谪氀? 而干預(yù)是補(bǔ)充鐵元素的改善貧血計(jì)劃, 對照組小孩因?yàn)樵谠囼?yàn)中不能得到鐵元素補(bǔ)充, 因而要實(shí)施隨機(jī)干預(yù)試驗(yàn)需經(jīng)過倫理委員會的嚴(yán)格審查。雖然仍存在不少問題, 但隨機(jī)干預(yù)試驗(yàn)的研究近年來越來越多地被經(jīng)濟(jì)學(xué)家采用。原因是即使是像American Economic Review這樣的頂級經(jīng)濟(jì)學(xué)期刊, 很多文章的計(jì)量經(jīng)濟(jì)結(jié)論還是有錯(cuò)誤的 (Mc Closkey and Ziliak, 1996) 。但隨機(jī)干預(yù)試驗(yàn)的引入有效回應(yīng)了部分質(zhì)疑。例如, 哈佛大學(xué)著名經(jīng)濟(jì)學(xué)家Zvi Griliches曾說, 他不曾看到超過4個(gè)變量的分析。隨機(jī)干預(yù)試驗(yàn)的研究能夠很好地減少控制變量的數(shù)目。正因如此, 在經(jīng)濟(jì)領(lǐng)域引入隨機(jī)干預(yù)試驗(yàn)的先鋒如MIT的Duflo教授, 因其突出的貢獻(xiàn)獲得了2010年度的克拉克獎(jiǎng)。隨著隨機(jī)干預(yù)試驗(yàn)的應(yīng)用越來越多, 一些計(jì)量經(jīng)濟(jì)學(xué)教科書也引入這部分內(nèi)容以介紹給讀者 (Stock and Waston, 2007) 。在這學(xué)期的計(jì)量經(jīng)濟(jì)學(xué)教學(xué)中, 我也特意安排一節(jié)課闡述了隨機(jī)干預(yù)試驗(yàn)的基本思想, 提醒學(xué)生在應(yīng)用計(jì)量經(jīng)濟(jì)學(xué)時(shí), 能夠不斷反思自己所建模型的可信性, 以提高學(xué)生對計(jì)量經(jīng)濟(jì)學(xué)的掌握程度。[1]Stock, James H., and Mark W.Watson.Introduction to Econometrics, 2nd ed[M].Boston:Addison Wesley, 2007 [2]Holland, Paul W.Statistics and Causal Inference[J].Journal of the American Statistical Association, 1986 [3]張林秀.隨機(jī)干預(yù)試驗(yàn)——影響評估的前沿方法[J].地理科學(xué)進(jìn)展, 2013 [4]Mccloskey, Deirdre N., and Stephen T.Ziliak.The standard error of regressions[J].Journal of economic literature, 1996
|