秋風(fēng)送爽,學(xué)期伊始。本號(hào)為計(jì)量小伙伴們送上一個(gè)開(kāi)學(xué)小禮包:如何使用雙重差分法的交叉項(xiàng)(迄今最全攻略)。 雙重差分法(Difference-in-differences,簡(jiǎn)記DID)無(wú)疑是實(shí)證研究中最常用的計(jì)量方法之一,而交互項(xiàng)則是DID的靈魂。在計(jì)量實(shí)踐中,取決于數(shù)據(jù)的類型與性質(zhì),DID的交互項(xiàng)有著不同的形式。靈活地使用DID的交互項(xiàng),是實(shí)證研究的一項(xiàng)重要技能。為此,本文全面地梳理了文獻(xiàn)中關(guān)于DID交互項(xiàng)的各種形式,包括(1)傳統(tǒng)DID;(2)經(jīng)典DID;(3)異時(shí)DID;(4)廣義DID;以及(5)異質(zhì)性DID。 傳統(tǒng)DID 雙重差分法是研究“處理效應(yīng)”(treatment effects)的流行方法。一般來(lái)說(shuō),DID的使用場(chǎng)景為,在面板數(shù)據(jù)中,個(gè)體可分為兩類,即受到政策沖擊的“處理組”(treatment group)與未受政策影響的“控制組”(control group)。為此,引入處理組虛擬變量 : 然而,處理組的個(gè)體也只有到了處理期才會(huì)受到政策沖擊(之前未受沖擊),故引入處理期虛擬變量: 傳統(tǒng)DID的模型設(shè)定為 其中,處理組虛擬變量 捕捉了處理組的組別效應(yīng)(處理組與控制組的固有差別),處理期虛擬變量 控制了處理期的時(shí)間效應(yīng)(處理期前后的固有時(shí)間趨勢(shì)), 為其他控制變量,而交互項(xiàng) 則代表了處理組在處理期的真正效應(yīng),其系數(shù) 正是我們關(guān)心的處理效應(yīng)。然后進(jìn)行OLS估計(jì)即可。 經(jīng)典DID DID使用了面板數(shù)據(jù),而估計(jì)面板模型的標(biāo)準(zhǔn)方法為“雙向固定效應(yīng)模型”(two-way fixed effects),它既控制了“個(gè)體固定效應(yīng)”(individual fixed effects),也控制了“時(shí)間固定效應(yīng)”(time fixed effects)。研究者后來(lái)發(fā)現(xiàn),雖然傳統(tǒng)DID控制了處理組的組別效應(yīng)()與處理期的時(shí)間效應(yīng)();但其實(shí)還可以做得更好,干脆引入雙向固定效應(yīng)模型,我們稱之為“經(jīng)典DID”: 其中, 為個(gè)體固定效應(yīng)(在回歸時(shí)加入個(gè)體虛擬變量即可), 為時(shí)間固定效應(yīng)(在回歸時(shí)加入時(shí)間虛擬變量即可),而交互項(xiàng) 之前的系數(shù) 依然是我們感興趣的處理效應(yīng)。顯然,加入個(gè)體固定效應(yīng) 之后,就不必再放入處理組虛擬變量 ;否則,將導(dǎo)致嚴(yán)格多重共線性,因?yàn)榍罢甙群笳吒嗟男畔ⅲㄇ罢呖刂频絺€(gè)體層面,而后者僅控制到組別層面)。 類似地,加入時(shí)間固定效應(yīng) 之后,就不必再放入處理期虛擬變量 ;否則,將導(dǎo)致嚴(yán)格多重共線性,因?yàn)榍罢甙群笳吒嗟男畔ⅲㄇ罢呖刂屏嗣恳黄诘臅r(shí)間效應(yīng),而后者僅控制處理期前后的時(shí)間效應(yīng))。估計(jì)方法依然是OLS,但須使用“聚類穩(wěn)健標(biāo)準(zhǔn)誤”(cluster-robust standard errors),因?yàn)槊姘鍞?shù)據(jù)一般為“聚類數(shù)據(jù)”(cluster data)。這種經(jīng)典DID的模型設(shè)定在實(shí)證研究中最為常見(jiàn)。 異時(shí)DID 在傳統(tǒng)與經(jīng)典DID的模型設(shè)定中,一個(gè)隱含假設(shè)是,處理組的所有個(gè)體開(kāi)始受到政策沖擊的時(shí)間均完全相同。但有時(shí)也會(huì)遇到每位個(gè)體的處理期不完全一致的情形(heterogeneous timing);比如,某項(xiàng)試點(diǎn)政策在不同城市分批推出。此時(shí),可使用“異時(shí)DID”(heterogeneous timing DID)。 異時(shí)DID的關(guān)鍵在于,既然每位個(gè)體的處理期不完全一致,則處理期虛擬變量也因個(gè)體而異,故應(yīng)寫(xiě)為 (既依賴于個(gè)體 i,也依賴于時(shí)間 t)。具體而言,異時(shí)DID的模型設(shè)定為 在具體實(shí)施時(shí),可在Stata中首先定義因個(gè)體而異的處理期虛擬變量 。比如,考慮一個(gè)五期面板,對(duì)于第1位個(gè)體,;對(duì)于第2位個(gè)體,;而對(duì)于第3位個(gè)體,。這意味著,第1位個(gè)體從第3期開(kāi)始受到政策處理,第2個(gè)體從第4期開(kāi)始受到政策沖擊,而第3位個(gè)體從未受到政策沖擊(屬于控制組);以此類推。 廣義DID 以上各種DID方法均假設(shè)存在處理組與控制組的區(qū)別,但有時(shí)某項(xiàng)政策在全國(guó)統(tǒng)一鋪開(kāi),此時(shí)只有處理組,并沒(méi)有控制組,是否還能使用DID呢?答案是“能”,可以嘗試“廣義DID”(generalized DID)。 使用廣義DID的重要前提是,雖然所有個(gè)體均同時(shí)受到政策沖擊,但政策對(duì)于每位個(gè)體的影響力度并不相同,不妨以 來(lái)表示。 一個(gè)經(jīng)典研究是 Bai and Jia (2016, Econometrica) 使用清朝的府級(jí)面板數(shù)據(jù),考察廢除科舉制對(duì)于革命起義的影響。由于科舉制于1911年在全國(guó)統(tǒng)一廢除,故不存在嚴(yán)格意義上的控制組。但由于各地科舉配額的巨大差異,廢除科舉對(duì)于各地的影響力度差別很大。 直觀上,如果某個(gè)府本來(lái)的科舉配額微乎其微,則廢除科舉當(dāng)然影響很??;反之,對(duì)于科舉配額很多的府,廢除科舉則可能引發(fā)劇烈震動(dòng),因阻斷很多士子的上升空間而導(dǎo)致革命。為此,Bai and Jia (2016) 以“科舉配額占人口比重”作為對(duì)于 的度量。 在實(shí)踐中,只要尋找到合適的 變量(一般從經(jīng)濟(jì)理論出發(fā)來(lái)尋找),則可以之替代經(jīng)典DID的 虛擬變量,將廣義DID模型設(shè)定如下: 其中,交互項(xiàng) 之前的系數(shù) 依然是我們關(guān)心的處理效應(yīng),然后對(duì)上式進(jìn)行OLS估計(jì)。 當(dāng)然,對(duì)于廣義DID,文獻(xiàn)中也曾出現(xiàn)更為“簡(jiǎn)單粗暴”的處理方法,即人為地設(shè)定一個(gè)門檻值 c,根據(jù) 變量是否超過(guò)此門檻值來(lái)定義處理組與控制組。具體來(lái)說(shuō),定義 然后,按照經(jīng)典DID來(lái)處理。這種處理方法的缺點(diǎn)在于,門檻值 c 的設(shè)定比較主觀,一般須進(jìn)行“穩(wěn)健性檢驗(yàn)”(robustness checks),即考察不同門檻值下的回歸結(jié)果是否穩(wěn)定。另外,在將連續(xù)變量 壓縮為二分變量 的時(shí)候,顯然損失了不少信息,故在實(shí)踐中已不多見(jiàn)。 異質(zhì)性DID 傳統(tǒng)的處理效應(yīng)模型一般假設(shè)“同質(zhì)性處理效應(yīng)”(homogeneous treatment effects),即所有個(gè)體的處理效應(yīng)都相同。顯然,此假定太苛刻,在實(shí)踐中難以成立。更為合理的假定則為“異質(zhì)性處理效應(yīng)”(heterogeneous treatment effects),即允許每位個(gè)體的處理效應(yīng)不盡相同。 在DID的框架下,也可引入異質(zhì)性處理效應(yīng),關(guān)鍵仍在于對(duì)交互項(xiàng) 的調(diào)整。為簡(jiǎn)單起見(jiàn),假設(shè)根據(jù)經(jīng)濟(jì)理論,可將所有個(gè)體分為兩類,以虛擬變量 來(lái)表示。在理論上,我們預(yù)期這兩類個(gè)體的處理效應(yīng)并不相同。此時(shí),可在經(jīng)典DID的模型中,再引入三重交互項(xiàng) ,構(gòu)建異質(zhì)性DID模型: 由上式可知,對(duì)于 那類處理組個(gè)體,其處理效應(yīng)為 。而對(duì)于 那類處理組個(gè)體,其處理效應(yīng)為 。顯然,對(duì)于 或 的這兩類個(gè)體,其處理效應(yīng)是異質(zhì)的(只要三重交互項(xiàng)的系數(shù) 顯著)。 推而廣之,如果經(jīng)濟(jì)理論認(rèn)為,應(yīng)將所有個(gè)體分為 M 類,以考察這 M 類個(gè)體的異質(zhì)性效應(yīng),則可設(shè)立 (M -1) 個(gè)類別虛擬變量,比如 ,然后分別生成三重交互項(xiàng) ,引入回歸方程中: 在上式中,第 1 類個(gè)體的處理效應(yīng)為 ,第 2 類個(gè)體的處理效應(yīng)為 ,以此類推。然后照常進(jìn)行OLS估計(jì)即可。 當(dāng)然,雙重差分法還有其他變種,比如三重差分法(Difference-in-differences-in-differences,簡(jiǎn)記DDD),以及與傾向得分匹配相結(jié)合的PSM-DID 等,有興趣的讀者可參考陳強(qiáng)(2014)。 參考文獻(xiàn) 陳強(qiáng),《高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用》,第2版,高等教育出版社,2014年 陳強(qiáng),《計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用》,高等教育出版社,2015年(好評(píng)如潮的配套教學(xué)視頻,可在網(wǎng)易云課堂購(gòu)買) 陳強(qiáng),《機(jī)器學(xué)習(xí)及R應(yīng)用》,高等教育出版社,2020年(即將出版) |
|
來(lái)自: 萌糍粑 > 《計(jì)量方法》