在因果推斷中,混雜因素(confounder)指的是既和自變量相關(guān)又和因變量相關(guān)的變量。在存在混雜因素的情況下,直接觀察自變量和因變量的共變關(guān)系會(huì)得出扭曲、錯(cuò)誤或虛假的因果效應(yīng)。在目前主流的研究設(shè)計(jì)中,只有理想中的隨機(jī)分組-對(duì)照實(shí)驗(yàn)(RCT)能夠真正解決混雜因素的問題。這是因?yàn)殡S機(jī)分組能使已經(jīng)認(rèn)識(shí)到的或尚未認(rèn)識(shí)到的混雜因素在處理組和控制組中平衡分布,使得處理/控制獨(dú)立于混雜因素,從而通過比較實(shí)驗(yàn)組和控制組的結(jié)果均值就可以求出干凈的因果效應(yīng)。 然而,在現(xiàn)實(shí)中,研究者仍然大量依賴于觀察性數(shù)據(jù)。而大多數(shù)實(shí)驗(yàn)隨機(jī)分組的有效性也會(huì)受到嚴(yán)重的質(zhì)疑。這使得研究者必須直面混雜因素,并想法設(shè)法去修正被混雜因素干擾的因果效應(yīng)。當(dāng)然,上述情況在社會(huì)科學(xué)領(lǐng)域尤為突出。因此,社會(huì)科學(xué)的發(fā)展無疑就是一部人類不斷“殺掉”混雜因素的史詩。 在回歸分析中加入巨多的控制變量很可能是許多研究者面對(duì)混雜因素時(shí)最后的倔強(qiáng)。政文觀止Poliview今天就給大家分享兩種更直觀、更高效且更易于理解和解釋的混雜因素殺手——加權(quán)和匹配。 這兩種方法的核心前提是一致的,即認(rèn)識(shí)到混雜因素取值不同的個(gè)體進(jìn)入處理組(而非控制組)的概率是不一樣的。這種條件概率還有一個(gè)更加網(wǎng)紅的名稱:傾向值(propensity score)。傾向值可以通過以混雜因素為自變量的回歸方程進(jìn)行預(yù)測(cè)。在此基礎(chǔ)上,加權(quán)的方法較為"溫柔",那就是用數(shù)學(xué)方法逆轉(zhuǎn)上述預(yù)測(cè)值。譬如在處理組中給傾向值更小的個(gè)體更大的權(quán)重,給傾向值更大的個(gè)體更小的權(quán)重。這樣,在重新構(gòu)造后的處理組和控制組中,混雜因素變得平衡,均值比較就可以發(fā)揮因果推斷的作用。與之相對(duì)的是,匹配的方法事實(shí)上非常"暴力",那就是不斷地找傾向值最相似的兩個(gè)個(gè)體(分別來自處理組和控制組)進(jìn)行匹配比較。那么,如果有些個(gè)體過于離譜導(dǎo)致找不到匹配的對(duì)象呢?那就直接丟棄。正因如此,Gary King有一句名言“Matching is pruning!”也有學(xué)者認(rèn)為匹配就是最極端的加權(quán)方式(給予某些個(gè)體0權(quán)重)。 下面我們結(jié)合Stata及其自帶的數(shù)據(jù)來分析一個(gè)實(shí)例。(可通過窗口File – Example dataset獲取或鍵入命令:use http://www./data/r15/cattaneo2.dta)。該數(shù)據(jù)描述了母親是否吸煙(mbsmoke)對(duì)嬰兒出生體重(bweight)的影響,同時(shí)還記錄了很多混雜因素(母親年齡mage,母親是否結(jié)婚mmaried,母親的教育程度medu以及是否為第一個(gè)孩子fbaby等)。如果不考慮混雜因素的影響,可以直接計(jì)算母親吸煙和母親不吸煙兩組的嬰兒體重均值,再通過比較來進(jìn)行推斷。結(jié)果如下圖所示,母親不吸煙的嬰兒體重平均比母親吸煙的嬰兒體重多275.2519克,差異顯著。 然而,根據(jù)既有經(jīng)驗(yàn),我們已經(jīng)可以明確一些混雜因素的干擾。譬如,一般而言,不吸煙的母親年齡較大而母親年齡較大嬰兒體重也較重。這就使得年齡干擾了我們對(duì)母親吸煙影響嬰兒體重的因果效應(yīng)的計(jì)算。下圖中的簡單檢驗(yàn)也證實(shí)了我們的擔(dān)憂。 下面嘗試使用加權(quán)的方法來修正因果效應(yīng)。首先通過下圖找到逆概率加權(quán)(Inverse-probability weighting,IPW)的對(duì)話框。然后將因變量/結(jié)果變量放入Outcome variable一欄,將自變量/處理變量放入Treatment variable一欄,將混雜因素放入Treatment independent一欄。同時(shí)指定預(yù)測(cè)條件概率的方程類型,一般默認(rèn)為logistic回歸。 結(jié)果如下圖所示,母親不吸煙時(shí),嬰兒體重的潛在結(jié)果均值(POmean)為3402.621克,母親吸煙對(duì)嬰兒體重的因果效應(yīng)被修正為-232.1279克。 類似地,我們也可以用傾向值匹配(Propensity-score matching)的方法來“殺掉”混雜因素。很多高級(jí)玩家喜歡用psmatch2等自由度更高的外部包來實(shí)現(xiàn)這一過程。事實(shí)上,高版本的stata已經(jīng)內(nèi)置一鍵式的傾向值匹配功能。我們可如下圖所示找到相應(yīng)的對(duì)話框,然后和ipw一樣制定好變量與方程。 結(jié)果如下圖所示,傾向值匹配給出的因果效應(yīng)為-203.9734克??梢?,即使都依賴于個(gè)體進(jìn)入處理組的概率,加權(quán)和匹配給出的因果效應(yīng)仍然有所差別。其中的奧妙就留給讀者自己去探索了。 值得注意的是,傾向值匹配一般只能應(yīng)用于二分變量,即只有一個(gè)處理組和一個(gè)控制組的情況;而逆概率加權(quán)則可以適用于多分類變量,因此得到了越來越多研究者的青睞。 當(dāng)然,基于被試進(jìn)入處理組的概率來解決混雜因素的方法也有自身的問題和風(fēng)險(xiǎn)。首先,只有當(dāng)混雜因素被成功識(shí)別和測(cè)量的時(shí)候,對(duì)條件概率的預(yù)測(cè)才有意義,否則傾向值本身也不值得信賴。在這方面,隨機(jī)分組-對(duì)照實(shí)驗(yàn)仍然是因果推斷的圣杯。其次,預(yù)測(cè)條件概率的方程把多維的混雜因素強(qiáng)行降為一維,因此有丟失信息的巨大風(fēng)險(xiǎn)。也正因如此,不少方法學(xué)家認(rèn)為應(yīng)當(dāng)直接用所有混雜因素的馬氏距離進(jìn)行多維匹配。 撰文:陸屹洲 審校:楊端程 編輯:康張城 【政文觀止Poliview】系頭條號(hào)簽約作者 你在看政觀么 |
|