小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

文獻薦讀 | 第一部分 因果推斷:基本框架(2)

 新用戶68639482 2020-04-07

來源:

翻譯:陳昕欣

校對:龍哥

編輯:林毅

點擊標題查看上期內容:

文獻薦讀 | 第一部分 因果推斷:基本框架(1)

1.5 了解因果效應:多個個體

雖然因果效應的定義不需要一個以上的個體,但是學習或者了解因果效應通常需要多個個體。因為只有一個個體,我們最多只能觀測到一個潛在的結果,我們必須依賴多個個體來做出因果推斷。更具體地,我們必須觀察多個個體,其中一些是處理組,接受積極的處理,另一些則是控制組,接受被動的處理。

一種方法是在不同的時間點,在不同的處理水平下觀察相同的物理對象。這種類型的數(shù)據(jù)集是對因果效應進行非正式估計的常見來源。例如,根據(jù)以往的經驗,包括服用阿司匹林時頭疼消失,與未服用阿司匹林時頭疼沒有消失這兩種經驗,我可能相信服用阿司匹林會在一個小時內緩解頭痛。在這種情況下,我的觀點是通過比較多個個體形成的:我自己在不同的時間點,服用和不服用阿司匹林。有時,人們傾向于把不同時間點的相同的物理現(xiàn)象視為同一個體。我們認為這是根本性的錯誤。同樣的物理個體,“在不同時期的我”,在我們處理因果關系的方法中不是相同的個體。時間點很重要。例如,我在晚上對阿司匹林的敏感程度可能與早上不同,或者是我最初的頭痛程度也可能影響結果。假設時間對無生命的物品沒有多大影響通常是合理的,根據(jù)過去的經驗,我們可能相信(或認為),打開水龍頭,水會從中流出來。但這種假設通常不適用于人類。將假設(例如,關于不同個體之間的相似性)與定義(例如,個體定義或因果關系的定義)混淆起來永遠是不正確的。

作為重復觀察同一物理對象的另一種選擇和方法,我們可以在大約同一時間觀察不同的物理對象。這種情況是對因果效應進行非正式估計的另一種常見來源。例如,如果你我都患有頭痛,但我們中只有一個人服用阿司匹林,我們可能會試圖通過比較我們隨后的頭痛狀況來推斷服用阿司匹林的效果。顯然的是,“你”和“我”是同一時間點的不同個體。你服用阿司匹林后的頭痛狀況與我服用阿司匹林后的頭痛狀況明顯不同。我可能對阿司匹林有些敏感,或者也可能開始時頭痛更加嚴重。這種比較,通常許多不同的個體,被廣泛應用于非正式的因果效應估計,但它也是社會科學和生物醫(yī)學中許多正式的因果效應研究的基石。例如,許多人通過比較受過大學教育的個人和沒有受過大學教育的個人的職業(yè)生涯,發(fā)現(xiàn)大學教育在經濟上有利于未來的職業(yè)發(fā)展。

然而,多個個體的存在本身并不能解決因果推斷的問題??紤]阿司匹林的例子,有兩個個體,你和我;每個個體有兩種可能的處理方法,服用阿司匹林或不服用阿司匹林。為了簡單起見,假設這兩種可用的阿司匹林藥片效果相同?,F(xiàn)在總共有4種處理水平:你服用阿司匹林而我沒有,我服用阿司匹林而你沒有,我們兩個都服用阿司匹林,或者我們兩個都不服用。因此我們每個人都有四種潛在結果。對于“我”,這四種潛在結果是我的頭痛狀態(tài)(i) 如果我們兩個都沒有服用阿司匹林,(ii)如果我服用了阿司匹林而你沒有,(iii)如果你服用了阿司匹林而我沒有,和(iv)如果我們都服用了阿司匹林?!澳恪碑斎灰灿邢鄬乃姆N潛在結果。對于每個個體,我們仍然只能觀測到這四種潛在結果的至多一種,即與你我是否服用阿司匹林相對應的已實現(xiàn)的結果。因此,現(xiàn)在每個處理水平都可以表明你是否服用阿司匹林和我是否服用。在這種情況下,有6種不同的比較定義了我們每個人的因果效應這取決于每個個體的四種潛在結果中的哪兩個可以進行概念上的比較。例如,我們可以把我們都服用阿司匹林時我的頭痛狀況,與我們都沒有服用阿司匹林時我的頭痛狀況進行比較、或者我們可以把只有你服用阿司匹林時我的頭痛狀況,同我們都服用阿司匹林時我的頭痛狀況進行比較。

雖然我們通常假設,你是否服用阿司匹林不會影響我的頭痛狀況,但是理解這種假設仍然很重要。人們不應忽略這一事實,即這是一個假設,通常是強有力且有爭議的假設,而不是一個事實,因此可能是錯誤的??紤]這樣一個情境,我服用阿司匹林,如果你沒有服用阿司匹林,那么我會頭痛;而如果你服用了阿司匹林,我不會頭痛:我們是在同一個空間中,除非你服用了阿司匹林緩解了你自己的頭痛,否則你不停地抱怨只會讓我持續(xù)頭痛。這種交互作用或溢出效應是許多教育項目的一個重要特征,并且常常促使分析個體從單個兒童轉移到學?;蚱渌麍F體。

1.6 穩(wěn)定個體干預值假設

(Suitable Unit Treatment Value Assumption)

在許多情況下,可以合理地假設對一個個體的處理不會影響另一個個體的結果。例如,如果我們處在不同的地方,彼此沒有聯(lián)系,那么有理由假設,你是否服用阿司匹林對我的頭痛狀況沒有影響。(但是,正如上一節(jié)的例子中所闡釋的,如果我們處在同一個位置,那么這種假設就不再成立了,而你的行為,本身就受你是否服用阿司匹林的影響,也可能會影響我頭痛的狀況,或者如果我們可以通過超感知覺進行交流的話。)穩(wěn)定個體干預值假設,簡稱SUTVA(Rubin, 1980a)就納入了這一想法,即個體之間互不干擾,而且每個個體只有單一形式的處理水平(在這種情況下,排除了特定的個體可以服用不同功效的阿司匹林藥片):

假設 1.1 (SUTVA)

任何個體的潛在結果都不隨分配給其他個體的處理水平而變化,而且處理水平對于所有個體都是相同的,這就導致了不同的潛在結果。

穩(wěn)定性假設的這兩種因素使得我們能夠利用多個個體的存在來估計因果效應。

SUTVA是本書中所探討的一系列假設中的第一個,這些假設通常被稱為排他性限制:即依賴外部的、實質性的信息來排除特定試驗,相對于替代方案因果效應的假設。例如,在阿司匹林的例子中,為了幫助評估阿司匹林對頭痛的因果效應,我們可以排除你服用或者不服用阿司匹林對我的頭痛狀況有任何影響的可能性。同樣,我們也可以排除我服用的阿司匹林藥片有不同的強度的可能性。但是,請注意,這些假設,以及稍后討論的限制性條件,并不是通過觀察直接得到的。也就是說,假設它們依賴于先前獲得的相關知識來證明其合理性。如果沒有這些假設,因果推斷通常是不可能的,因此,明確它們的內容和理由至關重要。

1.6.1 SUTVA:沒有干擾

首先,考慮SUTVA的無干擾部分——假定對一個個體的處理不會影響其他個體的結果。研究人員早就意識到這一概念的重要性。例如,在研究農業(yè)試驗中不同類型的化肥對地塊產量的影響時,傳統(tǒng)上,研究人員會小心地使用“保護帶”將地塊分開,即在施肥區(qū)之間使用未施肥的條狀土地。通過控制不同肥料在試驗田中的浸出,這些保護帶使得SUTVA更加可信了;沒有他們,我們可能會懷疑采用在一塊土地上的肥料會影響相鄰土地的產量。

在我們的頭痛例子中,為了解決無干擾假設,可以爭論,基于醫(yī)學和生理學的先驗知識,其他人在不同地方服用阿司匹林不會對我的頭痛狀況產生影響。你可能認為我們可以從另一個實驗中了解到這種干預的大小。假設人們配對,每對都放在一個單獨的房間里。在每一對中,隨機選取一個個體為“指定處理”個體,而另一個為“指定控制”個體。然后隨機選取一半作為處理組,另一半作為控制組。在處理組中的“指定處理”個體服用阿司匹林,控制組中的“指定控制”個體服用安慰劑。結果將是每對“控制”個體頭痛的狀態(tài)。盡管這樣的試驗讓我們對無干擾假設的合理性有一定了解,但這個試驗本身依賴于更遙遠形式的SUTVA——分配給一對的處理不會影響其他對的結果。如本例所示,為了對因果效應進行估計,研究人員必須依賴于當前主題的現(xiàn)有知識,以斷言某些處理不會影響某些個體的結果。

此外,仍存在某些情境,SUTVA的無干擾假設是存在爭議的。例如,在大規(guī)模的職業(yè)培訓項目中,當培訓人數(shù)增加,大到足以對某些工作產生競爭時,單個個體的結果很可能會受到培訓人數(shù)的影響。在一個極端的例子中,如果你的同齡人都去讀統(tǒng)計學研究生,那么你讀統(tǒng)計學研究生對未來收入的影響肯定會大不相同。經濟學家將這一概念稱為一般均衡效應,而非局部均衡效應。后者是在其他條件不變的假設下,統(tǒng)計學研究生學位對收入的影響。另一個典型的個體間相互干擾的例子出現(xiàn)在對傳染病進行免疫接種的情境中。接種疫苗與不接種疫苗的因果效應肯定取決于其他人是否接種疫苗:如果其他人已經接種了一種完美的疫苗,他們因此既不會感染疾病也不會傳播疾病,那么你的免疫接種就是多余的。然而,如果其他人沒有接種疫苗,那么你的處理(接種完美的疫苗)將比沒有接種疫苗有效。在這種情況下,有時可將個體定義為個人發(fā)生交互作用來考慮SUTVA的一種更嚴格的形式,例如,在教育環(huán)境中的學校,或限制分配給特定處理水平的個體數(shù)量。

1.6.2 SUTVA:處理水平對所有個體都是相同的

SUTVA的第二個組成部分要求接受特定處理水平的個體,不能接受不同程度的處理。在此考慮我們對阿司匹林對治療頭痛因果效應的評估。對于我們兩個都服用阿司匹林的潛在因果,我們顯然需要不止一片阿司匹林。但是,假設其中一片藥片是舊的,不再含有完全有效的劑量,而另一種是新的,含有完全有效的劑量。在這種情況下,我們每個人都可能有三種可行的處理方法:不服用阿司匹林,無效藥片和有效藥片。因此,有兩種形式的積極處理,在名義上都標記為“阿司匹林”:aspirin+ 和 aspirin-。即使沒有干擾,我們現(xiàn)在可以想到我們每個人都有三種潛在結果,即沒有阿司匹林的結果Yi (No Aspirin) ,弱阿司匹林的結果Yi(Aspirin-)和強阿司匹林的結果Yi(Aspirin+),這里的i表示“我”或“你”。SUTVA的第二部分或者要求這兩種阿司匹林的療效相同:,或者要求我只能得到aspirin+,你只能得到 aspirin-(反之亦然)?;蛘?,我們可以將處理方法重新定義為隨機選擇阿司匹林(aspirin+或aspirin-)。在這種情況下,重新定義的隨機處理可能會滿足SUTVA。

當采取處理的方法不同時,另一個SUTVA不能測出處理變化的情況就會發(fā)生。對于特定個體來說,服用藥物的效果可能會有所不同,這取決于該個體是否被指定接受藥物。例如,在被給予選擇后服用它可能導致個人采取的行動不同于如果該個體沒有選擇服用該藥物。

從根本上說,SUTVA的第二個組成部分也是一個排他性限制。要求是阿司匹林藥片的標簽,或者處理采用的性質,不能改變任一個體的潛在結果。這一假設并不要求所有個體接受的每一種處理水平的所有程度都是相同的,但是強調接受處理水平w的個體i,為所有的i和w指定了明確定義的潛在結果YI(w)。

使SUTVA更可信的一種策略在于重新定義所代表的的處理水平,使之包含更多的處理方法,例如,Apirin-,Aspirin+,和不服用阿司匹林,而不是只有服用阿司匹林和不服用阿司匹林。第二種策略是將結果粗化;例如,SUTVA可能更可信,如果結果被定義為死亡或活著,而不是健康狀況的詳細測量。重點是,SUTVA意味著每個個體和每一處理方法的潛在結果,是個體指標和處理方法明確定義的函數(shù)(可能帶有隨機性)。

1.6.3 SUTVA的替代方法

總結前面的討論,評估二元處理水平的因果效應需要觀察多個個體,因為我們必須觀察到兩種處理水平下的潛在結果:在一些個體中接受處理的觀測值,和另一些個體中沒有接受處理的觀測值。然而,在有多個個體的情境下,我們面臨著兩個棘手的問題。第一,存在著不同個體間相互干預的可能性,使得接受特定處理的個體潛在因果可能依賴于另一個體接受的處理水平。第二,因為是多個個體的情境,在每種處理水平下,我們必須有多個觀測。我們可能會面臨這樣的情況,即在接受名義上相同的處理水平時,不同個體的潛在因果可能因接受處理的不同程度而有所差異。這些是嚴重的問題,即除非我們用假設來限定它們,并結合細致的研究設計使得這些假設更加現(xiàn)實合理,否則任何因果推斷的可信度都有限。

在本書的大部分內容中,我們都將認為SUTVA是合理的。但是,在某些情況下,具體資料可能表明替代假設更為合適。例如,在某些早期的艾滋病藥物試驗情境中,許多患者服用了一些指定的藥物,并與其他患者分享,希望避免安慰劑?;谶@些知識,斷言SUTVA的無干預部分——一個個體接受的處理不會影響其他個體的結果——顯然已不再合適。然而,我們可以使用這一具體信息去模擬處理在研究中患者如何接受治療/處理的情況,進行替代假設(在本例中,替代假設更為合適)得到推斷。例如,在這類艾滋病藥物試驗中,SUTVA可能更適合將子樣本(subpopulation)視為一個個體。同樣,在教育情境中,SUTVA可能更適合以課堂或學校作為分析的樣本,而不是以學生作為分析樣本。在許多經濟實例中,個體之間的相互作用通常通過對市場結構的假設來模擬,同樣避免了SUTVA的無干擾因素。因此,SUTVA只是一個候選的排他性限制,用于模擬在特定試驗中,個體和處理水平之間潛在的復雜交互作用。然而,在許多情境中,SUTVA似乎是首選。

1.7 分配機制

如果我們愿意接受SUTVA,那么我們就可以將復雜的“你”和“我”阿司匹林的示例將簡化為表 0.3所述的情形?,F(xiàn)在你和我每個人都只面臨兩種處理水平(例如,“你”服用阿司匹林和“你”不服用阿司匹林),隨之而來的潛在結果只是我們個人行為的函數(shù)。這很容易擴展到許多個體的情形。為了適應一般化的情形,以及除了是否服用阿司匹林外的其他例子(正如在1.6節(jié)中介紹),我們將用i表示樣本大小為N的個體,取值為,設處理水平的指標(簡稱:處理指標),取值為0(代表控制組,例如,沒有服用阿司匹林)和1(代表處理組,例如,服用了阿司匹林)。每個個體有已實現(xiàn)的(并且可能觀測到的)潛在結果。對于個體,讓表示都已實現(xiàn)的(并且可能觀測到的)結果:

對每個個體,我們還缺少一個潛在的結果,表示為:

許多作者將潛在結果和處理指標替換為簡單的處理指標Wi,和實際觀測的結果。正如我們將在1.9節(jié)中看到的,這種“觀察值”(observed-value)表示法混淆了推斷對象和分配機制,可能導致錯誤。

然而,僅憑這些信息還不能讓我們推斷服用阿司匹林對頭痛的因果效應。假設,在兩人頭痛的示例中,一個人選擇不服用阿司匹林是因為他只有輕微的頭痛。假設,一個小時后兩人的頭痛都已減弱:第一個人的頭痛減弱可能是因為服用阿司匹林(如果沒有服用阿司匹林,頭痛仍會存在);第二個人的頭痛減弱僅僅是因為頭痛不太嚴重(即使沒有阿司匹林頭痛也會減緩)。當比較這兩個觀察到的潛在結果時,我們可能會得出結論,阿司匹林沒有效果,而事實上,阿司匹林可能是緩解更嚴重頭痛的原因。我們缺乏的關鍵信息是每個人如何接受處理/治療水平的:在我們的因果關系語言中,這就是分配機制。

因為因果效應是通過比較潛在因果來定義的(其中一個可以被觀察到),所以無論實際采取的行動如何,都可以很好地定義因果效應。但是,因為我們觀察到最多一半的潛在因果,而且是沒有個體水平下的因果效應,所以在估計因果效應時就存在推論問題。從這個意義上說,正如Rubin(1974)所指出的,因果推斷的問題是一個數(shù)據(jù)缺失問題:給定分配給單個個體的處理水平,則缺少與任何替代處理相關的潛在結果。因此,缺失的數(shù)據(jù),或者正如我們在因果推斷中提到的那樣,分配機制扮演了一個關鍵的角色。如何確定哪些個體得到了哪些處理水平,或者同樣地,哪些潛在結果實現(xiàn)了,哪些沒有?事實上,這一機制對因果推斷問題至關重要,本書的第二到第六部分就是根據(jù)這一機制的不同假設來架構的。

為了闡明分配機制的關鍵作用,考慮表 0.4所示的簡單假設示例。這一例子涉及4個個體(在本例中是患者),以及兩個可能的醫(yī)療程序,分別標記為0(藥物) 和1 (手術)。假設SUTVA成立,表 0.4 揭示了每個患者在每種治療/處理水平下的潛在結果,以治療后的生存年份為依據(jù)。從表 0.4可以看出,平均而言,手術治療比藥物治療會延長2年的壽命,也就是說,在這四個人中,手術對藥物的平均因果效應為2年。

現(xiàn)在假設醫(yī)生通過專業(yè)知識或者魔法,對這些潛在的結果有足夠的了解,因此為每位患者分配對該患者而言更有益的治療。在本例中,病人1和病人3將接受手術,而病人2和病人4將接受藥物治療。觀察到的治療/處理方法和結果如表 0.5所示,其中手術治療的平均觀測結果比藥物治療的平均觀測結果少2年。因此,一個業(yè)余觀察者可能會認為,平均而言,藥物治療優(yōu)于手術。事實上,情況恰恰相反:正如表 0.4所示,如果將藥物治療統(tǒng)一分配給這四名病人,平均存活年限是4年(可從表 0.4中的“Y(0)”一列中看出),而如果所有四名病人均接受手術,那么平均存活年限是6年(可從表 0.4中的“Y(1)”一列中看出)?;诖死覀兛梢钥闯?,我們不能簡單地觀察不同治療方法下潛在結果的實際觀測值,也就是說,而不考慮分配機制,就得出結論。為了得出有效的因果推斷,我們必須考慮為什么有些個體接受一種處理方法而不是另一種。在本書第二至第六部分中,我們將更詳細地討論各種分配機制,以及為得出有效結果推論的相應分析。

未完待續(xù)…

    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多