作者簡(jiǎn)介 臧雷振,中國(guó)農(nóng)業(yè)大學(xué)人文與發(fā)展學(xué)院教授; 滕白瑩,外交學(xué)院外交學(xué)與外事管理系講師; 熊峰,重慶郵電大學(xué)經(jīng)濟(jì)與管理學(xué)院講師。 社會(huì)科學(xué)實(shí)驗(yàn)快速擴(kuò)展,使得不同學(xué)科的相關(guān)研究成果出現(xiàn)井噴態(tài)勢(shì)。本文基于對(duì)社會(huì)科學(xué)實(shí)驗(yàn)方法的發(fā)展源流探索,深入揭示該研究方法發(fā)展脈絡(luò)、應(yīng)用過程、場(chǎng)景及所帶來的社會(huì)科學(xué)學(xué)科發(fā)展影響,進(jìn)而通過比較不同實(shí)驗(yàn)操作技術(shù)和準(zhǔn)實(shí)驗(yàn)分析模型的應(yīng)用,來實(shí)現(xiàn)對(duì)中外社會(huì)科學(xué)實(shí)驗(yàn)方法全面系統(tǒng)的探析,前瞻其發(fā)展趨向,并為進(jìn)一步科學(xué)地應(yīng)用此研究方法奠定學(xué)理基礎(chǔ)。作者初步呈現(xiàn)不同因果推斷方法如DIDD模型,PSM-DID模型、安慰劑檢驗(yàn)、合成控制等回歸結(jié)果的差異性,強(qiáng)調(diào)不同準(zhǔn)實(shí)驗(yàn)?zāi)P驮趯?duì)同一議題探析和同一數(shù)據(jù)挖掘過程中,可能存在相反結(jié)果的空間。這提醒我們,當(dāng)前的量化研究分析中,與其說單一的仰仗實(shí)驗(yàn)方法去探索因果關(guān)系,倒不如說更需要多模型驗(yàn)證。當(dāng)然,本文研究并不試圖挑起定量與定性研究方法的“范式之爭(zhēng)”,或樹立起傳統(tǒng)量化研究和新生量化模型之間的“迭代之爭(zhēng)”,我們更多的是試圖在包容性方法論思維的指引下,來實(shí)現(xiàn)我們研究成果信度和效度的提升,進(jìn)而提升社會(huì)科學(xué)的顯示度,以為社會(huì)經(jīng)濟(jì)政治政策的完善和改良做出更大的貢獻(xiàn)。 一、導(dǎo)語 世間萬物雖處于普遍聯(lián)系之中,但其中最為穩(wěn)定客觀的、不以人的意志為轉(zhuǎn)移、并呈現(xiàn)出時(shí)間維度先后順序的關(guān)聯(lián)則被稱之為因果關(guān)系。因果關(guān)系并非顯而易見的,其時(shí)常若隱若現(xiàn)在事物發(fā)展過程之中。此時(shí),科學(xué)研究的重要目標(biāo)是探析研究對(duì)象中被隱匿的因果關(guān)系,社會(huì)科學(xué)研究同樣如此。對(duì)因果關(guān)系的探索有助于我們認(rèn)知社會(huì)發(fā)展規(guī)律、解釋社會(huì)動(dòng)態(tài)現(xiàn)象和預(yù)見社會(huì)未來趨勢(shì),而實(shí)驗(yàn)方法在因果關(guān)系挖掘中往往被視為核心法寶之一。21世紀(jì)以來社會(huì)科學(xué)實(shí)驗(yàn)方法的應(yīng)用成果前所未有的快速增長(zhǎng),此得益于不同層次或類型實(shí)驗(yàn)數(shù)據(jù)的積累及實(shí)驗(yàn)方法操作的簡(jiǎn)化,以及在研究技術(shù)層面,如雙重差分、斷點(diǎn)回歸、工具變量、傾向值匹配、反事實(shí)、安慰劑效應(yīng)、神經(jīng)網(wǎng)絡(luò)算法、合成控制、機(jī)器學(xué)習(xí)等模型的普及。然而,我們需要注意的是,這些進(jìn)步雖然大大推動(dòng)了實(shí)驗(yàn)方法和因果機(jī)制探索的發(fā)展,但也為研究者囫圇吞棗般的應(yīng)用埋下了伏筆。 作為從其他自然學(xué)科借鑒過來的研究手段,在社會(huì)科學(xué)研究中,學(xué)者往往無法實(shí)現(xiàn)理想中實(shí)驗(yàn)研究方法所要求的對(duì)變量的干預(yù)和操縱、組別之間隨機(jī)分配、穩(wěn)定個(gè)體處理值假設(shè)等。基于研究者(準(zhǔn))干預(yù)的數(shù)據(jù)生成過程在分析中是否具有更高的外部效度,是否能實(shí)現(xiàn)對(duì)社會(huì)現(xiàn)象剖析是“最為接近的真相”,進(jìn)而實(shí)現(xiàn)有效的因果推斷?這些問題迄今依然未得到徹底的解決。特別是由于來自田野、實(shí)驗(yàn)室或網(wǎng)絡(luò)等不同實(shí)驗(yàn)場(chǎng)景,以及將研究者、政策制定者、未諳世事的學(xué)生或普通公民等作為不同層次的實(shí)驗(yàn)參與者而帶來的受試者不遵從行為、測(cè)量扭曲、實(shí)驗(yàn)倫理和結(jié)果可復(fù)制性等問題,進(jìn)一步放大了實(shí)驗(yàn)方法的爭(zhēng)論。 本文基于對(duì)社會(huì)科學(xué)實(shí)驗(yàn)方法的發(fā)展源流探索,深入揭示該研究方法發(fā)展脈絡(luò)、應(yīng)用過程、場(chǎng)景及所帶來的社會(huì)科學(xué)學(xué)科發(fā)展影響,進(jìn)而通過比較不同實(shí)驗(yàn)操作技術(shù)和準(zhǔn)實(shí)驗(yàn)分析模型的應(yīng)用,來實(shí)現(xiàn)對(duì)中外社會(huì)科學(xué)實(shí)驗(yàn)方法全面系統(tǒng)的探析,前瞻其發(fā)展趨勢(shì),并為進(jìn)一步科學(xué)應(yīng)用此研究方法奠定學(xué)理基礎(chǔ)。 二、社會(huì)科學(xué)實(shí)驗(yàn):從學(xué)科方法的借鑒到融合演化 (一)從自然科學(xué)實(shí)驗(yàn)到社會(huì)科學(xué)實(shí)驗(yàn) “實(shí)驗(yàn)”對(duì)我們每一個(gè)人并不陌生,在近現(xiàn)代科學(xué)數(shù)百年的發(fā)展歷程中,建立在“控制—對(duì)照—比較”邏輯上的實(shí)驗(yàn)方法,已經(jīng)衍生出不同類型的實(shí)驗(yàn)方法體系,成為檢驗(yàn)科學(xué)假說,發(fā)現(xiàn)經(jīng)驗(yàn)知識(shí)的主要路徑。但在每一門具體科學(xué)領(lǐng)域采用實(shí)驗(yàn)方法后均獲得長(zhǎng)足進(jìn)步的今天,我們依然面臨無法賦予很多問題精準(zhǔn)而令人信服含義的窘境,依然面臨很多對(duì)事物發(fā)展解讀的困惑。弗朗西斯·培根被馬克思稱為是最早的將實(shí)驗(yàn)方法作為認(rèn)識(shí)客觀世界方法并使之理論化的學(xué)者。培根指出:只有在實(shí)驗(yàn)的基礎(chǔ)上進(jìn)行歸納,才能得出貼近客觀真理的結(jié)論。如果我們將彼此聯(lián)系的概念知識(shí)進(jìn)行歸納、分析與整合,形成邏輯自洽的體系以達(dá)到解決社會(huì)問題目的過程稱之為理論化過程,此時(shí),如何規(guī)范地認(rèn)知和使用實(shí)驗(yàn)方法促使其在理論范式轉(zhuǎn)變與形成過程中發(fā)揮作用、貼近客觀真理則具有重要的意義。 毫無疑問,實(shí)驗(yàn)方法來自于自然科學(xué),其在自然科學(xué)發(fā)展史上具有極其重要的地位,它為基于觀察與經(jīng)驗(yàn)習(xí)得提出的自然科學(xué)理論假說上升成為科學(xué)理論搭建了橋梁,推動(dòng)了近代科學(xué)的產(chǎn)生。自然科學(xué)實(shí)驗(yàn)方法的創(chuàng)立歸功于伽利略,其用實(shí)驗(yàn)方法反駁亞里士多德關(guān)于物質(zhì)運(yùn)動(dòng)的古典思想。雖然這種帶給物理學(xué)以巨大成功的方法在20世紀(jì)初以“量子之謎”的形式令物理學(xué)家們感到困擾,甚至成為現(xiàn)代物理學(xué)的“難言之隱”,但這并不能否認(rèn)實(shí)驗(yàn)方法對(duì)整個(gè)自然科學(xué)發(fā)展的推動(dòng)作用。 所以,長(zhǎng)久以來,實(shí)驗(yàn)方法似乎都是物理學(xué)、化學(xué)或生物學(xué)等自然學(xué)科的專利,實(shí)驗(yàn)方法如何從自然科學(xué)領(lǐng)域逐步過渡到社會(huì)科學(xué)領(lǐng)域呢?社會(huì)科學(xué)研究中,微觀上主體的相互作用生成宏觀的復(fù)雜現(xiàn)象,因此,人類社會(huì)的研究對(duì)象顯著不同于經(jīng)典自然科學(xué)的研究對(duì)象。19 世紀(jì)初,化學(xué)家李比希在城市化和工業(yè)化的時(shí)代背景下率先提出,科學(xué)實(shí)驗(yàn)不應(yīng)局限于實(shí)驗(yàn)室里產(chǎn)生的模型,需要進(jìn)入現(xiàn)實(shí)世界,更多關(guān)注科學(xué)技術(shù)對(duì)真實(shí)世界的作用與影響。20世紀(jì)初期以來,不同學(xué)科研究方法相互借鑒的背景下,社會(huì)科學(xué)開始初步借鑒自然科學(xué)實(shí)驗(yàn)方法。在20世紀(jì)20年代至30年代,現(xiàn)代社會(huì)科學(xué)實(shí)驗(yàn)得到首次亮相,此后,在社會(huì)科學(xué)研究方法自我變革中,如政治學(xué)“行為主義革命”推動(dòng)下,政治學(xué)研究者可以“自由地使用任何其他學(xué)科可以借鑒的方法”,經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、心理學(xué)及統(tǒng)計(jì)學(xué)和應(yīng)用數(shù)學(xué)等多學(xué)科的研究成果都被借用來回答政治學(xué)問題;基于對(duì)特殊政治行為和政治現(xiàn)象進(jìn)行具體分析和實(shí)證研究的需求,學(xué)者在定量分析方法興起過程中也漸漸引入了實(shí)驗(yàn)方法。再到20世紀(jì)70年代,核能、計(jì)算機(jī)、光纖通信、衛(wèi)星通信、轉(zhuǎn)基因等顛覆性技術(shù)得到迅速發(fā)展,由于現(xiàn)代科技的復(fù)雜性、不確定性快速增加,傳統(tǒng)社會(huì)科學(xué)研究中以觀察和思辨為學(xué)科知識(shí)的基礎(chǔ)范式進(jìn)一步受到挑戰(zhàn)。那么,具體而言,實(shí)驗(yàn)方法在被社會(huì)科學(xué)所吸納借鑒之后,其具體是如何完成內(nèi)在的演化和方法體系的擴(kuò)展呢?下一部分將進(jìn)一步分析。 (二)社會(huì)科學(xué)實(shí)驗(yàn)方法的歷史演化 實(shí)驗(yàn)方法具體到社會(huì)科學(xué)的應(yīng)用中,較早被用于研究工業(yè)化大幕拉開的背景下,社會(huì)大眾的心理和行為變化。源自19世紀(jì)開始的快速工業(yè)化沖擊了傳統(tǒng)社會(huì)結(jié)構(gòu),新的工人運(yùn)動(dòng)此起彼伏,如何在工業(yè)社會(huì)中探索個(gè)體或組織的行為特征成為研究的主題。如1924年起,美國(guó)西方電氣公司與美國(guó)國(guó)家研究委員會(huì)協(xié)作,在霍桑工廠開展實(shí)驗(yàn)研究,試圖尋找提升工人效率的方法,即“霍桑實(shí)驗(yàn)”。霍桑實(shí)驗(yàn)雖然并未驗(yàn)證實(shí)驗(yàn)設(shè)計(jì)中的假設(shè),但卻發(fā)現(xiàn)受試者對(duì)于新的實(shí)驗(yàn)處理會(huì)產(chǎn)生正向反應(yīng),即行為的改變是由于環(huán)境改變而非由于實(shí)驗(yàn)干預(yù)造成的,這一發(fā)現(xiàn)為科學(xué)管理提供了重要的理論指導(dǎo)。政治學(xué)領(lǐng)域的實(shí)驗(yàn)方法運(yùn)用于以下幾個(gè)方面,如1926年的投票實(shí)驗(yàn)。1935年,美國(guó)學(xué)者喬治· 哈特曼在賓夕法尼亞州的艾倫敦通過散發(fā)傳單的方式,開展對(duì)照實(shí)驗(yàn)分析選民的投票行為。也有學(xué)者1953年于美國(guó)密歇根地區(qū)開展的溝通方式如何影響投票的試驗(yàn),其他研究應(yīng)用議題還包括政治精英分析、政治態(tài)度和心理分析等。 到20世紀(jì)60年代,全球經(jīng)濟(jì)高速發(fā)展過程中出現(xiàn)了不同程度的兩極分化、環(huán)境惡化、種族沖突等社會(huì)問題,在此背景下,美國(guó)推出了“偉大社會(huì)”改革計(jì)劃,側(cè)重在民權(quán)、反貧困、健康醫(yī)療、教育、城市治理、環(huán)境和生活質(zhì)量等領(lǐng)域的社會(huì)改革??藏悹柕热藢ⅰ皞ゴ笊鐣?huì)”改革與新的科學(xué)認(rèn)識(shí)論結(jié)合在一起,提出通過“實(shí)驗(yàn)學(xué)習(xí)”策略,將政策本身作為一種實(shí)驗(yàn)干預(yù)施加于社會(huì),并基于對(duì)就業(yè)計(jì)劃、電價(jià)和住房補(bǔ)貼等政策效果的評(píng)估,在“遞歸學(xué)習(xí)”的過程中獲取知識(shí)和經(jīng)驗(yàn)。 20世紀(jì)80年代,如前文所述,現(xiàn)代技術(shù)創(chuàng)新和復(fù)雜性科學(xué)運(yùn)動(dòng)興起帶來了重要影響,為社會(huì)科學(xué)研究開辟了新的路徑,特別是基于數(shù)據(jù)分析和計(jì)算的技術(shù)工具應(yīng)用極大地?cái)U(kuò)大了實(shí)驗(yàn)研究的規(guī)模。由于傳統(tǒng)的社會(huì)科學(xué)實(shí)證研究方法,只能適用于簡(jiǎn)單系統(tǒng),而社會(huì)科學(xué)研究對(duì)象的復(fù)雜本質(zhì)與復(fù)雜特征以及傳統(tǒng)研究方法的局限性,使學(xué)者認(rèn)識(shí)到必須提出新方法來研究社會(huì)復(fù)雜系統(tǒng)。 20世紀(jì)90年代以后,特別是新世紀(jì)以來,隨著信息社會(huì)的全方位到來,許多社會(huì)實(shí)驗(yàn)的技術(shù)問題可以通過計(jì)算機(jī)和互聯(lián)網(wǎng)來解決,加之日益突出的社會(huì)問題并未得到根本性改變,近十幾年來全球開始不斷涌現(xiàn)社會(huì)實(shí)驗(yàn)室嘗試去解決最棘手的社會(huì)科學(xué)問題。還有學(xué)者基于對(duì)切爾諾貝利核事故的觀察,提出了“技術(shù)社會(huì)實(shí)驗(yàn)”這一研究進(jìn)路,擴(kuò)大了社會(huì)科學(xué)實(shí)驗(yàn)范疇。如將切爾諾貝利核事故視為實(shí)驗(yàn)研究中的干預(yù),而處于切爾諾貝利核事故受影響區(qū)域的德國(guó)政府部門、科學(xué)家、社會(huì)公眾作為受試者,在這一自然實(shí)驗(yàn)場(chǎng)景下,能夠直接測(cè)量出重大社會(huì)事故對(duì)受試者的認(rèn)知、態(tài)度和對(duì)政府信任的影響變化,此類研究讓學(xué)者進(jìn)一步看到社會(huì)科學(xué)研究實(shí)驗(yàn)方法的價(jià)值,其為應(yīng)對(duì)現(xiàn)代科技發(fā)展帶來的復(fù)雜問題提供了測(cè)量手段。 當(dāng)然,有學(xué)者指出,1990年以后實(shí)驗(yàn)方法運(yùn)用迅速增加的主要原因是廉價(jià)的、可編程計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展。通過實(shí)驗(yàn)室及互聯(lián)網(wǎng)輔助,可能的實(shí)驗(yàn)設(shè)計(jì)數(shù)量遠(yuǎn)遠(yuǎn)超過了研究者可人工操作的數(shù)量。計(jì)算機(jī)技術(shù)還大大增強(qiáng)了研究者參與調(diào)查實(shí)驗(yàn)的能力,以及處理田野實(shí)驗(yàn)和自然實(shí)驗(yàn)中的統(tǒng)計(jì)及其他方法論問題的能力。技術(shù)發(fā)展將社會(huì)科學(xué)轉(zhuǎn)變?yōu)橐婚T實(shí)驗(yàn)科學(xué),進(jìn)而逐漸形成社會(huì)數(shù)據(jù)計(jì)算、社會(huì)模擬和互聯(lián)網(wǎng)社會(huì)科學(xué)實(shí)驗(yàn)三大方法。這一點(diǎn)在新世紀(jì)以來的大數(shù)據(jù)應(yīng)用中體現(xiàn)得尤為明顯。 三、社會(huì)科學(xué)實(shí)驗(yàn)的操作及其類型 (一)社會(huì)科學(xué)實(shí)驗(yàn)操作 社會(huì)科學(xué)實(shí)驗(yàn)研究中,實(shí)驗(yàn)?zāi)康氖翘剿髯宰兞繉?duì)因變量穩(wěn)定的影響機(jī)制,因果關(guān)系的界定需要比較在兩個(gè)平行世界,即某一個(gè)體接受實(shí)驗(yàn)干預(yù)與其沒有接受干預(yù)情況下的差異。同時(shí),社會(huì)科學(xué)中因變量通常是個(gè)體或群體的價(jià)值、偏好、態(tài)度、意識(shí)和行為,具有一定的復(fù)雜性,因此,必須經(jīng)過嚴(yán)格定義和可操作化處理,來對(duì)研究對(duì)象進(jìn)行隨機(jī)分配和干預(yù),實(shí)現(xiàn)對(duì)實(shí)驗(yàn)對(duì)象的有效控制,為前測(cè)、后測(cè)以及不同組間的可比性提供可能,便于得到可信度較高的研究結(jié)果。 此時(shí),為了使自變量對(duì)因變量的影響可視化,研究者就需設(shè)置一種無干預(yù)或其他干預(yù)的基準(zhǔn)對(duì)照組,也就是控制組,觀察在沒有特定干預(yù)條件或其他干預(yù)條件影響下因變量的狀態(tài),而存在自變量干預(yù)影響的一組叫做實(shí)驗(yàn)組。當(dāng)然,實(shí)驗(yàn)組和控制組內(nèi)的實(shí)驗(yàn)對(duì)象在實(shí)驗(yàn)開始前各方面狀況幾乎無區(qū)別,進(jìn)而通過對(duì)比控制組和實(shí)驗(yàn)組的差異,才可以確定自變量是否真正產(chǎn)生了影響及其影響程度,消除無關(guān)因素的影響。此過程還需要對(duì)研究對(duì)象進(jìn)行隨機(jī)分組,多數(shù)非實(shí)驗(yàn)研究者認(rèn)為隨機(jī)分配是實(shí)驗(yàn)研究者處理不可觀測(cè)變量的主要途徑。當(dāng)然,隨機(jī)分配也有賴于實(shí)驗(yàn)中實(shí)施機(jī)構(gòu)和實(shí)驗(yàn)人員的密切配合,如果實(shí)驗(yàn)對(duì)象隨機(jī)分配,實(shí)驗(yàn)研究者就能在統(tǒng)計(jì)學(xué)范圍內(nèi)消除一些影響他們期望觀察(或未觀察)到效果的外部因素,如選民行為中選民認(rèn)知能力、性別差異等。正因如此,實(shí)驗(yàn)主義研究者通常試著盡可能地隨機(jī)分配操作,而當(dāng)隨機(jī)分配不完善時(shí)使用統(tǒng)計(jì)學(xué)技巧來解釋不受控制的可觀測(cè)變量。 為了確定自變量對(duì)因變量的影響程度,即確定因變量在實(shí)驗(yàn)前后的變化程度,需要用合理的手段將影響效果量化。此時(shí),實(shí)驗(yàn)前對(duì)實(shí)驗(yàn)對(duì)象的測(cè)量稱為前測(cè),而實(shí)驗(yàn)后的測(cè)量稱之為后測(cè)。但是為了規(guī)避實(shí)驗(yàn)對(duì)象對(duì)實(shí)驗(yàn)前后同樣的測(cè)量問題有不同的熟悉程度,從而在后測(cè)中作出不真實(shí)的回答,在一些實(shí)驗(yàn)設(shè)計(jì)中僅有前測(cè)或后測(cè)。社會(huì)科學(xué)實(shí)驗(yàn)測(cè)量中,問卷和量表是常用的工具。 當(dāng)然,我們需要認(rèn)識(shí)到,社會(huì)科學(xué)中沒有完美或真正的實(shí)驗(yàn)。實(shí)驗(yàn)設(shè)計(jì)是否合適取決于研究問題和研究對(duì)象,實(shí)際上,不同的觀測(cè)數(shù)據(jù)有多種可能的實(shí)驗(yàn)設(shè)計(jì)和實(shí)驗(yàn)干預(yù)組合,在某種程度上實(shí)驗(yàn)研究的可能性要大于觀測(cè)數(shù)據(jù)的可能性。 (二)社會(huì)科學(xué)實(shí)驗(yàn)類型 目前社會(huì)科學(xué)研究中被廣泛使用的實(shí)驗(yàn)類別主要是:實(shí)驗(yàn)室實(shí)驗(yàn)、實(shí)地(田野、現(xiàn)場(chǎng))實(shí)驗(yàn)、調(diào)查實(shí)驗(yàn)和準(zhǔn)實(shí)驗(yàn)。 實(shí)驗(yàn)室實(shí)驗(yàn)是指在室內(nèi)通過嚴(yán)格的條件控制來考察變量之間的關(guān)系,但社會(huì)科學(xué)領(lǐng)域中實(shí)驗(yàn)室實(shí)驗(yàn)是否有效,其經(jīng)過了較長(zhǎng)時(shí)間的認(rèn)同過程,在實(shí)驗(yàn)開展過程中,人們往往會(huì)質(zhì)疑:如該類型實(shí)驗(yàn)是否具有較高的外部效度?特別是由于“在實(shí)驗(yàn)室發(fā)生”這一物理場(chǎng)景可能不具有真實(shí)世界的相似性,其僅僅是研究者主觀創(chuàng)造出來的實(shí)驗(yàn)情境,同時(shí)實(shí)驗(yàn)參與人群往往以未諳世事的學(xué)生為主。這就導(dǎo)致具有人工色彩的實(shí)驗(yàn)室環(huán)境得出的結(jié)論無法外推到更廣闊、更復(fù)雜的社會(huì)環(huán)境中,所以,有學(xué)者認(rèn)為雖然實(shí)驗(yàn)室有助于排除外界干擾,但就檢驗(yàn)因果關(guān)系的實(shí)驗(yàn)方法而言,實(shí)驗(yàn)室實(shí)驗(yàn)最適合的是對(duì)理論的檢驗(yàn)而并非對(duì)現(xiàn)實(shí)的推廣。當(dāng)然,還要考慮到實(shí)驗(yàn)室的被試者可能由于知道自己處于參與實(shí)驗(yàn)狀態(tài),會(huì)進(jìn)而導(dǎo)致其真實(shí)行為偏差,以及面臨各類不同的倫理問題。但同時(shí),實(shí)驗(yàn)室的優(yōu)勢(shì)則體現(xiàn)在其可以實(shí)現(xiàn)更好的控制,有利于實(shí)驗(yàn)開展,甚至還可以采用復(fù)雜的設(shè)備如功能磁共振成像來測(cè)量實(shí)驗(yàn)對(duì)象進(jìn)行選擇時(shí)的腦部活動(dòng)。近年來,為了解決實(shí)驗(yàn)室實(shí)驗(yàn)面臨的不足,借助虛擬現(xiàn)實(shí)技術(shù),越來越多的以沉浸式虛擬現(xiàn)實(shí)為基礎(chǔ)的實(shí)驗(yàn)手段開始受到學(xué)者的關(guān)注。 實(shí)地實(shí)驗(yàn)將隨機(jī)化原則與田野工作的基本理念結(jié)合起來,其在研究對(duì)象的日常環(huán)境中進(jìn)行,通過隨機(jī)分配現(xiàn)實(shí)中的被試對(duì)象 (包括個(gè)人、家庭、機(jī)構(gòu)、村莊、社區(qū)、地區(qū)等不同單位),在真實(shí)的社會(huì)經(jīng)濟(jì)環(huán)境下,使用真實(shí)的干預(yù)手段,具有更高的外在效度和解釋力。由此協(xié)調(diào)了控制混雜因素以及可能介入并影響干預(yù)效果的可觀測(cè)或不可觀測(cè)變量。實(shí)地實(shí)驗(yàn)?zāi)軌蚪o出實(shí)驗(yàn)室難以模擬的特定情景,使得其頗具吸引力,目前在經(jīng)濟(jì)學(xué)等研究中被廣泛使用,并逐步影響到政治學(xué)、管理學(xué)、傳播學(xué)、教育學(xué)、社會(huì)學(xué)等學(xué)科的研究。特別是西方選舉年中,不同的選舉動(dòng)員方式和競(jìng)選測(cè)量對(duì)投票率的影響如何,此類問題的研究常常采用實(shí)地實(shí)驗(yàn)。近年來,中國(guó)學(xué)者通過實(shí)地實(shí)驗(yàn),在高校專項(xiàng)招考計(jì)劃實(shí)施背景下,探究該政策對(duì)邊遠(yuǎn)、貧困、民族等地區(qū)農(nóng)村學(xué)生選擇大學(xué)的影響與機(jī)制?;蛟诿撠毠?jiān)的背景下,從貧困農(nóng)戶風(fēng)險(xiǎn)偏好態(tài)度的影響因素入手對(duì)“窮人思維”進(jìn)行解讀。以及分析父母雙方均外出的留守兒童與非留守兒童在公平感和幸福度上的差異。當(dāng)然,實(shí)驗(yàn)室實(shí)驗(yàn)與實(shí)地實(shí)驗(yàn)的主要區(qū)別就體現(xiàn)在研究對(duì)象、開展實(shí)驗(yàn)的背景、實(shí)驗(yàn)過程和結(jié)果測(cè)量方法等方面,而這些區(qū)別使得實(shí)地實(shí)驗(yàn)擁有與實(shí)驗(yàn)室實(shí)驗(yàn)不同的新的特點(diǎn)。從實(shí)驗(yàn)背景上來看,實(shí)驗(yàn)室實(shí)驗(yàn)通常會(huì)因?yàn)閯?chuàng)造極端環(huán)境而犧牲社會(huì)情境的真實(shí)性,而實(shí)地實(shí)驗(yàn)則在包含隨機(jī)機(jī)制的基礎(chǔ)上盡可能接近地模擬一個(gè)因果過程發(fā)生的條件,力求保證其物理環(huán)境和研究情境的真實(shí)性,其目的是增強(qiáng)實(shí)驗(yàn)結(jié)果的可推廣性,而從過程和結(jié)果來看,實(shí)地實(shí)驗(yàn)更容易得到研究對(duì)象之間穩(wěn)定的“長(zhǎng)期效應(yīng)”。但也不可否認(rèn)的是,實(shí)地實(shí)驗(yàn)所需要花費(fèi)的成本更加高昂,特別是實(shí)地試驗(yàn)中研究者常面臨的參與者不服從、樣本污染或中途退出的挑戰(zhàn)相比實(shí)驗(yàn)室實(shí)驗(yàn)更頻繁,這就喪失了對(duì)變量和實(shí)驗(yàn)環(huán)境的精準(zhǔn)控制,不能更好地分離出研究者所感興趣的因果關(guān)系,這也使得它的可復(fù)制性以及對(duì)理論的區(qū)分能力較弱。近年來,隨著互聯(lián)網(wǎng)的興起,學(xué)者還將實(shí)地實(shí)驗(yàn)搬到了網(wǎng)上并將其稱之為在線實(shí)地實(shí)驗(yàn),以區(qū)別于傳統(tǒng)的基于實(shí)驗(yàn)室的實(shí)驗(yàn)設(shè)計(jì)。當(dāng)然,為了避免實(shí)地實(shí)驗(yàn)帶來的倫理問題,研究者也樂于使用項(xiàng)目評(píng)估的方式來替代早期粗放式的實(shí)驗(yàn)比較。 準(zhǔn)實(shí)驗(yàn)因其手段的相對(duì)簡(jiǎn)易而獲得各個(gè)領(lǐng)域的廣泛應(yīng)用,但準(zhǔn)實(shí)驗(yàn)很多時(shí)候又與實(shí)地試驗(yàn)糾纏不清。準(zhǔn)實(shí)驗(yàn)通常是指研究者對(duì)研究對(duì)象施加的某種刺激并不是由研究者本身主觀產(chǎn)生并親自操作的,嚴(yán)格來說它只是借用了客觀世界已經(jīng)發(fā)生的干預(yù)來進(jìn)行觀察,更多是借助量化模型的創(chuàng)新來建構(gòu)實(shí)驗(yàn)對(duì)比。如比較個(gè)案研究就可以看做是一種較典型的準(zhǔn)實(shí)驗(yàn)做法,從事個(gè)案研究的工作者通常采用“求同法”和“求異法”的方法來進(jìn)行理論結(jié)構(gòu)。在對(duì)所得數(shù)據(jù)的處理方法上,這種做法只需要從現(xiàn)實(shí)社會(huì)中挑選具有可比性的案例就可以研究,成本低,操作過程簡(jiǎn)單,因而備受青睞;但它所存在的問題也是不可忽視的——準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)利用原始組進(jìn)行研究,缺少隨機(jī)分配,無法證明實(shí)驗(yàn)組是否為較大群體的隨機(jī)樣本,同時(shí)任何因素都可能對(duì)原始群體起作用,所以因被試挑選帶來的偏差將損害研究結(jié)果的可推廣性。 調(diào)查實(shí)驗(yàn)法是針對(duì)傳統(tǒng)大規(guī)模社會(huì)調(diào)查方法和實(shí)驗(yàn)方法的一種折合,在大規(guī)模問卷調(diào)查中嵌入實(shí)驗(yàn),將干預(yù)包含在常規(guī)的調(diào)查問卷中。該方法強(qiáng)調(diào)社會(huì)調(diào)查中的樣本隨機(jī)選取和實(shí)驗(yàn)分組設(shè)計(jì)中的樣本隨機(jī)分配。近年來,調(diào)查實(shí)驗(yàn)被廣泛應(yīng)用于各類特色的研究之中。如基于 “助推”思想,通過兩個(gè)調(diào)查實(shí)驗(yàn),探索信息框架(包括政策框架與新聞框架)對(duì)于生育意愿的助推機(jī)制,或在調(diào)查實(shí)驗(yàn)數(shù)據(jù)獲取基礎(chǔ)上,探究在PPP改革項(xiàng)目中不同治理主體對(duì)環(huán)境治理評(píng)價(jià)的影響,進(jìn)而驗(yàn)證治理主體影響公眾評(píng)價(jià)環(huán)境治理效果的中介機(jī)制。目前,在計(jì)算機(jī)輔助調(diào)查的支持下,隨機(jī)回答、列舉實(shí)驗(yàn)和支持實(shí)驗(yàn)等正在被廣泛使用在調(diào)查實(shí)驗(yàn)中。雖然調(diào)查實(shí)驗(yàn)簡(jiǎn)單易操作,但由于實(shí)驗(yàn)干預(yù)經(jīng)常難以根據(jù)研究對(duì)象的現(xiàn)實(shí)生活經(jīng)驗(yàn)來賦值,而這又可能會(huì)影響實(shí)驗(yàn)中所觀察到的干預(yù)效應(yīng)的因素。目前,越來越多的調(diào)查實(shí)驗(yàn)還被用來進(jìn)行問卷質(zhì)量測(cè)試。如在調(diào)查實(shí)驗(yàn)中設(shè)置“紅色鯡魚”問題,即陷阱題或注意力篩選題,通過在問卷調(diào)查中穿插“紅色鯡魚”問題,識(shí)別出不專心者,研究他們的特征。研究發(fā)現(xiàn)在問卷調(diào)查中不專心者比例為36%,這種不專心不僅僅是來自對(duì)政治事件的不感興趣,更可能來源于他們本身的逃避心理,他們只想快速地完成問卷,且這種注意力不集中的發(fā)生并不是完全隨機(jī)的,此時(shí)應(yīng)答者的答題速度更快,更愿意給出“不知道”的回答。此外,調(diào)查實(shí)驗(yàn)也在逐漸的改進(jìn)具體的實(shí)驗(yàn)效度和信度。如調(diào)查問卷中的列舉實(shí)驗(yàn),其對(duì)照組項(xiàng)目數(shù)(j)比實(shí)驗(yàn)組項(xiàng)目數(shù)(j 1)往往設(shè)置的要少,實(shí)驗(yàn)組的平均數(shù)可能僅僅因?yàn)轫?xiàng)目數(shù)多而機(jī)械性地膨脹,不能夠非常明確地得出由于敏感信息帶來的均值膨脹。比較新穎的解決辦法:如在對(duì)照組中多加上一個(gè)必要的假安慰劑項(xiàng)目來平衡列表長(zhǎng)度,這個(gè)安慰劑項(xiàng)目必須是合理的但對(duì)于所有受訪者來說都是假的。這些最新研究進(jìn)展正在逐步改進(jìn)調(diào)查實(shí)驗(yàn)的不足。本文將不同類型的實(shí)驗(yàn)方法在不同維度的比較結(jié)果呈現(xiàn)在表(1)中。 四、實(shí)驗(yàn)方法在社會(huì)科學(xué)中的多學(xué)科應(yīng)用 當(dāng)前,實(shí)驗(yàn)研究方法正在社會(huì)科學(xué)中得到廣泛的使用,但由于不同學(xué)科研究對(duì)象、研究主題和研究?jī)?nèi)容的差異,也使得實(shí)驗(yàn)在應(yīng)用過程中各具特色。下文主要從政治學(xué)、經(jīng)濟(jì)學(xué)、管理學(xué)和社會(huì)學(xué)等角度來呈現(xiàn)實(shí)驗(yàn)方法的應(yīng)用特征。 (一)政治學(xué)研究中的實(shí)驗(yàn)方法 政治學(xué)研究過程中,始終存在著探索因果機(jī)制的困境,隨著研究的不斷深入,政治心理學(xué)、政治生物學(xué)等新的研究主題不斷涌現(xiàn),經(jīng)濟(jì)學(xué)、心理學(xué)、統(tǒng)計(jì)學(xué)等領(lǐng)域發(fā)揮重要作用的實(shí)驗(yàn)方法開始被政治學(xué)者所注意,但在20世紀(jì),政治實(shí)驗(yàn)方法的開展并不多見,如1950-1992年間僅有將近60篇實(shí)驗(yàn)類研究文章發(fā)表在政治學(xué)頂級(jí)期刊。 20世紀(jì)50年代后,行為主義革命的興起實(shí)質(zhì)性推動(dòng)了實(shí)驗(yàn)方法的開展。如1957年,熱衷于用實(shí)驗(yàn)方法研究博弈理論的期刊《沖突解決雜志》創(chuàng)建,隨后著名的政治學(xué)家利普哈特指出“就科學(xué)解釋而言,實(shí)驗(yàn)方法幾乎是最理想的方法,但遺憾的是,由于實(shí)踐和倫理上的阻礙,這種方法在政治學(xué)中很少被運(yùn)用”,從而肯定了實(shí)驗(yàn)方法在政治學(xué)研究中的地位。之后,政治經(jīng)濟(jì)學(xué)家進(jìn)行實(shí)驗(yàn)研究的相關(guān)成果如雨后春筍般出現(xiàn),紐約大學(xué)石溪分校的政治心理實(shí)驗(yàn)室、耶魯大學(xué)媒體對(duì)社會(huì)輿論影響的相關(guān)實(shí)驗(yàn)、密歇根大學(xué)政治心理實(shí)驗(yàn)項(xiàng)目、加州大學(xué)洛杉磯分校的政治心理實(shí)驗(yàn)項(xiàng)目等紛紛成立或開展,加州理工學(xué)院也在這一時(shí)期建立了世界上第一個(gè)政治科學(xué)與經(jīng)濟(jì)學(xué)研究的實(shí)驗(yàn)室,許多實(shí)驗(yàn)政治學(xué)的研究者們?cè)诖说玫脚嘤?xùn)。 20世紀(jì)末以來,伴隨實(shí)驗(yàn)方法的簡(jiǎn)化,政治學(xué)領(lǐng)域的實(shí)驗(yàn)研究迅速在政治學(xué)二級(jí)學(xué)科中擴(kuò)散。如在國(guó)內(nèi)這類研究中,通過實(shí)地實(shí)驗(yàn),有學(xué)者測(cè)試了選舉日歷對(duì)地方經(jīng)濟(jì)發(fā)展政策的影響,即探討選舉時(shí)機(jī)、地方政治機(jī)構(gòu)和政黨結(jié)構(gòu)如何影響地方政府向外部公司提供投資激勵(lì)?;谧匀粚?shí)驗(yàn),學(xué)者考察游說和政黨影響力對(duì)公民投票偏好形成的作用機(jī)制。在比較政治學(xué)研究中,還可以通過調(diào)查實(shí)驗(yàn)來界定公民政治行為的影響因素。以及在性別政治中,討論性別在日常政治實(shí)踐中所帶來的政治結(jié)果。這類研究進(jìn)一步擴(kuò)充了研究議題,開拓了實(shí)驗(yàn)方法在政治學(xué)研究中的設(shè)計(jì)思路。 目前,學(xué)者指出:基因?qū)φ稳∠虻谋磉_(dá)至關(guān)重要。研究者開始利用基因相關(guān)數(shù)據(jù)和模型來衡量生物因素對(duì)社會(huì)和政治行為影響的大小和屬性。隨著越來越多的基因假設(shè)被研究所測(cè)驗(yàn),已有研究成果能夠?qū)碓从陔p胞胎和親屬的數(shù)據(jù)和個(gè)體的政治偏好、政治意識(shí)形態(tài)聯(lián)系起來。政治學(xué)家意識(shí)到生物因素對(duì)政治行為、認(rèn)知和態(tài)度的重要影響,利用生物遺傳理論和雙生子數(shù)據(jù)的實(shí)驗(yàn)方法測(cè)量就顯得尤為必要。經(jīng)典的雙生子設(shè)計(jì)就是當(dāng)前最流行的對(duì)社會(huì)行為和政治行為進(jìn)行初步檢測(cè)的一種實(shí)驗(yàn)設(shè)計(jì)。 (二)經(jīng)濟(jì)學(xué)研究中的實(shí)驗(yàn)方法 傳統(tǒng)經(jīng)濟(jì)學(xué)中將人視作理性人,每個(gè)人都會(huì)在深思熟慮和理性決策下做出對(duì)自己有利的最優(yōu)解,在此認(rèn)識(shí)論上衍生出的期望效用、一般均衡理論等構(gòu)成經(jīng)濟(jì)學(xué)的理論基石;而進(jìn)入20世紀(jì)后,社會(huì)真實(shí)案例和實(shí)驗(yàn)結(jié)果表明,人不僅是理性人,還是社會(huì)人,這決定了人們?cè)谡鎸?shí)的社會(huì)環(huán)境中并不一定完全遵循理性和利益最大化原則行事,相反,很多時(shí)候他們寧愿通過放棄一些自己的權(quán)利以獲得其在社會(huì)生活其他范圍的滿意程度。如“囚徒兩難”困境就是博弈論實(shí)驗(yàn)的經(jīng)典代表,其展現(xiàn)出人的偏好選擇背后的復(fù)雜動(dòng)機(jī),而這恰恰是傳統(tǒng)經(jīng)濟(jì)學(xué)所忽略的。 到20世紀(jì)早期,《博弈論與經(jīng)濟(jì)行為》的出版呈現(xiàn)出實(shí)驗(yàn)方法對(duì)經(jīng)濟(jì)研究的重要性,20世紀(jì)60年代,如1962年弗農(nóng)發(fā)表實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的奠基之作,標(biāo)志實(shí)驗(yàn)方法在主流經(jīng)濟(jì)學(xué)領(lǐng)域確立自己的獨(dú)立地位,同時(shí)期的壟斷競(jìng)爭(zhēng)理論的實(shí)驗(yàn)中,設(shè)計(jì)的“雙向拍賣”制度環(huán)境的實(shí)驗(yàn),為市場(chǎng)實(shí)現(xiàn)供需競(jìng)爭(zhēng)均衡的趨向性提供了新的思路;部分學(xué)者還加強(qiáng)實(shí)驗(yàn)經(jīng)濟(jì)學(xué)這一新生學(xué)科領(lǐng)域的人才培養(yǎng)和學(xué)術(shù)交流,他們將對(duì)實(shí)驗(yàn)經(jīng)濟(jì)學(xué)感興趣的研究者集聚到一起,通過研討會(huì),學(xué)術(shù)團(tuán)體的平臺(tái)強(qiáng)化了實(shí)驗(yàn)法研究者的聯(lián)系和交流,擴(kuò)大了實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的影響力。 20世紀(jì)70到80年代之間,通過一系列經(jīng)濟(jì)學(xué)者的努力,包括嘗試與其他學(xué)科交叉和改進(jìn)實(shí)驗(yàn)對(duì)象,實(shí)驗(yàn)經(jīng)濟(jì)學(xué)領(lǐng)域產(chǎn)生了一些豐富而有趣的理論成果。如在政治學(xué)和經(jīng)濟(jì)學(xué)領(lǐng)域的融合中,學(xué)者發(fā)現(xiàn)實(shí)驗(yàn)方法在產(chǎn)業(yè)組織理論探索中的運(yùn)用能夠很好地解釋行為假設(shè),進(jìn)行理論檢驗(yàn)并提煉出規(guī)則經(jīng)驗(yàn);在和心理學(xué)的融合中,學(xué)者進(jìn)一步完善了經(jīng)濟(jì)學(xué)的博弈論問題。在經(jīng)濟(jì)學(xué)與公共管理研究的融合之中,學(xué)者通過實(shí)驗(yàn)發(fā)現(xiàn)了公共產(chǎn)品供給實(shí)驗(yàn)中有關(guān)自愿捐助機(jī)制的研究,實(shí)驗(yàn)結(jié)果幾乎完全支持在公共產(chǎn)品領(lǐng)域出現(xiàn)的“搭便車”現(xiàn)象,且所得出的結(jié)論與其他經(jīng)濟(jì)學(xué)家產(chǎn)生了較大的差異。這進(jìn)一步拓展了經(jīng)濟(jì)學(xué)知識(shí)的疆域和邊界。 1990年代中期《實(shí)驗(yàn)經(jīng)濟(jì)學(xué)手冊(cè)》的出版進(jìn)一步擴(kuò)大實(shí)驗(yàn)方法的影響,再到弗農(nóng)由于其實(shí)驗(yàn)經(jīng)濟(jì)學(xué)研究成就獲得2002年諾貝爾獎(jiǎng),使得實(shí)驗(yàn)方法徹底在經(jīng)濟(jì)學(xué)領(lǐng)域大放異彩。 新世紀(jì)以來,理查德·塞勒因行為經(jīng)濟(jì)學(xué)領(lǐng)域的杰出貢獻(xiàn)而榮獲2017年度諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。他基于經(jīng)濟(jì)學(xué)實(shí)驗(yàn), 彌補(bǔ)了傳統(tǒng)經(jīng)濟(jì)學(xué)“理性人”假設(shè)的缺陷,解決了完全理性假設(shè)下的'經(jīng)濟(jì)人'與有限理性假設(shè)下的'社會(huì)人'之爭(zhēng),這些研究進(jìn)一步展現(xiàn)出實(shí)驗(yàn)方法在稟賦效應(yīng)、心理賬戶和社會(huì)偏好研究中的優(yōu)勢(shì),隨后,阿比吉特·班納吉、埃絲特·迪弗洛和邁克爾·克雷默三位經(jīng)濟(jì)學(xué)家從實(shí)地實(shí)驗(yàn)方法出發(fā),探索全球減貧問題,而被授予2019年度諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。這進(jìn)一步擴(kuò)大了實(shí)驗(yàn)方法的研究影響力。與政治學(xué)一樣,近年來基因經(jīng)濟(jì)學(xué)也受到廣泛的關(guān)注,強(qiáng)調(diào)分析個(gè)體的遺傳稟賦和環(huán)境對(duì)其經(jīng)濟(jì)行為、風(fēng)險(xiǎn)偏好影響的相對(duì)貢獻(xiàn)。 (三)管理學(xué)與社會(huì)學(xué)中的實(shí)驗(yàn)方法 在管理學(xué)領(lǐng)域,從20世紀(jì)30年代的霍桑實(shí)驗(yàn),使得管理走向科學(xué),到勒溫的“領(lǐng)導(dǎo)模式實(shí)驗(yàn)”,再到21世紀(jì)奧斯特羅姆獲得諾貝爾獎(jiǎng)以表彰她為實(shí)驗(yàn)方法擴(kuò)展在公共政策分析中的貢獻(xiàn),同樣表明實(shí)驗(yàn)方法在公共管理學(xué)科取得了成功。特別是由于經(jīng)濟(jì)學(xué)、心理學(xué)和管理學(xué)緊密相連,受經(jīng)濟(jì)學(xué)領(lǐng)域?qū)嶒?yàn)方法主導(dǎo)的研究成果不斷獲得諾貝爾獎(jiǎng)的激勵(lì)下,學(xué)者也開始逐漸探索管理研究中的實(shí)驗(yàn)方法應(yīng)用價(jià)值。如基于調(diào)查實(shí)驗(yàn),探索各種對(duì)高速公路服務(wù)的滿意度;或在調(diào)查實(shí)驗(yàn)的基礎(chǔ)上,考察公共決策透明(過程透明和內(nèi)容透明)與社會(huì)許可之間的因果關(guān)系,以更好地理解公共決策的社會(huì)許可機(jī)制;從國(guó)際比較來看,實(shí)驗(yàn)方法在公共管理研究中還缺乏統(tǒng)一的規(guī)范,阻礙了實(shí)驗(yàn)研究的交流效率和交流效果。當(dāng)然,也有學(xué)者從技術(shù)層面指出:實(shí)驗(yàn)方法在公共管理研究中應(yīng)用的成功與否,取決于實(shí)驗(yàn)設(shè)計(jì)的“內(nèi)在有效性”和“外在有效性”。但不得不說的是,奧斯特羅姆基于公共資源分配機(jī)制而獲得諾貝爾獎(jiǎng),擴(kuò)大了此研究方法在管理科學(xué)中的擴(kuò)散。 在社會(huì)學(xué)研究中,從奧古斯特·孔德最初將社會(huì)學(xué)命名為“社會(huì)物理學(xué)”,就可以看出其對(duì)社會(huì)研究中實(shí)證方法的重視,隨后,杜克海姆在實(shí)證研究中強(qiáng)調(diào)“受控比較法”,實(shí)質(zhì)上呈現(xiàn)出來的是一種“間接的實(shí)驗(yàn)方法”?,F(xiàn)代社會(huì)學(xué),同樣在統(tǒng)計(jì)技術(shù)和互聯(lián)網(wǎng)的影響下,開始不斷采用實(shí)驗(yàn)方法且研究成果眾多,限于篇幅,本文不對(duì)其過多闡述。 表2中更簡(jiǎn)潔呈現(xiàn)不同學(xué)科實(shí)驗(yàn)方法的應(yīng)用發(fā)展脈絡(luò),由此可見,雖然不同學(xué)科的實(shí)驗(yàn)研究方法都經(jīng)歷過起步階段,發(fā)展階段、蓬勃階段和迅速推廣階段,但學(xué)科之間依然存在時(shí)間維度的差異和研究選題差異。這一方面既是由于不同學(xué)科關(guān)注焦點(diǎn)的自身特征決定的,另一方面,也體現(xiàn)出不同學(xué)科在20世紀(jì)以來對(duì)其他不同學(xué)科的交叉借鑒和融合的心態(tài)。 五、社會(huì)科學(xué)實(shí)驗(yàn):中外比較和準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)的多模型應(yīng)用比較 (一)實(shí)驗(yàn)方法的中外比較 實(shí)驗(yàn)一直是中國(guó)近現(xiàn)代社會(huì)變革中的核心詞匯,如1926 年起晏陽初、李景漢等長(zhǎng)達(dá)十年的定縣實(shí)驗(yàn),1928 年起吳文藻先生開啟的清河實(shí)驗(yàn),以及 1931 年起梁漱溟在鄒平縣推動(dòng)的鄉(xiāng)村建設(shè)。改革開放之后,在20世紀(jì)70年代末,安徽小崗村18戶農(nóng)民開展的家庭聯(lián)產(chǎn)承包責(zé)任實(shí)驗(yàn)影響深遠(yuǎn),隨后的90年代,湖南省益陽市、山東省萊蕪市和黑龍江省肇東市的經(jīng)濟(jì)與社會(huì)協(xié)調(diào)發(fā)展實(shí)驗(yàn),也在全國(guó)不同區(qū)域產(chǎn)生影響力。新世紀(jì)以來,不同省市所開展的社區(qū)建設(shè)、社區(qū)治理、網(wǎng)格化治理等,也同樣具有實(shí)驗(yàn)性質(zhì)。同時(shí),在商業(yè)應(yīng)用領(lǐng)域,不同的互聯(lián)網(wǎng)公司,開始嘗試借助實(shí)驗(yàn)思路進(jìn)行A/B測(cè)試。 整體來看,中國(guó)的實(shí)驗(yàn)側(cè)重于實(shí)踐領(lǐng)域的改革和社會(huì)改善,相比較而言,20世紀(jì)開始西方實(shí)驗(yàn)研究更多以文本形式展現(xiàn)出來,以政治學(xué)為例,1924年到1979年期間,十本主要政治學(xué)學(xué)術(shù)期刊先后發(fā)表了217篇實(shí)驗(yàn)性研究論文,其中一半是發(fā)表在1970-1979年代之間。而在1980年到2010年,根據(jù)《牛津政治學(xué)研究方法手冊(cè)》中的數(shù)據(jù),政治學(xué)三本主要刊物的實(shí)驗(yàn)論文發(fā)表則超過之前半個(gè)世紀(jì)十本主要刊物的發(fā)表量。尤其是新近幾年,越來越多的實(shí)驗(yàn)方法研究成果在英文刊物和學(xué)界正在呈現(xiàn)井噴之勢(shì)。 但在中國(guó)學(xué)界依然面臨諸多實(shí)驗(yàn)的困境和對(duì)實(shí)驗(yàn)重視不夠等問題,進(jìn)而導(dǎo)致相關(guān)學(xué)術(shù)成果的曝光度不高。以政治學(xué)和社會(huì)學(xué)為例,目前實(shí)驗(yàn)方法及其相關(guān)成果在中文相關(guān)期刊的發(fā)表依然占據(jù)較低的比例,就筆者統(tǒng)計(jì)而言,近五年來,實(shí)驗(yàn)方法成果在政治學(xué)和社會(huì)學(xué)學(xué)科中文影響因子排名前十的CSSCI期刊發(fā)表論文占據(jù)總量的比例不超過1%。而就經(jīng)濟(jì)學(xué)和管理學(xué)期刊而言,近五年來實(shí)驗(yàn)方法研究成果在該學(xué)科排名前十的CSSCI期刊發(fā)表論文的比例也剛剛超過1%。相比較來看,心理學(xué)學(xué)科中,近五年來,其排名前十的CSSCI學(xué)術(shù)期刊所發(fā)表的實(shí)驗(yàn)研究成果則平均超過了30%,部分期刊如《心理學(xué)報(bào)》所發(fā)表論文中,實(shí)驗(yàn)方法論文占比超過45%。 表3初步總結(jié)了19世紀(jì)末到21世紀(jì)以來,中外學(xué)者在實(shí)驗(yàn)方法應(yīng)用上的不同特征、內(nèi)容和代表性實(shí)驗(yàn)。從表中可見,就研究特征而言,中國(guó)實(shí)驗(yàn)研究的規(guī)模依然較小,實(shí)驗(yàn)的理論化提煉還有待進(jìn)一步提升;而在實(shí)驗(yàn)內(nèi)容上,中國(guó)的實(shí)驗(yàn)方法應(yīng)用主題依然較為狹窄,且多以農(nóng)村和城市社區(qū)為主要實(shí)驗(yàn)對(duì)象,而西方實(shí)驗(yàn)研究主題和對(duì)象選擇多元化、多樣性的特征較為突出。當(dāng)然,在這樣的背景下,中西方的代表性實(shí)驗(yàn)及其影響力也存在顯著差異,如西方典型實(shí)驗(yàn)案例不僅僅局限于特定學(xué)科,已經(jīng)跨越學(xué)科的邊界,而中國(guó)的代表性實(shí)驗(yàn)案例依然聚焦于特定學(xué)科,如社會(huì)學(xué)學(xué)科。 (二)準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)的多模型比較 雖然方法有其流行的優(yōu)勢(shì),但上述分析也可以看出其存在不同維度的不足。那么,開篇指出研究者囫圇吞棗的應(yīng)用會(huì)導(dǎo)致方法論選擇偏差。故在此部分,我們想強(qiáng)調(diào),實(shí)驗(yàn)方法并不能帶來一切,特別是基于準(zhǔn)實(shí)驗(yàn)?zāi)P驮O(shè)計(jì)而開展的研究。因?yàn)閱我荒P脱芯?,即使采用?shí)驗(yàn)方法,也無法避免參數(shù)選擇或模型內(nèi)在機(jī)理等因素對(duì)結(jié)果的影響。因此,多模型比較目前正在成為研究工作關(guān)注的焦點(diǎn)。例如在環(huán)境研究領(lǐng)域中,包含了能源經(jīng)濟(jì)模型、綜合評(píng)估模型和局部均衡模型等多種模型類別的斯坦福能源模型論壇。近年來國(guó)內(nèi)經(jīng)濟(jì)學(xué)等學(xué)科開始逐步關(guān)注多模型比較研究,而在機(jī)器學(xué)習(xí)中,無監(jiān)督對(duì)比學(xué)習(xí)也正在興起,通過不同模型比較來實(shí)現(xiàn)算法優(yōu)化。但來自政治學(xué)和公共管理學(xué)科的多模型比較研究成果依然較為罕見。 為了實(shí)現(xiàn)多模型對(duì)比驗(yàn)證,作者選擇政府質(zhì)量數(shù)據(jù)庫(kù)中117個(gè)國(guó)家1992~2017年的面板數(shù)據(jù)作為本文的基礎(chǔ)數(shù)據(jù)集,圍繞政府腐敗對(duì)貧困發(fā)生率的影響機(jī)制探索為主題,同時(shí)分析該影響機(jī)制是否受到不同國(guó)籍的技術(shù)創(chuàng)新水平約束。因?yàn)榇罅康奈墨I(xiàn)指出,伴隨技術(shù)創(chuàng)新,如信息技術(shù)將有助于公民獲得更多的就業(yè)機(jī)會(huì)和技能提升機(jī)會(huì),同時(shí)這類技術(shù)革命還會(huì)增加政府腐敗成本,從而約束政府腐敗水平對(duì)不同國(guó)家貧困發(fā)生率的影響。限于篇幅,相關(guān)數(shù)據(jù)的統(tǒng)計(jì)描述,變量的多重共線性檢驗(yàn),以及平行趨勢(shì)檢驗(yàn)等不再一一呈現(xiàn)。 首先,作者基于數(shù)據(jù)集初步擬合了全球政府腐敗指數(shù)和貧困發(fā)生率的散點(diǎn)圖(圖1),從數(shù)據(jù)擬合圖可以看出,政府腐敗指數(shù)對(duì)貧富差距具有正向影響,且該影響是邊際遞減的,即呈現(xiàn)出倒U型關(guān)系。 表4利用固定效應(yīng)模型驗(yàn)證了政府腐敗指數(shù)對(duì)貧富差距不僅具有顯著的正向影響,且模型(2)中平方項(xiàng)的負(fù)向顯著表明該影響是邊際遞增的,正U型關(guān)系的結(jié)論和可視化分析下的數(shù)據(jù)擬合結(jié)果并不是一致的。 此時(shí),為了進(jìn)一步驗(yàn)證上述變量之間的穩(wěn)定關(guān)系,我們往往會(huì)尋求采用準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)。但考慮到社會(huì)科學(xué)中隨機(jī)試驗(yàn)會(huì)受到道德和實(shí)踐等諸多因素的限制。在缺少隨機(jī)試驗(yàn)的前提下,學(xué)者會(huì)訴諸于嚴(yán)格的準(zhǔn)自然實(shí)驗(yàn)干預(yù)。其中,斷點(diǎn)回歸方法被普遍認(rèn)為是一種最為可信的因果推斷分析方法。在斷點(diǎn)回歸方法中,所有單位都擁有一個(gè)“得分”,并且分值高于某個(gè)斷點(diǎn)的個(gè)體接受處理。這一設(shè)計(jì)的最大特點(diǎn)在于接受處理的概率在門檻值處急劇變化。 以樣本中政府腐敗指數(shù)的均值為斷點(diǎn),再次進(jìn)行多項(xiàng)式擬合,得到斷點(diǎn)回歸的圖形結(jié)果,可以看出,政府腐敗指數(shù)對(duì)貧富差距存在非線性影響,且在斷點(diǎn)之前是邊際遞增的倒U型,這一結(jié)論和固定效應(yīng)模型的結(jié)論基本一致;但又進(jìn)一步說明了在政府腐敗指數(shù)較高的位置上(斷點(diǎn)后半部分)是N型結(jié)構(gòu)。 但此時(shí),研究者出于審慎的考慮,會(huì)通過對(duì)不同國(guó)家的類型學(xué)處理,來細(xì)分不同的國(guó)家組別,進(jìn)而避免內(nèi)生性因素的影響。比如,本文討論不同技術(shù)創(chuàng)新能力下,政府腐敗指數(shù)對(duì)貧困發(fā)生率的影響,考慮到不同國(guó)家的創(chuàng)新水平差異,作者以專利授權(quán)數(shù)的中位數(shù)(3)來劃分出高創(chuàng)新國(guó)家和低創(chuàng)新國(guó)家。同時(shí),考慮到全球面板數(shù)據(jù)中,存在著不可避免的數(shù)據(jù)遺漏和變量遺漏,學(xué)者開始借助雙重差分模型構(gòu)造控制組和實(shí)驗(yàn)組來進(jìn)一步分析。 從表5可以看出,在創(chuàng)新水平比較低的國(guó)家,政府腐敗問題會(huì)進(jìn)一步加劇其貧困發(fā)生率,但在具有較高創(chuàng)新水平的國(guó)家,政府腐敗水平將不會(huì)對(duì)其貧困發(fā)生率有顯著的促進(jìn)作用。 但很多時(shí)候,由于雙重差分所需要的共同趨勢(shì)假設(shè)前提——即處理組和控制組在政策實(shí)施之前必須具有相同的時(shí)間趨勢(shì)——在實(shí)踐操作中總是非常的牽強(qiáng)。此時(shí),學(xué)者會(huì)借助傾向值匹配來進(jìn)一步完善雙重差分模型,由于傾向值匹配不需要嚴(yán)格的隨機(jī)分組,也不需要相同的時(shí)間趨勢(shì),僅僅需要研究對(duì)象中存在時(shí)序結(jié)構(gòu)即可。此時(shí)PSM-DID開始在20世紀(jì)末期被提出,該方法既具有雙重差分的特征,還通過傾向值匹配控制了研究樣本中不同區(qū)域的歷史文化等因素的影響??梢哉f是構(gòu)造一個(gè)更好的控制組。表6同樣采用表5的數(shù)據(jù),作者在低創(chuàng)新國(guó)家(即專利授權(quán)數(shù) 3)的樣本中找到與高創(chuàng)新國(guó)家(即專利授權(quán)數(shù) 3)一一匹配的樣本,所以得到與低創(chuàng)新國(guó)家樣本匹配的225個(gè)高創(chuàng)新國(guó)家樣本。在PSM模型后的DID結(jié)果中可以發(fā)現(xiàn),低創(chuàng)新國(guó)家的配對(duì)樣本中,政府腐敗指數(shù)對(duì)貧富差距具有顯著的影響,但該影響顯著高于模型(2)中專利授權(quán)數(shù)(>3)樣本的估計(jì)結(jié)果。同時(shí),相比表5,高創(chuàng)新國(guó)家的腐敗對(duì)貧富差距的影響開始由不顯著,變?yōu)轱@著。 隨著因果推斷研究的逐漸普及,學(xué)者還會(huì)采用安慰劑檢驗(yàn)來進(jìn)一步增強(qiáng)因果推斷的可信度、文章的故事性和邏輯性,在上文的雙重差分模型估算之后,通過前置不同國(guó)家的創(chuàng)新水平突破時(shí)間點(diǎn),作者隨機(jī)構(gòu)造實(shí)驗(yàn)組和模擬 500 次,所獲得系數(shù)值繪制如圖3,但我們很容易發(fā)現(xiàn),此時(shí)安慰劑檢驗(yàn)?zāi)P偷幕貧w系數(shù)并不顯著,難以支持上述DID模型和PSM-DID模型的結(jié)果。 在安慰劑檢驗(yàn)不顯著的背景下,作者還試圖進(jìn)一步嘗試比較合成控制模型的結(jié)果,該方法嚴(yán)格要求在政策變量發(fā)生變動(dòng)前樣本個(gè)體的合成控制對(duì)象具有良好的擬合效果,如果某樣本個(gè)體擬合效果不理想,則需要被剔除。而本文研究問題中,具有良好擬合效果的樣本個(gè)體較少,故無法得到有效的回歸估計(jì)結(jié)果。 為了進(jìn)一步呈現(xiàn)PSM-DID和DID模型回歸系數(shù)的結(jié)果比較,作者進(jìn)一步繪制了圖3,由圖3表明,即使同一議題、同一數(shù)據(jù),但在因果推斷的不同模型使用中,依然會(huì)得到不同的回歸結(jié)果??梢姡煌瑴?zhǔn)實(shí)驗(yàn)?zāi)P驮趯?duì)同一議題探析和同一數(shù)據(jù)挖掘過程中,甚至還會(huì)存在相反的結(jié)果。這提醒我們,當(dāng)前的量化研究分析中,與其說單一的仰仗實(shí)驗(yàn)方法去探索因果關(guān)系,倒不如說需要多模型驗(yàn)證。 六、結(jié)論和討論 計(jì)算能力的進(jìn)步、方法論的創(chuàng)新和相關(guān)數(shù)據(jù)庫(kù)的積累,使得現(xiàn)代社會(huì)科學(xué)研究的可選擇性越來越寬廣,但從方法創(chuàng)新到應(yīng)用創(chuàng)新,則仰仗于近年來西方民主國(guó)家的政治動(dòng)蕩,其使得一套創(chuàng)新——那些涉及所謂的“橋接”方法的創(chuàng)新——應(yīng)用于相同或相似公共策略“空間”中具有了廣闊的市場(chǎng)。如,我們可以在實(shí)驗(yàn)設(shè)計(jì)的基礎(chǔ)上,通過一位曾同時(shí)與兩名議員工作過的第三位議員,來比較從未一起任職的兩名議員的意識(shí)形態(tài)立場(chǎng)。我們?cè)噲D通過實(shí)驗(yàn)方法來探究研究對(duì)象的本原,化繁為簡(jiǎn)地勾勒出研究現(xiàn)象的前因后果,但這也只是構(gòu)成學(xué)者通過方法革新和數(shù)據(jù)處理技術(shù)的進(jìn)展來詮釋社會(huì)的一個(gè)奇跡,依然遠(yuǎn)離研究目標(biāo)辨析,此時(shí),實(shí)驗(yàn)方法更難以成為決策者的助手。 在社會(huì)科學(xué)的發(fā)展過程中,關(guān)于方法論的爭(zhēng)論從未間斷。羅賓斯指出,當(dāng)代文明的一個(gè)主要危機(jī)起源于自然科學(xué)訓(xùn)練出來的思想不能察覺到經(jīng)濟(jì)與技術(shù)之間的差別。對(duì)方法的陳述有可能會(huì)更好地指導(dǎo)我們研究對(duì)象,但單純的方法不能作為實(shí)際社會(huì)科學(xué)研究的一部分。因此,我們必須在個(gè)人實(shí)踐中,在不同學(xué)科之間,審慎地讓方法和研究工作保持密切聯(lián)系。實(shí)驗(yàn)研究方法作為一種研究方法,在較為漫長(zhǎng)的發(fā)展歷史中形成了不同的分類,有其自身獨(dú)特的優(yōu)勢(shì)與不足。 總體來看,雖然對(duì)實(shí)驗(yàn)方法存在不同程度的質(zhì)疑,使其不時(shí)面臨著各種方法論危機(jī),但實(shí)驗(yàn)方法在以下方面依然為我們的研究提供諸多啟迪。 首先,通過實(shí)驗(yàn)有助于解決若干傳統(tǒng)研究中難以規(guī)避的難題。如被調(diào)查者面對(duì)敏感問題是否還能誠(chéng)實(shí)回答問題?特別是面對(duì)潛在的被污名化,違反社會(huì)規(guī)范甚至存在道德、法律風(fēng)險(xiǎn)問題時(shí)。對(duì)于敏感問題,被調(diào)查者會(huì)選擇拒絕參與或簡(jiǎn)單地給出不實(shí)應(yīng)答,傳統(tǒng)的直接提問作法常會(huì)低估某類敏感性問題對(duì)研究結(jié)果的影響。為了解決這個(gè)問題,在過去的半個(gè)世紀(jì)中,一些非直接的提問技術(shù)發(fā)展起來,如由沃納開發(fā)的隨機(jī)回答技術(shù),通過對(duì)被調(diào)查者答案進(jìn)行隨機(jī)加密來實(shí)現(xiàn)對(duì)匿名想法的表達(dá)。此過程中被調(diào)查者會(huì)收到關(guān)于一個(gè)敏感問題的兩種問法之一。例如,被調(diào)查者可能會(huì)收到問題S:你使用過非法藥物嗎?概率為p,他們也會(huì)收到相反的問題S’:你從來沒使用過非法藥物嗎?這將得到一個(gè)互補(bǔ)的概率1-p,被調(diào)查者通過擲骰子隨機(jī)抽取回答哪個(gè)問題。在這個(gè)一調(diào)查中,只有被調(diào)查者知道這個(gè)隨機(jī)選擇的結(jié)果(即被調(diào)查者會(huì)被要求在調(diào)查者看不見的地方擲骰子)。因?yàn)橹挥斜徽{(diào)查者知道自己回答的是哪個(gè)問題,所以調(diào)查者不能根據(jù)被調(diào)查者回答的“是”或“否”推斷出被調(diào)查者的情況。然而,盡管調(diào)查人員無法推斷任何個(gè)別被調(diào)查者的狀況,但根據(jù)已知隨機(jī)化的概率p,來對(duì)敏感屬性問題中流行率估計(jì),從回答“是”的選擇比例中得出。 其次,良好的隨機(jī)干預(yù)平衡了實(shí)驗(yàn)組和對(duì)照組之間的所有潛在混淆因素,從而能夠評(píng)估因果效應(yīng)或準(zhǔn)確估計(jì)其缺失情況。計(jì)算機(jī)輔助背景下,越來越多的情境實(shí)驗(yàn)、場(chǎng)景實(shí)驗(yàn)被采用,如情景評(píng)估實(shí)驗(yàn)方法被用來分析政黨偏好和政黨紛爭(zhēng)對(duì)政策制定的影響。這些為社會(huì)科學(xué)研究帶來新氣象。再如,實(shí)驗(yàn)方法使我們能夠確定若干政策議題的時(shí)效性。有的問題可能是當(dāng)前政治辯論的核心主題,但卻不是對(duì)公眾重要,如何識(shí)別出公民關(guān)注的核心焦點(diǎn),則需要一定的實(shí)驗(yàn)方法中所獲得的信息來支持。部分田野實(shí)驗(yàn)還開始側(cè)重對(duì)政策議題的細(xì)節(jié)處理,來進(jìn)一步類型化研究對(duì)象。 實(shí)驗(yàn)方法研究的本質(zhì)特點(diǎn)是數(shù)據(jù)生成過程中研究者的干預(yù),此時(shí)數(shù)據(jù)的變化部分是在設(shè)計(jì)階段,測(cè)量數(shù)據(jù)前研究者的決定所致,在這一過程中,實(shí)驗(yàn)方法的操作中也需要關(guān)注如下問題: 首先,實(shí)驗(yàn)研究中,其干預(yù)手段往往通過給予特定實(shí)驗(yàn)者一段視頻、一段文字等信息植入的方式。但這種實(shí)驗(yàn)方法中一個(gè)局限的信息往往難以改變政策偏好,即使它可以改變其他態(tài)度。如在多民族國(guó)家中,對(duì)不同族群的態(tài)度認(rèn)知實(shí)驗(yàn)調(diào)查表明這種分歧凸顯了:即對(duì)少數(shù)群體的態(tài)度改善并不一定意味著對(duì)傷害該群體的政策支持減少。 其次,多重實(shí)驗(yàn)評(píng)估的重要性、實(shí)驗(yàn)不遵從和自我報(bào)告偏差被忽略。通過多重實(shí)驗(yàn)測(cè)試和評(píng)估,或者說基于等價(jià)測(cè)試,有助于研究人員對(duì)分析結(jié)果進(jìn)一步校正或組合測(cè)試,進(jìn)而提升研究的效度和信度。此外,實(shí)驗(yàn)不遵從,不可觀測(cè)特征變量產(chǎn)生的歪曲和實(shí)驗(yàn)中的其他干擾會(huì)扭曲研究結(jié)果。當(dāng)然,目前大量的實(shí)驗(yàn)室實(shí)驗(yàn)和調(diào)查實(shí)驗(yàn)都有賴于被試者的自我報(bào)告,此時(shí)受訪者很難內(nèi)省地考慮不同問題的相對(duì)重要性,如當(dāng)沒有任何投票經(jīng)驗(yàn)的學(xué)生被試者談到投票選擇問題的重要性時(shí),其并不擅長(zhǎng)給出切合現(xiàn)實(shí)的判斷,這就導(dǎo)致評(píng)估和選擇認(rèn)知的過程通常是一個(gè)無意識(shí)的過程,即使最終該結(jié)果被實(shí)驗(yàn)方法所包裝。 再次,社會(huì)科學(xué)實(shí)驗(yàn)倫理問題的忽視。實(shí)驗(yàn)倫理是研究透明度的重要環(huán)節(jié),但社會(huì)科學(xué)實(shí)驗(yàn)倫理問題并沒有像理工科那樣被強(qiáng)調(diào)。當(dāng)然,實(shí)驗(yàn)倫理并不是簡(jiǎn)單的研究設(shè)計(jì)預(yù)注冊(cè),其實(shí),特別是在實(shí)地實(shí)驗(yàn)中,為了避免實(shí)驗(yàn)被意外曝光,預(yù)注冊(cè)的登記文件還需要通過一系列延遲公布等措施予以保護(hù),最終的干預(yù)措施和結(jié)果保持一定的公開度,還應(yīng)注重全面報(bào)告原始的注冊(cè)設(shè)計(jì)文件和實(shí)驗(yàn)執(zhí)行過程,而非選擇性地公開研究數(shù)據(jù)。 最后,現(xiàn)代實(shí)驗(yàn)方法應(yīng)用到底是議題需求驅(qū)動(dòng),還是發(fā)表偏倚驅(qū)動(dòng)?可能更多的是后者,在激烈的學(xué)術(shù)發(fā)表競(jìng)爭(zhēng)中,越來越復(fù)雜的模型和創(chuàng)新的方法被采納來提升發(fā)表的成功率。分析表明,日益復(fù)雜的因果模型正在充斥著頂級(jí)的組織研究期刊。從2016年到2018年,在《美國(guó)管理學(xué)會(huì)學(xué)報(bào)》,《組織行為和人類決策過程》和《管理科學(xué)季刊》這三大頂級(jí)期刊上,最常見的是含有六變量的因果模型。在2008年至2017年之間,《美國(guó)管理學(xué)會(huì)學(xué)報(bào)》中討論因果模型的文章數(shù)量從22%增加到36%,增加了64%;《組織行為和人類決策過程》從24%增至60%,增長(zhǎng)了150%;《管理科學(xué)季刊》從13%變?yōu)?9%,增加了46%。除此之外,從2016年到2018年,《美國(guó)管理學(xué)會(huì)學(xué)報(bào)》,《組織行為和人類決策過程》和《管理科學(xué)季刊》的10篇最復(fù)雜模型論文平均擁有16個(gè)變量,而2008年最復(fù)雜的模型只有12個(gè)變量。這種相信復(fù)雜理論敘述的智力趣味,樂衷于復(fù)雜方法設(shè)計(jì)的學(xué)識(shí)興奮,代價(jià)是增加了復(fù)雜性卻危及模型的真實(shí)性。如何識(shí)別有意義的簡(jiǎn)化模型和無意義的復(fù)雜模型,則是研究者自身素養(yǎng)的體現(xiàn)。 當(dāng)然,我們很多人會(huì)懷疑實(shí)驗(yàn)的效用,一方面是由于社會(huì)科學(xué)家很少有人接受專業(yè)實(shí)驗(yàn)設(shè)計(jì)教育,缺少學(xué)習(xí)實(shí)驗(yàn)技術(shù)的動(dòng)機(jī),也會(huì)擔(dān)心實(shí)驗(yàn)倫理問題。特別是實(shí)驗(yàn)的控制條件是人為設(shè)置的,實(shí)驗(yàn)被試者知道自己處于被觀察的狀態(tài),進(jìn)而會(huì)對(duì)限額外產(chǎn)生實(shí)在而未知的影響,另一方面,抽樣方法帶來的樣本選擇偏差也導(dǎo)致實(shí)驗(yàn)結(jié)果信度和效度的下降。但有學(xué)者指出這些問題也存在于其他研究方法中,總而言之,根本不存在最優(yōu)的研究方法。特別是準(zhǔn)實(shí)驗(yàn)多模型的驗(yàn)證中,我們很容易發(fā)現(xiàn)因果推斷模型依然會(huì)存在失靈的空間,這其實(shí)也提醒我們與其說是實(shí)驗(yàn)方法,倒不如將更多精力側(cè)重于多模型比較來增加研究結(jié)果的可信度,而目前重復(fù)驗(yàn)證的趨向下,其既包括不同情景下數(shù)據(jù)的重復(fù)驗(yàn)證,也包含不同模型的重復(fù)驗(yàn)證。 本文在全球發(fā)展比較下,呈現(xiàn)出社會(huì)科學(xué)實(shí)驗(yàn)研究方法的初步特征,但這并不是試圖挑起定量與定性研究方法的“范式之爭(zhēng)”,或樹立起傳統(tǒng)量化研究和新生量化模型之間的“迭代之爭(zhēng)”,我們更多的是試圖在包容性方法論思維的指引下,來實(shí)現(xiàn)我們研究成果信度和效度的提升,進(jìn)而提升社會(huì)科學(xué)的顯示度,以為社會(huì)政策的完善和改良做出更好的貢獻(xiàn)。 推薦語 探究因果關(guān)系是社會(huì)科學(xué)研究的重要任務(wù),而實(shí)驗(yàn)則是挖掘事物之間因果關(guān)系最具價(jià)值的研究方法之一。本文考察了實(shí)驗(yàn)方法的歷史演化、操作類型、應(yīng)用過程和學(xué)科場(chǎng)景以及它對(duì)社會(huì)科學(xué)帶來的影響,并通過比較中外實(shí)驗(yàn)和準(zhǔn)實(shí)驗(yàn)分析模型系統(tǒng)地展示了該方法的發(fā)展脈絡(luò)與前景,有助于為進(jìn)一步科學(xué)地應(yīng)用實(shí)驗(yàn)研究方法奠定學(xué)理基礎(chǔ)。(政治學(xué)人編輯部) 責(zé)任編輯:肖偉林 一審:班允博 二審:王智睿 終審:吉先生 文章來源:《廣西師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)》2021年第5期。 |
|