導(dǎo)言: 如下是連玉君老師上課的板書。你可以看出什么是 「固定效應(yīng)」,什么是 「雙向固定效應(yīng)模型」,什么是 「POLS」 v.s. 「FE」 以及二者的差別。 所以,面板數(shù)據(jù)模型其實沒有你想象的那么復(fù)雜! 常見的數(shù)據(jù)形式有時間序列數(shù)據(jù)( Time series data ),截面數(shù)據(jù)( Cross-sectional data )和面板數(shù)據(jù)( Panel data )。 從維度來看,時間序列數(shù)據(jù)和截面數(shù)據(jù)均為一維。面板數(shù)據(jù)可以看做為時間序列與截面混合數(shù)據(jù),因此它是二維數(shù)據(jù)。數(shù)據(jù)形式如下: 世界是復(fù)雜的,所表現(xiàn)出來的行為特征也是復(fù)雜的,我們需要面板數(shù)據(jù)。 例如,欲研究影響企業(yè)利潤的決定因素,我們認(rèn)為企業(yè)規(guī)模 (截面維度)和技術(shù)進(jìn)步(時間維度)是兩個重要的因素。截面數(shù)據(jù)僅能研究企業(yè)規(guī)模對企業(yè)利潤的影響程度,時間序列數(shù)據(jù)僅能研究技術(shù)進(jìn)步對企業(yè)利潤的影響,而面板數(shù)據(jù)同時考慮了截面和時間兩個維度 (從哪個維度看都好看),可以同時研究企業(yè)規(guī)模和技術(shù)進(jìn)步對企業(yè)利潤的影響。 正因為面板數(shù)據(jù)所具有的獨(dú)特優(yōu)勢,許多模型從截面數(shù)據(jù)擴(kuò)展到面板數(shù)據(jù)框架下。通過
本文主要就普通靜態(tài)面板數(shù)據(jù)模型進(jìn)行介紹,包括模型形式設(shè)定、模型分類與選擇及 Stata 程序?qū)崿F(xiàn)等。
面板數(shù)據(jù)模型同時包含了截面和時間兩個維度,設(shè) i (i=1, ..., N) 表示截面 (個體),t (t=1, ..., T) 表示時間,設(shè)定如下線性模型: 其中,
顯然, 和 在多數(shù)情況下都是無法直接觀測或難以量化的,因此也就無法進(jìn)入模型。在截面分析中往往會引起遺漏變量的問題。 面板數(shù)據(jù)模型的主要用途之一就在于處理這些不可觀測的個體效應(yīng)或時間效應(yīng)。當(dāng)對所有的 i, 均相等時,模型退化為混合數(shù)據(jù)模型 ( Pooled OLS ),可直接用 根據(jù)個體數(shù)N 和時期數(shù) T的大小,通??梢詫⒚姘鍞?shù)據(jù)分為宏觀面板和微觀面板:宏觀面板一般為 「大T小N」,微觀面板一般為「小T大N」。依據(jù) N、T大小不同,所采用的參數(shù)估計方法和分析中關(guān)注的重點也不盡相同。
面板數(shù)據(jù)模型可以分為固定效應(yīng)( Fixed effect model )和隨機(jī)效應(yīng)模型( Random effect model )。當(dāng) 和相關(guān),即,則該模型為固定效應(yīng)模型;反之為隨機(jī)效應(yīng)模型。 兩種模型的差異主要反映在對 “個體效應(yīng)” 的處理上。 固定效應(yīng)模型假設(shè)個體效應(yīng)在組內(nèi)是固定不變的,個體間的差異反映在每個個體都有一個特定的截距項上; 隨機(jī)效應(yīng)模型則假設(shè)所有的個體具有相同的截距項, 個體間的差異是隨機(jī)的,這些差異主要反應(yīng)在隨機(jī)干擾項的設(shè)定上。 基于此,一種常見的觀點認(rèn)為, 當(dāng)我們的樣本來自一個較小的母體時,我們應(yīng)該使用固定效應(yīng)模型,而當(dāng)樣本來自一個很大的母體時, 應(yīng)當(dāng)采用隨機(jī)效應(yīng)模型。 然而,在具體的實例應(yīng)用中,大母體和小母體并沒有一個嚴(yán)格的界限,我們并不能明確地區(qū)分我們的樣本來自一個較大母體還是較小的母體。因此,有些學(xué)者認(rèn)為,區(qū)分固定效應(yīng)模型和隨機(jī)效應(yīng)模型應(yīng)當(dāng)通過檢驗使用二者的假設(shè)條件是否滿足。 下面我們討論混合數(shù)據(jù)模型、固定效應(yīng)模型和隨機(jī)效應(yīng)模型的選擇。 2.1、固定效應(yīng)的檢驗固定效應(yīng)的檢驗本質(zhì)即檢驗個體間截距項的差異是否顯著,即=0。根據(jù)假設(shè)檢驗原理,設(shè)定如下原假設(shè) 若結(jié)果拒絕原假設(shè),則表明個體間截距項存在顯著差異,模型中需要考慮固定效應(yīng)。反之,混合 OLS 模型更為合適。通??梢岳?$F$ 統(tǒng)計量來檢驗上述假設(shè)是否成立: 其中:為固定效應(yīng)模型的擬合優(yōu)度系數(shù)(不受約束模型),為混合數(shù)據(jù)模型的擬合優(yōu)度系數(shù)(受約束模型);N 和T 分別為截面與時期數(shù);K 為解釋變量個數(shù)。若原假設(shè)被拒絕,則說明個體效應(yīng)顯著,固定效應(yīng)模型比混合數(shù)據(jù)模型更優(yōu)。同理,可以構(gòu)造相似的F統(tǒng)計量檢驗時期效應(yīng)是否顯著。 2.2、隨機(jī)效應(yīng)的檢驗Breusch and Pagan (1980) 提出了基于面板隨機(jī)效應(yīng)模型殘差的 LM統(tǒng)計量,構(gòu)造如下原假設(shè)來檢驗隨機(jī)效應(yīng): 相應(yīng)的檢驗統(tǒng)計量LM為: 在原假設(shè)下,該統(tǒng)計量服從自由度為1的卡方分布。若拒絕原假設(shè)則表明存在隨機(jī)效應(yīng)。 2.3、固定效應(yīng)還是隨機(jī)效應(yīng)?通過檢驗說明個體效應(yīng) () 需要被納入到模型中后,應(yīng)該將 看成隨機(jī)干擾項的一部分(隨機(jī)效應(yīng)模型)還是待估計參數(shù)(固定效應(yīng)模型),下面介紹一些基本方法。 (1) Hausman 檢驗從基本定義出發(fā),可以通過通過檢驗個體效應(yīng)與其它解釋變量是否相關(guān)作為進(jìn)行固定效應(yīng)和隨機(jī)效應(yīng)模型篩選的依據(jù)。此時,我們可以采用 Hausman 檢驗。其基本思想是:在和其他解釋變量不相關(guān)假定下,采用組內(nèi)變換法估計固定效應(yīng)模型和采用GLS法隨機(jī)效應(yīng)模型得到的參數(shù)估計都是無偏且一致的,只是前者不具有效性。若原假設(shè)不成立,則固定效應(yīng)模型的參數(shù)估計仍然是一致的,但隨機(jī)效應(yīng)模型不一致。因此,在原假設(shè)下,二者的參數(shù)估計應(yīng)該不會有顯著的差異, 可以基于二者參數(shù)估計的差異構(gòu)造統(tǒng)計檢驗量。 假設(shè)為固定效應(yīng)模型的組合估計,為隨機(jī)效應(yīng)模型的 GLS 估計。在原假設(shè)成立下,有 根據(jù)方差公式 又因為,因此有 Hausman 檢驗基于如下 Wald 統(tǒng)計量 若拒絕原假設(shè),表明個體效應(yīng) 與解釋變量相關(guān),此時隨機(jī)效應(yīng)模型的結(jié)果不一致,應(yīng)選擇固定效應(yīng)模型。 (2) 穩(wěn)健Hausman檢驗Wooldridge (2002)當(dāng)不服從同方差假設(shè)時,傳統(tǒng)的 Hausman 檢驗方法失效。Wooldridge (2002) 提出了一種穩(wěn)健版的 Hausman 檢驗方法。建立如下輔助模型: 其中:為時變解釋變量。當(dāng) RE 估計為完全有效估計時,利用 Wald 統(tǒng)計量做 檢驗所得結(jié)果應(yīng)該漸近相等于標(biāo)準(zhǔn)的檢驗。當(dāng)RE 估計為不是完全有效估計時,Wooldridge (2002) 提出在cluster-robust 標(biāo)準(zhǔn)誤下做上述檢驗。 (3) 修正的 Hausman統(tǒng)計量在固定效應(yīng)模型與隨機(jī)效應(yīng)模型選擇上,Hausman 統(tǒng)計量被廣泛地應(yīng)用于實證研究中。從上述看,該檢驗統(tǒng)計量漸近服從卡方分布,值應(yīng)該為正數(shù)。然而,實際問題中計算出的統(tǒng)計值常出現(xiàn)負(fù)值的情況。針對出現(xiàn)負(fù)值這一現(xiàn)象,許多學(xué)者進(jìn)行了研究,但并未形成一致的觀點。 一種觀點認(rèn)為出現(xiàn)這樣的情況主要是由小樣本偏誤引起,并建議此時應(yīng)該解釋為不能拒絕原假設(shè),應(yīng)選擇隨機(jī)效應(yīng)模型 (如,Baltagi, 2008; Hsiao, 2003;Statacrop, 2009)。 另一種觀點認(rèn)為該統(tǒng)計量出現(xiàn)負(fù)值恰恰表明原假設(shè)不合理,此時應(yīng)該選擇固定效應(yīng)模型。這些研究表明這種狀況不僅僅出現(xiàn)在小樣本情況下,在大樣本情況下也時有發(fā)生 (Schreiber, 2008; Magazzini and Calzolarr, 2010)。如沈根祥 (2010) 在利用高頻數(shù)據(jù)時也出現(xiàn)統(tǒng)計量為負(fù)值的情形。 連玉君等 (2014) 利用蒙特卡洛模擬方法得到內(nèi)生性問題 (即解釋變量與個體效應(yīng)相關(guān)) 是導(dǎo)致統(tǒng)計量出現(xiàn)負(fù)值的主要原因。模擬分析表明,修正的 Hausman 統(tǒng)計量,以及過度識別檢驗方法能夠很好地克服上述缺陷。 修正的 Hausman 統(tǒng)計量主要是對或進(jìn)行調(diào)整。調(diào)整后的統(tǒng)計量為 或者為 其中:和分別為固定效應(yīng)模型和隨機(jī)效應(yīng)模型下的均方根誤差。 (4) 基于過度識別檢驗的 Wald 統(tǒng)計量基于通常的 Hausman 統(tǒng)計量在存在異方差 (heteroskedastic) 情況下失效且當(dāng)定義 cluster-robust 標(biāo)準(zhǔn)誤時不再適用問題,Arellano (1993) 基于過度識別檢驗提出了 Wald 檢驗統(tǒng)計量解決這一問題。在條件同方差情況下,該檢驗統(tǒng)計量與通常的Hausman統(tǒng)計量漸近相等。此外,該統(tǒng)計量始終為正數(shù)。 如前所述,F(xiàn)E 估計和 RE 估計都需要滿足一般意義上的外生性假設(shè)條件,即,而 RE 估計還要進(jìn)一步滿足面板特定的外生性假設(shè)條件,即。 我們可以將這個新增加的正交條件視為一個過度識別約束,以此來區(qū)分 RE 估計的前提假設(shè)是否合理。我們可以通過估計如下模型來構(gòu)造 Wald 統(tǒng)計量 其中:,。和具有相似的定義。顯然,在上式中,的 OLS 估計即為 RE 估計量,而的 OLS 估計即為之間的差異,即 利用 Wald 檢驗假設(shè),所得統(tǒng)計量即為過度識別檢驗的 Wald 統(tǒng)計量。 (5) Mundlak’s (1978) 方法在原假設(shè)成立情況下,估計量的有效性假設(shè) (存在最小漸近方差) 是運(yùn)用Hausman 檢驗的前提條件。然而,當(dāng)誤差項存在異方差或者序列相關(guān)時,這個條件往往不能夠被滿足。即使在這個條件滿足情況下,該方法也可能存在小樣本問題。 這里介紹另外一種方法,即 Mundlak’s(1978) 提出的一種檢驗方法。與通常的 Hausman檢驗不同,該方法在誤差項不滿足同方差和序列不相關(guān)情況下也是有效的。設(shè)定如下線性模型: Mundlak 方法的思想為檢驗和解釋變量 是否存在相關(guān)。因此,建立如下關(guān)系式: 其中:是 的組內(nèi)平均,是非時變的,且與自變量不相關(guān)的。 要保證 和解釋變量 不相關(guān),只需=0。根據(jù)以上式子,可以轉(zhuǎn)化為檢驗如下方程的系數(shù) 因此,只需要回歸這個方程,并檢驗是否成立。若拒絕原假設(shè),則 和解釋變量 存在相關(guān),應(yīng)選擇固定效應(yīng)模型。 (6) Bootstrap Hausman檢驗傳統(tǒng)的 Hausman 檢驗統(tǒng)計量可定義為 傳統(tǒng) Hausman 檢驗有效的前提條件是,在原假設(shè)為真的情況下,其中一個估計量為完全有效的。然而,實際應(yīng)用中這個假設(shè)通常不被滿足。特別地,當(dāng)利用穩(wěn)健標(biāo)準(zhǔn)誤時,估計量通常非有效。 Bootstrap方法可以在估計量非有效的情況估計。假設(shè)重復(fù)進(jìn)行 B 次抽樣,可以得到 B 個和估計值,進(jìn)而可得到 B 個估計值。可以利用下面式子進(jìn)行估計 其中:。
本部分以 Kleiber 和 Zeileis (2008) 的Grunfeld.dta數(shù)據(jù)集為例,說明運(yùn)用面板數(shù)據(jù)模型的一般步驟。 3.1. 讀取數(shù)據(jù)與面板數(shù)據(jù)設(shè)定1. webuse grunfeld,clear //利用webuse從網(wǎng)絡(luò)讀取數(shù)據(jù) 1xtset company year,yearly //設(shè)置面板數(shù)據(jù)格式,利用 Stata 中`xt`開頭的命令,必須用該命令進(jìn)行設(shè)置。yearly表示年度數(shù)據(jù),詳細(xì)參考 `help xtset` 3.2. 模型檢驗與模型選擇本部分內(nèi)容安排如下: (1)個體效應(yīng)和隨機(jī)效應(yīng)的聯(lián)合顯著性檢驗,以判別是否需要利用面板數(shù)據(jù)模型; (2)若表明需用面板數(shù)據(jù)模型,利用Hausman統(tǒng)計量選擇固定效應(yīng)模型或隨機(jī)效應(yīng)模型更優(yōu); (3)考慮到一般的Hausman檢驗在異方差和自相關(guān)情況下失效風(fēng)險問題,對異方差,序列相關(guān)進(jìn)行檢驗,以說明是否需要利用其它方法進(jìn)行選擇; (4)針對一般的Hausman檢驗統(tǒng)計量可能為負(fù)值且對在異方差和序列相關(guān)情況不穩(wěn)健問題,對穩(wěn)健 Hausman 檢驗,修正的 Hausman統(tǒng)計量, 基于過度識別檢驗的Wald統(tǒng)計量法,Mundlak’s (1978)法,基于 bootstrap法的hausman檢驗等方法的Stata實現(xiàn)進(jìn)行講解。 (5)在選定固定效應(yīng)模型或隨機(jī)效應(yīng)模型后,依據(jù)誤差項結(jié)構(gòu)(異方差,序列相關(guān),截面相依)以及不同面板結(jié)構(gòu)(「大T小N」,「大N小T」), 介紹相應(yīng)的參數(shù)估計命令。 (1)個體效應(yīng)和隨機(jī)效應(yīng)的聯(lián)合顯著性檢驗以invest為因變量,mvalue kstock為自變量,建立如下模型: 其中:和為待估系數(shù)。 利用Stata中 1xtreg invest mvalue kstock,fe //fe表示固定效應(yīng);若同時包括時期虛擬變量,xtreg invest mvalue kstock i.year,fe,利用 testparm 檢驗 1xtreg invest mvalue kstock,re //re表示隨機(jī)效應(yīng) 1xttest0 //檢驗隨機(jī)效應(yīng)是否顯著,需要運(yùn)行隨機(jī)效應(yīng)模型后使用 (2)Hausman檢驗上述結(jié)果說明了有必要考慮個體效應(yīng)和隨機(jī)效應(yīng),接下來利用
利用 1. hausman name-consistent [name-efficient] [, options] 接下來進(jìn)行hausman檢驗, 1xtreg invest mvalue kstock,fe (3)異方差和序列相關(guān)檢驗前文已經(jīng)說明,當(dāng)模型誤差項存在序列相關(guān)或異方差時,此時經(jīng)典的Hausman 檢驗不在適用,下面我們進(jìn)行序列相關(guān)和異方差檢驗。 序列相關(guān)檢驗 先進(jìn)行序列相關(guān)檢驗,在固定效應(yīng)模型時可以利用命令 1xtserial invest mvalue kstock 同樣地,在隨機(jī)效應(yīng)時可以利用命令 異方差檢驗 Greene (2000, p598) 提出一種修正的Wald統(tǒng)計量檢驗異方差,與標(biāo)準(zhǔn)的Wald統(tǒng)計量、LR和LM統(tǒng)計量不同,修正Wald檢驗同樣適用于模型殘差不服從正態(tài)分布情況下。值得一提的是,在大N小T情況下,該方法的檢驗功效較低。該檢驗的原假設(shè)為同方差。 1xtreg invest mvalue kstock,fe (4)模型選擇其它方法第一種:穩(wěn)健 Hausman 檢驗** 目前 Stata 中沒有相應(yīng)的命令進(jìn)行穩(wěn)健 Hausman檢驗, 根據(jù) 2.3 中 (2) 部分公式,可以編寫如下代碼進(jìn)行檢驗 1webuse grunfeld, clear
第二種: 修正的 Hausman統(tǒng)計量 1xtreg invest mvalue kstock,fe 1hausman fe_result re_result,sigmaless
第三種:基于過度識別檢驗的Wald統(tǒng)計量 1 xtreg invest mvalue kstock, re cluster(company) 運(yùn)行后提示需要更高版本的 上述結(jié)果表明拒絕假設(shè),應(yīng)該選擇固定效應(yīng)模型。
第四種:Mundlak’s (1978)法
根據(jù)上文所述原理,可通過如下三個步驟實現(xiàn)該方法: 第一:計算解釋變量均值 1local xlist "mvalue kstock" 第二步:估計包含均值的回歸方程: 1xtreg invest mvalue kstock mean_mvalue mean_kstock,re vce(robust) 第三步:利用 1test mean_mvalue mean_kstock 結(jié)果如下 此外,也可以通過外部命令 1mundlak invest mvalue kstock,full
第五種:基于 bootstrap法的hausman檢驗
由于存在序列相關(guān)和異方差,經(jīng)典的 1xtreg invest mvalue kstock,fe 從檢驗結(jié)果可以發(fā)現(xiàn),利用經(jīng)典的 除了序列相關(guān)和異方差檢驗之外,截面相依檢驗也尤為重要。在固定效應(yīng)模型中,可以利用命令 (5)相關(guān) Stata 命令推薦依據(jù)誤差項結(jié)構(gòu)(異方差,序列相關(guān),截面相依)以及不同面板結(jié)構(gòu)(「大TT小NN」,「大NN小TT」), 下文介紹相應(yīng)的參數(shù)估計命令。 截面相依檢驗 1qui xtreg invest mvalue kstock, fe 1 qui xtreg invest mvalue kstock, re 當(dāng)誤差項存在序列相關(guān),異方差或截面相依時,依據(jù)形式不同,可以利用不同的方法和命令進(jìn)行估計,詳細(xì)可以參考 Hoechle (2007)。 幾點說明
?
雖然本文系統(tǒng)地介紹了靜態(tài)面板數(shù)據(jù)模型的各種檢驗方法,但從現(xiàn)有的文獻(xiàn)來看,實操層面的做法往往是單刀直入,甚至多少有些粗暴。 具體而言:
?
1clear |
|