今天要解讀的依然是一篇教學(xué)文獻(xiàn):The Basics of Structural Equation Modeling,文獻(xiàn)作者是Diana Suhr, Ph.D. University of Northern Colorado。 文獻(xiàn)鏈接:https://www./wuss/2006/tutorials/TUT-Suhr.pdf 概念結(jié)構(gòu)方程模型是:
我們做結(jié)構(gòu)方程模型主要是為了: 1. 了解變量之間的共變關(guān)系 2. 解釋模型中變量盡可能多的變異 上面給出了結(jié)構(gòu)方程模型比較宏大的概念,具體地我們又可以細(xì)分: 我們用路徑分析探究變量之間的因果。我們用驗(yàn)證性因子分析探究潛變量和顯變量之間的關(guān)系。我們用潛增長曲線模型(LGM)估計(jì)縱向數(shù)據(jù)的初始,變化,結(jié)構(gòu)斜率和方差。上面提到的方法統(tǒng)統(tǒng)都可以歸于結(jié)構(gòu)方程模型的特例。 結(jié)構(gòu)方程模型和傳統(tǒng)分析方法的不同首先SEM更加靈活,更加綜合。傳統(tǒng)方法的模型是提前規(guī)定的或者說是默認(rèn)的,而做結(jié)構(gòu)方程的時(shí)候,它對變量關(guān)系的限制幾乎沒有,需要你自己根據(jù)理論知識設(shè)定變量之間的關(guān)系;SEM既包含顯變量又有潛變量,而傳統(tǒng)的方法只分析顯變量;在SEM中我們認(rèn)為誤差是存在的,你甚至可以規(guī)定不同變量之間誤差的關(guān)系是怎樣的,但是傳統(tǒng)的方法認(rèn)為誤差是沒有的;傳統(tǒng)方法能夠輸出變量間關(guān)系的直接的顯著性檢驗(yàn)結(jié)果,而SEM沒有這樣的結(jié)果,我們得用擬合指標(biāo)來評價(jià)模型;另外,結(jié)構(gòu)方程模型可以很好地容忍多重共線性。 SEM的統(tǒng)計(jì)指標(biāo)chi-square:這個(gè)統(tǒng)計(jì)量表示預(yù)期協(xié)方差矩陣和數(shù)據(jù)的協(xié)方差矩陣的差異,卡方越小說明我們的模型和數(shù)據(jù)越符合 Comparative Fit Index (CFI):這個(gè)指標(biāo)表示調(diào)整了樣本量后的ediscrepancy function,這個(gè)指標(biāo)取值1~1,越大越好,建議大于0.9 Root Mean Square Error of Approximation (RMSEA):這是一個(gè)和模型殘差有關(guān)的指標(biāo),越小越好,一般要求小于0.06 如果我們的模型做出來擬合指標(biāo)還過的去,我們接下來就應(yīng)該檢驗(yàn)?zāi)P偷膮?shù),參數(shù)與其標(biāo)準(zhǔn)誤的比值是服從z分布的,所以參數(shù)和其標(biāo)準(zhǔn)誤的比值大于1.96的話,這個(gè)參數(shù)的p就小于0.05. 當(dāng)然啦,模型擬合指標(biāo)不好的情況也是經(jīng)常出現(xiàn)的,這個(gè)時(shí)候我們要很具合理的修正指數(shù)來修正我們的模型,比如你把原先固定的參數(shù)進(jìn)行釋放等等。 做SEM之前你需要考慮1. 你的理論假設(shè) 2. 樣本量:好一點(diǎn)的話就應(yīng)該是估計(jì)參數(shù)的20倍,現(xiàn)實(shí)一點(diǎn)10倍就行,千萬不要小于5倍 3. 測量工具 4. 數(shù)據(jù)是否多元正態(tài)性 5. 模型能否識別 6. 離群值和缺失值 7. 模型擬合指數(shù) 做SEM的一般流程1. 首先你得有你的理論模型,根據(jù)這個(gè)理論來設(shè)定變量間的關(guān)系 2. 設(shè)定模型,可以通過圖(AMOS)或者代碼(lavaan,mplus) 3. 判斷模型識別情況 4. 明確模型變量的測量(就是明確問卷,或者自編條目) 5. 收集數(shù)據(jù) 6. 初始分析(缺失值、離群值的處理,標(biāo)準(zhǔn)化等) 7. 估計(jì)模型參數(shù) 8. 評估模型擬合情況 9. 修正模型(如果有必要的話) 10. 結(jié)果解釋寫作 上面的流程都是一家之言,你知道基本上做SEM就這些流程,具體不必非得按照上面這個(gè)順序,比如你可以再沒有收集數(shù)據(jù)之前就提前設(shè)定好模型,計(jì)劃好如何對潛變量進(jìn)行測量,都是可以的。 SEM的各種標(biāo)簽釋疑令很多同學(xué)頭疼的問題之一就是一個(gè)SEM中各種術(shù)語名稱,這兒統(tǒng)一給大家總結(jié)一下: 自變量(Independent),預(yù)測因子(predictor),外生變量(exogenous (external))都是一個(gè)東西,在模型中都是去影響別的變量的。 因變量(Dependent),標(biāo)準(zhǔn)變量(criterion),內(nèi)生變量(endogenous (internal))都是一個(gè)東西,表示別的變量的效果,在模型中受別的變量影響。 潛變量(Latent variable),因子(factor),構(gòu)象(construct)都是一個(gè)東西,指模型中的變量。 模型model指的就是你研究的變量之間的關(guān)系的統(tǒng)計(jì)表達(dá)。 如果你想把你的模型直觀地畫出來,畫出來的這個(gè)東西就叫路徑圖path diagram。 模型設(shè)定Specification就是指你對模型參數(shù)和整個(gè)模型的規(guī)定,這兒需要注意:
我們對于模型參數(shù)的設(shè)定要么是固定的,要么是設(shè)定為自由的。 固定參數(shù)Fixed parameters就是指這個(gè)參數(shù)不從我們的數(shù)據(jù)中來估計(jì),而是將它固定為0或者1。 自由參數(shù)Free parameters是指需要模型從數(shù)據(jù)中估計(jì)的參數(shù)。 擬合指數(shù)Fit indices反映模型擬合的如何,指的是我們設(shè)定固定和自由參數(shù)是不是和原始數(shù)據(jù)的方差協(xié)方差一致,chi-square, CFI, NNFI, RMSEA都是常見的擬合指數(shù)。 一個(gè)SEM可以劃分為兩個(gè)部分,一個(gè)部分叫做測量模型measurement model,指的是對潛變量和顯變量關(guān)系的設(shè)定,另一個(gè)叫做結(jié)構(gòu)模型structural model,指的是潛變量間或者潛變量與其余變量關(guān)系的設(shè)定。 識別Identification模型識別的意思是對模型中的自由參數(shù)能否獲得一個(gè)特定的解,模型有解是需要滿足一定條件的:就是就是自由參數(shù)的個(gè)數(shù)q必須要小于或等于你的樣本協(xié)方差矩陣中非冗余元素的個(gè)數(shù)p*。模型識別的意思是對模型中的自由參數(shù)能否獲得一個(gè)特定的解,模型有解是需要滿足一定條件的:就是就是自由參數(shù)的個(gè)數(shù)q必須要小于或等于你的樣本協(xié)方差矩陣中非冗余元素的個(gè)數(shù)p*,這個(gè)P*=p(p + 1)/2,其中p為測量變量的個(gè)數(shù)。 識別的類型不識別underidentified:就是從我們的數(shù)據(jù)中給一個(gè)或者多個(gè)參數(shù)找不出來一個(gè)特定的解。比如x + y = 5,這個(gè)xy可以來回變我們是找不到這個(gè)方程的特定解的,這個(gè)適合就叫做不識別,就是自由參數(shù)的個(gè)數(shù)q大于了獨(dú)立方程的個(gè)數(shù)。 恰好識別just identified:就是對模型中的自由參數(shù)恰好可以從我們的數(shù)據(jù)中求得一個(gè)獨(dú)立的解,比如我們有方程組x + y = 5 and 2x + y = 8,這個(gè)時(shí)候xy剛剛好有一個(gè)解,但是恰好識別的情形下,模型是無法被檢驗(yàn)的。 超識別overidentified:就是我們可以從數(shù)據(jù)中給模型中自由參數(shù)估計(jì)很多個(gè)特定的值,比如我們有方程組x + y = 5, 2x + y = 8, and x + 2y = 9.這個(gè)方程本身也是無解的,但是我們可以定標(biāo)準(zhǔn),然后求的特定的解,標(biāo)準(zhǔn)不一樣,解不一樣,所以這個(gè)情形模型是可以被檢驗(yàn)的。 還有一個(gè)術(shù)語叫做自由度df,df = (p* - q),當(dāng)自由度為正時(shí),所有的自由參數(shù)都可以被估計(jì)。 我們做結(jié)構(gòu)方程,就是為了在滿足我們本身數(shù)據(jù)結(jié)構(gòu)和理論設(shè)定的情形下對自由參數(shù)進(jìn)行估計(jì)。設(shè)定好不好,估計(jì)的準(zhǔn)不準(zhǔn)都得看模型擬合指標(biāo)。 擬合指標(biāo)常規(guī)的Chi-square,這個(gè)東西叫做“badness-of-fit” index,我給翻譯為“擬合劣度指數(shù)”,所以卡方越小越好。 其他的各種CFI, NNFI.........等等各種指數(shù)都是擬合優(yōu)度指數(shù),越大越好。 兩個(gè)檢驗(yàn)一個(gè)叫做Wald test,這個(gè)檢驗(yàn)是用來檢驗(yàn)卡方改變量的,就是模型固定參數(shù)增加了之后模型擬合會不會顯著變壞。 另一個(gè)叫做LaGrange Multiplier Test (LM),這個(gè)檢驗(yàn)可以得到在釋放自由參數(shù)后模型的擬合會不會顯著變好。 模型修正Model modification模型修正就是通過釋放固定參數(shù),就是把模型中原先固定的參數(shù)進(jìn)行自由估計(jì)以此來提高模型擬合。 路徑效應(yīng)大小的判斷判斷效應(yīng)大小時(shí),我們一定要看調(diào)整后的路徑系數(shù),如果小于0.1就是小效應(yīng),0.3附近則為中效應(yīng),大于0.5為大效應(yīng)。 SEM圖示SEM中常見的圖示和解釋如下圖: 看幾個(gè)例子吧: 首先是回歸模型: 上圖中就是3個(gè)自變量對一個(gè)因變量的回歸的圖示。 上圖同樣是4個(gè)變量但是其中兩個(gè)變量對因變量有間接作用。像這樣的叫做中介模型。 上圖就是一個(gè)最簡單的結(jié)構(gòu)方程了,有測量部分也有結(jié)構(gòu)部分,但是結(jié)構(gòu)部分是共變關(guān)系。 實(shí)例原文獻(xiàn)中有SEM的實(shí)例和SAS軟件以及PROC CALIS軟件進(jìn)行SEM分析的代碼,因?yàn)樽约翰挥眠@兩個(gè)軟件,所以不在我的文章中給大家寫了,感興趣自己去瞅瞅哈。 小結(jié) |
|