上一期我們講到了SPSS聚類(lèi)分析中的系統(tǒng)聚類(lèi)。無(wú)論是系統(tǒng)聚類(lèi)中的Q型聚類(lèi)還是R型聚類(lèi),都是一種探索的聚類(lèi)分析,就是我們沒(méi)有明確要將目標(biāo)劃分為幾類(lèi),只是想探索可以分為幾類(lèi),根據(jù)探索出來(lái)的結(jié)果再來(lái)決定分幾類(lèi)最好。大家可以回顧一下: 《SPSS聚類(lèi)分析的軟件操作與結(jié)果解讀》 《SPSS聚類(lèi)分析(R型聚類(lèi))的軟件操作與結(jié)果解讀》 今天我們所講解的K-均值聚類(lèi),則是我們的研究目的明確的知道或者要求分成固定的幾類(lèi),或者有比較明確的經(jīng)驗(yàn)確定要分成幾類(lèi),那么就可以使用K-均值聚類(lèi)。 但是值得注意的是,K-均值聚類(lèi)只能針對(duì)樣本進(jìn)行聚類(lèi)。請(qǐng)看我們的案例數(shù)據(jù)(圖1),要明確的將樣本分為3類(lèi)。 圖1 操作步驟: ①點(diǎn)擊“分析”--“分類(lèi)”--“K-均值聚類(lèi)”(圖2) 圖2 ②然后將γ1-5選入右側(cè)變量框中,將聚類(lèi)數(shù)設(shè)置為“3”類(lèi)(圖3) 圖3 ③點(diǎn)擊右側(cè)“保存”按鈕,勾選“聚類(lèi)成員”選項(xiàng)(圖4) 圖4 ④點(diǎn)擊右側(cè)“選項(xiàng)”,勾選“統(tǒng)計(jì)”欄目下的“初始聚類(lèi)中心”和“每個(gè)個(gè)案的聚類(lèi)信息”(圖5),最后點(diǎn)擊確定按鈕 圖5 ⑤結(jié)果分析 圖6 由上圖可以看出:我們?cè)谧兞恳晥D已經(jīng)可以看到生成一列新的變量,就是對(duì)應(yīng)31個(gè)樣本被新劃分成的類(lèi)別。 圖7 可以看出1類(lèi)有9個(gè)樣本,2類(lèi)有18個(gè)樣本,3類(lèi)有4個(gè)樣本。那么雖然我們得到了分類(lèi),但是123類(lèi)之間的關(guān)系是如何的呢,我們下面通過(guò)最終聚類(lèi)中心表來(lái)查看(圖8) 圖8 由最終聚類(lèi)中心可以看出:第3類(lèi)為所有γ指標(biāo)值最大的一類(lèi),第1類(lèi)為中等,而第2類(lèi)就為所有指標(biāo)數(shù)值最低的一類(lèi)。 這樣我們就很快速準(zhǔn)確的講31個(gè)樣本按照高中低分成了3類(lèi)。 以上就是我們今天所講解的SPSS聚類(lèi)分析之K-均值聚類(lèi)的操作與詳解,總結(jié)一下,K-均值聚類(lèi)是一種帶著明確聚類(lèi)別數(shù)的目的去進(jìn)行分類(lèi)的方法,但是只能對(duì)樣本進(jìn)行聚類(lèi),類(lèi)似于之前所講的系統(tǒng)聚類(lèi)里的Q型聚類(lèi)。重點(diǎn)在于已知要分類(lèi)的類(lèi)別數(shù),而之前的系統(tǒng)聚類(lèi)重點(diǎn)在于未知聚類(lèi)類(lèi)別數(shù),在于探索。 |
|
來(lái)自: geoallan > 《數(shù)據(jù)分析》