小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

SPSS聚類(lèi)分析:用于篩選聚類(lèi)變量的一套方法

 梨花帶雨2018 2015-02-22

聚類(lèi)分析是常見(jiàn)的數(shù)據(jù)分析方法之一,主要用于市場(chǎng)細(xì)分、用戶(hù)細(xì)分等領(lǐng)域。利用SPSS進(jìn)行聚類(lèi)分析時(shí),用于參與聚類(lèi)的變量決定了聚類(lèi)的結(jié)果,無(wú)關(guān)變量有時(shí)會(huì)引起嚴(yán)重的錯(cuò)分,因此,篩選有效的聚類(lèi)變量至關(guān)重要。


案例數(shù)據(jù)源:


在SPSS自帶數(shù)據(jù)文件plastic.sav中記錄了20中塑料的三個(gè)特征,分別是tear_res(抗拉力)、gloss(光滑度)、opacity(透明度),相關(guān)經(jīng)驗(yàn)表面這20中塑料可以分為3個(gè)種類(lèi),如果用這三個(gè)變量進(jìn)行聚類(lèi),請(qǐng)判斷和篩選有效聚類(lèi)變量。


一套篩選聚類(lèi)變量的方法

一、盲選


將根據(jù)經(jīng)驗(yàn)得到的、現(xiàn)有的備選聚類(lèi)變量全部納入模型,暫時(shí)不考慮某些變量是否不合適。本案例采用SPSS系統(tǒng)聚類(lèi)方法。對(duì)話(huà)框如下:

統(tǒng)計(jì)量選項(xiàng)卡:聚類(lèi)成員選擇單一方案,聚類(lèi)數(shù)輸入數(shù)字3;

繪制選項(xiàng)卡:勾選樹(shù)狀圖;

方法選項(xiàng)卡:默認(rèn)選項(xiàng),不進(jìn)行標(biāo)準(zhǔn)化;

保存選項(xiàng)卡:聚類(lèi)成員選擇單一方案,聚類(lèi)數(shù)輸入數(shù)字3;


二、初步聚類(lèi)


這是盲選得到的初步聚類(lèi)結(jié)果,并且在數(shù)據(jù)視圖我們可以看到已經(jīng)自動(dòng)生成了一個(gè)聚類(lèi)結(jié)果變量,這個(gè)變量非常有用。

三、方差分析


是不是每一個(gè)納入模型的聚類(lèi)變量都對(duì)聚類(lèi)過(guò)程有貢獻(xiàn)?利用已經(jīng)生成的初步聚類(lèi)結(jié)果,我們可以用一個(gè)單因素方差分析來(lái)判斷分類(lèi)結(jié)果在三個(gè)變量上的差異是否顯著,進(jìn)而判斷哪些變量對(duì)聚類(lèi)是沒(méi)有貢獻(xiàn)的。

分析——比較均值——單因素方差分析

選項(xiàng)選項(xiàng)卡:勾選均值圖

由方差分析我們很明確的得知,納入模型的三個(gè)聚類(lèi)變量,其中只有“透明度”指標(biāo)在各個(gè)分類(lèi)上有顯著的差異,也就是說(shuō)分類(lèi)有效果,讓每個(gè)分類(lèi)的差異很大,而兩外兩個(gè)變量則在三個(gè)分類(lèi)上沒(méi)有顯著差異,沒(méi)有很好的類(lèi)別區(qū)分度,所以,我們可以認(rèn)為,這兩個(gè)變量對(duì)聚類(lèi)無(wú)作用或者無(wú)貢獻(xiàn),可考慮踢出模型。


我們還想從可視化的角度來(lái)查看和判斷,單因素方差分析為我們提供了均值圖,可惜,這三個(gè)圖卻最容易誤導(dǎo)我們的判斷,因?yàn)閟pss在自動(dòng)生產(chǎn)均值圖時(shí)為每一個(gè)變量單獨(dú)制圖,而且分配不同的縱軸坐標(biāo),導(dǎo)致每個(gè)圖看起來(lái)都有非常大的差異,從視覺(jué)上迷惑我們做出錯(cuò)誤的判斷。

這里需要改進(jìn)!


四、均值描述


為改進(jìn)以上SPSS默認(rèn)選項(xiàng)的不足之處,我們需要自己生成三個(gè)變量在不同類(lèi)別上的均值,means過(guò)程可以幫助到我們。

從數(shù)字上來(lái)看,抗拉力(6.8、6.7、7.1)、光滑度(9.3、9.4、9.2)兩個(gè)指標(biāo)在三個(gè)類(lèi)別上并沒(méi)有多大的差異,而對(duì)聚類(lèi)有貢獻(xiàn)的透明度指標(biāo)在不同類(lèi)別上區(qū)分度非常明顯。


五、多線(xiàn)均值圖


克服縱軸刻度的方法是將這三個(gè)指標(biāo)放在同一個(gè)坐標(biāo)軸上進(jìn)行對(duì)比,也就是制作一個(gè)多線(xiàn)均值圖。

此時(shí),結(jié)果已經(jīng)一目了然了。


綜上,我們可以將抗拉力、光滑度兩個(gè)指標(biāo)從模型中剔除,只留下透明度一個(gè)指標(biāo)再進(jìn)行聚類(lèi)。

我們發(fā)現(xiàn),前后兩次聚類(lèi)的結(jié)果一模一樣,用一個(gè)指標(biāo)可以代替以前三個(gè)指標(biāo)的進(jìn)行聚類(lèi)。


我們這樣做的意義何在?如果能將這些整理成為規(guī)則,形成經(jīng)驗(yàn),那我們就可以不用測(cè)量抗拉力和光滑度這兩個(gè)指標(biāo)了,你不覺(jué)得多測(cè)量?jī)蓚€(gè)指標(biāo)成本會(huì)增加嗎?


文章思路參考自:文彤老師《SPSS11高級(jí)教程》

——————————

歡迎關(guān)注:微信號(hào)spsser。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶(hù)發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多