小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

SPSS(十五)spss之聚類分析(圖文+數(shù)據(jù)集)

 misswee 2020-02-28

聚類分析簡介

按照個體(記錄)的特征將它們分類,使同一類別內(nèi)的個體具有盡可能高的同質(zhì)性,而類別之間則具有盡可能高的異質(zhì)性。
為了得到比較合理的分類,首先要采用適當(dāng)?shù)闹笜?biāo)來定量地描述研究對象之間的聯(lián)系的緊密程度。

假定研究對象均用所謂的“點”來表示。
在聚類分析中,一般的規(guī)則是將“距離”較小的點歸為同一類,將“距離”較大的點歸為不同的類。
常見的是對個體分類,也可以對變量分類,但對于變量分類此時一般使用相似系數(shù)作為“距離”測量指標(biāo)

  • 聚類分析前所有個體所屬的類別是未知的,類別個數(shù)一般也未知,分析的依據(jù)就是原始數(shù)據(jù),可能事先沒有任何有關(guān)類別的信息可參考。
  • 嚴格說來聚類分析并不是純粹的統(tǒng)計技術(shù),它不像其它多元分析法那樣,需要從樣本去推斷總體。一般都涉及不到有關(guān)統(tǒng)計量的分布,也不需要進行顯著性檢驗。
  • 聚類分析更像是一種建立假設(shè)的方法,而對相關(guān)假設(shè)的檢驗還需要借助其它統(tǒng)計方法。
     

注意:聚類分析更像是一種建立假設(shè)的方法,而對于相關(guān)假設(shè)的檢驗還需要借助其他統(tǒng)計的方法,比如判別分析、T-檢驗、方差分析等,看聚類出來的幾個類別是否存在差異

 

聚類的用途

  • 設(shè)計抽樣方案(分層抽樣)
  • 預(yù)分析過程(先通過聚類分析達到簡化數(shù)據(jù)的目的,將眾多的個體先聚集成比較好處理的幾個類別或子集,然后再進行后續(xù)的多元分析)
  • 細分市場、個體消費行為劃分(先聚類,然后再利用判別分析進一步研究各個群體之間的差異)

 

聚類分析的基本步驟總結(jié)

 

聚類方法

K均值聚類(K-means Cluster)

方法原理

  1. 選擇(或人為指定)某些記錄作為凝聚點
  2. 按就近原則將其余記錄向凝聚點凝集
  3. 計算出各個初始分類的中心位置(均值)
  4. 用計算出的中心位置重新進行聚類
  5. 如此反復(fù)循環(huán),直到凝聚點位置收斂為止

方法特點

  1. 要求已知類別數(shù)
  2. 可人為指定初始位置
  3. 節(jié)省運算時間
  4. 樣本量過大時有必要考慮
  5. 只能使用連續(xù)性變量
     

案例:移動通訊客戶細分

數(shù)據(jù)包含6個變量
是客戶編號(Customer_ID)
工作日上班時期電話時長(Peak_mins)
工作日下班時期電話時長(OffPeak_mins)
周末電話時長(Weekend_mins)
國際電話時長(International_mins)
總通話時長(Total_mins)
平均每次通話時長(average_mins)
根據(jù)前期的調(diào)研,研究者認為移動用戶應(yīng)當(dāng)被分為5個主要群體,現(xiàn)希望得到相應(yīng)的定量聚類結(jié)果。
(由于數(shù)據(jù)集過多,可到我的資源下載“spss之聚類分析--移動通訊客戶細分”

看到結(jié)果無法收斂,所以重新設(shè)置迭代次數(shù),讓其收斂

但是最終聚類出來,結(jié)果怪怪的

各變量測量尺度,量綱不一樣,聚類計算其距離時量綱大的對結(jié)果影響大

如何進行標(biāo)化呢?

重新聚類

標(biāo)準(zhǔn)化的變量,一般在正負3以內(nèi),0代表平均水平

但是我們想看原始變量的原始水平,不看這標(biāo)準(zhǔn)化的

保存?zhèn)€案被劃分為哪個類

 

我們只想看均值

 

得到非標(biāo)準(zhǔn)化的聚類中心結(jié)果 

 

解讀

  • 第一類:高端商用客戶,總通話時間長,工作日上班時間通話比例高
  • 第二類:少使用低端客戶,總通話時間短,各時段通話時間都短
  • 第三類:中端商用客戶,總通話時間居中,工作日上班時間通話比例高
  • 第四類:中端日常用客戶,總通話時間居中,工作日下班時間通話比例高
  • 第五類:長聊客戶,每次通話時間長

 

層次聚類(Hierarchical Cluster)

屬于系統(tǒng)聚類法的一種,其聚類過程可以用樹形結(jié)構(gòu)(treelike structure)來描繪的方法

方法原理

  1. 先將所有n個變量/觀測看成不同的n類
  2. 然后將性質(zhì)最接近(距離最近)的兩類合并為一類
  3. 再從這n-1類中找到最接近的兩類加以合并
  4. 依此類推,直到所有的變量/觀測被合為一類
  5. 使用者再根據(jù)具體的問題和聚類結(jié)果來決定應(yīng)當(dāng)分為幾類

 

特點

  1. 一旦記錄/變量被劃定類別,其分類結(jié)果就不會再進行更改
  2. 可以對變量或記錄進行聚類
  3. 變量可以為連續(xù)或分類變量(變量雖然可以為連續(xù)型或者分類型,但是不能混用,要不就是全分類這樣使用,要不就全連續(xù)變量聚類)
  4. 提供的距離測量方法非常豐富
  5. 運算速度較慢

 

案例:體操裁判打分傾向聚類(這個案例是對變量進行聚類)

SPSS自帶數(shù)據(jù)集judges.sav是中、美、法等七個國家的裁判和未經(jīng)嚴格訓(xùn)練體育愛好者在評判體育比賽中對選手的評分情況。請根據(jù)在評分上的差異將它們分為適當(dāng)?shù)念悺?/p>

  1. 7.30 8.00 7.10 7.70 7.20 7.20 7.00 7.6
  2. 7.80 8.70 7.20 8.40 7.50 8.10 7.30 7.1
  3. 7.20 7.40 7.10 7.50 7.20 7.10 7.00 7.0
  4. 7.30 8.40 7.20 7.90 7.50 8.50 7.30 7.1
  5. 7.70 7.80 7.20 8.40 7.60 7.40 7.10 7.1
  6. 7.30 7.60 7.20 8.10 7.30 7.20 7.00 7.0
  7. 8.30 8.30 7.70 8.50 7.80 7.80 7.20 7.8
  8. 9.60 9.80 9.30 9.80 8.80 9.90 9.40 10.0
  9. 9.10 8.80 8.60 9.10 7.80 9.30 8.50 8.5
  10. 9.50 9.70 9.00 9.60 8.90 9.80 9.20 10.0
  11. 7.80 8.50 8.30 9.10 8.00 9.50 7.60 7.9
  12. 8.60 8.90 7.80 9.00 8.00 8.70 7.80 7.8
  13. 8.50 9.10 8.10 9.30 8.00 8.30 7.80 8.5
  14. 9.20 9.10 8.00 9.40 8.50 9.60 8.60 8.9
  15. 8.20 9.20 7.90 9.10 7.80 8.30 7.50 8.2
  16. 7.00 7.50 7.10 7.40 7.10 7.10 7.00 7.7
  17. 9.70 9.90 9.10 9.70 9.00 10.00 9.60 9.9
  18. 9.80 9.90 9.50 9.80 9.00 10.00 9.70 9.9
  19. 8.60 9.40 8.20 9.50 8.70 9.80 8.30 9.5
  20. 8.80 9.00 7.90 8.50 8.10 9.30 8.00 9.8
  21. 9.30 9.80 9.30 9.80 8.70 10.00 9.30 9.3
  22. 7.50 7.90 7.20 8.10 7.30 7.70 7.10 7.2
  23. 9.00 9.30 7.80 9.10 8.20 9.40 8.10 8.5
  24. 8.90 9.70 8.90 9.50 8.60 9.70 9.40 9.2
  25. 9.90 10.00 9.70 9.90 9.40 10.00 9.90 9.9
  26. 7.20 7.20 7.00 7.90 7.10 7.10 7.00 7.3
  27. 7.00 7.10 7.00 7.20 7.00 7.00 7.00 7.0
  28. 7.30 7.50 7.10 7.60 7.30 7.90 7.10 7.6
  29. 9.00 9.00 8.10 9.10 7.80 9.30 7.70 7.1
  30. 7.50 8.50 7.20 8.50 8.00 8.90 7.20 7.6
  31. 9.10 9.70 8.60 9.60 9.10 9.90 9.50 7.6
  32. 7.60 8.00 7.20 8.90 7.40 7.60 7.10 7.2
  33. 7.70 8.30 7.40 8.40 7.50 8.30 7.40 8.5
  34. 7.70 7.90 7.30 8.70 7.40 7.70 7.30 8.3
  35. 8.10 8.40 7.90 8.90 7.90 8.60 7.70 7.0
  36. 8.50 9.60 8.70 9.20 8.40 9.30 8.30 8.7
  37. 9.80 9.80 9.70 9.90 8.90 9.90 9.80 9.9
  38. 9.20 9.20 8.10 9.60 8.40 9.60 8.80 9.2
  39. 9.90 9.90 9.70 9.90 9.10 10.00 9.70 9.8
  40. 8.90 8.70 7.90 9.00 8.40 9.70 8.40 7.5
  41. 9.90 10.00 9.20 9.90 9.00 10.00 9.30 8.0
  42. 7.50 8.50 7.50 8.20 7.50 8.70 7.90 9.4
  43. 8.90 9.60 8.80 9.30 8.40 9.90 9.20 9.1
  44. 7.70 8.70 7.40 8.50 7.70 8.30 7.30 7.1
  45. 9.70 9.90 9.40 9.80 9.20 9.90 9.60 10.0
  46. 9.60 9.90 8.80 9.70 9.00 9.90 9.30 9.2
  47. 7.60 8.40 7.60 8.60 7.50 8.00 7.20 7.1
  48. 8.30 8.40 7.30 8.50 7.60 7.60 7.30 7.8
  49. 8.90 8.90 8.30 9.00 8.30 9.50 8.70 9.4
  50. 9.50 9.90 8.60 9.60 8.60 9.90 9.30 8.8
  51. 7.90 8.50 7.60 8.30 7.60 8.40 7.30 7.1
  52. 8.70 9.60 8.00 9.30 8.30 9.30 8.00 8.8
  53. 7.30 7.90 7.20 7.70 7.30 8.00 7.00 8.0
  54. 7.30 7.40 7.00 7.80 7.20 7.60 7.00 7.2
  55. 7.10 7.20 7.10 7.50 7.10 7.20 7.00 7.0
  56. 9.80 10.00 9.50 9.90 9.40 10.00 9.90 10.0
  57. 9.30 9.50 8.50 9.40 7.90 9.50 8.70 9.8
  58. 8.50 9.00 7.50 8.90 7.90 9.10 7.70 8.6
  59. 9.70 10.00 9.40 9.90 9.10 10.00 9.90 9.7
  60. 8.70 8.40 8.00 8.90 7.60 9.40 7.40 9.9
  61. 7.50 7.80 7.20 8.10 7.30 7.80 7.30 8.5
  62. 8.20 8.70 7.90 9.00 8.10 8.90 8.50 7.9
  63. 8.70 9.50 8.30 9.60 8.10 9.80 8.50 8.3
  64. 9.40 9.70 9.10 9.40 8.80 9.90 8.90 9.9
  65. 8.90 9.80 8.20 9.30 8.20 9.70 8.50 9.5
  66. 9.80 9.90 9.20 9.60 9.30 9.90 9.90 10.0
  67. 9.00 9.60 8.30 9.60 8.20 9.60 8.70 9.8
  68. 8.30 8.60 7.90 8.50 7.90 9.50 8.40 9.3
  69. 8.80 9.10 8.00 9.10 8.00 9.50 8.80 9.8
  70. 8.40 8.40 7.40 8.70 7.90 8.40 7.40 8.0
  71. 9.90 10.00 9.80 9.70 9.50 10.00 10.00 8.3
  72. 8.80 9.20 8.60 9.20 8.00 9.50 7.50 7.3
  73. 8.90 9.00 8.00 9.10 7.90 9.30 7.90 8.3
  74. 9.50 10.00 9.50 9.80 9.10 10.00 9.70 9.1
  75. 9.00 9.50 8.30 9.30 8.60 9.80 9.30 9.1
  76. 9.70 9.40 9.10 9.50 9.00 9.90 9.40 10.0
  77. 8.70 9.60 8.90 9.70 8.80 9.70 9.10 10.0
  78. 7.40 7.80 7.10 8.20 7.10 7.90 7.10 8.7
  79. 8.10 8.90 8.00 9.10 8.10 9.30 8.10 8.5
  80. 7.80 8.40 7.60 8.30 7.50 7.80 7.20 8.2
  81. 7.50 7.40 7.10 8.10 7.20 7.30 7.10 7.8
  82. 7.70 8.10 7.40 8.70 7.60 8.50 7.60 7.2
  83. 9.80 10.00 9.70 9.90 9.30 10.00 9.80 10.0
  84. 7.10 7.60 7.00 7.80 7.20 7.20 7.00 7.1
  85. 9.70 9.70 9.20 9.70 8.60 10.00 9.40 7.3
  86. 9.60 9.20 9.00 9.40 8.60 9.60 9.10 9.8
  87. 9.80 9.90 9.30 9.70 8.80 10.00 9.30 9.6
  88. 7.10 7.20 7.10 7.70 7.10 7.10 7.00 7.0
  89. 7.40 7.80 7.20 8.40 7.50 7.60 7.20 8.5
  90. 8.70 8.50 8.20 9.20 7.80 8.20 7.60 7.9
  91. 7.30 8.10 7.10 8.00 7.10 7.50 7.20 7.5
  92. 8.50 9.20 8.40 9.30 7.90 9.50 8.60 9.4
  93. 8.90 9.60 8.70 9.50 8.50 9.60 9.30 7.8
  94. 7.00 7.40 7.00 7.50 7.00 7.10 7.00 7.2
  95. 7.70 8.90 7.20 8.70 7.90 8.60 7.50 8.2
  96. 7.90 8.90 7.40 9.00 7.90 8.80 7.70 7.2
  97. 7.10 7.50 7.10 7.90 7.10 7.20 7.00 7.0
  98. 8.30 9.10 7.50 8.70 7.80 8.40 7.50 8.2
  99. 8.50 9.00 8.10 8.90 7.90 9.30 7.80 9.0
  100. 9.60 9.90 9.30 9.70 9.00 9.90 9.50 9.3
  101. 8.80 9.40 8.20 9.30 8.10 9.90 8.60 8.6
  102. 8.30 8.60 7.50 8.80 7.60 8.60 7.30 7.3
  103. 9.50 9.20 8.90 9.50 8.50 9.90 9.10 9.9
  104. 7.60 8.30 7.50 8.70 7.50 8.00 7.80 7.6
  105. 9.40 9.80 9.10 9.60 8.40 9.70 9.40 8.9
  106. 7.30 7.90 7.40 7.90 7.20 8.30 7.20 7.7
  107. 8.70 9.20 7.50 9.20 7.50 8.10 7.40 9.7
  108. 7.40 7.50 7.10 8.30 7.10 7.30 7.00 7.1
  109. 8.50 9.60 8.40 9.10 8.10 9.50 8.30 9.7
  110. 8.40 8.80 7.70 9.10 8.00 9.30 8.30 8.2
  111. 8.80 9.30 7.50 9.30 7.80 9.20 8.30 7.9
  112. 9.90 10.00 9.70 9.80 9.50 10.00 10.00 10.0
  113. 7.00 7.20 7.00 7.60 7.10 7.10 7.00 7.0
  114. 8.80 9.40 8.60 9.10 7.80 8.70 8.30 9.2
  115. 7.20 7.80 7.10 8.00 7.10 7.60 7.10 7.1
  116. 8.70 9.70 8.90 9.70 8.40 9.70 9.30 9.2
  117. 7.10 7.40 7.10 7.70 7.10 7.00 7.00 7.1
  118. 7.90 9.00 7.30 8.50 7.30 8.30 7.30 7.0
  119. 8.70 9.40 7.70 9.10 7.80 9.10 8.70 9.8
  120. 7.20 7.60 7.10 8.10 7.30 7.70 7.10 7.3
  121. 9.10 9.80 8.40 9.50 8.60 9.60 8.20 9.8
  122. 8.30 8.40 8.20 8.60 7.90 9.30 8.20 7.0
  123. 8.70 9.80 8.90 9.40 8.00 9.70 8.30 9.5
  124. 8.40 8.80 7.30 9.30 7.40 8.60 7.70 7.0
  125. 9.30 9.90 9.00 9.70 8.50 9.70 9.40 9.9
  126. 9.20 9.50 8.60 9.60 8.20 9.50 9.40 8.3
  127. 7.40 7.60 7.10 8.30 7.20 7.10 7.00 7.0
  128. 7.30 8.00 7.10 8.30 7.30 7.50 7.40 7.8
  129. 8.70 9.50 8.20 9.60 8.20 9.50 8.80 8.0
  130. 7.20 8.60 7.10 8.00 7.30 7.70 7.00 8.5
  131. 8.80 8.10 7.50 8.70 7.70 8.40 7.50 7.7
  132. 9.20 9.70 8.70 9.70 8.50 9.40 9.00 9.5
  133. 7.60 7.80 7.20 8.30 7.40 8.00 7.10 7.1
  134. 7.90 8.50 7.40 8.30 7.40 8.40 7.10 7.4
  135. 7.70 7.70 7.20 8.30 7.20 8.10 7.10 9.1
  136. 7.50 8.30 7.60 8.60 7.30 8.20 7.50 7.3
  137. 8.80 8.60 7.60 8.90 7.80 9.00 7.80 9.5
  138. 7.60 7.90 7.30 8.10 7.40 7.70 7.10 7.1
  139. 9.30 9.60 8.70 9.40 7.90 9.10 8.30 7.8
  140. 8.10 8.70 7.70 8.80 7.70 8.70 7.90 9.3
  141. 9.80 9.90 9.40 9.70 8.80 9.80 9.40 8.8
  142. 9.90 9.80 9.30 9.90 8.80 9.90 9.80 9.9
  143. 8.90 9.10 8.50 9.50 8.40 9.80 8.80 9.9
  144. 7.90 8.30 7.80 8.80 7.50 8.30 7.30 7.9
  145. 8.10 9.00 7.30 8.30 7.30 7.30 7.10 9.0
  146. 9.20 8.70 7.80 9.00 8.00 9.10 7.90 7.1
  147. 9.80 9.90 9.70 9.90 9.30 10.00 9.90 9.8
  148. 9.20 9.10 8.70 8.90 7.90 9.20 8.40 9.1
  149. 7.50 8.00 7.30 7.90 7.30 8.10 7.30 7.6
  150. 8.10 8.90 7.70 8.90 7.60 8.40 8.10 7.6
  151. 9.60 9.90 9.20 9.70 8.90 9.90 9.60 9.7
  152. 9.00 9.00 8.00 9.40 8.30 9.10 8.70 8.2
  153. 7.10 7.30 7.10 7.80 7.10 7.30 7.00 7.0
  154. 9.70 9.90 9.40 9.70 9.30 10.00 9.80 9.5
  155. 9.60 9.90 9.50 9.60 8.70 10.00 9.30 7.6
  156. 7.20 7.80 7.20 8.00 7.30 7.10 7.00 7.0
  157. 9.60 9.90 9.50 9.90 9.30 9.90 9.90 10.0
  158. 8.30 8.80 7.30 9.00 7.60 8.70 7.10 8.9
  159. 7.90 9.10 7.50 8.90 7.50 8.60 8.10 7.6
  160. 9.30 9.70 8.80 9.70 8.70 9.70 9.50 7.7
  161. 9.50 9.90 8.70 9.70 9.10 9.90 9.50 9.9
  162. 8.10 8.70 7.20 8.70 7.50 7.80 7.40 9.5
  163. 7.80 7.80 7.30 8.60 7.40 7.50 7.10 7.2
  164. 9.70 9.90 9.00 9.70 9.20 10.00 9.60 9.4
  165. 8.10 9.30 7.60 9.00 7.90 8.10 8.00 7.4
  166. 7.80 8.40 7.20 8.10 7.40 7.80 7.10 7.9
  167. 8.50 8.90 7.50 8.80 7.90 8.60 7.70 8.9
  168. 9.30 9.80 9.20 9.40 8.90 9.80 9.10 9.9
  169. 7.90 8.30 7.40 8.60 7.50 7.70 7.30 7.8
  170. 8.20 9.10 8.20 9.00 7.80 8.50 8.10 8.2
  171. 9.40 9.70 8.30 9.10 8.20 9.40 8.40 7.5
  172. 9.00 9.60 9.00 9.50 8.80 9.60 9.40 9.9
  173. 8.60 8.60 8.00 9.10 8.10 9.20 7.70 7.7
  174. 9.40 9.90 9.50 9.80 9.20 10.00 9.40 9.9
  175. 8.20 9.40 8.30 9.20 8.20 9.10 8.80 9.4
  176. 7.90 9.20 7.90 9.00 7.90 8.90 7.70 9.9
  177. 7.90 8.30 7.60 8.80 7.50 8.00 7.20 7.1
  178. 9.40 9.90 9.70 9.70 9.20 10.00 9.40 9.8
  179. 9.10 9.40 8.40 9.20 8.50 9.90 8.80 7.7
  180. 7.90 8.40 7.40 8.60 7.60 8.80 7.50 7.0
  181. 8.80 9.50 8.50 9.70 8.00 9.60 8.90 9.4
  182. 9.80 9.90 9.40 9.90 9.30 9.90 9.70 9.6
  183. 8.30 9.30 7.70 9.20 7.90 9.30 8.60 9.2
  184. 9.70 9.80 8.80 9.70 9.20 9.90 9.50 8.3
  185. 9.00 9.60 8.40 9.40 8.30 9.10 9.00 9.2
  186. 7.20 7.10 7.00 7.50 7.10 7.30 7.00 7.5
  187. 7.70 8.50 7.40 8.70 7.70 8.30 7.30 9.5
  188. 8.20 8.00 7.40 8.40 7.40 8.30 7.20 8.9
  189. 7.40 7.70 7.10 7.80 7.30 7.10 7.20 7.0
  190. 8.30 8.80 7.60 9.10 7.70 8.90 7.80 7.5
  191. 9.80 9.80 9.80 9.90 8.60 10.00 9.90 8.8
  192. 9.80 9.90 9.30 9.80 9.10 10.00 9.50 9.3
  193. 8.70 9.10 8.20 9.10 8.20 9.10 8.20 8.4
  194. 7.90 8.60 7.40 8.50 7.60 8.40 7.30 8.5
  195. 7.50 8.00 7.30 8.00 7.40 8.00 7.10 7.1
  196. 7.20 7.60 7.20 8.00 7.40 7.30 7.00 8.9
  197. 9.50 9.70 8.30 9.60 8.70 9.80 8.70 9.7
  198. 8.30 8.10 7.50 9.00 7.30 7.50 7.20 7.4
  199. 9.50 9.80 9.50 9.70 9.10 9.80 8.80 9.3
  200. 8.40 8.70 8.10 9.20 7.90 8.50 7.30 8.1
  201. 9.80 9.80 8.70 9.60 8.70 9.90 9.40 9.9
  202. 8.70 8.50 7.50 8.40 7.70 8.20 7.30 8.6
  203. 9.70 9.90 8.90 9.80 9.00 9.90 9.20 9.4
  204. 7.80 8.50 8.00 8.80 8.00 9.20 7.30 7.4
  205. 8.30 8.70 7.50 8.40 7.50 8.70 7.20 7.8
  206. 8.00 8.40 7.50 8.60 7.50 7.50 7.20 8.8
  207. 7.50 8.20 7.20 8.50 7.30 8.00 7.10 7.0
  208. 9.70 9.90 9.50 9.80 8.70 10.00 9.90 9.8
  209. 9.70 9.90 9.70 9.90 9.40 10.00 9.80 9.8
  210. 7.00 7.10 7.00 7.20 7.00 7.00 7.00 7.0
  211. 7.50 8.20 7.10 8.40 7.20 7.80 7.10 8.0
  212. 8.60 9.20 8.50 9.20 8.50 9.60 8.40 8.1
  213. 9.00 9.40 7.90 9.50 8.40 9.30 8.20 9.7
  214. 8.40 8.70 7.50 9.20 7.80 8.30 7.70 7.6
  215. 8.00 9.20 7.80 8.90 7.90 8.40 7.30 10.0
  216. 8.50 8.70 8.20 9.40 7.80 9.50 8.20 7.9
  217. 7.20 8.20 7.30 8.30 7.50 7.80 7.10 7.5
  218. 7.20 7.90 7.10 7.90 7.20 7.70 7.00 8.3
  219. 8.30 8.60 7.30 9.00 7.80 8.20 8.10 7.7
  220. 7.20 7.40 7.10 7.80 7.10 7.20 7.00 7.3
  221. 9.20 9.80 8.80 9.50 8.60 10.00 9.30 9.6
  222. 8.40 9.00 7.50 9.10 8.00 8.90 8.00 9.2
  223. 7.30 7.50 7.00 8.00 7.30 7.10 7.00 7.8
  224. 8.40 9.50 8.30 9.40 8.20 9.40 9.20 9.0
  225. 7.60 8.10 7.60 8.60 7.30 8.00 7.10 7.6
  226. 7.60 8.40 7.30 8.40 7.30 8.20 7.10 7.3
  227. 7.40 7.80 7.10 8.00 7.20 7.50 7.10 7.0
  228. 8.70 9.00 8.00 9.40 7.70 8.90 7.80 7.9
  229. 9.50 9.90 9.30 9.60 9.10 9.90 9.50 9.0
  230. 9.30 9.80 8.80 9.60 9.20 9.70 9.40 8.7
  231. 9.80 9.80 9.00 9.70 8.60 10.00 9.30 9.8
  232. 8.20 9.00 7.10 8.90 7.50 8.90 7.50 7.9
  233. 8.00 8.40 7.30 8.40 7.30 7.90 7.40 7.2
  234. 8.80 9.30 8.70 9.20 8.20 9.10 8.20 8.4
  235. 8.70 8.70 7.40 8.90 7.80 9.20 7.60 9.4
  236. 7.10 7.60 7.00 7.70 7.10 7.10 7.00 7.1
  237. 8.60 8.50 7.90 9.20 7.80 9.20 7.40 8.6
  238. 7.70 8.00 7.20 8.50 7.40 8.10 7.10 9.2
  239. 8.10 8.80 7.70 8.90 8.00 9.10 7.90 8.7
  240. 8.40 9.20 8.50 9.50 8.50 9.80 8.20 9.7
  241. 9.20 9.70 9.20 9.60 9.00 9.80 9.60 9.5
  242. 9.90 9.80 9.30 9.80 8.80 9.90 9.80 9.9
  243. 9.60 9.90 8.70 9.60 8.30 9.90 9.30 9.5
  244. 7.00 7.20 7.00 7.30 7.00 7.00 7.00 7.3
  245. 7.60 8.20 7.40 8.90 7.60 8.10 7.30 7.2
  246. 8.30 9.20 7.90 9.10 8.00 9.00 8.00 8.9
  247. 9.60 9.80 8.50 9.50 8.60 9.80 9.20 7.6
  248. 8.50 8.80 7.60 8.80 7.80 8.90 7.40 8.5
  249. 9.80 10.00 9.30 9.90 9.20 9.90 9.90 10.0
  250. 9.50 9.80 9.40 9.50 8.90 10.00 9.70 10.0
  251. 8.50 9.20 8.10 9.10 8.50 9.70 7.70 9.9
  252. 7.40 7.90 7.10 8.20 7.10 7.90 7.30 7.2
  253. 8.00 9.20 7.90 9.10 8.00 8.80 7.30 9.6
  254. 9.20 9.60 8.00 9.50 8.40 9.60 9.50 10.0
  255. 8.80 9.70 8.20 9.50 8.90 9.50 8.20 8.8
  256. 7.10 7.60 7.40 7.80 7.20 7.40 7.00 7.1
  257. 9.00 9.70 8.20 9.50 7.90 9.60 8.60 9.9
  258. 7.60 8.90 8.40 9.20 7.90 8.20 7.60 8.2
  259. 9.70 9.70 9.30 9.70 9.00 9.90 9.60 7.8
  260. 8.20 9.20 8.10 9.00 7.70 9.00 8.60 7.3
  261. 9.00 9.00 8.10 9.30 8.00 10.00 8.70 9.9
  262. 9.10 9.30 8.20 9.50 8.20 9.70 8.50 9.4
  263. 10.00 10.00 9.80 9.90 9.40 10.00 9.90 9.4
  264. 7.50 8.30 7.30 8.30 7.90 7.60 7.20 7.3
  265. 9.80 9.90 9.10 9.40 8.30 9.90 9.20 9.4
  266. 8.90 9.50 8.60 9.60 8.40 9.20 8.00 9.7
  267. 7.90 8.80 7.40 8.50 7.50 8.20 8.10 9.2
  268. 9.30 9.90 9.10 9.60 9.00 9.60 9.50 9.8
  269. 7.80 8.70 7.60 8.70 7.60 9.10 7.30 7.1
  270. 9.00 9.60 8.60 9.20 7.80 9.30 8.10 7.3
  271. 9.50 9.80 8.50 9.30 8.40 9.60 8.90 8.2
  272. 8.70 9.60 8.70 9.10 8.40 9.70 8.40 9.9
  273. 7.90 8.40 7.40 8.40 7.50 7.90 7.30 7.5
  274. 7.00 7.10 7.00 7.60 7.10 7.10 7.00 7.0
  275. 9.20 9.90 8.70 9.70 9.50 9.90 9.60 9.3
  276. 8.90 9.00 7.60 9.20 7.80 9.30 7.70 7.7
  277. 7.80 8.10 7.70 8.60 7.50 8.60 7.20 8.2
  278. 7.80 8.10 7.40 8.10 7.30 8.40 7.10 8.0
  279. 9.40 9.90 9.60 9.70 9.50 10.00 9.80 10.0
  280. 9.30 9.50 8.70 9.50 8.20 9.70 8.90 8.5
  281. 8.40 9.50 8.60 9.20 8.40 9.70 8.60 8.2
  282. 9.70 9.90 9.00 9.90 9.00 10.00 9.70 8.4
  283. 9.00 9.70 8.70 9.40 8.10 9.80 9.10 9.6
  284. 9.30 9.50 8.80 9.70 8.50 9.90 9.50 8.3
  285. 7.90 9.30 8.10 9.20 7.70 9.00 8.40 7.3
  286. 8.80 9.60 8.80 9.50 8.30 9.80 8.50 7.6
  287. 7.40 7.50 7.10 7.80 7.30 7.30 7.00 7.4
  288. 9.70 9.90 8.60 9.80 9.30 10.00 9.70 8.2
  289. 7.80 8.20 7.40 9.00 7.40 7.90 7.20 9.7
  290. 9.20 9.50 8.70 9.60 8.20 9.60 8.80 8.8
  291. 8.30 8.70 7.90 9.10 8.40 9.50 8.40 9.2
  292. 7.80 8.70 7.50 8.30 7.40 8.40 7.40 7.3
  293. 9.80 9.90 9.60 9.90 9.10 10.00 9.80 9.9
  294. 7.90 8.40 7.50 8.50 7.90 8.20 7.50 7.1
  295. 9.00 9.40 8.70 9.60 8.40 9.70 8.70 7.9
  296. 8.40 9.20 8.00 9.00 7.90 9.20 8.40 8.2
  297. 9.70 9.60 9.20 9.50 8.90 9.50 9.40 10.0
  298. 7.30 7.60 7.10 7.70 7.10 7.10 7.00 7.7
  299. 7.80 8.20 7.50 8.20 7.40 7.60 7.20 7.0
  300. 8.40 9.20 8.10 9.30 7.70 8.40 7.70 9.8

為什么不能使用K均值聚類呢?

因為K均值聚類只能對案例做聚類,這個是對變量做聚類

而且K均值聚類需要確定類別數(shù),目前是不知道的

我們是對變量做聚類,冰柱圖看起來太麻煩了,直接看樹狀圖

聚類過程 ,系數(shù)代表距離,距離什么含義,要看我們使用了什么距離指標(biāo)

樹狀圖,233.297換算成下面的25

發(fā)現(xiàn)意大利和東方集團(中國、俄羅斯、羅馬尼亞)聚類有一些問題

變量聚類一般默認距離為相關(guān)性(默認是平方歐氏距離)

得到的結(jié)果好很多

 

這個例子也可以使用因子分析解決

擴展:

一般聚類方法組間聯(lián)接是最好的;ward法聚類出來會比較平均

度量標(biāo)準(zhǔn) :案例--平方歐式距離最好

變量--皮爾遜相關(guān)性最好

關(guān)于標(biāo)準(zhǔn)化問題

K均值聚類需要自己手動

系統(tǒng)聚類如下

 

前面說的兩種方法是經(jīng)典的分析聚類方法,還有智能分析聚類方法

兩步聚類算法(TwoStep Cluster)

特點:

  •  處理對象:分類變量和連續(xù)變量
  • 自動決定最佳分類數(shù)
  • 快速處理大數(shù)據(jù)集 

前提假設(shè):

  • 變量間彼此獨立
  • 分類變量服從多項分布,連續(xù)變量服從正態(tài)分布

 

其實稍微違反假設(shè)條件其實也不要緊,結(jié)果很穩(wěn)健,其會自動剔除異常值

數(shù)據(jù)集還是(我的資源下載“spss之聚類分析--移動通訊客戶細分”

spss使用該模型自動對連續(xù)變量進行標(biāo)化

設(shè)置其最大聚類數(shù)

 

 

聚類需要注意的地方

  • 距離測量方法

使用默認值即可

  • 變量選擇

無關(guān)變量有時會引起嚴重的錯分
應(yīng)當(dāng)只引入在不同類間有顯著差別的變量
盡量只使用相同類型的變量進行分析(使用連續(xù)變量,將分類變量用于結(jié)果解釋;新的聚類方法比如兩步聚類算法可以同時使用這些變量)

  • 共線性問題

對記錄聚類結(jié)果有較大的影響,相當(dāng)于某個變量在聚類中的權(quán)重大于其它變量
最好先進行預(yù)處理

  • 變量的標(biāo)準(zhǔn)化

變量量綱/變異程度相差非常大時需要進行
數(shù)理統(tǒng)計算法上要求一律標(biāo)準(zhǔn)化
標(biāo)準(zhǔn)化后會削弱有用變量的作用

  • 異常值

影響較大
還沒有比較好的解決辦法
盡力避免

  • 分類數(shù)

從實用角度講,2~8類比較合適

  • 專業(yè)意義

一定要結(jié)合專業(yè)知識進行分析

  • 其他方面

聚類分析主要應(yīng)用于探索性的研究,其分析的結(jié)果可以提供多個可能的解,選擇最終的解需要研究者的主觀判斷和后續(xù)的分析
聚類分析的解完全依賴于研究者所選擇的聚類變量,增加或刪除一些變量對最終的解都可能產(chǎn)生實質(zhì)性的影響
不管實際數(shù)據(jù)中是否真正存在不同的類別,利用聚類分析都能得到分成若干類別的解
  

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多