全文鏈接:http:///?p=32840隨著經(jīng)濟的快速發(fā)展和城市化進程的不斷推進,土地資源的利用和管理成為了一項極為重要的任務(點擊文末“閱讀原文”獲取完整代碼數(shù)據(jù))。 相關視頻 而對于全國各省市而言,如何合理利用土地資源以及如何影響GDP,通過科學的方法進行規(guī)劃和管理,是提高土地利用效率的關鍵。 本文旨在應用SPSS Modeler,幫助客戶采用K-means(K-均值)聚類、CHAID、CART決策樹等方法,對31個省市的土地利用情況數(shù)據(jù)進行分析和建模,以期提供科學有效的土地利用規(guī)劃和管理策略。 31省市土地利用情況數(shù)據(jù)數(shù)據(jù)流本文使用的數(shù)據(jù)來自于國家統(tǒng)計局發(fā)布的31省市土地利用情況數(shù)據(jù),選取31個省市作為研究對象,并選取了包括草地、耕地、園地、林地、水域和建設用地等7種土地類型的利用情況數(shù)據(jù)。然后,使用SPSS Modeler進行數(shù)據(jù)清洗、聚類、決策樹等步驟,最終得到模型結(jié)果。 K-means(K-均值)聚類在對完整的數(shù)據(jù)集進行初步分析后,本文采用K-means聚類算法對數(shù)據(jù)集進行聚類分析。在聚類過程中,我們首先需要確定聚類的個數(shù)k。根據(jù)肘部法則和輪廓系數(shù)法則,我們得出最終選擇k=5為較為合適的聚類數(shù)目。通過SPSS Modeler的K-means節(jié)點進行計算,得到了以下聚類概況、聚類類別和散點圖結(jié)果。 |
|
來自: 拓端數(shù)據(jù) > 《待分類》