SPSS新手教程—两步聚类之结果解读
在《詳解SPSS兩步聚類之參數設置》一文中,我們已經了解了兩步聚類的優點、分析原理,以及參數設置的技巧。
在本節中,會對IBM SPSS Statistics聚類后的結果進行解讀,其中會涉及到最終聚類的結果、聚類的質量、變量重要性、聚類特征的解讀。
如圖1所示,我們先來回顧下本例數據在參數設置面板中的詳細設置。
圖1:二階聚類設置
一、數值結果
根據上述參數設置,得到如下的數值分析結果。
首先看到自動聚類結果,如圖2所示為聚類的透視表結果,展示了不同聚類數目下的BIC、BIC變化量、BIC變化比例與距離測量比率。SPSS會自動綜合以上指標的數值,得出最佳的聚類數目。
圖2:自動聚類
根據圖2的自動聚類透視表結果,SPSS得出了如圖3所示的一個3聚類的結果。其中聚類1包含69個個案,占總計34.8%;聚類2包含62個個案,占總計31.3%;聚類3包含67個個案,占總計33.3%。
圖3:聚類分布
二、圖表結果
接下來,我們再來看看二階聚類的圖表結果。
如圖4所示,在模型概要中,顯示該模型執行了兩步聚類,輸入了6個變量,得到3個聚類。另外,其聚類質量為良好。
圖4:模型概要
如圖5所示,右擊模型概要,選擇“編輯”選項,打開模型查看器,可進一步查看其它的輔助視圖。
圖5:編輯圖表
如圖6所示,在模型查看器的左側包含了模型概要視圖,右側包含了預測變量重要性視圖。而通過單擊右側視圖下方的查看選項,可切換聚類大小、聚類特征等視圖。
首先看到的是預測變量重要性視圖,可以看到,星級是最為重要的變量、其次是銷售額與銷售量。
圖6:預測變量重要性
而從聚類大小看到,3個聚類的占比相似,最大聚類與最小聚類的比值為1.11。
圖7:聚類大小
如果想了解不同聚類的特征,可從如圖8所示的聚類特征表中得到相關的信息。聚類特征表展示的是聚類與變量的交叉分析,其數值展示的是分類變量的分布或連續變量的中心點,由此可得出不同聚類的顯著特征。
比如,聚類2是五星級占比100%,銷售額、銷售量、客流量中心點最大、所處區域為3(占比38.7%)的店鋪類型。
圖8:聚類特征表
三、小結
綜上所述,SPSS的兩步聚類分析解讀,可先從BIC準則判斷最佳的聚類數目,然后,再從模型概要得到聚類質量。
在確認聚類質量可接受的前提下,可通過模型查看器進一步解讀聚類變量的重要性、聚類特征等。
總結
以上是生活随笔為你收集整理的SPSS新手教程—两步聚类之结果解读的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python学习之==第三方模块的安装、
- 下一篇: msf