数据分析结果解读_聚类分析的实际运用及案例解读(二)
作者:么鈺兒?? 封面:吉江
引言各位SPSS學堂粉絲大家好,我是SPSS學堂的么鈺兒,本期繼續要給大家介紹的是聚類分析的實際運用及相關典型案例解讀。上一期已經講過了K-means聚類分析的實際應用及案例解讀,這一期我們接著來講系統聚類的實際應用與案例解讀~
系統聚類的實際應用及案例解讀
方法原理:先把N個對象看做是N,然后把相鄰的兩個對象聚為一類,如此反復,逐層遞進,直到最后所有的對象都聚為一類。層次聚類既可以對變量、也可以對案例進行聚類。其聚類過程可以用一個樹形圖加以描述。
案例:
探索來自中國、美國、法國等7個國家的裁判和1個體操愛好者,在打分傾向上是否存在著差異和偏向?
我們的假設:
1. 愛好者的打分肯定顯著有別于7個國家的裁判;
2.7個國家內部存在著東西方陣營的區別。
要驗證這個假設,就需要用到系統聚類法。
通過將八個變量全部選入,對“變量”進行分群,勾選“樹狀圖”,如圖所示。
注:公眾號回復20201204即可獲取數據
聚類結果
第一次嘗試的結果:結果不佳。第一,意大利被聚合在東方陣營中;第二,8號的業余愛好者和7個專業裁判之間差別不大,即一個距離大概為20,一個大概為14。
么鈺兒
究其原因:應該用相關系數來進行聚類,不能用歐氏距離~
第二次嘗試,將“方法”中“區間”改為“pearson相關性”,而不是選擇“Euclidean距離”,點擊確定。
聚類結果
第二次嘗試的結果:效果很好,假設得到驗證:1.專業和業余之間差距明顯;2. 東西方陣營彼此有差距。
么鈺兒
此外,系統聚類還有一個特別經典的用法,鑒于篇幅關系,咱們將在下一篇詳細說明,敬請期待~
補充:
1.樣本少沒關系,樣本質量高,思路巧妙,也能做一個研究
2.嚴格地說,聚類不是一種純粹的統計技術,它不像其他多元分析方法一樣,需要從樣本去推斷總體。一般不涉及到有關統計量的分布,也不需要進行顯著性檢驗。
3.聚類方法本質上是一個探索性方法,究竟聚為幾類,需要不斷探索和摸索,最終找到一個專業上最易解釋、最符合專業知識的類型。
4.聚類之后,做有序logistic回歸,或者判別分析,你的研究會提高更多
SPSS學堂出書啦!(點擊獲知詳情)
點擊下方鏈接購買:?
學堂君的歷史合輯:
菜鳥系列問卷設計與統計分析量表信效度分析線性回歸Logistic回歸曲線回歸聚類分析時間序列常見問題神經網絡多維尺度分析C4.5算法生存分析正態檢驗對應分析問卷數據分析權重賦值判別分析潛在類別模型調節效應與中介效應分析KNN算法調節中介典型相關分析統計方法選擇ROC曲線分析Meta分析結構方程模型精品推文匯總SPSS實現機器學習在信用風險識別中的應用歡迎添加:
【數據分析服務】請點擊菜菜幫工作室正式上線
【社群服務助手】請點擊SPSS學堂會員3群招募
【加入團隊】請點擊招募,我們是認真的!
總結
以上是生活随笔為你收集整理的数据分析结果解读_聚类分析的实际运用及案例解读(二)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python pymysql curso
- 下一篇: 二叉树 跳表_面试题之跳表