SPSS新手教程——进行距离分析的方法
我們在使用IBM SPSS Statistics來進行數據分析的時候,難免會遇上這種情況:變量非常多,多到我們不能對其一一控制的地步,但每個變量都有分析的價值,同時又彼此重疊。這個時候最直接的方法就是把所有變量按照一定的標準來進行分類,今天要介紹的距離分析,便可以提供這一標準。距離,意思是對變量之間的相似度或非相似度的一種測量方式。
距離分析可以分為相似度測量與非相似度測量兩大類,相似度測量主要分析變量的相似程度,而不相似度測量則相反,測量變量的不相似程度。
今天要給大家示范的是,以我國各省農產品種植面積為例 ,對7個變量進行距離分析的具體步驟。接下就來讓我們來看一看,在Windows10操作系統上,IBM SPSS Statistics是如何進行距離分析的吧。
如圖1所示,打開SPSS的界面,在菜單欄中依次找到【分析】- -?【相關】- -?【距離】。
圖1:進入距離設置頁面
首先我們要選擇進行距離分析的變量,這里要注意的一點是:在變量列表框里我們應該至少寫入兩個變量。如圖2所示,為了詳細分析圖中的數據,這里我們要寫入全部7個變量。
圖2:寫入變量
寫入了變量,接著就要寫入個案標注依據,在今天的這個例子中,個案標注依據是【地區】。變量和標注依據都填好了后,就該配置距離分析的各種參數了。在個案標注依據下面的是計算距離選項框,分別有個案間和變量間兩個選項,如果在此處勾選【個案間】,我們的輸出結果就會是個案之間的距離,如果勾選的是【變量間】,我們的輸出結果就會是變量之間的距離。因為前一步加入了7個變量,這里需要選擇【變量間】選項。接下來在測量選項卡里有相似性與非相似性兩個選項,我們選擇【相似性】選項,如圖3所示。
圖3:計算距離選項與相似性選項
然后在測量選項卡中點擊“測量”進行進一步配置,在【區間】- -?【測量】下拉框中選擇皮爾遜相關性,接著在【轉換值】- -?【標準化】下拉框中選擇Z得分并勾選【按變量】,設置完了單擊繼續,如圖4所示。
圖4:相似性測量詳細設定
設定好后單擊確定,我們就得到了SPSS的輸出結果,如圖5所示。
圖5:SPSS的距離分析輸出結果
在相似性矩陣中的數值越接近1,變量間的相似性就越高,說明越相似。在圖中相似度最高的一組變量是瓜果和蔬菜,距離為0.627,從圖中我們可以看出有的數值是1,這表示完全相同。
如果在【測量】選項卡中選擇非相似性,則最后得到的結果為非相似性矩陣,它與相似性矩陣相反,也就是說距離越接近0相似性越大,非相似性數值越大,說明越不相似。
通過距離分析我們可以得到變量間的相似系數,大家下次再遇到多個彼此重疊的變量時,不妨用SPSS的距離分析功能來試一試。
總結
以上是生活随笔為你收集整理的SPSS新手教程——进行距离分析的方法的全部內容,希望文章能夠幫你解決所遇到的問題。