日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

相关系数之皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数(评价线性关系的相关系数)(第一部分)

發布時間:2023/12/3 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 相关系数之皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数(评价线性关系的相关系数)(第一部分) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

0.前言

一開始學這里的時候我感覺真的完犢子了,因為這部分的內容涉及到了概率論和數理統計的東西,概率論和數理統計雖然我現在在學,但我學的一團糟,翻書也毫無頭緒,完了,現在就寫一寫自己怎么學的這兩個系數,關于這些系數有什么用怎么算,兩個方面。

1.回顧概率論與數理統計的一些知識點

首先是關于總體均值和總體協方差的計算,公式貼出來。

至于有什么用?都懂均值啥意思吧?先說說協方差吧

直觀理解協方差:如果XY變化方向相同,即當X大于(小于)其均值時,Y 大于(小于)其均值,在這兩種情況下,乘積為。如果X、Y的變化方向一直 保持相同,則協方差為正;同理,如果X、Y變化方向一直相反,則協方差為 如果X、Y變化方向之間相互無規律,即分子中有的項為正,有的項為負,那么 累加后正負抵消。

3.Pearson相關系數

接著就是這個Pearson相關系數的公式了

3.1.總體皮爾遜Pearson相關系數

皮爾遜相關系數也可以看成是剔除了兩個變量量綱影響,即將XY標準化后的協方差。

3.2.樣本皮爾遜Pearson相關系數

?麻了...看到這里頭都大了,一個總體person相關系數,一個樣本person相關系數,都有啥用?為啥要分總體和樣本呢?

首先我們要了解總體和樣本的概念:

總體指的是考察對象的全部個體,我們也總是希望得到總體數據的一些特征(均值方差之類的)

樣本指的是從總體中抽取的一部分個體

?知道了概念,我們了解到樣本數據相當于是總體數據的一個子集,當總體過大時,數據的處理將會變得異常困難,這時候樣本數據將會起到一個節省數據處理成本的一個作用。

例如使用樣本均值、樣本標準差來估計總體的均值(平均 水平)和總體的標準差(偏離程度)。

?一個總體person相關系數,一個樣本person相關系數,那都有啥用?問題又回到了這里,這些細小的差距,使用上需要注意什么?

?我們看下面這一組的散點圖,上面數字為相關系數的值

可以看出,相關系數越靠近1或-1則導致了圖像越是一個正相關與負相關的圖像

我們再看下面一組圖

可以看出異常點對于person相關系數的影響是巨大的?

通過這兩個圖我們可以得出一個結論:

這里的相關系數只是用來衡量兩個變量線性相關程度的指標;

也就是說,你必須先確認這兩個變量是線性相關的,然后這個相關系數才能告訴你他倆相關程度如何。 講人話就是:先畫散點圖,再BB相關系數 那怎么畫圖? 來點小例題吧..

4.樣本散點圖繪制

?4.1例題1

4.1.1要算person相關系數要先算描述性指標作出描述性統計的表格

?一般計算描述性指標有三種方法:Excel,MTALAB,SPSS

這里就只介紹MATLAB和SPSS的方法

  • MIN = min(Test); ?% 每一列的最小值
  • MAX = max(Test); ? % 每一列的最大值
  • MEAN = mean(Test); ?% 每一列的均值
  • MEDIAN = median(Test); ?%每一列的中位數
  • SKEWNESS = skewness(Test); %每一列的偏度
  • KURTOSIS = kurtosis(Test); ?%每一列的峰度
  • STD = std(Test); ?% 每一列的標準差
  • RESULT = [MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD] ?%將這些統計量放到一個矩陣中表示

執行后就可以得到一個描述性統計的表格,后續可到Excel中進行精簡處理

????0.1350 ? ?0.0160 ? ?1.4500 ? ?0.0078 ? ?0.0520 ? ?0.0005
? ? 0.1710 ? ?0.0650 ? ?3.2720 ? ?0.0150 ? ?0.2050 ? ?0.0175
? ? 0.1560 ? ?0.0468 ? ?2.3332 ? ?0.0108 ? ?0.1668 ? ?0.0095
? ? 0.1570 ? ?0.0470 ? ?2.3910 ? ?0.0107 ? ?0.1670 ? ?0.0096
? ?-0.0003 ? -0.0004 ? -0.0003 ? ?0.0007 ? -0.0008 ? -0.0002
? ? 0.0027 ? ?0.0094 ? ?0.0028 ? ?0.0033 ? ?0.0084 ? ?0.0028
? ? 0.0074 ? ?0.0050 ? ?0.3504 ? ?0.0013 ? ?0.0168 ? ?0.0029

?而SPSS則沒這么復雜,通過分析->描述統計->描述

4.1.2散點圖繪制

在計算皮爾遜相關系數之前,一定要做出散點圖來看兩組變量之間是否有線性關系 這里使用Spss比較方便:?圖形 舊對話框 散點圖/點圖 矩陣散點圖

?

?將指標移入后直接確定,出圖:

?啊這...這散點圖看得我頭皮疼,這有什么用,好像也看不出有沒有線性關系,但不管了,先做吧..

4.1.3person相關系數計算

  • R = corrcoef(Test) ? % correlation coefficient

執行后可得一個相關系數表格,可在Excel中進行后續的美化

???1.0000 ? ?0.0665 ? -0.2177 ? -0.1920 ? ?0.0440 ? ?0.0951
? ? 0.0665 ? ?1.0000 ? ?0.0954 ? ?0.0685 ? ?0.0279 ? -0.0161
? ?-0.2177 ? ?0.0954 ? ?1.0000 ? ?0.2898 ? ?0.0248 ? -0.0749
? ?-0.1920 ? ?0.0685 ? ?0.2898 ? ?1.0000 ? -0.0587 ? -0.0019
? ? 0.0440 ? ?0.0279 ? ?0.0248 ? -0.0587 ? ?1.0000 ? -0.0174
? ? 0.0951 ? -0.0161 ? -0.0749 ? -0.0019 ? -0.0174 ? ?1.0000????????

?先到這吧..

總結

以上是生活随笔為你收集整理的相关系数之皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数(评价线性关系的相关系数)(第一部分)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。