日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

简单数据分布分析及python实现

發(fā)布時間:2025/3/21 python 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 简单数据分布分析及python实现 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

簡單數(shù)據(jù)分布分析及python實現(xiàn)

  • 數(shù)據(jù)集中趨勢分析
    • 平均值
    • 中位數(shù)
    • 眾數(shù)
    • 分位數(shù)
  • 數(shù)據(jù)離中趨勢分析
    • 標準差
    • 方差
  • 數(shù)據(jù)的分布分析
    • 正態(tài)分布
    • 卡方分布(x^2^分布)
    • t分布
    • f分布

數(shù)據(jù)集中趨勢分析

數(shù)據(jù)集中趨勢分析是為了衡量數(shù)據(jù)的集中程度,常用的集中趨勢衡量指標包括數(shù)據(jù)的平均值中位數(shù)眾數(shù)分位數(shù)。平均值和中位數(shù)多作為連續(xù)數(shù)據(jù)的衡量指標,眾數(shù)多作為離散數(shù)據(jù)的衡量指標。

平均值

python實現(xiàn)。

import pandas as pd import numpy as np df = pd.DataFrame(np.random.randint(1,100,100).reshape((25,4))) df.mean(axis = 0) #計算每列的平均值 df.mean(axis = 1) # 計算每行的平均值

中位數(shù)

中位數(shù)是按順序排列的一組數(shù)據(jù)中位于中間位置的那個數(shù),當數(shù)據(jù)個數(shù)為奇數(shù)時,中位數(shù)即為正中間的那個數(shù),當數(shù)據(jù)個數(shù)為偶數(shù)時,中位數(shù)即為中間兩個數(shù)的平均值,python實現(xiàn)如下:

import pandas as pd import numpy as np df = pd.DataFrame(np.random.randint(1,100,100).reshape((25,4))) df.median(axis = 0) # 計算每列的中位數(shù) df.median(axis = 1) # 計算每行的中位數(shù)

眾數(shù)

眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,代表該組數(shù)據(jù)的集中趨勢點,一組數(shù)據(jù)中的眾數(shù)可能有多個。python實現(xiàn)如下:

import pandas as pd import numpy as np df = pd.DataFrame(np.random.randint(1,100,100).reshape((25,4))) df.mode(axis = 0) # 計算每列的眾數(shù) df.mode(axis = 1) # 計算每行的眾數(shù)

分位數(shù)

分位數(shù)也稱為分位點,即對一組數(shù)據(jù)進行從到大小排列后,按照該組數(shù)據(jù)的分布范圍進行等分,一般最常用的是進行四等分,處于25%位置的數(shù)字稱為下四分位數(shù),處于50%位置的數(shù)字稱為中位數(shù),處于75%位置的數(shù)字稱為上四分位數(shù)。python實現(xiàn)如下:

import pandas as pd import numpy as np df = pd.DataFrame(np.random.randint(1,100,100).reshape((25,4))) df.quantile(axis = 0,q = 0.25) # 計算每列的下四分位數(shù) df.quantile(axis = 1,q = 0.25) # 計算每行的下四分位數(shù)

數(shù)據(jù)離中趨勢分析

數(shù)據(jù)的離中趨勢用來衡量數(shù)據(jù)的離散程度,常用的衡量指標有標準差方差

標準差


式中: μ為算術平均值,σ為標準差。
python實現(xiàn)如下:

df = pd.DataFrame(np.random.randint(1,100,100).reshape((25,4))) df.std(axis = 0) # 計算每列的標準差 df.std(axis = 1) # 計算每行的標準差

方差


式中:s2為方差,μ為算術平均值。
python實現(xiàn)如下:

df = pd.DataFrame(np.random.randint(1,100,100).reshape((25,4))) df.var(axis = 0) # 計算每列的方差 df.var(axis = 1) # 計算每行的方差

數(shù)據(jù)的分布分析

正態(tài)分布


式中:μ為算術平均值,σ為標準差

python實現(xiàn)如下:

import scipy.stats as ss norm_sample = ss.norm(0,1) #建立均值為0,標準差為1的正態(tài)分布 norm_sample.pdf([0,2,-2]) # 概率密度計算函數(shù) norm_sample.cdf([0,2,-2]) # 累積分布概率計算函數(shù) norm_sample.ppf([0.9,0.95,0.98]) # 累積分布概率計算反函數(shù)

卡方分布(x2分布)


式中:n為自由度,Γ(x)表示伽馬函數(shù)。
python實現(xiàn)如下:

import scipy.stats as ss norm_sample = ss.chi2(3) #建立自由度為3的卡方分布 norm_sample.pdf([0,2,10]) # 概率密度計算函數(shù) norm_sample.cdf([0,2,10e5]) # 累積分布概率計算函數(shù) norm_sample.ppf([0.9,0.95,0.98]) # 累積分布概率計算反函數(shù)

t分布


式中:n為自由度,Γ(x)表示伽馬函數(shù)。
python實現(xiàn)如下:

import scipy.stats as ss norm_sample = ss.t(3) #建立自由度為3的t分布 norm_sample.pdf([0,2,-2]) # 概率密度計算函數(shù) norm_sample.cdf([0,2,-2]) # 累積分布概率計算函數(shù) norm_sample.ppf([0.9,0.95,0.98]) # 累積分布概率計算反函數(shù)

f分布


式中:m和n為自由度,Γ(x)表示伽馬函數(shù)。
python實現(xiàn)如下:

import scipy.stats as ss norm_sample = ss.f(4,3) #建立自由度,43的f分布 norm_sample.pdf([0.1,2,10]) # 概率密度計算函數(shù) norm_sample.cdf([0.1,2,10e5]) # 累積分布概率計算函數(shù) norm_sample.ppf([0.9,0.95,0.98]) # 累積分布概率計算反函數(shù)

by CyrusMay 2020 04 07
“你問我全世界是哪里最美,答案是你身邊”
——————五月天——————

總結(jié)

以上是生活随笔為你收集整理的简单数据分布分析及python实现的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。