日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

离散度计算公式 python_被多种离散化场景困扰?8种python技巧!让数据处理更简单...

發布時間:2025/3/21 python 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 离散度计算公式 python_被多种离散化场景困扰?8种python技巧!让数据处理更简单... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前言

python數據處理與分析學習過程中,需要有這樣的一種意識,即元“為什么選擇了python而不是其他?”既然選擇了python,那么在實際應用中,它到底哪里不一樣?大家說的方便、快捷、高復用性具體體現在哪里?帶著問題進行學習,會有事半功倍的效果,記憶力和識別能力也會有所提高。

在本文,小編跟大家分享的是數據處理與分析中的“離散化或面元”。8種python技巧,讓連續數據離散化更簡潔。

8種python技巧

為了便于分析,連續數據常常被離散化或拆分為“面元“(bin),假設有一組人員數據,而你希望將它們劃分為不同的年齡組:

In [154]: ages=[20,22,25,27,21,23,37,31,61,45,41,32]

離散化或面元:cut()

接下來將這些數據劃分為“18到25“、”26到35“、”35到60“以及”60以上“幾個面元。要實現此功能,需要使用pandas的cut函數:

n [24]: ages=[20,22,25,27,21,23,37,31,61,45,41,32]

In [25]: bins=[18,25,35,60,100]

In [26]: cats=pd.cut(ages,bins)

In [27]: cats

Out[27]:

[(18, 25], (18, 25], (18, 25], (25, 35], (18, 25], ..., (25, 35],

(60, 100], (35, 60], (35, 60], (25, 35]]

Length: 12

Categories (4, interval[int64]): [(18, 25] < (25, 35] < (35, 60] < (60, 100]]

codes屬性:標號

In [29]: cats.codes

Out[29]: array([0, 0, 0, 1, 0, 0, 2, 1, 3, 2, 2, 1], dtype=int8)

value_counts方法

該方法會按照離散化或面元結果,進行符合區間的值統計,具體使用方法如下:

In [30]: pd.value_counts(cats)

Out[30]:

(18, 25] 5

(35, 60] 3

(25, 35] 3

(60, 100] 1

dtype: int64

控制開/關:right=False

跟“區間“的數學符號一樣,圓括號表示開端,而方括號則表示閉端(包括)。哪邊是閉端可以通過right=False進行修改:

In [31]: pd.cut(ages,[18,26,36,61,100],right=False)

Out[31]:

[[18, 26), [18, 26), [18, 26), [26, 36), [18, 26), ..., [26, 36),

[61, 100), [36, 61), [36, 61), [26, 36)]

Length: 12

Categories (4, interval[int64]): [[18, 26) < [26, 36) < [36, 61) < [61, 100)]

設置面元名稱:labels

設置自己的面元名稱,將labels選項設置為一個列表或數組即可:

In [33]: group_names=['Youth','YoungAdult','MiddleAged','Senior']

In [34]: pd.cut(ages,bins,labels=group_names)

Out[34]:

[Youth, Youth, Youth, YoungAdult, Youth, ..., YoungAdult,

Senior, MiddleAged, MiddleAged, YoungAdult]

Length: 12

Categories (4, object): [Youth < YoungAdult < MiddleAged < Senior]

計算等長面元

如果向cut傳入的是面元的數量而不是確切的面元邊界,則它會根據數據的最小值和最大值計算等長面元。下面這個例子中,將一些均勻分布的數組分成四組:

In [35]: data=np.random.rand(20)

In [36]: pd.cut(data,4,precision=2)

Out[36]:

[(0.039, 0.27], (0.27, 0.5], (0.73, 0.95], (0.5, 0.73],

(0.039, 0.27], ..., (0.5, 0.73], (0.27, 0.5], (0.73, 0.95],

(0.039, 0.27], (0.73, 0.95]]

Length: 20

Categories (4, interval[float64]): [(0.039, 0.27] < (0.27, 0.5]

< (0.5, 0.73] < (0.73, 0.95]]

qcut()

qcut是一個非常類似于cut的函數,它可以根據樣本分位數對數據進行面元劃分。根據數據的分布情況,cut可能無法使各個面元中含有相同數量的數據點。而qcut由于使用的是樣本分位數,因此可以得到大小基本相等的面元:

In [37]: data=np.random.randn(1000)

In [38]: cats=pd.qcut(data,4)

In [39]: cats

Out[39]:

[(-0.66, -0.0518], (0.68, 3.328], (-0.66, -0.0518], (0.68, 3.328],

(-3.452, -0.66], ..., (-3.452, -0.66], (0.68, 3.328], (-3.452, -0.66],

(-0.66, -0.0518], (-3.452, -0.66]]

Length: 1000

Categories (4, interval[float64]): [(-3.452, -0.66] < (-0.66, -0.0518]

< (-0.0518, 0.68] < (0.68, 3.328]]

In [40]: pd.value_counts(cats)

Out[40]:

(0.68, 3.328] 250

(-0.0518, 0.68] 250

(-0.66, -0.0518] 250

(-3.452, -0.66] 250

設置自定義分位數

跟cut一樣,也可以設置自定義的分位數(0到1之間的數值,包含端點):

總結

離散化或面元是數據處理與分析中的常用方法。python提供了便捷、豐富的方法。該類方法通常是解決數據分析、機器學習或深度學習中,需要將連續性變量離散化的場景。8種不同的技巧均有其適用場景,無好與壞之分。大家可以實踐操作進行體驗,感謝大家關注!

總結

以上是生活随笔為你收集整理的离散度计算公式 python_被多种离散化场景困扰?8种python技巧!让数据处理更简单...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产乱码久久久 | 久久中文字幕视频 | 国产一区一区 | 日一区二区| 爆乳熟妇一区二区三区 | 国产睡熟迷奷系列精品视频 | 台湾一级视频 | xxxⅹ少妇少妇xxxx | 色秀视频网 | 91在线精品观看 | 宗合久久 | 精品人妻av一区二区 | 青青草原在线免费观看视频 | 99久久久国产精品无码网爆 | 亚洲av久久久噜噜噜熟女软件 | 欧美日韩亚洲高清 | 久久久av网站 | 另类图片亚洲色图 | 懂色av一区二区三区免费 | 91丨porny丨国产入口 | 日韩中文字幕电影 | 女人毛片视频 | 97视频在线观看免费高清完整版在线观看 | 欧美亚洲色综久久精品国产 | 久久久久国产精品国产 | www.xxx国产| 我和我的太阳泰剧在线观看泰剧 | 国产丝袜在线播放 | 天天做天天看 | 日韩和一区二区 | 神马午夜在线观看 | 亚洲一级Av无码毛片久久精品 | 成年人香蕉视频 | 国产亚洲一区二区三区在线观看 | 亚洲一二三区在线观看 | 亚洲人成高清 | 永久av免费在线观看 | 精品少妇3p| 亚洲Av无码成人精品区伊人 | 天堂精品| 一级片久久 | 日韩一级色 | 欧美顶级少妇做爰 | 免费观看在线观看 | av电影在线网站 | 久久久一二三区 | mm131丰满少妇人体欣赏图 | 粉嫩av网 | 小sao货大ji巴cao死你 | 动漫美女被吸乳奶动漫视频 | 亚洲黄色免费网站 | 成人永久视频 | 欧美人妖乱大交 | 成人手机在线免费视频 | 中文字幕在线观看网址 | 国产日韩在线看 | av大片网站 | 欧美人与动物xxxx | 女色综合| www.亚洲 | 欧美午夜久久 | 欧美日本一区二区三区 | 成熟丰满熟妇高潮xxxxx视频 | 四虎免费av | 女教师高潮黄又色视频 | 国偷自拍 | 在线亚洲观看 | av特黄 | 国产精品77 | 精品人妻无码一区二区性色 | 中文字幕.com| 无码毛片aaa在线 | 免费国产一区二区 | 国产做爰xxxⅹ高潮视频12p | 欧美精品一线 | 亚洲一区欧洲一区 | 自偷自拍av | 亚洲免费中文字幕 | 成年人激情网站 | 欧美tv | 激情黄色小说网站 | 欧美日韩国产中文字幕 | 九月丁香婷婷 | 天海翼视频在线观看 | 国产高潮av| 精品爆乳一区二区三区无码av | 夜色成人 | 中文在线观看高清视频 | 国产精品人人爽 | 国产伦精品一区二区三 | 婷婷伊人网 | 日韩图片一区 | 久草福利资源 | 久久看看| 97免费在线视频 | 日韩五码在线 | 国产精品日韩一区二区三区 | 海角国产乱辈乱精品视频 | 天天综合中文字幕 |