日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

分类变量 哑变量矩阵 指标矩阵_不懂数据集重排序?分类变量转换苦难?4种python方法,不再难!...

發布時間:2025/3/19 python 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 分类变量 哑变量矩阵 指标矩阵_不懂数据集重排序?分类变量转换苦难?4种python方法,不再难!... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前言

數據排序、分類變量轉換是數據處理與分析中常常遇到對場景,且需要有準確的判斷以及準確的處理方式,否則會影響數據質量,產生臟數據,進而影響數據呈現效果或預測效果等,更別提機器學習與深度學習準確性等系列問題。小編接下來會針對python方法在該場景的應用做具體介紹。

排列和隨機采樣

利用numpy.random.permutation函數可以輕松實現對Series和DataFrame的列的排列工作(permuting,隨機重排序)。通過需要排列的軸的長度調用permutation,可產生一個表示新順序的整數數組:

1.使用permutation()進行排列

我們先使用DataFrame創建一個5行4列的數據集,然后使用numpy.random.permutation函數進行重新排序,具體如下:

2.使用take函數對數據集進行重排序

通過下面對例子可以清楚理解take函數對作用。sampler是np.random.permutation()生成對隨機數組,然后將這個對象傳入到take函數中,作用于對象數據集,具體如下所示:

In [8]: df Out[8]: 0 1 2 3 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11 3 12 13 14 15 4 16 17 18 19In [9]: df.take(sampler) Out[9]: 0 1 2 3 0 0 1 2 3 1 4 5 6 7 4 16 17 18 19 3 12 13 14 15 2 8 9 10 11

如果不想用替換的方式選取隨機子集,則可以使用permutation:從permutation返回的數組中切下前k個元素,其中k為期望的子集大小。

In [10]: df.take(np.random.permutation(len(df))[:3]) Out[10]: 0 1 2 3 3 12 13 14 15 2 8 9 10 11 0 0 1 2 3

3.獲取隨機整數:np.random.randint

要通過替換的方式產生樣本,最快的方式通過np.random.randint得到一組隨機整數:

In [11]: ba=np.array([5,7,-1,6,4]) In [12]: ba Out[12]: array([ 5, 7, -1, 6, 4]) In [13]: sampler=np.random.randint(0,len(ba),size=10) In [14]: sampler Out[14]: array([1, 3, 1, 3, 1, 2, 3, 4, 2, 0]) In [15]: draws=ba.take(sampler) In [16]: draws Out[16]: array([ 7, 6, 7, 6, 7, -1, 6, 4, -1, 5])

計算指標/啞變量

另一種常用于統計建模或機器學習的轉換方式是:將分類變量轉換為“啞變量矩陣”或“指標矩陣”。如果DataFrame的某一列中含有k個不同的值,則可以派生出一個k列矩陣或DataFrame(其值權威1和0).pandas有一個get_dummies函數可以實現該功能。

In [17]: df=DataFrame({'key':['b','b','a','c','a','b'],'data1':range(6)}) In [18]: df Out[18]: key data1 0 b 0 1 b 1 2 a 2 3 c 3 4 a 4 5 b 5 In [19]: df['key'] Out[19]: 0 b 1 b 2 a 3 c 4 a 5 b Name: key, dtype: object

使用get_dummies()將分類變量轉換為“啞變量矩陣”

In [20]: pd.get_dummies(df['key']) Out[20]: a b c 0 0 1 0 1 0 1 0 2 1 0 0 3 0 0 1 4 1 0 0 5 0 1 0

總結

數據處理與分析的方法豐富且場景復雜,針對不同的應用情況,選擇適合的方法是最恰當且能解決實際問題的。希望大家從中有所收益,實踐中多體會和沉淀,感謝大家支持!記得關注哦!

總結

以上是生活随笔為你收集整理的分类变量 哑变量矩阵 指标矩阵_不懂数据集重排序?分类变量转换苦难?4种python方法,不再难!...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 岛国片在线免费观看 | 色老板精品凹凸在线视频观看 | 成人中文视频 | 激情六月天 | 91se在线| 国产男女猛烈无遮挡免费视频动漫 | 国产精品电影网站 | 最好看的2019中文大全在线观看 | 91大尺度| 国产wwwwwww| 天天久| 明日花绮罗高潮无打码 | 中文字幕精品国产 | 亚洲欧洲免费 | 日韩精品久久久久久久酒店 | 日韩特级黄色片 | 69性视频 | 久久久久久www | 日韩一级影片 | 久久久久久久av | 国产精品久久视频 | 男女互插视频 | 怡红院国产| 中国特级黄色大片 | 亚洲一区二区三区欧美 | 日韩av一二区| 日批网站在线观看 | 精品女厕偷拍一区二区 | 欧美多人猛交狂配 | 日本妇乱大交xxxxx | 久久婷婷综合色 | 久久精品成人av | 四虎午夜| 日本午夜三级 | 伊人久久久久噜噜噜亚洲熟女综合 | 久久久久久蜜桃 | 自拍偷拍亚洲天堂 | 先锋影音av中文字幕 | 香蕉久久夜色精品国产使用方法 | 亚洲视频一| 自拍偷拍第一页 | 亚洲国产日韩一区二区 | 亚洲一区二三区 | 日韩在线视频中文字幕 | 欧美性猛交ⅹ乱大交3 | 久久精品欧美一区二区三区不卡 | 请用你的手指扰乱我吧 | 国产成人久久777777 | 女人喂男人奶水做爰视频 | 黄色网入口| 国产一级在线 | 自拍偷拍精品视频 | 亚洲第一二三区 | 饥渴少妇伦色诱公 | 潘金莲一级淫片免费放动漫 | 这里只有精品免费视频 | 狠狠干综合 | 国产午夜精品久久久 | 成人在线视频免费观看 | 生活片av | 欧美做受高潮 | 91pron在线| 一区二区少妇 | 最近中文字幕在线中文视频 | 色偷偷网站 | 久久av高潮av | 久久精品资源 | 欧美日韩成人在线视频 | 深夜久久 | 91蝌蚪 | 最近更新中文字幕 | 国产成人久久婷婷精品流白浆 | 精品久久久久久久久久久久久久久久久久 | 丰满人妻一区二区三区免费视频棣 | 亚洲自拍偷拍色图 | 波多野结衣之潜藏淫欲 | 国产精品久久久久aaaa | 片多多在线观看 | 黄色av高清| 天美麻花果冻视频大全英文版 | 亚洲精品国产精品乱码视色 | 久青草视频 | 香蕉在线观看 | 成人性生交视频免费观看 | 五月婷婷俺也去 | 公侵犯一区二区三区四区中文字幕 | 国产一卡二卡在线播放 | 69成人免费视频 | 精品国产一区在线 | 欧美顶级少妇做爰hd | 天天舔天天干天天操 | 国产精品成人一区二区三区电影毛片 | 国产剧情精品在线 | 亚洲午夜无码久久 | 国产一区二 | 嫩草影院污 | 成人精品三级av在线看 | 精品少妇一二三区 | 女人性做爰69片免费看 |