【Python】30个Pandas高频使用技巧
公眾號(hào):尤而小屋
作者:Peter
編輯:Peter
本文主要是介紹的自己在平時(shí)使用Pandas處理數(shù)據(jù)過程中接觸到的高頻技巧。以前的Pandas文章有對(duì)不同知識(shí)點(diǎn)的拆解,歡迎閱讀。
Pandas連載文章
圖解Pandas數(shù)據(jù)合并:concat、join、append
創(chuàng)建DataFrame:10種方式任你選
贊!五花八門的Pandas篩選數(shù)據(jù)
數(shù)據(jù)處理基石:數(shù)據(jù)探索
高頻技巧
使用的技巧主要是下圖涉及到的:
import?pandas?as?pd import?numpy?as?np導(dǎo)入文件
Pandas能夠讀取很多文件:Excel、CSV、數(shù)據(jù)庫、TXT,甚至是在線的文件都是OK的
創(chuàng)建DataFrame
在以前的文章中介紹過10種DataFrame的方法
查看頭尾數(shù)據(jù)
頭尾都是默認(rèn)5行數(shù)據(jù),可以指定行數(shù)
#?df2.head()??默認(rèn)頭部5行 df2.head(3)??#?指定3行#?df2.tail()??默認(rèn)尾部5行 df2.tail(2)??#?指定尾部2行顯示全部列名
顯示索引
查看列的數(shù)據(jù)類型
查看行列數(shù)
查看數(shù)據(jù)大小
查看缺失值
修改列名
兩種方式:使用rename函數(shù)和直接使用columns屬性
統(tǒng)計(jì)元素
統(tǒng)計(jì)每個(gè)元素的個(gè)數(shù)
轉(zhuǎn)成列表數(shù)據(jù)
提取列中數(shù)據(jù)
提取文本數(shù)據(jù)
數(shù)值范圍數(shù)據(jù)提取
提取整列數(shù)據(jù)
缺失值填充
指定填充的值
用計(jì)算值
用其他值
數(shù)據(jù)去重
計(jì)算統(tǒng)計(jì)值
計(jì)算統(tǒng)計(jì)值,比如最值和均值等
計(jì)算中位數(shù)
提取最值所在的行
Pandas切片
df2.iloc[22]??#?提取某個(gè)行的數(shù)據(jù) df2.iloc[:,1:6]??#?行和列上的切片大小排序
分組聚合
使用groupby分組之后,對(duì)不同的字段可以使用不同的聚合函數(shù)
索引重排
注意和上面例子的比較。使用的是reset_index函數(shù)
去掉原索引
使用索引重排之后我們需要去掉原來的索引;比較上下兩個(gè)結(jié)果的區(qū)別。通過drop=True來實(shí)現(xiàn)
apply函數(shù)
兩個(gè)列相加
DataFrame合并
1、先看看兩個(gè)原始數(shù)據(jù)
2、默認(rèn)情況:求的兩個(gè)DF的交集
3、保留左邊全部數(shù)據(jù)
4、保留右邊全部數(shù)據(jù)
how="inner"其實(shí)就是默認(rèn)情況:
導(dǎo)出數(shù)據(jù)
導(dǎo)出數(shù)據(jù)的時(shí)候通常是不需要索引的
往期精彩回顧適合初學(xué)者入門人工智能的路線及資料下載機(jī)器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印機(jī)器學(xué)習(xí)在線手冊深度學(xué)習(xí)筆記專輯《統(tǒng)計(jì)學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯 AI基礎(chǔ)下載黃海廣老師《機(jī)器學(xué)習(xí)課程》視頻課黃海廣老師《機(jī)器學(xué)習(xí)課程》711頁完整版課件本站qq群851320808,加入微信群請掃碼:
總結(jié)
以上是生活随笔為你收集整理的【Python】30个Pandas高频使用技巧的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 搜狐视频怎么更改头像
- 下一篇: websocket python爬虫_p