pandas删除满足条件的行_入门Pandas练习
本節(jié)主要是自己學習pandas的練習,與你分享。
導入Pandas與NumPy
import numpy as np import pandas as pd生成Series時,pandas默認生成整數(shù)索引,我們嘗試一下。
s = pd.Series([23,2,5,np.nan,6,9]) s使用時間索引與含有標簽的Numpy數(shù)組生成DataFrame
dates = pd.date_range('20200101',periods=7) dates使用隨機數(shù)生成一個7*4的數(shù)據(jù)表。
使用Series字典生成DataFrame
df2 = pd.DataFrame({'A':1.2,'B':pd.Series(1,index=list(range(4)),dtype='float32'),'C':pd.Timestamp('20200101'),'D':np.array([3]*4,dtype='int32'),'E':pd.Categorical(["test","tarin","test","train"]),'F':'foo'}) df2我們查看一下df2中每列的數(shù)據(jù)類型
df2.dtypes下面進入數(shù)據(jù)查看環(huán)節(jié),查看數(shù)據(jù)的前幾行和結尾幾行的數(shù)據(jù):
df.head()#默認是5行df.head(3)#可以輸入數(shù)字查看相應行數(shù)df.tail(3)#查看最后3行顯示索引與列名
快速的查看數(shù)據(jù)統(tǒng)計概要:
數(shù)據(jù)轉置:
提取數(shù)據(jù)
獲取單列數(shù)據(jù),選擇單列,產生Series,與df.A 等效
使用[ ]切片:
按標簽選擇,用標簽提取一行數(shù)據(jù)
用標簽選擇多列數(shù)據(jù)
用標簽切片,包含行與列結束點:
提取標量值:
使用整數(shù)位置選擇
類似 NumPy / Python,用整數(shù)切片:
顯示整行的切片:
顯示整列的切片:
布爾索引,用單列的值選擇數(shù)據(jù):
提取出DataFrame 里滿足條件的值:
使用isin篩選:
用索引自動對齊新增列的數(shù)據(jù):
按標簽賦值:
按位置賦值
按 NumPy 數(shù)組賦值:
Pandas 主要用 np.nan 表示缺失數(shù)據(jù),計算時,默認不包含空值。 重建索引(reindex)可以更改、添加、刪除指定軸的索引,并返回數(shù)據(jù)副本,即不更改原數(shù)據(jù)。
刪除所有包含空值的行:
填充缺失值:
計算均值:
數(shù)值計數(shù):
包含的字符串的處理功能str:
數(shù)據(jù)合并,pandas 提供了多種將 Series、DataFrame 對象組合在一起的功能,用索引與關聯(lián)代數(shù)功能的多種設置邏輯可執(zhí)行連接(join)與合并(merge)操作。
為 DataFrame 追加行:
分組,“group by” 指的是涵蓋下列一項或多項步驟的處理流程:
分割:按條件把數(shù)據(jù)分割成多組;
應用:為每組單獨應用函數(shù);
組合:將處理結果組合成一個數(shù)據(jù)結構。
先分組,再用 sum()函數(shù)計算每組的匯總數(shù)據(jù):
多列分組后,生成多層索引,也可以應用 sum 函數(shù):
以上為學習所得,希望對你有幫助。
總結
以上是生活随笔為你收集整理的pandas删除满足条件的行_入门Pandas练习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 海外保险优势和劣势
- 下一篇: 查找字符位置_EXCEL函数公式大全之利