pandas的dropna方法_python中dropna函数(Python)
本文概述
如果你的數據集包含空值, 則可以使用dropna()函數分析并刪除數據集中的行/列。
句法
DataFrameName.dropna(axis=0, how=’any’, thresh=None, subset=None, inplace=False)
參數
軸:{0或’index’, 1或’columns’}, 默認值0
它采用int或字符串值作為行/列。輸入可以是0和1(整數和索引), 也可以是列(字符串)。
0或”索引”:刪除包含缺失值的行。
1或”列”:刪除包含缺失值的列。
怎么樣 :
當我們有至少一個不適用或所有不適用時, 它確定是否從DataFrame中刪除行或列。
它只接受兩種字符串值(” any”或” all”)。
any:如果任何值為null, 則刪除行/列。
all:僅在所有值均為null時丟棄。
脫粒:
它采用整數值, 該值定義要減少的最小NA值量。
子集:
它是一個數組, 將刪除過程限制為通過列表傳遞的行/列。
到位:
它返回一個布爾值, 如果它為True, 則會在數據幀本身中進行更改。
Return
它返回刪除了NA條目的DataFrame。
對于演示, 首先, 我們獲取一個csv文件, 該文件將從數據集中刪除任何列。
import pandas as pd
aa = pd.read_csv(“aa.csv”)
aa.head()
輸出
Name
Hire Date
Salary
Leaves Remaining
0 John Idle03/15/14
50000.0
10
1 Smith Gilliam
06/01/15
65000.0
8
2 Parker Chapman
05/12/14
45000.0
10
3 Jones Palin
11/01/13
70000.0
3
4 Terry Gilliam
08/12/14
48000.0
7
5 Michael Palin
05/23/13
66000.0
8
代碼
# importing pandas module
import pandas as pd
# making data frame from csv file
info = pd.read_csv(“aa.csv”)
# making a copy of old data frame
copy = pd.read_csv(“aa.csv”)
# creating value with all null values in new data frame
copy[“Null Column”]= None
# checking if column is inserted properly
print(info.columns.values, “\n”, copy.columns.values)
# comparing values before dropping null column
print(“\nColumn number before dropping Null column\n”, len(info.dtypes), len(copy.dtypes))
# dropping column with all null values
copy.dropna(axis = 1, how =’all’, inplace = True)
# comparing values after dropping null column
print(“\nColumn number after dropping Null column\n”, len(info.dtypes), len(info.dtypes))
輸出
[‘NameHire DateSalaryLeaves Remaining’]
[‘NameHire DateSalaryLeaves Remaining’
‘Null Column’]
Column number before dropping Null column
1 2
Column number after dropping Null column
1 1
上面的代碼從數據集中刪除了null列, 并返回了一個新的DataFrame。
總結
以上是生活随笔為你收集整理的pandas的dropna方法_python中dropna函数(Python)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 时间序列研(part13)--习题
- 下一篇: SEO的基本知识和优化思维