日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

Python学习笔记:数据清洗之缺失值填充fillna

發(fā)布時間:2024/8/5 综合教程 28 生活家
生活随笔 收集整理的這篇文章主要介紹了 Python学习笔记:数据清洗之缺失值填充fillna 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

在數(shù)據(jù)建模過程中,針對入模的數(shù)據(jù)需做數(shù)據(jù)清洗,特別針對缺失數(shù)據(jù)。

缺失數(shù)據(jù)比較多的情況下,可以考慮直接刪除;缺失數(shù)據(jù)較少的情況下,可對數(shù)據(jù)進(jìn)行填充。

此時,fillna() 則派上用場。語法為:

fillna(self, value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
# inplace=True 直接修改原對象 缺省False
# method取值:pad、ffill、backfill、bfill、None 缺省None
	# pad/ffill:用前一個非缺失值填充
    # backfill/bfill:用后一個非缺失值填充
# limit:限制填充個數(shù)
# axis:修改填充方向

創(chuàng)建測試數(shù)據(jù)框:

import pandas as pd
import numpy as np
from numpy import nan
data = pd.DataFrame(np.arange(3,19,1).reshape(4,4),index=list('abcd'))
print(data)
data.iloc[0:2, 0:3] = nan
print(data)
'''
    0   1   2   3
a   3   4   5   6
b   7   8   9  10
c  11  12  13  14
d  15  16  17  18
      0     1     2   3
a   NaN   NaN   NaN   6
b   NaN   NaN   NaN  10
c  11.0  12.0  13.0  14
d  15.0  16.0  17.0  18
'''

用0填充

data.fillna(0)

用每列特征的均值填充

data.fillna(data.mean())

用每列特征的中位數(shù)填充

data.fillna(data.median())

用相鄰后面(back)特征填充前面缺失值

data.fillna(method='bfill')

用相鄰前面(before)特征填充后面空值

import pandas as pd
import numpy as np
from numpy import nan
data = pd.DataFrame(np.arange(3,19,1).reshape(4,4),index=list('abcd'))
print(data)
data.iloc[1:2, 0:3] = nan
print(data)
data.fillna(method='pad')

利用字典對不同列填充不同值

values = {0:10, 1:20, 2:30} # 列名:填充值
data.fillna(value=values)

控制填充個數(shù)

data.fillna(method='bfill', limit=2)

按行填充

data.fillna(method='ffill', limit=1, axis=1)

參考鏈接:fillna()函數(shù)詳解

參考鏈接:Python 數(shù)據(jù)清洗之缺失數(shù)據(jù)填充fillna()

總結(jié)

以上是生活随笔為你收集整理的Python学习笔记:数据清洗之缺失值填充fillna的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。