日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

【数据处理】python数据清洗通用手法:缺失值处理

發布時間:2025/3/21 python 50 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【数据处理】python数据清洗通用手法:缺失值处理 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
def missing_delete_var(df, threshold=None):"""df:數據集threshold:缺失率刪除的閾值return :刪除缺失后的數據集"""df2 = df.copy()missing_df = missing_cal(df)missing_col_num = missing_df[missing_df.missing_pct >= threshold].shape[0]missing_col = list(missing_df[missing_df.missing_pct >= threshold].col)df2 = df2.drop(missing_col, axis=1)return df2def missing_delete_user(df, threshold=None):"""df:數據集threshold:缺失個數刪除的閾值return :刪除缺失后的數據集"""df2 = df.copy()missing_series = df.isnull().sum(axis=1)missing_list = list(missing_series)missing_index_list = []for i, j in enumerate(missing_list):if j >= threshold:missing_index_list.append(i)df2 = df2[~(df2.index.isin(missing_index_list))]return df2def const_delete(df, col_list, threshold=None):"""df:數據集col_list:變量list集合threshold:同值化處理的閾值return :處理后的數據集"""df2 = df.copy()const_col = []for col in col_list:const_pct = df2[col].value_counts().iloc[0] / df2[df2[col].notnull()].shape[0]if const_pct >= threshold:const_col.append(col)df2 = df2.drop(const_col, axis=1)return df2def missing_cal(df):"""df :數據集return:每個變量的缺失率"""missing_series = df.isnull().sum() / df.shape[0]missing_df = pd.DataFrame(missing_series).reset_index()missing_df = missing_df.rename(columns={'index': 'col',0: 'missing_pct'})missing_df = missing_df.sort_values('missing_pct', ascending=False).reset_index(drop=True)return missing_dfdef data_processing(df, target):"""df:包含了label和特征的寬表return:df :清洗后的數據集"""# 特征缺失處理df = missing_delete_var(df, threshold=0.8)# 樣本缺失處理df = missing_delete_user(df, threshold=int(df.shape[1] * 0.8))col_list = [x for x in df.columns if x != target]# 常變量處理df = const_delete(df, col_list, threshold=0.9)desc = df.describe().T# 剔除方差為0的特征std_0_col = list(desc[desc['std'] == 0].index)if len(std_0_col) > 0:df = df.drop(std_0_col, axis=1)df.reset_index(drop=True, inplace=True)# 缺失值計算和填充miss_df = missing_cal(df)cate_col = list(df.select_dtypes(include=['O']).columns)num_col = [x for x in list(df.select_dtypes(include=['int64', 'float64']).columns) if x != 'label']# 分類型特征填充cate_miss_col1 = [x for x in list(miss_df[miss_df.missing_pct > 0.05]['col']) if x in cate_col]cate_miss_col2 = [x for x in list(miss_df[miss_df.missing_pct <= 0.05]['col']) if x in cate_col]num_miss_col1 = [x for x in list(miss_df[miss_df.missing_pct > 0.05]['col']) if x in num_col]num_miss_col2 = [x for x in list(miss_df[miss_df.missing_pct <= 0.05]['col']) if x in num_col]for col in cate_miss_col1:df[col] = df[col].fillna('未知')for col in cate_miss_col2:df[col] = df[col].fillna(df[col].mode()[0])for col in num_miss_col1:df[col] = df[col].fillna(-999)for col in num_miss_col2:df[col] = df[col].fillna(df[col].median())return df, miss_df

??對數據分析、機器學習、數據科學、金融風控等感興趣的小伙伴,需要數據集、代碼、行業報告等各類學習資料,可添加微信:wu805686220(記得要備注喔!),也可關注微信公眾號:風控圏子(別打錯字,是圏子,不是圈子,算了直接復制吧!)

關注公眾號后,可聯系圈子助手加入如下社群:

  • 機器學習風控討論群(微信群)
  • 反欺詐討論群(微信群)
  • python學習交流群(微信群)
  • 研習社資料(qq群:102755159)(干貨、資料、項目、代碼、報告、課件)

相互學習,共同成長。

《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀

總結

以上是生活随笔為你收集整理的【数据处理】python数据清洗通用手法:缺失值处理的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 99re6热在线精品视频播放 | 国产综合久久久久久鬼色 | 亚洲夜夜操 | 激情综合网av| 免费观看久久久 | 天堂视频一区二区 | 国产91在线 | 亚洲 | 亚洲av无码乱码在线观看富二代 | 吊侵犯の奶水授乳羞羞漫画 | 中文字幕国产亚洲 | 就去干成人网 | 国产不卡视频在线观看 | 美女又爽又黄 | 黄色资源网站 | 五月天婷婷色综合 | 少妇熟女一区二区 | 国产精品videossex久久发布 | 三级做爰第一次 | 亚洲第一成网站 | 久色精品 | 亚洲国产中文字幕在线观看 | 在线xxxx | 中国美女一级看片 | 亚洲福利视频导航 | 男人的天堂av女优 | 粉嫩av一区二区白浆 | 欧美爱爱网站 | 闫嫩的18sex少妇hd | xxxx国产| 久草视频精品 | 久久66热这里只有精品 | 色激情网| 免费视频网站在线观看入口 | 欧美sm视频| 激情草逼 | 日韩精品视频免费 | 一级片黑人 | 国产成人三级在线观看视频 | 中国成人毛片 | 免费精品一区二区 | 综合久久影院 | 中文字幕在线观看视频一区二区 | 欧美黄页在线观看 | 99爱这里只有精品 | 国产美女作爱全过程免费视频 | 最新中文字幕免费 | 国产福利三区 | 免费无码又爽又黄又刺激网站 | 亚洲精品免费视频 | 免费视频色 | 少妇特黄一区二区 | 国产91丝袜在线播放0 | 亚洲国产午夜 | 欧美第一页在线 | 两根大肉大捧一进一出好爽视频 | 美女娇喘| 桃色一区二区 | 日本男人的天堂 | 超碰在线网 | 午夜在线小视频 | 91成人在线 | 久久精品噜噜噜成人 | 黄色片链接 | 午夜视频黄色 | www.97av.com| av手机在线观看 | 精品国产成人亚洲午夜福利 | 日韩欧美高清在线视频 | 日色网站 | 三上悠亚久久精品 | 国产成人免费视频网站 | 人妻丰满熟妇岳av无码区hd | 国产伦精品一区二区三区高清版 | 欧美日韩国产一级片 | 538任你躁在线精品免费 | 欧美黄色影院 | 在线日韩av| 亚洲一个色| 国产精品理论片在线观看 | 苏晴忘穿内裤坐公交车被揉到视频 | 一级黄色免费视频 | 欧美视频直播网站 | 成人a站 | 在线免费小电影 | 亚洲国产精品久久久久久久 | 成人黄色动漫在线观看 | 中国一级特黄毛片大片 | 爽爽影院在线免费观看 | 免费在线观看成年人视频 | 18成人在线| 国产精品成人久久电影 | 久久久久久一级片 | 欧美亚洲视频在线观看 | www.激情网| 亚洲av毛片 | 国产精品毛片va一区二区三区 | 少妇精品久久久久www | 涩涩视频网址 | 在线免费黄色网址 |