ML之FE:对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表daiding
生活随笔
收集整理的這篇文章主要介紹了
ML之FE:对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表daiding
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
ML之FE:對pandas的dataframe中的類別型字段進(jìn)行數(shù)字編碼化(類別型特征數(shù)值化)并導(dǎo)出映射表daiding
目錄
對pandas的dataframe中的類別型字段進(jìn)行數(shù)字編碼化(類別型特征數(shù)值化)并導(dǎo)出映射表
對pandas的dataframe中的類別型字段進(jìn)行數(shù)字編碼化(類別型特征數(shù)值化)并導(dǎo)出映射表
# ML之FE:對pandas的dataframe中的類別型字段進(jìn)行數(shù)字編碼化(類別型特征數(shù)值化)并導(dǎo)出映射表 from sklearn.preprocessing import LabelEncoder from NDataScience.DataAnalysis import Dict2DfByRow for col in df.columns:print(col,df[col].dtype)if df[col].dtype in ['float64', 'int', 'int64']:df[col] = pd.to_numeric(df[col])else:# 全部字符串化df[col] = df[col].apply(str)# 編碼化LbE = LabelEncoder()LbE.fit(df[col])df[col] = LbE.transform(df[col])#導(dǎo)出映射表:開發(fā)邏輯中需要mapping_dict = dict(zip(LbE.classes_, range(1, len(LbE.classes_) + 1)))mapping_dict = {encode: label for label, encode in enumerate(LbE.classes_)}Dict2DfByRow(mapping_dict,mark=col)總結(jié)
以上是生活随笔為你收集整理的ML之FE:对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表daiding的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Py之pandas:对dataframe
- 下一篇: Py之pandas:字典格式数据与dat