Scikit-learn数据预处理分类变量编码之等级变量编码
生活随笔
收集整理的這篇文章主要介紹了
Scikit-learn数据预处理分类变量编码之等级变量编码
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
? ? ? ? ? ? ? Scikit-learn數(shù)據(jù)預(yù)處理分類變量編碼之等級(jí)變量編碼
1 聲明
本文的數(shù)據(jù)來自網(wǎng)絡(luò),部分代碼也有所參照,這里做了注釋和延伸,旨在技術(shù)交流,如有冒犯之處請(qǐng)聯(lián)系博主及時(shí)處理。
2 等級(jí)分類變量編碼簡(jiǎn)介
有序分類變量,又等級(jí)分類變量,比如學(xué)歷的專科、本科、研究生等,即變量間的差值有意義。這類編碼一般通過map進(jìn)行映射。
注:這里主要針對(duì)原始分類變量是字符串的情況。
import pandas as pd dataframe = pd.DataFrame({"Score": ["Low", "Low", "Medium", "Medium", "High", "Barely More Than Medium"]}) scale_mapper = {"Low":1, "Medium":2, "Barely More Than Medium": 2.1,#3 這里需要根據(jù)業(yè)務(wù)需求設(shè)定閾段 "High":4} print(dataframe["Score"].replace(scale_mapper)) stlizer_data)總結(jié)
以上是生活随笔為你收集整理的Scikit-learn数据预处理分类变量编码之等级变量编码的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 平安普惠怎么申请退息
- 下一篇: Scikit-learn数据预处理分类变