日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习变量转换(定性变量、定量变量)

發布時間:2023/12/20 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 机器学习变量转换(定性变量、定量变量) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

為了更好地討論問題,將模型的自變量分類。在模型里使用的變量可以分為兩類:數值型變量和類別型變量。如圖1所示。

一、定義

數值型變量,在學術上被稱為定量變量(quantitative variable),如長度、收入、重量等。它們的數值表示具體的測量或計數。事實上,定量變量按是否連續可進一步細分為連續型變量和離散型變量。在一定區間內可以任意取值的變量叫連續型變量,比如人的身高、體重等;反之則是離散型變量,比如公司員工人數等。

類別型變量,也被稱為定性變量(categorical variable)。比如性別、省份、學歷、產品等級等。這類變量的取值通常是用文字而非數字來表示。比如對于性別這個變量,可能的取值為男、女。因此要將文字變量轉換為數字變量,并且保證對于轉換之后的變量,數學運算是有意義的,這并不是一件容易的事情。通常針對一個類別型變量,我們會用一個數字去表示其中的一個類別,但這樣的轉換方法并不能滿足要求:

  • 對于有序的類別型變量,比如產品等級,0表示合格、1表示良好、2表示優秀。這種情況下,0小于1的確對應著合格等級次于良好等級,但數字間的四則運算就沒有對應意義了。數學上2減1等于1,但對于產品等級,優秀減去良好還等于良好嗎?
  • 對于無序的類別型變量,比如對于省份,0表示北京、1表示上海、2表示深圳等。數字間的大小關系和四則運算都是沒有實際意義的。

二、定性變量的處理

對于定性變量,常見的處理方法有兩種:一種是將定性變量轉換為多個虛擬變量(dummy variable),另一種對將有序的定性變量轉換為定量變量。

正如前文中討論的,直接對定性變量數字編碼,得到的變量將無法進行有意義的數學運算。那么,相應的解決方法就是使得變換之后的變量不能直接做數學運算。

前面討論的虛擬變量的方法是比較通用的處理方法。但這種方法有一個很明顯的缺點:每個虛擬變量都是0或1,無法提供更多的信息。特別是對于多個有序的定性變量,這會損失掉每個定性變量本身的順序信息和定性變量間的關聯信息。為了解決這個問題,常常根據類別的順序,將定性變量轉換為定量變量。

?

本文參考了https://blog.csdn.net/weixin_39844018/article/details/82533494

總結

以上是生活随笔為你收集整理的机器学习变量转换(定性变量、定量变量)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。