分类变量如何设置变量值的显示顺序
生活随笔
收集整理的這篇文章主要介紹了
分类变量如何设置变量值的显示顺序
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
在做數(shù)據分析的時候,有時候分類變量值默認的排序不是我們想要的,需要調整顯示順序,pandas可以通過pd.Categorical來設置分類變量的顯示順序。
例如,對于數(shù)據分析教程常用的diamonds數(shù)據集,color等級是從J, I, H, G, F, E, D逐漸上升,如果要考察color等級和價格的關系,自然是希望color按照J, I, H, G, F, E, D順序顯示,但數(shù)據默認會按照字母(變量值)在數(shù)據中出現(xiàn)的順序或者一般排序的順序。
例如:直接繪圖,color的顯示順序為變量值在數(shù)據中出現(xiàn)的順序
import seaborn as sns sns.barplot(x = "color", y = "price",data = diamonds)?
?
現(xiàn)在通過pd.Categorical()函數(shù)重新設置color列的顯示順序
color_cats = ['J', 'I', 'H', 'G', 'F', 'E', 'D'] diamonds['color'] = pd.Categorical(diamonds['color'], categories=color_cats, ordered=True)設置完畢后,顯示順序就按照等級順序了。
總結
以上是生活随笔為你收集整理的分类变量如何设置变量值的显示顺序的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 小班教案《各种各样的蛋宝宝》反思
- 下一篇: Hive中的算术运算符:位运算符解释