机器学习——数据集预处理(数据查看和空值处理)
生活随笔
收集整理的這篇文章主要介紹了
机器学习——数据集预处理(数据查看和空值处理)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
前言
數據集查看
前言
目的:本數據集是為了分析爐絲功率和爐膛溫度以及樣品盒內部溫度之間的關系,分析溫場的分布等。
來源:本數據集的來源是實驗獲得的數據。
特點:特征維度高,數據量大。
數據集查看
1.查看數據集的基本信息(列名、行數、數據類型等)
import pandas as pddata = pd.read_csv('數據集.csv') #替換自己文件實際位置 info = data.info() print(info)注:python中默認info顯示100列的數據信息,若數據列超過100列,就會出現折疊顯示的情況。
?
此時若需要查看某一列的空值數和類型數,可以通過以下語句將info默認顯示的數據列值改大一些。
pd.options.display.max_info_columns = 350 # 設置info中信息顯示數量為350改完之后再運行info函數,可以展開顯示更多的數據列了。
?
?
2.顯示前5行數據
head = data.head() print(head)3.查看數據集的統計信息
des = data.describe() print(des)4.檢測某一列空值的數目
df.isnull().sum()5.直接原地刪除有空值的行
df.dropna(inplace=True)總結
以上是生活随笔為你收集整理的机器学习——数据集预处理(数据查看和空值处理)的全部內容,希望文章能夠幫你解決所遇到的問題。