机器学习(1)机器学习基础 鸢尾花数据集
生活随笔
收集整理的這篇文章主要介紹了
机器学习(1)机器学习基础 鸢尾花数据集
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
目錄
一、機(jī)器學(xué)習(xí)基礎(chǔ)理論
1、機(jī)器學(xué)習(xí)過程
2、機(jī)器學(xué)習(xí)分類?
3、數(shù)據(jù)集返回值介紹
二、鳶尾花數(shù)據(jù)集(實(shí)戰(zhàn))
1、首先是獲取數(shù)據(jù)集
?2、顯示數(shù)據(jù)集信息(可以不要)
三、數(shù)據(jù)集劃分
1、數(shù)據(jù)集劃分API?
2、代碼及效果
總代碼
一、機(jī)器學(xué)習(xí)基礎(chǔ)理論
1、機(jī)器學(xué)習(xí)過程
- 獲取數(shù)據(jù)
- 數(shù)據(jù)處理
- 特征工程(特征值、目標(biāo)值)(包括標(biāo)準(zhǔn)化)
- 算法訓(xùn)練 -> 得到模型
- 模型評估
2、機(jī)器學(xué)習(xí)分類(有監(jiān)督/無監(jiān)督)
學(xué)習(xí)階段可用數(shù)據(jù)集:
sklearn、kaggle、UCI
?
3、數(shù)據(jù)集返回值介紹
load返回小數(shù)據(jù)集,fetch返回大數(shù)據(jù)集。
返回datasets.base.Bunch數(shù)據(jù)類型(字典格式)
標(biāo)簽(target):目標(biāo)值
特征(data):特征值
返回方式1:dict['key']
返回方式2:dict.key
二、鳶尾花數(shù)據(jù)集(實(shí)戰(zhàn))
?
???以上三種鳶尾花,分別為鳶尾花的三個(gè)標(biāo)簽。
1、首先是獲取數(shù)據(jù)集
# 獲取數(shù)據(jù)集(鳶尾花)iris = load_iris()
?2、顯示數(shù)據(jù)集信息(可以不要)
# 顯示數(shù)據(jù)集信息Show_Data()# 顯示數(shù)據(jù)集
def Show_Data():# 鳶尾花數(shù)據(jù)集print('鳶尾花數(shù)據(jù)集\n\n', iris)# print('鳶尾花數(shù)據(jù)集描述\n', iris['DESCR'])# 鳶尾花標(biāo)簽# print('鳶尾花標(biāo)簽名稱\n', iris.target_names)# print('鳶尾花標(biāo)簽數(shù)組\n', iris.target)# 鳶尾花特征值# print('鳶尾花特征值名稱\n', iris.feature_names)# print('鳶尾花特征值\n', iris.data)# 數(shù)組行、列查看# print('鳶尾花特征數(shù)組行列\(zhòng)n', iris.data.shape)# print('鳶尾花標(biāo)簽數(shù)組行列\(zhòng)n', iris.target.shape)
三、數(shù)據(jù)集劃分
為了給后面的模型評估留下數(shù)據(jù),這里只能選取一部分?jǐn)?shù)據(jù)進(jìn)行模型訓(xùn)練。
1、數(shù)據(jù)集劃分API?
sklearn.model_selection.train_test_split返回:訓(xùn)練集特征值、測試集特征值、訓(xùn)練集目標(biāo)值、測試集目標(biāo)值。
2、代碼及效果
# 數(shù)據(jù)集劃分
def Data_Split():# 訓(xùn)練集、測試集劃分APItrain_data, test_data, train_target, test_target = train_test_split(iris.data, iris.target, test_size=0.2)#訓(xùn)練集特征值 測試集特征值 訓(xùn)練集目標(biāo)值 測試集目標(biāo)值 訓(xùn)練集測試集劃分API 訓(xùn)練集 測試集 測試量# 顯示(訓(xùn)練集/測試集的特征值/目標(biāo)值)print('訓(xùn)練集特征值:', train_data.shape)print('測試集特征值:', test_data.shape)print('訓(xùn)練集目標(biāo)值:', train_target.shape)print('測試集目標(biāo)值:', test_target.shape)
?
總代碼
# 機(jī)器學(xué)習(xí)基礎(chǔ)(鳶尾花數(shù)據(jù)集)
# sklearn.model_selection.train_test_split返回:
# 訓(xùn)練集特征值、測試集特征值、訓(xùn)練集目標(biāo)值、測試集目標(biāo)值。
import cv2
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split# 顯示數(shù)據(jù)集
def Show_Data():# 鳶尾花數(shù)據(jù)集print('鳶尾花數(shù)據(jù)集\n\n', iris)# print('鳶尾花數(shù)據(jù)集描述\n', iris['DESCR'])# 鳶尾花標(biāo)簽# print('鳶尾花標(biāo)簽名稱\n', iris.target_names)# print('鳶尾花標(biāo)簽數(shù)組\n', iris.target)# 鳶尾花特征值# print('鳶尾花特征值名稱\n', iris.feature_names)# print('鳶尾花特征值\n', iris.data)# 數(shù)組行、列查看# print('鳶尾花特征數(shù)組行列\(zhòng)n', iris.data.shape)# print('鳶尾花標(biāo)簽數(shù)組行列\(zhòng)n', iris.target.shape)# 數(shù)據(jù)集劃分
def Data_Split():# 訓(xùn)練集、測試集劃分APItrain_data, test_data, train_target, test_target = train_test_split(iris.data, iris.target, test_size=0.2)#訓(xùn)練集特征值 測試集特征值 訓(xùn)練集目標(biāo)值 測試集目標(biāo)值 訓(xùn)練集測試集劃分API 訓(xùn)練集 測試集 測試量# 顯示(訓(xùn)練集/測試集的特征值/目標(biāo)值)print('訓(xùn)練集特征值:', train_data.shape)print('測試集特征值:', test_data.shape)print('訓(xùn)練集目標(biāo)值:', train_target.shape)print('測試集目標(biāo)值:', test_target.shape)if __name__ == '__main__':# 獲取數(shù)據(jù)集(鳶尾花)iris = load_iris()# 顯示數(shù)據(jù)集信息# Show_Data()# 數(shù)據(jù)集劃分Data_Split()
總結(jié)
以上是生活随笔為你收集整理的机器学习(1)机器学习基础 鸢尾花数据集的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OpenCV(项目)车牌识别4 -- 总
- 下一篇: 机器学习(2)特征提取1 -- 字典特征