日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习第2天:简单线性回归模型

發布時間:2025/4/5 编程问答 14 豆豆
生活随笔 收集整理的這篇文章主要介紹了 机器学习第2天:简单线性回归模型 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

  • 一、概念
    • 1. 什么是回歸
    • 2. 什么是線性
    • 3. 什么是線性回歸
  • 二、具體實現步驟
    • 第1步:數據預處理
    • 第2步:使用簡單線性回歸模型來訓練訓練集
    • 第3步:預測結果
    • 第4步:可視化
      • 訓練集結果可視化
      • 測試集結果可視化
  • 三、可視化結果展示
    • 訓練集結果可視化結果
    • 測試集結果可視化結果
  • 四、知識點詳解
    • 1. 關于LinearRegression()
    • 2. 關于數據可視化

一、概念

1. 什么是回歸

回歸的目的是為了預測,比如在【待補充】這篇文章中通過花瓣長度預測花瓣寬度

回歸之所以能預測是因為它通過大量的花瓣長度與寬度數據,“弄懂了”花瓣長度與寬度之間的線性關系,在這個基礎之上就可以通過花瓣長度預測花瓣寬度了。

2. 什么是線性

線性就是關系可以用線性方程來表示,通過一個或多個變量來表示另外一個變量。

通俗的說符合“越…,越…”這種說法的可能就是線性關系,比如

  • “房子”越大,“租金”就越高
  • “漢堡”買的越多,花的“錢”就越多
  • 杯子里的“水”越多,“重量”就越大

但是也并非所有“越…,越…”都是線性的,比如“彈簧的彈力與位移的關系”,

3. 什么是線性回歸

通過兩個或多個變量之間的線性關系來預測結果。

通過鳶尾花的花瓣長度與寬度的線性關系來預測花瓣寬度,通過杯子里水的體積就可以知道(預測)水的重量

二、具體實現步驟

第1步:數據預處理

import pandas as pd import numpy as np import matplotlib.pyplot as pltdataset = pd.read_csv('studentscores.csv') X = dataset.iloc[ : , :1].values Y = dataset.iloc[ : ,1].valuesfrom sklearn.model_selection import train_test_split X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=1/4, random_state=0)

第2步:使用簡單線性回歸模型來訓練訓練集

from sklearn.linear_model import LinearRegression regressor = LinearRegression() regressor = regressor.fit(X_train, Y_train)

第3步:預測結果

Y_pred = regressor.predict(X_test)

第4步:可視化

訓練集結果可視化

plt.scatter(X_train, Y_train, color='red') plt.plot(X_train, regressor.predict(X_train), color='blue') plt.show()

測試集結果可視化

plt.scatter(X_test, Y_test, color='red') plt.plot(X_test, regressor.predict(X_test), color='blue') plt.show()

三、可視化結果展示

訓練集結果可視化結果

測試集結果可視化結果

四、知識點詳解

1. 關于LinearRegression()

sklearn.linear_model包實現了廣義線性模型,包括線性回歸、Ridge回歸、Bayesian回歸等。LinearRegression是其中較為簡單的線性回歸模型。

解釋一下什么是回歸:回歸最簡單的定義是,給出一個點集D,用一個函數去擬合這個點集,并且使得點集與擬合函數間的誤差最小,如果這個函數曲線是一條直線,那就被稱為線性回歸,如果曲線是一條二次曲線,就被稱為二次回歸。

更多關于回歸知識見:線性回歸

2. 關于數據可視化

plt.scatter():繪畫出訓練集數據的散點圖
plt.plot():繪畫出依據模型(LinearRegression的線性回歸模型)生成的直線

更加直觀的觀察數據集中的X、Y是否存在線性關系

關于數據可視化更多知識見:Matplotlib 簡介

你可以在下方留下你的疑惑,大家一起來看看

總結

以上是生活随笔為你收集整理的机器学习第2天:简单线性回归模型的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。