日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

李宏毅机器学习概述

發布時間:2023/12/14 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 李宏毅机器学习概述 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

機器學習簡介

  • 前言
  • 一、機器學習框架Framework
  • 二、Learning Map
    • 1.監督學習Supervised Learning
      • (1)回歸問題
      • (2)分類問題
    • 2.半監督學習Semi-supervised Learning
    • 3.遷移學習Transfer Learning
    • 4.無監督學習Unsupervised Learning
    • 5.強化學習Reinforcement Learning
  • 總結


前言

本文來源于李宏毅老師的機器學習課程。`

一、機器學習框架Framework

機器學習≈尋找一個function,具備根據所提供的資料尋找出function,具體步驟見下圖:

Step1:包含多個function,根據輸入內容找到對應的function;
Step2:衡量一個function的好壞;
Step3:用一個好算法從多個function里面挑選最好的function。

二、Learning Map

機器學習學習模塊主要如下圖所示:

1.監督學習Supervised Learning

監督學習是從輸入/輸出中學習總結規律,針對新的輸入給出對應的輸出,特點是訓練數據具有標簽label。

(1)回歸問題

回歸問題輸出值是連續的,是一種定量輸出,其輸出空間是一個度量空間。例如:預測明天空氣PM2.5的含量·、預測溫度、預測價格等。

(2)分類問題

分類問題輸出值是離散的,是一種定性輸出,輸出空間不是度量空間。分類問題被分為:二分類和多分類問題,二分類問題更多是yes or no,例如:垃圾郵件過濾、西瓜好壞判別等;而多分類問題則有多個分類選項,從多個類別里面選擇一個正確的類別,例如:手寫數字識別1-9。

常用的算法:K-近鄰KNN、線性回歸、邏輯回歸LR、支持向量機SVM、決策樹decision tree、隨機森林Random Forest、神經網絡。

2.半監督學習Semi-supervised Learning

半監督學習包含大量未標注數據和少量標注數據。主要是利用無標簽數據,輔助有標簽數據,進行監督學習。

3.遷移學習Transfer Learning

論文《A survey on transfer learning》
論文地址:https://ieeexplore.ieee.org/document/5288526/
遷移學習定義:給定源域和學習任務 、目標域和學習任務 ,遷移學習的目的是獲取源域和學習任務中的知識,以幫助提升目標域中預測函數的學習。
適用場景:
(1)有大量無標注數據,可以通過尋找與當前數據相似的有標注數據,用有標簽的數據訓練模型,再將該模型的參數遷移到新模型上,提高對目標數據的預測效果或者標注精度。
(2)跨域推薦系統。
(3)數據樣本小時,用遷移學習提高模型泛化能力。
遷移學習中關注三點: What to transfer; How to transfer; When to transfer。

4.無監督學習Unsupervised Learning

無監督學習是使用未標記的數據訓練模型,常見的無監督學習分為:聚類和降維。
聚類算法:k-means、DBSCAN、分層聚類算法、EM等,一般使用的是sklearn庫。
降維算法:主成分分析PCA、、流形學習t-SNE、非負矩陣分解NMF等,同樣使用sklearn庫。

5.強化學習Reinforcement Learning

強化學習主要由智能體(Agent)、環境(Environment)、狀態(State)、動作(Action)、獎勵(Reward)組成。
智能體agent與環境之間交互的任務,agent像人類一樣通過試錯,不斷地學習在不同的環境下做出最優的動作,而不是有監督地直接告訴agent在什么環境下應該做出什么動作,強化學習中不知道正確的動作是什么,reward是告訴agent執行一個動作或一系列動作后得到的獎勵,強化學習通過一序列的最優動作,獲得最大的長期回報。
強化學習是一個馬爾科夫決策過程,由五元組<S,A,P,r,γ>組成。

總結

第一節視頻內容主要對機器學習的分類進行介紹以及機器學習的優勢。

總結

以上是生活随笔為你收集整理的李宏毅机器学习概述的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。