李宏毅机器学习概述
機器學習簡介
- 前言
- 一、機器學習框架Framework
- 二、Learning Map
- 1.監督學習Supervised Learning
- (1)回歸問題
- (2)分類問題
- 2.半監督學習Semi-supervised Learning
- 3.遷移學習Transfer Learning
- 4.無監督學習Unsupervised Learning
- 5.強化學習Reinforcement Learning
- 總結
前言
本文來源于李宏毅老師的機器學習課程。`
一、機器學習框架Framework
機器學習≈尋找一個function,具備根據所提供的資料尋找出function,具體步驟見下圖:
Step1:包含多個function,根據輸入內容找到對應的function;
Step2:衡量一個function的好壞;
Step3:用一個好算法從多個function里面挑選最好的function。
二、Learning Map
機器學習學習模塊主要如下圖所示:
1.監督學習Supervised Learning
監督學習是從輸入/輸出中學習總結規律,針對新的輸入給出對應的輸出,特點是訓練數據具有標簽label。
(1)回歸問題
回歸問題輸出值是連續的,是一種定量輸出,其輸出空間是一個度量空間。例如:預測明天空氣PM2.5的含量·、預測溫度、預測價格等。
(2)分類問題
分類問題輸出值是離散的,是一種定性輸出,輸出空間不是度量空間。分類問題被分為:二分類和多分類問題,二分類問題更多是yes or no,例如:垃圾郵件過濾、西瓜好壞判別等;而多分類問題則有多個分類選項,從多個類別里面選擇一個正確的類別,例如:手寫數字識別1-9。
常用的算法:K-近鄰KNN、線性回歸、邏輯回歸LR、支持向量機SVM、決策樹decision tree、隨機森林Random Forest、神經網絡。
2.半監督學習Semi-supervised Learning
半監督學習包含大量未標注數據和少量標注數據。主要是利用無標簽數據,輔助有標簽數據,進行監督學習。
3.遷移學習Transfer Learning
論文《A survey on transfer learning》
論文地址:https://ieeexplore.ieee.org/document/5288526/
遷移學習定義:給定源域和學習任務 、目標域和學習任務 ,遷移學習的目的是獲取源域和學習任務中的知識,以幫助提升目標域中預測函數的學習。
適用場景:
(1)有大量無標注數據,可以通過尋找與當前數據相似的有標注數據,用有標簽的數據訓練模型,再將該模型的參數遷移到新模型上,提高對目標數據的預測效果或者標注精度。
(2)跨域推薦系統。
(3)數據樣本小時,用遷移學習提高模型泛化能力。
遷移學習中關注三點: What to transfer; How to transfer; When to transfer。
4.無監督學習Unsupervised Learning
無監督學習是使用未標記的數據訓練模型,常見的無監督學習分為:聚類和降維。
聚類算法:k-means、DBSCAN、分層聚類算法、EM等,一般使用的是sklearn庫。
降維算法:主成分分析PCA、、流形學習t-SNE、非負矩陣分解NMF等,同樣使用sklearn庫。
5.強化學習Reinforcement Learning
強化學習主要由智能體(Agent)、環境(Environment)、狀態(State)、動作(Action)、獎勵(Reward)組成。
智能體agent與環境之間交互的任務,agent像人類一樣通過試錯,不斷地學習在不同的環境下做出最優的動作,而不是有監督地直接告訴agent在什么環境下應該做出什么動作,強化學習中不知道正確的動作是什么,reward是告訴agent執行一個動作或一系列動作后得到的獎勵,強化學習通過一序列的最優動作,獲得最大的長期回報。
強化學習是一個馬爾科夫決策過程,由五元組<S,A,P,r,γ>組成。
總結
第一節視頻內容主要對機器學習的分類進行介紹以及機器學習的優勢。
總結
- 上一篇: SQL中使用正则表达式
- 下一篇: jupyter lab 导出笔记为pdf