日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习算法概述——摘录《机器学习算法导论》

發(fā)布時(shí)間:2023/12/14 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 机器学习算法概述——摘录《机器学习算法导论》 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

目錄

第一章 機(jī)器學(xué)習(xí)算法概述

1.1什么是機(jī)器學(xué)習(xí)?

1.2機(jī)器學(xué)習(xí)的形式分類

1.2.1 監(jiān)督式學(xué)習(xí)

1.2.2 無監(jiān)督學(xué)習(xí)

1.2.3強(qiáng)化學(xué)習(xí)

1.3 機(jī)器學(xué)習(xí)算法綜覽


第一章 機(jī)器學(xué)習(xí)算法概述

人工只能的概念是由以麥卡賽、明斯基、羅切斯特和香農(nóng)等為首的一批科學(xué)家在1956年提出的。為何已有六十余年的歷史學(xué)科又一次進(jìn)入到人們視野的中心?是什么技術(shù)的突破,為人工智能領(lǐng)域注入了新鮮的活力?

人工智能的核心是機(jī)器學(xué)習(xí),而機(jī)器學(xué)習(xí)的核心是算法!近年來,機(jī)器學(xué)習(xí)的算法,尤其是深度學(xué)習(xí)算法,展現(xiàn)出了無與倫比的威力,而且GPU(圖像處理器)的高速發(fā)展,使得大規(guī)模深度學(xué)習(xí)成為可能。正是機(jī)器學(xué)習(xí)算法和硬件技術(shù)的土坯使得人工智能煥發(fā)新生。

本書將要回答:機(jī)器如何通過學(xué)習(xí)獲取智能?機(jī)器學(xué)習(xí)算法和傳統(tǒng)算法有何不同?

本章先概述機(jī)器學(xué)習(xí)這領(lǐng)域。

1.1什么是機(jī)器學(xué)習(xí)?

機(jī)器學(xué)習(xí)是智能體通過模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為來獲得新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu),以不斷改善自身智能。

給定任務(wù)T,相關(guān)的經(jīng)驗(yàn)E,關(guān)于學(xué)習(xí)效果的度量P,機(jī)器學(xué)習(xí)就是通過對(duì)經(jīng)驗(yàn)E的學(xué)習(xí)來優(yōu)化任務(wù)T完成效果度量P的一個(gè)過程。

舉例:無人駕駛汽車系統(tǒng)中,機(jī)器學(xué)習(xí)的任務(wù)就是根據(jù)路況確定駕駛方式;學(xué)習(xí)效果的度量可以是事故發(fā)生的概率;經(jīng)驗(yàn)是人類大量的駕駛數(shù)據(jù)。

在機(jī)器學(xué)習(xí)中,用于學(xué)習(xí)的經(jīng)驗(yàn)數(shù)據(jù)為訓(xùn)練數(shù)據(jù),完成任務(wù)的方法叫模型。機(jī)器學(xué)習(xí)的核心是設(shè)計(jì)出以訓(xùn)練數(shù)據(jù)為輸入,模型為輸出的算法。

1.2機(jī)器學(xué)習(xí)的形式分類

常見的機(jī)器學(xué)習(xí)的形式分類有兩種:無監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)。此外,還有介入兩者之間的形式——強(qiáng)化學(xué)習(xí)。

1.2.1 監(jiān)督式學(xué)習(xí)

在這類機(jī)器學(xué)習(xí)的學(xué)習(xí)形式中,每一條訓(xùn)練數(shù)據(jù)含有兩部分信息:特征組和標(biāo)簽。一條訓(xùn)練數(shù)據(jù)中的特征組是對(duì)應(yīng)對(duì)象的特征的描述,而標(biāo)簽則是對(duì)象的一個(gè)屬性。監(jiān)督式學(xué)習(xí)的任務(wù)就是根據(jù)對(duì)象的特征組對(duì)標(biāo)簽的取值進(jìn)行預(yù)測(cè)。

舉例:手寫數(shù)字識(shí)別。特征組是手寫數(shù)字圖片的像素灰度矩陣,標(biāo)簽是圖片中的數(shù)字。

通常,有兩種獲取標(biāo)簽值的方式:1.人工標(biāo)注法。例如,電影推薦系統(tǒng)中,用戶給影片的評(píng)分便是訓(xùn)練數(shù)據(jù)的標(biāo)簽。2.數(shù)據(jù)自帶標(biāo)簽值。例如,搜索引擎中,點(diǎn)擊率越高的鏈接,應(yīng)當(dāng)排在前面。

根據(jù)訓(xùn)練數(shù)據(jù)所帶標(biāo)簽值的特性,又可將監(jiān)督式學(xué)習(xí)分為兩類——分類問題和回歸問題。

分類問題,是指標(biāo)簽值只取有限個(gè)可能值,對(duì)應(yīng)的監(jiān)督式學(xué)習(xí)。每個(gè)標(biāo)簽值代表一個(gè)類,含有k個(gè)類別的分類問題被稱為k元分類問題。

分類問題的任務(wù)可分為兩種形式。第一種是要求對(duì)類別有明確的預(yù)測(cè);第二種是計(jì)算出給定對(duì)象屬于每一類別的概率。

回歸問題,是指標(biāo)簽取值為某個(gè)區(qū)間實(shí)數(shù)的監(jiān)督學(xué)習(xí)問題。例如,房?jī)r(jià)預(yù)測(cè)中,訓(xùn)練數(shù)據(jù)包含房屋及相關(guān)具體特征 和 交易價(jià)格(標(biāo)簽值)。

上述兩類監(jiān)督式學(xué)習(xí)問題可以相互轉(zhuǎn)化,比如logistic回歸就是一種利用回歸方法求解分類問題的算法。

1.2.2 無監(jiān)督學(xué)習(xí)

訓(xùn)練數(shù)據(jù)不含標(biāo)簽。無監(jiān)督學(xué)習(xí)問題的任務(wù)通常是對(duì)數(shù)據(jù)本身的模式識(shí)別與分類。廣泛應(yīng)用于降維問題和聚類問題。

降維問題。機(jī)器學(xué)習(xí)中每條訓(xùn)練數(shù)據(jù)的特征組都可以用一個(gè)向量來表示。此向量的每個(gè)分量代表了對(duì)象的一個(gè)特征。實(shí)際應(yīng)用中,特征組的維度相當(dāng)高(甚至達(dá)百萬數(shù)量級(jí))時(shí),眾多特征增加了求解問題的復(fù)雜性,因此對(duì)高維度的特征組進(jìn)行低維近似,是降維問題的主要應(yīng)用。降維問題的另一個(gè)應(yīng)用便是數(shù)據(jù)可視化。

聚類問題。無監(jiān)督學(xué)習(xí)的聚類問題和有監(jiān)督學(xué)習(xí)的分類問題區(qū)別在于:聚類問題的任務(wù)僅限于對(duì)未知分類的一批數(shù)據(jù)進(jìn)行聚類,而分類問題是用已知分類的訓(xùn)練數(shù)據(jù)訓(xùn)練出一個(gè)能夠預(yù)測(cè)數(shù)據(jù)類別的模型。二者都是將數(shù)據(jù)按模式分類。聚類問題常應(yīng)用于異常探測(cè)。聚類算法將數(shù)據(jù)聚成兩類——正常類和異常類。

1.2.3強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)是現(xiàn)代人工智能的重要課題,在博弈策略、無人駕駛汽車等領(lǐng)域中都能見到強(qiáng)化學(xué)習(xí)的身影。

強(qiáng)化學(xué)習(xí)的任務(wù)是根據(jù)對(duì)環(huán)境的探索,制定應(yīng)對(duì)環(huán)境變化的策略。它模擬了生物探索環(huán)境和積累經(jīng)驗(yàn)的過程。例如,訓(xùn)練海豚雜技表演時(shí),海豚每成功完成動(dòng)作,即可獲得獎(jiǎng)勵(lì),否則沒有。這樣的經(jīng)驗(yàn)與記憶引起海豚做出精彩的雜技表演。

強(qiáng)化學(xué)習(xí)是介于監(jiān)督式學(xué)習(xí)與無監(jiān)督學(xué)習(xí)之間的一類機(jī)器學(xué)習(xí)算法。一方面,強(qiáng)化學(xué)習(xí)沒有一組帶有標(biāo)簽的訓(xùn)練數(shù)據(jù)作為其輸入,算法需要自發(fā)地探索環(huán)境來獲得訓(xùn)練數(shù)據(jù);而另一方面,由于環(huán)境對(duì)每個(gè)行動(dòng)能給與反饋,所以可認(rèn)為,通過探索得到的數(shù)據(jù)是有標(biāo)簽的。

1.3 機(jī)器學(xué)習(xí)算法綜覽

本書的2-9章介紹監(jiān)督式學(xué)習(xí)算法。

第二章介紹監(jiān)督學(xué)習(xí)的基本概念、一般性算法架構(gòu)——經(jīng)驗(yàn)損失最小化、正則化算法。過擬合是經(jīng)驗(yàn)損失最小化算法常遇到的問題,正則化則是降低過擬合概率的重要手段之一。

第三章講述線性回歸算法。線性回歸算法的正規(guī)方程用到了均方誤差求解最優(yōu)解的數(shù)學(xué)表達(dá)式,但絕大多數(shù)監(jiān)督式學(xué)習(xí)算法的最優(yōu)解不存在明確數(shù)學(xué)解析表達(dá)式,因此需要用更具一般性的算法來求解——搜索算法。

第四章將系統(tǒng)講解機(jī)器學(xué)習(xí)中的搜索算法,包括梯度下降算法、隨機(jī)梯度下降算法、牛頓迭代算法以及坐標(biāo)下降算法。

第五章講解Logistic回歸算法。Logistic回歸算法將回歸算法的輸出左右sigmoid函數(shù)的輸入,這樣將輸出值限制在0-1之間。

第六章介紹另一種分類算法——支持向量機(jī)。以二元分類為例,通過訓(xùn)練,支持向量機(jī)將計(jì)算出一條直線方程,使得帶+1和-1標(biāo)簽的訓(xùn)練數(shù)據(jù)分別位于該直線的兩側(cè)。支持向量機(jī)的中心思想是選擇一條最”中立“的直線方程,使得直線到最近的兩類標(biāo)簽的數(shù)據(jù)點(diǎn)的距離相等。那些到這條直線距離最近的點(diǎn)被稱為支持向量。倘若訓(xùn)練數(shù)據(jù)間不存在明確的直線邊界,也不意味著該方法失效了,有一種名為”核方法“的算法技巧,使得支持向量機(jī)算法可以處理不規(guī)則的邊界計(jì)算問題。以上三類算法(線性回歸、logistic回歸、支持向量機(jī))都要求訓(xùn)練數(shù)據(jù)的特征組取值為數(shù)值,而面對(duì)特征組取值是類別時(shí),以上三類無法直接使用類別特征。

第七章介紹的決策樹算法時(shí)處理類別特征的最佳選擇。決策樹算法既能處理分類問題,也能處理回歸問題,具體算法性能比較詳見第七章。

第八章介紹深度學(xué)習(xí)算法的基礎(chǔ)——神經(jīng)網(wǎng)絡(luò)。

第九章介紹深度學(xué)習(xí),包含卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò),CNN模擬人類視覺,適合圖片識(shí)別的相關(guān)任務(wù),RNN模擬人腦記憶,適合于時(shí)間序列和自然語言的相關(guān)任務(wù)。

第10-11章關(guān)于無監(jiān)督學(xué)習(xí)

第十章講解降維算法。代表性算法為主成分分析法(PCA),還有線性判別分析法、局部線性嵌入法和多維縮放算法等

第十一章介紹聚類算法。包含k均值算法、合并聚類與DBSCAN算法。

第12章 關(guān)于強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)的任務(wù)形式分兩類——有模型強(qiáng)化學(xué)習(xí)和免模型強(qiáng)化學(xué)習(xí)。

對(duì)于有模型強(qiáng)化學(xué)習(xí),任務(wù)中,行動(dòng)對(duì)環(huán)境的改變效果以及可能獲得的獎(jiǎng)懲是已知的。在這一假定下,算法可以在所有行動(dòng)開始前用動(dòng)態(tài)規(guī)劃算法(值迭代與策略迭代)預(yù)先計(jì)算出最優(yōu)策略。

對(duì)于免模型強(qiáng)化學(xué)習(xí),任務(wù)中,行動(dòng)對(duì)環(huán)境的改變效果以及可能獲得的獎(jiǎng)懲是未知的。算法必須自行探索來獲得環(huán)境的信息以及行動(dòng)的獎(jiǎng)懲值。第十二章將介紹兩類免模型強(qiáng)化學(xué)習(xí)算法——時(shí)序差分模型算法和策略梯度型算法。時(shí)序差分模型算法是通過對(duì)行動(dòng)可能獲得的獎(jiǎng)懲建模來學(xué)習(xí)最優(yōu)策略,代表型算法有sarsa算法、Q學(xué)習(xí)算法和深度Q神經(jīng)網(wǎng)絡(luò)。深度Q神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的產(chǎn)物。策略梯度算法是直接對(duì)策略建模,代表型算法有REINFORCE模型和Actor-Critic算法。

總結(jié)

以上是生活随笔為你收集整理的机器学习算法概述——摘录《机器学习算法导论》的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。