當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

吴恩达《机器学习》学习笔记一——初识机器学习

發(fā)布時(shí)間：2024/7/23 编程问答 32 豆豆

生活随笔收集整理的這篇文章主要介紹了吴恩达《机器学习》学习笔记一——初识机器学习小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

吳恩達(dá)《機(jī)器學(xué)習(xí)》學(xué)習(xí)筆記一

一、什么是機(jī)器學(xué)習(xí)？
二、監(jiān)督學(xué)習(xí)
三、無監(jiān)督學(xué)習(xí)

初識(shí)機(jī)器學(xué)習(xí)
這是個(gè)人學(xué)習(xí)吳恩達(dá)《機(jī)器學(xué)習(xí)》課程的一些筆記，供自己和大家學(xué)習(xí)提升。第一篇內(nèi)容較少，日后繼續(xù)加油。

課程鏈接：https://www.bilibili.com/video/BV164411b7dx?from=search&seid=5329376196520099118

一、什么是機(jī)器學(xué)習(xí)？

機(jī)器學(xué)習(xí)一直沒有一個(gè)官方固定的定義。但課中給出了兩種解釋，個(gè)人認(rèn)為非常經(jīng)典，易于理解。

定義一：Field of study that gives computers the ability to learn without being explicitly programmed.—— Arthur Samuel(1959) 即無需明確編程，就使得計(jì)算機(jī)有學(xué)習(xí)能力的研究領(lǐng)域。

值得一提的是，阿瑟.塞繆爾（Arthur Samuel）在此之前（1952年）研發(fā)出了第一個(gè)計(jì)算機(jī)跳棋程序，它是世界上第一個(gè)可以自主學(xué)習(xí)的程序。通過和該跳棋程序不斷的下棋，使得該程序的跳棋技巧不斷得到提升，最終甚至超過了人類水平，這是機(jī)器學(xué)習(xí)早期一個(gè)非常經(jīng)典的案例。

定義二：A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. 即計(jì)算機(jī)程序從經(jīng)驗(yàn)E上學(xué)習(xí)來處理任務(wù)T，且P為性能評(píng)估，如果在T上，由P衡量的性能隨著經(jīng)驗(yàn)E的學(xué)習(xí)而提高，這就是機(jī)器學(xué)習(xí)。

下面看一個(gè)課中給出的定義二的例子：

這是一個(gè)郵件分類問題，基于已知郵件是否為垃圾郵件的信息，來優(yōu)化郵件分類系統(tǒng)。此處選項(xiàng)一：把郵件分類為垃圾或正常郵件是機(jī)器學(xué)習(xí)的T；選項(xiàng)二：觀察你標(biāo)記的郵件是垃圾還是正常是機(jī)器學(xué)習(xí)的E；選項(xiàng)三：正確分類郵件的數(shù)量是機(jī)器學(xué)習(xí)的P。

此外，機(jī)器學(xué)習(xí)有其分類，主要分為如下三類：

機(jī)器學(xué)習(xí)分類具體算法舉例

監(jiān)督學(xué)習(xí)	線性回歸、SVM、決策樹等
無監(jiān)督學(xué)習(xí)	聚類、密度估計(jì)等
其他：強(qiáng)化學(xué)習(xí)、推薦系統(tǒng)等	-待學(xué)習(xí)-

所以下面分別討論了基本的監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。

二、監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)的特點(diǎn)是，學(xué)習(xí)數(shù)據(jù)都是有標(biāo)注的。如經(jīng)典的房價(jià)預(yù)測案例，它的數(shù)據(jù)集中數(shù)據(jù)樣本不僅給出了各自的屬性值，還給出了具體的房價(jià)大小，而這個(gè)房價(jià)大小就是所謂的標(biāo)注，也就是需要預(yù)測的屬性，模型從帶有標(biāo)注的數(shù)據(jù)中學(xué)習(xí)，隨后對新的數(shù)據(jù)預(yù)測其標(biāo)簽值。如下圖所示是房價(jià)預(yù)測的一個(gè)示例。

圖中為簡單起見，只考慮了房子的一個(gè)屬性：面積（feet2），而實(shí)際還需要考慮很多其他屬性如：朝向、地段等。紅色的×表示已知的一批帶有標(biāo)注的數(shù)據(jù)，要從這些數(shù)據(jù)中學(xué)習(xí)得一種模型，使得后續(xù)預(yù)測的值比較真實(shí)，紅色的直線是一次函數(shù)模型，藍(lán)色的曲線是更復(fù)雜的模型，目標(biāo)都是盡可能地模擬所有數(shù)據(jù)。模型選擇的好壞，也會(huì)對預(yù)測有很大的影響（此處藍(lán)色的模型看起來要比紅色的好）。若已得到一個(gè)模型，則新給出一個(gè)輸入如：房屋面積為750feet2，根據(jù)模型則可以得到預(yù)測房價(jià)為多少。

此外，房價(jià)預(yù)測也是回歸問題的一個(gè)實(shí)例，所謂回歸，就是預(yù)測值是連續(xù)值，此處房價(jià)是一個(gè)連續(xù)值，所以是一個(gè)回歸問題。
與此對應(yīng)，若預(yù)測值是離散的，則被稱為分類問題，如上述提到的郵件分類，預(yù)測值只有垃圾郵件和正常郵件兩個(gè)值。如下圖所示，是根據(jù)腫瘤尺寸這個(gè)屬性來對乳腺腫瘤進(jìn)行分類的數(shù)據(jù)，標(biāo)簽值只有0（良性）和1（惡性）兩種。

而往往不止通過一個(gè)屬性進(jìn)行學(xué)習(xí)，還可能通過細(xì)胞尺寸均勻度、細(xì)胞形狀均勻度、患者年齡等許多屬性來進(jìn)行學(xué)習(xí)。

三、無監(jiān)督學(xué)習(xí)

無監(jiān)督學(xué)習(xí)與監(jiān)督學(xué)習(xí)相對，當(dāng)學(xué)習(xí)數(shù)據(jù)不帶有標(biāo)簽時(shí)，就可以看成是無監(jiān)督學(xué)習(xí)，也可以理解為沒有正確答案的學(xué)習(xí)。無監(jiān)督學(xué)習(xí)在做的，更多的是找出數(shù)據(jù)之間的相似相關(guān)性。如下圖所示，x1和x2是數(shù)據(jù)的兩個(gè)屬性，數(shù)據(jù)不帶有標(biāo)簽，無監(jiān)督學(xué)習(xí)會(huì)尋找數(shù)據(jù)之間的相似性，將無標(biāo)注的數(shù)據(jù)劃分為一個(gè)個(gè)的簇。

總結(jié)

以上是生活随笔為你收集整理的吴恩达《机器学习》学习笔记一——初识机器学习的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： QT事件过滤器eventFilter函数
下一篇： sublime text插件emmet的