李宏毅机器学习笔记:机器学习介绍
前言
本文記錄了關于機器學習的基本介紹,機器學習的一個基本的框架以及機器學習的相關技術,并且本文是基于臺灣李宏毅機器學習課程的基礎上所做的筆記。
一、機器學習介紹
- 機器學習是什么
機器學習的本質其實就是在尋找一個Function,這個Function可以滿足我們的期望:輸入一個特定的值,輸出我們所需要的,比如在自然語言方面輸入一段語音期望能夠識別出語音的內容,在圖像識別方面,輸入圖像期望輸出圖像內容的類別等等
- 機器學習的總體過程
機器學習的總體過程可以分為三個部分:第一找到特定的Function;第二衡量Function的性能好壞;第三挑選出最優的Function
二、機器學習的分類
- 機器學習總體分為以下幾大類
機器學習可分為:監督學習、無監督學習、半監督學習、強化學習、遷移學習,當然這是個人認為僅僅代表個人觀點;其中深度學習事實上是本事屬于機器學習的內容,只不過深度學習在后來的研究中專門拿出來另起爐灶,深度學習的前身就是機器學習中的神經網絡,當然個人認為目前大多數的深度學習都屬于監督學習的范疇,大都建立在大數據集的基礎上。
- 監督學習
監督學習的官方一點的解釋就是:根據已有的數據集,知道輸入和輸出結果之間的關系,根據這種已知的關系,訓練得到一個最優的模型。也就是說,在監督學習中訓練數據既有特征(feature)又有標簽(label),通過訓練,讓機器可以自己找到特征和標簽之間的聯系,在面對只有特征沒有標簽的數據時,可以判斷出標簽。通俗一點講就是,我們在不斷地教機器做事。監督學習大體也可以分為回歸和分類兩大類型,這兩個的任務基本上也都是建立在大數據的基礎上,比如回歸任務中的房價預測,得先收集足夠多的過去的房價數據才可以對未來的房價進行預測;在分類任務中對圖像內容進行二分類或者多分類,同樣是通過收集足夠多的樣本圖像并注明該圖像的內容所屬,才可對新的圖像進行一個分類。
- 無監督學習
無監督學習就是監督學習的反例,就是沒有人教,給了他數據但是沒有人告訴機器這些數據是屬于什么,無監督學習更像是在自學不斷地碰壁不斷地總結規律。比如機器學習中的經典算法聚類算法,KNN,Kmeans等都是屬于無監督學習。
- 半監督學習
半監督學習就是給定兩類數據集一類是有標注的數據另一類是無標注的數據,因為在現如今社會大多數的數據集基本上不可能全是有標注也不可能全是無標注,因此半監督學習就是監督學習和無監督學習的一種融合,在做訓練的時候通過有標注數據來輔助無標注數據的擬合或者訓練。
- 遷移學習
遷移學習就是把已訓練好的模型(預訓練模型)參數遷移到新的模型來幫助新模型訓練。考慮到大部分數據或任務都是存在相關性的,所以通過遷移學習我們可以將已經學到的模型參數(也可理解為模型學到的知識)通過某種方式來分享給新模型從而加快并優化模型的學習效率不用像大多數網絡那樣從零學習。
- 強化學習
強化學習一個叫很經典的例子就是人工智能的圍棋,Alpha Go那樣的人工智能使用的就是強化學習,強化學習和監督、非監督不同,強化學習沒有所謂的標注,有的是獎勵和懲罰,也可以看作是分數,給機器數據讓機器走,如果做的好就獎勵或者分數更高,做不好就懲罰分數更低。
總結
以上是生活随笔為你收集整理的李宏毅机器学习笔记:机器学习介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 李宏毅机器学习笔记——Transform
- 下一篇: 阿里销售铁军:阿里巴巴客户跟进流程