日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

从基础概念到数学公式,这是一份520页的机器学习笔记(图文并茂)

發(fā)布時間:2023/12/4 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 从基础概念到数学公式,这是一份520页的机器学习笔记(图文并茂) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.



導讀:近日,來自SAP(全球第一大商業(yè)軟件公司)的梁勁(Jim Liang)公開了自己所寫的一份 520 頁的學習教程(英文版),詳細、明了地介紹了機器學習中的相關概念、數(shù)學知識和各種經典算法。完整的 PDF 請從文后作者公開的鏈接下載。



在介紹中,Jim Liang?寫到:


人工智能是這兩年風頭正勁的領域,也是未來具有顛覆性可能的新領域。不少人嘗試去學習機器學習相關的知識。然而,一旦越過最初的 overview 階段,很多人就開始打退堂鼓了,然后迅速放棄。


為什么會這樣?


極高的學習曲線


  • 首當其沖就是數(shù)學,涉及統(tǒng)計學、微積分、概率、線性代數(shù)等,大家雖然都學過高等數(shù)學,但如果你還記得里面的細節(jié),算你牛。更可能的情況是,多數(shù)人都對高等數(shù)學忘記了,面對各種算法里的大量公式,感到厭惡,甚至恐懼。

  • 其次因為機器學習本身是一個綜合性學科,而且是一個快速發(fā)展的學科,知識點散亂,缺乏系統(tǒng)性。

  • 市面上的機器學習/深度學習書籍、文章、教程,遍地開花,但能以清晰的方式表達、循序漸進地講解的教程,其實不多,大量的教程沒有考慮到學習者的基礎,使得初學者感到挫敗和困惑。


圖解機器學習


正是對機器學習的過程中的痛苦有切身體會,我希望能做一份教程,以淺顯易懂的方式去講解它,降低大家的學習門檻。我為此花費了數(shù)月時間,經常做到深夜,把自己的學習筆記整理成了這份教程。


從結構來看,全部教程包含兩部分:



Part 1 介紹了基本概念,包括:


  • 機器學習的流程

  • 數(shù)據處理

  • 建模

  • 評估指標(如 MSE、ROC 曲線)

  • 模型部署

  • 過度擬合

  • 正則化等


在第一部分,作者先介紹了如今應用普遍的機器學習:從自動駕駛、語音助手到機器人。其中有些思想,也是眾多讀者們了解過的,例如:為何機器學習在這個時候會火(大數(shù)據、計算力、更好的算法);機器學習、人工智能、深度學習三者的關系等。


除了這些基礎概念,這份教程也對機器學習模型的開發(fā)流程做了圖像化展示(如下圖),即使對此不太了解的讀者,也能通過這種流程展示有所學習。


▲建立機器學習解決方案的步驟


在 Part1 的其他小節(jié),作者以類似的圖像展示,對數(shù)據、建模、模型部署等內容做了詳細介紹,這里就不一一列舉,可以從原報告查看。


在 Part2,作者介紹了 常用的算法,包括:


  • 線性回歸

  • 邏輯回歸

  • 神經網絡

  • SVM

  • Knn

  • K-Means

  • 決策樹

  • 隨機森林

  • AdaBoost

  • 樸素貝葉斯

  • 梯度下降

  • 主成分分析


這部分包含了大量的數(shù)學公式,但作者盡力注解了其中的每個公式,從而充分、清晰地表達了眾多數(shù)學概念。


例如在「神經網絡」部分,作者整理了 59 頁的筆記(從 311 頁到 369 頁)。作者從人腦中的神經元架構說起,介紹了人工神經網絡(ANN)、人工神經元工作的原理。這份筆記非常注重圖像化的概念解釋,理解起來非常直觀。


例如,下圖中的概念解釋很形象地展現(xiàn)了生物神經元和人工神經元工作方式的相似性。


▲生物神經元的樹突輸入-軸突輸出模式和人工神經元的輸入輸出模式對比。


▲過擬合的解釋


▲人工神經元的基礎結構


在涉及到數(shù)學公式時,作者會在旁邊有詳細的注解,如下圖所示:



對于并列的可選項(如激活函數(shù)、常用神經網絡架構等),也會有全面的列表:


▲常用的激活函數(shù)


然后會有每個激活函數(shù)的單獨介紹:


▲Sigmoid 激活函數(shù)


▲用神經網絡分類手寫數(shù)字的前向傳播示例(softmax 激活函數(shù))。


對于神經網絡中較為復雜的概念(如求導、反向傳播),幾張圖就能解釋清楚:



關于神經網絡的完整訓練過程,作者用簡略流程圖+計算細節(jié)展開的方式呈現(xiàn):


▲反向傳播算法完整流程


▲前向傳播部分的計算細節(jié)


就像前面提到的,這部分除了「神經網絡」的介紹,還包括隨機森林、梯度下降等概念的介紹,讀者們可查看原教程。


總結


看完這份教程之后,小編覺得這是一份包羅萬象的學習筆記,既適合非專業(yè)人士了解有關機器學習的基礎概念,又適合有專業(yè)背景的學生進一步學習。


寫教程是為了自己持續(xù)學習,分享教程是為了幫助更多人學習。就像作者所說,「Learning by doing/teaching, 寫這個教程主要是強迫自己持續(xù)學習,另外,也想分享給他人,希望能幫助到更多想學習 Machine Learning 的人,降低大家的學習痛苦。」


筆記作者:Jim Liang

來源:機器之心(ID:almosthuman2014)

教程文檔下載地址(百度云):

https://pan.baidu.com/s/1tNXYQNadAsDGfPvuuj7_Tw


文章版權歸原作者所有,轉載僅供學習使用,不用于任何商業(yè)用途,如有侵權請留言聯(lián)系刪除,感謝合作。


總結

以上是生活随笔為你收集整理的从基础概念到数学公式,这是一份520页的机器学习笔记(图文并茂)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。