机器学习-机器学习简介
生活随笔
收集整理的這篇文章主要介紹了
机器学习-机器学习简介
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
機器學習簡介
即使是機器學習領域的專業人士,也很難給機器學習這一概念下一個準確的定義,比較常見的說法有兩種。Arthur Samuel描述其為“使計算機無需明確編程就能自主學習的研究領域”,Tom Mitchell給了一個更為流行的解釋為“一個計算機程序從經驗E中學習某些類型的任務T和性能度量P,如果它在任務T中的性能(以P度量)隨著經驗E提高了,稱之為具有機器學習能力。”
文章目錄
- 機器學習簡介
- 簡介
- 監督學習(Supervised Learning)
- 非監督學習(Unsupervised Learning)
- 發展狀況
- 補充說明
簡介
- 如今,機器學習作為人工智能的主要研究方向被落地使用于各個行業,機器學習算法的有效及強大備受關注,由基本的機器學習算法衍生了很多子方向如強化學習、深度學習等,這些領域歸根結底都是經典的機器學習方法的擴充。
- 一般將機器學習劃分為兩個類別,即監督學習和無監督學習,前者依據數據的特征和標簽,后者只依賴數據的特征。
監督學習(Supervised Learning)
- 監督學習是指訓練算法的數據集的樣本都有實際的標簽(label)存在,如房價問題的房價、垃圾郵件識別問題的郵件類別。
- 監督學習主要由分類(Classification)和回歸(Regression)兩個類別組成,回歸問題要求預測連續的輸出值如房價,分類問題要求預測離散的輸出值如好或者壞。形象地說,回歸問題要求找到一個盡量擬合訓練數據分布的函數表達,分類問題要求找到一個盡量區分訓練數據不太類別數據的分界線。某種程度上,這兩種問題可以相互轉化。
- 如圖,對于回歸問題,盡量找到一條擬合全部數據的函數;對于分類問題,盡量找到區分不同類別樣本的分界線函數。
非監督學習(Unsupervised Learning)
- 非監督是指訓練算法的數據集的樣本只包含特征,而沒有標簽、目標之類的信息,我們不知道什么是好什么是壞,我們需要找到盡量區分不同樣本的方法,如聚類算法。經典的問題如新聞主題聚合。
- 非監督學習的典型問題是聚類問題,要求找出數據中的類型結構,并劃分出來。
- 如圖,對于聚類問題,要求發現數據的潛在特性,進行類別劃分。
發展狀況
- 目前,監督學習和非監督學習的發展如火如荼,然而取得較為實用的成就且能用于工業界的大多還是監督學習算法,換句話說,我們仍然需要大量的人工標注的數據用于模型的訓練。
- 當然,近些年很多深度學習方法(如自動編碼器)被逐漸用于非監督學習領域,這也促使非監督學習的進一步發展。
- 未來的強人工智能應該是更加依賴非監督學習算法,配合以監督學習算法的。
補充說明
- 本文力求簡潔介紹機器學習的一些基本概念,思路參照吳恩達的機器學習課程(Coursera)。
- 本系列相關的博文和代碼開放于Github,歡迎訪問項目。同時博客也同步在我的個人博客網站,歡迎訪問查看其他文章。
- 由于能力有限,如有錯誤,歡迎評論指正。
總結
以上是生活随笔為你收集整理的机器学习-机器学习简介的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: TensorFlow2-高层API接口K
- 下一篇: TensorFlow2-网络训练技巧