【机器学习】如何通俗易懂地阐述机器学习?
機器學習是一個非常火爆的術語。本文以最通俗易懂的方式闡述了機器學習的基本原理及其應用。
什么是機器學習?
機器學習,顧名思義,一臺機器,正在學習一些東西。這是一個學習過程,從觀察輸入到特定機器的數據開始,機器在該數據中尋找特定模式,以便使用它做出決策。
它的核心目標是讓機器/計算機僅通過使用某些算法來本能地學習,而無需任何人工干預或幫助,并相應地調整其方法以適應模型。
簡而言之,機器學習是對計算機算法的研究,它可以通過使用數據自動改進。
機器學習的先決條件
★?訓練數據集
它是用于擬合用于訓練數據集的模型的數據集。它幫助機器學習數據以及如何進一步使用它。
★?驗證數據集
它是用于對模型在訓練數據集上的擬合度進行無偏評估的數據樣本,同時調整模型超參數(其值用于控制學習過程的參數),它也被稱為開發集。
★?測試數據集
它是獨立于訓練集的數據集,用于對訓練數據集上的最終模型擬合提供無泄漏數據評估。
★?標簽數據
標簽數據是一組用一個或多個標簽標記過的數據樣本。
機器學習的方法
機器學習方法大致分為四類,如下所示:
☆?監督學習
它是最常見和最容易使用的算法之一;機器使用標記良好的訓練數據進行訓練。
☆?無監督學習
這是一種機器學習算法,其中模型使用未標記的數據集進行訓練,并允許在沒有任何外部監督的情況下對數據采取行動。
☆?半監督學習
它是一種機器學習算法,它由一小部分標記數據和大部分未標記數據組成,模型可以從中進行所需的預測。
☆?強化學習
它是一種獨特的機器學習算法,它獎勵期望的輸出并懲罰錯誤,以訓練機器。
實現機器學習模型的步驟
①?確定訓練數據集的類型
檢查它是數值數據、分類數據、時間序列數據還是基于文本的數據。還要檢查存在多少因變量和自變量。
②?收集標記的訓練數據
確定目標是什么以及特征是什么,以獲得識別模式并預測目標數據。
③?拆分數據集
根據需求將實體數據集拆分為兩個或三個部分——訓練集、驗證集和測試集。
④?確定訓練數據集的輸入特征
理解給定數據集的特征。
⑤?確定訓練數據集的合適算法
在了解需求后,我們需要為我們的數據集決定最合適的數據集——回歸/分類、聚類/關聯、決策樹等。
⑥?在訓練數據集上執行算法
在數據上應用選定的算法來訓練數據集。
⑦?評估模型的準確性
通過提供測試數據,可以了解和評估模型的準確性。
監督學習
定義:根據已有的數據集,知道輸入和輸出結果之間的關系。根據這種已知的關系,訓練得到一個最優的模型。
也就是說,在監督學習中訓練數據既有特征(feature)又有標簽(label),通過訓練,讓機器可以自己找到特征和標簽之間的聯系,在面對只有特征沒有標簽的數據時,可以判斷出標簽。
監督學習是一種機器學習技術,其中機器使用標記良好的數據進行訓練。它的主要目標是找到一個映射函數來映射輸入變量和輸出變量。
監督學習可以分為兩種 ——?單因素監督學習和多元監督學習。
◎?單變量監督學習?由?一個因變量?和?一個自變量?組成。
◎?多元監督學習?由?一個因變量?和?一個以上的自變量?組成。
監督學習算法的類型
☆?回歸分析
回歸分析是一種統計方法,如果用于輸入變量和連續輸出變量之間存在關系,則使用該方法。回歸分析類型的算法有——線性回歸、回歸樹、非線性回歸、貝葉斯線性回歸、多項式回歸。
☆?分類分析
當輸出變量是分類的時候使用分類方法;即只有限個解決方案。分類分析類型的算法有——邏輯回歸、支持向量機、K-最近鄰、SVM、樸素貝葉斯、決策樹分類、隨機森林分類。
監督學習的優點
◎ 監督學習模型可以在使用訓練集訓練模型的基礎上預測輸出。
◎ 我們對正在使用的類別有一個明確的概念,因為它們被標記了。
◎ 它可以幫助我們解決現實世界中的問題。
監督學習的缺點
◎ 它不適用于復雜的數據集。
◎ 如果測試數據與訓練數據不同,則無法預測正確的輸出。
◎ 訓練模型需要大量計算。
監督學習在現實生活中的應用
監督學習在現實生活中的應用非常多,如· 文本分類、垃圾郵件檢測、天氣預報、根據當前市場價格預測房價、股票價格預測、人臉識別、簽名識別、客戶發現等待。
◎?圖像識別:圖像識別是監督機器學習最重要的例子之一。它檢測圖像之間的模式并做出適當的預測。這主要用于安全和醫療目的。
◎?語音識別:語音識別是可以將口語轉換為可讀文本的方法。最著名的語音助手,例如Siri、Alexa、天貓精靈、小愛同學等等,都使用此應用程序。
無監督學習
無監督機器學習(Unsupervised Machine Learning)是一種機器學習技術,它使用未標記的數據集訓練模型,并允許模型在該數據集上工作和行動,而不需要任何外部的人工干預或監督。
無監督學習對于從數據中找到有用的見解非常有幫助。這是非常熟悉的方式,人類學習通過自己的經驗來思考。即使輸入數據與輸出數據不一致,此方法也可以工作。
無監督學習算法的類型
☆?聚類
聚類是將對象分組為簇的方法,其中最相似的對象保留在特定組中,而差異較大的則屬于另一組。
☆?關聯
關聯是在大型數據庫中查找變量之間關系的方法。我們開始了解一個變量如何直接或間接地與另一個變量相關聯。
不同類型的算法有?K-means、K近鄰、層次聚類分析、Anamoly 分析、神經網絡、主成分分析、獨立成分分析?等。
無監督學習的優點
◎ 無監督學習可用于解決復雜的任務。
◎ 有更大的自由來探索現有的數據。
無監督學習的缺點
◎ 很難處理。
◎ 預測的準確性可能更低。
無監督學習的現實生活應用
惡意軟件檢測、數據輸入過程中人為錯誤識別、進行準確的購物籃分析、欺詐檢測等等
◎?客戶細分:根據客戶各種特征的將他們分成多個群。
◎?庫存管理:庫存管理是商店使用的應用程序,可以通過關聯找到某些產品之間的聯系。
半監督學習
半監督學習是一種機器學習方法,其中使用一小部分標記數據和大部分未標記數據來訓練模型。
半監督學習的優點
◎ 用于半監督學習的算法本質上是穩定的。
◎ 它本質上是高效的。
半監督學習的缺點
◎ 準確率可能不高。
◎ 迭代結果不是很穩定。
半監督學習在現實生活中的應用
據報道,在工業界,支付寶的風控與微信中掃一掃的識物,已利用半監督學習節省人力,并提升識別效果。
◎?語音分析:音頻文件的標記是一項非常密集的任務,其中可能只標記部分特征,并且需要大量人工干預。
◎?網頁內容分類:在線內容需要根據我們的搜索和關鍵字進行分類。
強化學習
強化學習是一種機器學習方法,它是按順序做出決策。輸出取決于當前輸入的狀態,下一個輸入取決于輸入預覽的輸出。做出的決定是完全依賴的,因此標簽被賦予了依賴決定的序列。
強化學習被稱為機器學習中的半監督學習模型,是一種允許代理采取行動并與環境交互以最大化總獎勵的技術
強化學習的類型
☆?正強化
正強化是指由于特定行為而發生的事件會增加該特定行為發生的頻率。它還可以最大限度地提高性能,并在很長一段時間內保持變化。
☆?負強化
負強化被定義為在避免負條件時模型行為的強化。它增加了行為,它還提供了對最低標準性能的顛覆。
強化學習的優點
◎ 它可以用來解決非常復雜的問題。
◎ 它取得了長期的成果。
強化學習的缺點
◎ 過度的強化學習會導致過載,從而減少結果。
◎ 它不是解決簡單問題的首選。
強化學習在現實生活中的應用
強化學習應用于無人駕駛、金融貿易、醫療保健、工程、新聞推薦、廣告營銷、機器人控制等等領域。
◎?股票預測:股票預測需要強化學習來了解市場及其未來走勢。
◎?金融貿易:強化學習通過市場基準標準對RL模型進行評估,確保RL智能體正確做出持有、購買或是出售的決定,以保證最佳收益。
◎?自動駕駛:有些自動駕駛的任務可以與強化學習相結合,比如軌跡優化,運動規劃,動態路徑,最優控制,以及高速路中的情景學習策略。
◎?游戲:我們玩的單人游戲需要我們的設備進行下一步,而移動將基于我們之前的移動。國際象棋、Ludo、UNO 等需要強化學習。
寫在最后
至此我們了解機器學習算法和模型的基礎知識,以及它們可以在現實世界中的哪些地方使用。
如果你有更好的想法,歡迎一起交流學習呀~
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載黃海廣老師《機器學習課程》視頻課黃海廣老師《機器學習課程》711頁完整版課件本站qq群554839127,加入微信群請掃碼:
總結
以上是生活随笔為你收集整理的【机器学习】如何通俗易懂地阐述机器学习?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 风姐姐,对不起
- 下一篇: 腾讯视频下载安装免费2020_腾讯视频a