當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习知识总结系列- 基本概念（1-0）

發(fā)布時間：2023/12/13 编程问答 38 豆豆

生活随笔收集整理的這篇文章主要介紹了机器学习知识总结系列- 基本概念（1-0）小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

文章目錄

目錄
- 1. 機(jī)器學(xué)習(xí)的定義
- 2. 機(jī)器學(xué)習(xí)的分類
- - 2.1根據(jù)是否在人類監(jiān)督下進(jìn)行訓(xùn)練
  - - 監(jiān)督學(xué)習(xí)
    - 非監(jiān)督學(xué)習(xí)
    - 半監(jiān)督學(xué)習(xí)
    - 強(qiáng)化學(xué)習(xí)
  - 2.2根據(jù)是否可以動態(tài)漸進(jìn)的學(xué)習(xí)
  - - 在線學(xué)習(xí)
    - 批量學(xué)習(xí)
  - 2.3根據(jù)是否在訓(xùn)練數(shù)據(jù)過程中進(jìn)行模式識別
  - - 實例學(xué)習(xí)
    - 基于模型的學(xué)習(xí)
- 3. 機(jī)器學(xué)習(xí)中的一些常見名詞
- 4. 機(jī)器學(xué)習(xí)的挑戰(zhàn)
- - 4.1 訓(xùn)練的數(shù)據(jù)量不足
  - 4.2 沒有代表性的數(shù)據(jù)
  - 4.3 低質(zhì)量的數(shù)據(jù)
  - 4.4 不相關(guān)的特征
  - 4.5 過擬合和欠擬合
- 5. 其他
- - 5.1偏差與方差
  - - 概念
    - 導(dǎo)致偏差和方差的原因
    - 深度學(xué)習(xí)中的偏差與方差
    - 偏差與方差的計算公式
    - 偏差與方差的權(quán)衡（過擬合與模型復(fù)雜度的權(quán)衡）
  - 5.2 生成模型與判別模型
  - - 概念
    - 優(yōu)缺點(diǎn)
    - 常見模型
  - 5.3 先驗概率與后驗概率

強(qiáng)化學(xué)習(xí)是智能體（Agent）以“試錯”的方式進(jìn)行學(xué)習(xí)，通過與環(huán)境進(jìn)行交互獲得的獎賞指導(dǎo)行為，目標(biāo)是使智能體獲得最大的獎賞，強(qiáng)化學(xué)習(xí)不同于連接主義學(xué)習(xí)中的監(jiān)督學(xué)習(xí)，主要表現(xiàn)在強(qiáng)化信號上，強(qiáng)化學(xué)習(xí)中由環(huán)境提供的強(qiáng)化信號是對產(chǎn)生動作的好壞作一種評價(通常為標(biāo)量信號)，而不是告訴強(qiáng)化學(xué)習(xí)系統(tǒng)RLS(reinforcement learning system)如何去產(chǎn)生正確的動作。由于外部環(huán)境提供的信息很少，RLS必須靠自身的經(jīng)歷進(jìn)行學(xué)習(xí)。通過這種方式，RLS在行動-評價的環(huán)境中獲得知識，改進(jìn)行動方案以適應(yīng)環(huán)境。

2.2根據(jù)是否可以動態(tài)漸進(jìn)的學(xué)習(xí)

在線學(xué)習(xí)

與批量學(xué)習(xí)不同，在線學(xué)習(xí)假設(shè)訓(xùn)練數(shù)據(jù)持續(xù)到來，通常利用一個訓(xùn)練樣本更新當(dāng)前的模型，大大降低了學(xué)習(xí)算法的空間復(fù)雜度和時間復(fù)雜度，實時性強(qiáng)。在大數(shù)據(jù)時代，大數(shù)據(jù)高速增長的特點(diǎn)為機(jī)器學(xué)習(xí)帶來了嚴(yán)峻的挑戰(zhàn)，在線學(xué)習(xí)可以有效地解決該問題，引起了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。

批量學(xué)習(xí)

不能進(jìn)行持續(xù)的學(xué)習(xí)，在線使用和離線學(xué)習(xí)完全分開，只是使用離線學(xué)習(xí)到的策略。

2.3根據(jù)是否在訓(xùn)練數(shù)據(jù)過程中進(jìn)行模式識別

實例學(xué)習(xí)

直接從實例當(dāng)中進(jìn)行學(xué)習(xí)，最簡單的方法就是查表，即所謂的記憶學(xué)習(xí)。其中KNN可以認(rèn)為是一種基于實例的學(xué)習(xí)方法。

基于模型的學(xué)習(xí)

從樣本中進(jìn)行歸納，然后建立樣本的模型，然后根據(jù)模型進(jìn)行新樣本的預(yù)測，則為基于模型的學(xué)習(xí)。大部分的機(jī)器學(xué)習(xí)模型都是基于模型的學(xué)習(xí)方法。

3. 機(jī)器學(xué)習(xí)中的一些常見名詞

4. 機(jī)器學(xué)習(xí)的挑戰(zhàn)

4.1 訓(xùn)練的數(shù)據(jù)量不足

在機(jī)器學(xué)習(xí)領(lǐng)域，往往是大數(shù)據(jù)+簡單模型的效果比小量數(shù)據(jù)+復(fù)雜模型的效果好。
對于復(fù)雜問題，數(shù)據(jù)比算法更重要
在實際的問題中，獲取大量的有標(biāo)簽的數(shù)據(jù)往往是很困難的，所以優(yōu)化算法也是比較重要的。

4.2 沒有代表性的數(shù)據(jù)

機(jī)器學(xué)習(xí)的本質(zhì)是使用模型通過已有的數(shù)據(jù)去盡可能的擬合原始數(shù)據(jù)的分布情況，如果用于擬合的數(shù)據(jù)無法很好的代表全部數(shù)據(jù)的分布（即：采樣有偏的情況下），學(xué)習(xí)到的模型就是不準(zhǔn)確的模型。

4.3 低質(zhì)量的數(shù)據(jù)

訓(xùn)練集中含有大量的噪聲，異常點(diǎn)，錯誤都會影響模型的訓(xùn)練。
花費(fèi)時間對數(shù)據(jù)進(jìn)行清理是很有必要的。

4.4 不相關(guān)的特征

特征對于機(jī)器學(xué)習(xí)非常重要，所謂：進(jìn)去的是垃圾，出來的也是垃圾。
特征工程是機(jī)器學(xué)習(xí)中很重要的一部分工作。

4.5 過擬合和欠擬合

5. 其他

5.1偏差與方差

概念

導(dǎo)致偏差和方差的原因

深度學(xué)習(xí)中的偏差與方差

神經(jīng)網(wǎng)絡(luò)的擬合能力非常強(qiáng)，因此它的訓(xùn)練誤差（偏差）通常較小；
但是過強(qiáng)的擬合能力會導(dǎo)致較大的方差，使模型的測試誤差（泛化誤差）增大；
因此深度學(xué)習(xí)的核心工作之一就是研究如何降低模型的泛化誤差，這類方法統(tǒng)稱為正則化方法

偏差與方差的計算公式

偏差與方差的權(quán)衡（過擬合與模型復(fù)雜度的權(quán)衡）

5.2 生成模型與判別模型

概念

優(yōu)缺點(diǎn)

常見模型

5.3 先驗概率與后驗概率

已將發(fā)生的概率就是最大的。

總結(jié)

以上是生活随笔為你收集整理的机器学习知识总结系列- 基本概念（1-0）的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：《Python Cookbook 3rd
下一篇： PCB布局，布线技巧总结