日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

集成方法Ensemble Method(bagging, AdaBoost)

發布時間:2024/7/23 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 集成方法Ensemble Method(bagging, AdaBoost) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1 主要思想

  • 將原始數據分成幾個組
  • 訓練一組分類器,里面有很多種弱分類器
  • 每個分類器的標簽看作一次投票,投票最多的標簽為最終標簽

其架構如下所示:

2 為什么集成方法可行

假設這里有25個訓練的弱分類器,且這些分類器獨立工作,不會相互影響。

每一個分類器的出錯率

集成分類器的最終做出一個錯誤預測的概率(超過一半的基礎分類器都預測錯了)為:

其中:X為做出錯誤預測的弱分類器的數量

由此可見,集成分類器做出一個錯誤預測的概率比弱分類器低很多。

下圖顯示了,弱分類器(有的文檔也稱base classifier)的錯誤率(做出錯誤預測的概率)與集成分類器(ensemble classifier)的錯誤率之間的關系

由上圖可見,當弱分類器的錯誤率低于0.5時,集成分類器才有效。

集成分類器主要分為兩種,一種處理數據的分布,例如bagging,boosting;

另一種處理輸入特征,例如 random forests

?

3 Bagging Algorithm

3.1 Pseudo code

  • 放回抽樣(sampling with replacement)

3.2 實例

已知一維原始數據集:

弱分類器是一個單層決策樹(desicion stump)

抽樣,分類

統計各標簽的得票數(正票數+負票數):

上圖中最后一行為預估類(或標簽)

?

4 AdaBoosting Algorithm

4.1 Boosting

在bagging中,每一輪sampling,數據被取得概率都是一樣的,而Boosting更加關注哪些被誤分類的數據。

在Boosting算法中,首先,在第一輪Boosting中,所有的數據都被分配相同的權重(被抽取的概率),

在以后的幾輪抽取中,被抽取的權重發生變化,錯誤分類的數據的被抽取的權重將會提升,

而正確分類的數據被抽取的權重將會降低。

4.2 AdaBoosting?

4.2.1 Pseudo code

首先初始化權重w=1/n 并訓練弱分類器:C1, C2, …, CT

其次,計算錯誤率:

計算一個分類器的重要性:

更新權重:

?使所有??之和為1.

如果錯誤率高于0.5,所有權重再次被分配為1/n

分類公式:

4.2.2 實例

3.2中的一維原始數據集:

基本分類器任然是一個單層決策樹(desicion stump)

訓練數據過程:

總結:

計算權重:

分類:

預測分類的計算:

總結

以上是生活随笔為你收集整理的集成方法Ensemble Method(bagging, AdaBoost)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。