日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

二叉树剪枝_决策树,生成剪枝,CART算法

發(fā)布時(shí)間:2025/3/21 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 二叉树剪枝_决策树,生成剪枝,CART算法 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

決策樹

1.

原理

1.1

模型簡(jiǎn)介

決策樹是一種基本的回歸和分類算法。在分類問題中,可以認(rèn)為是一系列

if-then

規(guī)則的幾何。決策樹學(xué)通常包括三個(gè)步驟:特征選擇,決策樹的生成,

決策樹的修剪。

定義:決策樹由結(jié)點(diǎn)和有向邊組成,內(nèi)部節(jié)點(diǎn)表示一個(gè)特征和屬性,葉子

結(jié)點(diǎn)表示一個(gè)類。

性質(zhì):決策樹路徑(或者對(duì)應(yīng)的

if-then

規(guī)則)具有互斥且完備性:每一個(gè)

實(shí)例都被一條路徑或規(guī)則所覆蓋,而且只被這條路徑或規(guī)則所覆蓋。

決策樹學(xué)習(xí):能夠正確對(duì)數(shù)據(jù)集進(jìn)行分類的決策樹可能有多個(gè),也可能一

個(gè)也沒有,我們的目的是找到一個(gè)與訓(xùn)練數(shù)據(jù)集矛盾較小的,同時(shí)具有很好泛

化能力的決策樹。

特征選擇:一種是在決策樹學(xué)習(xí)開始的時(shí)候,對(duì)特征進(jìn)行選擇,只留下對(duì)

訓(xùn)練數(shù)據(jù)有足夠分類能力的特征,一種是在學(xué)習(xí)過程中對(duì)訓(xùn)練數(shù)據(jù)分割成自己

的時(shí)候,選擇最優(yōu)的特征進(jìn)行分割。

決策樹生成:一般這是一個(gè)遞歸的規(guī)程。

決策樹的剪枝:提高決策樹的泛化能力。

1.2

特征選擇

特征選擇的準(zhǔn)則一般是:信息增益和信息增益比

1.2.1

信息增益

a.

信息增益:

信息增益大的特征具有更強(qiáng)的分類能力,

即選擇信息增益值大的特

征作為最優(yōu)特征。

b.

信息熵:表示變量的不確定性(在得知特征

X

的信息時(shí),使得

Y

的信息不確

定性減少的程度)

,熵越大,變量的不確定性越大。設(shè)

X

是一個(gè)取有限值的離散型

隨機(jī)變量,其概率分布為:

(

)

i

i

p

X

x

p

?

?

則隨機(jī)變量

X

的熵定義為:

總結(jié)

以上是生活随笔為你收集整理的二叉树剪枝_决策树,生成剪枝,CART算法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。