通俗易懂地搞懂决策树(Decision Tree)那些事儿
一、決策樹是什么?
“決策樹是一顆好樹,是一顆可以幫我們做決策的樹。”
決策樹的結構:樹形結構,節(jié)點表示判斷條件(分為根節(jié)點和中間節(jié)點),分支代表判斷結果,葉子代表分類結果。
二、如何構造一棵決策樹
1.當我們要構造一棵決策樹的時候,大概首先想到的就是以下4個問題:
- 選哪個作為根節(jié)點?
- 根節(jié)點選定后,怎么選中間節(jié)點?
- 最后的葉節(jié)點又是怎樣確認的?到什么程度呢?
- 怎樣把這個事弄的更細致,使其能夠讓計算機來實現(xiàn)?
2.要解決上面的問題,先來看下構造決策樹的流程
收集數(shù)據(jù)->準備數(shù)據(jù)->分析數(shù)據(jù)->訓練算法->測試算法->使用算法
針對構造決策樹時候面臨的問題,衍生了很多決策樹算法,他們處理的根本問題是上面流程的第四步——訓練算法,實際上也就是劃分數(shù)據(jù)集方法。一般有ID3、C4.5、C5.0三種算法。
1) ID3算法
根據(jù)信息熵算法計算節(jié)點的信息增益,信息增益最大的自變量作為根節(jié)點,其他的特征值依次選取為內部節(jié)點。
2) C4.5算法
待更新。。。。
3) C5.0算法
待更新。。。。
三、決策樹與多條件過濾有什么區(qū)別?
從決策樹的結構可以看出來,其實決策樹的本質就是多條件過濾,但與多條件過濾的區(qū)別主要體現(xiàn)在各判斷的條件上,多條件過濾中各個判斷條件的權重是一樣的,而決策樹中越是處于樹結構頂端的節(jié)點權重占比越大,比如根節(jié)點的權重是最大的。這就好比去面試,一面沒過的話就沒必要進行二面、三面、四面了。因此決策樹過濾的效率會比多條件過濾更高。
四、決策樹的應用
決策樹在商業(yè)中的實際應用很多,比如銷量預測模型。
五、決策樹的python實現(xiàn)
待更新。。。。
參考文章:
百度百科:決策樹
一篇文章搞懂機器學習中決策樹的那些事兒
?
總結
以上是生活随笔為你收集整理的通俗易懂地搞懂决策树(Decision Tree)那些事儿的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python 3.9要发布啦,快来看看有
- 下一篇: 阿里攻城狮岗级分析