日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > java >内容正文

java

java决策树_【Java】决策树介绍和使用

發布時間:2023/12/3 java 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 java决策树_【Java】决策树介绍和使用 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

現在生活中,越來越多的時候 需要進行判斷和決策,因此關于怎么去判斷和決策,需要根據一定的依據進行判斷和決策,并不是憑空的按照自己的意愿去判斷和決策,就比如舉個例子; 假如甲同學準備結婚,但是在準備結婚之前,甲的女朋友需要甲買一套房子,但是甲去買房子的過程中,開發商進會對甲是否能夠購買方法進行評估和決策:

如下圖:

圖一

分析: ①開發商對于你是否能夠購買房子 進行判斷的第一個依據是 “能否購買” 如果你又現金 OK,可以購買,如果你沒有現金 會對再次判斷; ②判斷你是否有工作,如果沒有工作 ,直接不讓你買,如果有工作,還不一定能讓你買,還要繼續判斷你 的工資是多少。 ③如果工資 大于4K的 OK,你可以購買,如果你工資不大于4K的,還要看你的職業; ④如果職業是 公務員的 ,OK 你可以購買,如果你不是公務員的,不讓你購買;

這個例子中,就形成了一個決策樹;

那什么是決策樹:決策樹(decision tree):是一個樹形結構,決策樹從根開始進行決策,直到到葉子節點,得到決策結果,當然這個決策樹不是分支越多越好,而是決策的分支越少越好,并且有些不必要的分支,我們最終的時候,還要進行剪枝;

但是這個決策樹,不是憑空形成的,在形成這個決策樹的過程中,我們會想到一些問題?

①為什么是第一個按照 “能否購買” 來進行判斷決策; ②為什么是第二個按照 “是否有工作” 來進行判斷決策; ③為什么是第三個按照 “工資多少”來進行判斷決策; ④這些順序能夠進行調整?

要分析清楚這樣的分類問題,我們需要了解一些分類的算法 ID3算法,C4.5算法,CART算法 ID3算法是早期的算法,存在一些問題,而C4.5算法和CART算法 都是從 ID3算法 演變而來的,而且ID3算法 和 C4.5算法 是同一個人提出的; 那ID3算法是什么? ID3是貪心算法,用來構造決策樹的,ID3算法的核心思想是以信息增益最大的屬性來進行分類的; 這里有提到一個概念,信息增益: 它是ID3算法中用于進行屬性選擇度量,一般是擁有最高信息增益的的屬性來作為節點N的分裂屬性;

圖二

其中Info(D) 叫 總數的信息熵

InfoA(D)表示 具體A這個屬性的信息熵

Gain(A) 表示 A這種劃分的信息增益

A這種的信息信息增益的結果等于 總數的信息熵Info(D) 減去具體某項的信息熵InfoA(D) ;

這是算出A的劃分的的增益 ,同理,其他的增益 也是這樣算出了,增益越多,就優先選擇作為分類的標準;

ID3算法的缺點: 這種ID3算法的信息增益有個缺點,就是它會偏向具有大量值得屬性,因為作為分母的D 越大 越多,整體的值就越小, 總數減去越大的小的值,信息增益就越大,這樣就存在問題,假如我一個分類的屬性 我分的越細,它的D就會越大, 但是只是根據分類的越細 來獲取大的增益,這種是沒有實際意義的;

基于ID3算法的缺點,后面出現C4.5算法和CART算法 C4.5算法:

C4.5算法核心采用信息增益率

圖三

C4.5 采取得是分裂信息的量,當因子數比較多 ,數值比較大,在使用信息增益除以這個大的數,使得到小的數,這樣就可以抵消掉傾向于ID3的缺點。

總結

以上是生活随笔為你收集整理的java决策树_【Java】决策树介绍和使用的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。