C4.5中对于离散和连续特征的判定
生活随笔
收集整理的這篇文章主要介紹了
C4.5中对于离散和连续特征的判定
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
根據(jù)C4.5的文件build.c
MultiVal = true;if ( ! SUBSET ) /* 默認(rèn)SUBSET=False */{for ( a = 0 ; MultiVal && a <= MaxAtt ; a++ ){if ( SpecialStatus[a] != IGNORE ){MultiVal = MaxAttVal[a] >= 0.3 * (MaxItem + 1);}/* 這個(gè)for循環(huán)一旦碰到某個(gè)特征的取值數(shù)量 MaxAttVal[a]大于數(shù)據(jù)條數(shù)(MaxItem + 1)的30%,就會(huì)退出循環(huán), */}}如果離散特征的取值種數(shù)大于數(shù)據(jù)集長(zhǎng)度的30%,那么就會(huì)被算法認(rèn)為是連續(xù)特征。
總結(jié)
以上是生活随笔為你收集整理的C4.5中对于离散和连续特征的判定的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: sql对查询的一列结果进行去重
- 下一篇: pandas中的DataFrame转化为