日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

An Algorithm Summary of Programming Collective Intelligence (1)

發(fā)布時(shí)間:2023/12/1 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 An Algorithm Summary of Programming Collective Intelligence (1) 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

就按照最后一章的順序來說吧。很多名字都不知道中文該怎么說,就直接用英文名稱了。

Naive Bayesian Classifier 樸素貝葉斯分類器
nb算法是通過學(xué)習(xí)樣本中已經(jīng)分類的條目,計(jì)算生成條目中的特性相對(duì)于類別的概率矩陣,然后根據(jù)待分類條目中特性在這個(gè)矩陣中的值來反向計(jì)算條目的類別概率。

P(Category|Item)=P(Item|Category)*P(Category)/P(Item)

在靜態(tài)樣本中,P(Item)是固定的,所以可以去掉簡化計(jì)算。但是如果樣本集是動(dòng)態(tài)的,就需要考慮進(jìn)來。

P(Item|Category)=P(Feature1|Category)*P(Feature2|Category)*...

優(yōu)點(diǎn):
速度快
增量訓(xùn)練時(shí)可以不使用舊樣本
容易理解
分類效果往往比想象的好
缺點(diǎn):
對(duì)于內(nèi)容龐雜的大分類來說效果不太好,特別是出現(xiàn)比較中性的特性組合時(shí)更是如此。

Decision Tree Classifier 決策樹
dt算法進(jìn)行分類計(jì)算是很簡單直觀的,它的技巧在于決策樹的構(gòu)造過程。樣本是已知的條件結(jié)果數(shù)據(jù)矩陣,需要決定的是用來分類的條件順序。為了得到這個(gè)順序,就要針對(duì)每個(gè)條件計(jì)算單純應(yīng)用這個(gè)條件分類后結(jié)果的混合度,也就是看用哪個(gè)條件來分可以分得更清楚一些。確定了最好的分類條件,就把數(shù)據(jù)分開成若干子集,對(duì)每個(gè)子集再計(jì)算最佳分類條件,以此類推,直到子集只包含一個(gè)結(jié)果或者達(dá)到某些終止條件。

dt算法有兩個(gè)有意思的地方。一是如何計(jì)算應(yīng)用某個(gè)條件得到的分類結(jié)果的混合度。書里面給了一個(gè)簡單的計(jì)數(shù)算法和一個(gè)熵算法(好親切啊)。

p(i)=frequency(outcome)=count(outcome)/count(total rows)
Entropy=sum of p(i)*log(p(i) for all outcomes

進(jìn)一步計(jì)算information gain:
weight1 = size of subset1 / size of original set
weight2 = size of subset2 / size of original set
gain = entropy(original) – weight1*entropy(set1) – weight2*entropy(set2)

另外一個(gè)有意思的地方是對(duì)不同類型的條件數(shù)據(jù)如何選擇分類點(diǎn)。對(duì)于是否問題這個(gè)比較容易解決,但是對(duì)于數(shù)值或者字符串或者更復(fù)雜的類型就要特殊情況特殊處理了。

優(yōu)點(diǎn):
結(jié)果簡潔直觀
可以處理不同的條件數(shù)據(jù)類型
缺點(diǎn):
不能通過增量訓(xùn)練來改進(jìn),生成決策樹必須使用整個(gè)已知樣本集。
大數(shù)據(jù)集可能存在的眾多條件會(huì)產(chǎn)生巨大繁雜的決策樹,分類計(jì)算會(huì)變得緩慢。

轉(zhuǎn)載于:https://www.cnblogs.com/ysjxw/archive/2008/04/11/1148887.html

總結(jié)

以上是生活随笔為你收集整理的An Algorithm Summary of Programming Collective Intelligence (1)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。