日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

如何理解naive Bayes

發布時間:2025/3/21 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 如何理解naive Bayes 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

原理:

已知有兩個類class0,class1,已知文檔docx,現在需要判斷該文檔屬于哪一個類。

將其轉化為概率問題

即求P(class0|docx)和P(class1|docx)這兩個值,然后比大小

由bayes公式,P(class0|docx)P(docx) = P(docx|class0)*P(class0)。同理class1

P(class0|docx):docx屬于class0的概率

P(docx):產生出docx的概率

P(class0):表示class0的先驗概率,例如分類體育類,財經類,任意拿了1萬個語料,體育類8000個,財經類2000個,那么體育類先驗的就是80%。

P(docx|class0):表示class0生成出docx的概率

由于比大小P(docx)是完全一致的,因此略去

則計算的是P(docx|class0)*P(class0),其中P(class0)可以從語料中觀測到。

現在就歸結到計算P(docx|class0)

在詞袋模型的假設下,docx可以由獨立同分布的詞向量構成,即docx={term1,term2,term3...termn}。

即P(docx|class0) = P( {x1,x2,x3,..xn} |class0),其中x1表示term1出現的次數,第一維表示term1

由獨立假設

?P( {x1,x2,x3,..xn} |class0)=P({x1,0,0,...0}|class0)*P({0,x2,0,0,...}|class0)

?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? =(y1^x1)*(y2^x2)... ? ?y1表示term1在class0的概率。即class0的全部文檔看作是1個文檔,計算term1的出現概率。

兩邊取對數

?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?=x1log(y1)+x2log(y2)....

如果對整個P(docx|class0)*P(class0)取對數,在求負數,相當用用f(x) = -log(x)作用一下x,則有

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? -log(P(docx|class0)*P(class0)) = -log(P(class0)) + - x1log(y1)+ -x2log(y2).... ?其中x1表示在docx中term1出現的次數

至此我們可以將公式看作一個docx對class0提供的信息量的累加,在什么信息都沒有的情況下,是class0的信息量是 -log(P(class0),在term1出現了x1次以后,信息量增加了-x1log(y1),依次往復,相當于docx用class0這個model能壓縮的最小物理空間XXbit。也就是說,借助class0的分布,只用XXbit就可以表示docx。從壓縮上想不難理解,class0提供了一個特征的概率分布特點,用香濃公式來對每個特征按照概率編碼。

?? ? ? ? ? ?

?舉個計算過程的例子

1)訓練語料如下

?? ? ? ?term1 ? term2 ?term3 ?term4 ? class

doc1 ? ?0 ? ? ? 1 ? ? ? ? ? 1 ? ? ? ? ? 1 ? ? ? ? 1 ??
doc2 ? ?1 ? ? ? 1 ? ? ? ? ? 0 ? ? ? ? ? 0 ? ? ? ? 0?
doc3 ? ?2 ? ? ? 3 ? ? ? ? ? 1 ? ? ? ? ? 0 ? ? ? ? 0 ? ?
doc4 ? ?2 ? ? ? 2 ? ? ? ? ? 0 ? ? ? ? ? 1 ? ? ? ? 0 ??
doc5 ? ?1 ? ? ? 0 ? ? ? ? ? 2 ? ? ? ? ? 3 ? ? ? ? 1
2)計算model parameter

w0(1) = log(2/5) ? w0(0) = log(3/5) ? ? ?[在5個樣本中,label 1有2個,lable 0有3個]

w1(1) = log(1/9) ? w1(0) = log(5/13) ? ?[term1 在label為0的標簽的3個樣本中,出現了5次,label為0的標簽的3個樣本中共計各種term出現了13次]

w2(1) = log(1/9) ? w2(0) = log(6/13) ? ?

w3(1) = log(3/9) ? w3(0) = log(1/13)

w4(1) = log(4/9) ? w4(0) = log(1/13)


3)given test sample

docx (1,3,2,0,1) ?{1表示我是一個文檔,3表示term1出現了3次,2表示term2出現了2次...}

4)計算屬于哪個類

p(1|docx) = -(1*log(2/5)+3*log(1/9)+2*log(1/9)+0*log(3/9)+1*log(4/9)) = ?6.4755775834193

p(0|docx) = -(1*log(3/5)+3*log(5/13)+2*log(6/13)+0*log(1/13)+1*log(1/13) )= ?3.6672696976529

so docx is class 0,用class0的分布表示docx,只需要3.66比特,docx和class0更具有分布上的一致性。


5)理解

w0(0),w1(0)表示docx一個term都不含的時候,直接用類上的比例來推測可能得分類。比如某個docx為空文檔。

wi(0)的物理含義 ?tf向量,表示class0生成termi的能力。
wi(1)的物理含義 ?tf向量,表示class1生成termi的能力。
w(0)可以看作是一個指向label為0的samples的向量。
w(1)可以看做是一個指向label為1的samples的向量。
docx*w(0) > docx*w(1) 表示docx的類為0
docx*w(1) > docx*w(0) 表示docx的類是1

docx*w(0) = docx*w(0) 表示docx恰好距離類0和類1相同。也可理解為夾角相同,如果同除以docx和w的模就可以理解為夾角。

6)最后訓練出的model是什么?

就是訓練語料每個term出現多少次,而總次數可以將這些數字加和得到,不需存儲。

因此

class 0的model就是

?? ?term1 5

?? ?term2 6

?? ?term3 1

?? ?term4 1

在加上每個class的數目。

完畢,就是一個數數過程。


from:?http://blog.csdn.net/pennyliang/article/details/6651897

總結

以上是生活随笔為你收集整理的如何理解naive Bayes的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 久久人妻少妇嫩草av无码专区 | 中文字幕一区二区久久人妻 | 老熟妇毛茸茸 | 国产一区二区三区精品在线观看 | 超碰av人人 | 91免费网站入口 | 麻豆视频在线观看免费网站 | 天天亚洲| 国产成人精品片 | 免费污视频在线观看 | 国产精品久久久久高潮 | 尤物在线观看视频 | 天天摸天天操 | 欧美日韩免费观看一区=区三区 | 久久久久久99精品久久久 | 人碰人人| 亚洲精品视频国产 | 一区二区日本 | 国产精品一区二区三区免费观看 | 午夜日韩精品 | 性色av一区 | 午夜视频在线观看视频 | 午夜精品国产精品大乳美女 | 91精品婷婷国产综合久久竹菊 | 在线成人欧美 | 在线观看黄色片 | 国产一级在线视频 | 免费无码毛片一区二三区 | 成人手机在线播放 | 少妇高潮一区二区三区 | 国产色视频在线 | 一区精品在线观看 | 欧美精品在线观看 | 国产精品区在线 | 成人动漫一区二区三区 | 超碰网站在线观看 | 无码人妻精品一区二区 | 九色在线| 高清国产在线观看 | 成人欧美一区二区三区黑人冫 | 精品一区二区在线观看 | 性感少妇在线观看 | 乱色专区 | 亚洲精品无码久久久 | 都市豪门艳霸淫美妇 | 欧美成人精品激情在线视频 | 玉蒲团在线 | 操伊人 | 日韩少妇高潮抽搐 | 中国美女洗澡免费看网站 | 亚洲社区在线观看 | 亚洲av色香蕉一区二区三区 | wwwxxx日本人 | 一区二区三区四区在线观看视频 | 久久资源365 | av夜色| 超爽视频| 在线免费不卡视频 | 国产精品99 | av不卡一区二区 | 日本少妇b| 一区二区视频免费看 | 另类小说五月天 | 亚洲性猛交富婆 | 国产精品久久久久久久久久久新郎 | 成人在线视频免费看 | 亚洲天堂网站 | av在线影音| 精品香蕉一区二区三区 | 高h av | 久久久久久亚洲中文字幕无码 | 国产18在线观看 | 综合性色| 午夜免费一区二区 | 亚洲女人的天堂 | 在线免费观看网站入口在哪 | 亚洲精品网站在线观看 | 99久久精品无免国产免费 | 欧美一级不卡 | 中文字幕一区二区三区人妻 | 免费在线不卡视频 | 999午夜 | 黄色免费毛片 | 91精品婷婷国产综合久久竹菊 | 国产床上视频 | 午夜写真片福利电影网 | 一级特黄aaa大片 | 超碰99热| 日韩av在线直播 | 国产精品久久在线 | 日韩精品在线视频 | 污夜影院| 久久久久久国产免费a片 | 在线视频观看一区二区 | 中文字幕欧美在线观看 | 喷水视频在线观看 | 亚洲涩情| www.黄色免费 | 国产不卡av在线播放 |