日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习实战 - 读书笔记(04) - 朴素贝叶斯

發布時間:2024/6/21 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 机器学习实战 - 读书笔记(04) - 朴素贝叶斯 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

核心公式 - 貝葉斯準則

\[p(c|x) = \frac{p(x|c)p(c)}{p(x)}\]

  • p(c|x) 是在x發生的情況下,c發生的概率。
  • p(x|c) 是在c發生的情況下,x發生的概率。
  • p(c) 是c發生的概率。
  • p(x) 是x發生的概率。

規則

如果P(c?|x) > P(c?|x),那么屬于類別c?。
如果P(c?|x) < P(c?|x),那么屬于類別c?。

等價變化

\[p(c1|x) = \frac{p(x|c1)p(c1)}{p(x)}\]
\[p(c2|x) = \frac{p(x|c2)p(c2)}{p(x)}\]
Therefore, comparing p(c1|x) and p(c2|x)
are same as comparing
\(\frac{p(x|c1)p(c1)}{p(x)}\) and \(\frac{p(x|c2)p(c2)}{p(x)}\)
same as comparing
\(p(x|c1)p(c1)\) and \(p(x|c2)p(c2)\)

多個獨立特征的變化

p(x|c1)中,x是多個獨立特征,即\(x=x_0,x_1...x_n\),
則: \(p(x|c1)=p(x_0,x_1...x_n|c1)\)
\(p(x|c1)=p(x_0|c1)p(x_1|c1)...p(x_n|c1)\)

下溢出問題

為了解決下溢出問題,這是由于太多很小的數相乘造成的,所以程序會下溢出或者得到不正確的答案。
在代數中有ln(a*b) = ln(a)+ln(b),于是通過求對數可以避免下溢出或者浮點數舍入導致的錯誤。同時,采用自然對數進行處理不會有任何損失。
Therefore, comparing p(c1|x) and p(c2|x)
same as comparing
\(log(p(x_0|c1)) + log(p(x_1|c1)) + ... + log(p(x_n|c1) + log(p(c1))\) and
\(log(p(x_0|c2)) + log(p(x_1|c2)) + ... + log(p(x_n|c2) + log(p(c2))\)

實際應用

  • 過濾侮辱性留言
  • 過濾垃圾郵件

轉載于:https://www.cnblogs.com/steven-yang/p/5592582.html

總結

以上是生活随笔為你收集整理的机器学习实战 - 读书笔记(04) - 朴素贝叶斯的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。