日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

统计学习笔记(4)——朴素贝叶斯法

發布時間:2025/3/21 编程问答 18 豆豆
生活随笔 收集整理的這篇文章主要介紹了 统计学习笔记(4)——朴素贝叶斯法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?樸素貝葉斯法是基于貝葉斯定理與特征條件獨立假設的分類方法。簡單來說,樸素貝葉斯分類器假設樣本每個特征與其他特征都不相關。舉個例子,如果一種水果具有紅,圓,直徑大概4英寸等特征,該水果可以被判定為是蘋果。盡管這些特征相互依賴或者有些特征由其他特征決定,然而樸素貝葉斯分類器認為這些屬性在判定該水果是否為蘋果的概率分布上獨立的。盡管是帶著這些樸素思想和過于簡單化的假設,但樸素貝葉斯分類器在很多復雜的現實情形中仍能夠取得相當好的效果。樸素貝葉斯分類器的一個優勢在于只需要根據少量的訓練數據估計出必要的參數(離散型變量是先驗概率和類條件概率,連續型變量是變量的均值和方差)。

1.貝葉斯分類模型

? ? ? ? 貝葉斯分類模型如下:


? ? ? ?其中,X表示屬性集,Y表示類變量,P(Y)為先驗概率,P(X|Y)為類條件概率,P(X)為證據,P(Y|X)為后驗概率。貝葉斯分類模型就是用先驗概率P(Y)、類條件概率P(X|Y)和證據P(X)來表示后驗概率。在比較Y的后驗概率時,分母中的證據P(X)總是常數,因此可以忽略不計。先驗概率P(Y)可以通過計算訓練集中屬于每個類的訓練記錄所占的比例很容易估計。對類條件概率P(X|Y)的估計,不同的實現決定不同的貝葉斯分類方法,常見的有樸素貝葉斯分類法和貝葉斯信念網絡。

2.樸素貝葉斯分類模型



3.實例

? ? ? ? 數據集如下:


? ? ? ? ?從該數據集計算得到的先驗概率以及每個離散屬性的類條件概率、連續屬性的類條件概率分布的參數(樣本均值和方差)如下:

先驗概率:P(Yes)=0.3;P(No)=0.7

P(有房=是|No) = 3/7

P(有房=否|No) = 4/7

P(有房=是|Yes) = 0

P(有房=否|Yes) = 1

P(婚姻狀況=單身|No) = 2/7

P(婚姻狀況=離婚|No) = 1/7

P(婚姻狀況=已婚|No) = 4/7

P(婚姻狀況=單身|Yes) = 2/3

P(婚姻狀況=離婚|Yes) = 1/3

P(婚姻狀況=已婚|Yes) = 0

年收入:

如果類=No:樣本均值=110; 樣本方差=2975

如果類=Yes:樣本均值=90; 樣本方差=25

——》待預測記錄:X={有房=否,婚姻狀況=已婚,年收入=120K}

P(No)*P(有房=否|No)*P(婚姻狀況=已婚|No)*P(年收入=120K|No)=0.7*4/7*4/7*0.0072=0.0024

P(Yes)*P(有房=否|Yes)*P(婚姻狀況=已婚|Yes)*P(年收入=120K|Yes)=0.3*1*0*1.2*10-9=0

由于0.0024大于0,所以該記錄分類為No。

從上面的例子可以看出,如果有一個屬性的類條件概率等于0,則整個類的后驗概率就等于0。僅僅使用記錄比例來估計類條件概率的方法顯得太脆弱了,尤其是當訓練樣例很少而屬性數目又很多時。解決該問題的方法是使用m估計方法來估計條件概率:




總結

以上是生活随笔為你收集整理的统计学习笔记(4)——朴素贝叶斯法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。