基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_机器学习之朴素贝叶斯
1.貝葉斯原理
樸素貝葉斯分類(Naive Bayesian,NB)源于貝葉斯理論,是一類基于概率的分類器,其基本思想:假設(shè)樣本屬性之間相互獨(dú)立,對(duì)于給定的待分類項(xiàng),求解在此項(xiàng)出現(xiàn)的情況下其他各個(gè)類別出現(xiàn)的概率。
樸素貝葉斯分類實(shí)現(xiàn)的三階段:
第一階段,準(zhǔn)備工作。
根據(jù)具體情況確定特征屬性,并對(duì)每一特征屬性進(jìn)行劃分,然后人工對(duì)一些待分類項(xiàng)進(jìn)行分類,形成訓(xùn)練樣本集合。
這一階段的輸入是所有待分類數(shù)據(jù),輸出是特征屬性和訓(xùn)練樣本。唯一需要人工處理的階段,質(zhì)量要求較高。
第二階段,分類器訓(xùn)練階段(生成分類器)。
計(jì)算每個(gè)類別在訓(xùn)練樣本中出現(xiàn)頻率及每個(gè)特征屬性劃分對(duì)每個(gè)類別的條件概率估計(jì),并將結(jié)果記錄。
其輸入是特征屬性和訓(xùn)練樣本,輸出是分類器。
第三階段,應(yīng)用階段。
使用分類器對(duì)待分類項(xiàng)進(jìn)行分類,其輸入是分類器和待分類項(xiàng),輸出是待分類項(xiàng)與類別的映射關(guān)系。
2.R語(yǔ)言貝葉斯網(wǎng)絡(luò)實(shí)現(xiàn)
- caret中train函數(shù)
- e1071包中的naiveBayes函數(shù)
- klaR包中的NavieBayes函數(shù)
2.1數(shù)據(jù)準(zhǔn)備
我們將在Rstudio中使用這三種樸素貝葉斯函數(shù)對(duì)威斯康星州乳腺癌數(shù)據(jù)集進(jìn)行分類。
#設(shè)置路徑
setwd("F:360MoveData甥敳獲Administrator.PC-201704251340Desktop機(jī)器學(xué)習(xí)課程決策樹")#讀入數(shù)據(jù)
breast#設(shè)置class為分類變量
df總結(jié)
以上是生活随笔為你收集整理的基于朴素贝叶斯分类器的西瓜数据集 2.0 预测分类_机器学习之朴素贝叶斯的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 两个list关联合并_算法分享---两个
- 下一篇: python数字转对应中文_python