當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Educoder 机器学习第1关：基于贝叶斯决策理论的分类方法

發(fā)布時(shí)間：2023/12/8 编程问答 34 豆豆

生活随笔收集整理的這篇文章主要介紹了 Educoder 机器学习第1关：基于贝叶斯决策理论的分类方法小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

第1關(guān)：基于貝葉斯決策理論的分類方法

任務(wù)描述

本關(guān)任務(wù)：理解樸素貝葉斯的分類思想，完成編程習(xí)題。

編程要求

根據(jù)提示，在右側(cè)編輯器補(bǔ)充代碼，運(yùn)行程序。

測試說明

根據(jù)所學(xué)完成右側(cè)編程題。

開始你的任務(wù)吧，祝你成功！

import numpy as np''' Parameters:無 Returns:postingList - 實(shí)驗(yàn)樣本切分的詞條classVec - 類別標(biāo)簽向量 ''' # 函數(shù)說明:創(chuàng)建實(shí)驗(yàn)樣本 def loadDataSet():postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], #切分的詞條['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'],['my', 'dalmation', 'is', 'so', 'cute', 'I', 'love', 'him'],['stop', 'posting', 'stupid', 'worthless', 'garbage'],['mr', 'licks', 'ate', 'my', 'steak', 'how', 'to', 'stop', 'him'],['quit', 'buying', 'worthless', 'dog', 'food', 'stupid']]classVec = [0,1,0,1,0,1]#類別標(biāo)簽向量，1代表侮辱性詞匯，0代表不是return postingList,classVec''' Parameters:vocabList - createVocabList返回的列表inputSet - 切分的詞條列表 Returns:returnVec - 文檔向量,詞集模型 ''' # 函數(shù)說明:根據(jù)vocabList詞匯表，將inputSet向量化，向量的每個(gè)元素為1或0 def setOfWords2Vec(vocabList, inputSet):returnVec = [0] * len(vocabList) #創(chuàng)建一個(gè)其中所含元素都為0的向量for word in inputSet: #遍歷每個(gè)詞條if word in vocabList: #如果詞條存在于詞匯表中，則置1returnVec[vocabList.index(word)] = 1else: print("the word: %s is not in my Vocabulary!" % word)return returnVec #返回文檔向量''' Parameters:dataSet - 整理的樣本數(shù)據(jù)集 Returns:vocabSet - 返回不重復(fù)的詞條列表，也就是詞匯表 ''' # 函數(shù)說明:將切分的實(shí)驗(yàn)樣本詞條整理成不重復(fù)的詞條列表，也就是詞匯表 def createVocabList(dataSet):vocabSet = set([]) #創(chuàng)建一個(gè)空的不重復(fù)列表for document in dataSet:vocabSet = vocabSet | set(document) #取并集return list(vocabSet)''' Parameters:trainMatrix - 訓(xùn)練文檔矩陣，即setOfWords2Vec返回的returnVec構(gòu)成的矩陣trainCategory - 訓(xùn)練類別標(biāo)簽向量，即loadDataSet返回的classVec Returns:p0Vect - 侮辱類的條件概率數(shù)組p1Vect - 非侮辱類的條件概率數(shù)組pAbusive - 文檔屬于侮辱類的概率 ''' # 函數(shù)說明:樸素貝葉斯分類器訓(xùn)練函數(shù) def trainNB0(trainMatrix,trainCategory):numTrainDocs = len(trainMatrix) #計(jì)算訓(xùn)練的文檔數(shù)目numWords = len(trainMatrix[0]) #計(jì)算每篇文檔的詞條數(shù)pAbusive = sum(trainCategory)/float(numTrainDocs) #文檔屬于侮辱類的概率p0Num = np.ones(numWords); p1Num = np.ones(numWords)#創(chuàng)建numpy.ones數(shù)組,詞條出現(xiàn)數(shù)初始化為1，拉普拉斯平滑p0Denom = 2.0; p1Denom = 2.0 #分母初始化為2,拉普拉斯平滑for i in range(numTrainDocs):##########if trainCategory[i]==1:p1Num+=trainMatrix[i]p1Denom+=sum(trainMatrix[i])else:p0Num+=trainMatrix[i]p0Denom+=sum(trainMatrix[i])##########p1Vect = np.log(p1Num/p1Denom) #取對數(shù)，防止下溢出p0Vect = np.log(p0Num/p0Denom)#返回屬于侮辱類的條件概率數(shù)組，屬于非侮辱類的條件概率數(shù)組，文檔屬于侮辱類的概率return p0Vect,p1Vect,pAbusiveif __name__ == '__main__':postingList, classVec = loadDataSet()myVocabList = createVocabList(postingList)print('myVocabList:\n', myVocabList)trainMat = []#for循環(huán)使用詞向量來填充trainMat列表for postinDoc in postingList:trainMat.append(setOfWords2Vec(myVocabList, postinDoc))p0V, p1V, pAb = trainNB0(trainMat, classVec)print('p0V:\n', p0V)print('p1V:\n', p1V)print('classVec:\n', classVec)print('pAb:\n', pAb)

總結(jié)

以上是生活随笔為你收集整理的Educoder 机器学习第1关：基于贝叶斯决策理论的分类方法的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：基于spring cloud 免费搭建开
下一篇：决策理论与方法