日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

【Python-ML】电影评论数据集文本挖掘 -在线学习

發布時間:2025/4/16 python 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【Python-ML】电影评论数据集文本挖掘 -在线学习 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
# -*- coding: utf-8 -*- ''' Created on 2018年1月22日 @author: Jason.F @summary: 文本挖掘,對電影評論進行內容抽取、特征向量化并訓練模型預測,在線學習并持久化模型 電影評論數據:http://ai.stanford.edu/~amaas/data/sentiment/ ''' import pyprind import pandas as pd import os import numpy as np import re import time import pickle from nltk.corpus import stopwords from sklearn.feature_extraction.text import HashingVectorizer from sklearn.linear_model import SGDClassifierstart = time.clock()homedir = os.getcwd()#獲取當前文件的路徑 #導入數據并輸出到moive_data.csv ''' pbar=pyprind.ProgBar(50000) labels={'pos':1,'neg':0}#正面和負面評論標簽 df = pd.DataFrame() for s in ('test','train'):for l in ('pos','neg'):path=homedir+'/aclImdb/%s/%s' %(s,l)for file in os.listdir(path):with open(os.path.join(path,file),'r') as infile:txt =infile.read()df =df.append([[txt,labels[l]]],ignore_index=True)pbar.update() df.columns=['review','sentiment'] np.random.seed(0) df=df.reindex(np.random.permutation(df.index))#重排數據集,打散正負樣本數據 df.to_csv(homedir+'/movie_data.csv',index=False) ''' #文本向量化,并訓練模型和更新 df=pd.read_csv(homedir+'/movie_data.csv') stop = stopwords.words('english')#獲得英文停用詞集 def tokenizer(text):text=re.sub('<[^>]*>','',text)#移除HTML標記,#把<>里面的東西刪掉包括內容emotions=re.findall('(?::|;|=)(?:-)?(?:\)|\(|D|P)',text)text=re.sub('[\W]+',' ',text.lower())+' '.join(emotions).replace('-','')tokenized = [w for w in text.split() if w not in stop]return tokenized def stream_docs(path):with open(path,'r') as csv:next(csv) #skip headerfor line in csv:text,label = line[:-3] ,int(line[-2])yield text,label def get_minibatch(doc_stream,size):docs,y =[],[]try:for _ in range(size):text,label =next(doc_stream)docs.append(text)y.append(label)except StopIteration:return None,Nonereturn docs,y vect=HashingVectorizer(decode_error='ignore',n_features=2**21,preprocessor=None,tokenizer=tokenizer) clf = SGDClassifier (loss='log',random_state=1,n_iter=1)#隨機梯度下降,每次用一個樣本更新權重 doc_stream = stream_docs(path=homedir+'/movie_data.csv') pbar = pyprind.ProgBar(45) classes=np.array([0,1]) for _ in range(45):X_train,y_train = get_minibatch(doc_stream, size=1000)if not X_train:breakX_train = vect.transform(X_train)clf.partial_fit(X_train, y_train, classes=classes)#部分訓練pbar.update() #測試 X_test,y_test=get_minibatch(doc_stream, size=5000) X_test=vect.transform(X_test) print ('Accuracy:%.3f' %clf.score(X_test,y_test)) clf=clf.partial_fit(X_test,y_test)#更新模型 #持久化模型 dest=os.path.join('pkl_objects') if not os.path.exists(dest):os.makedirs(dest) pickle.dump(stop,open(os.path.join(dest,'stopwords.pkl'),'wb'),protocol=2)#保存停用詞 pickle.dump(clf,open(os.path.join(dest,'classifier.pkl'),'wb'),protocol=2)#保存模型 #導入模型預測 clf =pickle.load(open(os.path.join('pkl_objects','classifier.pkl'),'rb')) label ={0:'negative',1:'positive'} example=['I love this movie'] X=vect.transform(example) print ('Prediction:%s \nProbability:%.2f%%'%(label[clf.predict(X)[0]],np.max(clf.predict_proba(X))*100))end = time.clock() print('finish all in %s' % str(end - start))

結果:

Warning: No valid output stream. Accuracy:0.867 Prediction:positive Probability:82.53% finish all in 50.6331459967

總結

以上是生活随笔為你收集整理的【Python-ML】电影评论数据集文本挖掘 -在线学习的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 射黄视频 | 久久久久亚洲AV成人 | 日本羞羞网站 | 成人av资源| 欧美99热 | 在线亚洲网站 | 中国女人做爰视频 | 国产日韩欧美亚洲 | 久草免费在线观看视频 | 精品一区二区三区在线观看 | 日韩第八页 | 国产美女福利视频 | 欧美三级一级 | 国产网站黄色 | 三上悠亚痴汉电车 | 免费看国产黄色片 | 逼逼爱插插网站 | 久久久精品视频免费 | 成人午夜一区二区 | 国产一区二区三区自拍 | 亚洲乱码国产乱码精品精98午夜 | 天堂网一区 | 性欧美18—19sex性高清 | 中文字幕一区日韩 | 国产在线观看xxx | 青青伊人久久 | 亚洲夜夜爱 | 波多野结衣亚洲一区 | 国产在线精品成人欧美 | 精品欧美乱码久久久久久 | 一级免费毛片 | 97国产成人无码精品久久久 | 毛片哪里看 | 欧美电影一区二区三区 | 欧美一线高本道 | 国产chinese男男网站大全 | 久久你懂的 | 久久婷婷婷| 乱lun合集小可的奶水 | 欧美大片一区二区 | 九九热在线观看 | 每日av更新 | 麻豆福利在线观看 | 亚洲精品白虎 | 日韩国产精品一区二区三区 | 免费看成人av | 欧美三区在线观看 | 久操精品 | 久久久av一区二区三区 | 亚洲国产v| 麻豆观看| 少妇饥渴放荡91麻豆 | 一区二区三区精品免费视频 | 国产乱真实合集 | 免费播放片大片 | 最近国语视频在线观看免费播放 | 草草影院av | 免费在线播放视频 | 韩日视频在线观看 | 人人草人人看 | 黄色视屏在线播放 | 国产成人在线视频免费观看 | 午夜看片福利 | 午夜一区二区三区在线观看 | 日韩av在线免费 | 日韩av少妇 | 国产无遮挡又黄又爽免费网站 | 免费黄色短片 | 绯色av一区二区 | 男同互操gay射视频在线看 | 欧美一级片在线看 | 九七久久 | 亚洲综合久久av一区二区三区 | 欧美v日韩 | 久久美女免费视频 | 三上悠亚 在线观看 | 国产精品福利一区二区三区 | 99色网| 天天爱综合 | 一本到免费视频 | а 天堂 在线 | 天堂va蜜桃一区二区三区 | 国产一区黄色 | 片黄在线观看 | 精品第一页 | 久青草资源福利视频 | 黄色av毛片 | 综合在线亚洲 | wwwxxx日韩| 亚洲片国产一区一级在线观看 | 久久久人妻无码一区二区 | 久久r视频 | 一区二区三区欧美精品 | 亚洲天堂黄色 | 狼干综合 | 无码播放一区二区三区 | 男女激情网址 | 色爱亚洲 | 超碰在线影院 |