日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

第十届中国大学生服务外包创新创业大赛

發布時間:2024/3/24 51 豆豆
生活随笔 收集整理的這篇文章主要介紹了 第十届中国大学生服务外包创新创业大赛 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

基于TextCNN的電商產品短文本分類

分類一直是數據科學界研究的重點問題,它被廣泛地應用到生活的各個方面。伴隨著電商行業的快速發展。商品的數量越來越多,需要對商品制定分類,便于找尋自己所需的商品。針對現在每天都會產生的大量商品名稱,如果人工去為商品分類,不僅工作量巨大,速度慢,而且也會出現分類錯誤的情況。因此本項目旨在尋找一種分類方法,能夠實現商品的快速準確的分類,降低人工成本以及出錯率。

Github項目完整內容鏈接:https://github.com/Cynicicm/Service-outsourcing
項目宣傳視頻鏈接:https://pan.baidu.com/s/1jFQ3mY7QW1waBWzvP2JOQg?提取碼:n0fp

項目創意

本項目采用基于CNN的文本分類模型實現自動分類。文本分類模型大體上分為基于傳統機器學習和基于深度學習的文本分類模型,后者與前者最主要的區別是隨著數據規模的增加其性能也不斷增長。本項目的數據集在萬級以上,因此基于深度學習的文本分類模型能夠更加完美地解釋它。

隨著現在大數據時代的到來,基于深度學習模型的文本分類模型已經成為了主流,其中CNN模型在文本分類任務中是兼具效率與質量的理想模型。因此基于CNN的文本分類模型具有良好的商業價值和社會應用價值。

項目特色

  • 采用針對大量數據集的深度學習框架從而可以自動地從已構建的數據集上歸納出一套分類規則;
  • 采用結巴中文分詞技術能夠將句子最精確地切開,適合文本分析;
  • 采用One-Hot技術使文本數值化能夠有效降低異常值對模型的影響,增強模型穩定性;
  • 采用目前業界普遍認為準確度最高的模型TextCNN進行文本分類,兼具效率與質量;
  • 采用MVC架構實現用戶與系統之間的交互,支持多種查詢數據的方式,可視化效果好。

數據集

數據集請自行下載:?https://pan.baidu.com/s/1Fw9Zb9gV3Y6GaloOSne6hQ?提取碼: r1p0

訓練結果模型地址:https://pan.baidu.com/s/1hZSDZmBfbA04E_NKfm0taA?提取碼:wznj

通過比對模型的訓練的結果,最終采取訓練集:驗證集為?19:1?.

數據集劃分如下:

  • 訓練集: 475,000
  • 驗證集: 25,000
  • 測試集: 4,500,000

環境

  • python 3
  • jieba(中文分詞) 0.39
  • pandas 0.24.1
  • numpy 1.16.2
  • tensorflow 1.13.1

數據預處理

我們希望能夠得知商品信息,自動對其進行分類,比如針對“騰訊QQ幣148元148QQ幣148個直充148Q幣148個Q幣148個QQB★自動充值”這樣一個商品信息,預期得到“本地生活--游戲充值--QQ充值”,那么首先第一步就是要對原始數據進行預處理,在本項目中主要處理以下問題:

  • 除去非文本部分

  • 處理中文編碼

  • 處理某些行堆積幾百條數據

  • 結巴中文分詞處理

  • one-hot表示數據與標簽

CNN文本分類模型

CNN的大致結構:

CNN配置參數

CNN可配置的參數如下所示,在train_cnn.py中。

class TCNNConfig(object):"""CNN配置參數"""# 模型參數embedding_dim = 128 # 詞向量維度seq_length = 40 # 序列長度num_classes = 1199 # 類別數num_filters = 128 # 卷積核數目filter_sizes = 3,4,5 # 卷積核尺寸vocab_size = 160000 # 詞匯表大小fc_hidden_size = 1024 # 全連接層神經元dropout_keep_prob = 0.5 # 防止過擬合dropout # 保留比例learning_rate = 0.001 # 學習率batch_size = 256 # 每批訓練大小num_epochs = 40 # 總迭代輪次evaluate_every = 800 # 每多少步進行一次驗證

參數變化過程

參數第一次第二次第三次第四次
num_epochs353510040
batch_size64512256256
Learn_rate0.0010.010.0010.001
訓練集驗證集比例19:119:14:119:1
最終結果第一次第二次第三次第四次
Recall0.6286370.8245050.8437640.857021
accuracy0.6244190.8234460.839160.857925
F0.6258250.8237990.8406950.853659

根據上表,在這里我們展示第四次效果最佳情況下的一些結果變化過程. 再此之前我們先解釋一下一些結果值的概念。

現在假設我們的分類目標只有兩類,計為正例(positive)和負例(negtive)分別是:

1)True positives(TP): 被正確地劃分為正例的個數,即實際為正例且被分類器劃分為正例的實例數(樣本數);
2)False positives(FP): 被錯誤地劃分為正例的個數,即實際為負例但被分類器劃分為正例的實例數;
3)False negatives(FN):被錯誤地劃分為負例的個數,即實際為正例但被分類器劃分為負例的實例數;
4)True negatives(TN): 被正確地劃分為負例的個數,即實際為負例且被分類器劃分為負例的實例數。  

首先有關TP、TN、FP、FN的概念。大體來看,TP與TN都是分對了情況,TP是正類,TN是負類。 則推斷出,FP是把錯的分成了對的,而FN則是把對的分成了錯的。1.準確率(Accuracy)。顧名思義,就是所有預測正確(正類負類)的占總的比重。Accuracy=(TP+TN)/(TP+TN+FP+FN)2.精確率(Precison),查準率。即正確預測為正的占全部預測為正的比例。Precision=TP/(TP+FP)3.召回率(Recall),查全率。即正確預測為正的占全部實際為正的比例。Recall=TP/(TP+FN)4.F1值,算數平均數除以幾何平均數,且越大越好。2/F1=1/Precision+1/Recall5.Epoch,使用訓練集的全部數據對模型進行一次完成訓練,被稱之為“一代訓練”。6.Batch,使用訓練集中的一小部分樣本對模型權重進行一次反向傳播的參數更新,這一部分樣本被稱為“一批數據”。7.Iteration,使用一個Batch數據對模型進行一次參數更新的過程,被稱之為“一次訓練”。

結語

整個模型讀取450萬待預測數據并處理的效率為?128,571個/分鐘,打標簽的效率為?97,825個/分鐘、準確率為?85.792%,為訓練集打標簽的準確率為?91.593%。實際上如果原始數據集更加規范準確、每類商品信息的數據集更大,我們模型的準確率會更高。

文件說明

data_helper.py 包含數據預處理函數,以及對文件的操作函數都在里面predict_cnn.py 提供模型的預測textCNN.py CNN模型train_cnn.py 訓練模型

運行步驟:

每次更改訓練集需要重新運行步驟1,2再進行預測

1.運行data_helper.py 構造詞匯表,獲得數據分類2.運行train_cnn.py 進行模型的訓練(在logs文件可以找到相關日志文件查看記錄)3.運行predict_cnn.py進行預測

總結

以上是生活随笔為你收集整理的第十届中国大学生服务外包创新创业大赛的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 91黄瓜视频 | 91青青草视频 | 精品美女久久 | 羞羞软件 | 国产精品永久免费观看 | 日日噜噜噜噜人人爽亚洲精品 | 白嫩初高中害羞小美女 | 玩偶游戏在线观看免费 | 天天做天天操 | 午夜性生活视频 | 我们的2018在线观看免费高清 | 国产农村妇女aaaaa视频 | ,亚洲人成毛片在线播放 | 久草日韩| 欧美激情999| 国产精品久久久精品 | 手机看片日韩国产 | 国产午夜福利100集发布 | 午夜免费福利小视频 | 天天综合天天做 | 欧美男人天堂网 | 日本性网站 | 日韩一区二区三区四区 | 最好看的日本字幕mv视频大全 | 永久免费看黄网站 | 欧美国产二区 | 蜜桃av在线免费观看 | 日韩欧美中 | 免费人成在线 | 91午夜在线 | 亚洲tv在线观看 | 亚洲女同一区二区 | 超碰最新网址 | 亚洲v在线 | 美日韩丰满少妇在线观看 | 五月天视频网 | 熟妇毛片 | 欧洲美熟女乱又伦 | 色网站在线播放 | 亚洲日本色图 | 俺来也俺也啪www色 欧洲一区二区视频 | 91精品国产乱码久久久久 | 午夜在线观看影院 | 日本高潮视频 | 69国产| 97精品在线观看 | 国产成人精品久久二区二区91 | 裸体裸乳被免费看视频 | 日日干日日 | 日本69式三人交 | 黑人性生活视频 | 污视频网站在线看 | 在线观看国产一区二区 | 欧美成人精品一区二区男人小说 | 激情五月婷婷丁香 | 日本成人一级片 | 色一情一区二区三区 | 999久久| 国产欧美日韩精品在线 | 久久在线精品视频 | 韩国三级在线播放 | 欧美在线一区二区 | 亚洲女人av| 中文字幕一区二区三区四区五区 | 欧美综合激情网 | 国产丝袜第一页 | 欧美另类精品xxxx孕妇 | 国产传媒av | 日韩av网址大全 | 特级毛片在线观看 | 国产二三区| 成人网免费视频 | 波多野结衣a级片 | 国产成人黄色av | 日本久久免费 | 免费视频中文字幕 | 人人妻人人藻人人爽欧美一区 | 久成人| 亚洲综合成人av | 天堂av2021| 久久五月天婷婷 | 一级视频在线播放 | 亚洲老妇色熟女老太 | 欧美3p在线观看 | 久久大陆 | 韩国三级中文字幕hd久久精品 | av精选 | 国产愉拍 | 色撸撸在线观看 | 一级视频免费观看 | 波多野吉衣中文字幕 | 亚洲黄色一级大片 | 亚洲国产理论 | 麻豆视频一区二区三区 | 成人羞羞网站 | 女同性恋一区二区三区 | 日本精品免费一区二区三区 | 99久久久久| 国产免费看 |