自然语言处理常用数据集
最近需要從文本中抽取結(jié)構(gòu)化信息,收集到很多數(shù)據(jù),遂整理了一下,后續(xù)會(huì)不斷更新。
涉及內(nèi)容包括:中英文敏感詞、語(yǔ)言檢測(cè)、中外手機(jī)/電話歸屬地/運(yùn)營(yíng)商查詢、名字推斷性別、手機(jī)號(hào)抽取、身份證抽取、郵箱抽取、中日文人名庫(kù)、中文縮寫庫(kù)、拆字詞典、詞匯情感值、停用詞、反動(dòng)詞表、暴恐詞表、繁簡(jiǎn)體轉(zhuǎn)換、英文模擬中文發(fā)音、汪峰歌詞生成器、職業(yè)名稱詞庫(kù)、同義詞庫(kù)、反義詞庫(kù)、否定詞庫(kù)、汽車品牌詞庫(kù)、汽車零件詞庫(kù)、連續(xù)英文切割、各種中文詞向量、公司名字大全、古詩(shī)詞庫(kù)、IT詞庫(kù)、財(cái)經(jīng)詞庫(kù)、成語(yǔ)詞庫(kù)、地名詞庫(kù)、歷史名人詞庫(kù)、詩(shī)詞詞庫(kù)、醫(yī)學(xué)詞庫(kù)、飲食詞庫(kù)、法律詞庫(kù)、汽車詞庫(kù)、動(dòng)物詞庫(kù)、中文聊天語(yǔ)料、中文謠言數(shù)據(jù)。
下載地址:https://download.csdn.net/download/m0_38106923/10804731
?
總結(jié)
以上是生活随笔為你收集整理的自然语言处理常用数据集的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 用深度神经网络搭建马赛克神器,高清无码效
- 下一篇: 使用 Inception-v3,实现图像