大数据文本分析的应用场景有哪些?
https://www.pmcaff.com/discuss/index/480966354177088?from=related&pmc_param%5Bentry_id%5D=1000000000167873
自問(wèn)自答一發(fā)。之前寫(xiě)過(guò)2篇相關(guān)的文章:
【數(shù)據(jù)運(yùn)營(yíng)】在運(yùn)營(yíng)中,為什么文本分析遠(yuǎn)比數(shù)值型分析重要?(上)
【數(shù)據(jù)運(yùn)營(yíng)】在運(yùn)營(yíng)中,為什么文本分析遠(yuǎn)比數(shù)值型分析重要?一個(gè)實(shí)際案例,五點(diǎn)分析(下)
除了上面那幾種應(yīng)用,這種基于大數(shù)據(jù)的文本分析還有如下實(shí)際應(yīng)用:
1 傳播分析
檢索對(duì)象在傳播趨勢(shì)和傳播渠道上的分析。
傳播走勢(shì)
傳播渠道
2 情感分析
情感分析指的是對(duì)文本中情感的傾向性和評(píng)價(jià)對(duì)象進(jìn)行提取的過(guò)程。
基于上百萬(wàn)條社交網(wǎng)絡(luò)平衡語(yǔ)料和數(shù)十萬(wàn)條新聞平衡語(yǔ)料的機(jī)器學(xué)習(xí)模型,結(jié)合自主開(kāi)發(fā)的半監(jiān)督學(xué)習(xí)技術(shù),正負(fù)面情感分析準(zhǔn)確度達(dá)到80%以上,可以輕松的識(shí)別網(wǎng)民對(duì)于某一檢索對(duì)象的好惡傾向,最直接的應(yīng)用就是品牌口碑檢測(cè)領(lǐng)域。
3信息分類(lèi)
文本信息分類(lèi)將文本按照預(yù)設(shè)的分類(lèi)體系進(jìn)行自動(dòng)區(qū)分。常見(jiàn)的商業(yè)應(yīng)用前景有:
通過(guò)社交網(wǎng)絡(luò)挖掘商業(yè)情報(bào)和潛在銷(xiāo)售機(jī)會(huì);
企業(yè)內(nèi)文本數(shù)據(jù)分析;
海量數(shù)據(jù)篩選;
資訊分類(lèi);
自動(dòng)標(biāo)簽預(yù)測(cè)等。
4典型意見(jiàn)提取
微博評(píng)論典型意見(jiàn)
網(wǎng)民典型評(píng)論
典型意見(jiàn)引擎將消費(fèi)者意見(jiàn)進(jìn)行單句級(jí)別的語(yǔ)義聚合,提取出有代表性的意見(jiàn)。常見(jiàn)的商業(yè)應(yīng)用前景有:
消費(fèi)者調(diào)研;
電商點(diǎn)評(píng)分析;
社會(huì)熱點(diǎn)事件的意見(jiàn)整理。
5文本聚類(lèi)
相似文本聚類(lèi)指的是機(jī)器自動(dòng)對(duì)給定的文本進(jìn)行話題聚類(lèi),將語(yǔ)義上相似的內(nèi)容歸為一類(lèi)。常見(jiàn)的商業(yè)應(yīng)用前景有:
海量文檔、資訊的整理;
話題級(jí)別的統(tǒng)計(jì)分析。
6關(guān)鍵詞抽取
文章關(guān)鍵詞抽取
用戶評(píng)論關(guān)鍵詞抽取
關(guān)鍵詞提取引擎從一篇或多篇文本中提取出有代表性的關(guān)鍵詞。關(guān)鍵詞提取技術(shù)綜合考慮詞語(yǔ)在文本中的頻率,和詞語(yǔ)在千萬(wàn)級(jí)背景數(shù)據(jù)中的頻率,選擇出最具有代表性的關(guān)鍵詞并給出相應(yīng)權(quán)重。
可以使用戶在如恒河沙數(shù)的文本數(shù)據(jù)中提煉出有價(jià)值的信息,節(jié)省閱讀時(shí)間。
7 語(yǔ)義網(wǎng)絡(luò)分析、知識(shí)圖譜
通過(guò)將應(yīng)用數(shù)學(xué)、圖形學(xué)、信息可視化技術(shù)、信息科學(xué)等學(xué)科的理論與方法引入文本數(shù)據(jù)分析領(lǐng)域,并結(jié)合共現(xiàn)分析手段,可視化語(yǔ)義網(wǎng)絡(luò)呈現(xiàn)各類(lèi)文本/信息之間的內(nèi)在相關(guān)關(guān)系,時(shí)間維度上的動(dòng)態(tài)關(guān)系(傳播路徑)。
知識(shí)圖譜網(wǎng)絡(luò)
傳播網(wǎng)絡(luò)
商品關(guān)聯(lián)網(wǎng)絡(luò)
1.錘子新發(fā)布的功能“BigBang”分詞功能。也算是大數(shù)據(jù)文本分析的應(yīng)用,通過(guò)大數(shù)據(jù)文本分析,才能實(shí)現(xiàn)對(duì)詞義的準(zhǔn)確分析,從而做到更準(zhǔn)確的分詞。
2.網(wǎng)絡(luò)輿情監(jiān)控。這也當(dāng)然是大數(shù)據(jù)文本分析的產(chǎn)物,提取網(wǎng)絡(luò)文本的關(guān)鍵詞,組成語(yǔ)義網(wǎng)絡(luò)之后分析語(yǔ)義傾向,達(dá)到輿情監(jiān)控的目的。
3.社交網(wǎng)絡(luò)情緒監(jiān)控。相信大家都看到了很多網(wǎng)絡(luò)上直播自殺、發(fā)自殺預(yù)報(bào)的這樣的事情,和輿情監(jiān)控相同,就是對(duì)個(gè)人社交網(wǎng)絡(luò)的信息進(jìn)行監(jiān)控,通過(guò)文本分析和機(jī)器學(xué)習(xí)的技術(shù),分析出此人的情緒狀況,一旦出現(xiàn)極端的負(fù)面情緒,可以通過(guò)一定的措施避免極端行為的發(fā)生。
4.證券行業(yè)投資情報(bào)獲取。可以基于積累的大數(shù)據(jù)做進(jìn)一步深層次的分析與挖掘,整合各社交網(wǎng)絡(luò)、證券討論社區(qū)群體信息提取加工成有價(jià)值的證券投資情報(bào),對(duì)證券投資行為做輔助分析和預(yù)報(bào)。
總結(jié)
以上是生活随笔為你收集整理的大数据文本分析的应用场景有哪些?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: jMeter 打开项目时遇到错误消息 C
- 下一篇: idea在Tomcat服务器加载html