Python词云学习之旅
前言:
上次看知乎的時(shí)候,看到了一位python大神爬取了一些人們?cè)谝咔榻Y(jié)束后第一件事要干嘛的評(píng)論,并做成了云圖,當(dāng)時(shí)就覺(jué)得特別有意思,所以就來(lái)學(xué)習(xí)一下。
下載的話就不過(guò)多介紹了,百度上都有,主要說(shuō)一下編輯云詞很好用的工具以及如何去制作詞云。
0x00:jupyter notebook工具
工具的介紹以及下載可以查知乎大神寫的
https://zhuanlan.zhihu.com/p/33105153
安裝好之后,更改一下默認(rèn)目錄,之后運(yùn)行的話只需輸入
即可運(yùn)行
0x01:制作一個(gè)簡(jiǎn)單的詞云
因?yàn)槟J(rèn)是無(wú)法加載漢字的,所以需要復(fù)制一下本地字體進(jìn)行導(dǎo)入
復(fù)制一個(gè)到你設(shè)置的jupyter notebook目錄,導(dǎo)入即可
背景圖片
生成的詞云圖
但如果想要透明背景的話應(yīng)該怎么做
去掉之后,再運(yùn)行就OK了
這里我設(shè)置的字符串是
如果是這么長(zhǎng)的一段話,又該怎么處理那?
text = "TheShy:首先第一個(gè)是個(gè)人認(rèn)為薇恩打鐵男是一個(gè)很好的英雄之一。在玩鐵男的立場(chǎng)上,如果說(shuō)不Ban薇恩的話,鐵男是很難玩的。因?yàn)檗倍饕彩菦](méi)有玩過(guò)這個(gè)英雄,所以當(dāng)時(shí)也在猶豫到底要不要用這個(gè)英雄,但是當(dāng)時(shí)隊(duì)友說(shuō)可以用這個(gè)英雄,就拿薇恩了。"使用\進(jìn)行分割
也可以導(dǎo)入一個(gè)第三方自然語(yǔ)言處理庫(kù)
空格、符號(hào)會(huì)被自動(dòng)去掉,但是wcd.generate(text)需要傳入的是字符串不是列表,而且傳入的字符串需要每個(gè)字間隔都要有空格,可以改成如下的格式
這樣generate方法就可以進(jìn)行處理了
這個(gè)只是一個(gè)最簡(jiǎn)單的例子,之后會(huì)每天進(jìn)行學(xué)習(xí)做一個(gè)不同的云圖!!!
未完待續(xù)!!!
總結(jié)
以上是生活随笔為你收集整理的Python词云学习之旅的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Centos7 LAMP服务源码搭建
- 下一篇: websocket python爬虫_p