日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程语言 > python >内容正文

python

Python词云学习之旅

發(fā)布時(shí)間:2024/9/30 python 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python词云学习之旅 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

前言:

上次看知乎的時(shí)候,看到了一位python大神爬取了一些人們?cè)谝咔榻Y(jié)束后第一件事要干嘛的評(píng)論,并做成了云圖,當(dāng)時(shí)就覺(jué)得特別有意思,所以就來(lái)學(xué)習(xí)一下。

下載的話就不過(guò)多介紹了,百度上都有,主要說(shuō)一下編輯云詞很好用的工具以及如何去制作詞云。

0x00:jupyter notebook工具

工具的介紹以及下載可以查知乎大神寫的
https://zhuanlan.zhihu.com/p/33105153
安裝好之后,更改一下默認(rèn)目錄,之后運(yùn)行的話只需輸入

jupyter notebook

即可運(yùn)行

0x01:制作一個(gè)簡(jiǎn)單的詞云

因?yàn)槟J(rèn)是無(wú)法加載漢字的,所以需要復(fù)制一下本地字體進(jìn)行導(dǎo)入

復(fù)制一個(gè)到你設(shè)置的jupyter notebook目錄,導(dǎo)入即可

from wordcloud import WordCloud import numpy as np from PIL import Image #實(shí)例化一個(gè)WordCloud對(duì)象 wcd = WordCloud(background_color="white",repeat=True,max_words=500,height=480, width=854,max_font_size=100,font_path="fonts/msyh.ttc",colormap="YlGnBu_r", mask=mask,contour_width=8,contour_color='white') #很多選項(xiàng)都可以通過(guò)shite+tab鍵查看 #加載圖片,白底的圖片才可以 mask = np.array(Image.open("4.png")) text = "劍姬 劍魔 杰斯 奧恩 VN 圣槍游俠 阿卡麗 吸血鬼 船長(zhǎng) " #加載字符串 wcd.generate(text) #生成詞云 wcd.to_image() #保存圖片 wcd.to_file("shy.png")

背景圖片

生成的詞云圖

但如果想要透明背景的話應(yīng)該怎么做

wcd = WordCloud(background_color="None",repeat=True,max_words=500,height=480, width=854,max_font_size=100,font_path="fonts/msyh.ttc",colormap="YlGnBu_r", mask=mask,mode='RGBA') #這里有一個(gè)bug,如果不去掉contour_width=8,contour_color='white',便會(huì)發(fā)生報(bào)錯(cuò)


去掉之后,再運(yùn)行就OK了

這里我設(shè)置的字符串是

text = "劍姬 劍魔 杰斯 奧恩 VN 圣槍游俠 阿卡麗 吸血鬼 船長(zhǎng) "

如果是這么長(zhǎng)的一段話,又該怎么處理那?

text = "TheShy:首先第一個(gè)是個(gè)人認(rèn)為薇恩打鐵男是一個(gè)很好的英雄之一。在玩鐵男的立場(chǎng)上,如果說(shuō)不Ban薇恩的話,鐵男是很難玩的。因?yàn)檗倍饕彩菦](méi)有玩過(guò)這個(gè)英雄,所以當(dāng)時(shí)也在猶豫到底要不要用這個(gè)英雄,但是當(dāng)時(shí)隊(duì)友說(shuō)可以用這個(gè)英雄,就拿薇恩了。"

使用\進(jìn)行分割

也可以導(dǎo)入一個(gè)第三方自然語(yǔ)言處理庫(kù)

import jiebatext= "TheShy:首先第一個(gè)是個(gè)人認(rèn)為薇恩打鐵男是 \ 一個(gè)很好的英雄之一。在玩鐵男的立場(chǎng)上,如果說(shuō)不Ban薇恩的話,\ 鐵男是很難玩的。因?yàn)檗倍饕彩菦](méi)有玩過(guò)這個(gè)英雄,\ 所以當(dāng)時(shí)也在猶豫到底要不要用這個(gè)英雄,但是當(dāng)時(shí)隊(duì)友說(shuō)可以用這個(gè)英雄\ ,就拿薇恩了" #jieba.lcut()可以生成一個(gè)list jieba.lcut(text)


空格、符號(hào)會(huì)被自動(dòng)去掉,但是wcd.generate(text)需要傳入的是字符串不是列表,而且傳入的字符串需要每個(gè)字間隔都要有空格,可以改成如下的格式

" ".join(jieba.lcut(text))


這樣generate方法就可以進(jìn)行處理了

這個(gè)只是一個(gè)最簡(jiǎn)單的例子,之后會(huì)每天進(jìn)行學(xué)習(xí)做一個(gè)不同的云圖!!!

未完待續(xù)!!!

總結(jié)

以上是生活随笔為你收集整理的Python词云学习之旅的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。