日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

tushare pro接口_利用tushare获取新闻联播文字稿并制作词云

發布時間:2025/3/21 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 tushare pro接口_利用tushare获取新闻联播文字稿并制作词云 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

安裝

首先需要一堆python的第三方庫,俺用的是大清的鏡像,一點都不卡哦。

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba pip install -i https://pypi.tuna.tsinghua.edu.cn/simple wordcloud pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tushare pip install -i https://pypi.tuna.tsinghua.edu.cn/simple openpyxl pip install -i https://pypi.tuna.tsinghua.edu.cn/simple datetime pip install -i https://pypi.tuna.tsinghua.edu.cn/simple imageio

文字稿件的獲取

俺是從tushare金融社區獲得的文字稿,這是網址:https://tushare.pro/document/2?doc_id=154。

此外,你需要注冊一個賬號,在經過實名驗證之后獲得20個積分,就可以調取數據了。

代碼

import wordcloud import jieba import openpyxl from imageio import imread import datetime import tushare as ts import time c=openpyxl.Workbook()#創建一個工作簿 b=c.active#創建一個工作表 ts.set_token('token號') pro = ts.pro_api()#對接tushare接口

這里注意,你要填入自己在tushare的個人主頁中的token號之后,才能對接接口

end=input('請輸入類似20180211的開始日期') start=input('請輸入類似20180217的結束日期') datestart = datetime.datetime.strptime(start, '%Y%m%d') dateend = datetime.datetime.strptime(end, '%Y%m%d')#獲得起始時間 d=''#定義一個空字符串

end和start的命名反了是因為是俺從網上扒來的代碼,就懶得改了,湊合著用吧。

while datestart >= dateend:url_time = datestart.strftime('%Y%m%d')datestart -= datetime.timedelta(days=1)df = pro.cctv_news(date=url_time)b['A1']=url_timefor i in range(len(df.index)):b['A'+str(i+2)]=df.index[i]b['B'+str(i+2)]=df['title'][i]b['C'+str(i+2)]=df['content'][i]d = d + b['B' + str(i + 2)].value + b['C' + str(i + 2)].valuec.save(url_time+'新聞聯播.xlsx')print('已存入同級文件夾目錄下,命名為'+url_time+'新聞聯播.xlsx')if datestart >= dateend:time.sleep(31)#tushare限制訪問時間一分鐘2次

讀取每一天的數據,返回的類型是DataFrame.然后將其存入excel表格備用,同時將文稿都讀入字符串d中.

d=jieba.lcut(d) d=' '.join(d) g=imread(r'C:Users大帥哥Desktopstar.png')#大帥哥是俺的用戶名 e=wordcloud.WordCloud(width=1920,height=1920,background_color=(255,255,255),stopwords={},mask=g,font_path=r'C:WindowsFontsmsyh.ttc') e.generate(d) pic=e.to_image() e.to_file(end+'至'+start+'新聞聯播詞云.png') pic.show()

用jieba進行分詞,最后用五星制作為分詞就ok了.

圖與程序不符,但只有2020710-712的沒有敏感詞

下面是完整代碼

import wordcloud import jieba import openpyxl from imageio import imread import datetime import tushare as ts import time c=openpyxl.Workbook()#創建一個工作簿 b=c.active#創建一個工作表 ts.set_token('token號') pro = ts.pro_api()#對接tushare接口 end=input('請輸入類似20180211的開始日期') start=input('請輸入類似20180217的結束日期') datestart = datetime.datetime.strptime(start, '%Y%m%d') dateend = datetime.datetime.strptime(end, '%Y%m%d')#獲得起始時間 d=''#定義一個空字符串 while datestart >= dateend:url_time = datestart.strftime('%Y%m%d')datestart -= datetime.timedelta(days=1)df = pro.cctv_news(date=url_time)b['A1']=url_timefor i in range(len(df.index)):b['A'+str(i+2)]=df.index[i]b['B'+str(i+2)]=df['title'][i]b['C'+str(i+2)]=df['content'][i]d = d + b['B' + str(i + 2)].value + b['C' + str(i + 2)].valuec.save(url_time+'新聞聯播.xlsx')print('已存入同級文件夾目錄下,命名為'+url_time+'新聞聯播.xlsx')if datestart >= dateend:time.sleep(31)#tushare限制訪問時間一分鐘2次 d=jieba.lcut(d) d=' '.join(d) g=imread(r'C:Users大帥哥Desktopstar.png')#大帥哥是俺的用戶名 e=wordcloud.WordCloud(width=1920,height=1920,background_color=(255,255,255),stopwords={},mask=e,font_path=r'C:WindowsFontsmsyh.ttc') e.generate(d) pic=e.to_image() e.to_file(end+'至'+start+'新聞聯播詞云.png') pic.show()

總結

以上是生活随笔為你收集整理的tushare pro接口_利用tushare获取新闻联播文字稿并制作词云的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。