日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python爬取qq音乐周杰伦_Python爬取20万条评论,告诉你周杰伦为啥弄崩QQ音乐?

發布時間:2025/4/5 python 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python爬取qq音乐周杰伦_Python爬取20万条评论,告诉你周杰伦为啥弄崩QQ音乐? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

作者 | 哈哈浩

責編 | 伍杏玲

9 月 16 日晚間,周董在朋友圈發布了最新單曲《說好不哭》。

發布后,真的讓一波人哭了,一群想搶鮮聽的小伙伴直接淚奔。

因為 QQ 音樂直接被搞崩了!

沒想到干翻 QQ 音樂的不是網易云音樂,也不是蝦米音樂,而是周董!

周董成成功地憑一己之力干翻了 QQ 音樂!

那么聽過周董新歌后的小伙伴都是怎么評價的呢?

這里,我們獲取了 QQ 音樂的近 20W 條評論數據進行分析,看看其中有哪些有趣的東西?

數據獲取

1、請求分析

在 QQ 網頁版直接搜索『說好不哭』,很容易就能找到單曲頁面:

說好不哭

拉到頁面最下方,可以看到評論的分頁查看按鈕:

分頁查看

按下 F12 點擊第二頁,在請求流中就可以看到對應的請求:

評論請求

其中可以看到兩個重要參數:pagenum 和 pagesize。

將請求 copy 到 Postman 中進行測試:

Postman測試

發現可以直接獲取到數據,連 Header 都不需要添加。這里嘗試對請求參數進行了精簡,最終只需要如下幾個參數即可:

參數精簡

從 Postman 中可以直接獲取到對應的代碼:

import requests

url ="https://c.y.qq.com/base/fcgi-bin/fcg_global_comment_h5.fcg"

querystring = {"biztype":"1","topid":"237773700","cmd":"8","pagenum":"1","pagesize":"25"}

response = requests.request("GET", url, params=querystring)

print(response.text)

這里是單頁評論的獲取,所有評論的獲取只需遞增 pagenum 即可。

2、數據解析

返回數據中有很多暫時不需要的字段,這里我們只取其中的用戶名、評論時間、評論內容、點贊數。

對應如下字段:

{

"nick":"丨那壹刻永遠消失\"\"",

"praisenum":1,

"rootcommentcontent":"越聽越好聽怎么回事!",

"time":1568729836,

}

由于數據量較大 這里我們暫時將數據存放在 Excel 中,一來無須依賴外部數據庫,二來可以使用 Excel 對數據進行二次處理。

數據存儲代碼如下:

deffile_do(list_info, file_name):

# 獲取文件大小

ifnotos.path.exists(file_name):

wb = openpyxl.Workbook()

page = wb.active

page.title ='jay'

page.append(['昵稱','時間','點贊數','評論'])

else:

wb = openpyxl.load_workbook(file_name)

page = wb.active

forinfoinlist_info:

try:

page.append(info)

exceptException:

print(info)

wb.save(filename=file_name)

數據可視化

1、各時段的評論數

首先我們對評論按小時區間進行匯總,由于時間粒度比較小,這里對時間粒度進行了一些處理:

評價人數走勢圖

周董的新曲是在 9.16 號 23 點準時發布的。可以看出在發布后的一個小時內(23:00-24:00)評論數量達到了高峰,占了總評論數的一半以上。

另外看了一眼 9.16 23 點之前的評論也很有意思:

一種搬好小板凳嗑著瓜子坐等的既視感

2、大家都在說什么

詞云生成的方法有很多,可以用代碼生成,也可以用一些在線工具。這里我就使用了在線詞云工具:WordArt,生成效果如下:

詞云

周杰倫、杰倫字眼很明顯,還有大量跑來『打卡』的:『好聽』、『來了』、『哭了』、『愛了』,其中少不了的還有『青春』,另外『阿信』的出現估計給了很多人驚喜。

3、大家都點贊了哪些評論

我們以點贊數對評論進行了排序,排名靠前的評論是如下一些:

評論排名

另外,QQ 音樂官方也會放出精彩評論:

熱心網友昀愷丶

涼城

蝸牛..

對比下可以看出和我們獲取到的數據是比較一致的,只不過官方并不是按點贊個數進行排名的,看得出來這些排名靠前的大都是在回憶青春。

這些評論之所以能夠得到大家的共鳴,也許他們的青春里都有一個周杰倫吧。

留言互動:你的青春里有周杰倫嗎?

源碼:https://github.com/hoxis/Python/tree/master/python-web-scraping/qqmusic

聲明:本文系作者投稿,版權歸作者所有。

【END】

熱 文推 薦

你點的每個“在看”,我都認真當成了喜歡

總結

以上是生活随笔為你收集整理的python爬取qq音乐周杰伦_Python爬取20万条评论,告诉你周杰伦为啥弄崩QQ音乐?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。