日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

《中餐厅》弹幕数据分析,我不要你觉得,我只要我觉得!

發布時間:2024/9/15 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 《中餐厅》弹幕数据分析,我不要你觉得,我只要我觉得! 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.


這段時間奇怪了,周圍朋友都愛上了同一個口頭禪“我不要你覺得,我只要我覺得”;我就納悶了漢語文字那么多,你們偏偏都愛上了同一句,我懷疑他們在玩梗,果不其然,在B站的鬼畜區了解到了真相。

綠大暗僅憑一己之力,將綜藝節目《中餐廳3》推上了熱門,成為了本季度當之無愧的綜藝之王,“我不要你覺得,我只要我覺得”,“別說話,聽我的”等是綠大暗的經典名言,這些名言被稱為“明學”,甚至隱隱與“六學”齊名,兩開花。

對一部視頻作品,如果說評論是觀眾觀看后的沉思,那么彈幕就是吃瓜群眾情感的實時流露,為了一窺“明學”的真諦,我打算爬一爬《中餐廳3》的彈幕數據,做一個情感分析。

廢話不多說,“起鍋燒油”

一、分析網頁爬數據

1.確認加載方式

《中餐廳3》在芒果TV獨播,打開Chrome瀏覽器,訪問第1集的鏈接https://www.mgtv.com/b/330026/6086563.html,通過禁用頁面javaScript發現頁面視頻和彈幕都無法加載,并且右鍵-查看頁面源碼,搜索不到彈幕的文字,說明數據是異步加載的

2.抓包分析

打開剛剛關閉的javaScript,重新加載頁面,F12打開開發者工具,仔細查找XHR或JS最終在js中找到了彈幕數據,鏈接是這樣的
https://galaxy.bz.mgtv.com/rdbarrage?version=2.0.0&vid=6086563&abroad=0&pid=&os=&uuid=&deviceid=&cid=330026&ticket=&time=60102&mac=&platform=0&callback=jsonp_1568127366004_84552

彈幕數據是json格式,但是偽裝成了jQuery藏在JS里面。

3.鏈接分析

從抓包的地址看,彈幕的真實請求地址是https://galaxy.bz.mgtv.com/rdbarrage?,其后是一堆相關的參數,相關的參數見下圖

上圖中許多參數字段是沒有值的,所以我們試著簡化請求地址鏈接,最終發現https://galaxy.bz.mgtv.com/rdbarrage?vid=6086563&cid=330026&time=60102仍然可以請求成功,也就是說只保留vid,cid.time3個參數就可以了

接下來分析vid,cid.time這3個參數

首先我們把前3期的url列出來

第1期:https://www.mgtv.com/b/330026/6086563.html

第2期:https://www.mgtv.com/b/330026/6128068.html

第3期:https://www.mgtv.com/b/330026/6168375.html

發現上述url中330026沒有變化,只有后面的一串文字發生了變化,通過和下圖中參數對比,發現url中第一個不變的數字串就是我們要尋找的vid,而后面的數字串就是cid,不難看出,vid是“中餐廳3”在芒果TV平臺中的編號,而cid是中餐廳3不同期數的編號。

那么參數time是什么?
首先通過time英文的本身來看,她是一個和時間有關系的變量,那么可以有以下猜測

  • time是本波彈幕開始加載的時間;
  • time是本波彈幕播放的總時長
  • 然后觀察4條相鄰的彈幕js數據,當前彈幕的next的值和下一條彈幕js文件請求的time值非常接近,于是嘗試把
    https://galaxy.bz.mgtv.com/rdbarrage?vid=6086563&cid=330026&time=120083中的time值修改為120000,然后再次請求數據,發現仍然可以成功請求到對應的數據
    上圖中在next參數的旁邊還有個參數interval,她的英文意思是“間隔,間距”,而彈幕的time值依次是60000、120000、180000….,差值為60000,所以推測next=1000*interval,所以很有可能next的單位是ms,而interval的單位是s。為了驗證猜想,我們把視頻進度條拉到最后,本期的視頻長度為104.01分鐘,而最后一條彈幕的next為6240000,6240000ms轉化為分鐘剛好是104min,驗證成立:time是每條彈幕開始播放的時間。至此所有的參數都已經搞清楚了

    二、爬取數據

    采用request請求數據,導入我們需要調用的包import?requests
    import?json?
    import?pandas?as?pd
    import?time
    首先定義一個主函數用來獲取每條彈幕js文件的內容,并將獲得的數據轉化為json格式。傳入的參數time_zimu是每條彈幕開始播放的時間def?main(time_zimu):
    ????url='https://galaxy.bz.mgtv.com/rdbarrage?vid=6337608&cid=330026&time='+str(time_zimu)
    ????html=requests.get(url,headers=headers)
    ????html.encoding="utf-8"
    ????html_data=html.text[html.text.find('['):-2]
    ????html_data_json=json.loads(html_data)
    這需要注意一點,因為我們要獲取的json數據是在jQuery中,為了避免出錯,我們這里直接獲取json部分的數據html_data=html.text[html.text.find('['):-2],效果如下圖將數據轉為json格式后,其中type,uid,content,time是我們想要的數據構造獲取彈幕信息函數,傳入json的數據orgin_data,通過循環重復取出單條彈幕信息,并提取對應的字段def?get_infos(orgin_data):
    ????for?infos?in?orgin_data:
    ????????yield[
    ????????infos['type'],
    ????????infos['uid'],
    ????????infos['content'],
    ????????infos['time']
    ????????]
    構造保存數據函數,將獲得的數據構建成DaraFrame,將數據保存到csv文件中def?save_data(single_data):
    ????data=[]
    ????data.extend(single_data)
    ????columns=['type','uid','content','time']
    ????data_frame=pd.DataFrame(data=data,columns=columns)
    ????data_frame.to_csv('data2019.csv',mode='a')
    最后封裝函數,循環獲取所有彈幕文件if?__name__?==?"__main__":
    ????time_c=60000?#加載彈幕時間間隔
    ????for?i?in?range(0,110):?#此處110取決于最后彈幕的出現時間
    ????????print('開始?時間為'+str(i)+'的字幕')
    ????????main(time_c*i)
    ????????time.sleep(3)

    三、展示成果

    運行爬蟲,開始工作爬取彈幕
    展示下我們爬取到的彈幕數據文件的前幾行數據,達成獲得彈幕數據成就data=pd.read_csv('data2019.csv')
    print(data.head())

    四、one more thing

    這篇文章并沒有太大難度,但是對于新手來說,網上的的教程都集中在代碼部分,而前期的分析工作則一筆帶過,其實這部分才是最重要的部分,這也是我寫本文的初衷。本文完整代碼,在「小詹學Python」后臺回復「中餐廳」即可獲取!推薦閱讀:(點擊下方標題即可跳轉)

    與50位技術專家面對面20年技術見證,附贈技術全景圖

    總結

    以上是生活随笔為你收集整理的《中餐厅》弹幕数据分析,我不要你觉得,我只要我觉得!的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 天天色综合av | 自拍偷拍色 | 日韩天堂在线视频 | 双性皇帝高h喷汁呻吟 | 亚洲另类天堂 | 丰满人妻老熟妇伦人精品 | 久久三 | 美女色呦呦 | 亚洲高清天堂 | 一本一道久久a久久精品蜜桃 | 亚洲精品国产精品乱码桃花 | 99在线看| 亚洲人交配视频 | 免费精品视频一区二区三区 | 久久久久久艹 | 国产成人小视频 | 性生活一级大片 | 中文字幕日韩欧美一区二区三区 | 国产草草浮力影院 | 欧洲一区二区三区在线 | www.brazzers.com| 亚洲图片 自拍偷拍 | 国产第一区第二区 | 国产一区一一区高清不卡 | 极品av在线 | 国产精品无人区 | 奇米综合网 | 男人肌肌桶女人肌肌 | 被两个男人吃奶三p爽文 | 免费看片色 | 色婷婷国产精品 | 麻豆网站在线看 | 麻豆免费在线观看 | 91在线观看免费高清 | 性欧美丰满熟妇xxxx性 | 国内国产精品天干天干 | 国产亚洲欧美在线精品 | 成人激情社区 | 亚洲欧美日韩综合在线 | 污污的视频在线观看 | 阿v天堂在线 | 影音先锋中文字幕资源 | 国产精品伦一区二区三区免费看 | 色多多视频在线 | 国产乱码精品一品二品 | 久久精品视频免费 | 99产精品成人啪免费网站 | 日本不卡一区二区在线观看 | 亚洲精品一区在线观看 | 黑人操日本女优 | 日本3级网站 | 欧美丰满少妇人妻精品 | 成人黄色免费观看 | 国产日本欧美一区二区 | 久色电影 | 国产欧美成人 | 乱淫67194| 我的好妈妈在线观看 | 黄色网免费看 | 国产成人在线影院 | 中文毛片无遮挡高潮免费 | 9999热视频 | 99视频一区二区 | 欧美精品亚洲精品 | 国产成a人亚洲精v品无码 | 国产福利在线观看视频 | 亚洲欧美日韩图片 | 五月的婷婷 | 国产福利小视频 | 国产永久av| 麻豆成人精品国产免费 | 狠狠干狠狠撸 | 日韩字幕在线观看 | 久久久久久91 | 三年中文免费观看大全动漫 | 少妇一级淫片免费播放 | 黄色另类小说 | 男女日皮视频 | 午夜91 | 国产乱码精品一区二区三区亚洲人 | 嫩草嫩草嫩草嫩草嫩草嫩草 | gv天堂gv无码男同在线观看 | 九色网站在线观看 | 久久一区二区三区精品 | 黑人操亚洲女 | 激情视频网站在线观看 | 成人免费看片入口 | 一区在线观看视频 | 亚洲国产网 | 午夜污污 | 亚洲欧美日韩国产综合 | 国产精品二区一区二区aⅴ污介绍 | 免费观看a级片 | 永久免费精品影视网站 | 日韩激情网站 | 欧美日a| 久久久性色精品国产免费观看 | 国产精彩视频一区 | 欧美乱妇日本无乱码特黄大片 |