日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

爬取酷6网小视频

發布時間:2024/1/1 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 爬取酷6网小视频 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

本文只為學習交流。
目標網站

https://m.ku6.com/index


這個就是我們需要的請求數據

這個是含視頻的請求

構建請求

# Date: 2020/9/5 14:03 # @Software: PyCharm import requests import json import pprint from lxml import etreeurl = 'https://m.ku6.com/video/feed?pageNo=0&pageSize=8' headers = {'user-agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Mobile Safari/537.36' } redf = requests.get(url=url,headers=headers) pprint.pprint(redf.json())


解析數據

json_wqx = redf.json() jsod_list = json_wqx['data'] #print(jsod)

循環提取數據

# 一定要注意縮進問題,不然可能只循環一個 for data in jsod_list:playUrl = data['title'] + 'mp4'title = data['playUrl']#print(playUrl,title)

然后對視頻的url進行提取,并保存到本地

values = requests.get(url=playUrl,headers=headers).contentwith open('kuwang\\' + title,'wb') as f:f.write(values)print('正在下載:',title)

最后一步,翻頁提取。

這個翻頁是最簡單的翻頁,利用循環翻頁。

for page in range(1,6):print('************************************正在爬取第{}*********************************'.format(page))url = 'https://www.ku6.com/video/feed?pageNo={}&pageSize=40&subjectId=76'.format(page)

最后還是注意一點,縮進問題,任何一點縮進問題都會出錯,我以踩過坑。
本人小白,哪有出錯,請多多指教。

完整代碼

# Author:風啟新塵 # Date: 2020/9/5 14:03 # @Software: PyCharm import requests import json import pprint from lxml import etree for page in range(1,6):print('************************************正在爬取第{}*********************************'.format(page))url = 'https://www.ku6.com/video/feed?pageNo={}&pageSize=40&subjectId=76'.format(page)headers = {'user-agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Mobile Safari/537.36'}redf = requests.get(url=url,headers=headers)#pprint.pprint(redf.json())json_wqx = redf.json()jsod_list = json_wqx['data']#print(jsod)# 一定要注意縮進問題,不然可能只循環一個for data in jsod_list:title = data['title'] + '.mp4'playUrl= data['playUrl']#print(playUrl,title)values = requests.get(url=playUrl,headers=headers).contentwith open('kuwang\\' + title,'wb') as f:f.write(values)print('正在下載:',title)

總結

以上是生活随笔為你收集整理的爬取酷6网小视频的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。