日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

Python异步爬取知乎热榜

發布時間:2025/3/20 python 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python异步爬取知乎热榜 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、錯誤代碼:摘要和詳細的url獲取不到

import asyncio from bs4 import BeautifulSoup import aiohttpheaders={'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36','referer': 'https://www.baidu.com/s?tn=02003390_43_hao_pg&isource=infinity&iname=baidu&itype=web&ie=utf-8&wd=%E7%9F%A5%E4%B9%8E%E7%83%AD%E6%A6%9C' } async def getPages(url):async with aiohttp.ClientSession(headers=headers) as session:async with session.get(url) as resp:print(resp.status) # 打印狀態碼html=await resp.text()soup=BeautifulSoup(html,'lxml')items=soup.select('.HotList-item')for item in items:title=item.select('.HotList-itemTitle')[0].texttry:abstract=item.select('.HotList-itemExcerpt')[0].textexcept:abstract='No Abstract'hot=item.select('.HotList-itemMetrics')[0].texttry:img=item.select('.HotList-itemImgContainer img')['src']except:img='No Img'print("{}\n{}\n{}".format(title,abstract,img))if __name__ == '__main__':url='https://www.zhihu.com/billboard'loop=asyncio.get_event_loop()loop.run_until_complete(getPages(url))loop.close()

二、查看JS代碼

發現詳細鏈接、圖片鏈接、問題摘要等都在JS里面(CSDN的開發者助手插件確實好用)

?

正則表達式獲取上述信息

?

接下來就是詳細的代碼啦

import asyncio import json import re import aiohttpheaders={'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36','referer': 'https://www.baidu.com/s?tn=02003390_43_hao_pg&isource=infinity&iname=baidu&itype=web&ie=utf-8&wd=%E7%9F%A5%E4%B9%8E%E7%83%AD%E6%A6%9C' } async def getPages(url):async with aiohttp.ClientSession(headers=headers) as session:async with session.get(url) as resp:print(resp.status) # 打印狀態碼html=await resp.text()regex=re.compile('"hotList":(.*?),"guestFeeds":')text=regex.search(html).group(1)# print(json.loads(text)) # json換成字典格式for item in json.loads(text):title=item['target']['titleArea']['text']question=item['target']['excerptArea']['text']hot=item['target']['metricsArea']['text']link=item['target']['link']['url']img=item['target']['imageArea']['url']if not img:img='No Img'if not question:question='No Abstract'print("Title:{}\nPopular:{}\nQuestion:{}\nLink:{}\nImg:{}".format(title,hot,question,link,img))if __name__ == '__main__':url='https://www.zhihu.com/billboard'loop=asyncio.get_event_loop()loop.run_until_complete(getPages(url))loop.close()

?

?

總結

以上是生活随笔為你收集整理的Python异步爬取知乎热榜的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 免费看国产一级片 | 手机看片国产1024 | 黄色一级欧美 | 欧美日韩国产图片 | 亚洲av无码乱码国产麻豆 | 粗大黑人巨茎大战欧美成人免费看 | 少妇2做爰hd韩国电影 | 久久精品欧美日韩 | 成人www | 丰满少妇高潮一区二区 | v天堂在线观看 | 久久久久亚洲av无码专区体验 | 国产第一精品视频 | 男女免费网站 | 4438x全国最大成人 | 国产精品99久久久久久久 | 天干夜天干天天天爽视频 | 日本h在线观看 | 黄色成人在线免费观看 | av福利在线看 | 日韩性网| 亚洲精品中文字幕乱码三区91 | 黄色不打码视频 | 久久综合伊人77777麻豆 | 成人7777| 日本成人一二三区 | 五月网站 | 国产黄色自拍视频 | aaa亚洲精品 | 亚洲30p| 国产欧美二区 | 丰满双乳秘书被老板狂揉捏 | 日日夜夜国产精品 | 正在播放国产精品 | 国产一级免费在线观看 | 猛1被调教成公厕尿便失禁网站 | 久久久久久亚洲av无码专区 | 小明天天看 | 尹人av| 日韩高清在线观看一区 | 在线手机av| 草草影院在线观看视频 | 张柏芝54张无删码视频 | 视频在线国产 | 国内精品久久99人妻无码 | 亚洲网站在线 | 亚洲一区二区视频在线观看 | 国产精品久久久久久免费免熟 | 国产欧美在线观看不卡 | 嫩草视频在线免费观看 | 欧洲亚洲视频 | 午夜精品久久久久久久久久蜜桃 | 超碰日日夜夜 | 亚洲AV无码成人精品区明星换面 | 激情五月av | eeuss鲁片一区二区三区在线观看 | 欧美偷拍亚洲 | 欧美性爱精品在线 | 亚洲色在线视频 | 亚洲视频精选 | 久草国产在线 | 无码国产精品一区二区免费16 | 欧洲丰满少妇做爰 | 午夜操操 | 亚洲宅男天堂 | 91porn破解版 | 黄网站免费在线观看 | 婷婷深爱网 | 亚洲一区影视 | 久久免费看视频 | 国产成人亚洲精品无码h在线 | 日韩人妻精品一区二区三区视频 | 免费国产一区二区三区 | 亚洲91精品 | 成人三级在线视频 | 黄色网页在线看 | 国产欧美日韩综合精品一区二区 | 国产麻豆成人传媒免费观看 | 日韩久草| 黑料视频在线观看 | 羞羞影院体验区 | 99久热| 最新极品jizzhd欧美 | 欧美久久久影院 | 欧美黑粗大 | 国产乱码精品一区二区三 | 与子敌伦刺激对白播放的优点 | 亚洲人人干 | 日本精品网 | 亚洲国产中文字幕在线观看 | 人成在线 | 黄a毛片 | 国产swag在线 | av在线黄| 无码精品在线观看 | av黄色片在线观看 | 久久老熟女一区二区三区 | 97超碰网| 国产91丝袜在线观看 |