日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python爬虫获取小说根据正文调用函数传入章节地址列表_python爬虫之小说章节获取,聊斋志异小说完整版...

發布時間:2023/12/10 python 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python爬虫获取小说根据正文调用函数传入章节地址列表_python爬虫之小说章节获取,聊斋志异小说完整版... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

“寫鬼寫妖高人一等,刺貪刺虐入骨三分。”

沒找到聊齋志異完整版的txt文檔,那就把在線閱讀的文章抓下來吧。

開發環境

python3.7

requests模塊

lxml模塊

獲取分析

找到聊齋志異的小說網站。

通過查看源碼與分析小說每一章的URL鏈接發現,構成每一章的URL鏈接其實是通過小說網站URL鏈接的前綴+每一章的章節屬性得到。

#獲取章節鏈接

for name0 in url2:

name = name0.xpath("./a/text()")[0]

urlhref = name0.xpath("./a/@href")[0]

finurl = "https://www.sbkk88.com" + urlhref

獲取到小說每一章的URL鏈接后分析章節內容網頁,發現是靜態頁面,直接通過requests.get()方法就獲取到。

#解析,獲取內容

response2 = requests.get(finurl,headers = headers).content.decode('gbk')

html = etree.HTML(response2)

cons = html.xpath("//*[@id='f_article']/p")

for one in cons:

essay = []

conss = one.xpath(".//text()")

for sentence in conss:

if sentence == "一":

pass

else:

essay.append(sentence)

最后將爬取到的內容寫入.txt文本,就能得到一本完整的聊齋志異小說!

結果展示:

聊齋志異小說

現在就能閱讀整本的聊齋志異白話文小說了。

總結

以上是生活随笔為你收集整理的python爬虫获取小说根据正文调用函数传入章节地址列表_python爬虫之小说章节获取,聊斋志异小说完整版...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。