日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Crawler:利用Beautifulsoup库+find_all方法实现下载在线书架小说《星祖的电影世界》

發(fā)布時(shí)間:2025/3/21 编程问答 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Crawler:利用Beautifulsoup库+find_all方法实现下载在线书架小说《星祖的电影世界》 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Crawler:利用Beautifulsoup庫+find_all方法實(shí)現(xiàn)下載在線書架小說《星祖的電影世界》

?

?

目錄

輸出結(jié)果

核心代碼


?

?

?

?

輸出結(jié)果

?

核心代碼

?

# -*- coding: utf-8 -*- ''' Created on 2018年4月7日@author: niu ''' #Py之Crawler:利用beautifulsoup+find_all方法實(shí)現(xiàn)下載在線書架小說《星祖的電影世界》 #find_all方法的第一個(gè)參數(shù)是獲取的標(biāo)簽名,第二個(gè)參數(shù)class_是標(biāo)簽的屬性。from bs4 import BeautifulSoup import requests, sysclass downloader(object):def __init__(self):self.server = 'http://www.biqukan.com/'self.target = 'http://www.biqukan.com/50_50927/'self.names = [] #存放章節(jié)名self.urls = [] #存放章節(jié)鏈接self.nums = 0 #章節(jié)數(shù)def get_download_url(self): #獲取下載鏈接req = requests.get(url = self.target)html = req.textdiv_bf = BeautifulSoup(html) #利用beautifulsoup提取內(nèi)容div = div_bf.find_all('div', class_ = 'listmain') #通過審查元素發(fā)現(xiàn)全書各個(gè)章節(jié)存放在了class屬性為listmain的div標(biāo)簽下,各章之間差別就在于這些章節(jié)的【href】屬性不一樣,而且其屬性正好對應(yīng)著每一章節(jié)URL后半部分,那這樣,我們就可以根據(jù)標(biāo)簽的href屬性值獲得每個(gè)章節(jié)的鏈接和名稱了。a_bf = BeautifulSoup(str(div[0]))a = a_bf.find_all('a') self.nums = len(a[14:]) #剔除不必要的章節(jié),并統(tǒng)計(jì)章節(jié)數(shù)for each in a[14:]:self.names.append(each.string)self.urls.append(self.server + each.get('href')) #再接著提取章節(jié)名和章節(jié)文章def get_contents(self, target): #獲取章節(jié)內(nèi)容,target下載連接(string),texts章節(jié)內(nèi)容(string)req = requests.get(url = target)html = req.textbf = BeautifulSoup(html)texts = bf.find_all('div', class_ = 'showtxt') #觀察不同標(biāo)簽發(fā)現(xiàn)class屬性為showtxt的div標(biāo)簽只有一個(gè)!這個(gè)標(biāo)簽里面存放的內(nèi)容,是我們需要的小說正文texts = texts[0].text.replace('\xa0'*8,'\n\n') #replace方法,剔除空格,替換為回車進(jìn)行分段。 在html中是用來表示空格的。replace(‘\xa0’*8,’\n\n’)就是去掉下圖的八個(gè)空格符號(hào),并用回車代替return textsdef writer(self, name, path, text): #將爬取的文章內(nèi)容寫入文件write_flag = Truewith open(path, 'a', encoding='utf-8') as f: #當(dāng)前路徑下,小說保存名稱(string)f.write(name + '\n') #章節(jié)名稱(string)f.writelines(text) #章節(jié)內(nèi)容(string)f.write('\n\n') if __name__ == "__main__":dl = downloader()dl.get_download_url()print('《星祖的電影世界》開始下載:')for i in range(dl.nums):dl.writer(dl.names[i], '星祖的電影世界.txt', dl.get_contents(dl.urls[i]))sys.stdout.write(" 已下載:%.3f%%" % float(i/dl.nums) + '\r')sys.stdout.flush()print('《星祖的電影世界》下載完成')

?

?

《新程序員》:云原生和全面數(shù)字化實(shí)踐50位技術(shù)專家共同創(chuàng)作,文字、視頻、音頻交互閱讀

總結(jié)

以上是生活随笔為你收集整理的Crawler:利用Beautifulsoup库+find_all方法实现下载在线书架小说《星祖的电影世界》的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 欧美高清大白屁股ass18 | 久久国产乱子伦免费精品 | 麻豆毛片 | 亚洲视频一二三区 | 岛国av在线播放 | 亚洲第一区在线播放 | 亚洲性激情 | 美女大bxxxxn内射 | 高清av网站 | 亚洲成人高清 | 色开心 | 国产一区二区免费视频 | 99精品人妻无码专区在线视频区 | 九九热这里有精品视频 | 蜜桃视频在线观看www | 婷婷激情久久 | 日本在线视频中文字幕 | 超碰777 | 日本不卡视频一区二区 | 瑟瑟视频在线看 | 久久一线| 岛国a视频| 欧美嫩草| 国产在线观看xxx | 九九在线 | 绯色av蜜臀vs少妇 | 91精品日韩 | 亚洲精品一区二区三区影院忠贞 | a视频在线| 国模大胆一区二区三区 | 亚洲视频入口 | 华人色 | 国产视频xxxx | 高清乱码免费看污 | 在线观看国产一区二区 | 亚洲色图第三页 | 福利片在线观看 | 99精品久久久久久 | 99久久婷婷国产综合精品草原 | www国产亚洲精品 | 国产日韩一级片 | 欧美浪妇xxxx高跟鞋交 | 美女黄色录像 | 亚洲av久久久噜噜噜熟女软件 | 欧美 日韩 国产 亚洲 色 | xxx国产 | 五月天中文字幕 | 2022国产精品 | 久久精品69| 久操视频免费观看 | 黑人巨大精品人妻一区二区 | 九一天堂 | 日本不卡高字幕在线2019 | 视频1区2区 | 夜夜骚视频 | 国产综合精品在线 | 69视频免费 | www嫩草 | 西方裸体在线观看 | 国产又粗又黄又爽又硬的视频 | 久久久久无码国产精品一区 | 国产美女作爱全过程免费视频 | 国产按摩一区二区三区 | 91视频免费视频 | 99久久久无码国产精品性 | 国产精品久久久久久久久岛 | 国产免费麻豆 | 超碰人人人人 | 综合另类| 色综合网址 | 久久情趣视频 | 国产特黄 | 欧美在线黄色 | 男女av网站 | 亚洲熟妇一区二区三区 | 日本亲与子乱ay中文 | 成年人黄色片网站 | 经典杯子蛋糕日剧在线观看免费 | 在线观看黄色的网站 | 91看视频 | 小sao货大ji巴cao死你 | 日本不卡一区二区在线观看 | 美女视频国产 | 制服师生在线 | 密臀av在线 | 看了让人下面流水的视频 | 成人欧美一区二区三区黑人免费 | 日本www色 | 911av| 亚洲成av人片一区二区 | 精品少妇一区二区三区免费观 | 五月婷婷视频在线 | 国产精选一区 | 国产老头老太作爱视频 | 精品一区二区久久久久久久网站 | 丝袜 亚洲 另类 国产 制服 | 91麻豆网| 亚洲欧美国产高清va在线播放 | 国产第8页 |