我用Python爬取了难下载的电子教材(内附代码)
我用Python爬取了難下載的電子教材(內(nèi)附代碼)
第一次在CSDN上面分享經(jīng)歷,有點(diǎn)激動(dòng)。本大二狗最近這段時(shí)間去不了學(xué)校又想看教材,不巧學(xué)習(xí)通上面的部分內(nèi)容老師設(shè)置了不可下載啊。好在最近學(xué)習(xí)了一點(diǎn)Python爬蟲(chóng)的知識(shí),歡迎需要下載的同學(xué)看過(guò)來(lái)!還請(qǐng)各位大佬多多指教哦!
聲明 下載僅供學(xué)習(xí),不應(yīng)到處轉(zhuǎn)發(fā)電子版本侵害教材版權(quán)!
學(xué)習(xí)系統(tǒng)簡(jiǎn)介
學(xué)習(xí)通
以如下這門課為例,教師設(shè)置了不可下載:
Windows系統(tǒng)按F12檢查網(wǎng)頁(yè),再點(diǎn)擊右上角的定位(或Ctrl+Shift+C),去網(wǎng)頁(yè)中選擇你想下載的內(nèi)容。觀察右側(cè)Elements欄可知該教案的鏈接,并得知其為png圖片格式。
將左欄教材逐漸翻頁(yè),依次觀察鏈接,可見(jiàn)文件名稱的更改有以下規(guī)律:
https://s3.ananas.chaoxing.com/doc/90/82/9f/a0166ab6ad54432fe759395aaf79af62/thumb/2.png
僅圖片名稱逐張加一。
對(duì)此可以寫(xiě)一個(gè)循環(huán),拼接鏈接并下載圖片。
代碼實(shí)現(xiàn)
注意,本段代碼需要使用requests庫(kù)。
import requests headers={'user-agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'} # 設(shè)置請(qǐng)求頭for i in range(1,23): # 根據(jù)實(shí)際情況設(shè)置頁(yè)數(shù)# 發(fā)出請(qǐng)求,并把返回的結(jié)果放在變量res中res = requests.get('https://s3.ananas.chaoxing.com/doc/90/82/9f/a0166ab6ad54432fe759395aaf79af62/thumb/'+str(i)+'.png')# 把Reponse對(duì)象的內(nèi)容以二進(jìn)制數(shù)據(jù)的形式返回pic=res.content# 這里的文件沒(méi)加路徑,它會(huì)被保存在程序運(yùn)行的當(dāng)前目錄下。# 圖片內(nèi)容需要以二進(jìn)制wb讀寫(xiě)。你在學(xué)習(xí)open()函數(shù)時(shí)接觸過(guò)它。photo = open(str(i)+'.png','wb')# 獲取pic的二進(jìn)制內(nèi)容photo.write(pic) # 關(guān)閉文件photo.close()
在當(dāng)前路徑中就能看到下載好的圖片啦。
結(jié)語(yǔ)
真的不太會(huì)編程,只是感覺(jué)有必要學(xué)習(xí)一下,終于在 風(fēng)變編程 的幫助下學(xué)會(huì)了一點(diǎn)一直很渴望學(xué)的實(shí)用技能。忍不住要夸夸它!
這個(gè)代碼也是很簡(jiǎn)單,以后也要繼續(xù)加油!
總結(jié)
以上是生活随笔為你收集整理的我用Python爬取了难下载的电子教材(内附代码)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: cadencesxstrace.exe修
- 下一篇: websocket python爬虫_p