python爬虫之图片
生活随笔
收集整理的這篇文章主要介紹了
python爬虫之图片
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
# -*- coding: utf-8 -*-
# feimengjuan
#
# re模塊主要包含了正則表達式
import re#urllib.request模塊提供了讀取Web頁面數據的接口
import urllib.request#抓取網頁圖片#根據給定的網址來獲取網頁詳細信息,得到的html就是網頁的源代碼
def getHtml(url):page = urllib.request.urlopen(url) # urllib.request.urlopen()方法用于打開了一個URL地址html = page.read().decode() # read().decode() 用于讀取URL上的數據并解碼return htmldef getImg(html):#利用正則表達式把源代碼中的圖片地址過濾出來reg = r'src="(.+?\.jpg)" pic_ext' # pic_ext=jpeg 用于正則匹配圖片格式imgre = re.compile(reg) # re.compile() 可以把正則表達式編譯成正則表達式對象,可以重復使用imglist = imgre.findall(html) #表示在整個網頁中過濾出所有圖片的地址,放在imglist中x = 0for imgurl in imglist:# urllib.request.urlretrieve()方法,直接將遠程數據下載到本地,圖片通過x一次遞增命名urllib.request.urlretrieve(imgurl,'E:\haha\%s.jpg' %x) #打開imglist中保存的圖片網址,并下載圖片保存在本地x = x + 1print(imgurl)html = getHtml("http://tieba.baidu.com/p/2460150866")#獲取該網址網頁詳細信息,得到的html就是網頁的源代碼
getImg(html)#從網頁源代碼中分析并下載保存圖片
總結
以上是生活随笔為你收集整理的python爬虫之图片的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UI标签库专题二:JEECG智能开发平台
- 下一篇: Python 学习记录1