當前位置：首頁 > 编程语言 > python >内容正文

python

python爬虫之图片

發布時間：2025/3/16 python 18 豆豆

生活随笔收集整理的這篇文章主要介紹了 python爬虫之图片小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

# -*- coding: utf-8 -*- # feimengjuan # # re模塊主要包含了正則表達式 import re#urllib.request模塊提供了讀取Web頁面數據的接口 import urllib.request#抓取網頁圖片#根據給定的網址來獲取網頁詳細信息，得到的html就是網頁的源代碼 def getHtml(url):page = urllib.request.urlopen(url) # urllib.request.urlopen()方法用于打開了一個URL地址html = page.read().decode() # read().decode() 用于讀取URL上的數據并解碼return htmldef getImg(html):#利用正則表達式把源代碼中的圖片地址過濾出來reg = r'src="(.+?\.jpg)" pic_ext' # pic_ext=jpeg 用于正則匹配圖片格式imgre = re.compile(reg) # re.compile() 可以把正則表達式編譯成正則表達式對象，可以重復使用imglist = imgre.findall(html) #表示在整個網頁中過濾出所有圖片的地址，放在imglist中x = 0for imgurl in imglist:# urllib.request.urlretrieve()方法，直接將遠程數據下載到本地，圖片通過x一次遞增命名urllib.request.urlretrieve(imgurl,'E:\haha\%s.jpg' %x) #打開imglist中保存的圖片網址，并下載圖片保存在本地x = x + 1print(imgurl)html = getHtml("http://tieba.baidu.com/p/2460150866")#獲取該網址網頁詳細信息，得到的html就是網頁的源代碼 getImg(html)#從網頁源代碼中分析并下載保存圖片

總結

以上是生活随笔為你收集整理的python爬虫之图片的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： UI标签库专题二：JEECG智能开发平台
下一篇： Python 学习记录1