日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python爬取京东商品图片_python利用urllib实现爬取京东网站商品图片的爬虫实例

發布時間:2025/3/20 python 17 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python爬取京东商品图片_python利用urllib实现爬取京东网站商品图片的爬虫实例 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

本例程使用urlib實現的,基于python2.7版本,采用beautifulsoup進行網頁分析,沒有第三方庫的應該安裝上之后才能運行,我用的IDE是pycharm,閑話少說,直接上代碼!

# -*- coding: utf-8 -*

import re

import os

import urllib

import urllib2

from bs4 import BeautifulSoup

def craw(url,page):

html1=urllib2.urlopen(url).read()

html1=str(html1)

soup=BeautifulSoup(html1,'lxml')

imagelist=soup.select('#J_goodsList > ul > li > div > div.p-img > a > img')

namelist=soup.select('#J_goodsList > ul > li > div > div.p-name > a > em')

#pricelist=soup.select('#plist > ul > li > div > div.p-price > strong')

#print pricelist

path = "E:/{}/".format(str(goods))

if not os.path.exists(path):

os.mkdir(path)

for (imageurl,name) in zip(imagelist,namelist):

name=name.get_text()

imagename=path + name +".jpg"

imgurl="http:"+str(imageurl.get('data-lazy-img'))

if imgurl == 'http:None':

imgurl = "http:" + str(imageurl.get('src'))

try:

urllib.urlretrieve(imgurl,filename=imagename)

except:

continue

'''

#J_goodsList > ul > li:nth-child(1) > div > div.p-img > a > img

#plist > ul > li:nth-child(1) > div > div.p-name.p-name-type3 > a > em

#plist > ul > li:nth-child(1) > div > div.p-price > strong:nth-child(1) > i

'''

if __name__ == "__main__":

goods=raw_input('please input the goos you want:')

pages=input('please input the pages you want:')

count =0.0

for i in range(1,int(pages+1),2):

url="https://search.jd.com/Search?keyword={}&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&suggest=1.def.0.T06&wq=diann&page={}".format(str(goods),str(i))

craw(url,i)

count += 1

print 'work completed {:.2f}%'.format(count/int(pages)*100)

圖片的命名為商品的名稱,京東商品圖片地址的屬性很可能會有所變動,所以大家進行編寫的時候應該舉一反三,靈活運用!

這是我下載下來的手機類圖片文件的截圖:

我本地的爬取的速度很快,不到一分鐘就能爬取100頁上千個商品的圖片!

以上這篇python利用urllib實現爬取京東網站商品圖片的爬蟲實例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持易采站長站。

總結

以上是生活随笔為你收集整理的python爬取京东商品图片_python利用urllib实现爬取京东网站商品图片的爬虫实例的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。