日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

6、通过xpath获取网页数据

發布時間:2025/6/17 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 6、通过xpath获取网页数据 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1、xpath解析網頁源文件

from urllib import request from lxml import etree # 請求的url url = "http://www.dfenqi.cn/Product/Index" # 請求的頭文件 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36" } # 創建請求對象 req = request.Request(url,headers = headers) # 創建處理器對象 httpHandler = request.HTTPHandler() # 創建opener opener = request.build_opener(httpHandler) # 發送請求 response = opener.open(req) # 讀取源文件 html = response.read().decode('utf-8') # 創建xpath關系 xpath = "//div[@class='liebiao']/ul/li/p/text()" # 獲取屬性值列表 # xpath = "//div[@class='liebiao']/ul/li/p/@class" # 將html轉換成可解析對象 selector = etree.HTML(html) # 返回xpath查詢列表 goodsList = selector.xpath(xpath) # 顯示商品標題 for goods in goodsList:print(goods)

2、xpath解析源文件,并下載圖片至本地

from urllib import request from lxml import etree import osclass Spilder():def __init__(self,pageUrl):# 需要爬取網頁的urlself.pageUrl = pageUrl# 請求頭文件self.headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36"}# 請求的處理器self.httpHandler = request.HTTPHandler()# 請求的openerself.opener = request.build_opener(self.httpHandler)def loadPage(self):''' 請求網頁 :return: 返回網頁源文件 '''req = request.Request(self.pageUrl,headers = self.headers)response = self.opener.open(req)return response.read()def getImageUrls(self,html,xpath):''' 根據xpath解析源文件 :param html: 源文件 :param xpath: xpath解析字符串 :return: 解析列表 '''selector = etree.HTML(html)imgUrls = selector.xpath(xpath)return imgUrlsdef loadImage(self,url):''' 下載圖片 :param url: 圖片url :return: 返回圖片數據 '''req = request.Request(url,headers=self.headers)response = self.opener.open(req)return response.read()def writeImage(self,img,imgName):''' 在當前文件夾下面創建image子文件夾,將圖片寫入本地, :param img: 圖片數據 :param imgName: 圖片名稱 :return: '''folderName = os.path.join(os.path.abspath(os.curdir),"image")if not(os.path.isdir(folderName)):os.mkdir(folderName)with open('image/%s' % imgName,'wb') as f:f.write(img)if __name__ == "__main__":url = "http://www.dfenqi.cn/Product/Index"spilder = Spilder(url)html = spilder.loadPage()xpath = "//div[@class='liebiao']/ul/li/div/a/img/@src"imgUrls = spilder.getImageUrls(html,xpath)index = 0for url in imgUrls:index += 1img = spilder.loadImage(url)spilder.writeImage(img,'img%s.jpg' % index)

轉載于:https://www.cnblogs.com/toloy/p/8618007.html

總結

以上是生活随笔為你收集整理的6、通过xpath获取网页数据的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 一本一道久久综合 | 最全aⅴ番号库 | 97se亚洲综合 | 人妖粗暴刺激videos呻吟 | 国产高清一区二区三区 | 96精品在线 | 午夜av不卡 | 超碰在线免费97 | 国产理论在线观看 | 日韩成人免费在线视频 | 欧美成人免费看 | 天天摸天天摸 | 亚洲黄色影院 | 中国一级片在线观看 | 天天草天天干 | 成人免费公开视频 | 日韩精品免费在线 | 日韩成人av网 | 在线观看日本中文字幕 | 国产精品国语自产拍在线观看 | 色就是色综合 | 不卡av在线 | 午夜资源网 | 天天操你 | 免费色视频 | 成人av综合 | 丰满少妇一区二区三区 | 日韩在线观看第一页 | 日韩美女视频 | 黄色av影院| 91蝌蚪91密月 | 在线视频观看你懂得 | 果冻传媒av | 三级全黄做爰在线观看 | 国偷自产av一区二区三区 | 国产尤物视频 | 久久影院国产 | 色综合综合 | 欧美色图视频在线 | av老司机在线观看 | 日韩国产一级 | 伊人久久大香线蕉综合网站 | 久久精品国产99国产精品 | 久久九精品 | 开心综合网 | 国产黄视频网站 | 精品在线免费视频 | 黄色成人av网站 | 91成人精品视频 | 国模精品视频一区二区 | 中文字幕在线观看一区二区三区 | 爱草av| 免费在线不卡av | 日本一区二区三区四区五区 | 日韩黄色网 | 特一级黄色大片 | 国产精品久久久无码一区 | 999这里有精品| 桃花岛影院| 69热在线 | www成人网| 欧美a级肉欲大片xxx | 四川话毛片少妇免费看 | 国产在线播放一区二区 | 国产黄色视 | 在线视频你懂得 | 青久草视频 | 深夜视频在线观看 | 国产夫妻久久 | 久久天堂电影 | 天堂资源中文在线 | 原来神马电影免费高清完整版动漫 | 牛人盗摄一区二区三区视频 | 中文字幕人妻互换av久久 | 免费毛片软件 | 第一色综合 | 成人h动漫精品一区二区 | 成人国产a | 天天综合人人 | www日韩在线 | 国产粉嫩呻吟一区二区三区 | 欧洲亚洲一区二区 | 欧美视频直播网站 | 天天干狠狠爱 | 色先锋资源网 | 中文字幕欧美专区 | 亚洲成人观看 | 亚洲欧美日韩精品在线观看 | 国产精品tv | 亚洲视频黄 | 亚洲精品97久久中文字幕 | 秋霞在线视频观看 | 欧美亚洲久久 | 中文字字幕在线 | 97久久精品人人澡人人爽 | 娇妻之欲海泛舟无弹窗笔趣阁 | 久久免费看片 | 激情综合久久 | 精品日韩一区二区 |