當前位置：首頁 > 编程语言 > python >内容正文

python

Python 爬取斗图啦图片

發布時間：2024/4/13 python 31 豆豆

生活随笔收集整理的這篇文章主要介紹了 Python 爬取斗图啦图片小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

斗圖啦

requests

BeautifulSoup4

代碼

# -*- coding:utf-8 -*- # pip install requests 框架 import requests # pip install beautifulsoup4 框架 # pip install lxml 解析器 from bs4 import BeautifulSoup import osclass doutuSpider(object):headers = {"user-agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36"}def get_url(self, url):data = requests.get(url, headers=self.headers)soup = BeautifulSoup(data.content, 'lxml')totals = soup.findAll("a", {"class": "list-group-item"})for one in totals:sub_url = one.get('href')global pathpath = 'E:\\img' + '\\' + sub_url.split('/')[-1]os.mkdir(path)try:self.get_img_url(sub_url)except:passpasspassdef get_img_url(self, url):data = requests.get(url, headers = self.headers)soup = BeautifulSoup(data.content, 'lxml')totals = soup.findAll('div', {'class': 'artile_des'})for one in totals:img = one.find('img')try:sub_url = img.get('src')except Exception as e:raise efinally:urls = sub_urltry:self.get_img(urls)except:print urlspasspasspassdef get_img(self, url):filename = url.split('/')[-1]global pathimg_path = path + '\\' + filenameimg = requests.get(url, headers = self.headers)try:with open(img_path, 'wb') as f:f.write(img.content)except:passpassdef create(self):for count in range(1,10):url = 'https://www.doutula.com/article/list/?page={}'.format(count)print 'download {} page'.format(count)self.get_url(url)passpassif __name__ == '__main__':doutu = doutuSpider()doutu.create() 超強干貨來襲云風專訪：近40年碼齡，通宵達旦的技術人生

總結

以上是生活随笔為你收集整理的Python 爬取斗图啦图片的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： YAML基础知识及搭建一台简洁版gues
下一篇： websocket python爬虫_p