日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

一个简单粗暴的爬虫 - 必应今日美图

發布時間:2025/7/14 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 一个简单粗暴的爬虫 - 必应今日美图 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1. 必應今日美圖

當使用bing搜索時,每天都會出現一副美圖。

搜索找到bing今日美圖??http://bing.plmeizi.com/?(這里收集了一年多的今日美圖) 收集者:?http://leil.plmeizi.com/?

目前共47頁

url格式按?http://bing.plmeizi.com/?page=*

?

?點進去就是我們要的名稱和名稱

2. 開始編碼

使用簡單的Jsoup進行爬蟲,很簡單,很好理解。

HtmlUtil

1 package util; 2 3 import java.io.IOException; 4 5 import org.jsoup.Jsoup; 6 import org.jsoup.nodes.Document; 7 8 public class HtmlUtil { 9 // 根據url從網絡獲取網頁文本 10 public Document getHtmlTextByUrl(String url) { 11 Document doc = null; 12 try { 13 // doc = Jsoup.connect(url).timeout(5000000).get(); 14 int i = (int) (Math.random() * 1000); // 做一個隨機延時,防止網站屏蔽 15 while (i != 0) { 16 i--; 17 } 18 doc = Jsoup.connect(url).data("query", "Java").userAgent("Mozilla").cookie("auth", "token").timeout(300000) 19 .post(); 20 } catch (IOException e) { 21 e.printStackTrace(); 22 try { 23 doc = Jsoup.connect(url).timeout(5000000).get(); 24 } catch (IOException e1) { 25 // TODO Auto-generated catch block 26 e1.printStackTrace(); 27 } 28 } 29 return doc; 30 } 31 }

GetPhoto

這個編碼主要需要先分析html屬性,按照屬性取到我們需要的元素,元素值。

我是先拿到每個圖的page頁面url

然后到詳情頁面拿到圖的url,圖的名字截取。

然后將圖保存到本地。

1 package bing; 2 3 import java.io.DataInputStream; 4 import java.io.File; 5 import java.io.FileOutputStream; 6 import java.io.IOException; 7 import java.net.URL; 8 9 import org.jsoup.nodes.Document; 10 import org.jsoup.nodes.Element; 11 import org.jsoup.select.Elements; 12 13 import util.HtmlUtil; 14 15 /** 16 * 17 * @author loveincode 18 * @data Sep 29, 2017 1:15:00 PM 19 */ 20 public class GetPhoto { 21 22 public static void go(int startpage, int endpage) throws IOException { 23 24 HtmlUtil htmlutil = new HtmlUtil(); 25 // 獲取圖片的絕對路徑 26 String url = "http://bing.plmeizi.com/?page="; 27 for (int i = startpage; i <= endpage; i++) { 28 String gourl = url + i + ""; 29 Document dochtml = htmlutil.getHtmlTextByUrl(gourl); 30 Elements elements_a = dochtml.getElementsByClass("item"); 31 for (int x = 0; x < elements_a.size(); x++) { 32 String pyotopage = elements_a.get(x).attr("href"); 33 Document dochtml_photo = htmlutil.getHtmlTextByUrl(pyotopage); 34 Element elements_picurl = dochtml_photo.getElementById("picurl"); 35 String picurl = elements_picurl.attr("href"); 36 Element elements_searchlink = dochtml_photo.getElementById("searchlink"); 37 String name = elements_searchlink.getElementsByTag("span").get(0).html(); 38 name = name.split("\\(")[0]; 39 40 if (picurl.contains("jpg")) { 41 // 下載圖片 42 URL url_pic = new URL(picurl); 43 DataInputStream dataInputStream = new DataInputStream(url_pic.openStream()); 44 String imageName = name + ".jpg"; 45 FileOutputStream fileOutputStream = new FileOutputStream(new File("bing_pic/" + imageName)); 46 byte[] buffer = new byte[1024]; 47 int length; 48 while ((length = dataInputStream.read(buffer)) > 0) { 49 fileOutputStream.write(buffer, 0, length); 50 } 51 dataInputStream.close(); 52 fileOutputStream.close(); 53 } 54 } 55 } 56 57 } 58 59 public static void main(String[] args) throws IOException { 60 System.out.println("test"); 61 go(1, 1); 62 } 63 64 }

Mythread

1 package bing; 2 3 import java.io.IOException; 4 5 public class Mythread extends Thread { 6 7 private int startpage; 8 9 private int endpage; 10 11 public Mythread(int startpage, int endpage) { 12 this.startpage = startpage; 13 this.endpage = endpage; 14 } 15 16 @SuppressWarnings("static-access") 17 @Override 18 public void run() { 19 GetPhoto getPhoto = new GetPhoto(); 20 try { 21 getPhoto.go(startpage, endpage); 22 } catch (IOException e) { 23 // TODO Auto-generated catch block 24 e.printStackTrace(); 25 } 26 } 27 }RUN

RUN

采用多線程,開啟多個線程同時爬取圖片

1 package bing; 2 3 import java.io.IOException; 4 5 /** 6 * 7 * @author loveincode 8 * @data Sep 29, 2017 1:55:57 PM 9 */ 10 public class RUN { 11 12 public static void main(String[] args) throws IOException { 13 14 long startTime = System.currentTimeMillis(); // 獲取開始時間 15 16 Mythread a1 = new Mythread(1, 5); 17 Mythread a2 = new Mythread(6, 10); 18 Mythread a3 = new Mythread(11, 15); 19 Mythread a4 = new Mythread(16, 20); 20 Mythread a5 = new Mythread(21, 25); 21 Mythread a6 = new Mythread(26, 30); 22 Mythread a7 = new Mythread(31, 35); 23 Mythread a8 = new Mythread(36, 40); 24 Mythread a9 = new Mythread(41, 45); 25 Mythread a10 = new Mythread(46, 47); 26 27 a1.start(); 28 a2.start(); 29 a3.start(); 30 a4.start(); 31 a5.start(); 32 a6.start(); 33 a7.start(); 34 a8.start(); 35 a9.start(); 36 a10.start(); 37 38 while (true) { 39 if (a1.isAlive() == false && a2.isAlive() == false && a3.isAlive() == false && a4.isAlive() == false 40 && a5.isAlive() == false && a6.isAlive() == false && a7.isAlive() == false && a8.isAlive() == false 41 && a9.isAlive() == false && a10.isAlive() == false) { 42 long endTime = System.currentTimeMillis(); // 獲取結束時間 43 System.out.println("程序運行時間: " + (endTime - startTime) / 1000.0 + "s"); 44 break; 45 } 46 } 47 } 48 49 }

執行 RUN?

耗時76.962s 完成圖片下載到本地。

成功

效果:

很高清吧

?

轉載于:https://www.cnblogs.com/loveincode/p/jsoup_bingpic.html

總結

以上是生活随笔為你收集整理的一个简单粗暴的爬虫 - 必应今日美图的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 亚洲免费色图 | 青草99 | 久久久国产一区二区三区 | 日韩女人性猛交 | 免费看污视频的网站 | 国产综合视频在线 | 欧美日韩免费观看一区=区三区 | 久99热 | 久久久久亚洲av无码专区桃色 | 岛国裸体写真hd在线 | 日韩中文字幕 | 国产二区三区视频 | 在线观看中文字幕第一页 | 韩国19主播内部福利vip | youjizz麻豆 | 欧美嫩草 | 国产人妖ts重口系列网站观看 | 日本捏奶吃奶的视频 | 九一精品在线 | 国产裸体舞一区二区三区 | 9l视频自拍九色9l视频成人 | 亚洲成人伊人 | 久久伊人一区 | 亚洲熟乱 | av网站在线免费播放 | 男生吃小头头的视频 | 男人操女人的视频 | 久久精品国产亚洲av麻豆色欲 | 色婷婷综合久久久久中文 | 极品久久久 | 午夜影院体验区 | 玖玖爱av| brazzers欧美大波霸 | 国产拍拍拍拍拍拍拍拍拍拍拍拍拍 | 天天干天天操天天碰 | 极品超粉嫩尤物69xx | 超碰人体 | 色啊色| 亚洲欧美高清视频 | 欧美久久久久久又粗又大 | 欧美成人午夜视频 | 欧美一区二区三区成人精品 | 一区二区三区视频在线 | 欧洲女性下面有没有毛发 | 欧美肥妇bwbwbwbxx | 韩国性猛交╳xxx乱大交 | 精品福利一区 | 久久99久久99精品免观看软件 | av波多野吉衣 | 国产深喉视频一区二区 | 少妇精品无码一区二区三区 | 超级碰在线视频 | 中国一级特黄真人毛片免费观看 | 黄网在线免费观看 | 亚洲国产精品视频一区 | 国产一区激情 | 亚洲国产成人av | 久久黄网 | 国产精品无码久久av | 快播久久| 久久久久国产视频 | 亚洲自拍偷拍一区二区三区 | 亚洲精品国产精品国自产观看浪潮 | 国产成人一区二区三区电影 | 在线爽| 吻胸摸激情床激烈视频大胸 | 好吊视频在线观看 | 国产精品卡一卡二 | 无码人妻精品一区二区蜜桃网站 | av先锋在线| 五月综合激情网 | 国产精品中文久久久久久 | 九九热精品视频在线 | 日本强好片久久久久久aaa | 特级淫片aaaaaaa级附近的 | 国产69精品久久久久久久 | 影音先锋蜜桃 | 色姐| 亚州男人天堂 | 国产一区二区三区四区五区美女 | 国产欧美精品一区 | 亚洲国产毛片aaaaa无费看 | 与子敌伦刺激对白播放的优点 | 中文字字幕一区二区三区四区五区 | 国产综合av| 亚洲成人偷拍 | 91av免费| 中文字幕第80页 | 美女扒开腿让男生捅 | 久久日本精品字幕区二区 | 国产欧美日韩综合精品一区二区三区 | 久久人| 国产喷水吹潮视频www | 欧美日韩在线视频免费观看 | 伊人色在线 | 色婷婷久久久亚洲一区二区三区 | 黄黄的网站 | 亚洲av人人澡人人爽人人夜夜 | 99久久久无码国产精品衣服 |