日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

java爬取小说

發(fā)布時間:2025/3/12 编程问答 18 豆豆
生活随笔 收集整理的這篇文章主要介紹了 java爬取小说 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

使用Java爬取網(wǎng)站:http://www.shicimingju.com的小說內(nèi)容

代碼詳解
1.在本地創(chuàng)建存儲位置
2.編寫正則表達式
3.循環(huán)獲取內(nèi)容
4.把內(nèi)容存入文件夾中
5.判斷成功或失敗

效果演示

代碼展示

package text;import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.File;import java.io.FileOutputStream;import java.io.InputStreamReader;import java.io.OutputStreamWriter;import java.net.URL;import java.util.regex.Matcher;import java.util.regex.Pattern;public class text {public static void main(String[] args) {//創(chuàng)建文件存放內(nèi)容File file = new File("D:\\Text\\text.txt");//正則表達式String regex_content = "<p.*?>(.*?)</p>";String regex_title = "<title>(.*?)</title>";Pattern p_content = Pattern.compile(regex_content);Pattern p_title = Pattern.compile(regex_title);Matcher m_content;Matcher m_title;//循環(huán)獲取內(nèi)容for (int i = 1; i <= 120; i++) {System.out.println("第" + i + "章開始下載。。。");try {URL url = new URL("http://www.shicimingju.com/book/sanguoyanyi/" + i+ ".html");BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream(), "utf8"));String str = null;BufferedWriter writer = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(file, true)));while ((str = reader.readLine()) != null) {m_title = p_title.matcher(str.toString());m_content = p_content.matcher(str.toString());boolean isEx = m_title.find();if (isEx) {String title = m_title.group();title = title.replace("<title>", "").replace("</title>", "");System.out.println(title);writer.write("第" + i + "章:" + title + "\n");}while (m_content.find()) {String content = m_content.group();content = content.replace("<p>", "").replace("</p>", "").replace("&nbsp;", "").replace("?", "");//存內(nèi)容writer.write(content + "\n");}}System.out.println("第" + i + "章下載完成.........");writer.write("\n\n");writer.close();reader.close();} catch (Exception e) {System.out.println("很遺憾,本次下載失敗!!!");e.printStackTrace();}}}}

了解更多關(guān)注我喲!!!

總結(jié)

以上是生活随笔為你收集整理的java爬取小说的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。