日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

博客搬家算法伪码

發(fā)布時(shí)間:2023/12/13 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 博客搬家算法伪码 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
已有平臺(tái):CSDN博客、51CTO、博客園、WordPress


不同平臺(tái)的博客,數(shù)據(jù)解析方式不一樣,數(shù)據(jù)抓取和存儲(chǔ)都是類似的。


1.確定博客首頁地址

? a.平臺(tái)地址

? 比如,CSDN的博客地址是?http://blog.csdn.net/

? b.賬號(hào)

? ?fansunion

? ?

? CSDN某個(gè)用戶的地址是:http://blog.csdn.net/FansUnion


2. 從首頁獲得關(guān)鍵信息


? 2.1獲得博客分類列表


??

? 新人畢業(yè)-老人跳槽(24)?

? OpenJDK源碼研究筆記(16)?

? 性能優(yōu)化(11)?

? 中國(guó)象棋(13)?

??

? List<String> 存儲(chǔ)所有的文章分類,保存到數(shù)據(jù)庫(kù)中

? addArticleCategory(Integer userId,List<String> categoryList);

??

? 創(chuàng)建所有的日志分類(id自增,name)

??

? ? 2.2確定日志的頁數(shù)

? ?CSDN的"431條數(shù)據(jù) 共9頁"

? ?獲取到“9” pageCount

? ?

3.獲取日志集合???

? 3.1確定日志列表的地址

? ?比如CSDN的日志格式是:http://blog.csdn.net/FansUnion/article/list/2

??

??

? 3.2遍歷所有的文章列表

? ? for(int index=0;index<pageCount;index++){

??解析該頁的日志地址,比如CSDN的格式是“?http://blog.csdn.net/fansunion/article/details/17070151”

}

所有的日志地址集合

List<String> articleList;

4.遍歷所有的文章

? for(int index=;index<articleList.size;index++){

??抓取每1篇日志的字段數(shù)據(jù),

??

??Article:標(biāo)題、內(nèi)容、摘要、時(shí)間、性質(zhì)(原創(chuàng)、轉(zhuǎn)載、翻譯)

??

??保存到數(shù)據(jù)庫(kù)中

??addArticle(Article);

??

? }

原文首發(fā):http://fansunion.cn/article/detail/59.html
?

轉(zhuǎn)載于:https://www.cnblogs.com/qitian1/p/6463155.html

總結(jié)

以上是生活随笔為你收集整理的博客搬家算法伪码的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。