日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

下载天涯的文章

發布時間:2024/6/14 编程问答 48 豆豆
生活随笔 收集整理的這篇文章主要介紹了 下载天涯的文章 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

寫了個下載天涯文章的Python腳本,有點亂,效率很低,單線程,用正則表達式拼起來的。

能簡單的判斷一些是不是作者與網友聊天的帖子,也會有失誤,而且很多!!!!

有時候會卡死,我的解決辦法是重新來一次……汗

# -*- coding: utf-8 -*- import urllib import urllib2 import re,osdef cn(s):return s.decode("utf-8").encode("gbk")def getUrlContent(url):return urllib2.urlopen(url).read()def getFirst(cont):p1 = re.findall('''<div class="bbs-content clearfix">(.+?)</div>''',cont,re.DOTALL)if len(p1)>0:return p1[0]else:return ""def getNextPageUrl(cont):p1 = re.findall('''<a href="(.+?)" class="js-keyboard-next">下頁</a>''',cont)if len(p1)>0:return "http://bbs.tianya.cn"+p1[0]else:return Nonedef getAuthor(cont):p1 = re.findall('''<meta name="author" content="(.+)">''',cont)if len(p1)>0:return p1[0]def getTitle(cont): p1 = re.findall('''<span class="s_title"><span style="font-weight:400;">(.+?)</span>''',cont)if len(p1)>0:return p1[0]def getOnePage(cont,author,fp):t=""n=0#print contp='''<div class="atl-item".+?uname="(.+?)">.+?<span>(時間.+?)</span>.+?<div class="bbs-content">(.+?)</div>'''p1 = re.findall(p,cont,re.S)#print p1if len(p1)>0:for t in p1:if t[0]==author:if re.findall("[^-]+?-----------------------------[^-]*?",t[2])==[] and len(t[2])>512:fp.writelines("<hr/>%s<br/>%s"%(t[1],t[2]))def main(url):n=0author=""print urlcont=getUrlContent(url)if cont<0:returnprint 'open OK'author=getAuthor(cont)if author<0:print "url error"returntitle = getTitle(cont)if author<0:print "url error"returntime=re.findall("<span>(時間:.+?)</span>",cont)[0]print 'title:',cn(title)print 'author:',cn(author)print 'time:',cn(time)while 1:if n>0:fn="%s[%d].htm"%(cn(title),n)else:fn="%s.htm"%cn(title)if os.path.isfile(fn):print "File %s already exists!"%fnn=n+1else:breakfp=open(fn,'w')fp.writelines('''<html><head><meta charset="utf-8"/><title>%s</title></head><body>'''%(title))fp.writelines("【%s】<br/>【%s】\n<hr/>%s<br/>"%(title,author,time))fp.writelines(getFirst(cont))n=1while 1:print "page:%d"%ngetOnePage(cont,author,fp)url=getNextPageUrl(cont)if url!=None:cont=getUrlContent(url)n=n+1else:breakfp.writelines('''</body></html>''')fp.close()print "download ok"if __name__ == '__main__':url=raw_input('input url:')main(url)

  

轉載于:https://www.cnblogs.com/fwindpeak/p/3369383.html

總結

以上是生活随笔為你收集整理的下载天涯的文章的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: www黄色片| 国产色91 | 国内外免费激情视频 | 天天干天天舔天天射 | 懂色av蜜臀av粉嫩av喷吹 | 亚洲精品一级二级 | 青草操 | 精品黄色片 | 另类激情亚洲 | 亚洲欧美在线免费观看 | 视频一区在线免费观看 | 中文字幕av片 | 91一区二区在线 | 伊伊成人 | 3d动漫精品啪啪一区二区竹菊 | 日本一级大毛片a一 | 日本欧美中文字幕 | 午夜插插 | 国产精品一区二三区 | 国产aⅴ爽av久久久久成人 | 亚洲精品.www | 日韩精品中文字幕一区 | 女教师三上悠亚ssni-152 | julia一区二区三区中文字幕 | 欧美高跟鞋交xxxxxhd | 午夜寂寞少妇 | 5级黄色片| 大色av| 日韩午夜小视频 | 99久久99久久免费精品蜜臀 | 看了让人下面流水的视频 | 国产又粗又猛又黄又爽视频 | 九九这里只有精品视频 | 四虎影院www | 欧美精品一区二区三区四区五区 | 国产无套内射又大又猛又粗又爽 | 三上悠亚一区二区在线观看 | 又爽又黄视频 | 亚洲AV无码成人精品一区 | 国av在线| 日本少妇喷水 | 丁香一区二区三区 | 日本性视频网站 | 亚洲久久色 | 午夜时刻免费入口 | 深夜福利麻豆 | 亚洲综合在线第一页 | 熟妇高潮一区二区 | 成人三级在线播放 | 波多野结衣成人在线 | 欧美视频免费 | 男人的天堂99| 久久久中文 | 日韩片在线观看 | 国产精品一区二区6 | 国产三级漂亮女教师 | 韩国bj大尺度vip福利网站 | 久久久久久五月天 | av资源网在线观看 | 91看片就是不一样 | 免费处女在线破视频 | av毛片在线免费看 | 精品人妻人伦一区二区有限公司 | 日本在线精品 | 麻豆国产一区二区三区四区 | 夜夜精品一区二区无码 | 日日爱夜夜操 | 国产精品日本一区二区在线播放 | 国产深夜福利在线 | 少妇高潮av久久久久久 | 黄色777| 国产精品一二区 | 国产美女黄色 | xxx69美国 | 少妇中出视频 | 西西44rtwww国产精品 | 成人黄色免费看 | 国产色婷婷一区二区三区竹菊影视 | 亚洲伦理网 | 3o一40一50一6o女人毛片 | 亚洲青涩在线 | 日本一区不卡在线 | 大乳女喂男人吃奶视频 | 国产99999| 欧美另类极品videosbest最新版本 | 超黄网站在线观看 | 91一起草| 日本视频色 | 国产91丝袜在线观看 | 男女又爽又黄 | 亚洲偷拍一区 | av大全免费| 另类激情亚洲 | 亚洲国产毛片aaaaa无费看 | 91精品婷婷国产综合久久蝌蚪 | 天天干天天干天天 | 日本黄色视屏 | 欧美无吗 | 欧美精品一区二区蜜臀亚洲 |