日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python3爬虫——模拟登录丁香园并提取信息

發布時間:2024/1/8 python 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python3爬虫——模拟登录丁香园并提取信息 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

上一篇:模擬登錄QQ郵箱

ps:在進行模擬登錄時,輸入賬號密碼后,會彈出驗證碼,目前還沒有解決模擬驗證,所以本教程需要進行人工驗證。

代碼:

from selenium import webdriver import time from lxml import etree#模擬登陸丁香園網站 browser = webdriver.Firefox() browser.get('https://auth.dxy.cn/accounts/login?service=http://www.dxy.cn/bbs/thread/626626') time.sleep(1) browser.find_element_by_xpath('//*[@paneid="j_loginTab2"]').click() time.sleep(5) browser.find_element_by_name('username').send_keys('丁香園網站賬號') time.sleep(6) browser.find_element_by_name('password').send_keys('丁香園網站密碼') time.sleep(3) browser.find_element_by_xpath('//button[@class= "button"]').click() time.sleep(18)#得到所需得到的信息 url = browser.current_url #得到當前網址 browser.get(url) html = browser.page_source #得到頁面的html tree = etree.HTML(html) xpath_auth="//div[@class= 'auth']/a/text()" xpath_level ="//div[@class='user-level-area']" xpath_score_vote_dingdang="//div[@class='num']/a/text()" xpath_contect="//td[@class= 'postbody']"re_auth = tree.xpath(xpath_auth) re_content = tree.xpath(xpath_contect) re_three =tree.xpath(xpath_score_vote_dingdang) re_level=tree.xpath(xpath_level)#將提取到的信息打印出來 i =1 for auth,content,level in zip(re_auth,re_content,re_level):print('作者:'+auth,' 級別:'+level.xpath('string(.)'),' 內容:'+content.xpath('string(.)').strip(),end=' ')print('積分:'+re_three[i],' 得票:'+re_three[i+1],' 丁當:'+re_three[i+2]+'\n')i = i+1```

總結

以上是生活随笔為你收集整理的python3爬虫——模拟登录丁香园并提取信息的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。