日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 运维知识 > windows >内容正文

windows

网络爬虫(一):配置selenium、pycharm(windows平台)

發(fā)布時間:2025/3/19 windows 47 豆豆
生活随笔 收集整理的這篇文章主要介紹了 网络爬虫(一):配置selenium、pycharm(windows平台) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

最近在學(xué)習(xí)爬蟲的編寫,使用selenium模塊時候,遇到了很多坑,本blog的目的是總結(jié)一下遇到的坑和解決辦法,以便后來人少走彎路!

以下介紹均以Python3.x為基準(zhǔn)進(jìn)行,基于windows平臺的。

1. Selenium配置

我們在做爬蟲的時候,避免不了要使用selenium模塊,但是它不是python的標(biāo)準(zhǔn)庫,所以需要自行安裝。
那么如何安裝selenium呢,這時候就用到了pip這個工具。

1. 首先我們需要下載pip:

所謂pip,即Python Install Packet(python安裝包)。

  • pip下載地址

2. 然后我們解壓下載的pip,打開cmd命令控制臺,cd到剛才解壓的目錄:

可以看到,python不是內(nèi)部命令,執(zhí)行失敗;這是由于python的可執(zhí)行文件路徑?jīng)]有加入到windows的環(huán)境變量里。

3. 設(shè)置環(huán)境變量:

按照如下的順序:

計算機(jī) -> 屬性 -> 高級系統(tǒng)設(shè)置 -> 高級 -> 環(huán)境變量 -> path





將python.exe所在路徑添加到path中(注意,不同路徑間的隔離使用;)

4. 驗證pip是否安裝成功

使用如下命令(使用此命令之前,同樣需要將pip所在的目錄加入到環(huán)境變量中,默認(rèn)的pip路徑為python.exe同目錄文件夾Scripts下):

  • pip list

5. 安裝selenium模塊

采用如下命令:

  • pip install selenium

至此,selenium模塊算是安裝完成了

6. 配置selenium使其支持不同瀏覽器

開發(fā)中,我們一般采用chrome或firefox,因此我以這兩款為準(zhǔn)進(jìn)行講解。
當(dāng)我們安裝完成selenium模塊,準(zhǔn)備使用其進(jìn)行編碼時,突然發(fā)現(xiàn),又有問題出現(xiàn)了:


發(fā)生以上原因是因為: 缺少Chrome/Firefox的webdriver驅(qū)動。

驅(qū)動的下載地址:

  • Chrome/Firefox webdriver github 地址
  • 該地址下有所有的IE/Chrome/Firefox webdriver

將下載好的驅(qū)動解壓,然后放到與python.exe同一個目錄中;

到此處,你可以試試如下代碼:

# coding = utf-8 from time import sleep from selenium import webdriverbrowser = webdriver.Firefox()browser.get(r"http://www.baidu.com") browser.find_element_by_id("kw").send_keys("python") browser.find_element_by_id("su").click() sleep(5) browser.quit()

將會打開一個新的firefox窗口,算是selenium配置成功。

2. Pycharm 2017.3破解與使用

Pycharm是玩python、web開發(fā)、爬蟲等等必不可少的工具,其優(yōu)秀性不必多言,誰用誰知道!

1. 下載并安裝 Pycharm2017

  • Pycharm 2017下載地址


安裝不用多說了吧!

2. 破解pycharm


進(jìn)入Pycharm, 點(diǎn)擊Help -> Register

然后,去下載一個破解軟件:

  • idea_active_proxy.exe

按照下圖進(jìn)行設(shè)置:

輸入完成后,點(diǎn)擊Active,一切都o(jì)k了!

另外,破解的專業(yè)網(wǎng)站地址:

  • Pycharm 破解教程

3. 注冊完成后,我們將開始我們第一個項目:

# coding = utf-8 from time import sleep from selenium import webdriverbrowser = webdriver.Firefox()browser.get(r"http://www.baidu.com") browser.find_element_by_id("kw").send_keys("python") browser.find_element_by_id("su").click() sleep(5) browser.quit()

運(yùn)行過程中,可能會出現(xiàn)如下的錯誤:

雖然我們安裝了selenium,但是Pycharm找不到這個模塊(包),這怎么回事呢?
原因就是我們使用的python 解釋器的問題(未使用系統(tǒng)默認(rèn)的解釋器)

可做如下修改:

  • File -> Settings -> Project coding -> Project interpreter

選擇所需要的Python解釋器。

如下拉列表中沒有對應(yīng)的系統(tǒng)Python解釋器,我們可以自己添加:


設(shè)置完以上之后,重新回到代碼區(qū)運(yùn)行上述代碼,一切都o(jì)k了!

至此,大功告成!!!

轉(zhuǎn)載于:https://www.cnblogs.com/Jimmy1988/p/8398507.html

總結(jié)

以上是生活随笔為你收集整理的网络爬虫(一):配置selenium、pycharm(windows平台)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。