日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

python爬虫第一课 开发环境配置

發(fā)布時間:2023/12/10 python 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python爬虫第一课 开发环境配置 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

一、Python3的安裝

二、請求庫的安裝

1、requests的安裝

直接pip安裝:pip3 install requests

2、Selenium的安裝

selenium是一個自動測試化工具,利用它我們可以驅(qū)動瀏覽器執(zhí)行特定的動作,如點(diǎn)擊、下拉等操作。

直接pip安裝:pip install selenium

3、ChromeDriver的安裝

首先下載Chrome瀏覽器,并記住Chrome的版本號。然后下載ChromDriver,下載完成之后需要進(jìn)行環(huán)境變量的配置,直接將chromedriver.exe復(fù)制到python的Scripts目錄下。

當(dāng)然,可以在命令行下進(jìn)行驗(yàn)證:chromedriver。

4、PhantomJS的安裝

百度下載安裝包之后,將其exte文件放在python3的Scripts目錄下,安裝之后進(jìn)行在命令行下進(jìn)行測試:phantomjs。

5、aiohttp的安裝

直接進(jìn)行 pip3 install aiohttp

此外同時推薦安裝兩個庫,一個是字符編碼檢測庫cchardet,另一個是加速DNS的解析庫aiodns。

直接進(jìn)行 pip3 install cchardet aiodns

三、解析庫的安裝

1、lxml的安裝

直接進(jìn)行 pip install lxml

lxml是python的一個解析庫,支持HTML和XML的解析,支持XPath的解析方式,而且解析效率非常高。

2、Beautiful Soup的安裝

Beautiful Soup是python的HTML或XML的解析庫,可以用來方便的從網(wǎng)頁上提取數(shù)據(jù)。注意:Beautiful Soup的HTML和XML的解析器是依賴于lxml庫的。

3、pyquery的安裝

同樣是一個強(qiáng)大的網(wǎng)頁解析工具,它提供了和jQuery類似的語法來解析HTML文檔,支持CSS選擇器,使用非常方便。

直接進(jìn)行 pip3 install pyquery?

4、tessserocr的安裝

--------------待續(xù)。。。

總結(jié)

以上是生活随笔為你收集整理的python爬虫第一课 开发环境配置的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。