Python -bs4反爬虫解决方法
生活随笔
收集整理的這篇文章主要介紹了
Python -bs4反爬虫解决方法
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
爬蟲有時會遭遇兩種情況,導致無法正常爬取
(1)IP封鎖,(貌似美團會出現(xiàn))
(2)禁止機器人爬取,(比如Amazon)
解決方法:
我們以下面文章里的爬蟲代碼為例
http://blog.csdn.net/co_zy/article/details/77150544
其中的getHTMLText()函數(shù),更改如下,添加fakeHeaders ,proxies
這里的可以通過ip測試網(wǎng)站進行驗證是否成功使用了代理 http://ip.chinaz.com/
總結(jié)
以上是生活随笔為你收集整理的Python -bs4反爬虫解决方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python-爬取2345电影并写入文件
- 下一篇: Python-爬取音悦台MV列表以及反爬