python登录网站 爬虫_Python爬虫如何使用Cookies登录网站
最近搞到了一個學校教務系統可以查詢全校成績的賬號,恰逢申請獎學金之際,就想用python寫個腳本把年級里的績點排名給爬下來,可是就在寫登錄的時候發現還是要處理驗證碼登錄的問題,為了避免麻煩,就沒使用類似pytester的識別庫,使用了一個比較討巧的方法:
Cookies:
cookies是用戶在登錄之后登錄網站發送給瀏覽器的一小段文本,其中記錄著你的登錄信息,不過不用擔心安全問題,瀏覽器一般會幫你把cookies保護起來而且這段文本是經過加密,平常人看來就是一堆亂碼。比如這樣:
當然,學過前端的朋友應該都是知道的,不過cookies一般是被瀏覽器給保護起來不讓看的(比如說Safari...) 這時候我們就要利用抓包的方法把cookies給抓下來了:
對于用Win朋友來說可以直接用Chrome然后按F12打開Internet,在登錄后刷新頁面,尋找cookies,但是Chrome對于一些網站的兼容性比較差,所以建議用Firefox瀏覽器安裝Firebug插件來查詢,安裝完插件之后登錄完網站,然后單擊右上角的插件就發現可以找到cookies信息了:
Like this
接下來就是代碼的具體實現了,只有使用cookies登錄的部分,不涉及其他腳本代碼:
基于Python2.X的代碼
最后:
使用cookies登錄簡直是要比傳統的寫用戶名密碼登錄的方法爽了不知多少,基于這個方法自己寫的選課腳本也是代碼量驟減,最后要注意cookies是有一定時間限制的,這算是一個比較討巧的方法,用過一次之后就知道有多方便啦~
總結
以上是生活随笔為你收集整理的python登录网站 爬虫_Python爬虫如何使用Cookies登录网站的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vivo X Fold2跑分曝光!安兔兔
- 下一篇: websocket python爬虫_p