日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

生成的头_Python爬虫偷懒神器!快速一键生成Python爬虫请求头

發布時間:2025/3/8 python 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 生成的头_Python爬虫偷懒神器!快速一键生成Python爬虫请求头 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

今天介紹個神奇的網站!堪稱爬蟲偷懶的神器!

我們在寫爬蟲,構建網絡請求的時候,不可避免地要添加請求頭( headers ),以 mdn 學習區為例,我們的請求頭是這樣的:

一般來說,我們只要添加 user-agent 就能滿足絕大部分需求了,Python 代碼如下:

import requestsheaders = {#'authority': 'developer.mozilla.org',#'pragma': 'no-cache',#'cache-control': 'no-cache',#'upgrade-insecure-requests': '1','user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36',#'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',#'accept-encoding': 'gzip, deflate, br',#'accept-language': 'zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6',#'cookie': 你的cookie, }response = requests.get('https://developer.mozilla.org/zh-CN/docs/learn', headers=headers)

但是有些請求,我們要把特定的 headers 參數添加上才能獲得正確的網絡響應,不知道哪個參數是必要的情況下,就要先把所有參數都添加上,再逐個排除。

但是手動復制粘貼 headers 字典里的每一個鍵值對太費事了

成長離不開與優秀的同伴共同交流,如果你需要好的學習環境,好的學習資源,這里歡迎每一位熱愛Python的小伙伴

一個不那么方便的解決方案:

用正則表達式或者直接字符串替換,把 headers 字符串直接轉化為字典,封裝成函數方便以后反復調用。

有的人喜歡用這種方法,每次復制headers信息,然后調用自己封裝好的函數,但我覺得還是挺麻煩的。

那么還有沒有快速一鍵生成 Python 爬蟲請求頭的方法呢?

這里給大家介紹兩個:

  • 網站在線轉換
  • Postman

實戰演練

抓取網站:https://developer.mozilla.org...

網站在線轉換

1,Chrome 打開開發者選項( f12 )---> network 選項卡 ---> 刷新頁面,獲取請求 ---> 找到頁面信息對應的請求 (通過請求的名稱、后綴和 response 內容來判斷)

2,右鍵,copy ---> copy as cURL (bash),注意不是【copy as cURL (cmd)】

3,打開網站,https://curl.trillworks.com/,粘貼 cURL (bash) 到左邊 curl command,右邊會自動出 Python 代碼

4,生成代碼如下圖

5,print ( response.text ) 就可以直接打印網頁源代碼啦!

Postman

1,下載 postman ( Chrome 也有個 postman 的插件,操作應該差不多)

2,打開 postman,彈出的界面可以直接關掉

3,import --> paste raw text,在 Chrome 里復制 curl (bash),粘貼到下面的對話框里,點擊 import 按鈕

4,點擊 send,模擬網絡請求,下方可查看源代碼

5,確保源代碼正常后,點擊 code

6,左上角可以選擇編程語言,右上角復制到剪貼板

大功告成!

其實我本人平時都是用第一種,網站比較穩定,基本沒出現過異常;有了這個神器就不用自己再構造請求頭了,先一鍵生成,然后再根據需求調一調就好了,幾秒鐘就搞定了。

總結

以上是生活随笔為你收集整理的生成的头_Python爬虫偷懒神器!快速一键生成Python爬虫请求头的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。