日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人文社科 > 生活经验 >内容正文

生活经验

Python:Scrapy的settings

發布時間:2023/11/28 生活经验 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python:Scrapy的settings 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Settings

Scrapy設置(settings)提供了定制Scrapy組件的方法。可以控制包括核心(core),插件(extension),pipeline及spider組件。比如 設置Json Pipeliine、LOG_LEVEL等。

參考文檔:http://scrapy-chs.readthedocs.io/zh_CN/1.0/topics/settings.html#topics-settings-ref

內置設置參考手冊

  • BOT_NAME

    • 默認: 'scrapybot'

    • 當您使用 startproject 命令創建項目時其也被自動賦值。

  • CONCURRENT_ITEMS

    • 默認: 100

    • Item Processor(即 Item Pipeline) 同時處理(每個response的)item的最大值。

  • CONCURRENT_REQUESTS

    • 默認: 16

    • Scrapy downloader 并發請求(concurrent requests)的最大值。

  • DEFAULT_REQUEST_HEADERS

    • 默認: 如下

      {
      'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
      'Accept-Language': 'en',
      }
      

      Scrapy HTTP Request使用的默認header。

  • DEPTH_LIMIT

    • 默認: 0

    • 爬取網站最大允許的深度(depth)值。如果為0,則沒有限制。

  • DOWNLOAD_DELAY

    • 默認: 0

    • 下載器在下載同一個網站下一個頁面前需要等待的時間。該選項可以用來限制爬取速度, 減輕服務器壓力。同時也支持小數:

    DOWNLOAD_DELAY = 0.25 # 250 ms of delay

    • 默認情況下,Scrapy在兩個請求間不等待一個固定的值, 而是使用0.5到1.5之間的一個隨機值 * DOWNLOAD_DELAY 的結果作為等待間隔。
  • DOWNLOAD_TIMEOUT

    • 默認: 180

    • 下載器超時時間(單位: 秒)。

  • ITEM_PIPELINES

    • 默認: {}

    • 保存項目中啟用的pipeline及其順序的字典。該字典默認為空,值(value)任意,不過值(value)習慣設置在0-1000范圍內,值越小優先級越高。

      ITEM_PIPELINES = {
      'mySpider.pipelines.SomethingPipeline': 300,
      'mySpider.pipelines.ItcastJsonPipeline': 800,
      }
      
  • LOG_ENABLED

    • 默認: True

    • 是否啟用logging。

  • LOG_ENCODING

    • 默認: 'utf-8'

    • logging使用的編碼。

  • LOG_LEVEL

    • 默認: 'DEBUG'

    • log的最低級別。可選的級別有: CRITICAL、 ERROR、WARNING、INFO、DEBUG 。

  • USER_AGENT

    • 默認: "Scrapy/VERSION (+http://scrapy.org)"

    • 爬取的默認User-Agent,除非被覆蓋。

  • PROXIES: 代理設置

    • 示例:

      PROXIES = [{'ip_port': '111.11.228.75:80', 'password': ''},{'ip_port': '120.198.243.22:80', 'password': ''},{'ip_port': '111.8.60.9:8123', 'password': ''},{'ip_port': '101.71.27.120:80', 'password': ''},{'ip_port': '122.96.59.104:80', 'password': ''},{'ip_port': '122.224.249.122:8088', 'password':''},
      ]
      
  • COOKIES_ENABLED = False

    • 禁用Cookies

總結

以上是生活随笔為你收集整理的Python:Scrapy的settings的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。