日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

哪种代理适合用于Web数据采集

發布時間:2024/1/17 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 哪种代理适合用于Web数据采集 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在Web數據采集中為了避免被服務器封鎖而通過代理下載的情況很常見。但是,并非所有的代理都適合于Web數據采集。下面是鯤鵬數據的技術人員給出的說明。

根據HTTP代理的匿名性可以將其分為以下幾種:

1. 透明代理(Transparent Proxies) 目標服務器能夠檢測到真實的源IP。 目標服務器根據HTTP請求頭進行檢測,判斷依據: REMOTE_ADDR = 代理服務器 IP HTTP_VIA = 通常為代理服務器 IP(或代理軟件名稱,也可能無此頭) HTTP_X_FORWARDED_FOR = 真實源IP(不用代理時,無此頭或值為空) PS:該類型代理不適合用于Web數據采集。 2. (普通)匿名代理(Anonymous Proxies) 目標服務器無法檢測到真實的源IP,但能夠檢測到使用了代理。 檢測依據: REMOTE_ADDR = 代理服務器 IP HTTP_VIA = 通常為代理服務器 IP(或代理軟件名稱,也可能無此頭) HTTP_X_FORWARDED_FOR = 代理服務器 IP(知道你使用了代理,但無法得知真實源IP) PS:該類型代理可以用于Web數據采集,但有被檢測到的風險。 3. 高匿名代理(High Anonymity Proxies -Elite proxies) 目標服務器無法檢測到你在是使用代理。 檢測依據: REMOTE_ADDR = 代理服務器 IP HTTP_VIA = 值為空或無此頭 HTTP_X_FORWARDED_FOR = 沒數值或無此頭 PS:該類型的代理非常適合用戶Web數據采集。鯤鵬數據的付費代理方案提供的全部為高匿名類型的代理。 另外,不使用代理時發出的頭: REMOTE_ADDR =真實源 IP HTTP_VIA = 值為空或無此頭 HTTP_X_FORWARDED_FOR = 沒數值或無此頭 不過,在檢測嚴格的情況下,即使沒有HTTP_VIA頭和HTTP_X_FORWARDED_FOR頭,如果存在HTTP_PROXY_CONNECTION頭,會被認為在使用普通匿名代理。 我們提供了一個代理類型檢測接口,在瀏覽器中訪問該接口即可顯示出你當前使用的代理類型(如下圖): http://proxies.site-digger.com/proxy-detect/

轉載于:https://www.cnblogs.com/mvc2014/p/3776072.html

總結

以上是生活随笔為你收集整理的哪种代理适合用于Web数据采集的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。