日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > php >内容正文

php

php spider shell,ScrapyShell使用

發布時間:2023/12/1 php 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 php spider shell,ScrapyShell使用 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Scrapy Shell

Scrapy終端是一個交互終端,我們可以在未啟動spider的情況下嘗試及調試代碼,也可以用來測試XPath或CSS表達式,查看他們的工作方式,方便我們爬取的網頁中提取的數據。

如果安裝了 IPython ,Scrapy終端將使用 IPython (替代標準Python終端)。 IPython 終端與其他相比更為強大,提供智能的自動補全,高亮輸出,及其他特性。(推薦安裝IPython)

Scrapy Shell根據下載的頁面會自動創建一些方便使用的對象,例如 Response 對象,以及 Selector 對象 (對HTML及XML內容)。

當shell載入后,將得到一個包含response數據的本地 response 變量,輸入 response.body將輸出response的包體,輸出 response.headers 可以看到response的包頭。

輸入 response.selector 時, 將獲取到一個response 初始化的類 Selector 的對象,此時可以通過使用 response.selector.xpath()或response.selector.css() 來對 response 進行查詢。

Scrapy也提供了一些快捷方式, 例如 response.xpath()或response.css()同樣可以生效。

Selectors選擇器

Scrapy Selectors 內置 XPath 和 CSS Selector 表達式機制。

Selector有四個基本的方法,最常用的還是xpath:

xpath(): 傳入xpath表達式,返回該表達式所對應的所有節點的selector list列表

extract(): 序列化該節點為Unicode字符串并返回list

css(): 傳入CSS表達式,返回該表達式所對應的所有節點的selector list列表,語法同 BeautifulSoup4

re(): 根據傳入的正則表達式對數據進行提取,返回Unicode字符串list列表

使用案例:

# 啟動

scrapy shell "http://hr.tencent.com/position.php?&start=0#a"

![Uploading scrapyshell1_605828.png . . .]

# 返回 xpath選擇器對象列表

response.xpath('//title')

[\u804c\u4f4d\u641c\u7d22 | \u793e\u4f1a\u62db\u8058 | Tencent \u817e\u8baf\u62db\u8058]

# 使用 extract()方法返回 Unicode字符串列表

response.xpath('//title').extract()

[u'

\u804c\u4f4d\u641c\u7d22 | \u793e\u4f1a\u62db\u8058 | Tencent \u817e\u8baf\u62db\u8058']

# 打印列表第一個元素,終端編碼格式顯示

print response.xpath('//title').extract()[0]

職位搜索 | 社會招聘 | Tencent 騰訊招聘

# 返回 xpath選擇器對象列表

response.xpath('//title/text()')

# 返回列表第一個元素的Unicode字符串

response.xpath('//title/text()')[0].extract()

u'\u804c\u4f4d\u641c\u7d22 | \u793e\u4f1a\u62db\u8058 | Tencent \u817e\u8baf\u62db\u8058'

# 按終端編碼格式顯示

print response.xpath('//title/text()')[0].extract()

職位搜索 | 社會招聘 | Tencent 騰訊招聘

response.xpath('//*[@class="even"]')

職位名稱:

print site[0].xpath('./td[1]/a/text()').extract()[0]

TEG15-運營開發工程師(深圳)

職位名稱詳情頁:

print site[0].xpath('./td[1]/a/@href').extract()[0]

position_detail.php?id=20744&keywords=&tid=0&lid=0

職位類別:

print site[0].xpath('./td[2]/text()').extract()[0]

技術類

總結

以上是生活随笔為你收集整理的php spider shell,ScrapyShell使用的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 特黄级| 欧美精品一区二区三区久久久竹菊 | 色在线综合 | 国产色吧| 一本久道综合色婷婷五月 | 久久理伦 | 97综合网| 久久久久久免费毛片精品 | 中文字幕dvd | 国产冒白浆| 国产精品久久久久久人妻精品动漫 | 一级性生活大片 | 九九热在线视频 | 日本中文字幕第一页 | 成人六区 | 草色网 | 国产91综合一区在线观看 | 超碰婷婷 | 欧美一区二区三区免费在线观看 | 日本一区二区三区精品视频 | 夜晚福利 | 精品午夜一区二区 | 亚洲综合激情在线 | 精品在线视频观看 | 伊人av综合网 | 亚洲香蕉在线观看 | 色爱五月天 | 成品人视频ww入口 | 欧美精品久久久久a | 人妻精品一区一区三区蜜桃91 | 骚虎av在线| 你懂的网站在线 | 国产真人无码作爱视频免费 | 人人妻人人澡人人爽精品欧美一区 | 日韩福利视频 | 欧美性区 | 亚洲第一成年人网站 | 欧美大片xxx| 国产成人一区二区三区免费看 | 69视频一区二区三区 | 影音先锋在线视频观看 | 国产精品99久久久久久www | 丝袜美女啪啪 | 中国黄色a级 | 毛片基地在线播放 | 黄色免费片 | 91影院在线 | 久久久久性 | 诱惑の诱惑筱田优在线播放 | 午夜蜜桃视频 | 蜜桃视频久久一区免费观看入口 | 草草久久久 | 亚洲av无码潮喷在线观看 | 男人天堂2021 | 国产亚洲欧美日韩高清 | 国内自拍xxxx18 | 精品免费一区二区三区 | av免费大全 | 激情五月av | 欧美色图在线观看 | 日美一级片 | 高潮爽爆喷水h | 天天透天天操 | 丰满少妇av| 公车乳尖揉捏酥软呻吟 | 国产99精品视频 | 国产在线日本 | 中文字幕有码无码人妻av蜜桃 | 亚洲瑟瑟| 成人做爰69片免费看 | 毛茸茸日本熟妇高潮 | 欧美在线免费 | 99热久久这里只有精品 | 涩涩网站视频 | 91抖音在线观看 | 日日操网站 | 欧洲精品一区二区三区 | 黄色一级在线 | 97爱视频| 免费在线观看av网站 | 亚洲人成电影在线 | 国产在线免费观看 | 91小仙女jk白丝袜呻吟 | 男人和女人做爽爽视频 | 91福利小视频| 亚洲经典一区 | 欧美精品一区二区三 | 色吧综合网 | 九七电影院97理论片 | 亚洲福利一区二区三区 | 日韩精品极品 | 综合视频在线观看 | 国产乱论 | 黄色片久久 | 欧美freesex黑人又粗又大 | 国产v综合v亚洲欧美久久 | 探花av在线 | 91九色porn| 美女又爽又黄视频毛茸茸 |