xpath helper
引語
在爬蟲各個應用場景下,數據解析為其中重要的一環。而在數據解析中,BeautifulSoup、Xpath以及正則表達式等多種方法均為利器,在實際應用中根據不同場景選擇不同的方法是最高效的,但是對各個方法的掌握程度要求很高。事實上,精通一種方法就已經滿足需要了,再此基礎之上,用輔助工具幫助理解提高效率。
本文將提供給“爬蟲大師們”使用xpath方法的輔助工具XPath Helper插件。
XPath Helper簡介
XPath即為XML路徑語言,它是一種用來確定XML(標準通用標記語言的子集)文檔中某部分位置的語言。XPath基于XML的樹狀結構,提供在數據結構樹中找尋節點的能力。起初XPath的提出的初衷是將其作為一個通用的、介于XPointer與XSL間的語法模型。
XPath Helper是一款專用于chrome內核瀏覽器的實用型爬蟲網頁解析工具。XPath Helper插件功能強勁,支持進行XPath查詢功能。XPath Help插件可以幫助用戶在各類網站上通過按shift鍵選擇想要查看的頁面元素來提取查詢其代碼,同時還支持用戶對查詢出來的代碼進行編輯,而編輯出的結果將立即顯示在旁邊的結果框中。
XPath Helper安裝方法
根據下面的鏈接將文件下載到本地。
鏈接:https://pan.baidu.com/s/18_Ws5qjHW9skhE1cb1jtYA
提取碼:x0no? ??
如果鏈接失效,請聯系Cgm1285373531
下載完成后,將文件的后綴名改為“.zip”,并進行解壓。
解壓之后有兩個文件,將文件名為“2.0.2_0.crx”后綴名改為“.zip”,并對其進行二次解壓。
至此,所有彈出的提示語句全部選擇 是
二次解壓完成,獲得如下圖所示的文件夾。如果紅色框內文件夾如圖所示,將“_metadata”改為“metadata”。如果默認就是“metadata”則不需要做任何操作。
進入自己對應的瀏覽器。在此,我以Google瀏覽器為基礎操作。
點擊谷歌右上角的三個點的按鈕
選擇更多工具——>選擇擴展程序
進入,打開開發者模式,加載已解壓的擴展程序,選擇相應的已解壓的文件,確認!
重啟瀏覽器,確認可以正常使用
如下圖表示創建成功。
??
使用方法,打開xpath,按住shfit鍵,鼠標指哪就顯示哪個的值。
?
?
?
?
原文鏈接:https://blog.csdn.net/heartbeat196/article/details/113790232
?
總結
以上是生活随笔為你收集整理的xpath helper的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HttpClientHelper
- 下一篇: OpenCV图像处理(下) 边缘检测+模