如何写公式爬取网页数据之船舶定位
各位親,不用Python,不用寫VBA,寫公式也能爬網頁數(shù)據(jù),您知道嗎?今天小編給您整理了一個案例,做進出口貿易的朋友,需要每天關注船舶狀態(tài),關注一個船舶倒是容易,到網頁上查一查就行,但如果有多個,甚至十幾個船舶,一個一個查就不方便,也不直觀。此時,如果能在表格中批量查,就方便了。下如圖是我們要抓取的數(shù)據(jù)。
這一張圖是最終效果,演示了如何在表格中寫公式批量查船舶狀態(tài),是不是直觀,也很方便?
接下來,小編給您介紹完整的抓取步驟。
第一步,安裝好Excel網絡函數(shù)庫。本案例所涉及的公式都是免費的,使用也沒有任何限制。
第二步,構造網址。以船舶定位為例,我們在維運網上輸入船名查詢的時候,很容易從瀏覽器地址欄獲得查詢網址,簡單分析,可以找到網址拼接規(guī)律,只要將英文船名拼接到網址后就行。這種網址拼接方式最簡單。
http://www.weiyun001.com/NewRoute/trace/shipname/KOTA%20LEGIT
特別說明,由于本例中查詢網頁是嵌套結構,所以實際找到的拼接網址是下面的網址。
http://ais.weiyun001.com/ShipTrace/GoogleMapIndex/?ShipName=
第三步,分析網頁結構,找到數(shù)據(jù)項所在XPath。推薦使用Chrome瀏覽器,打開要采集的網頁,如下圖所示,我們要找到船舶狀態(tài)所在網頁元素的XPath。
將光標移到船舶狀態(tài)上,右鍵,在彈出菜單中選擇檢查,在彈出的開發(fā)者工具窗體中,找到要抓取的數(shù)據(jù)項,右鍵,選擇Copy,選擇Copy XPath獲得如下XPath。每一個數(shù)據(jù)項都這樣去處理。
//*[@id="lbAisNavStatus"]
第四步,寫公式GetWebContentByXPathW(url,xpath),如下圖所示,url參數(shù)傳入拼接的網址,xpath用找到數(shù)據(jù)項。GetWebContentByXPathW()的詳細用法,請點擊這里。
第五步,運行Excel瀏覽器,設置網頁抓取任務。
?第六步,當Excel瀏覽器全部抓取完畢后,回到Excel表格重新計算公式。
總結
本案例中,寫公式抓取環(huán)節(jié),相對比較容易,多看幾遍,大家應該都能掌握。難點在于,如何找到正確的拼接網址,您可借助瀏覽器的網絡請求工具,判斷實際抓取數(shù)據(jù)的是哪個網址。
總結
以上是生活随笔為你收集整理的如何写公式爬取网页数据之船舶定位的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AD 用脚本语言做螺旋线左旋右旋线圈的
- 下一篇: 平流式沉淀池流量计算_平流沉淀池计算公式