HTML.parser和正则解析,正则表达式+HTMLParser使用详.ppt
================================ getText:/body================================ getText: ================================getText:/html================================getText:================================除了前面3.2中輸出的幾個Tag,其余的Tag都在這里了。 3.4 XorFilter 把前面的AndFilter換成NotFilter測試代碼: NodeFilter filterID = new HasAttributeFilter( "id" );NodeFilter filterChild = new HasChildFilter(filterA);NodeFilter filter = new XorFilter(filterID, filterChild); 輸出結果: getText:div id="top_main"================================ 4.1 NodeClassFilter 這個Filter用于判斷節點類型是否是某個特定的Node類型。在 2.1 TagNameFilter TabNameFilter是最容易理解的一個Filter,根據Tag的名字進行過濾。 下面是用于測試的HTML文件:
白澤居-< /head> ??? ??? ??? ??? ??? 白澤居-白澤居-??? ??? 白澤居- HTMLParser遍歷了網頁的內容以后,以樹(森林)結構保存了結果。HTMLParser訪問結果內容的方法有兩種。 使用Filter和使用Visitor。 下面介紹使用Visitor訪問內容的方法。 4.1 NodeVisitor 從簡單方面的理解,Filter是根據某種條件過濾取出需要的Node再進行處理。Visitor則是遍歷 HTMLParser使用詳解(4)- 通過Visitor訪問 內容樹的每一個節點,對于符合條件的節點進行處理。實際的結果異曲同工,兩種不同的方法可以達到相同的結果。下面是一個最常見的NodeVisitro的例子。 測試代碼: ??? public static void main(String[] args) {??????? try{??????????? Parser parser = new Parser( (HttpURLConnection) (new URL(":8080/HTMLParserTester.html")).openConnection() ); ? NodeVisitor visitor = new NodeVisitor( false, false ) {??????????????? public void visitTag(Tag tag) {?????????????????? message("This is Tag:"+tag.getText());??????????????? }??????????????? public void visitStringNode (Text string)??? {???????????????????? message("This is Text:"+string);??????????????? } ? public void visitRemarkNode (Remark remark) {???????????????????? message("This is Remark:"+remark.getText());???????????????總結
以上是生活随笔為你收集整理的HTML.parser和正则解析,正则表达式+HTMLParser使用详.ppt的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: etc安装好了卡拿下后还能用吗?
- 下一篇: 2017年html5行业报告,云适配发布