【转载保存】Jsoup解析html常用方法
首先我們要清楚 class的繼承關系
Document 繼承于 ?Element ?繼承于 Node ?繼承于 Object
首先 我們先研究一下 Element 中的函數作用:
01 addClass(String className) ? --> 添加一個class名字 到這個元素的class屬性上.
02 after(Node node) ?--> 將指定的節點添加到當前Element的后面
03 after(String html)?--> 指定的html加添到當前Element的后面
04 append(String html) --> 添加這個html到這個元素中
05 appendChild(Node child) ?--> 添加一個子節點到這個元素.
06 appendElement(String tagName) --> 創建一個有標簽名的新元素,并添加到最后一個節點.
07 appendText(String text) ?--> 創建和添加一個新的文本節點到這個元素.
08 attr(String attributeKey , String attributeValue) 在這個元素中設置一個屬性值.
09 before(Node node) 將此節點添加到當前元素的前面
10 before(String html) 將此html字符串添加到當前元素的前面
11 child(int index) ?通過索引 定位到子元素.
12 children() 獲取這個元素的所有子孩子
13 className() ?獲取這個元素的class屬性的名字
14 classNames() 獲取所有元素的class名字 返回值: Set
15 classNames(Set classNames ) 通過提供的class名字來設置元素的class屬性
16 clone() ?克隆
17 data() ?獲取這個元素的結合數據
18?elementSiblingIndex() ?獲取當前元素在他的兄弟列表中的索引 (返回值是Integer)
19 empty() 移除這個元素的所有孩子數據節點.
20?firstElementSibling() 獲取當前元素 同一級別的第一個兄弟元素.
21 getAllElements() 拿到當前元素下的所有元素 ( 包括 自己 , 孩子 , 孩子的孩子)
22 getElementById(String id) ?通過id屬性找到元素
23 getElementsByAttribute(String key) ?通過屬性名稱 查找當前html下的所有元素
24 getElementsByAttributeStarting(String keyPrefix) ?查找當前元素下 , 所有以String 開頭的字符串 屬性名稱的所有集合
25 getElementsbyAttributeValue(String key , String value) 通過屬性和屬性值, 獲取所有元素.
26 getElementsByAttributeValueContaining(String key , String match) 通過屬性和屬性值(屬性值可以模糊查詢) 獲取所有元素
27 getElementsByAttributeValueEnding(String key , String end) 通過屬性和屬性值(已String結尾的值) 查詢所有元素
28?getElementsByAttributeValueMatching(String?key,?Pattern?pattern) 通過屬性值得正則表達式來查詢所有元素
29?getElementsByAttributeValueNot(String?key,?String?value) 查詢屬性值不是我們提供的屬性值的所有元素
30?getElementsByAttributeValueStarting(String?key,?String?valuePrefix)? 通過查詢已valuePrefix的屬性值開始的所有元素
31 getElementsByClass(String className) ?當前元素是否有此class 或者在這個元素下面是否有這個class
32 getElementsByIndexEquals(int index) 查找當前元素同一級別的元素索引和提供的index相同的元素.
33?getElementsByIndexGreaterThan(int index) 查找同一級別元素索引大于當前索引的所有元素.
34 getElementsByIndexLessThan(int index) ?查找同一級別元素索引小于當前索引的所有元素.
35 getElementsByTag(String tagName) 查找當前元素或者當前元素之下的相同標簽的元素.
36 getElementsContainingOwnText(String searchText) 查找當前元素直接包含的文本內容的元素
37 getElementsContainingText(String searchText) 查找當前元素包含的文本String
38?getElementsMatchingOwnText(Pattern?pattern) 查找當前元素直接包含的文本的正則表達式
39 getElementsmatchingText(Pattern pattern) 查找當前元素下 包含文本的正則表達式
40 hasClass(String className) ?通過class屬性名字來查找所有元素
41 boolean ? hasText() ?測試 當前元素下是否有一些文本
42 html() 檢索文件內的Html
43 id() 返回當前元素的id值
44 insertChildren(int index , Collection<? extends Node> children) ?在元素指定的位置, 插入子孩子
45 isBlock() ?測試這個元素是不是層級元素
46 lastElementSibling() 獲取這個元素的同一級別元素的最后一個
47 nextElementSubling() 獲取這個元素的同一級別元素的下一個
48 nodeName() 標簽名字
49 ownText() 獲取到當前元素的文本 , 而不是子孩子的文本
50 parent() 獲取這個節點的父節點
51 prepend(String html) ?添加這個html到這個元素
52 parents() 獲取到父節點 ,一直到節點的根節點
53 prependChild(Node child) ?添加一個節點到子節點開始位置
54 prependElement(String tarName) ?創建一個新的節點 , 并且作為第一個子節點
55 PrependText(String text) ?創建和前置一個新的文本節點到這個元素
56 previousElementSibling() 獲取到當前元素的上一個元素
57 removeClass(String className) ?把當前元素的class屬性刪除
58 select() ?選擇器方法 , 萬能的
59 siblingElements() 獲取所有的兄弟元素(不包含自己)
60 返回值 Tag ?tag() 獲取這個標簽對象
61 tagName() 獲取這個標簽的名字
62 tagName(String tagName) ?改變這個標簽名字
63 text() 獲取這個元素和所有孩子的文本內容
64 textNodes() 獲取這個元素的孩子文本標簽集合
65 toggleClass(String className) ?如果元素有當前參數的 class屬性名 , 刪除它 ?.如果沒有 添加它
66 val() …
67 ?wrap() ?包裝這個元素的html
作者:動吉
來源:CSDN
原文:https://blog.csdn.net/zhangboy1234/article/details/38893955
版權聲明:本文為博主原創文章,轉載請附上博文鏈接!
總結
以上是生活随笔為你收集整理的【转载保存】Jsoup解析html常用方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MongoDb随笔,PyMongo简单使
- 下一篇: 【转载保存】dubbo学习笔记