jsoup 去除html标签,如何使用jsoup取消注释html标签
Kai Sternad..
7
對的,這是可能的.以下是解決此問題的一種方法:
查找所有評論節(jié)點
對于每個注釋,提取數(shù)據(jù)屬性
在當前注釋節(jié)點之后插入包含數(shù)據(jù)的新節(jié)點
刪除注釋節(jié)點
看看這段代碼:
public class UncommentComments {
public static void main(String... args) {
String htmlIn = "
"+ ""
+ "
not a comment"+ ""
+ "";
Document doc = Jsoup.parse(htmlIn);
List comments = findAllComments(doc);
for (Comment comment : comments) {
String data = comment.getData();
comment.after(data);
comment.remove();
}
System.out.println(doc.toString());
}
public static List findAllComments(Document doc) {
List comments = new ArrayList<>();
for (Element element : doc.getAllElements()) {
for (Node n : element.childNodes()) {
if (n.nodeName().equals("#comment")){
comments.add((Comment)n);
}
}
}
return Collections.unmodifiableList(comments);
}
}
給出這個HTML文檔:
not a comment將導(dǎo)致此輸出:
hello therenot a commentanother comment
總結(jié)
以上是生活随笔為你收集整理的jsoup 去除html标签,如何使用jsoup取消注释html标签的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: fileitem方法_FileItem的
- 下一篇: 一分钟看懂动态代理