xpath 取标签下所有文字内容_xpath提取目录下所有标签内的内容,递归 //text()...
生活随笔
收集整理的這篇文章主要介紹了
xpath 取标签下所有文字内容_xpath提取目录下所有标签内的内容,递归 //text()...
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
利用xpath來提取所有標(biāo)簽里面的內(nèi)容,即使標(biāo)簽頭不同
#-*-coding:utf8-*-
import re
import os
from lxml import etree
html = '''
測試-常規(guī)用法- 我
是
誰- who
- am
- i!
- 你是
- 誰!
- who
- you
- are!
'''
selector = etree.HTML(html)
for k in range(1,3):
chinese = selector.xpath('//div[@id="content"][%s]/ul[@id="useful"]//text()'%k)
data = "".join([each for each in chinese])
english = selector.xpath('//div[@id="content"][%s]/ul[@id="useless"]//text()'%k)
Data = "".join([each for each in english])
print data
print Data
結(jié)果:
總結(jié)
以上是生活随笔為你收集整理的xpath 取标签下所有文字内容_xpath提取目录下所有标签内的内容,递归 //text()...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: matlab randn state 2
- 下一篇: qt html导pdf 页眉,如何使用w