re正则表达式匹配多行文本
生活随笔
收集整理的這篇文章主要介紹了
re正则表达式匹配多行文本
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
今天在寫一個(gè)簡(jiǎn)單爬蟲,最后的文本提取部分,卻一直提不出想要的部分。
文本格式是這樣的
離文本最近的<p data-align="left">不固定,只能用上面的<div class="rich-content topic-richtext">來(lái)匹配,但是用我僅知道的re的一點(diǎn)皮毛re.findall('(.*?)',text)發(fā)現(xiàn),一直匹配不到
查了半天,才意識(shí)到我的問(wèn)題是,匹配多行文本,順利找到方法:
https://www.jianshu.com/p/ebb3694a2b80
re.compile()函數(shù)可接受一個(gè)有用的標(biāo)記–re.DOTALL。這使得正則表達(dá)式中的句點(diǎn)(.)可以匹配所有的字符,也包括換行符
添加re.DOTALL,順利解決
comment = re.compile(r'(.*?)', flags=re.DOTALL)比起解決問(wèn)題,更重要的是知道你在面臨什么問(wèn)題
總結(jié)
以上是生活随笔為你收集整理的re正则表达式匹配多行文本的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: python之路金角大王_Python
- 下一篇: DDS与DA