python贪婪匹配顺序_Python正则表达式:贪婪模式返回多个空匹配
這種模式僅意味著將字符串中的所有內(nèi)容抓取到數(shù)據(jù)中第一個潛在句子邊界為止:
[^\.?!\r\n]*
輸出:
>>> pattern = re.compile(r"([^\.?!\r\n]*)")
>>> matches = pattern.findall("Australians go hard!!!") # Actual source snippet, not a personal comment about Australians. :-)
>>> print matches
['Australians go hard', '', '', '', '']
從Python文檔中:
re.findall(模式,字符串,標志= 0)
返回字符串中模式的所有非重疊匹配項,作為字符串列表。從左到右掃描字符串,并以找到的順序返回匹配項。如果模式中存在一個或多個組,則返回一個組列表;否則,返回一個列表。如果模式包含多個組,則這將是一個元組列表??掌ヅ漤棇ㄔ诮Y(jié)果中,除非它們碰到另一個匹配項的開頭。
現(xiàn)在,如果從左到右掃描字符串,并且運算符是貪婪的,那么很有意義的是,返回的第一個匹配項是整個字符串,直到感嘆號為止。但是,在消耗完該部分之后,我看不到該模式如何準確地產(chǎn)生四次空匹配,大概是通過在“
d”之后向左掃描字符串來實現(xiàn)的。我確實知道運算符意味著該模式可以匹配空字符串,但我只是看不出它在字母的后綴“
d”和前導“!”之間會多次執(zhí)行該操作。標點符號。
添加^錨具有以下效果:
>>> pattern = re.compile(r"^([^\.?!\r\n]*)")
>>> matches = pattern.findall("Australians go hard!!!")
>>> print matches
['Australians go hard']
由于這消除了空字符串匹配,因此似乎表明所述空匹配發(fā)生在字符串的前導“ A”之前。但這似乎與按照找到的順序返回的匹配項的文檔相矛盾(應該先出現(xiàn)前導“
A”之前的匹配項),而且,恰好有四個空匹配項使我感到困惑。
總結(jié)
以上是生活随笔為你收集整理的python贪婪匹配顺序_Python正则表达式:贪婪模式返回多个空匹配的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python封装类在当前文件中使用_na
- 下一篇: python自带编译器闪退_python