正则表达式 BRE 与 ERE的区别
傳統(tǒng)上,POSIX 定義了兩種正則表達(dá)式語法, 即:基本正則表達(dá)式(BRE)和擴(kuò)展正則表 達(dá)式(ERE)。大多數(shù)LINUX程序至少要符合BRE規(guī)范。linux中,不同的程序支持的REGXP也不同,如sed只支持BRE的大部分,這主要是收到速度的限制。sed編輯器要盡可能快的處理數(shù)據(jù)流中的文本。而grep可以支持ERE,不過要使用-E 選項(xiàng)。gawk使用BRE引擎。 其中, BRE 定義的語法符號(hào)包括: . - 匹配任意一個(gè)字符。 [] - 字符集匹配,匹配方括號(hào)中定義的字符集之一。 [^] - 字符集否定匹配,匹配沒有在方括號(hào)中定義的字符。 ^ - 匹配開始位置。 $ - 匹配結(jié)束位置。 /(/) - 定義子表達(dá)式。 /n - 子表達(dá)式向前引用,n 為 1-9 之間的數(shù)字。 由于此功能已超出正則語義,需 要在字符串中回溯,因此需要使用 NFA 算法進(jìn)行匹配。 * - 任意次匹配(零次或多次匹配)。 /{m,n/} - 至少 m 次,至多 n 次匹配;/{m/} 表示 m 次精確匹配;/{m,/} 表示至少 m 次匹配。 ERE 修改了 BRE 中的部分語法,并增加了以下語法符號(hào): ? - 最多一次匹配(零次或一次匹配)。 + - 至少一次匹配(一次或更多次匹配)。 | - 或運(yùn)算,其左右操作數(shù)均可以為一個(gè)子表達(dá)式。 同時(shí),ERE 取消了子表達(dá)式 "()" 和 次數(shù)匹配 "{m,n}" 語法符號(hào)的轉(zhuǎn)義符引用語法,在 使用這兩種語法符號(hào)時(shí),不在需要添加轉(zhuǎn)義符。 與此同時(shí), ERE 也取消了非正則語義的 子表達(dá)式向前引用能力。 BRE 和 ERE 共享同樣的 POSIX 字符類定義。同時(shí),它們還支持字符類比較操作 "[. .]" 和字符來等效體 "[= =]" 操作,但很少被使用。 f / fr / wfr / bwfr 等工具默認(rèn)使用 ERE 模式,同時(shí)支持以下 PERL 風(fēng)格的字符類: POSIX 類 perl類 描述
----------------------------------------------------------------------------
[:alnum:] 字母和數(shù)字
[:alpha:] /a 字母
[:lower:] /l 小寫字母
[:upper:] /u 大寫字母
[:blank:] 空白字符(空格和制表符)
[:space:] /s 所有空格符(比[:blank:]包含的范圍廣)
[:cntrl:] 不可打印的控制字符(退格、刪除、警鈴...)
[:digit:] /d 十進(jìn)制數(shù)字
[:xdigit:] /x 十六進(jìn)制數(shù)字
[:graph:] 可打印的非空白字符
[:print:] /p 可打印字符
[:punct:] 標(biāo)點(diǎn)符號(hào) -
此外,還有以下特殊字符類:
perl類 等效POSIX表達(dá)式 描述
----------------------------------------------------------------------------
/o [0-7] 八進(jìn)制數(shù)字
/O [^0-7] 非八進(jìn)制數(shù)字
/w [[:alnum:]_] 單詞構(gòu)成字符
/W [^[:alnum:]_] 非單詞構(gòu)成字符
/A [^[:alpha:]] 非字母
/L [^[:lower:]] 非小寫字母
/U [^[:upper:]]
總結(jié)
以上是生活随笔為你收集整理的正则表达式 BRE 与 ERE的区别的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux shell 时间运算以及时间
- 下一篇: ORACLE 效率测试小工具 Runst