日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【ES6(2015)】RegExp

發布時間:2025/3/15 编程问答 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【ES6(2015)】RegExp 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

  • 1. y修飾符
  • 2. u修飾符

1. y修飾符

ES6為正則表達式添加了y修飾符,叫做“粘連”(sticky)修飾符。

y修飾符的作用與g修飾符類似,也是全局匹配,后一次匹配都從上一次匹配成功的下一個位置開始。不同之處在于,g修飾符只要剩余位置中存在匹配就可,而y修飾符確保匹配必須從剩余的第一個位置開始,這也就是“粘連”的涵義。

const s = 'aaa_aa_a' const r1 = /a+/g const r2 = /a+/yr1.exec(s) // ["aaa"] r2.exec(s) // ["aaa"]r1.exec(s) // ["aa"] r2.exec(s) // null

上面代碼有兩個正則表達式,一個使用g修飾符,另一個使用y修飾符。這兩個正則表達式各執行了兩次,第一次執行的時候,兩者行為相同,剩余字符串都是_aa_a。由于g修飾沒有位置要求,所以第二次執行會返回結果,而y修飾符要求匹配必須從頭部開始,所以返回null。

如果改一下正則表達式,保證每次都能頭部匹配,y修飾符就會返回結果了。

const s = 'aaa_aa_a' const r = /a+_/yr.exec(s) // ["aaa_"] r.exec(s) // ["aa_"]

上面代碼每次匹配,都是從剩余字符串的頭部開始。

使用lastIndex屬性,可以更好地說明y修飾符。

const regexp = /a/g// 指定從2號位置(y)開始匹配 regexp.lastIndex = 2// 匹配成功 const match = regexp.exec('xaya')// 在3號位置匹配成功 console.log(match.index) // 3// 下一次匹配從4號位開始 console.log(regexp.lastIndex) // 4// 4號位開始匹配失敗 regexp.exec('xaxa') // null

上面代碼中,lastIndex屬性指定每次搜索的開始位置,g修飾符從這個位置開始向后搜索,直到發現匹配為止。

y修飾符同樣遵守lastIndex屬性,但是要求必須在lastIndex指定的位置發現匹配。

const regexp = /a/y// 指定從2號位置開始匹配 regexp.lastIndex = 2// 不是粘連,匹配失敗 regexp.exec('xaya') // null// 指定從3號位置開始匹配 regexp.lastIndex = 3// 3號位置是粘連,匹配成功 const match = regexp.exec('xaxa') console.log(match.index) // 3 console.log(regexp.lastIndex) // 4

進一步說,y修飾符號隱含了頭部匹配的標志^。

const reg = /b/y reg.exec('aba') // null console.log(reg.lastIndex)

sticky 模式在正則匹配過程中只會影響兩件事:
匹配必須從 re.lastIndex 開始(相當于正則表達中的 ^)
如果匹配到會修改 re.lastIndex(相當于 g 模式)

2. u修飾符

ES6為正則表達式添加了u修飾符,含義為“Unicode模式”,用來正確處理大于 \uFFFF 的Unicode字符。也就是說,會正確處理四個字節的UTF-16編碼。

/^\uD83D/u.test('\uD83D\uDC2A') // false/^\uD83D/.test('\uD83D\uDC2A') // true

上面代碼中, \uD83D\uDC2A 是一個四個字節的UTF-16編碼,代表一個字符 “🐪”。但是,ES5不支持四個字節的UTF-16編碼,會將其識別為兩個字符,導致第二行代碼結果為true。加了u修飾符以后,ES6就會識別其為一個字符,所以第一行代碼結果為false。
一旦加上u修飾符號,就會修改下面這些正則表達式的行為。

(1) 點字符
點(.)字符在正則表達式中,含義是除了換行符以外的任意單個字符。對于碼點大于 0xFFFF 的 Unicode 字符,點字符不能識別,必須加上u修飾符。

let s = '𠮷' /^.$/.test(s) // false /^.$/u.test(s) // true

上面代碼表示,如果不添加u修飾符,正則表達式就會認為字符串為兩個字符,從而匹配失敗。

(2) Unicode字符表示法
ES6新增了使用大括號表示Unicode字符,這種表示法在正則表達式中必須加上u修飾符,才能識別。

/\u{61}/.test('a') // false/\u{61}/u.test('a') // true/\u{20BB7}/u.test('𠮷') // true

上面代碼表示,如果不加u修飾符,正則表達式無法識別\u{61}這種表示法,只會認為這匹配61個連續的u。

(3) 量詞
使用u修飾符后,所有量詞都會正確識別碼點大于0xFFFF的Unicode字符。

/a{2}/.test('aa') // true/a{2}/u.test('aa') // true/𠮷{2}/.test('𠮷𠮷') // false/𠮷{2}/u.test('𠮷𠮷') // true

另外,只有在使用u修飾符的情況下,Unicode表達式當中的大括號才會被正確解讀,否則會被解讀為量詞。

/^\u{3}$/.test('uuu') // true

上面代碼中,由于正則表達式沒有u修飾符,所以大括號被解讀為量詞。加上u修飾符,就會被解讀為Unicode表達式。

/\u{20BB7}{2}/u.test('𠮷𠮷') // true

使用 u 修飾符之后 Unicode 表達式+量詞也是可以的。

(4) 預定義模式
u修飾符也影響到預定義模式,能否正確識別碼點大于0xFFFF的Unicode字符。

/^\S$/.test('𠮷') // false/^\S$/u.test('𠮷') // true

上面代碼的\S是預定義模式,匹配所有不是空格的字符。只有加了u修飾符,它才能正確匹配碼點大于0xFFFF的Unicode字符。

利用這一點,可以寫出一個正確返回字符串長度的函數。

function codePointLength(text) {const result = text.match(/[\s\S]/gu)return result ? result.length : 0 }const s = '𠮷𠮷's.length // 4 codePointLength(s) // 2

(5) i修飾符
有些Unicode字符的編碼不同,但是字型很相近,比如,\u004B與\u212A都是大寫的K。

/[a-z]/i.test('\u212A') // false/[a-z]/iu.test('\u212A') // true

上面代碼中,不加u修飾符,就無法識別非規范的K字符。

總結

以上是生活随笔為你收集整理的【ES6(2015)】RegExp的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。