正则表达式使用及常见表达式汇总
最近接到一個(gè)內(nèi)部搜索業(yè)務(wù),本來是使用solr構(gòu)建的分詞搜索,但是在前期的數(shù)據(jù)量并沒有那么大的情況下,使用者反饋使用分詞反而不如精確匹配來的好用,所以運(yùn)用相關(guān)正則表達(dá)式重寫了一套搜索接口直接進(jìn)行數(shù)據(jù)庫檢索,準(zhǔn)備等數(shù)據(jù)量大起來以后再接入solr。在這個(gè)過程中使用了一些正則表達(dá)式,使用合適的工具做合適的事情果然可以事半功倍。所以收集并分享一下。
1.使用方法
此處不探究正則表格式更強(qiáng)大的功能,只講述一下最常用的匹配,替換(相信大多數(shù)業(yè)務(wù)需求也正是這樣)。
創(chuàng)建正則表達(dá)式
在javaScript中一般創(chuàng)建正則表達(dá)式采取兩種方式:
- 字面量方法:直接使用字面量創(chuàng)建,在js解析器的性能上有一定優(yōu)勢,形式如下:
- 構(gòu)造函數(shù)方法:調(diào)用RegExp的構(gòu)造函數(shù)進(jìn)行初始化正則表達(dá)式,形式如下:
使用正則表達(dá)式
在javaScript中有兩個(gè)類(此處為了稱呼方便說為類,實(shí)際上javaScript基于原型不存在類的概念)的6個(gè)方法可以使用到正則表達(dá)式,分別是:
| RegExp | exec,test |
| String | match, repalce, search, split |
- exec: exec() 方法用于檢索字符串中的正則表達(dá)式的匹配。若匹配成功返回一個(gè)數(shù)組,其中存放匹配的結(jié)果;如果未找到匹配,則返回 null。 簡而言之當(dāng)結(jié)果數(shù)組不為null是表示匹配成功。
- test:test() 方法用于檢測一個(gè)字符串是否匹配某個(gè)模式。定義比較簡單,與(r.exec(reg) != null)等價(jià)。
- match:與exec方法表現(xiàn)相似,差別在當(dāng)為global匹配時(shí)結(jié)果為所有匹配結(jié)果,若不是則為第一個(gè)匹配結(jié)果(可以匹配的情況下)。
- replace:replace方法是一個(gè)非常實(shí)用的方法,主要用來在字符串中用一些字符替換另一些字符,或替換一個(gè)與正則表達(dá)式匹配的子串。有兩個(gè)參數(shù),第一個(gè)為匹配的正則表達(dá)式或者特定字符串,第二個(gè)參數(shù)是替換的字符串或者一個(gè)函數(shù),該函數(shù)有四個(gè)可調(diào)用的參數(shù),返回值為規(guī)定的字符串。參數(shù)如下:
中間參數(shù)為子表達(dá)式匹配字符串,個(gè)數(shù)不限.( $i (i:1-99))
倒數(shù)第二個(gè)參數(shù)為匹配文本字符串的匹配下標(biāo)位置。
最后一個(gè)參數(shù)表示字符串本身。 // 將apples替換為oranges var re = /apples/gi; var str = 'Apples are round, and apples are juicy.'; // 第二個(gè)參數(shù)為字符串 var newstr = str.replace(re, 'oranges'); // oranges are round, and oranges are juicy.// 第二個(gè)參數(shù)為函數(shù) var newstr = str.replace(re, function(value) {if(value == 'Apples') {return 'Oranges';}if(value == 'apple') {return 'oranges';} }); // Oranges are round, and oranges are juicy.
- search:search() 方法用于檢索字符串中指定的子字符串,或檢索與正則表達(dá)式相匹配的子字符串,返回第一個(gè)匹配成功的字串起始位置。注意:忽略RegExp對象的lastIndex,每次執(zhí)行均從頭開始。
- split:大多數(shù)人都知道split方法是用來對字符串按照指定子字符串進(jìn)行分割返回?cái)?shù)組的,但是很多人不知道它的參數(shù)可以是正則表達(dá)式,這無疑擴(kuò)展了這個(gè)方法的能力。
基本的使用方法就是以上幾種,接下來對常用的正則表達(dá)式進(jìn)行一下總結(jié)。
2.常見表達(dá)式匯總
一、校驗(yàn)數(shù)字的表達(dá)式
1 數(shù)字:^[0-9]*$2 n位的數(shù)字:^\d{n}$3 至少n位的數(shù)字:^\d{n,}$4 m-n位的數(shù)字:^\d{m,n}$5 零和非零開頭的數(shù)字:^(0|[1-9][0-9]*)$6 非零開頭的最多帶兩位小數(shù)的數(shù)字:^([1-9][0-9]*)+(.[0-9]{1,2})?$7 帶1-2位小數(shù)的正數(shù)或負(fù)數(shù):^(\-)?\d+(\.\d{1,2})?$ 8 正數(shù)、負(fù)數(shù)、和小數(shù):^(\-|\+)?\d+(\.\d+)?$9 有兩位小數(shù)的正實(shí)數(shù):^[0-9]+(.[0-9]{2})?$10 有1~3位小數(shù)的正實(shí)數(shù):^[0-9]+(.[0-9]{1,3})?$11 非零的正整數(shù):^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$ 12 非零的負(fù)整數(shù):^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$13 非負(fù)整數(shù):^\d+$ 或 ^[1-9]\d*|0$14 非正整數(shù):^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$15 非負(fù)浮點(diǎn)數(shù):^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$16 非正浮點(diǎn)數(shù):^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$17 正浮點(diǎn)數(shù):^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$18 負(fù)浮點(diǎn)數(shù):^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$19 浮點(diǎn)數(shù):^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$二、校驗(yàn)字符的表達(dá)式
1 漢字:^[\u4e00-\u9fa5]{0,}$2 英文和數(shù)字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$3 長度為3-20的所有字符:^.{3,20}$4 由26個(gè)英文字母組成的字符串:^[A-Za-z]+$5 由26個(gè)大寫英文字母組成的字符串:^[A-Z]+$6 由26個(gè)小寫英文字母組成的字符串:^[a-z]+$7 由數(shù)字和26個(gè)英文字母組成的字符串:^[A-Za-z0-9]+$8 由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串:^\w+$ 或 ^\w{3,20}$9 中文、英文、數(shù)字包括下劃線:^[\u4E00-\u9FA5A-Za-z0-9_]+$10 中文、英文、數(shù)字但不包括下劃線等符號:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$11 可以輸入含有^%&',;=?$\"等字符:[^%&',;=?$\x22]+12 禁止輸入含有~的字符:[^~\x22]+三、特殊需求表達(dá)式
1 Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$2 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?3 InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$4 手機(jī)號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$5 電話號碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$6 國內(nèi)電話號碼(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}7 身份證號(15位、18位數(shù)字):^\d{15}|\d{18}$8 短身份證號碼(數(shù)字、字母x結(jié)尾):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$9 帳號是否合法(字母開頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$10 密碼(以字母開頭,長度在6~18之間,只能包含字母、數(shù)字和下劃線):^[a-zA-Z]\w{5,17}$11 強(qiáng)密碼(必須包含大小寫字母和數(shù)字的組合,不能使用特殊字符,長度在8-10之間):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$12 日期格式:^\d{4}-\d{1,2}-\d{1,2}13 一年的12個(gè)月(01~09和1~12):^(0?[1-9]|1[0-2])$14 一個(gè)月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$15 xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$16 中文字符的正則表達(dá)式:[\u4e00-\u9fa5]17 雙字節(jié)字符:[^\x00-\xff] (包括漢字在內(nèi),可以用來計(jì)算字符串的長度(一個(gè)雙字節(jié)字符長度計(jì)2,ASCII字符計(jì)1))18 空白行的正則表達(dá)式:\n\s*\r (可以用來刪除空白行)19 HTML標(biāo)記的正則表達(dá)式:<(\S*?)[^>]*>.*?</\1>|<.*? /> (網(wǎng)上流傳的版本太糟糕,上面這個(gè)也僅僅能部分,對于復(fù)雜的嵌套標(biāo)記依舊無能為力)20 首尾空白字符的正則表達(dá)式:^\s*|\s*$或(^\s*)|(\s*$) (可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達(dá)式)21 騰訊QQ號:[1-9][0-9]{4,} (騰訊QQ號從10000開始)22 中國郵政編碼:[1-9]\d{5}(?!\d) (中國郵政編碼為6位數(shù)字)23 IP地址:\d+\.\d+\.\d+\.\d+ (提取IP地址時(shí)有用)24 IP地址:((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))匯總參考: http://blog.csdn.net/IMW_MG/a...
附正則表:
總結(jié)
以上是生活随笔為你收集整理的正则表达式使用及常见表达式汇总的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: react 项目实战(三)表单验证
- 下一篇: 【51nod】1239 欧拉函数之和 杜