當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Day16 正则表达式

發(fā)布時(shí)間：2023/12/14 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了 Day16 正则表达式小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Day16 正則表達(dá)式

檢測(cè)類符號(hào)

\b - 檢測(cè)是否是單詞邊界

單詞邊界: 凡是可以將兩個(gè)單詞區(qū)分開的符號(hào)都是單詞邊界
比如: 空白字符、標(biāo)點(diǎn)符號(hào)對(duì)應(yīng)的字符、字符串的開頭和結(jié)尾
注意: 檢測(cè)類符號(hào)是在匹配成功的情況下看檢測(cè)類符號(hào)的位置是否符合要求
re_str = r'abc \b123'print( fullmatch(re_str, 'abc 123')) #<re.Match object; span=(0, 7), match='abc 123'>re_str = r'\b\d\d\b' result = findall(re_str, 'sij12結(jié)束 98 按照形成12, 糾結(jié), 21, 計(jì)算12i]98') print(result) #['98', '21', '98']

\B - 檢測(cè)是否不是單詞邊界

re_str = r'\B\d\d\B' result = findall(re_str, 'sij12結(jié)束 98 按照形成12, 糾結(jié), 21, 計(jì)算45i 98') print(result) # ['12', '45']

^ - 檢測(cè)是否是字符串開頭

re_str = r'^\d\d' result = findall(re_str, '561sij12結(jié)束 98 45按照形成12, 糾結(jié), 21, 12計(jì)算12i 98') print(result) # ['56']

$ - 檢測(cè)是否是字符串結(jié)尾

re_str = r'\d\d$' result = findall(re_str, '56sij12結(jié)束 98 456按照形成12, 糾結(jié), 21, 計(jì)算12i 98') print(result)

匹配次數(shù)

‘*’ - 任意次數(shù)

a* - a出現(xiàn)任意次
\d* - \d出現(xiàn)任意次數(shù)
[abc]* - abc任意一個(gè)字符出現(xiàn)任意次數(shù)
re_str = r'a\d*b' print(fullmatch(re_str, 'ab')) print(fullmatch(re_str, 'a1b')) print(fullmatch(re_str, 'a13b')) print(fullmatch(re_str, 'a1345b'))

‘+’ - 出現(xiàn)至少一次

re_str = r'a\d+b' print(fullmatch(re_str, 'ab')) # None print(fullmatch(re_str, 'a1b')) print(fullmatch(re_str, 'a13b')) print(fullmatch(re_str, 'a1345b'))

? - 出現(xiàn)至多一次

re_str = r'a\d?b' print(fullmatch(re_str, 'ab')) print(fullmatch(re_str, 'a1b')) print(fullmatch(re_str, 'a13b')) # None print(fullmatch(re_str, 'a1345b')) # None

{}

{N} - 匹配N次
{M,N} - 匹配M到N次,M和N都可以取到
{M, } - 匹配至少M(fèi)次
{,N} - 匹配至多N次
re_str = r'1a{2,5}2' print(fullmatch(re_str, '1a2')) # None print(fullmatch(re_str, '1aa2')) print(fullmatch(re_str, '1aaa2')) print(fullmatch(re_str, '1aaaaaa2')) # None

貪婪和非貪婪

在匹配次數(shù)不確定的時(shí)候才有貪婪和非貪婪兩種模式.
貪婪: 在能匹配成功的前提下取匹配次數(shù)最多的次數(shù). (默認(rèn))
非貪婪: 在能夠匹配成功的前提下取匹配次數(shù)最少的次數(shù)(在匹配次數(shù)后加?)
re_str = r'a.+b' print(fullmatch(re_str, 'a掃is建檔立卡那種類型等級(jí)哦ib')) print(match(re_str, 'asjzixb123basdb拉三等獎(jiǎng)')) # 5次 9次 13次re_str = r'a.+?b' print(fullmatch(re_str, 'a掃is建檔立卡那種類型等級(jí)哦ib')) print(match(re_str, 'asjdxb123basdb拉三等獎(jiǎng)')) # 4次 8次 12次

分組或分支

分組 - ()

用法1: 將正則表達(dá)式中的一部分作為一個(gè)整體, 進(jìn)行整體相關(guān)操作, 比如控制次數(shù)
用法2: 重復(fù)-使用\M來重復(fù)前面第M個(gè)分組中的內(nèi)容
re_str = r'([a-z]{3}\d{2}){3}' result = fullmatch(re_str, 'amn12abm23zsg78') print(result)# '23a23a56a23' re_str = '(\d{2}a){3}\d{2}' print(fullmatch(re_str, '23a23a56a23'))# 34abc 78abc78 re_str = r'(\d\d)abc\1' print(fullmatch(re_str, '45abc45')) print(fullmatch(re_str, '45abc55')) # None print(fullmatch(re_str, '45bc45')) # Nonere_str = r'(\d{2})=([u4e00-\u9fa5])=\2=\1' print(fullmatch(re_str, '23=啥=啥=23'))re_str = r'(\d{2})=\1=([u4e00-\u9fa5])=\2=\1' print(fullmatch(re_str, '23=23=啥=啥=23'))

分支 - |

正則表達(dá)式1|正則表達(dá)式2 - 先讓正則1和字符進(jìn)行匹配, 如果成功就成功, 如果失敗就和正則2匹配, 都失敗才失敗
# '23abc'、'MKHabc' re_str = r'\d{2}abc|[A-Z]{3}abc' print(fullmatch(re_str, 'IOLabc'))re_str = r'\d{2}|[A-Z]{3}abc' print(fullmatch(re_str, '23')) print(fullmatch(re_str, '23abc')) # None

轉(zhuǎn)義符號(hào) \

讓特殊功能的符號(hào)的功能消失, 表示一個(gè)普通符號(hào)
# '23.56' '90.01' re_str = r'[1-9]\d.\d{2}' print(fullmatch(re_str, '19637'))re_str = r'[1-9]\d\.\d{2}' print(fullmatch(re_str, '19.37'))# '2+9' re_str = r'\d+\d' print(fullmatch(re_str, '91324237')) print(fullmatch(re_str, '9+7')) # Nonere_str = r'\d\+\d' print(fullmatch(re_str, '91324237')) # None print(fullmatch(re_str, '9+7'))
注意: 獨(dú)立具備特殊功能的符號(hào)在[]中功能也會(huì)自動(dòng)消失, 例如: + * ? . ( [ 等
本身在[]中具有特殊意義的就要特別注意: ^

re模塊

compile(正則表達(dá)式) - 創(chuàng)建一個(gè)正則表達(dá)式對(duì)象

re_obj = re.compile(r'\d{3}')re_obj.fullmatch('123')

匹配類方法

fullmatch

fullmatch(正則表達(dá)式, 字符串)
正則表達(dá)式對(duì)象.fullmatch(字符串)
判斷整個(gè)字符串是否符合正則表達(dá)式規(guī)則, 不符合返回None,符合返回匹配對(duì)象

match

match(正則表達(dá)式, 字符串)
正則表達(dá)式對(duì)象.match(字符串)
判斷字符串開頭是否符合正則表達(dá)式規(guī)則, 不符合返回None, 符合返回匹配對(duì)象
result = match(r'\d{3}', '123阿拉斯加寬帶哦-100231sa') result = match(r'(\d{3})-([a-z]{2,5})', '112-mog阿拉斯加寬帶哦-100231sa') print(result) #<re.Match object; span=(0, 7), match='112-mog'>

匹配對(duì)象

匹配對(duì)象.group() - 獲取整個(gè)正則表達(dá)式匹配結(jié)果
匹配對(duì)象.group(N) - 獲取正則表達(dá)式中第N個(gè)分組匹配到的結(jié)果
print(result.group()) # '112-mog' print(result.group(1)) # '112' print(result.group(2)) # 'mog'

獲取匹配結(jié)果在原字符串中的位置

匹配對(duì)象.span()
匹配對(duì)象.span(N)
print(result.span()) # (0, 7) print(result.span(1)) # (0, 3) print(result.span(2)) # (4, 7)

獲取原字符串

匹配對(duì)象.string
print(result.string) #112-mog阿拉斯加寬帶哦-100231sa

查找類方法

search(正則表達(dá)式, 字符串)
正則表達(dá)式對(duì)象.search(字符串)
獲取字符串中第一個(gè)滿足正則表達(dá)式的子串, 如果沒有返回None, 否則返回匹配對(duì)象
result = search(r'\d{3}', 'sjxa12341瞬間xz856sjiaskjdlji--奧術(shù)大師多123') print(result) #<re.Match object; span=(4, 7), match='123'>

findall

findall(正則表達(dá)式, 字符串)
正則表達(dá)式.findall(字符串)
獲取字符串中所有滿足正則表達(dá)式的子串, 以列表的形式返回
str1 = 'shais21233sad32=-213ml25343計(jì)算是23, 90毛33' result = findall(r'\d+', str1) print(result) #['21233', '32', '213', '25343', '23', '90', '33']result = findall(r'[\u4e00-\u9fa5]\d+', str1) print(result) # ['是23', '毛33']# 如果正則表達(dá)式中有分組, findall只提取匹配結(jié)果中分組匹配到的內(nèi)容 result = findall(r'[\u4e00-\u9fa5](\d+)', str1) print(result) # ['23', '33']result = findall(r'\d+-[a-z]+', 'asd8982-mn颯颯的話2-sasidj==-2323-asd=愛上降低') print(result) # ['8982-mn', '2-sasidj', '2323-asd']result = findall(r'\d+-([a-z]+)', 'asd8982-mn颯颯的話2-sasidj==-2323-asd=愛上降低') print(result) # ['mn', 'sasidj', 'asd']result = findall(r'(\d+)-([a-z]+)', 'asd8982-mn颯颯的話2-sasidj==-2323-asd=愛上降低') print(result) # [('8982', 'mn'), ('2', 'sasidj'), ('2323', 'asd')]

finditer

finditer(正則表達(dá)式, 字符串)
正則表達(dá)式對(duì)象.finditer(字符串)
獲取字符串中所有滿足正則表達(dá)式的子串, 返回值是迭代器,迭代器中元素是匹配對(duì)象
str1 = 'shais21233sad32=-213ml25343計(jì)算是23, 90毛33' result = finditer(r'\d+', str1) print(list(result))print('-----------------') result = finditer(r'(\d+)-([a-z]+)', 'asd8982-mn颯颯的話2-sasidj==-2323-asd=愛上降低') print('所有匹配結(jié)果:',[x.group() for x in result])result = finditer(r'(\d+)-([a-z]+)', 'asd8982-mn颯颯的話2-sasidj==-2323-asd=愛上降低') print('匹配的所有數(shù)字結(jié)果:', [x.group(1) for x in result])result = finditer(r'(\d+)-([a-z]+)', 'asd8982-mn颯颯的話2-sasidj==-2323-asd=愛上降低') print('匹配的所有字母結(jié)果:', [x.group(2) for x in result])

切割

split(正則表達(dá)式, 字符串)
正則表達(dá)式對(duì)象.split(字符串)
將字符串中所有滿足正則表達(dá)式的子串作為切割點(diǎn)對(duì)字符串進(jìn)行切割
str1 = '撒大蘇打123aasda阿瑟東23=qweas123ji1阿斯頓3213' result = split(r'\d+', str1) print(result) # ['撒大蘇打', 'aasda阿瑟東', '=qweas', 'ji', '阿斯頓', '']str2 = '颯颯的, 阿斯頓. 啊實(shí)打?qū)嵉? 斯洛克.按時(shí)大撒達(dá)娃大撒' result = split(r'[,.]', str2) print(result) # ['颯颯的', '', '阿斯頓', '', '啊實(shí)打?qū)嵉?#39;, '', '斯洛克', '按時(shí)大撒達(dá)娃大撒']result = split(r'[,.]', str2, 3) print(result) # ['颯颯的', '', '阿斯頓', ' 啊實(shí)打?qū)嵉? 斯洛克.按時(shí)大撒達(dá)娃大撒']

替換

sub(正則表達(dá)式, 字符串1, 字符串2)
sub(字符串1, 字符串2)
將字符串2中所有滿足正則表達(dá)式的子串都替換正字符串1
result = sub(r'\d+', '+', 'sdo12ajasdh123asi23dj12asd9,98-=-1') print(result) #sdo+ajasdh+asi+dj+asd+,+-=-+result = sub(r'\d+', '+', 'sdo12ajasdh123asi23dj12asd9,98-=-1', 3) print(result) #sdo+ajasdh+asi+dj12asd9,98-=-1

匹配參數(shù)

匹配參數(shù): 1. 單行匹配 2. 忽略大小寫

單行匹配和多行匹配

默認(rèn)是多行匹配
多行匹配時(shí), '.‘不能和\n(換行)進(jìn)行匹配; 單行匹配時(shí)’.'可以和\n進(jìn)行匹配
# 多行匹配 print(fullmatch(r'a.b', 'a\nb')) # None# 單行匹配 print(fullmatch(r'a.b', 'a\nb', flags=S)) # <re.Match object; span=(0, 3), match='a\nb'> print(fullmatch(r'(?s)a.b', 'a\nb')) # <re.Match object; span=(0, 3), match='a\nb'>

忽略大小寫

默認(rèn)不忽略大小寫
print(fullmatch(r'[a-z]{3}123', 'hSm123')) # None# 忽略大小寫 print(fullmatch(r'[a-z]{3}123', 'hSM123', flags=I)) print(fullmatch(r'(?i)[a-z]{3}123', 'hSM123'))# 單行匹配和忽略大小寫同時(shí)進(jìn)行 print(fullmatch(r'abc.123', 'ABC\n123', flags=I|S)) #<re.Match object; span=(0, 7), match='ABC\n123'> print(fullmatch(r'(?si)abc.123', 'ABC\n123')) #<re.Match object; span=(0, 7), match='ABC\n123'>

作業(yè)

一、不定項(xiàng)選擇題

能夠完全匹配字符串"(010)-62661617"和字符串"01062661617"的正則表達(dá)式包括（ABD ）

A.r"$?\d{3}$?-?\d{8}"
B. r"[0-9()-]+"
C.r"[0-9(-)]*\d*"
D.r"[(]?\d*[)-]*\d*"

能夠完全匹配字符串“back”和“back-end”的正則表達(dá)式包括（ BCD）
A. r“\w{4}-\w{3}|\w{4}”
B. r“\w{4}|\w{4}-\w{3}”
C.r “\S±\S+|\S+”
D. r“\w*\b-\b\w*|\w*”

能夠完全匹配字符串“go go”和“kitty kitty”，但不能完全匹配“go kitty”的正則表達(dá)式包括（ AD）
A.r “\b(\w+)\b\s+\1\b”
B. r“\w{2,5}\s*\1”
C. r“(\S+) \s+\1”
D. r“(\S{2,5})\s{1,}\1”

能夠在字符串中匹配“aab”，而不能匹配“aaab”和“aaaab”的正則表達(dá)式包括（BD ）
A. r“a*?b”
B. r“a{,2}b”
C. r“aa??b”
D. r“aaa??b”

二、編程題

1.用戶名匹配

? 要求: 1.用戶名只能包含數(shù)字字母下劃線

? 2.不能以數(shù)字開頭

? 3.?度在 6 到 16 位范圍內(nèi)

[^0-9]\w{6,16}

密碼匹配

? 要求: 1.不能包含!@#￥%^&*這些特殊符號(hào)

? 2.必須以字母開頭

? 3.?度在 6 到 12 位范圍內(nèi)

[a-z]+[^!@#￥%^&*]{5,11}

ipv4 格式的 ip 地址匹配
提示: IP地址的范圍是 0.0.0.0 - 255.255.255.255

r'(25[0-5]|2[0-4]\d|[0-1]?\d?\d)(\.25[0-5]|2[0-4]\d|[0-1]?\d?\d)\2{3}'

提取用戶輸入數(shù)據(jù)中的數(shù)值 (數(shù)值包括正負(fù)數(shù) 還包括整數(shù)和小數(shù)在內(nèi)) 并求和

例如:“-3.14good87nice19bye” =====> -3.14 + 87 + 19 = 102.86 str1 = input('請(qǐng)輸入字符串:') result = findall(r'((\-|\+)?\d+(\.\d+)?)', str1) sum1 = sum(eval(x[0]) for x in result) print(sum1)

驗(yàn)證輸入內(nèi)容只能是漢字

str1 = input('請(qǐng)輸入:') result = fullmatch(r'[\u4e00-\u9fa5]+', str1) if result == Noneprint('驗(yàn)證失敗,輸入有誤,請(qǐng)輸入漢字') else:print('驗(yàn)證成功')

匹配整數(shù)或者小數(shù)（包括正數(shù)和負(fù)數(shù)）

r'((\-|\+)?\d+(\.\d+)?)'

驗(yàn)證輸入用戶名和QQ號(hào)是否有效并給出對(duì)應(yīng)的提示信息

要求：
用戶名必須由字母、數(shù)字或下劃線構(gòu)成且長度在6~20個(gè)字符之間
QQ號(hào)是5~12的數(shù)字且首位不能為0

name_in = input('請(qǐng)輸入用戶名:') qq_in = input('請(qǐng)輸入qq:') name_result = fullmatch(r'\w{6,20}', name_in) if name_result == None:print('用戶名輸入有誤') else:print('用戶名輸入成功') qq_result = fullmatch(r'[1-9]\d{4,11}', qq_in) if qq_result == None:print('用戶名輸入有誤') else:print('用戶名輸入成功')

拆分長字符串：將一首詩的中的每一句話分別取出來

? poem = ‘窗前明月光，疑是地上霜。舉頭望明月，低頭思故鄉(xiāng)。’

poem = '窗前明月光，疑是地上霜。舉頭望明月，低頭思故鄉(xiāng)。' result = split(r'[，。]+', poem) print(result)

總結(jié)

以上是生活随笔為你收集整理的Day16 正则表达式的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

正则表达式

上一篇：基于Cisco CDP协议的家用路由器以
下一篇：颜色对照表