日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

Python正则表达式之修改,分割,搜索和替换字符串(6)

發(fā)布時間:2025/3/21 python 16 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python正则表达式之修改,分割,搜索和替换字符串(6) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

文章目錄

    • 修改字符串
    • 分割字符串:
    • 搜索和替換

修改字符串

我們已經(jīng)介紹完如何對字符進行搜索,接下來我們講講正則表達式如何修改字符串

正則表達式使用以下方法修改字符串:

方法用途
split()在正則表達式匹配的地方進行分割,并返回一個列表
sub()找到所有匹配的子字符串,并替換為新的內(nèi)容
subn()跟 sub() 干一樣的勾當,但返回新的字符串以及替換的數(shù)目

分割字符串:

正則表達式的 split() 方法將字符串在匹配的地方進行分割,并將分割后的結(jié)果作為列表返回。它的做法其實很像字符串的 split() 方法,但這個可以使用更加廣泛的分隔符。你猜的沒錯,它同時提供了一個模塊級別的函數(shù):re.split()

.split(string[, maxsplit=0])

通過正則表達式匹配來分割字符串。如果在 RE 中,你使用了捕獲組,那么它們的內(nèi)容會作為一個列表返回。你可以通過傳入一個 maxsplit 參數(shù)來設(shè)置分割的數(shù)量。如果 maxsplit 的值是非 0,表示至多有 maxsplit 個分割會被處理,剩下的內(nèi)容作為列表的最后一個元素返回。

下邊例子中,分隔符是任何非字母數(shù)字字符

>>> p = re.compile(r'\W+') >>> p.split('This is a test, short and sweet, of split().') ['This', 'is', 'a', 'test', 'short', 'and', 'sweet', 'of', 'split', ''] >>> p.split('This is a test, short and sweet, of split().', 3) ['This', 'is', 'a', 'test, short and sweet, of split().']

有時候你可能不僅對分隔符之間的內(nèi)容感興趣,你可能對分隔符本身(就是正則表達式匹配的內(nèi)容)也同樣感興趣。如果使用了捕獲組,那么作為分隔符的值也會被返回:

>>> p = re.compile(r'\W+') >>> p2 = re.compile(r'(\W+)') >>> p.split('This... is a test.') ['This', 'is', 'a', 'test', ''] >>> p2.split('This... is a test.') ['This', '... ', 'is', ' ', 'a', ' ', 'test', '.', '']

模塊級別的函數(shù) re.split() 除了將 RE 作為第一個參數(shù)外,其他參數(shù)是一樣的:

>>> re.split('[\W]+', 'Words, words, words.') ['Words', 'words', 'words', ''] >>> re.split('([\W]+)', 'Words, words, words.') ['Words', ', ', 'words', ', ', 'words', '.', ''] >>> re.split('[\W]+', 'Words, words, words.', 1) ['Words', 'words, words.']

搜索和替換

另一個常見的任務(wù)就是找到所有的匹配部分,并替換成不同的字符串。sub 方法可以幫你實現(xiàn)這個愿望!sub 方法有一個 replacement 參數(shù),它可以是一個待替換的字符串,或者一個處理字符串的函數(shù)。

.sub(replacement, string[, count=0])

返回一個字符串,這個字符串從最左邊開始,所有 RE 匹配的地方都替換成 replacement。如果沒有找到任何匹配,那么返回原字符串。

可選參數(shù) count 指定最多替換的次數(shù),必須是一個非負值。默認值是 0,意思是替換所有找到的匹配。

下邊是使用 sub() 方法的例子,它會將所有的顏色替換成 color:

>>> p = re.compile( '(blue|white|red)') >>> p.sub( 'colour', 'blue socks and red shoes') 'colour socks and colour shoes' >>> p.sub( 'colour', 'blue socks and red shoes', count=1) 'colour socks and red shoes'

subn() 方法跟 sub() 方法干同樣的勾當,但區(qū)別是返回值為一個包含有兩個元素的元組:一個是替換后的字符串,一個是替換的數(shù)目

>>> p = re.compile( '(blue|white|red)') >>> p.subn( 'colour', 'blue socks and red shoes') ('colour socks and colour shoes', 2) >>> p.subn( 'colour', 'no colours at all') ('no colours at all', 0)

空匹配只有在它們沒有緊挨著前一個匹配時才會被替換掉:

>>> p = re.compile('x*') >>> p.sub('-', 'abxd') '-a-b-d-'

如果 replacement 參數(shù)是一個字符串,那么里邊的反斜杠都會被處理。比如 \n 將會被轉(zhuǎn)換成一個換行符,\r 轉(zhuǎn)換成回車,等等。未知的轉(zhuǎn)義如 \j 保持原樣。逆向引用如 \6,則被 RE 中相應(yīng)的捕獲組匹配的內(nèi)容所替換。這使你可以在替換后的字符串中插入一部分原字符串。

下邊例子中,將匹配被 { 和 } 括起來的單詞 section,并將 section 替換成 subsection:

>>> p = re.compile('section{ ( [^}]* ) }', re.VERBOSE) >>> p.sub(r'subsection{\1}','section{First} section{second}') 'subsection{First} subsection{second}'

這里開啟了 re.VERBOSE,空格將被忽略。因為這里一堆符號,用空格隔開看著才不會亂糟糟的…2. 這里 r'subsection{\1}' 使用 \1 引用匹配模式中的 ([^}]*) 匹配的字符串內(nèi)容。

還可以使用 Python 的擴展語法 (?P<name>...) 指定命名組,引用命名組的語法是 \g<name>。\g<name> 會將名字為 name 的組匹配的字符串替換進去。另外,\g<數(shù)字> 是通過組的序號進行引用。\g<2> 其實就相當于 \2,但我們更提倡使用 \g<2>,因為這樣可以避免歧義。例如,\g<2>0 的含義是引用序號為 2 的組,然后后邊匹配一個字符 '0',而你寫成 \20 就會被認為是引用序號為 20 的組了。

>>> p = re.compile('section{ (?P<name> [^}]* ) }', re.VERBOSE) >>> p.sub(r'subsection{\1}','section{First}') 'subsection{First}' >>> p.sub(r'subsection{\g<1>}','section{First}') 'subsection{First}' >>> p.sub(r'subsection{\g<name>}','section{First}') 'subsection{First}'

有時候你可能不滿足簡單的字符串替換,你可能需要在替換的過程中動點“手腳”…沒關(guān)系,一樣可以滿足你!replacement 參數(shù)還可以是一個函數(shù),該函數(shù)將會在正則表達式模式每次不重復(fù)匹配的時候被調(diào)用。在每次調(diào)用時,函數(shù)會收到一個匹配對象的參數(shù),因此你就可以利用這個對象去計算出新的字符串并返回它。

下邊的例子中,替換函數(shù)將十進制數(shù)替換為十六進制數(shù):

>>> def hexrepl(match): ... "Return the hex string for a decimal number" ... value = int(match.group()) ... return hex(value) ... >>> p = re.compile(r'\d+') >>> p.sub(hexrepl, 'Call 65490 for printing, 49152 for user code.') 'Call 0xffd2 for printing, 0xc000 for user code.'

當使用模塊級的 re.sub() 函數(shù)時,正則表達式模式作為第一個參數(shù)。該模式可以是一個字符串一個編譯好的對象。如果你需要指定正則表達式標志,那么你必須使用后者;或者使用模式內(nèi)嵌修正器,例如 sub("(?i)b+", "x", "bbbb BBBB") 返回 'x x'。

總結(jié)

以上是生活随笔為你收集整理的Python正则表达式之修改,分割,搜索和替换字符串(6)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 午夜小影院| 超碰在线人人 | 一级毛片黄片 | 色婷婷综合五月 | 波多野结衣在线观看一区二区 | 国产精品第三页 | 理论片毛片 | 欧美黑人性受xxxx精品 | 免费大片黄在线观看视频网站 | 伊人一区二区三区四区 | 亚洲综合日韩精品欧美综合区 | 插久久| 全部免费毛片 | 黄色小视频在线免费看 | 亚洲视频免费在线观看 | 3p视频在线| 欧美色图888 | 精品少妇无码av无码专区 | 国精产品一区一区三区有限公司杨 | 特黄特色大片免费 | 夜夜骚视频 | 日本老肥婆bbbwbbbwzr | 亚洲视频一区二区在线观看 | 性欧美精品中出 | 午夜剧场福利 | 日韩欧美国产另类 | 精品国产成人av在线免 | 伦理av在线 | 九九九在线| 揉我啊嗯~喷水了h视频 | 欧美xxxxbbbb| 可以看的毛片 | 印度午夜性春猛xxx交 | 精品国精品国产自在久不卡 | 美国一区二区三区 | 免费色网址 | 鲁一鲁色一色 | 在线成人 | 久久精品一二区 | 中出视频在线观看 | 永久在线 | 欧美色图日韩 | 黄色网址在线免费看 | 欧美a∨ | 一本一道久久 | 日本东京热一区二区三区 | 中文国产在线观看 | 在线欧美 | 久久调教 | 国产第一区第二区 | 日韩av网站在线观看 | 国产精品久久久无码一区 | 99热手机在线观看 | 亚洲成a人片 | 午夜宅男网 | 国产网站在线 | 91免费. | 美女又爽又黄视频毛茸茸 | 夜夜骚av一区二区三区 | 怡红院一区 | 国产精品久久久久久亚洲毛片 | 鲁丝片一区二区三区 | 熊出没之冬日乐翻天免费高清观看 | 色网站免费在线观看 | 裸体裸乳被免费看视频 | 国产精品国产一区二区 | 中文字幕 欧美激情 | 性活交片大全免费看 | 久草午夜| 边啃奶头边躁狠狠躁 | 黄色福利片 | 四虎一国产精品一区二区影院 | 波多野结衣在线电影 | 韩国av一区二区 | 天天草视频 | 亚洲无人区码一码二码三码的含义 | 亚洲淫视频 | 黄色一级片免费播放 | 亚洲图片一区二区三区 | 亚洲第一黄 | 99久久久无码国产 | 欧美日韩一区精品 | 国产视频黄色 | 亚洲最大成人av | 天天操天天干天天舔 | 美女隐私免费网站 | 亚洲欧美日韩成人 | 99精品一区二区三区无码吞精 | 一级片观看 | 前任攻略在线观看免费完整版 | 欧美日韩精品一区二区三区蜜桃 | 黄色一级一级 | 黄色av一区二区 | 天天天天天天天天干 | 日本视频一区二区 | 日韩欧美一区二区在线观看 | av解说在线 | 亚洲熟女少妇一区 | 国产成人无遮挡在线视频 |