日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

02 re模块

發布時間:2023/12/1 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 02 re模块 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
# re的工作是在python中執行正則表達式 import re# # find # result = re.findall("\d+", "baby的電話號是: 185123456789") # print(result) # # it = re.finditer("\d+", "baby123456789的電話號是: 185123456789") # for el in it: # print(el.group()) # 分組# search 搜索, 查找 # 一旦匹配到結果. 直接返回, 如果匹配不到結果. 返回None # result = re.search("\d", "寶寶的電話是") # print(result) # print(result.group())# 匹配, 從頭開始匹配. 相當于在你正則前面加了一個^ # result = re.match("\d+", "157寶寶的電話是:") # print(result.group())# search和match的區別: search查找. 找到了結果就返回. match. 從頭開始匹配.# # 坑: 爬蟲的一個重點 # # .*? # result = re.finditer(r"姓名:(?P<name>.*?), 愛好:(?P<hobby>.*?),", "姓名:寶寶, 愛好:女,") # for el in result: # print(el.group("name"), el.group("hobby"))# # 正則的常用操作 # result = re.split("\d+", "寶寶110來找你了. 你回頭收拾收拾去119報道") # print(result)# 用正則替換 # s = re.sub("\d+", "__sb__", "寶寶110來找你了. 你回頭收拾收拾去119報道") # print(s)# s = re.subn("\d+", "__sb__", "寶寶110來找你了. 你回頭收拾收拾去119報道") # 替換了xxx次 # print(s)# code = "for i in range(10): print(i)" # # c = compile(code, "", "exec") # 編譯 # # exec(c) # 快速執行# reg = re.compile(r"\d+") # 編譯了一段正則. 加載了一段正則 # lst = reg.findall("呵呵, 寶寶才不去110呢.他要去120了") # print(lst) # # re.findall(r"\d+", "呵呵, 寶寶才不去110呢.他要去120了")# lst = re.findall(r"a(?:\d+)c", "a123456c") # 把括號python中的分組變成了原來正則表達式中的分組 # print(lst)# # 爬取電影天堂 from urllib.request import urlopencontent = urlopen("https://www.dytt8.net/html/gndy/dyzz/20181219/57954.html").read().decode("gbk") # print(content)reg = r'<div id="Zoom">.*?片  名(?P<name>.*?)<br />◎年  代(?P<years>.*?)<br />.*?◎上映日期(?P<date>.*?)<br />'+ \ '.*?◎主  演(?P<main>.*?)◎簡  介.*?<td style="WORD-WRAP: break-word" bgcolor="#fdfddf"><a href="(?P<download>.*?)">' it = re.finditer(reg, content, re.S) # re.S 去掉.里面的\n for el in it:print(el.group("name"))print(el.group("years"))print(el.group("date"))print(el.group("main").replace("<br />      ", ", "))print(el.group("download"))

  

轉載于:https://www.cnblogs.com/work14/p/10192787.html

總結

以上是生活随笔為你收集整理的02 re模块的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。