日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 前端技术 > HTML >内容正文

HTML

爬虫-基于bs4库的HTML内容查找方法

發布時間:2025/7/14 HTML 16 豆豆
生活随笔 收集整理的這篇文章主要介紹了 爬虫-基于bs4库的HTML内容查找方法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

bs4有一個find_all(name,attrs,recursive,string,**kwargs)方法,返回一個列表類型,存儲查找的結果

name 對標簽名稱的檢索字符串

attrs 對標簽屬性值的檢索字符串,可標注屬性檢索,可查找某標簽中是否含有特定的字符串

?recursive 是否對子孫全部檢索,默認True

string <>...</>中字符串區域的檢索字符串

?

舉例說明:

name

soup.find_all('a')#返回a標簽的內容 soup.find_all(['a','b'])#返回a和b標簽的內容for tag in soup.find_all(True):#打印文檔中的所有標簽名字print(tag.name) ''' 返回 html head title body p b p a a ''' #使用正則化后: import re#如果我們只想得到以b開頭的標簽,n那么我們需要正則表達式,re是相應的庫 for tag in soup.find_all(re.compile('b')):print(tag.name) #返回 body b

?attrs:

soup.find_all('p','course')#查找p標簽中包含'course'的信息 soup.find_all(id='link1') '''返回 [<a class="py1" href="http://www.icourse163.org/course/BIT-268001" id="link1">Basic Python</a>] ''' soup.find_all('link')#返回[]import re soup.find_all(id=re.compile('link'))#利用正則表達式查找包含link的標簽內容 ''' [<a class="py1" href="http://www.icourse163.org/course/BIT-268001" id="link1">Basic Python</a>,<a class="py2" href="http://www.icourse163.org/course/BIT-1001870001" id="link2">Advanced Python</a>] '''

recursive:

soup.find_all('a',recursive=False) #返回[]表明兒子節點上沒有a標簽

string:

soup.find_all(string='Basic Python') #['Basic Python']import re soup.find_all(string=re.compile('python'))#所有在字符串中出現Python的字符串檢索 ''' ['This is a python demo page','The demo python introduces several python courses.'] '''

另外,我們可以使用

<tag>(..)等價于<tag>.find_all(..)

soup(..)等價于soup.find_all(..)

?

find的擴展方法

方法說明
<>.find()搜索切只返回一個結果,字符串類型,同find_all()參數
<>.find_parents()在先輩節點中搜索,返回列表類型,同find_all()參數
<>.find_parent()在先輩節點中返回一個結果,同上
<>.find_next_siblings()在后續平行節點中搜索,同上
<>.find_next_sibling()在后續節點中返回一個結果,同上
<>.find_previous_siblings()在前序平行節點中搜索,同上
<>.find_previous_sibling()在前序平行節點中返回一個結果,同上

轉載于:https://www.cnblogs.com/rayshaw/p/8577120.html

總結

以上是生活随笔為你收集整理的爬虫-基于bs4库的HTML内容查找方法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产特级淫片免费看 | 国产一级片麻豆 | 韩国三级中文字幕 | 久草手机在线观看 | 狠狠爱av | 色婷婷中文 | 欧美伦理一区 | 91看片视频| 又黄又爽又色视频 | 国产一区免费看 | 日韩一级视频 | 久久性感视频 | 图书馆的女友动漫在线观看 | 韩日成人 | 中文字幕一区二区三区乱码人妻 | 国产野外作爱视频播放 | 寂寞d奶大胸少妇 | 1024精品一区二区三区日韩 | 中文字幕少妇在线三级hd | 911香蕉| 亚洲欧美一区二区三区四区五区 | xxxwww在线观看 | 国产欧美日韩精品区一区二污污污 | 亚洲av无码一区二区乱孑伦as | 天堂在线精品 | 日本丰满熟妇hd | 国语av| 色呦呦在线观看视频 | 国产女主播一区二区 | 初尝人妻少妇中文字幕 | 亚洲国产精品久久久久久6q | 婷婷丁香六月天 | 亚洲区自拍偷拍 | 精品日韩中文字幕 | 欧美精品一区三区 | 亚洲欧美激情图片 | 91传媒理伦片在线观看 | 色哟哟视频在线观看 | 精品国产大片大片大片 | 福利免费在线观看 | 亚洲精品少妇一区二区 | 欧美综合图片 | 国产欧美精品一区二区三区 | 日本a天堂| 色哟哟国产 | 日本a在线免费观看 | 亚洲美女影院 | 先锋av资源网 | 中文字幕免费在线播放 | 天堂色综合 | 风间由美一区二区 | 国产精品爱啪在线线免费观看 | 国内精品免费 | 欧美视频网站 | 国产香蕉av| 香蕉久久网站 | 色妞色视频一区二区三区四区 | 国产精品午夜久久 | 芒果视频在线观看免费 | 影音先锋久久久 | 色牛影院| 日韩一级黄 | 河北彩花av在线播放 | chinese中国性按摩hd | 亚洲精品高清视频在线观看 | 最新日韩在线视频 | 色偷av| 伊人久久久久久久久久久久久 | 欧美日韩黄色一级片 | 欧美一区二区三区成人精品 | 国产精品久久91 | 久久精品动漫 | 精品动漫一区二区三区的观看方式 | 亚洲中字幕 | 中文字幕狠狠干 | 欧美日韩综合网 | 男男受被啪到高潮自述 | 青青偷拍视频 | 日本xxxxxwwwww | 操丰满女人 | 国产一区二区三区网站 | 欧美日韩综合一区二区三区 | 国产精品青青草 | 久久五月天婷婷 | 草草视频在线播放 | 国产精品入口麻豆九色 | 亚洲精品视频国产 | 空姐吹箫视频大全 | 国产精品不卡视频 | 97爱视频 | 成人免费小视频 | 金鱼妻日剧免费观看完整版全集 | 亚洲一区二区免费看 | 国产精品suv一区二区69 | 影音先锋丝袜制服 | 国产熟妇一区二区三区aⅴ网站 | 久久精品一二区 | 91国产大片 | 日本爱爱免费视频 |