日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【爬虫】-爬取食品检验结果

發布時間:2025/7/14 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【爬虫】-爬取食品检验结果 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
# 需求 爬取網站上的所有的關于藥品檢驗記錄的信息,并輸出到excel文件中 import requests from bs4 import BeautifulSoup import redef find_all_a_tag():"""考慮到只有一次使用機會,這里uel就寫死好了,沒有持續傳參數:return:"""url = r'http://www.nifdc.org.cn/CL0873/'html_t = requests.get(url)soup = BeautifulSoup(html_t.text, 'lxml')# 這里的注釋:做成標簽文檔樹的形式檢查一下html文件是否爬取正確# res = soup.prettify()# print(res)a_list = soup.find_all(id='table297')[0].find_all('a')path_url = 'http://www.nifdc.org.cn/'url_list = []# 找到所有的html后綴,完成拼接for i in a_list:# print(i)path_url_plus = re.findall('C\w{5}', str(i))[0]p = path_url + path_url_plus + '/'url_list.append(p)return url_listdef single_page_get(url):"""解析傳入url的a標簽:param url::return:"""html_text = requests.get(url)soup = BeautifulSoup(html_text.text, 'lxml')tag = soup.find_all(id='table5')[0].find_all('a')return tagdef get_all_a():"""返回所有的和記錄有關的a標簽0.a標簽內所有的C開頭/結尾的剔除1.a標簽內如果是http開頭的,直接加入列表2.如果是..開頭的,拼接上一個tag:return:"""all_list = []tags = find_all_a_tag()for tag in tags:tag_t = single_page_get(tag)# print(tag)for i in tag_t:path_url_plus = re.findall('C\w{5}/\d+\.html', str(i))path_url_plus_1 = re.findall('http.+\.htm', str(i))path_url_plus_2 = re.findall('attach.+\.htm', str(i))if path_url_plus_2:fin_a_path2 = ('http://www.nifdc.org.cn/'+path_url_plus_2[0])all_list.append(fin_a_path2)if path_url_plus_1:fin_a_path1 = path_url_plus_1[0]all_list.append(fin_a_path1)# print(i)a_path_url_plus = re.findall('\d+\.html', str(path_url_plus))if a_path_url_plus:fin_a_path3 = (tag+a_path_url_plus[0])all_list.append(fin_a_path3)return all_listdef get_re():passif __name__ == '__main__':all_list = get_all_a()# print(len(all_list))for i in all_list:print(i) 爬蟲源碼

用爬蟲的知識爬取到企業的所有的a標簽內容,然后再做信息數據的提取,目前只找到了所有的a標簽數據

轉載于:https://www.cnblogs.com/pandaboy1123/p/9712656.html

總結

以上是生活随笔為你收集整理的【爬虫】-爬取食品检验结果的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 天天射视频 | 欧美成人精品欧美一级 | 97在线免费视频 | 久久久久久久伊人 | 1024久久| 国产免费看| 羞羞动漫在线观看 | free女性xx性老大太 | 借种(出轨高h) | 综合精品久久 | 97av在线播放 | 性感美女被爆操 | 青青青草视频 | 古代玷污糟蹋np高辣h文 | 欧美午夜在线视频 | 免费黄色网址视频 | 性欧美精品男男 | 亚洲福利社 | 亚洲国产精品视频一区二区 | 翔田千里一区二区三区av | 国产欧美精品久久久 | 成年人视频在线 | 操她视频网站 | 成年人黄色 | 91久久精品日日躁夜夜躁欧美 | 欧美日韩综合一区二区三区 | 亚洲区在线播放 | 成人黄色大片在线观看 | a激情 | 日韩毛片网 | 久久久在线视频 | 三级做爰第一次 | 俄罗斯精品一区二区三区 | 男人天堂99 | 日本大胆裸体做爰视频 | 久久综合国产精品 | 男生操女生屁股 | 午夜一级影院 | 在线精品国产 | 亚洲天堂一区二区三区 | 欧美一区二区三区四区五区 | 免费福利小视频 | 亚洲精品乱码久久久久久国产主播 | 女人天堂网站 | jizzjizz国产 | 国产免费视频 | 亚欧精品在线观看 | 99精品国产99久久久久久97 | 国产成人一区二区三区影院在线 | 国产精品视频入口 | 91精品一区二区三区在线观看 | 欧美绿帽合集xxxxx | 一区二区国产在线观看 | av成人动漫 | 中文字幕视频网站 | 性精品 | 91九色中文| 久久传媒 | 一区二区www | 亚洲一区二区三区影视 | 天天色天天干天天色 | 亚洲天堂视频网 | jizz一区二区 | 日韩中文字幕精品视频 | 精品成人一区 | 欧美精品黄 | 亚洲二级片 | 国产精品午夜影院 | 亚洲精品9999 | 午夜久 | 日韩激情中文字幕 | 国产免费播放 | 一区二区成人精品 | 无码国产精品高潮久久99 | 国产亚洲精品成人 | 性色av一区 | 久久毛片网 | 国产一区二区三区在线免费观看 | a毛片在线观看 | 婷婷久久综合 | 日韩毛片无码永久免费看 | 欧美v日本 | 日日骚av一区二区 | 18欧美性xxxx极品hd | 久久精品欧美视频 | 在线观看不卡的av | 污视频网站在线 | 日本中文字幕免费 | 国产乱子伦精品 | 五月婷婷丁香综合 | 综合久久网 | 国产视频成人 | 激情一区二区三区 | 国产又黄又嫩又滑又白 | www.97av.com| 九九精品九九 | 日韩黄色视屏 | 国产精品久久久久高潮 | 97看片吧 |