python正则获取网页标签里面的内容
生活随笔
收集整理的這篇文章主要介紹了
python正则获取网页标签里面的内容
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
# -*- coding:utf-8 -*-
import re
str = "<option value=2018010401>2018級播音與主持藝術1班</option><option value=2018080601>2018級財務管理1班</option><option value=2018080602>2018級財務管理2班</option><option value=2018080603>2018級財務管理3班</option><option value=2018060701>2018級產品設計1班</option><option value=2018060702>2018級產品設計2班</option><option value=2018060401>2018級動畫1班</option><option value=2018060402>2018級動畫2班</option><option value=2018110801>2018級工程管理1班</option><option value=2018110301>2018級工程造價1班</option><option value=2018110401>2018級國際商務1班</option><option value=2018010201>2018級漢語言文學1班</option><option value=2018010202>2018級漢語言文學2班</option><option value=2018060901>2018級環境設計1班</option><option value=2018060902>2018級環境設計2班</option><option value=2018080201>2018級計算機科學與技術1班</option><option value=2018110501>2018級金融工程1班</option><option value=2018080501>2018級經濟學1班</option><option value=2018110701>2018級汽車服務工程1班</option><option value=2018030301>2018級日語1班</option><option value=2018030302>2018級日語2班</option><option value=2018081101>2018級軟件工程1班</option><option value=2018030401>2018級商務英語1班</option><option value=2018030402>2018級商務英語2班</option><option value=2018110101>2018級食品科學與工程1班</option><option value=2018110102>2018級食品科學與工程2班</option><option value=2018220101>2018級食品質量與安全1班</option><option value=2018220102>2018級食品質量與安全2班</option><option value=2018060801>2018級視覺傳達設計1班</option><option value=2018060802>2018級視覺傳達設計2班</option><option value=2018080101>2018級數學與應用數學1班</option><option value=2018080102>2018級數學與應用數學2班</option><option value=2018080103>2018級數學與應用數學3班</option><option value=2018081001>2018級網絡工程1班</option><option value=2018010601>2018級網絡與新媒體1班</option><option value=2018110601>2018級物流工程1班</option><option value=2018010101>2018級新聞學1班</option><option value=2018080401>2018級信息管理與信息系統1班</option><option value=2018080301>2018級信息與計算科學1班</option><option value=2018030501>2018級英語1班</option><option value=2018030502>2018級英語2班</option><option value=2018030503>2018級英語3班</option><option value=2018030504>2018級英語4班</option><option value=2019010401>2019級播音與主持藝術1班</option><option value=2019010402>2019級播音與主持藝術2班</option><option value=2019080601>2019級財務管理1班</option><option value=2019080602>2019級財務管理2班</option><option value=2019080603>2019級財務管理3班</option><option value=2019060701>2019級產品設計1班</option><option value=2019060702>2019級產品設計2班</option><option value=2019060401>2019級動畫1班</option><option value=2019060402>2019級動畫2班</option><option value=2019110801>2019級工程管理1班</option><option value=2019110301>2019級工程造價1班</option><option value=2019110401>2019級國際商務1班</option><option value=2019010201>2019級漢語言文學1班</option><option value=2019010202>2019級漢語言文學2班</option><option value=2019060901>2019級環境設計1班</option><option value=2019060902>2019級環境設計2班</option><option value=2019081201>2019級計算機科學與技術(嵌入式系統)1班</option><option value=2019110501>2019級金融工程1班</option><option value=2019080501>2019級經濟學1班</option><option value=2019110701>2019級汽車服務工程1班</option><option value=2019030301>2019級日語1班</option><option value=2019030302>2019級日語2班</option><option value=2019081101>2019級軟件工程1班</option><option value=2019030401>2019級商務英語1班</option><option value=2019030402>2019級商務英語2班</option><option value=2019110101>2019級食品科學與工程1班</option><option value=2019110102>2019級食品科學與工程2班</option><option value=2019220101>2019級食品質量與安全1班</option><option value=2019220102>2019級食品質量與安全2班</option><option value=2019060801>2019級視覺傳達設計1班</option><option value=2019060802>2019級視覺傳達設計2班</option><option value=2019060803>2019級視覺傳達設計3班</option><option value=2019080101>2019級數學與應用數學1班</option><option value=2019080102>2019級數學與應用數學2班</option><option value=2019080103>2019級數學與應用數學3班</option><option value=2019081001>2019級網絡工程1班</option><option value=2019010601>2019級網絡與新媒體1班</option><option value=2019010602>2019級網絡與新媒體2班</option><option value=2019110601>2019級物流工程1班</option><option value=2019010101>2019級新聞學1班</option><option value=2019080401>2019級信息管理與信息系統1班</option><option value=2019080302>2019級信息與計算科學1班</option><option value=2019030501>2019級英語1班</option><option value=2019030502>2019級英語2班</option><option value=2019030503>2019級英語3班</option><option value=2019030504>2019級英語4班</option><option value=2020010401>2020級播音與主持藝術1班</option><option value=2020010402>2020級播音與主持藝術2班</option><option value=2020080601>2020級財務管理1班</option><option value=2020080602>2020級財務管理2班</option><option value=2020060701>2020級產品設計1班</option><option value=2020060702>2020級產品設計2班</option><option value=2020060401>2020級動畫1班</option><option value=2020060402>2020級動畫2班</option><option value=2020110801>2020級工程管理1班</option><option value=2020110301>2020級工程造價1班</option><option value=2020110401>2020級國際商務1班</option><option value=2020010201>2020級漢語言文學1班</option><option value=2020010202>2020級漢語言文學2班</option><option value=2020060901>2020級環境設計1班</option><option value=2020060902>2020級環境設計2班</option><option value=2020080201>2020級計算機科學與技術1班</option><option value=2020110501>2020級金融工程1班</option><option value=2020080501>2020級經濟學1班</option><option value=2020110701>2020級汽車服務工程1班</option><option value=2020030301>2020級日語1班</option><option value=2020030302>2020級日語2班</option><option value=2020081101>2020級軟件工程1班</option><option value=2020030401>2020級商務英語1班</option><option value=2020030402>2020級商務英語2班</option><option value=2020110101>2020級食品科學與工程1班</option><option value=2020220101>2020級食品質量與安全1班</option><option value=2020060801>2020級視覺傳達設計1班</option><option value=2020060802>2020級視覺傳達設計2班</option><option value=2020080101>2020級數學與應用數學1班</option><option value=2020080102>2020級數學與應用數學2班</option><option value=2020080103>2020級數學與應用數學3班</option><option value=2020081001>2020級網絡工程1班</option><option value=2020010601>2020級網絡與新媒體1班</option><option value=2020110601>2020級物流工程1班</option><option value=2020010101>2020級新聞學1班</option><option value=2020080301>2020級信息與計算科學1班</option><option value=2020030501>2020級英語1班</option><option value=2020030502>2020級英語2班</option><option value=2020030503>2020級英語3班</option><option value=2020030504>2020級英語4班</option></select></td></tr></table>"
content = re.findall(r'<option.*?>(.*?)</option>', str)
result = '\n'.join(content)f=open("runoob.txt","w")
f.write(result)
print(content)
總結
以上是生活随笔為你收集整理的python正则获取网页标签里面的内容的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 鲁大师如何判断操作系统是不是正版?
- 下一篇: 小白学数据:教你用Python实现简单监