python正则提取txt文本
生活随笔
收集整理的這篇文章主要介紹了
python正则提取txt文本
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
首先,我們的文本可能有兩種格式
1.沒有特殊符號的單一村文本,比如這一份先知的標(biāo)題與對應(yīng)的url
2.第二種是有規(guī)律的,比如ip,賬號密碼,也是我們滲透里經(jīng)常遇到的,
對于提取這2中文本的關(guān)鍵內(nèi)容,這就需要用我們的正則了
第一種用如下代碼
# -*- coding: utf-8 -*
import re
f = open("dg.txt", "r", encoding='utf-8')
data = f.readlines()
f.close()
for line in data:
pattern = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+')
string = str(line)
url = re.findall(pattern,string)
f1 = open("url.txt", "a+", encoding='utf-8')
for urls in url:
f1.write(urls+'\n')
f1.close()
這是提取url,我們唯一需要改變的就是第七行的正則即可,這是效果
對于第二種,我們用如下代碼
# -*- coding: utf-8 -*
import re
f = open("p.txt", "r", encoding='utf-8')
data = f.readlines()
f.close()
for line in data:
f1 = open("city.txt", "a+", encoding='utf-8')
x = line.split("----")
f1.write(x[4])
f1.write("\n")
print(x[4])
f1.close()
這是效果
我們只需將特殊符號作為正則的標(biāo)志,即可提取。
總結(jié)
以上是生活随笔為你收集整理的python正则提取txt文本的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Lettuce命令延迟测量(Comman
- 下一篇: Google谷歌官网首页涂鸦记录