當(dāng)前位置：首頁 > 编程资源 > 综合教程 >内容正文

综合教程

python正则提取txt文本

發(fā)布時(shí)間：2023/12/13 综合教程 31 生活家

生活随笔收集整理的這篇文章主要介紹了 python正则提取txt文本小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

首先，我們的文本可能有兩種格式

1.沒有特殊符號的單一村文本，比如這一份先知的標(biāo)題與對應(yīng)的url

2.第二種是有規(guī)律的，比如ip，賬號密碼，也是我們滲透里經(jīng)常遇到的，

對于提取這2中文本的關(guān)鍵內(nèi)容，這就需要用我們的正則了

第一種用如下代碼

# -*- coding: utf-8 -*
import re
f = open("dg.txt", "r", encoding='utf-8')     
data = f.readlines()                            
f.close()                                       
for line in data:
    pattern = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+')
    string = str(line)
    url = re.findall(pattern,string)
    f1 = open("url.txt", "a+", encoding='utf-8')
    for urls in url:
        f1.write(urls+'\n')
    f1.close()

這是提取url，我們唯一需要改變的就是第七行的正則即可，這是效果

對于第二種，我們用如下代碼

# -*- coding: utf-8 -* 
import re
f = open("p.txt", "r", encoding='utf-8')     
data = f.readlines()                            
f.close()                                       
for line in data:
    f1 = open("city.txt", "a+", encoding='utf-8')
    x = line.split("----")
    f1.write(x[4])
    f1.write("\n")
    print(x[4])
f1.close()

這是效果

我們只需將特殊符號作為正則的標(biāo)志，即可提取。

總結(jié)

以上是生活随笔為你收集整理的python正则提取txt文本的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Lettuce命令延迟测量(Comman
下一篇： Google谷歌官网首页涂鸦记录