python读取rtf文件_【Python】【IO】文件读写
一、打開的文件在使用完后要關閉
>>>f=file('fibs.py')
#用''表示文件名
#無''表示變量名
>>>f.read()
#打印fibs.py中的內容
#f.read()后可以列出文件內容
#但經過一次f.read()后再次f.read()不可以列出文件內容
#因為指針在文件末尾
#需要f.close()關閉文件后再重新f.read()才可以列出內容
>>> f.closed#判斷文件有無關閉
False#未關閉
>>> f.close()#關閉文件
>>> f.closed#判斷文件有無關閉
True#已關閉
二、readline()和readlines()的區別
以11111.txt文件為例
1.用file()方法讀取文件
>>> f=file('11111.txt')
>>> f.read()
'11111111\n22222222\n33333333\n44444444\n55555555\n66666666\r\n'
>>> f.close()
2.用readline()逐次讀取各行內容
>>> f=file('11111.txt')
>>> f.readline()
'11111111\n'
>>> f.readline()
'22222222\n'
>>> f.readline()
'33333333\n'
>>> f.readline()
'44444444\n'
>>> f.readline()
'55555555\n'
>>> f.readline()
'66666666\r\n'
3.readlines()把每行內容作為列表讀取
>>> f=file('11111.txt')
>>> f.readlines()
['11111111\n', '22222222\n', '33333333\n', '44444444\n', '55555555\n', '66666666\r\n']
三、以'w'寫入方式打開注意事項
1.已有文件時,對原文件進行寫入操作會清空原文件
當我們想對文件進行寫入時,可能會進行如下操作
>>> f=file('11111.txt')
>>> f.write('hello')
Traceback (most recent call last):
File "", line 1, in
IOError: File not open for writing
報錯了,文件未已寫入方式打開
>>> f.close()
關閉文件
正確的寫入文件方法是什么呢?
在此之前先看一下我們要操作的文件11111.txt內容
>>> f=file('11111.txt')
>>> f.read()
'11111111\n22222222\n33333333\n44444444\n55555555\n66666666\r\n'
然后我們以寫入的方式將文本打開
>>> f=file('11111.txt','w')#以寫入方式打開11111.txt文件
>>> f.close()#關閉文件
#一般情況下,文件關閉后會自動刷新緩沖區,但有時你需要在關閉前刷新它,這時就可以使用 flush() 方法。
>>> f=file('11111.txt')#以普通方式打開文件
>>> f.read()#顯示文件內容
''
#文件被清空了
當我們對含有原本11111.txt相同內容的22222.txt文件寫入內容時
>>> f=file('22222.txt')
>>> f.read()
'11111111\n22222222\n33333333\n44444444\n55555555\n66666666\r\n'
>>> f.close()
#一般情況下,文件關閉后會自動刷新緩沖區,但有時你需要在關閉前刷新它,這時就可以使用 flush() 方法。
>>> f=file('22222.txt','w')
>>> f.write('hello')
>>> f.close()
#一般情況下,文件關閉后會自動刷新緩沖區,但有時你需要在關閉前刷新它,這時就可以使用 flush() 方法。
>>> f=file('22222.txt')
>>> f.read()
'hello'
#清空原文件內容并寫入新內容
2.無此文件時,創建新文件進行寫入操作
$ ls
$RECYCLE.BINdesktop.ini
11111.txt培訓.docx
22222.txt刪除.rtf
Microsoft Edge.lnk未命名.rtf
Thumbs.db查看地址.txt - 快捷方式.lnk
Windows 10微博去除格式.rtfd
首先目錄下無33333.txt文件,我們想創建一個內容是'hello',可以進行以下操作
>>> f=file('33333.txt','w')#以寫入方式創建
>>> f.write('hello')#寫入內容'hello'
>>> f.close()#關閉文件
#一般情況下,文件關閉后會自動刷新緩沖區,但有時你需要在關閉前刷新它,這時就可以使用 flush() 方法。
>>> f=file('33333.txt')#打開文件
>>> f.read()#讀取文件
'hello'
>>> f.close()#關閉文件
目錄下多了一個33333.txt的文件
$ ls
$RECYCLE.BINdesktop.ini
11111.txt培訓.docx
22222.txt刪除.rtf
33333.txt未命名.rtf
Microsoft Edge.lnk查看地址.txt - 快捷方式.lnk
Thumbs.db微博去除格式.rtfd
Windows 10
總結:
f=file('666.txt','w')若666.txt文件存在==>清空原文件后以寫入方式打開后可直接調用write()函數寫入新內容
若666.txt文件不存在==>創建此文件且以寫入方式打開后可直接調用write()函數寫入內容
四、使用flush() 方法立刻刷新緩沖區,緩沖區中的數據立刻寫入文件,同時清空緩沖區
優點:省去關閉文件的步驟提升程序運行效率
我們以33333.txt文件為例,對內容進行修改
>>> f=file('33333.txt')
>>> f.read()
'hello'
>>> f.close()
內容是'hello'
調用write()函數對文件進行覆蓋寫入'China'
>>> f=file('33333.txt','w')
>>> f.write('China')#此時‘China’并未真正寫入文件中
>>> f.close()#關閉文件會自動刷新緩沖區,數據寫入文件
也可以直接調用flush() 方法立刻刷新緩沖區
>>> f=file('33333.txt','w')
>>> f.write('China')#此時‘China’并未真正寫入文件中
>>> f.flush()#此時才講'China'從緩存中寫入文件中
五、以'a'追加寫入方式打開注意事項
1.不會清空已有文件內容
>>> f=file('33333.txt')
>>> f.read()#顯示原文件內容
'China'
>>> f.close()
>>> f=file('33333.txt','a')#以追加方式打開文件
>>> f.write('hello')#寫入'hello'
>>> f.close()
>>> f=file('33333.txt')
>>> f.read()#顯示文件內容
'Chinahello'
#發現文件原內容并未刪除,且新內容也成功寫入
>>> f.close()
2.追加方式也可在無文件的情況下創建新文件
$ ls
$RECYCLE.BINdesktop.ini
11111.txt培訓.docx
22222.txt刪除.rtf
33333.txt未命名.rtf
Microsoft Edge.lnk查看地址.txt - 快捷方式.lnk
Thumbs.db微博去除格式.rtfd
Windows 10
以追加方式創建文件
>>> f=file('qqqqq.txt','a')
>>> f.write('qqqqq')
>>> f.close()
>>> f=file('qqqqq.txt')
>>> f.read()
'qqqqq'
>>> f.close()
文件創建成功
$ ls
$RECYCLE.BINdesktop.ini
11111.txtqqqqq.txt
22222.txt培訓.docx
33333.txt刪除.rtf
Microsoft Edge.lnk未命名.rtf
Thumbs.db查看地址.txt - 快捷方式.lnk
Windows 10微博去除格式.rtfd
六、以'r+'追加寫入方式打開注意事項以往我們以'w'、'a'方式打開文件只能寫入,無法讀取
以'r'方式打開文件只能讀取,無法寫入
但‘r+’方式打開文件,既能讀取也可寫入,且原文件不會被清空
優點很多同時也有些問題
>>> f=file('sssss.txt')
>>> f.read()
'1\n2\n3\n4\n5\n6'
>>> f.close()
>>> f=file('sssss.txt','r+')
>>> f.write('qqqqq')
>>> f.flush()#立即刷新緩存,將數據從緩存寫入文件
現文件為
>>> f.close()
>>> f=file('sssss.txt')
>>> f.read()
'qqqqq\n4\n5\n6'
因為指針在開頭,所以把原文件開始的5個字符給覆蓋了
解決辦法
seek() 方法
seek() 方法用于移動文件讀取指針到指定位置。
seek() 方法語法如下:
fileObject.seek(offset[, whence])
參數offset -- 開始的偏移量,也就是代表需要移動偏移的字節數
whence:可選,默認值為 0。給offset參數一個定義,表示要從哪個位置開始偏移;0代表從文件開頭開始算起,1代表從當前位置開始算起,2代表從文件末尾算起。
f.seek(2,1)#2為往后偏移量,1為當前位置
#表示從當前位置往后偏移2個字節
f.seek(0)等同于f.seek(0,0)
#表示從文件開頭往后偏移0個字節,也就是把指針移到文件頂端
f.seek(0,2)
#表示從文件末尾往后偏移0個字節,也就是將指針移到文件末尾
七、各種打開方式詳細細節
八、推薦使用 with open as f語句打開文件
由于文件讀寫時都有可能產生IOError,一旦出錯,后面的f.close()就不會調用。所以,為了保證無論是否出錯都能正確地關閉文件,我們可以使用try ... finally來實現:
try:
f = open('/path/to/file', 'r')
print f.read()
finally:
if f:
f.close()
但是每次都這么寫實在太繁瑣,所以,Python引入了with語句來自動幫我們調用close()方法:
with open('/path/to/file', 'r') as f:
print f.read()
這和前面的try ... finally是一樣的,但是代碼更佳簡潔,并且不必調用f.close()方法。
調用read()會一次性讀取文件的全部內容,如果文件有10G,內存就爆了,所以,要保險起見,可以反復調用read(size)方法,每次最多讀取size個字節的內容。另外,調用readline()可以每次讀取一行內容,調用readlines()一次讀取所有內容并按行返回list。因此,要根據需要決定怎么調用。
如果文件很小,read()一次性讀取最方便;如果不能確定文件大小,反復調用read(size)比較保險;如果是配置文件,調用readlines()最方便:
for line in f.readlines():
print(line.strip()) # 把末尾的'\n'刪掉
九、二進制文件
前面講的默認都是讀取文本文件,并且是ASCII編碼的文本文件。要讀取二進制文件,比如圖片、視頻等等,用'rb'模式打開文件即可:
>>> f = open('/Users/michael/test.jpg', 'rb')
>>> f.read()
'\xff\xd8\xff\xe1\x00\x18Exif\x00\x00...' # 十六進制表示的字節
十、字符編碼
要讀取非ASCII編碼的文本文件,就必須以二進制模式打開,再解碼。比如GBK編碼的文件:
>>> f = open('/Users/michael/gbk.txt', 'rb')
>>> u = f.read().decode('gbk')
>>> u
u'\u6d4b\u8bd5'
>>> print u
測試
如果每次都這么手動轉換編碼嫌麻煩(寫程序怕麻煩是好事,不怕麻煩就會寫出又長又難懂又沒法維護的代碼),Python還提供了一個codecs模塊幫我們在讀文件時自動轉換編碼,直接讀出unicode:
import codecs
with codecs.open('/Users/michael/gbk.txt', 'r', 'gbk') as f:
f.read() # u'\u6d4b\u8bd5'
更多內容可以參考文件讀寫?www.liaoxuefeng.comPython 文件I/O | 菜鳥教程?www.runoob.com
總結
以上是生活随笔為你收集整理的python读取rtf文件_【Python】【IO】文件读写的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vue调用微信qpi
- 下一篇: 基于python的驾校管理系统的设计与实