python文件对象是可以迭代的_详解python可迭代对象、迭代器和生成器
可迭代對象
什么是可迭代對象?顧名思義就是可以迭代的一個對象,再通俗點就是可以被for循環(huán)遍歷的對象,如常用的list、str等數(shù)據(jù)類型。我們可以使用isinstance來判斷這個數(shù)據(jù)是否是可迭代對象,在此要先從Iterable包中導入模塊collections。
from collections import Iterable
a = 1 #int
b= [1,2,3] #list
c= "abc" #str
d = {1,2,3} #set
e = (1,2,3) #tuple
f = {1:'a',2:'b'}#dict
g = open('test.py')
print (isinstance(a,Iterable))
print (isinstance(b,Iterable))
print (isinstance(c,Iterable))
print (isinstance(d,Iterable))
print (isinstance(e,Iterable))
print (isinstance(f,Iterable))
print (isinstance(g,Iterable))
False
True
True
True
True
True
True
可以看出除了像int、float、complex這種基本類型外,其他的數(shù)據(jù)類型都是屬于可迭代對象,包括文件對象。他們之所以被python內部認為是一種可迭代對象,是因為他們都具有__iter__方法,用hasattr可以看出來。
a = 1 #int
b= [1,2,3] #list
c= "abc" #str
d = {1,2,3} #set
e = (1,2,3) #tuple
f = {1:'a',2:'b'}#dict
g = open('test.py')
print (hasattr(a,'__iter__'))
print (hasattr(b,'__iter__'))
print (hasattr(c,'__iter__'))
print (hasattr(d,'__iter__'))
print (hasattr(e,'__iter__'))
print (hasattr(f,'__iter__'))
print (hasattr(g,'__iter__'))
False
True
True
True
True
True
True
靠__iter__這個方法我們就可以自己創(chuàng)造一個可迭代對象,如下所示:
from collections import Iterable
class A():
def __init__(self):
pass
def __iter__(self):
pass
class B():
def __init__(self):
pass
a = A()
b = B()
print (isinstance(a,Iterable))
print (isinstance(b,Iterable))
True
False
上面代碼可以看出來,在一個類中加入了__iter__這個方法,實例化的對象就會被python內部認為是一個可迭代的對象。
迭代器
上面介紹了什么是可迭代對象。那么什么是迭代器呢?迭代器跟可迭代對象又是什么關系呢?那么先解釋第一問,迭代器對象是要求支持迭代器協(xié)議的對象,在Python中,支持迭代器協(xié)議就是實現(xiàn)對象的__iter__()和next()方法。其中__iter__()方法返回迭代器對象本身;next()方法返回容器的下一個元素,在結尾時引發(fā)StopIteration異常。事實上,我們可以用上述的方法來檢測一下那些數(shù)據(jù)類型是不是屬于迭代器。
from collections import Iterator
a = 1 #int
b= [1,2,3] #list
c= "abc" #str
d = {1,2,3} #set
e = (1,2,3) #tuple
f = {1:'a',2:'b'}#dict
g = open('test.py')
print (isinstance(a,Iterator))
print (isinstance(b,Iterator))
print (isinstance(c,Iterator))
print (isinstance(d,Iterator))
print (isinstance(e,Iterator))
print (isinstance(f,Iterator))
print (isinstance(g,Iterator))
False
False
False
False
False
False
True
結果顯示除了文件對象,其他的數(shù)據(jù)類型都不是迭代器,上面說過,迭代器必須同時有__iter__和__next__方法,我們可以看看文件對象和列表,比較他們是否有__next__方法,依次驗證。
print (hasattr(b,'__next__'))#list
print (hasattr(g,'__next__'))#文件對象
False
True
再講一下可迭代對象和迭代器的區(qū)別,我們都知道在學習python時流行這么一句話“一切皆對象”,那么顯然易見可迭代對象就包括了迭代器,之所以把把文件對象又叫做迭代器,是因為它多了一種__next__方法而已。
知道了上述所講的內容后,我們就可以試著自己寫一個迭代器,無非就是加入__iter__和__next__方法。
from collections import Iterator
class A():
def __init__(self,i):
self.n = 0
self.i = i
def __iter__(self):
return self
def __next__(self):
if self.i > self.n:
var = self.i
self.i -= 1
return var
else:
raise StopIteration()
a = A(5)
print (isinstance(a,Iterator))
for i in a:
print (i)
#True
#5
#4
#3
#2
#1
創(chuàng)建一個迭代器還可以使用python內置的函數(shù)iter和next,如下:
from collections import Iterator
a = [1,2,3]
b = iter(a)
print (next(b))
print (isinstance(b,Iterator))
1
True
上述代碼用iter將一個可迭代對象變成了一個迭代器,然后就可以使用迭代器的專用方法next來一個一個地取出數(shù)據(jù)。
for循環(huán)內部機制
a = [1,2,3]
for i in a:
print(i)
#1
#2
#3
為什么一個列表放在for循環(huán)里就可以很快地取出內部所有元素呢?正常來說,一個可迭代對象是不能直接從其中取出元素的,但放在for循環(huán)里就可以,這是因為在循環(huán)時,它會先自動調用__iter__方法將列表變成一個迭代器,然后這個迭代器再調用其__next__()方法。
生成器
首先我們需要知道的是生成器本質就是一個迭代器,它同樣擁有__iter__和__next__兩個方法。與迭代器不同的是,他可以產生延遲操作,既不會立即出現(xiàn)結果,而是在你需要的時候才產生。生成器通過生成器函數(shù)產生,生成器函數(shù)可以通過常規(guī)的def語句來定義,但是不用return返回,而是用yield一次返回一個結果,在每個結果之間掛起和繼續(xù)它們的狀態(tài),來自動實現(xiàn)迭代協(xié)議。也就是說,yield是一個語法糖,內部實現(xiàn)支持了迭代器協(xié)議,同時yield內部是一個狀態(tài)機,維護著掛起和繼續(xù)的狀態(tài)。
def A(n):
print ("----生成器開始-----")
i = 1
while n != 0:
print("開始循環(huán)第%d次"%i)
yield n
n -= 1
print ("第%d循環(huán)結束"%i)
i += 1
print ("----生成器結束----")
a = A(3)
print (a.__next__())
----生成器開始-----
開始循環(huán)第1次
5
可以看出,生成器函數(shù)直接調用并不會馬上執(zhí)行,只有用next方法才能開始執(zhí)行,next一次,他會直到碰到y(tǒng)ield就會馬上結束,當再次寫一個next方法時(如下所示),它會在yield后繼續(xù)執(zhí)行下去,直到碰到下一個yield才會停止。如果沒有找到y(tǒng)ield,就會報出異常。
----生成器開始-----
開始循環(huán)第1次
5
第1循環(huán)結束
開始循環(huán)第2次
4
上述代碼如果next方法執(zhí)行四次,就會報出StopIteration錯誤。如下所示:
Traceback (most recent call last):
----生成器開始-----
開始循環(huán)第1次
File "D:/untitled/test.py", line 20, in
3
第1循環(huán)結束
開始循環(huán)第2次
2
第2循環(huán)結束
開始循環(huán)第3次
1
print (a.__next__())
第3循環(huán)結束
----生成器結束----
StopIteration
生成器中還有兩個很重要的方法:send()和close()。
send(value):next()方法可以恢復生成器狀態(tài)并繼續(xù)執(zhí)行,其實send()是除next()外另一個恢復生成器的方法。與next不同的是,它需要傳入一個參數(shù),一般傳入None,即send(None)與next()是等效的。
close():這個方法用于關閉生成器,對關閉的生成器后再次調用next或send將拋出StopIteration異常。
總結
以上是生活随笔為你收集整理的python文件对象是可以迭代的_详解python可迭代对象、迭代器和生成器的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java编程思想泛型对混入的详细探讨
- 下一篇: websocket python爬虫_p