迭代器是Python中的一个高级概念,迭代器是一个实现了迭代器协议的对象,那何为迭代器协议呢?
满足下面两个条件就行。(1)该对象实现了__iter__()方法;(2)该对象实现了next()方法,返回当前元素,并指向下一个元素的位置,如果当前位置已无元素,则抛出StopIteration异常。
看下面例子
这说明列表这个对象实现了迭代器协议。如果一个对象有__iter__()方法,那么它就是可迭代对象。可以利用迭代器协议来遍历可迭代对象,例如下面例子:
#coding=utf-8
a = range(3)
it = a.__iter__()
while 1:
try:
print it.next()
except StopIteration:
break
输出结果:
1
2
其实吧,for语句就是获取了容器的迭代器、调用迭代器的next()方法以及对StopIteration进行处理等流程进行封装了的语法糖,类似的还有in/not in语句。
迭代器的优势有很多:
(1)定义了统一的访问容器的接口,我们可以随时定义自己的迭代器,只要实现了迭代器协议就行。
(2)迭代器有惰性求值的特性,它进可以在迭代至当前元素时才计算,所以非常适合遍历元素非常多的容器,而且更省内存。
看下面例子:
#coding=utf-8
class Fab(object):
def __init__(self, max):
self.max = max
self.n, self.a, self.b = 0, 0, 1
def __iter__(self):
return self
def next(self):
if self.n < self.max:
r = self.b
self.a, self.b = self.b, self.a + self.b
self.n = self.n + 1
return r
raise StopIteration()
for one in Fab(5):
print one
输出结果如下:
1
2
3
4
5
迭代器使用的内存会更小。看看下面的例子:
print sys.getsizeof(Fab(5))
print sys.getsizeof([1,2,3,4,5])
输出结果如下:
同样是获取含有元素1,2,3,4,5的容器,迭代器更省内存。还有一个,看下面例子:
print sys.getsizeof(Fab(5))
print sys.getsizeof(Fab(50))
print sys.getsizeof(Fab(500))
print sys.getsizeof(Fab(5000))
输出结果如下:
占用的内存并没有因为元素的增多而增加,所以在编写代码时要多多使用迭代器或者迭代协议。
Python中内置了一个iter()函数,可以返回一个迭代器对象,它接受的参数是一个实现了__iter__()方法的容器(也就是可迭代对象)或者迭代器。对于有__iter__()方法的容器,__iter__()也返回一个迭代器对象。
python中有itertools模块,里面的函数都是用迭代器实现的,效率很高,有时间你可以去了解下。