欢迎点击「算法与编程之美」↑关注我们!
本文首发于微信公众号:"算法与编程之美",欢迎关注,及时了解更多此系列文章。
问题描述
a = [x for x in range(10)]
b = (x for x in range(10))
你能看出上面两行用python编写的代码有什么区别吗?
如果你能够很快的看出区别,那么恭喜你,你的python基础非常的扎实,如果不能,那么本文对于你来说就非常有价值。
表面上看二者的区别在于,一个使用了中括号[],一个使用了小括号(),但是这两者之间有什么本质的区别呢?
问题分析
首先来看以下中括号的情况:
a = [x for x in range(10)]
type(a) # list
使用type(a)方法可以查看a的类型是list,这就是平时所说的python的列表类型。
接着来看一下小括号的情况:
b = (x for x in range(10))
type(b) # generator
可以看到,b的类型是generator。
此时可以看到二者之间的区别,一个是list类型,另外一个是generator类型,但是这二者之间有什么区别呢?接下来将通过案例的形式来展示它们的区别。
设计一个案例,分两次来遍历所有的元素,第一次遍历的循环变量设置为i,第二次遍历的循环变量设置为j,接下来观察它们的区别。
首先还是来看list类型的变量a的情况。
for i in a:
print(i)
输出:
0
1
2
3
4
5
6
7
8
9
for j in a:
print(j)
输出:
0
1
2
3
4
5
6
7
8
9
上面的输出结果和我们之前理解的一样,没什么不同之处。接下来看一下generator类型的变量b的情况。
for i in b:
print(i)
输出:
0
1
2
3
4
5
6
7
8
9
for j in b: print(j)输出:(空)
第一次用for循环遍历的时候,打印了所有的元素,但是第二次遍历的时候,什么也没有打印。出现了很奇怪的现象。这就是generator和list的最大的区别。
结语
generator可以理解为是一种生产消费型的数据结构,先生产数据,然后进行消费,而且消费的数据具有不可逆性。如上面的示例,生产了10个元素,第一次循环就消费了十个,还剩下零个元素。而第二个循环再次进行消费时,此时已没有任何元素,因此输出为空。
而对于list来说,不会因为第一次遍历,就会影响后面的遍历,每一次遍历都是相互独立的,不会对后续产生任何影响。
为什么要设计generator这样的数据结构呢?它的意义在于什么地方?有什么作用呢?欢迎持续关注后续文章,也欢迎留言讨论。
where2go 团队
微信号:算法与编程之美
温馨提示:点击页面右下角“写留言”发表评论,期待您的参与!期待您的转发!