原文:http://yaoyaoblog.xyz/2017/09/04/wtfPython%E2%80%94Python%E4%B8%AD%E4%B8%80%E4%BA%9B%E5%A5%87%E5%A6%99%E7%9A%84%E4%BB%A3%E7%A0%81/
wtfPython是github上的一个项目,作者收集了一些奇妙的Python代码片段,这些代码的输出结果会和我们想象中的不太一样;
通过探寻产生这种结果的内部原因,可以让我们对Python里的一些细节有更广泛的认知。
1.字典键的隐式转换
输出如下:
原因:
Python的字典键的比较是通过哈希值来比较的
在Python里如果两个不可变对象的值相等,那他们的哈希也是一样的
因此此处hash(5) == hash(5.0)是True的,所以键被隐式的转换了
2.生成器执行时间的差异
输出:
原因
在一个生成器表达式里,in的操作是在声明时求值的,而if是在运行期求值的
所以在运行期之前,array已经被重新分配成了[2,8,22],x的值也是2,8,22
3.在列表迭代式删除item
输出:
原因
其实只有list3才算是合格的写法,对一个正在迭代的对象进行修改并不是一个很好的选择,正确的做法应该是建立一份该对象的拷贝来进行迭代
对于list1,del item删除的只是item变量而不是变量指向的数据,对列表本身没有影响
对于list2和list4,因为列表的迭代是根据索引来的,第一次删掉了索引为0的1,剩下[2, 3, 4],然后移除索引 1(此时为3),剩下了[2, 4],此时只有2个元素,循环结束
4.else的不同处理
对于循环的else
输出:
对于try的else
输出:
原因
循环后的else只会在经过了所有迭代且没有出现break的时候才会执行
一个try模块后的else会在try里的代码成功执行完后去执行
5.python里的is
原因
is和==是不一样的;is判断的是两个对象是否是同一个对象,而==判断的是两个对象的值是否相等;即is是既要值相等又要引用一致
在Python中-5~256因为被经常使用所以被设计成固定存在的对象
6.循环里的局部变量泄露
代码段1
输出:
代码段2
输出:
代码段3
在Python2.x里的输出:
在Python3.x里的输出:
原因
对于代码段1,在Python中,for循环可以使用包含他们的命名空间的变量,并将他们自己定义的循环变量保存下来;* 对于代码段2,如果我们在全局命名空间里显示定义for循环变量,则循环变量会重新绑定到现有变量上。
对于代码段3,在Python3.x中改变了对列表解析的语法形式;Python2.x中,列表解析的语法形式为:[… for var in item1, item2, …];而Python3.x的列表解析式为:[… for var in (item1, item2, …)],这种情况下不会发生循环变量的泄露
7.+和+=的区别
代码段1
输出:
代码段2
输出:
原因
a = a + b的操作生成了一个新的对象并建立了一个新的引用
a += b是在a这个列表上做extend操作
8.关于try—finally里的return
输出:
原因
在try…finally这种写法里面,finally中的return语句永远是最后一个执行
一个函数的return的值是由最后一个return语句来决定的
9.True=False
输出:
原因
最开始的时候,Python是没有bool类型的(使用0表示false,使用非0值表示真),后来加上了True,False和bool类型;但是为了向后兼容性,True和False并没有被设置成常量,而只是一个内建变量,所以可以被赋值修改
在Python3当中,因为并没有向后兼容,所以不会有这种情况发生
10.一步操作,从有到无
输出:
原因
许多修改序列/映射对象的方法(例如list.append, dict.update, list.sort等等)都是直接修改对象并返回一个None;所以平常碰到这种直接修改的操作,应该避免直接赋值。
11.Python的for
输出:
原因
Python的for循环机制是每次迭代到下一项的时候都会解包并分配一次;即range(4)里的四个值在每次迭代的时候都会解包一次并赋值;所以i = 10对迭代没有影响。
学习Python和网络爬虫,关注公众号:datanami
领取专属 10元无门槛券
私享最新 技术干货