Unicode与各种编码格式
我的理解是:Unicode是一种规则,法则,抽象的,飘在空中的; 而各种编码则是工具,把Unicode字符捣鼓成我们想要的东西....数据从外部(文件,网络等地方)-->Python程序时
先不急,用一个unicode接住它们,然后再进行之后的各种操作
content = unicode(originalContent, 'src_data_encoding...模块
6 always be utf-8-no-bom总是好的,所有IDE/editor都默认编码为utf-8-no-bom,可以省去许多麻烦(其中Windows的记事本少用,一不小心就忘记了记事本会插入...BOM这一事实)
7 如果能用Python3就绝不使用Python2,3修补了字符串的许多坑(不只是unicode这一项)
举例
1 Windows_cmd控制台打印unicode
Windows8中文版...-Python2.7
s = u'中国人民'
print s #ok,看来Python知道应该使用什么编码,隐式转换了
print s.encode('gbk') #ok,目的地能接受gbk
print