一个编码问题的简单测试程序:
#!/bin/env python
# -*- coding: utf-8 -*-
print u"Råbjerg" # >>> unicodedata.name(u"å") = 'LATIN SMALL LETTER A WITH RING ABOVE'
这是我从debian命令框中使用它时得到的结果,我不明白为什么在这里使用redirect会破坏它,因为我可以在不使用的情况下正确看到它。
有人能帮我理解一下我错过了什么吗?打印这些字符的正确方式应该是什么,以便它们在任何地方都可以使用?
每次我遇到Unicode时,什么都不起作用。我在Linux上,我从Windows上得到了这些文件:
$file *
file1: UTF-8 Unicode text
file2: ISO-8859 text
file3: ISO-8859 text
在我发现文件有不同的编码之前,什么都不起作用。我想让我的生活变得轻松,让它们都以相同的格式出现:
iconv -f UTF-8 -t ISO-8859 file1 > test
iconv: conversion to `ISO-8859' is not supported
Try `iconv --help' or `ic
我已经读过了:
我试图坚持经验法则:“始终在内部使用Unicode,解码接收的内容,并对发送的内容进行编码。”
这是我的主要文件:
# coding: utf-8
import os
import sys
from myplugin import MyPlugin
if __name__ == '__main__':
c = MyPlugin()
a = unicode(open('myfile.txt').read().decode('utf8'))
print(c.generate(a).encode('