我想从Python 3中的txt文件中读取一些cyrilic文本,这就是文本文件所包含的内容。
абцдефгчийклмнопярстувшхыз
我用:
with open('text.txt', 'r') as myfile:
text=myfile.read()
print (text)
但这是python外壳中的输出:
ÿþ01F45D3G89:;<=>?O@ABC2HEK7
有人能解释一下为什么这是输出吗?
发布于 2017-10-26 17:59:10
Python支持这种类型的utf-8。
你应该能够:
with open('text.txt', encoding = 'utf-8', mode = 'r') as my_file:
...
另外,请确保您的文本文件是以utf-8编码保存的。我在shell中测试了这一点,如果没有适当的编码,我的输出是:
?????????????????????
用适当的编码:
file = open('text.txt', encoding='utf-8', mode='r')
text = file.read()
print(text)
абцдефгчийклмнопярстувшхы
发布于 2017-10-26 17:52:02
尝试使用编解码器处理该文件,您需要
进口码
然后再做
text =codecs.open(“text.txt”、“r”、“utf-8”)
基本上你需要utf8
https://stackoverflow.com/questions/46960730
复制相似问题