我已经开始使用Pytesser了,它对英文和中文都很好用,但是有没有办法同时使用两种语言呢?我需要创建自己的训练数据文件吗?我的代码是:
import Image
from pytesser import *
print image_to_string(Image.open("chinese_and_english.jpg"), lang="eng")
#also want to have chinese be recognized
几天前,我仔细阅读了关于unicode疼痛的文章,几个小时前我问了这个问题:
但最近一个奇怪的问题出现在我的脑海里。
我发现这些密码很好用:
chinese = ['中文', '你好'] # py2, these are bytes, type is str
with open('filename', 'wb') as f:
f.writelines(chinese)
由于我可以在py2和py3中使用任何unicode字符直接声明变量,所以python(或我们)有哪些unicode类型?我们不能在整个程序中使用str(