在尝试实现一个特定说话人的语音识别系统时,我遇到了一些问题。当采用说话人15分钟语音的声学模型时,错误率太高(从6-10个单词中识别出正确的1个单词)。我所做的: 1.我已经将阿拉伯语单词转录成俄语,并将它们放入字典中。2.我已经尝试了ru4sphinx项目的旧模型msu_ru_zero.cd_cont_2000和cmusphinx-ru-5.2的新模型(目前最新的俄语声学模型)。3.我使用了我从自己研究领域的文本中制作的词典和语言模型。在utf-8中有将近200MB的俄语文本。但只有一小部分阿拉伯语词汇在这本词典里。
只有很少的(40个中的4个)音频音轨改编失败,“align audio t
我有一个带有字段的模型,名为phone。在俄语中,它将如下所示:
телефон
有时,当我试图进行查询时,应用程序会向我抛出这样的错误消息:
User with field phone already exists
如果我在设置中将LANGUAGE_CODE设置为ru-RU,则添加具有适当详细名称的Meta类,以前的异常将抛出此类消息:
Пользователь с таким телефон уже существует
这不对。
在此消息的上下文中,字段телефоном.应该称为phone。它最后还有额外的字母。
在某些语言中,如俄语,根据句子的上下文,单词会有不同的结尾。
我试图使用
在阅读和打印python中的土耳其语时,我遇到了以下问题,单词中的土耳其字母无法识别。但是,当我试图在其他语言上存储字符串时,例如俄语、日语和汉语,就不会出现这样的问题。
>>> s = u'abartmadığını'
>>> s
u'abartmad???n?'
>>> print s
abartmad???n?
如何调整编码以解决此问题?我在Windows10上使用Python2.7.10,将命令行的代码页更改为28595似乎不起作用,我只是在Python控制台中得到了以下错误。
LookupErro