我正在做一个语音识别任务,它涉及到检测儿童的说话能力,随着时间的推移,.
我想使用来为检测的ASR部分提供文本API。然后我会用不同测量的记录来估计进展。
但!Google语音API的句子级自动更正一致地重写了口语语句的前一个分支.
是否有一种方法可以禁用此ASR?的自动更正
我不能用"speechContext“、"single_utterance”或"maxAlternatives“选项绕过这个问题。
"single_utterance“可能对单词起作用,但它纠正了拼写错误。
在这个领域有什么建议吗?
发布于 2018-02-25 14:23:05
如果您使用流而不是批处理识别,您应该收到一个答案,一旦该部分的音频被转录,它不会等待其余的句子。然后,您应该只存储流提供的第一个答案,而不是进一步的更正。
这意味着您不需要等待到isFinal=True
。
关于我所指的快速和肮脏的例子,请使用语音API页面,并在打开开发工具的情况下运行流测试。在这里,您将看到在说话时接收到的流数据:
https://stackoverflow.com/questions/48932010
复制相似问题