暂无搜索历史
腾讯 | 社区FAQ (已认证)
按照文档说明,Version应该取值为'2019-08-23',文档链接:https://cloud.tencent.com/document/product/1073/37995
腾讯云大数据AI产品中心高级研究员。
有可能是服务不稳定造成的,请重新请求一下看下是否还会发生这样的错误。如果仍然有这类错误发生,请再联系我们。
如果只是单纯的转换后缀,那么仍然还是没办法识别的,需要用特定的工具转化为正常的wav类型音频。识别结果为空有可能是采样率不匹配,目前一句话识别只支持8k和16k的采样率的音频识别。
不需要服务端这边额外配合,参照SDK里的说明即可接入。
暂时不支持这种功能,如果有需求的话,把每个词单独请求一次,结果文本自行处理即可。
请确认下音频格式是否符合“识别8k(16k)的16bit的mp3或者wav音频”与音频本地路径是否正确。还有可能是音频长度的问题,一句话识别要求音频时长大于1秒小于60秒。
这边如果无法确定音频数据的准确性,建议使用SourceType(语音数据来源)为0,即语音URL的方式进行音频数据的传输。可将音频数据放在腾讯云对象存储的服务上,然后在Url参数上填写公网可下载的音频,发送请求进行识别。
请开发者检查下接口请求的参数(比如采样率、文件格式等),务必和 demo 中的 test.wav 一致, 否则无法正确识别。
用户在发请求时提供的回调URL(即:回调接口)需要是公网URL,否则无法通过此URL接收腾讯云侧回传的结果(包括识别结果,音频长度等)。
用adobe audition可以获取音频的各类参数,然后可在调用语音识别各类服务接口的请求中写入相关参数。
目前的语音合成功能无法指定多音字的发音,是合成引擎根据合成文本的上下文自动判断的,后续会考虑开发这方面的功能。
暂时不能区分其他动物的声音。
关于机器翻译,后台系统有做限制,目前普通用户的翻译服务统一qps限制为5。我们的系统计划在2019年4月份接入付费服务,用户可通过付费的方式,提升qps的限制。
录音文件识别(即:离线语音识别)的上传语音时长应大于或等于 1 秒并小于 1 个小时。
实时语音识别对硬件没有特别要求,只要能录取到声音或者提供音频就行。
目前调用频率没限制。
是的,录音文件识别服务就是离线语音识别服务。
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址