简介
语音识别是针对已经录制完成的录音文件,进行识别的服务,异步返回识别文本,可应用于呼叫中心语音质检、视频字幕生成,会议语音资料转写等场景。
相关说明
支持中文普通话、英语和粤语的语音识别。
支持 wav、mp3、m4a 的音频格式。
语音文件的时长不能大于5小时,文件大小不超过512MB。
说明
语音识别是付费服务,按照识别时长进行计费,具体费用请参见 计费与定价。
数据万象在每个账户首次产生该服务用量后,将发放一个用量为20小时,有效期为2个月的免费额度资源包,超出用量或资源包到期后将正常计费。
操作步骤
您可通过控制台开启服务,开启服务后,对于当前存储桶中的音频资源,使用相应的语音识别接口即可创建语音识别任务。
1. 登录 数据万象控制台。
2. 在左侧导航栏中,单击存储桶管理,进入存储桶列表。
3. 选择并单击需操作的存储桶名称,进入相应存储桶管理页面。
4. 在左侧导航栏中,选择数据工作流 > 任务管理,并在页面上方选择智能语音页签。
5. 选择任务类型智能语音 > 语音识别,单击创建任务,并按照如下配置项说明进行配置:
源文件路径:输入被处理文件的所在路径,注意文件路径不允许以 / 开头或结尾。
选择模板:您可选择自定义模板。如无,请前往创建模板。
目标存储桶:支持选择同地域下开通了媒体处理功能的存储桶。
目标路径:识别语音后文件后所存放的路径。
目标文件名:您可以在此处指定目标文件名。
队列:目前只支持默认队列 queue-1。