文档中心>数据万象

语音识别

最近更新时间:2023-05-26 16:33:29

我的收藏

简介

语音识别是针对已经录制完成的录音文件,进行识别的服务,异步返回识别文本,可应用于呼叫中心语音质检、视频字幕生成,会议语音资料转写等场景。

相关说明

支持中文普通话、英语和粤语的语音识别。
支持 wav、mp3、m4a 的音频格式。
语音文件的时长不能大于5小时,文件大小不超过512MB。
说明
语音识别是付费服务,按照识别时长进行计费,具体费用请参见 计费与定价
数据万象在每个账户首次产生该服务用量后,将发放一个用量为20小时,有效期为2个月的免费额度资源包,超出用量或资源包到期后将正常计费。

操作步骤

您可通过控制台开启服务,开启服务后,对于当前存储桶中的音频资源,使用相应的语音识别接口即可创建语音识别任务。
2. 在左侧导航栏中,单击存储桶管理,进入存储桶列表。
3. 选择并单击需操作的存储桶名称,进入相应存储桶管理页面。
4. 在左侧导航栏中,选择数据工作流 > 任务管理,并在页面上方选择智能语音页签。
5. 选择任务类型智能语音 > 语音识别,单击创建任务,并按照如下配置项说明进行配置:



源文件路径:输入被处理文件的所在路径,注意文件路径不允许以 / 开头或结尾。
选择模板:您可选择自定义模板。如无,请前往创建模板。
目标存储桶:支持选择同地域下开通了媒体处理功能的存储桶。
目标路径:识别语音后文件后所存放的路径。
目标文件名:您可以在此处指定目标文件名。
队列:目前只支持默认队列 queue-1。