提交音质检测任务

最近更新时间:2024-11-13 15:22:12

我的收藏
朗读获取声音训练文本内容,录制好音频文件上传到指定 cos 路径后,需要进行音频质量检测,检测通过的音频会返回 AudioId,使用该 AudioId 调用定制接口进行一句话声音定制。

调用协议

HTTPS + JSON
POST /v2/ivh/assetmanager/zeroshotservice/detectaudioquality
Header Content-Type: application/json;charset=utf-8

请求参数

参数
类型
必须
说明
TextId
string
获取声音训练文本接口返回的 TextId
ReferenceText
string
音频参考文本,ReferenceText 和 TextId 为两种不同方式获取声音训练文本,可以都不填或二选一,能获取更加准确音质检测结果
AudioUrl
string
语音文件 url 地址,要求:
1. url 地址为通过4.1上传到指定路径的资源 url 地址后增加 zeroshot 路径,例如/customer-pipline/{数字}/{uuid}/zeroshot/xxx.mp3
2. 建议上传音频时长为10-30S,单个文件不超过20M
3. 音频格式支持 wav、mp3、aac、m4a、wma、asf,采样率需大于等于16K;对于压缩格式,建议码率大于等于128kbps
4. 音频命名为2-50个字符,只允许有汉字、字母、数字、下划线、横线

返回参数

参数
类型
必须
说明
TaskId
string
制作的任务 ID,携带 TaskId 访问查询音质检测任务进度,可获得检测进度和检测结果

请求示例

{ "Header": {}, "Payload": { "AudioUrl": "https:\\/\\/virtualhuman-cos-prod-1251316161.cos.accelerate.myqcloud.com\\/customer-pipeline\\/1322\\/c9d435f3-9dfb-42c8-9b39-c0117d3cd35c\\/zeroshot\\/90450181730994661.mp3" } }

返回示例

{ "Header": { "Code": 0, "DialogID": "", "Message": "ok", "RequestID": "c9d435f3-9dfb-42c8-9b39-c0117d3cd35c" }, "Payload": { "TaskId": "6da6f935-de23-4337-b753-64cca3627362" } }