概述
声音复刻(Voice Cloning)为企业提供快速、批量、自动化的定制音色服务。声音复刻基于客户上传的少量录音数据进行模型训练,实现对发音人音色的定制。完成音色训练后,可通过调用 语音合成 输出对应的音色音频。声音复刻广泛适用于数字人、语音社交、资讯播报、短视频制作等场景。
本章节介绍的声音复刻 API 接口均为 API 3.0 接口。
您可以调用 API 进行声音复刻操作,声音复刻支持的所有接口信息请参见 API 概览 。
术语表
声音复刻 API 接口的常见术语请参见下表:
术语 | 描述 |
---|---|
音质检测 | 用于检测原始音频的清晰度、是否存在背景噪声及语义一致性。 注:为确保复刻音色的合成效果,需要提供音质良好,发音清晰,切无环境噪音的注册音频 |
使用限制
对于 API 接口的参数限制,请参考各接口文档中的参数说明。
API 快速入门
您可以使用 API Explorer 工具在线调用 API。
本文以声音复刻任务创建为例,通过 API Explorer 工具调用 API 接口的步骤如下:
1、注册腾讯云账号并通过实名认证后,登录 声音复刻控制台 ,阅读和同意服务条款,单击立即开通,即可获得声音复刻的 API 接口调用权限。
2、进入 API Explorer 页面。更多 API Explorer 工具使用信息,请参见 使用 API Explorer 。
3、调用 声音复刻 接口。
4、输入相应参数后在线调用查看响应结果。具体输入参数说明可参见 声音复刻任务创建接口。