简介

最近更新时间:2025-08-11 02:42:51

我的收藏

概述

声音复刻(Voice Cloning)为企业提供快速、批量、自动化的定制音色服务。声音复刻基于客户上传的少量录音数据进行模型训练,实现对发音人音色的定制。完成音色训练后,可通过调用 语音合成 输出对应的音色音频。声音复刻广泛适用于数字人、语音社交、资讯播报、短视频制作等场景。

本章节介绍的声音复刻 API 接口均为 API 3.0 接口。
您可以调用 API 进行声音复刻操作,声音复刻支持的所有接口信息请参见 API 概览

术语表

声音复刻 API 接口的常见术语请参见下表:

术语 描述
音质检测 用于检测原始音频的清晰度、是否存在背景噪声及语义一致性。
注:为确保复刻音色的合成效果,需要提供音质良好,发音清晰,切无环境噪音的注册音频

使用限制

对于 API 接口的参数限制,请参考各接口文档中的参数说明。

API 快速入门

您可以使用 API Explorer 工具在线调用 API。

本文以声音复刻任务创建为例,通过 API Explorer 工具调用 API 接口的步骤如下:
1、注册腾讯云账号并通过实名认证后,登录 声音复刻控制台 ,阅读和同意服务条款,单击立即开通,即可获得声音复刻的 API 接口调用权限。
2、进入 API Explorer 页面。更多 API Explorer 工具使用信息,请参见 使用 API Explorer
3、调用 声音复刻 接口。
4、输入相应参数后在线调用查看响应结果。具体输入参数说明可参见 声音复刻任务创建接口