创建 AIGC 声音复刻

最近更新时间:2026-05-15 03:53:15

我的收藏

1. 接口描述

接口请求域名: vod.tencentcloudapi.com 。

该接口用于创建 AIGC 音色复刻。注意,调用本接口会产生费用,请参考计费文档

默认接口请求频率限制:20次/秒。

推荐使用 API Explorer
点击调试
API Explorer 提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力。您可查看每次调用的请求内容和返回结果以及自动生成 SDK 调用示例。

2. 输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数

参数名称 必选 类型 描述
Action String 公共参数,本接口取值:CreateAigcAudioClone。
Version String 公共参数,本接口取值:2018-07-17。
Region String 公共参数,此参数为可选参数。
SubAppId Integer

点播应用 ID。从2023年12月25日起开通点播的客户,如访问点播应用中的资源(无论是默认应用还是新创建的应用),必须将该字段填写为应用 ID。


示例值:221073
AudioFileInfo AigcAudioCloneInputFileInfo

原音频文件(需要确保可访问) 模型将以此参数中传入的音频音色为示例对音色进行复刻。

入参限制:注1:音频仅支持格式:mp3、m4a、wav; 注2:上传的音频文件的时长最少应不低于 10 秒,最长应不超过 5 分钟; 注3:上传的音频文件大小需不超过20mb; 注4:音频内容免涉版权,否则会被下架或销毁。

VoiceId String

自定义的声音ID,示例:"vidu01"。

入参限制:

  • 自定义的 voice_id 长度范围[8,256];
  • 首字符必须为英文字母;
  • 允许数字、字母、横线、下划线;
  • 末位字符不可为 -、_
  • voice_id 不可与已有 id 重复,否则会报错.

示例值:maigua111
Text String

复刻试听参数。

参数格式:限制 1000 字符以内,模型将使用复刻后的音色朗读本段文本内容,并返回试听音频链接。 注:试听将根据字符数正常收取语音合成费用。


示例值:华强怎么还没来
PromptAudioFileInfo AigcAudioCloneInputFileInfo

音色复刻示例音频。提供本参数将有助于增强语音合成的音色相似度和稳定性,若使用本参数,需同时上传一小段示例音频。

入参限制:注1:音频仅支持格式:mp3、m4a、wav; 注2:上传的音频文件的时长最少应小于 8 秒; 注3:上传的音频文件大小需不超过20mb。

PromptText String

示例音频对应的文本内容 需确保和音频内容一致,句末需有标点符号做结尾。


示例值:你瞧瞧现在哪有瓜呀,这都是大棚的瓜,你嫌贵我还嫌贵呢。
Payload String

透传参数。 入参限制:不做任何处理,仅数据传输 注:最多 1048576个字符


示例值:mypayload
SessionId String

用于去重的识别码,如果三天内曾有过相同的识别码的请求,则本次的请求会返回错误。最长 50 个字符,不带或者带空字符串表示不做去重。


示例值:mySessionid
SessionContext String

来源上下文,用于透传用户请求信息,音画质重生完成回调将返回该字段值,最长 1000 个字符。


示例值:mySessionContext
TasksPriority Integer

任务的优先级,数值越大优先级越高,取值范围是 -10 到 10,不填代表 0。


示例值:10
ExtInfo String

保留字段,特殊用途时使用。


示例值:myExtInfo

3. 输出参数

参数名称 类型 描述
TaskId String

任务ID。


示例值:221073-CreateAigcAudioClone-4f736149667baa953315afe87daacad6t
RequestId String 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。

4. 示例

示例1 创建 AIGC 音频复刻

输入示例

POST / HTTP/1.1
Host: vod.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: CreateAigcAudioClone
<公共请求参数>

{
    "SubAppId": 221073,
    "AudioFileInfo": {
        "Type": "Url",
        "Url": "https://cg-sdk-1258344699.cos.ap-nanjing.myqcloud.com/personal/jeffgaogao/aigc/output2z.mp3"
    },
    "VoiceId": "maigua111",
    "Text": "华强怎么还没来",
    "PromptAudioFileInfo": {
        "Type": "Url",
        "Url": "https://cg-sdk-1258344699.cos.ap-nanjing.myqcloud.com/personal/jeffgaogao/aigc/output2z.mp3"
    },
    "PromptText": "你瞧瞧现在哪有瓜呀,这都是大棚的瓜,你嫌贵我还嫌贵呢。",
    "Payload": "mypayload",
    "SessionId": "mySessionid",
    "SessionContext": "mySessionContext",
    "TasksPriority": 10,
    "ExtInfo": "myExtInfo"
}

输出示例

{
    "Response": {
        "TaskId": "221073-CreateAigcAudioClone-4f736149667baa953315afe87daacad6t",
        "RequestId": "dcde7626-cee7-4005-8974-3696244613bf"
    }
}

5. 开发者资源

腾讯云 API 平台

腾讯云 API 平台 是综合 API 文档、错误码、API Explorer 及 SDK 等资源的统一查询平台,方便您从同一入口查询及使用腾讯云提供的所有 API 服务。

API Inspector

用户可通过 API Inspector 查看控制台每一步操作关联的 API 调用情况,并自动生成各语言版本的 API 代码,也可前往 API Explorer 进行在线调试。

SDK

云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

命令行工具

6. 错误码

以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码

错误码 描述
FailedOperation 操作失败。
FailedOperation.InvalidVodUser 没有开通点播业务。
InternalError 内部错误。
InvalidParameter 参数错误。
InvalidParameterValue.FileId FileId 不存在。
InvalidParameterValue.SubAppId 参数值错误:应用 ID。
UnauthorizedOperation 未授权操作。