价格指南

最近更新时间:2025-03-06 16:10:22

我的收藏

基本结构

腾讯云智能数智人售卖三类产品:形象采购、播报服务以及交互服务。形象采购为必选项,可以搭配数智人的播报服务以及交互服务一同使用。需注意,单独购买形象采购、播报服务以及交互服务任一产品均无法直接应用于最终的应用场景,需要组合购买。


形象介绍

形象类别介绍
形象类型
定义
使用场景
示例
2D精品
通过在专业影棚中录制动作素材,经过两周左右的训练可生成应用于播报、交互场景的数智人。精品形象可在文中随机插入指定动作,动作呈现多样性。
适用于金融、传媒类对数智人形象、动作有要求的客户。



2D小样本-通用口型
通过一段真人视频素材进行训练数智人,数智人的外貌与真人一致,口型将采用大模型生成的通用唇齿,训练视频素材要求更低,具体参见形象录制指引-通用口型
适用于对数智人口型无要求、无良好拍摄条件的客户。



2D小样本-专属口型
通过一段真人视频素材进行训练数智人,数智人的外貌与真人一致,口型将采用真人专属唇齿,训练视频素材需无其他人声以及明显环境声,具体参见形象录制指引-专属口型
适用于对数智人形象复刻有要求、有较好拍摄条件的客户。
2D小样本-高精版本
通过一段4K的真人视频素材进行训练数智人,素材采集要求及最终唇齿效果同2D小样本(专属口型),最终数智人的清晰度提升为4K。具体参见形象录制指引-高精版本
适用于大型会议、面对面对话、产品发布会、大屏场景。
2D小样本免训练(视频素材)
通过一段真人视频素材,无需训练,即可通过输入文本或音频,生成人物说话口型与输入内容相匹配的新视频。
适合客户获客拉新、制作营销视频&口播视频场景。


2D小样本-照片数字人
通过一张照片即可训练数智人;该版本主打低价快速,从素材提交后,一般情况下在10分钟后即可使用。照片数智人使用的是照片原始背景,不支持切换背景图片。
适用于泛互、娱乐场景。



3D卡通
根据客户的需求设定数智人五官特征、发型、服饰、配饰等完成原画,待客户评审后敲定最终形象后进行模型制作。后经过骨骼绑定、渲染、UE调优等阶段后可输出覆盖交互、播报场景的数智人。
适用于已有2D吉祥物形象,期望升级为3D形象为用户提供服务的场景。



3D半写实
根据客户的需求设定数智人五官特征、发型、服饰、配饰等完成原画,待客户评审后敲定最终形象后进行模型制作。后经过骨骼绑定、渲染、UE调优等阶段后可输出覆盖交互、播报场景的数智人。
适用于需要一定的写实感但精度要求不高的场景,如资讯播报、手机端智能客服场景。



3D写实
根据客户的需求设定数智人五官特征、发型、服饰、配饰等完成原画,待客户评审后敲定最终形象后进行模型制作。后经过骨骼绑定、渲染、UE调优等阶段后可输出覆盖交互、播报场景的数智人。
适用于需要高写实感和高精度展现的场景,如品牌宣传、大屏交互场景。




形象对比


2D小样本-通用口型
2D小样本-专属口型
2D小样本-高精版本
2D小样本-照片数字人
2D小样本免训练(视频素材)
录制要求
录制至少1mins的视频,对于视频拍摄声音无要求
录制至少3mins的视频,录制环境需要保持安静,仅可录制拍摄主体的声音
录制标准同专属口型,视频分辨率需是4K
仅需要提供一张人物清晰正面照片
录制一段5秒到10分钟的真人视频素材。
交付周期
1天内出demo供客户效果确认,客户点击确认后即可使用
2天内出demo供客户确认效果,客户点击确认后即可使用
3天内出demo供客户确认确认,客户点击确认后即可使用
10分钟内即可使用
无需训练,分钟级即可看到成品视频效果。
成品效果
通用版本使用的为大数据模型生成的唇齿
专属版本为录制本人的口型,面部清晰度更优
在专属口型的效果基础上,输出4K分辨率,更加高清
照片数智人使用的为大数据模型生成的唇齿,身体姿态无法轻微晃动。
照片数智人不支持切换背景。
成品视频会保留录制本人的口型特征。
通用口型 vs 专属口型



通用口型 vs 照片数智人



专属口型 vs 高精版本




价格说明

形象采购

形象采购是指数智人的形象购买,具体可以分为形象租赁、形象定制和声音定制三种方式。
形象租赁:通过租赁公共基础形象库内的形象。租赁期间,为无独占租赁,仅拥有该形象的使用权,该形象的所有权依旧归腾讯方所有,且腾讯方有权将该形象进行二次租赁。 适合对形象专属要求不高、业务处在初期阶段的客户。
形象定制:通过录制训练或者建模的方式对数智人形象进行定制,适用于对自有形象有要求、对形象需要拥有所有权的客户。
声音定制:通过对语音数据的采集训练,复刻特定的声音。
1. 形象租赁
支持租赁公有形象库的形象,具体形象可以参见小时包基础形象库
形象类型
功能描述
价格
2D小样本通用口型
在2D小样本通用口型形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。
50/个/月
400/个/年
2D小样本专属口型
在2D小样本专属口型形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。
125/个/月
1,000/个/年
3D卡通
在3D卡通形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。
18,800/个/月
150,000/个/年
3D半写实
在3D半写实形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。
25,000/个/月
200,000/个/年
3D写实
在3D写实形象库中选取形象租赁,租赁期间为无独占租赁,支持文本驱动或原声驱动,基础动作按照实际形象情况为准。含默认音色。
37,500/个/月
300,000/个/年
2. 形象定制
需要注意:形象定制配额自购买后即生效,有效期为一年。
形象类型
功能描述
价格
2D精品
不限云服务、私有化使用。
支持文本/声音驱动,含1个姿态1套服装1个分辨8个基础动作,赠送默认音色1个。
录制档期1天。
350,000元/个
2D小样本通用口型
限云服务。支持文本及原声驱动。
通过提供1段1分钟视频素材即可定制数智人,含1个默认音色。
服装造型、姿态、动作均以视频素材数据为准。
素材为绿幕纯色背景的,方可支持背景更换功能。
0-20个(不含 20):2,500 元/个
20-80个(不含 80):2,000 元/个
80-200个(不含 200):1,200 元/个
200个 以上:1,000 元/个
2D小样本专属口型
支持文本驱动或原声驱动。
通过提供1段3分钟视频素材即可定制播报数智人,含1个默认音色。
服装造型、姿态、动作均以视频素材数据为准。
素材为绿幕纯色背景,方可支持背景更换功能。
0 - 10 个(不含 10):10,000 元/个
10 - 20 个(不含 20):8,000 元/个
20 - 50 个(不含 50):5,000 元/个
50个以上:3,000 元/个
2D小样本高精版本
支持文本驱动或原声驱动。
通过一段4K的真人视频素材进行训练数智人,素材采集要求及最终唇齿效果同2D小样本(专属口型),最终数智人的清晰度提升为4K。
20,000元/个
2D小样本照片
支持文本驱动或原声驱动。
通过一张照片即可训练数智人,成本低,定制速度快速。
19.9元/个
3D卡通
不限云服务、私有化使用。
支持文本/声音驱动/单目摄像头视频驱动,1套服装、8个动作、1个音色。
3D卡通配套资产精度为B级别。
300,000元/个
3D半写实
不限云服务、私有化使用。
基于“云依”身体模式定制,支持文本/声音驱动/单目摄像头视频驱动,1套服装、8个动作、1个音色。
3D半写实形象配套资产精度为A级别。
450,000元/个
3D写实
不限云服务、私有化使用。
支持文本/声音驱动/单目摄像头视频驱动,基于默认版3D人像(参考哟哟形象身体模板),针对脸型、发型、服装、动作按指定的要求进行客制化,成套模型包含脸型*1、发型*1、服装*1,动作库8个。
如需额外的发型、服装、动作、表情定制,需增项加购。
3D写实配套资产精度为S级别。
790,000元/个
3D写实-数字人驱动模块
适用于客户已有并且满足驱动规范的3D写实形象资产,支持文本驱动或原声驱动。
550,000元/个
3D半写实-数字人驱动模块
适用于客户已有并且满足驱动规范的3D半写实形象资产,支持文本驱动或原声驱动。
250,000元/个
3D卡通-数字人驱动模块
适用于客户已有并且满足驱动规范的3D卡通形象资产,支持文本驱动或原声驱动。
200,000元/个
3. 声音定制
需要注意:声音定制配额自购买后即生效,有效期为一年。
类别
功能描述
价格
声音复刻-极速版
输入秒级别的声音数据,10分钟内即可极速拥有专属AI定制音色;主要用于搭配照片数智人,主打及时可用。可参见声音复刻录制指引-极速版
39.9元/个
声音复刻-基础版
输入100句语料进行声音复刻,训练时长仅需要1天,主要用于搭配2D小样本,适用于对声音要求不高、预算有限的客户。
和极速版相比,基础版能保留更多的口音特色,音色相似度更高。可参见声音复刻录制指引-基础版
0 - 10 个(不含 10):10,000 元/个 10 - 20 个(不含 20):8,000 元/个 20 - 50 个(不含 50):5,000 元/个 50个以上:3,000 元/个
精品声音复刻
输入1000句以上的语料进行声音复刻,训练时长为20天,定制效果更为逼真,可以覆盖较多的发音情况,韵律更加自然,推荐搭配2D精品、3D数智人,适用于对声音有较高要求的客户。
280,000元/个

播报服务

播报服务是指用数智人提供音视频播报的能力,该场景下提供视频生成服务小时包、音频生成服务小时包以及视频生成服务并发三类服务。视频生成服务小时包以及并发将依据形象类型进行收费,不同形象类型的服务包不支持混用。
视频生成服务-小时包:必选。可用于制作播报音视频的视频时长资源包。必须购买此项,才能使用播报服务。
默认同一个用户可同时提交5个视频制作任务(对于2D小样本免训练服务,默认可提交的任务数为1),由主子账号共享,调用的并发资源是所有客户共享,可能会出现排队等待的情况;
可以通过增购“播报并发”,来提升视频制作任务数。例如客户购买了1路2D小样本专属口型播报并发,则一共可同时提交6个2D小样本专属口型视频制作任务,且其中1路视频制作并发是该客户独享;例如客户购买了1路2D小样本免训练播报并发,则一共可同时提交2个2D小样本免训练视频制作任务,且其中1路视频制作并发是该客户独享。
对于2D小样本免训练,默认1个用户可同时提交1个视频制作任务。
音频生成服务-小时包:选购。可用于制作播报音视频的音频时长资源包。如果需要单独生成音频,则需要采购;仅合成数智人视频时,不需要采购。
默认同一个用户可同时提交20个音频制作任务,由主子账号共享;
调用的并发资源是所有客户共享,可能会出现排队等待的情况。
播报并发:选购。可以通过增购“播报并发”,来提升视频制作任务数。
1. 视频生成服务-小时包
形象类型
功能描述
价格
2D精品
数智人租赁/定制形象视频生成时长10小时

0 - 10 个(不含 10):9,600 元/个
10 - 60个(不含 60):3,600 元/个
60个以上: 1,200 元/个
2D小样本通用口型
数智人租赁/定制形象视频生成时长10小时
0 - 10 个(不含 10): 2,000 元/个
10 - 20 个(不含 20): 1,600 元/个
20 - 50 个(不含 50):1,000 元/个
50个以上:600元/个
2D小样本专属口型

数智人租赁/定制形象视频生成时长10小时
0 - 10 个(不含 10): 2,000 元/个
10 - 20 个(不含 20): 1,600 元/个
20 - 50 个(不含 50):1,000 元/个
50个以上:600元/个
2D小样本高精版本
数智人租赁/定制形象视频生成时长10小时
0 - 10 个(不含 10): 4,000 元/个 10 - 20 个(不含 20): 3,200 元/个 20 - 50 个(不含 50):2,000 元/个 50个以上:1,200元/个
2D小样本免训练(视频素材)
视频播报合成小时包-免训练版10小时
5,000元/个
2D小样本照片数字人
数智人租赁/定制形象视频生成时长10小时
0 - 10 个(不含 10): 2,000 元/个 10 - 20 个(不含 20): 1,600 元/个 20 - 50 个(不含 50):1,000 元/个 50个以上:600元/个
3D卡通
数智人租赁/定制形象视频生成时长10小时
0 - 10 个(不含 10):9,600 元/个
10 - 60 个(不含 60):3,600 元/个
60个以上: 1,200 元/个
3D半写实
数智人租赁/定制形象视频生成时长10小时
0 - 10 个(不含 10):14,400 元/个
10 - 60 个(不含 60):5,400 元/个
60个以上:1,800 元/个
3D写实
数智人租赁/复刻声音视频生成时长10小时
0 - 10 个(不含 10):19,200 元/个
10 - 60 个(不含 60):7,200 元/个
60个以上:2,400 元/个
2. 音频生成服务-小时
小时包类型
功能描述
价格
100小时包
限云服务,数智人租赁/复刻声音音频生成时长100小时包
90元/个
1000小时包
限云服务,数智人租赁/复刻声音音频生成时长1000小时包
750元/个
10000小时包
限云服务,数智人租赁/复刻声音音频生成时长10000小时包
6,500元/个
100000小时包
限云服务,数智人租赁/复刻声音音频生成时长100000小时包
55,000元/个
3. 播报并发
形象类型
功能描述
价格
2D精品
支持2D精品,分辨率最高1080p,1路1个具体形象。
3,500元/月/路
27,000元/年/路
2D小样本通用口型
支持2D小样本通用口型,分辨率最高1080p。
3,500元/月/路
27,000元/年/路
2D小样本专属口型
支持2D小样本专属口型,分辨率最高1080p。
3,500元/月/路
27,000元/年/路
2D小样本高精版本
支持2D小样本高精版本,分辨率最高4K。
6,750元/月/路 54,000元/年/路
2D小样本免训练(视频素材)
支持2D小样本免训练(视频素材),分辨率最高1080P。
12,000元/路/月
2D小样本照片
支持2D小样本照片,分辨率最高1080p。
3,500元/月/路 27,000元/年/路
3D卡通
支持3D卡通,分辨率最高1080p。
3,500元/月/路
27,000元/年/路
3D半写实
支持3D半写实,分辨率最高1080p。
5,200元/月/路
41,000元/年/路
3D写实
支持3D写实,分辨率最高1080p。
6,750元/月/路
54,000元/年/路

交互服务

交互服务是指用数智人提供语音交互的能力,常用于智能客服、数智人直播等场景,该场景下提供交互并发的服务,具体是指支持同时在线并发交互建流的数量。交互并发根据形象类型单独提供服务,不同形象类型之间不支持混用。
形象类型
功能描述
价格
2D精品
支持2D精品,分辨率最高1080p,1路1个具体形象。
3,500元/月/路
27,000元/年/路
2D小样本通用口型
支持2D小样本通用口型,分辨率最高1080p
3,500元/月/路
27,000元/年/路
2D小样本专属口型
支持2D小样本专属口型,分辨率最高1080p
3,500元/月/路
27,000元/年/路
2D小样本高精版本
支持2D小样本高精版本,分辨率最高4K。
6,750元/月/路 54,000元/年/路
2D小样本照片
支持2D小样本照片,分辨率最高1080p
3,500元/月/路
27,000元/年/路
3D卡通
支持3D卡通,分辨率最高1080p。
3,500元/月/路
27,000元/年/路
3D半写实
支持3D半写实,分辨率最高1080p。
5,200元/月/路
41,000元/年/路
3D写实
支持3D写实,分辨率最高1080p。
6,750元/月/路
54,000元/年/路

形象定制在架服务

定制在架服务可用于延长定制形象/声音的生效时间。
形象类型
功能描述
价格
2D形象专属口型
支持对2D精品、2D小样本专属口型、2D小样本高精版本的定制形象进行在架服务续期。
150元/月/个
2D形象通用口型
支持对2D小样本通用口型的定制形象进行在架服务续期。
9.9元/月/个
3D形象
支持对3D卡通、3D半写实、3D写实的定制形象进行在架服务续期。
600元/月/个
声音复刻
支持对复刻的声音进行在架服务续期。
150元/月/个

私有化服务

若需要购买私有化服务,请联系您的商务经理进行报价。