2025年2月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
形象类型新增2D小样本(免训练版本) | 平台 | 推出2D小样本免训练(视频素材),无需训练,分钟级生成数字人。只需一段真人视频素材,输入文本或音频,即可快速生成口型匹配的新视频,省时省力。 核心优势: 1. 极速体验: 无需训练,几分钟出成品。 2. 门槛更低: 适合获客拉新、营销口播等场景。 3. 成本更低: 无训练费,可尝试多场景、多服装拍摄,丰富视频内容。 注意: 目前仅支持播报服务,不支持交互服务。 | 2月19日 |
2024年12月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
2D小样本专属口型基础形象库视觉升级 | 形象库升级 | 2D小样本专属口型基础形象库视觉升级,品质全面提升。 升级说明: 1.现有用户: 在有效期内,您的专属口型形象将保持不变,确保体验一致性。 2.新购/续购用户: 升级后,您将享受全新视觉效果的专属口型形象,体验更佳。 | 12月18日 |
2024年8月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
数智人平台及 API 功能新增 | 平台/接口 | 数智人播报能力的相关优化,包含: 1. 数智人平台音视频播报模块增加保存和草稿功能 2. 播报视频新增支持输出带通道的 mov 格式,可通过数智人平台-生成视频、播报 aPaaS 指定输出格式 3. 优化了数智人平台上对形象位置、大小缩放的限制规则,更好适配视频制作需求 4. 新增音色筛选及搜索功能以便快速查找,同时优化了无性别音色的展示规则 | 8月8日 | |
数智人小程序体验升级 | 能力升级 | 1. 新增支持2D小样本通用口型定制体验,每微信用户可免费体验1次定制,及定制形象对话&播报效果 2. 新增支持照片数智人风格化,包含插画、国风、3D插画等多种风格生成,敬请体验 | 8月8日 | - |
2024年7月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
2D小样本形象定制能力升级 | 平台/接口 | 2D小样本数智人定制流程的优化,包含: 1. Demo 确认部分的优化:支持客户指定音色和语速定制 Demo,支持客户提前指定文案、音色及语速、音频生成 Demo;形象定制时,支持自动将视频里的音频提取出来快速复刻,生成文本驱动 Demo;支持预览全部视频片段(即带帧号的pv视频)。 2. 支持客户在定制2D小样本(专属口型、通用口型和高精版本)数智人时,通过接口或平台上传 alpha 通道视频制作。 3. 支持客户在定制2D小样本(专属口型、通用口型和高精版本)数智人时,上传白幕或白墙背景的视频,支持白幕扣图。 | 7月19日 |
2024年4月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
视频定制接口能力升级 | 接口 | 优化播报视频制作资源共享的逻辑: 1. 每种形象类型,默认支持同时处理5个视频制作任务,由主子账号共享;调用的视频制作并发资源是所有客户共享的,可能会出现任务排队的情况。 2. 客户可增购播报独享并发,详情见:购买页。例如客户购买了1路播报独享并发,则支持同时处理6个视频制作任务。 | 4月25号 | |
SDK增加快速跑通接入方案 | 接口 | H5 SDK增加快速跑通方案,保证接入方可以在10分钟内完成接入工作,并最终得到一个包含完备 UI 的数智人交互对话界面。 | 4月23日 | |
数智人平台功能升级 | 平台 | 支持对定制形象和复刻的声音资产在架服务的续期管理 | 4月10号 | |
声音复刻能力升级 | 平台/接口 | 新增声音复刻(极速版),包含: 1. 支持通过15秒的音频快速进行声音复刻; 2. 支持下单购买声音复刻(极速版),详见:购买页; 3. 支持通过定制接口进行声音复刻(极速版)的定制; 4. 支持在播报&交互 apaas 和平台上使用定制好的声音。 | 4月8号 |
2024年3月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
数智人平台V3.0.0发布 | 平台/接口 | 支持在数智人平台进行一站式大模型配置,包含: 1. 支持直接创建大模型应用、绑定同 UIN 下应用、通过 appkey 绑定应用到数智人交互项目; 2. 支持配置大模型应用,如知识管理、导入文档等; 3. 支持互动调优数智人话术。 | 3月27日 | |
数智人平台支持iPaaS模式 | 接口 | 支持 iPaaS(Integration Platform as a Service)的模式,支持快速集成配置端(数智人平台)页面并进行主题色、品牌 logo 的配置 | 3月27日 | |
数智人小程序体验升级 | 能力升级 | 1. 可官网扫码直接体验照片数字人、2D小样本、3D数智人等形象类型,在大模型流式对话下驱动下的效果 2. 每微信用户可免费体验3次照片数字人定制,及定制形象对话&播报效果 | 3月27日 | - |
3D形象及能力升级 | 能力升级 | 3D形象支持使用小样本音色 | 3月27日 | - |
2024年2月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
形象类型新增2D小样本(照片数字人) | 平台/接口 | 支持新产品2D小样本(照片数字人),包含: 1. 新增通过定制接口进行照片数字人定制; 2. 支持通过平台上传照片、查看定制进度; 3. 支持在资产管理里,查看下发的照片数字人; 4. 支持在播报&交互 apaas 和平台上使用照片数字人。 | 2月4日 |
2023年11月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
形象类型新增2D小样本(通用口型) | 平台 | 支持新产品2D小样本(通用口型),包含:
1. 新增通过定制接口进行数字人定制;
2. 支持通过平台上传素材、查看定制进度;
3. 支持在资产管理里,查看下发的通用口型数字人;
4. 支持在播报&交互 apaas 和平台上使用通用口型数字人。 | 11月2日 |
2023年10月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
数智人平台及 API 功能新增 | 平台/接口 | 1. 新增个人资产模块(含默认音色、默认语速设置) 2. 新增新客领用流程,支持自助领用交互及播报服务体验资源 3. 2D小样本定制流程支持自定义文本与音频驱动 demo 4. 支持使用腾讯云公有云音色(可调情感风格、情感程度、音量增益) 5. 运营统计分析模块口径提示+新增会话次数相关统计 6. 扩充了音频驱动/定制音频素材时,支持的音频格式均由 wav、mp3 扩展到 wav、mp3、wma、m4a、aac 5种格式 | 10月26日 | |
3D形象及能力升级 | 能力升级 | 1. 标准形象库扩充,新增S级写实形象呦呦2.0、A级半写实形象艾云、B级卡通形象叮当 2. 3D驱动路线升级,口型驱动效果提升 3. 新增表情能力,支持平台插入表情,提升形象表情表现力 4. 动作制作方案优化,静默动作自然度提升,增加自然头部和身体晃动,动作中支持丰富表情表现 | 10月27日 |
2023年7月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
播报 aPaas V4.8.5发布 | 接口 | 1. 支持更长的原始视频素材片段,用于最终数智人生成视频服务 2. 播报视频可以通过 apaas 接口指定首尾帧 3. 音频驱动场景下,可以通过 apaas 接口支持首尾帧归位 4. 资产管理API接口支持查询“带帧号的闭嘴视频片段”,便于选择合适的帧号 | 7月29日 |
2023年6月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
小样本形象定制接口V1.2.0发布 | 接口 | 支持通过接口查询形象定制全流程状态 | 6月20日 |
2023年4月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关文档 |
小样本形象定制接口V1.1.0发布 | 接口 | 支持通过 API 接口上传形象定制素材和声音定制素材 | 4月25日 |
2023年2月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
数智人平台发布 | 平台 | 1. 融合播报平台和交互平台 2. 标准形象库支持平台预览 | 2月8日 |
2023年1月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
播报平台能力更新 | 平台 | 1. 形象新增,支持小样本数智人 2. 上线原声驱动的功能 3. 支持制作、下载和删除音频文件 4. 支持带 alpha 通道透底视频生成,格式为 webm | 1月3日 | - |
2022年12月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
交互数智人V1.7.0 | 平台 | 1. 并发数和形象绑定 2. 支持给形象进行声音驱动的单独授权 3. 给主账号授权交互体验优化 | 12月5日 |
2022年11月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
交互数智人V1.6.0 | 平台 | 1. 功能新增,交互数人与渲染小程序插件接入上线,针对话术100%固定的场景可使用该小程序插件,提升并发 2. 交互数智人云端预渲染方案上线 3. 首页增加视频流实时预览功能,降低用户接入验证成本 4. 小程序扫码体验:二维码延长生效时间至2小时、且共享数智人项目的并发,提升 POC 的体验 5. 入库方式体验优化:话术内容自动添加,提升用户体验 6. 话术管理页面添加“累计调用次数”、“渲染情况”等新的字段 7. 话术管理兼容文本客服配置的富文本样式 | 11月9日 |
2022年10月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
购买页发布 | 购买页 | 支持线上下单购买产品 | 10月26日 |
2022年9月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
交互数智人V1.5.0 | 平台 | 1. 【形象升级】2D真人形象驱动模型升级,提升形象的自然度、美白度和清晰度。 2. 【功能新增】2D/3D数字人增加声音驱动能力 3. 【音色上新】新增音色 4. 【体验优化】形象切换时,话术管理部分的优化 5. 【体验优化】提示文案优化 | 9月12日 | - |
2022年8月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
播报aPaas接口V4.0.0 | 接口 | 1. 【3D形象上线】接口新增3d形象,包含呦呦5套服装,同交互平台 2. 【2D形象扩充】新增多个2D形象 3. 【功能扩充】播报接口功能扩充 4. 【效率提升】透明背景制作效率提升 5. 【配置优化】播报接口权限管理逻辑优化 | 8月5日 | - |
播报平台 | 平台 | 1. 【平台更名】更名为“腾讯云-播报数智人平台” 2. 【音色切换】支持音色切换 3. 【内容编辑】支持文本、TTS标注及动作标注 4. 【视频设置】支持视频不同的分辨率、比例;支持上传片头片尾 | 8月11日 | - |
交互数智人V1.4.0 | 平台 | 1. 【能力新增】上线7个新的高自然度音色;可试听语速
【对接对话】文本客服页面的嵌入,可直接在交互数智人里配置对话 2. 【对接对话】可绑定任意客服机器人的对话(非本人账号创建的也可以) 3. 【话术增强】话术管理页面优化:3D增加智能动作匹配&批量导入回复语 4. 【话术增强】不使用云小微对话服务的 bot,也可以使用话术管理,进行动作&语音&样式标注干预 5. 【组件化】组件化能力:面向三方平台提供组件化输出能力;面向内部平台提供基于权限底座的组件化输出能力 6. 【功能新增】形象融合部分能单独分配权限;存量的账号默认不勾 7. 【体验优化】优化扫码体验的二维码的体验 | 8月10日 |
2022年7月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
交互数智人V1.3.0 | 平台 | 1. 【对接对话】平台上支持绑定对话,且支持实时扫码体验带对话的数智人效果。 2. 【话术增强】支持基于对话回复语进行语音&动作标注,且支持实时的效果预览。 3. 【话术增强】支持基于对话回复语,进行选择题、图片等特殊样式配置。 4. 【声音驱动】雅妮声音驱动模型上线平台,且增加声音驱动能力的扫码体验。 5. 【类型增加】增加2D卡通类型,支持用户选择形象,且在平台上配置动作组。 6. 【形象上架】上架6个含动作的云萱(原静萱)文本驱动形象;和2个雅妮声音驱动的形象。 7. 【体验优化】增加屏幕自适应、扫码体验优化等若干体验升级。 | 7月4日 | - |
2022年6月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
交互数智人V1.2.1 | 平台 | 1.【配置端】完成对接云小微权限底座,平台可支持对客开通体验
2.【配置端】支持客户通过平台创建多个数智人 bot,灵活分配并发
3.【接入端】支持客户自助在平台上获取接口 Key,无需线下提供
4.【形象范围】客户体验的形象数量范围,由全量变成可灵活控制 | 6月8日 | - |
播报数智人 aPaas | 接口 | 支持 webm 格式透明背景、动作标签、TTS 试听(MP3格式)、字幕文件下载(SRT 格式)、全局语速调整、多音字标注、数字标注、连读/停顿设置等数智人核心能力 | 6月27日 | - |
2022年5月
动态名称 | 分类 | 动态详情 | 发布时间 | 相关链接 |
交互数智人 V1.0.0 | 平台 | 1. 新增管理端配置平台: 可视化操作:可直接在配置平台上切换形象、修改背景等,操作便捷高效;配置好的内容,支持实时扫码体验。 接口升级:由原来单独提供 API 接口,升级为提供“配置平台+aPaaS 接口”;在平台上完成配置修改后,在 aPaaS 接口可实时生效 页面组件化:配置端具有以前端组件形式被集成到业务系统的能力 2. 新增形象库中的数智人形象 | 5月17日 | - |