前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >简单了解虚拟数字人的制作标准

简单了解虚拟数字人的制作标准

作者头像
产品言语
发布2023-09-09 08:51:34
7361
发布2023-09-09 08:51:34
举报
文章被收录于专栏:产品笔记

虚拟数字人从技术层面理解,是通过计算机图形学、深度学习、语音合成技术、动作捕捉、图形渲染等技术手段聚合合成,具有“人”外观、行为甚至思想的可交互虚拟形态。

数字人分类:


01

3D数字人制作标准

3D数字人的制作标准从影响产品力的两大核心指标进行评估:美术评估和技术评估。

美术评估指标从角色造型辨识度(外貌、性格、背景)、模型精度与骨骼绑定(模型精度、动作流畅度)、不同场景适配度(使用场景、道具互动)三个维度出发,将虚拟数字人的设定元素细化到世界观构建、口头禅、招牌动作等的设计上;考察手发质感、布料质感肢体动作及微表情的精度与流畅度,同时还结合虚拟数字人与场景、道具的互动反馈。

技术评估指标从语音合成效果(清晰度、辨析度、自然度)、内容生成效能(覆盖领域广、生成速度快、内容精度高)、渲染能力(面部渲染技术、骨骼渲染技术、皮肤毛发渲染技术、服饰渲染技术)、角色生成效能(图像质量、生成效率、适用性)、交互能力(人机交互、环境交互)等五个维度进行考察,一方面包括了虚拟数字人制作相关的语音、图像、渲染技术,另一方面包括了虚拟数字人运营相关的内容生成、交互技术等。同时从技术的复杂度、效果度、智能度将指标细化,将虚拟数字人进行分级评估。

根据指标维度,将技术分为 L1-L5 五级、美术分为 A1-A5 五级。虚拟数字人是美术与技术的集合体,两者缺一不可,技术和美术双指标结合评估可以更完整地评估虚拟数字人的产品力。

02

2D数字人制作标准

视频:http://mpvideo.qpic.cn/0bc3zaaagaaaraapc732drsfbsgdapeaaaya.f10002.mp4?

2D数字人的制作标准从影响产品力性能和用户体验的几个关键指标进行评估。

  1. 唇形驱动效果:可以从同步性、准确性、自然性等方面来衡量2D数字人唇形驱动的效果。
    1. 同步性:数字人的唇形动画与语音的同步性,如果同步性好,数字人的唇形运动将与发音时间对齐,给用户带来更真实的体验。
    2. 准确性:数字人的嘴唇运动与实际发音的准确性,包括观察数字人的嘴唇变化是否正确反应了所发出的音素。
    3. 自然性:数字人的唇形驱动是否与现实生活中的人类相似。可以通过观察嘴唇的运动速度、平滑度和过度来进行评估。过于生硬或不自然的嘴唇运动会让观众感到不适。
  2. 表情和肢体语言:除了唇形驱动外,数字人的表情和肢体语言也对整体效果产生影响。表情和肢体语言应与语音信号相协调,以增强沟通效果和真实感。
  3. 运动平滑度:衡量数字人嘴唇运动的平滑程度。通过计算嘴唇运动速度或加速度的变化来实现,得到一个运动平滑度。
  4. 唇形相似度:通过比较数字人嘴型与实际发音者的嘴型之间的相似程度,得出一个数值。可以通过计算嘴唇轮廓之间的距离或相关性来实现。
  5. 主观评估:让不同类型的用户观看并评价数字人的唇形驱动效果。用户可以根据同步性、准确性和自然性等因素进行评价,通过调查问卷、评分、用户反馈等方法来收集,从而衡量整体效果。

为了全面评估数字人产品的性能和用户体验,需要收集和分析这些关键指标。这些数据可以指导产品的优化和改进,以满足用户需求和提高整体体验。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-06-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 产品言语 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档