近年来数字人发展备受关注且市场规模呈现高速增长的态势。据IDC发布的《中国AI数字人市场现状与机会分析,2022》报告预测:到2026年中国AI数字人市场规模将达102.4亿元人民币。此外,各级政府也积极出台相关政策推动数字人技术创新和应用的发展,例如北京市就发布了国内首个针对数字人产业的专项支持政策,旨在打造数字人产业的创新高地。尽管态势利好,但数字人行业却仍存在技术门槛高、成本高,但体验感不佳等诸多难题,动辄一套动捕服就需要几万乃至几十万,再加上背后十几人的运营团队,数字人制作成本始终居高不下。如今伴随人工智能和深度学习等技术的不断突破,数字人逐渐实现了投入与用户体验之间的平衡,火山语音发布的首个超写实数字人员工小灿,便是一例成功尝试。
多项自研技术助力数字人逼真呈现
据了解,火山语音数字人技术已从单纯的外表打造向动作、情感交互等方向进军,让其能更高效理解需求,更顺畅地与人们交互,其中AI驱动能力作为数字人发展的重要技术,它不仅能让数字人更低成本、更高效率打造细腻的表情、连贯的动作,还能让数字人带给用户更接近人类的真实体验。
火山语音突出的AI驱动口型能力可以合成与输入文本或语音完全匹配的唇形,准确率高达98.55%。在声音呈现方面,火山语音团队的“一条音频秒级别音色复刻”技术在数字人小灿的身上实现落地应用:能够让数字人高保真还原真人音色、说话风格,还能还原声学环境,极大提升用户与数字人互动时的体验感。团队多项核心自研技术以及3D超写实数字人整套形象设计、资产制作、高成本影视级cg管线视频内容的制作能力等,让火山语音团队未来在数字人领域的探索与创作中拥有强大的技术基础和优势能力。
蓄势待发下好虚拟现实“先手棋”
目前,我国数字人已经进入广泛实际场景应用阶段。从数字人客服到数字人主播,再到数字员工,多行业收获虚拟现实相关技术带来的利好。而作为AI技术研发团队的火山语音,深谙拥抱数字人,就等同于下好虚拟现实的“先手棋”这个道理,早已在此领域耕耘数年、蓄势待发。
在多年技术积淀下,目前火山语音团队已建立了包括2D、3D卡通和3D超写实在内的虚拟数字人产品矩阵,涵盖“播报型数字人”和“交互型数字人”两种类型,其中播报型数字人,即输入文本或语音,就可生成自然生动的数字人播报视频;交互数字人作为播报型数字人的形态升级,依托于火山语音长期积累的成熟语音交互技术,可以做到“善听”、“会说”、“能想”,与用户面对面实时交互。
2022年6月,火山引擎虚拟人数字平台已获得信通院首批数字人系统基础能力认证。2023年初,火山语音还加入了“十四五”国家重点研发计划项目“实时高逼真孪生数字人关键技术研发与应用示范”的建设中,与江南游戏工作室合作,通过整合交互理解、智能对话管理、智能驱动三大模块,构建支持定制化并适用于多样场景的数字人智能“对话”系统,实现多模态交互对话。未来,火山语音还将继续围绕数字人进行一系列创新应用的加速落地,不断探索AI与业务场景的高效融合,让数字人在更多行业生根发芽。
领取专属 10元无门槛券
私享最新 技术干货