在蓬勃发展的人工智能时代,AI数字人凭借视频、声音和文本等多种形式的计算机图形学技术的应用,正日益受到关注。通俗地讲,所谓数字人,本质上是AI的一种进化,被虚拟制作出来的类人形象,没有现实世界的实体。从初音未来、洛天依等虚拟偶像到银行大堂的AI数字员工再到我们游览风景名胜古迹不时遇见的虚拟数字解说员,我们的生活中不乏AI数字人踪迹。
(生活中形形色色的AI数字人)
那么,AI数字人为何被制造出来呢?其结构成分又是什么?就目的而言,AI数字人的目标在于通过计算机图形学技术创造出无限接近人类的数字化形象,并赋予其特定的人物身份设定,从而在视觉上拉近与人的心理距离,实现更加真实的情感互动,从而应用于各个行业产生经济、社会价值。目前,AI数字人结构从上到下可以分为基础层、平台层和应用层。
一、基础层
基础层是AI数字人的根基,为虚拟数字人提供着必要的基础软、硬件支持。硬件方面,包括显示设备、光学器件、传感器和芯片等支持驱动的必备元件。作为基础软件的建模软件和渲染引擎则分别负责对虚拟数字人的人体、衣物等进行三维建模和对灯光、毛发等的渲染。
二、平台层
平台层包括生成系统和AI能力平台,为虚拟数字人的制作及开发提供技术能力。作为生成系统的建模系统和动作捕捉系统通过产业链上游的传感器、光学器件等硬件获取真人/实物的各类信息,利用软件算法实现对人物的建模、动作的重现。AI能力平台则提供计算机视觉、智能语音、自然语言处理技术能力。
三、应用层
应用层是指虚拟数字人技术结合实际应用场景领域,切入各类,形成行业应用解决方案,赋能行业领域。不同外形、不同功能的虚拟数字人赋能影视、传媒、游戏、金融、文旅等领域,根据需求为用户提供定制化服务。
(AI数字人结构示意图)
作为人工智能领域的领军者之一,拓世科技集团在AI数字人领域布局已早,并在AI数字人驱动方式、底层架构、制作成本方面进行创新改变。
一、驱动方式迭变
传统的真人驱动型虚拟数字人受到技术局限,需要真人(“中之人”)在后台配合完成各种动作和表情。然而,随着人工智能技术的进步,AI驱动型虚拟数字人正逐渐成为主流。拓世AI数字人通过深度学习模型、神经网络渲染和自然语言处理等技术实现自动交互能力,摆脱了对真人的依赖。这使得拓世AI数字人能够根据不同应用场景配置相应的交互与内容创造能力,全流程实现数字人的创建、驱动与内容生成。
二、底层架构转变
拓世AI数字人以便捷和高效的底层技术新架构,通过训练模型完成对不同行业知识图谱的学习与应用,可以为不同行业提供高效率和低成本的实时服务。不仅如此,拓世AI数字人在应用领域的拓展也更加广泛:从传统的虚拟偶像、游戏核心领域到直播、电商、教育、医疗、文旅等各个领域。
(拓世AI数字人应用千行百业)
三、制作成本降低
拓世AI数字人的内容生成更加智能化,减少了对真人的依赖,从而降低了制作人力成本。同时因为相关算法的优化迭代有助于降低运营传播成本。新的平台型基础技术架构也将进一步减少拓世AI数字人的研发与推广成本,降低AI交互技术门槛。
此外,拓世AI数字人还展现出全新魅力,不仅具有高颜值,其多样化的声音、神情和姿态,更是增添了“人性的温度”和亲和力。拓世AI数字人到“数智人”的转变,以全双工技术,能够实现更高可靠性、高效性和逻辑性的交互,成为企业的智能化助手。
在现代人工智能技术的加持下,以“数智人”为代表的拓世AI数字人将不断满足用户需求,引领人机交互领域的无限可能。这一前沿技术的推进,更将深刻推动人工智能在各个行业领域的广泛应用,为未来社会的智能化发展赋能。
领取专属 10元无门槛券
私享最新 技术干货