如果没有元宇宙的沃土,没有二次元的追捧,一个个虚拟人将会以怎样的方式闯入我们的生活?
现在,虚拟人真实地活跃在我们身边,让人们真切地感受到其商业价值。在这条“热赛道”上,企业跑步入场,成功似乎变得唾手可得。这些虚拟人“出圈”,是因为性格还是外形?他们与人类在职场上是互补还是替代?企业“押宝”是为了引流还是变现?
“这是虚拟人吗?”
“看她的掌纹和手背上的青筋,怎么可能是假的?”
“但她没有瞳孔。”
几个年轻人围着一张手机上的照片,用指尖把它放到最大,仔细打量,努力判断眼前这个紫发姑娘到底是不是个真人。她叫Rae,生日是10月17日,天秤座女孩,是一个虚拟偶像。Rae有着猫一样的眼睛、双眼皮、锥形鼻梁、丰满的嘴唇、独特的断眉俏皮且神秘。她的“人设”是一个热爱街头文化的大胆的姑娘,富有表现力和时尚感。每到周末,她都会找个地方练习滑板技巧。因为喜欢滑板,她成为2021年中国滑板精英赛的虚拟推荐官。
虚拟偶像Rae
在社交平台上,Rae的自我介绍是“城市探索者”。有时,她也愿意称自己为“数码艺术家”。Rae有一只宠物Tako。这只长得像八爪鱼的宠物站在Rae身边时有一种反差萌。Rae在国内的第一次亮相是在两年前的生日那天,她在微博上发了一张颇具朦胧美感的单人照。这个紫发女孩每次亮相之前,背后都有十几人为其服务。其运营团队是上海想来想去文化传媒有限公司,该公司总经理王一宝告诉记者:“给Rae制作视频的话,大概需要10天的时间,图片制作也要3天左右。”
迭代升级
从“纸片人”到“立体人”
什么是虚拟人?目前,业内人士对于虚拟人的定义引用了中国人工智能产业发展联盟发布的《2020年虚拟数字人发展白皮书》中的释义:虚拟人是指具有数字化外形的虚拟人物,依赖显示设备存在,并且拥有人的相貌、人的举止以及人的思想。
提到虚拟人,就绕不开初音未来。她是世界上第一个使用全息投影技术举办演唱会的虚拟偶像,曾在美国、墨西哥、印尼、新加坡等国家举办世界巡演,拥有6亿“粉丝”,代言过上百个品牌。不过刚出道时,初音未来的智能程度还不高,只有人为设定的一些歌曲和动作,不能与人交流。“以往我们把初音未来、洛天依等归于虚拟偶像,是因为那时没有虚拟人这个概念。从去年开始,虚拟人已不局限于虚拟偶像这单一类型。”艾媒咨询首席分析师张毅表示。
“虚拟人的发展并非一蹴而就的。在近20年的时间内,虚拟人随着计算空间、计算平台不断迭代升级。”百度数字人业务相关负责人将虚拟人的发展历程归结为三个阶段:第一阶段是“纸片人”,一般是游戏或动漫公司发布虚拟形象,通过电子音合成软件,使虚拟形象可以唱歌、跳舞,但用户只能观赏,无法与其进行互动;第二阶段是人为驱动,这一个阶段技术人员不只借由软件做固定的编排,还可以通过设备实时驱动虚拟人进行演绎与互动;最后一个阶段是虚拟人与人类的自主互动。当前,通过人工智能技术,部分虚拟人可以具备听懂外部内容并实时反馈的功能。
目前所见的虚拟人大多通过操作人员来进行操控,比如直播间里的虚拟主播。也有虚拟人是由人工智能驱动,直接与人交互,比如万科的“最佳员工”崔筱盼。资讯公司量子位发布的《虚拟数字人深度产业报告》显示,到2030年,我国虚拟人整体市场规模将达到2700亿元。
赛道成型
市场报价从十几万元到上百万元
元宇宙的热度打开了虚拟人的赛道。目前,我国虚拟人主要从事虚拟主播、数字员工、虚拟偶像、品牌代言人等职业。
数字员工属于服务型虚拟人,可以为金融、零售等领域提供新型客户服务,解决排队时间长、回应慢、人力成本高等问题,并助力这些行业进一步实现智能化转型。虚拟主播和虚拟偶像则属于演艺型虚拟人。现实生活中的明星可能会因为各种事情人设崩塌,给品牌造成不同程度的损失。演艺型虚拟人不存在人设崩塌的风险。虚拟人另外一个显而易见的优势是可以24小时在线营业。
百度智能云曦灵数字人家族
2021年,百度推出了百度智能云曦灵数字人平台,为各行各业提供虚拟主持人、虚拟员工、虚拟偶像、品牌代言人的创建与运营服务。目前,该平台已生产20余位虚拟人。其中,央视AI手语主播、央视数字虚拟小编小C属于演艺型虚拟人,浦发银行虚拟人等属于服务型虚拟人。百度智能云曦灵相关负责人对记者表示,演艺型虚拟人侧重于通过内容生产来帮客户达成业务诉求,而服务型虚拟人则通过交互来满足客户诉求。该负责人称:“目前,客户对虚拟人的接受度及认可度较高,我们也在不断打造新产品,降低技术门槛,让虚拟人应用到更多行业中。未来虚拟人还将与文旅、元宇宙空间等各类场景深度融合。”
据了解,现在不少从事虚拟人制作的技术公司前身是影视后期制作公司。王一宝告诉记者,目前市面上提供虚拟人服务的公司大多有自己的虚拟人储备库,他们的业务模式大致分为两种:一种是客户从已有的储备库里选择适合自己品牌定位的虚拟人,直接买断版权;另一种是为客户定制虚拟人形象,收取制作费以及后续的运营费用。由于定制标准不同以及制作公司的知名度不同,这两种方式报价差别很大,从十几万元到上百万元不等。
投入较大
技术成本占比高
目前,虚拟人发展尚处于早期,由于成本过高和功能不够全面,超写实风格的虚拟人尚未得到大范围使用。通常,做一个虚拟人要整合几家公司来完成全链路。也就是说,虚拟人的人物设定、角色创建、角色动作、引擎驱动分布在不同的制作公司,各环节相对割裂。而更重要的是,制作智能程度高、互动性强的虚拟人的成本较高。一位虚拟人制作公司负责人向记者透露,制作一款具有AI驱动能力的虚拟人成本至少要上百万元。其中,技术投入占到一半以上。张毅表示:“在如今商业化场景上,如果有一款虚拟人能够持续地有内容输出,也许其带来的收入能覆盖成本。这才是一个行业可持续发展的方向。”
在头豹研究院高级分析师朱晓雯看来,目前,虚拟人的人设打造、用户培育和商业运营路径主要有三种:第一是品牌、广告营销,比如AYAYI这种在小红书、微博等渠道进行营销、代言;第二是类似主播带货;第三是将虚拟人和游戏、影视等内容相结合,如柳夜熙等。
值得注意的是,在虚拟人火爆“出圈”的背后,这一领域也存在一些争议,比如道德伦理、商业化模式等。在张毅看来,虚拟人是科技进步、文化发展,以及商业社会变化的结果。随着行业的发展,监管部门、行业协会也会对虚拟空间制定一些行为规范。
人物篇
冬冬生成记
会说段子的“北京大妞”
虚拟主播冬冬
“老规矩,想跟冬冬唠嗑儿的朋友,在评论区互动起来!”直播间里,一个穿着白色连衣裙、梳着马尾辫的女主播正忙着带货。她在介绍上架商品的间隙,还要回复评论区的提问、感谢“粉丝”的关注,甚至是替网友向工厂催货。其间,她频频向网友卖惨:“打工人,打工魂。白天去央视做节目,晚上要来直播,空余时间还要踩缝纫机,我好辛苦。”
站在镜头前的主播叫冬冬,是一款AI实时驱动的虚拟人,是个地道的“北京大妞”。她会滑冰、会滑雪,还掌握好多的冰雪运动知识。正因如此,她在北京冬奥会期间成为了冬奥宣推官。
阿里巴巴达摩院是冬冬的研发机构,其相关负责人对记者表示,冬冬实现了AI实时驱动,其背后集合了数字人技术、计算机视觉、自然语言处理技术及语音技术等综合能力的输出。语言方面,冬冬可快速根据场景智能获取并处理文本信息,生成逻辑通顺、有一定文采的文本,内容口语化、自然化、趣味化,更贴近自然人的语言。行为方面,她会通过文本或者语音输入自动生成与之匹配的嘴型和面部动作。
通过AI技术驱动,冬冬可以表现得性格飒爽、风趣幽默,还可以实时、有感情地和观众互动对话。她结合地域、性格等人物设定,通过AI算法与原型定位结合,生成了与真人近似度较高的人物造型。
“冬冬是我们的一个技术突破。整个冬奥会期间有28个虚拟人,如果一一去看,你会发现只有冬冬是不一样的。她是第一个能够和真人实时互动的虚拟人。不需要提前录制,冬冬就可以与用户对话。”该负责人表示,除了让冬冬像真人一样交流之外,他们团队还赋予她一个有趣的“灵魂”。“冬冬是一个会说段子的虚拟人。我们希望她在人为设定的基础上,还能表现得更加幽默。于是,我们找了一些脱口秀的模板,让她去自动生成段子,最后效果很不错。”
技术篇
从形似到神似
虚拟人的数字密码
“好看的皮囊千篇一律,有趣的灵魂万里挑一。”对于虚拟人来说,好看的皮囊与有趣的灵魂二者缺一不可。
从事虚拟人技术工作的李先生对记者透露,有一位投资人曾出资200多万元做出了一款虚拟人,希望将她打造成一个IP,但没过多久,这个虚拟人就销声匿迹了。在李先生看来,其失败的原因主要是因为这款产品无法与人互动。“这种虚拟人只是基于真人的形象,然后换了一张好看的脸。尽管外观非常接近真人,但她的作用仅限于录些好看的视频。”
艾媒咨询披露的数据显示:一半以上的网民表示喜欢虚拟人是出于其形象。“我并不排斥做IP,但我觉得这个IP要有灵魂,要可以和用户交互,这样才能让用户真正体会到虚拟人的价值。”李先生对记者表示,虚拟人要实现声情并茂主要包括三个方面的技术:生成、驱动、交互。通俗说来就是:外观、语言、思想。
外观方面,技术人员一般会通过建模来塑造虚拟人的表情和肢体动作,也会基于深度神经网络渲染技术,采集真人的面容、肢体等数据,渲染生成数字孪生人。为了使表情更加自然,虚拟人需要增加算法驱动。比如,一款虚拟人使用超过30TB的数据进行训练,可以呈现出超过72000个训练好的肌肉形状,并做出全新的面部表情。
语言方面,是基于语音合成技术(TTS),将文本转化为语音,结合自然语言处理能力,使虚拟人能够像人类一样理解、处理和生成语言。为了让声音更有“温度”,技术人员往往会增加情感TTS技术。“如何让人觉得这个虚拟人比较自然亲切,这个技术是关键。”李先生说。
而思想,也就是交互能力方面,虚拟人通过语音语义识别等智能技术判断用户的意图,从而决定后续的语音和动作。这就需要较高的多模态交互能力。模态用通俗的话来说就是感官。多模态交互需要通过文字、语音、视觉、动作、环境等多种方式进行人机交互。用户与交互能力较高的虚拟人对话时,可以随时打断他说话也不影响后续的交流。
“凭借当前的AI技术,有的虚拟人已不需要人工穿着动捕服驱动,就可以实现不受时间和空间的限制、24小时全天候工作。”百度数字人业务相关负责人对记者说道。
企业篇
玩家“组团”进场
入局占坑抢风口
变现,是大多商业行为的终极目标。但虚拟人行业距离玩家们定的目标似乎有点遥远。“目前看来,这个领域的投入产出还不匹配。”上海想来想去文化传媒有限公司总经理王一宝告诉记者,虚拟人要保证IP吸引力就要不断输出优质的内容,但后期每次发布虚拟人的图片和视频都是要产生费用的。要运营好一个虚拟人,一年至少需要上百万元的成本。即使是一些高流量的虚拟偶像,可能仍处在烧钱吸粉阶段。
“更多时候,虚拟人是一个引流的噱头。公司指望她带货,销售额连成本都覆盖不了。”一位做女装直播的主播告诉记者,她曾考虑让虚拟人直播,但询价后发现太贵,便作罢。
尽管目前虚拟人市场的盈利不及预期,但从国内平台虚拟主播的增长趋势可以看出,这个赛道的“蛋糕”还是诱人的。企查查数据显示,近5年相关企业注册量呈整体上涨趋势,2021年新注册相关企业1000余家,同比增长63.69%。2022年一季度共新注册近300家相关企业,同比增长67.47%,其中已获得融资的企业有11家。
“这是搭乘了元宇宙的顺风车。”王一宝认为,虚拟人是元宇宙场景中较好落地的一环,因此形成了一个风口。“现在虚拟人领域是一个短平快的打法。很多企业抢占市场,能找到融资就做,找不到就止损不做了。他们更多的是走资本运作的路线,这是目前这个行业的现状。”王一宝说。
采访中,多位业内人士告诉记者,在目前虚拟人领域,中小体量的公司认真做产品的不多。一位从事影视后期制作的人士告诉记者:“赛道热,有些没有过硬技术的小公司也先入场占位。有的团队恨不得拿张照片就去融资。大多数虚拟人制作公司没有自己的‘造血功能’,靠投资续命。”
职场篇
虚拟人入职就业互补
“人机耦合”成趋势
现在,虚拟人已经不只是在跨年晚会和网络平台直播间里亮相了,越来越多的虚拟人从聚光灯前走进日常工作中。此前,万科将“2021年度的优秀新人奖”颁给了数字员工崔筱盼。这引发了一波热议:被赋能的数字员工未来在职场上会不会取代人类,抢占了本属于人类的就业岗位?
数字员工是一种高度拟人的新型工作人员,它是由人工智能、 RPA(机器人流程自动化)、数据、机器人等多种技术深度融合而成。《全球人工智能市场2021预测》报告中指出:到2024年,预计45%的重复工作任务将通过使用由AI、机器人和RPA提供支持的数字员工完成。
“数字员工未来可能会做一些标准化程度较高、重复性较大的工作,例如银行的柜员、客服,文旅中的博物馆讲解员、导游等。人将从标准化、重复性的劳动中解放出来,追求更加创造性的工作。”头豹研究院高级分析师朱晓雯表示。
目前,虚拟人的行为背后需要一个团队进行支援,因此,虚拟人入职在一定程度上属于“就业互补”,而非“就业替代”。有业内人士认为,虚拟人火爆的这几年,可能还会催生一些新的就业岗位。
未来,“人机耦合”或成为用工市场的发展趋势。过去大多是人对计算机进行指令操作。随着人工智能技术的不断发展,虚拟员工可能会成为人类的合作伙伴。(津云新闻编辑孙畅)
本文分享自 Metaverse元宇宙 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!