封面:Ideogram生成
CyberDaily:
模仿游戏
一直以来,人们致力于让机器人变得更像人类,无论是从四肢外表体态、丰富的表情,或是语音对话、行动的能力,甚至为其注入类人的思考模式——创造一个真正的类人的硅基生物。现今人形机器人走入现实世界,不只是需要它可以为人类工作,也需要它可以提供情绪情感价值、非言语的力量。
科学家们正在逐步实现这些需要。来自纽约哥伦比亚大学的创意机器实验室近期展示了一个里程碑式的进展——一个可以模仿人类表情的人形机器人Emo,可以在0.839秒内预测和识别人类的微笑,就像人类一样。
Emo不emo:它可以瞬时模仿和预测人类的情绪
Emo是一个人形机器人,虽然现在只有头颅人类化身,但它不仅能够复制人的微笑,还能瞬时预期人类的微笑,实时与人同步,创造出接近真实的人机互动体验。研究者说,与同伴同时微笑相比,延迟微笑可能会让人感觉做作和不真诚。
因而,它可以通过在眼睛内置的高分辨率摄像头,捕捉人面部肌肉的微小变化,甚至在微笑完全展现在面部之前就能捕捉到事先的迹象,这样它就能在差不多同一时间内做出反应,跟人一起微笑。
Emon的表面覆盖着柔软的蓝色硅胶皮肤,隐藏着26个微小的电动机,类似人脸上的肌肉,能够支持丰富而精确的面部表情。目的是,不仅让机器人能模仿微笑,还能预测和表现出悲伤、愤怒和惊讶等其他表情。该机器人接受了人类表情视频数据集的训练。通过观察人脸的细微变化,机器人可以在人微笑前 839 毫秒预测微笑到来,并调整其面部以同时微笑。尽管暂时无法展现全部人类的表情范围,研究团队计划持续增加更多的"肌肉"以丰富其表情能力。
为什么需要像Emo的人形机器人带来非言语的力量
面部表情纵横人类各学科的研究,无论是神经科学、心理学、社会学,包括所谓微表情研都有广泛探讨,人类互动里最为宝贵的是情感真诚流露,以此建立双方信任、社会一致性的认同感,这一方面,在人机互动里同为重要。就如研究人员所言的,机器人的非语言沟通能力长时间被忽视了,研究者提到大型语言模型(LLM)正在使机器人语言交流取得快速进展,但非语言交流却未能跟上步伐。物理人形机器人主要依靠声音来努力使用面部运动来表达和交流。挑战是双重的:首先,富有表现力的多功能机器人面部的驱动在机械上具有挑战性。第二个挑战是知道要生成什么表情,以使机器人显得自然、及时和真实。而训练 Emo 机器人的创新恰好填补了这一空白。’
哥伦比亚大学的研究人员霍德·利普森(Hod Lipson)希望是未来,人与机器人的互动能像与朋友沟通一样自然,他们希望建立起人类与机器人共情并能够互助的未来。“通过开发能够准确解释和模仿人类表情的人形机器人,人形机器人可以无缝地融入我们的日常生活,提供陪伴、帮助,甚至同理心。
因此,在进一步研究计划了,团队正尝试将类似ChatGPT这样的大型语言模型集成到Emo中,以便它在未来能够实时回答问题并进行交谈,以增强未来人形机器人与人类的互动体验。
广告:想了解更多人形机器人产业链、市场动向与商业化、结识同行人等,可以加入CyberRobo,点击这里或扫码加入即可。
它是怎么被训练的呢?自我监督学习+面部表情预测
这里则引用了社会心理学的概念,自我监督学习和自我预期。因而,要达到可以预测和模仿并回应人类的情绪表达,自我监督学习+面部表情预测双模型一步步来实现Emo的情绪表达能力。
首先是自我监督学习的模型:让它自己照镜子练习表情
传统上,控制机器人要用到复杂的数学公式和电脑模拟,就像给机器人编一套动作指令一样。但是,这种方法只适用于那些结构固定,动作方式已知的硬壳机器人。
研究者提出了一种新的学习方式,叫做“自我监督学习”。这就像让机器人站在镜子前,通过自己在镜子中观察自己的脸,来理解不同的动作是如何影响它的面部表情的。机器人不需要人类事先告诉它每个动作是什么意思,它可以自己尝试不同的动作,并从反复的实践中学会如何做出像人一样的表情。
简单来说,就像小孩子学习做鬼脸一样,他们会对着镜子反复练习,慢慢学会用脸部的肌肉来表达各种各样的情感。这个面部机器人也是通过类似的方式来学习如何表达“高兴”、“惊讶”或其他复杂的人类表情。
面部表情预测模型:让机器人学会提前读懂人类情绪
要让机器人能够真实地、及时地模仿人类的面部表情,关键在于教会它们提前"猜测"人的表情变化。这就需要一个强大的预测模型,以便机器人能够迅速作出反应。为了打造这样的模型,研究团队收集了大量人类表情变换的视频资料,通过这些视频,教会机器人辨认人脸最初的微小动作,从而预测出接下来可能形成的表情。
这个预测模型的工作原理有点像是人类对他人面部表情的敏锐捕捉能力。就像我们能从某人嘴角开始上扬的细微动作中,预感到对方即将微笑一样,机器人通过自身的模型也能做到这一点。在面部表情刚刚露出端倪的时候,预测模型就能准确捕捉到这个信号,并迅速驱动机器内部的机械结构——类似于人类表情肌肉——作出相应的表情。
最后,同时结合预测模型和自我监督模型来实现人机面部同步表情。即首先预测面部表情,然后快速生成预测的面部表情,最后表达给人类。
未来,你可能看到Emo人形机器人用在这些地方
这可能是很多人关心的问题,人们需要的不只是可以语言表达的人形机器人,也需要它提供可以非言语表达和情绪价值,因而,类似Emo的人形机器人可以用在包括健康护理、教育、客户服务等领域,不只是减少劳动力压力,也可以在人机交互中,给予人真实、不做作、情感温度的体验。我们简单描述Emo可能用在的领域:
01.健康护理
对于老年化社会来说,Emo可以在医院或老年人护理设施中用作情绪支持机器人,它为患者提供情绪慰藉,特别是对于那些患有焦虑、抑郁或自闭症的患者。
02.特殊教育
比如在特殊教育中,Emo可以辅助教师识别学生的情绪变化,并相应地调整教学方法,特别是对于情绪表达存在挑战的儿童。比如自闭症孩童。
03.客户服务
服务行业中的Emo机器人可以通过其情绪感知能力来提高客户的交互体验,比如在酒店、机场及零售业提供个性化服务。
05.陪聊伴侣
Emo可以用作陪伴机器人,为孤独或需要陪伴的人们提供社交互动,促进他们的社会参与和情感福祉。
06. 辅助交流
Emo也可以帮助有社交交流挑战的人士,比如说非语言沟通有障碍的人,通过模仿他们的表情和情绪,开展互动沟通训练。尤其是接入AI后,更能放大Emo的实时交谈价值。
07. 娱乐与社交
Emo可以为娱乐和社交活动(如主题公园或社交事件)带来新颖的互动元素,也可以像Ameca一样在迪拜博物馆充当导游,提高参与者的体验。
在迪拜博物馆的Ameca
08. 自闭症治疗:
每年新增的自闭症患者不只是增加社会支持成本,也让每个家庭带来沉重打击, 对于自闭症患者而言则缺少了体验更多世界的可能,Emo可以帮助自闭症患者识别和表达情绪,从而在心理治疗和情绪管理方面发挥作用。
09. 心理辅导
心理学家和治疗师可以使用Emo机器人来理解患者的非言语线索,改善治疗过程的沟通以及治疗成效。
10. 实验研究:就像该哥伦比亚的研究人员一样,未来其他研究团队可以使用Emo来进行社会科学和认知科学实验,研究人类情绪识别和模拟、以及这些因素如何影响人机交互。
当然,Emo不只是用在这些地方,比如还可以用于家庭人形机器人、商场导购、博物馆导游等等。
还有这些人形机器人也会情绪表达
Emo人形机器人给了我们足够震撼,实际上,在人形机器人世界里,还有许多像Emo一样的人形机器人在碳基世界活跃着。比如Ameca
Ameca是被称为最逼真的人形机器人,由知名机器人公司Engineered Arts打造。
Ameca 配备的传感器可以跟踪整个房间的运动,以及超过20种面部表情和多种语音识别、视觉识别等功能,可以自然地与人类互动并检测情绪和年龄。Ameca 能够表达惊讶和惊讶等常见表情,以及打哈欠和耸肩等手势。接入GPT4的Ameca可以更加智能地与人类互动,实时交谈,咨询业务等等,早些时间还与工程师调笑风声。现在在迪拜博物馆、拉斯维加斯新球馆就职咨询和导游一致。可以看看以下的视频:(也可以在CyberDaily公众号搜索Ameca获得更多阅读)
不得不提这个可以读懂人类情绪的人形机器人Abel,
这个像斯皮尔伯格导演的《人工智能》的AI男孩,他由比萨大学的生物工程师 古斯塔夫·黑格尔和 Biomimic 公司的 FX 艺术家共同创建。希望Abel机器人可以帮助自闭症和阿尔茨海默症患者解除“魔咒”。据悉,Abel配备先进的头部、躯干、手臂、手、42个电机驱动关节和视觉社会感知系统,这对识别面部表情至关重要。Abel能逐渐适应病人的面部表情和情绪,不断提高同理心的能力。这一过程可能对自闭症和阿尔茨海默症患者的康复产生重要帮助——可以让患者们实时模仿与学习Abel的情绪表达能力。
从以下视频里可以看到,Abel与一个12岁男孩模样相似,通过人工智能驱动可以在任意社交环境中运作,并实时识别考虑、读懂对话者的情绪。Abel这样设计的目的,是与这些患者建立同理心,帮助他们更好地理解人类的认知和情感过程,以便从“咒诅”走出来。因而,这也是Abel的使命,用于判断人类情绪并作出恰当反应。
最后,分享这个名为Alex的人形机器人,目前已经耗资800万美元打造,由来自俄罗斯的三位兄弟团队共同打造。它的脸部设计得像他们的朋友Aleksei,且可以做出多达600种人类面部表情。Promobot V1已经进化成近乎逼真的人形机器人Alex。这并不容易。Alex的创造是一个复杂的过程,就面部、身体和手臂中多达600多个伺服电机。目前这家公司也已经建造了30多个人形机器人,并分布50个不同的国家工作。他们身在购物中心、博物馆和大学工作。
太多类似的人形机器人已经活跃在人类社会舞台,我们就不再这叙述了,您也可以加入CyberRobo一起交流探讨。
后记
Emo虽然不是第一个可以做情绪表达的人形机器人,尽管上半身还不全,但它的实时预测和模仿人类情绪表达的能力,也在告诉那些制造人形机器人的公司,不要忘记了人类需要的非言语的价值和力量。LLM可以让机器人语言交流,与此同时也需要情感互动。可以见得未来它可以用在至少10个以上的领域,面向数以千万计的人类,而这也是人形机器人用武之地,帮助人们解脱某种不得已的束缚,而获得或重获生活的自主能力、情感需要,以及幸福感。
人形机器人会越来越像人类。
付费阅读
领取专属 10元无门槛券
私享最新 技术干货