Facebook AI 和机器学习部门 FAIR 发布博客宣布,经过多年研究,其已经构建和开源了一个新的聊天机器人 Blender。并称,这是有史以来最大的开放域(Open-Domain)聊天机器人。“今天,我们将发布完整的模型、代码和评估设置,以便其他 AI 研究人员能够重现此工作,并继续推进对话性 AI 研究。”
据介绍,Blender 是第一个将各种对话技能(包括同理心、知识和个性)融合在一个系统中的聊天机器人。据人类评估者称,在参与度方面,它比别人更出色,也感觉更人性化。
同时,Blender 包括改进的解码技术、新颖的技能融合以及具有 94 亿个参数的模型,比最大的现有系统(谷歌聊天机器人 Meena)高出 3.6 倍。此外,其还包括用于混合技能和详细生成同等重要的技术。
Facebook 方面称,创建聊天机器人的第一步是大规模培训,Blender 使用了 15 亿个对话作为训练语料。同时,研究人员还引入了一个新的混合技能任务(Blended Skill Talk,BST)来训练和评估模型的对话技能,Blender 也综合了许多 Facebook 之前的研究成果。
BST 包含以下技能:
而由 Facebook 单方面提供的测试结果显示,67% 的评估者表示 Blender 听起来更人性化,75% 的评审者表示,他们宁愿与 Blender 进行长时间的对话,也不愿与 Meena 进行长时间的对话。
不过,Facebook 也表示,Blender 聊天机器人相对于人类仍然有许多弱点,找到一种可以更好地暴露这些弱点的评估方法是一个公开的问题,也是其未来研究议程的一部分。
“目前,我们正在探索在与新体系结构和不同损耗函数进行更长期对话时进一步提高模型会话质量的方法。我们还专注于建立更强大的分类器,以过滤对话中的有害语言。我们已经看到在帮助缓解聊天机器人的性别偏见的研究方面取得了初步成功。”“通过开放源码进行微调,进行自动和人工评估,我们希望 AI 研究社区能够在此基础上开展这项工作,共同推动对话性 AI 向前发展。”
领取专属 10元无门槛券
私享最新 技术干货