关注文章公众号
回复"吴俣"获取PPT资料
摘要
近些年来,随着互联网的兴起,我们可以方便快捷的从网络上抓取大规模人与人的对话,并以此训练数据驱动的聊天机器人。已有的数据驱动的聊天机器人分为基于生成的聊天机器人和基于检索的聊天机器人。但他们均有各自的不足:
1、基于生成的聊天机器人有着“万能回复”的问题。所谓的“万能回复”,是指那些看似能够回复任何输入的但却没有实际意义、不利于对话过程持续进行的句子,例如“我不知道”。
2、基于检索的聊天机器人虽然回复信息量充分,但相关性有时不佳,且强依赖索引的数据。
在SFFAI&微软的活动中,微软亚洲研究院与北京航空航天大学的联合培养博士生吴俣介绍了在AAAI-19上发表的题为“上下文敏感的改写式回复生成模型”的工作。在这个工作中,吴俣等人提出了一个新的范式:“先检索,后改写”,用于回复生成。在该框架中,首先利用检索式聊天机器人检索一个回复(原型),之后根据该回复原本的上下文和当前上下文之间的差异来改写此回复。这种新的范式不仅继承了检索式聊天机器人回复流畅和富有信息量的优势,而且还享有生成式聊天机器人的灵活性和相关性。实验表明,这一方法在相关性,多样性和原创性方面优于传统模型。
作者简介
吴俣,吴俣是微软亚洲研究院与北京航空航天大学的联合培养博士生。自2014年起,他在导师李舟军教授与周明常务副院长的指导下开始了博士生的学习与科研工作,截止到目前已经发表了7篇会议文章(全部为CCF A类)与2篇期刊文章。他的研究兴趣为:open domain conversation and natural language generation.
精彩瞬间
SFFAI讲者招募
为了满足人工智能不同领域研究者相互交流、彼此启发的需求,我们发起了SFFAI这个公益活动。SFFAI每周举行一期线下活动,邀请一线科研人员分享、讨论人工智能各个领域的前沿思想和最新成果,使专注于各个细分领域的研究者开拓视野、触类旁通。
SFFAI目前主要关注机器学习、计算机视觉、自然语言处理等各个人工智能垂直领域及交叉领域的前沿进展,将对线下讨论的内容进行线上传播,使后来者少踩坑,也为讲者塑造个人影响力。
SFFAI还将构建人工智能领域的知识树(AI Knowledge Tree),通过汇总各位参与者贡献的领域知识,沉淀线下分享的前沿精华,使AI Knowledge Tree枝繁叶茂,为人工智能社区做出贡献。
这项意义非凡的社区工作正在稳步向前,衷心期待和感谢您的支持与奉献!
领取专属 10元无门槛券
私享最新 技术干货