分享背景
基于编码器-解码器结构的序列生成模型被广泛应用文本任务,例如神经机器翻译,摘要生成,对话系统等等。然而,现有模型在生成序列的时候都是只生成一次,而没有反复“推敲”的过程。而推敲在我们进行翻译、写文章的时候是一个很普遍的做法。因此我们将“推敲”引入序列生成模型中,提出了推敲网络,来改进序列生成质量。本次 GAIR 大讲堂中,嘉宾夏应策将主要分享推敲网络算法及其应用。
分享主题
推敲网络:用于序列生成的网络结构
分享提纲
1.序列生成模型的基本结构以及应用(主要介绍神经机器翻译)
2. 推敲网络的结构和优化算法
3.推敲网络的实验结果
4.推敲网络和对偶学习的结合
分享人简介
夏应策,博士五年级,现就读于中国科大--微软博士联合培养班,研究方向为机器学习(包括对偶学习,神经机器翻译和多臂赌博机),是 2016 年微软学者奖得主之一。
分享时间
北京时间 1 月 19 日(周五)20:00
参与方式
领取专属 10元无门槛券
私享最新 技术干货