传统的摘要生成系统大部分都是抽取型的, 这类方法从给定的文章中, 抽取关键的句子或者短语, 并重新拼接成一小段摘要, 而不对原本的内容做创造性的修改....下面我们举一个例子来说明训练的过程:
?
?
通过包含编码器并且联合训练这两个组块, 我们根据当前yc对x的不同内容投入不同的关注度, 进而的到更好的结果. 模型结构如下图所示:
?
?
?
?...Step5: 迭代N次, 最终选出可能性最大的一条词序列路径
?
下面是对Beam Search算法的详细分析, 对原文的Algorithm 1逐条进行解释.
Beam Search算法分析
?...最近谷歌开源了TensorFlow版本的摘要生成程序textsum, Github上的项目. textsum的核心模型就是基于注意力的seq2seq(sequence-to-sequence)模型, textsum...: 读取数据, 调用beam_search解码
beam_search.py: beam search算法的核心程序
textsum程序解析
Google开源的textsum项目的具体算法是基于Hinton