Seq2Seq是指一般的序列到序列的转换任务,特点是输入序列和输出序列是不对齐的,比如机器翻译、自动文摘等等。...假如原句子为X=(a,b,c,d,e,f),目标输出为Y=(P,Q,R,S,T),则Seq2Seq模型如下:
模型的工作原理如下;
Encoder部分首先通过RNN及其变种(LSTM、GRU)等进行编码...,讲输入序列编码成一个定长向量c,认为这个向量包含了句子的所有信息。...Decoder的任务就是把这个定长向量进行解码:在给定Target序列的前一个字符,通过训练来预测下一个字符。...个向量的序列。