原文题目:Evaluating the Utility of Document Embedding Vector Difference for Relation Learning
摘要:最近的工作表明,通过减去预先训练过的词嵌入向量得到的向量偏移可以用来预测词汇关系,并具有惊人的准确性。在这一发现的启发下,本文将这种思想推广到文档层,生成文档级嵌入,计算它们之间的距离,并使用线性分类器对文档之间的关系进行分类。在重复检测和对话行为标记任务的背景下,我们发现文档级差异向量在评估文档级相似性方面有一定的实用价值,但在多关系分类中效果较差。
原文作者:Jingyuan Zhang, Timothy Baldwin
原文地址:https://arxiv.org/abs/1907.08184
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。