首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >spaCy只能链接指定的实体吗?

spaCy只能链接指定的实体吗?
EN

Stack Overflow用户
提问于 2020-03-23 07:27:51
回答 1查看 828关注 0票数 0

这是一篇(据说)有趣的餐馆评论的摘录:

我想亲自和Tofu先生握手。虽然我不能从医学上证明这一点,但我100%肯定他们的soondubu含有未定义的属性。从某种程度上说,我在这里用餐后总是感觉更好。吃过吗?去他的NyquilE 210,得到辛辣的e 111/code>和服 soondubu。

我想提取重要的实体,并链接到维基百科实体。我对spaCy进行了维基百科/维基数据的小样本培训,并在评论中运行实体链接:

代码语言:javascript
运行
复制
[('Tofu', 'PERSON', 'Q177378'), 
('Nyquil', 'WORK_OF_ART', 'NIL')]

我也希望其他实体也能被提取和链接,例如:

代码语言:javascript
运行
复制
kimchi -> Kimchi
cold -> Common cold
healing -> medicine 
medically -> medicine

看起来,spaCy只能链接指定的实体。我试图显式地列出其他实体的名称(这显然不能很好地扩展):

代码语言:javascript
运行
复制
ruler = EntityRuler(nlp)
patterns = [{"label": "ORG", "pattern": "kimchi"}, {"label": "ORG", "pattern": "cold"}]
ruler.add_patterns(patterns)
nlp.add_pipe(ruler)

然而,spaCy似乎根本不链接新实体:

代码语言:javascript
运行
复制
[ ('Tofu', 'PERSON', 'Q177378'),
  ('cold', 'ORG', ''),
  ('Nyquil', 'WORK_OF_ART', 'NIL'),
  ('kimchi', 'ORG', '')]
  1. 我如何使Spacy也能识别其他实体?
  2. 这是应该在培训实体链接模型之前完成,还是可以用已经培训过的模型来完成?
  3. spaCy是完成任务的正确工具吗?
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-03-23 08:15:53

理论上这是可能的。首先,您需要确保您有一个标记这类实体的组件。您可以对此进行训练NER模型,但是要知道,在诸如“冷”之类的事情上,它的性能可能不如“伦敦”这样的实体那么好。

为了从维基百科/维基数据中创建知识库和实体链接器,示例脚本并不局限于命名实体--它们试图解析任何出现在wiki内部链接中的内容。如果“冷”这个词被链接到“普通感冒”一页,它应该能够学会它。存储在知识库中并用于培训EL模型的确切实体取决于实体识别器组件找到的实体。因此,如果您根据用例对其进行调整,实体链接组件将自动跟随。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60809394

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档