这是一篇(据说)有趣的餐馆评论的摘录:
我想亲自和Tofu先生握手。虽然我不能从医学上证明这一点,但我100%肯定他们的soondubu含有未定义的属性。从某种程度上说,我在这里用餐后总是感觉更好。吃过冷吗?去他的Nyquil
E 210,得到辛辣的e 111/code>和服soondubu。
我想提取重要的实体,并链接到维基百科实体。我对spaCy进行了维基百科/维基数据的小样本培训,并在评论中运行实体链接:
[('Tofu', 'PERSON', 'Q177378'),
('Nyquil', 'WORK_OF_ART', 'NIL')]我也希望其他实体也能被提取和链接,例如:
kimchi -> Kimchi
cold -> Common cold
healing -> medicine
medically -> medicine看起来,spaCy只能链接指定的实体。我试图显式地列出其他实体的名称(这显然不能很好地扩展):
ruler = EntityRuler(nlp)
patterns = [{"label": "ORG", "pattern": "kimchi"}, {"label": "ORG", "pattern": "cold"}]
ruler.add_patterns(patterns)
nlp.add_pipe(ruler)然而,spaCy似乎根本不链接新实体:
[ ('Tofu', 'PERSON', 'Q177378'),
('cold', 'ORG', ''),
('Nyquil', 'WORK_OF_ART', 'NIL'),
('kimchi', 'ORG', '')]我如何使Spacy也能识别其他实体?这是应该在培训实体链接模型之前完成,还是可以用已经培训过的模型来完成?spaCy是完成任务的正确工具吗?https://stackoverflow.com/questions/60809394
复制相似问题