首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何利用NLTK从句子中提取特定信息

如何利用NLTK从句子中提取特定信息
EN

Stack Overflow用户
提问于 2016-10-31 20:45:11
回答 2查看 1.3K关注 0票数 4

我是为NLP操作使用Python和NLTK的新手。从不同的句子开始,我想知道如何在一个句子中提取特定的依赖关系。

例如:爱德华有一件黑色夹克和一双带红色鞋带的白色鞋子。

使用POS标记,我可以提取词性的某些部分,但我想具体地提取出他有一件黑色夹克,以最终列出如下信息:

名称: Edward

服装:黑色夹克

鞋:红色花边的白鞋

EN

回答 2

Stack Overflow用户

发布于 2016-10-31 20:53:42

您要寻找的是纳纳 (命名实体识别)。由于每个句子结构都不同,而且所需的信息也不同,您可能需要自己制作自己的句子,因此您可以从这里获得模板或工作示例。

也有巨大的语料库,你可以使用。

票数 2
EN

Stack Overflow用户

发布于 2016-10-31 21:47:34

你可以把这个问题看作是提取关系元组,可能是二进制关系。在这种情况下,您需要了解开放IE。在这种情况下,您可以提取类似或。如果你有监督数据,你可以建立你自己的关系提取模型。否则,使用其他技术(如NER或POSTagging )提取姓名、服装或其他重要信息并非易事。

另一种方法可以是依赖解析,但我不知道如何对其建模以适应您的特殊需求。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40350299

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档