我是为NLP操作使用Python和NLTK的新手。从不同的句子开始,我想知道如何在一个句子中提取特定的依赖关系。
例如:爱德华有一件黑色夹克和一双带红色鞋带的白色鞋子。
使用POS标记,我可以提取词性的某些部分,但我想具体地提取出他有一件黑色夹克,以最终列出如下信息:
名称: Edward
服装:黑色夹克
鞋:红色花边的白鞋
发布于 2016-10-31 20:53:42
您要寻找的是纳纳 (命名实体识别)。由于每个句子结构都不同,而且所需的信息也不同,您可能需要自己制作自己的句子,因此您可以从这里获得模板或工作示例。
也有巨大的语料库,你可以使用。
发布于 2016-10-31 21:47:34
你可以把这个问题看作是提取关系元组,可能是二进制关系。在这种情况下,您需要了解开放IE。在这种情况下,您可以提取类似或。如果你有监督数据,你可以建立你自己的关系提取模型。否则,使用其他技术(如NER或POSTagging )提取姓名、服装或其他重要信息并非易事。
另一种方法可以是依赖解析,但我不知道如何对其建模以适应您的特殊需求。
https://stackoverflow.com/questions/40350299
复制相似问题