斯坦福依赖关系手册(manual.pdf)提到:“或者我们的转换工具可以将其他选区解析器的输出转换为斯坦福依赖关系表示。”
有人知道这个工具在哪里或者如何使用吗?
Stanford文档(http://nlp.stanford.edu/software/stanford-dependencies.shtml)提到:“依赖关系可以使用我们的软件.使用解析器包中可用的EnglishGrammaticalStructure类在短语结构树上获得。”
我感兴趣的是获得(ccprocessed)类型的依赖列表,以便在NLTK中使用。我看到了一个构造函数EnglishGrammaticalStructure(Tree ),我想要一些关于如何为它提供NLTK树的指导。
第一个想法:使用nltk.tree.Tree.pprint生成一个字符串,然后使用Tree.valueOf解析它。有什么建议吗?
相关问题:
发布于 2013-08-22 18:06:41
我不知道你是否看过斯坦福分析者的常见问题:
我能从另一个解析器生成的树中得到您的类型化依赖(语法关系)输出吗?
您可以使用EnglishGrammaticalStructure的主要方法。您可以给它一些选项,比如在树中读取-treeFile,比如-collapsed来输出typedDependenciesCollapsed。例如,此命令(具有适当的路径)将将Penn Treebank文件转换为未折叠的依赖关系:
java -cp stanford-parser.jar edu.stanford.nlp.trees.EnglishGrammaticalStructure -treeFile wsj/02/wsj_0201.mrg -basic
..。
这里的mrg
文件是一个“合并”(即POS标记和短语结构) Penn表示,如果使用适当的语法定义,可以让NLTK的Tree.pprint发出。但是,我不能详述这一点,因为问题描述并没有涉及为什么这两个工具必须是流水线的。
https://stackoverflow.com/questions/17846355
复制相似问题