Java - opennlp
我是一个新的opennlp,我正在尝试分析句子,并有post标签和块结果,但我不能理解价值的含义。有什么表格可以解释post标签和块结果值的完整形式含义吗?
Tokens: [My, name, is, Chris, corrale, and, I, live, in, Philadelphia, USA, .]
Post Tags: [PRP$, NN, VBZ, NNP, NN, CC, PRP, VBP, IN, NNP, NNP, .]
chunk Result: [B-NP, I-NP, B-VP, B-NP, I-NP, O, B-NP, B-VP, B-PP, B-NP, I-NP, O]发布于 2013-02-26 01:19:21
POS机标签来自Penn Treebank tagset。语块包括名词短语(NP)、动词短语(VP)和介词(PP)。"B-..“标志着这样一个短语的开始,"I-..“意思类似于“内部”,即短语在这里继续(参见OpenNLP docs)。
发布于 2014-12-18 21:49:25
S ->简单陈述从句,即不是由(可能是空的)从属连词或wh-词引入的,也不表现出主谓倒置。
由(可能为空的)从属连词引入的SBAR ->子句。
间接疑问句和关系从句应归入SBAR,而不是SBARQ。
ADJP ->形容词短语。
->副词短语。
CONJP ->连词短语。
FRAG ->片段。
INTJ ->感叹。大致对应于词性标签UH。
LST ->列表标记。包括周围的标点符号。
NAC ->非构成成分;用于表示名词短语中某些前名修饰语的范围。
NP ->名词短语。
NX ->在某些复杂的NP中用来标记NP的中心语。大致对应于N-bar
PP ->介词短语。
PRN ->括号。
PRT ->粒子。应标记为RP的单词的类别。
QP ->量词短语(即复杂度量/数量短语);用于NP中。
RRC ->减少了关系子句。
UCP ->与并列短语不同。
VP ->动词短语。
WHADJP -> Wh-形容词短语。包含wh副词的形容词短语,如how hot。
WHAVP -> Wh-副词短语。引入一个带有NP间隙的从句。可以是空的(包含0补足符),也可以是词性的,包含wh副词,例如如何或为什么。
WHNP -> Wh-名词短语。引入一个带有NP间隙的从句。可以是null (包含0补足符),也可以是包含一些wh-word的词汇,例如谁、哪本书、谁的女儿、没有哪本书或有多少只豹。
WHPP -> Wh-介词短语。包含wh名词短语的介词短语(如which of或by wh),该短语要么引入PP间隙,要么被WHNP包含。
X ->未知、不确定或无括号。
图片来源:http://mail-archives.apache.org/mod_mbox/opennlp-users/201402.mbox/%3CCACQuOSXOeyw2O-AZtW3m=iABo1=3cpZOdPiWFXoNwN-SVWo4gQ@mail.gmail.com%3E
发布于 2015-02-20 19:01:41
请参考POSTag list以获取标签的详细信息。
像"B-NP“这样的块标签由两个或三个部分组成:
第一部分:
B - marks the beginning of a chunk
I - marks the continuation of a chunk
E - marks the end of a chunk作为一个块,它可能只有一个单词的长度(就像上面例子中的“她”),它可以同时是一个块的开始和结束。
第二部分
NP - noun chunk
VP - verb chunk有关更多参考信息,请参阅OpenNLP Documentation。
https://stackoverflow.com/questions/15059878
复制相似问题