我试图找到一种方法,用python从一段文本中获得所有的二元语法,这些单词不一定是连续的单词,但在文本中由N个单词分隔。虽然我已经找到了很多关于如何找到连续二元语法的答案,但我还没有找到关于非连续二元语法的明确答案。我使用sklearn和CountVectorizer来查找我的二元语法,但我不知道它是否能够完成此任务。"]
预期的结果是,拥有一段文本sentence= "i lo
我尝试在python3中使用spacy从文本中提取语言特征。exploring text analytics using spacy我正在寻找这样的输出,通过提取具有我提供的特定词性模式的三元语法/二元语法短语的单词。如名词、动词名词、形容词等,同时也保留了数据框架结构。如果一个句子有多个短语,则必须使用新短语复制记录。