基于此链接:Is it possible to use spacy with already tokenized input? 我可以让Spacy接受标记化的文档作为输入,并进一步处理文档。如果我想使用nlp.pipe()函数以批处理模式处理文档,该怎么办?类似于: nlp_docs = self.nlp.pipe(texts) 管道接受一个原始文本列表。如何处理这种情况?
我最近在使用spacy时遇到了一个奇怪的行为,那就是当我处理字符串时, 在字符串是单个字符串对象的情况下,我必须使用nlp( string ), 而对于由字符串元素组成的列表,我必须使用nlp.pipeis a string to be process by nlp'
doc =['this','is','a','string','list'