我有一个文本数据集,我在其中训练了一个gensim w2v模型。现在,我想使用这些向量来增强tf值,用于我的数据集中的单词和文档。正确的方法是什么?我试着在gensim的网站上跟踪。File "<ipython-input-229-7946418f8a82>", line 1, in <module> models.tfidfmodel(model.wv[model.wv.index2word]) TypeError:
如何将语料库转换为包含元数据的R中的数据帧?我已经尝试了来自的建议,但得到的数据框只包含语料库中所有文档的文本行。我还需要文档ID,也许还需要两列中文本行的行号。sapply(corpus, `[`, "content")), 但是没有帮助;我只得到了一个错误信息"Error in match.fun(FUN):‘meta(语料库,"id")’ist nicht Funktion,Zeichen oder Symbol“
语