text2vec - 腾讯云开发者社区

文章/答案/技术大牛

发布

2回答

R-安装text2vec Ubuntu VM

、、、、

我正在尝试在亚马逊网络服务的EC2免费层Ubuntu上安装text2vec。我收到这个错误消息：Installing package into ‘/usr/local/lib’ ...** libs g++ -std=gnu++11

浏览 7提问于2018-04-21得票数 0

1回答

字符n-g的R中的Tfidfvectorizer

是否有类似于tfidf矢量器的工具，它将原始文档集合转换为R包中TF-国防军特性的矩阵？参考见这。

浏览 0提问于2018-03-18得票数 2

1回答

将DocumentTermMatrix转换为dgTMatrix

、、

我试图通过AssociatedPress的LDA实现从tm-package运行text2vec数据集。然而，text2vec期望输入x为text2vec::lda$fit_transform(x = ...)为Matrix::dgTMatrix。因此，我的问题是:有没有办法强迫DocumentTermMatrix接受text2vec接受的东西？最小(失败)示例：library('text2vec') data("Associ

浏览 0提问于2018-04-14得票数 3

回答已采纳

1回答

text2vec与RHadoop的兼容性

目前，我们在亚马逊网络服务EC2(single instance)中使用text2vec处理大数据集，未来文本数据会越来越大，我们可能会尝试RHadoop(MapReduce)架构，但不知道它是否能兼容text2vec和RHadoop(MapReduce)。

浏览 7提问于2017-08-13得票数 0

回答已采纳

1回答

将text2vec dtm写入文件(csv或svmlight)

、、、

我今天偶然看到了text2vec包，这正是我需要解决特定问题的地方。但是，我还没有弄清楚如何将用text2vec创建的dtm导出到某种输出文件中。我的最终目标是使用text2vec在R中生成特性，并将生成的矩阵导入H2O以供进一步建模。H2O可以读取CSV或SVMLight格式。

浏览 2提问于2016-11-27得票数 1

回答已采纳

1回答

在R中使用text2vec -错误:没有名为‘futile.options’的包

、

我在R中成功地安装了text2vec，但是当我尝试用library(text2vec)加载它时，我得到了一个错误：there is no package

浏览 2提问于2018-10-28得票数 0

1回答

TF-IDF的快速实现

、

我正在尝试使用下面的函数计算词频反向文档频率，以获得归一化的权重。当行数为百行时，结果非常快，但当行数为数千行(仅两万行)时，几乎需要3到4分钟才能得到结果。有人能给我指出正确的方向来减少计算时间吗？ mat = mat[,names] id=function(col){sum(!col==0)} tfidf = mat for(word in names(idf)){tfidf[,word] <-

浏览 2提问于2018-04-12得票数 1

1回答

词组消去与矢量生成

、、

在text2vec中，我能找到的关于Stopword的唯一函数是“create_vocabulary”。但在文本挖掘任务中，通常需要消除资源文档中的断点，然后构建语料库或其他进一步的过程。如何使用“秒针”来处理使用text2vec构建语料库、dtm和中医的文档？我以前使用tm进行文本挖掘。如果使用text2vec读取文档，它能将一张纸读入矢量吗？向量的体积是否足以在期刊上发表一篇论文？)否则，在text2vec中构建的语料库和向量与在tm中内置的内容兼容吗？

浏览 7提问于2016-07-12得票数 1

回答已采纳

1回答

R中主题建模中预训练词向量的整合

、、

我是主题建模领域的新手，所以我希望这不是一个愚蠢的问题。提前谢谢你！

浏览 0提问于2017-09-01得票数 1

1回答

、、

如何在text2vec中设置切分中文的itoken？这个例子是针对英语的！目前已有的中文分词软件包有:解霸等，但我想用text2vec做文本聚类和线性回归模型。此外，如何进行文本聚类？library(text2vec)#　数据准备train=movie_review[J(train_ids)]#文档向量化 #

浏览 10提问于2017-05-04得票数 0

1回答

计算r中文档集合的余弦和jaccard相似度

、、

我将计算近14,000个文档之间的相似度。但是代码执行的时间太长了。有没有其他方法可以更快地完成同样的工作？wb=createWorkbook() #create workbooklistoffiles=list.files() #get list of documents from current working directoryfor(i i

浏览 0提问于2017-11-23得票数 0

1回答