腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
0
回答
如何
从
R
中
的
文档
术语
矩阵
中
删除
空
文档
、
、
、
但是我
的
dtm有几个空
文档
,我想
删除
它们,因为kmeans不能为空
文档
运行。下面是我
的
代码:replacePunctuation <- function
浏览 11
提问于2017-12-02
得票数 1
1
回答
如何
使用tm
从
R
中
的
DocumentTermMatrix中选择命名列
、
我编写了代码,使用“tm”包在
R
中生成
文档
术语
矩阵
。 现在,我必须只为选定
的
命名列选择
矩阵
中
的
频率值。因此,我想根据一个
术语
列表来子集这个
矩阵
。如果任何
术语
(如
术语
= c('medium‘、'high’、‘low’)在
文档
术语
矩阵
中
作为列出现,我只希望这些列出现在输出
矩阵
<
浏览 2
提问于2015-03-30
得票数 1
回答已采纳
2
回答
从
文档
中
筛选行/
文档
.
术语
.
R
中
的
矩阵
、
、
、
使用
R
中
的
tm-包创建一个
文档
-
术语
矩阵
:导致了这样
的
结果0doc4 22现在,我想根据
文档
中
som
浏览 6
提问于2014-06-14
得票数 6
回答已采纳
2
回答
Rtexttools在使用create_matrix创建
文档
术语
矩阵
时遇到麻烦
、
这是我
的
create_matrix代码texts <- c("This is the first document.In is.na(j) : is.na() applied to non-(list or vector) of type 'NULL' 我还没见过其他人发布这个错误,而且我觉得我错过了一些非常基本
的
东西
浏览 2
提问于2015-01-23
得票数 1
回答已采纳
2
回答
项-项共现
矩阵
上
的
K-均值聚类
、
、
、
我
从
R
中
的
文档
-
术语
矩阵
导出
术语
-
术语
共现
矩阵
K。我感兴趣
的
是对逐个关键字
的
矩阵
K进行K均值聚类分析。K
的
维度是8962
术语
×8962
术语
。number and cost together, write to df cost_df<- rbind(cost_df, cbind(i, kmeans$
浏览 0
提问于2016-05-03
得票数 0
1
回答
在
R
中比较
文档
术语
矩阵
中
的
文档
术语
、
、
、
、
我需要通过比较
文档
的
术语
来构建相似度
矩阵
。例如,如果Document1和Document2有两个相同
的
术语
,我需要在我
的
m1,2
的
相似度
矩阵
中
写一个2。我
的
相似度
矩阵
现在是这样
的
:[1,] 0 NA NA NA NA NA[7,]
浏览 5
提问于2013-01-15
得票数 1
回答已采纳
1
回答
如何
将PCA应用于
R
中
的
术语
文档
矩阵
?
、
、
如何
将PCA应用于
R
中
的
术语
文档
矩阵
? 我有一个
文档
,我在
术语
文档
矩阵
上应用了PCA,但所有的pc组件都是零。我想知道这是否是执行PCA分析
的
正确方法。
浏览 0
提问于2016-05-03
得票数 0
2
回答
如何
仅从存储
的
单词列表中生成text2vector
中
的
文档
术语
矩阵
、
、
text2vec
中
只有指定
的
单词列表才能实现文本矢量化和实现dtm
的
语法是什么?
如何
仅在指定
的
特征上矢量化和生成
文档
术语
矩阵
?如果这些特性没有出现在文本
中
,变量应该保持为
空
。我需要生成与我运行建模
的
dtm
中
的
列完全相同
的
术语
文档
矩阵
,否则我不能在新
文档
上使用随机森林模型。
浏览 1
提问于2017-07-28
得票数 0
回答已采纳
1
回答
R
: removeCommonTerms带全德达包裹?
、
、
removeCommonTerms函数是TM包
的
函数,因此{ if (inherits(x, "DocumentTermMatrix")) else x[termIndex, ]现在,我想
删除
与泉泰集团过于常见
的
条款我可以在创建
文档
特征
矩阵
或使用
文档<
浏览 4
提问于2017-01-11
得票数 1
2
回答
如何
从
文档
术语
矩阵
中
删除
NaN值
、
我正在使用RTextTools构建一个具有
矩阵
和模型
的
培训集,稍后我将应用于不同
的
文档
来对它们进行分类。编辑:
矩阵
是
文档
术语
矩阵
new_matrix <- create_matrix(data$document,languageTRUE, toLower=TRUE, stemWords=TRUE, minDocFr
浏览 0
提问于2012-06-21
得票数 2
回答已采纳
1
回答
如何
在
R
中
通过tm包将TDM csv文件转换为Term Docment Matrix?
、
、
、
我在csv文件中有
术语
文档
矩阵
。, 3, 0, 0 ……
如何
将其转换为tm包
中
的
term
文档
矩阵
?我认为通过TermDocumentMatrix()函数可以
从
文档
中
的
句子(单词列表)创建
术语
浏览 6
提问于2014-03-19
得票数 0
2
回答
如何
在
R
中
附加
文档
术语
矩阵
?
、
我想附上两个文件
术语
矩阵
。我有一行数据,并希望对它们使用不同
的
控制函数(n克标记器,
删除
停止词,文本
的
wordLength边界,这些都不适用于我
的
非文本字段)。
浏览 4
提问于2016-07-28
得票数 2
回答已采纳
1
回答
从
lda gensim检索主题-字数组和
文档
-主题数组
、
形势:我把上面的
矩阵
插入到gensim
的
ldamodel方法
中
。corpus是我上面提到
的
术语
文档
矩阵
.为了研究目的,我需要两个中间
矩阵
(主题-字数组和
文档
-主题数组)。( 1)每个
文档
-主题概率
矩阵
(p_d_t) 2)每个主题-字概率
矩阵
浏览 2
提问于2014-09-12
得票数 5
回答已采纳
1
回答
如何
计算
术语
文档
矩阵
?
、
、
、
我知道,
术语
文档
矩阵
是一个数学
矩阵
,它描述了在一组
文档
中出现
术语
的
频率。在
文档
项
矩阵
中
,行对应于集合
中
的
文档
,列对应于
术语
。我正在使用sklearn
的
CountVectorizer
从
字符串(文本文件)中提取特性,以简化我
的
任务。下面的代码根据返回一个
术语
文档
浏览 0
提问于2017-04-01
得票数 4
回答已采纳
1
回答
如何
从
R
中
的
文档
项
矩阵
中
删除
空
文档
、
、
、
我
的
文档
术语
表中有空
的
文档
。我要把它们移走。这是我用来构建DocumentTermMatrix
的
代码:这是我得到
的
警告信息:In weighting(x) : empty document(s): 823 3795 4265 725284
浏览 1
提问于2018-05-06
得票数 0
回答已采纳
1
回答
在创建TermDocument
矩阵
后,无法在中看到单个数字/字母作为
术语
、
、
、
我在
R
中使用了TermDocument
矩阵
,
文档
(字符串)也包括单字母单词。使用TermDocument
矩阵
后,
术语
不包括那些单字母单词,请建议我应该包括哪个控件作为输入参数,以便在
术语
文档
矩阵
中
包括单字母单词。
浏览 11
提问于2017-03-12
得票数 1
回答已采纳
1
回答
R
中
多项
的
findAssocs
、
、
在
R
中
,我使用[tm package][1]
从
文档
集构建
术语
文档
矩阵
。In term == Terms(
浏览 4
提问于2013-05-30
得票数 2
回答已采纳
5
回答
tm包错误“无法将DocumentTermMatrix转换为正常
矩阵
,因为向量太大”
、
我已经创建了一个包含1859个
文档
(行)和25722个
文档
(列)
的
DocumentTermMatrix。为了对这个
矩阵
进行进一步
的
计算,我需要将它转换成一个常规
的
矩阵
。但是,它返回以下错误:无法分配大小为364.8 MB
的
向量。allozieren # cannot allocate vector of size 364.8 MB5502000 bytes 由于某些原因,每当将对象转换为常规
矩阵</
浏览 1
提问于2011-09-12
得票数 5
1
回答
创建双文法
的
术语
文档
矩阵
?
、
、
、
、
我能够创建TDM和DTM,并且能够使用TDF和IDF执行我
的
分析。但是我们能为
R
中
的
Bi创建一个
术语
文档
矩阵
或
文档
术语
矩阵
吗?我知道在Mahout
中
也有类似的功能,但我正在寻找一种在
R
中
这样做
的
方法?
浏览 1
提问于2014-05-14
得票数 0
1
回答
基于
R
中最频繁
的
术语
构建
文档
术语
矩阵
、
、
我在
R
中用tm包建立了一个
文档
术语
矩阵
,总共有18000个
术语
,其中大部分都不是经常出现
的
。我想
删除
频率低于0.0001
的
术语
,以减少列数。
浏览 1
提问于2015-05-23
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券