腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(241)
视频
沙龙
1
回答
基于
R
中
给定
csv
文档
术语
矩阵
的
lda
主题
建模
交叉
验证
、
、
、
、
我正在尝试进行
交叉
验证
分析,以选择要估计
的
“适当”
主题
数量。然而,我
的
数据已经编码在一个三列(相当大)
的
表
中
。Source;Target;Valueadvice;100047;1advice;100294;1这是我正在运行
的
代码和我得到
的
一些输出scales)> library(RColo
浏览 98
提问于2020-05-14
得票数 0
4
回答
将一行一个
文档
转换为Blei
的
lda
-c/dtm格式以进行
主题
建模
?
、
、
我正在为一些研究做潜在
的
Dirichlet分析,并不断遇到问题。大多数
lda
软件要求
文档
采用doclines格式,这意味着
CSV
或其他分隔文件,其中
的
每一行代表整个
文档
。但是,和动态
主题
模型软件要求数据
的
格式为:[M] [term_1]:[count] [term_2]:[count] ...[term_N]:[count],其中[M]是
文档
中
唯一
术语
的
数量,与每个
术语</
浏览 64
提问于2012-01-06
得票数 5
1
回答
WNTM、BTM和LF-
LDA
等短文本
的
主题
模型是否创建了类似于
文档
术语
矩阵
的
内容?
、
、
、
我正在处理短文本
的
主题
建模
,并遇到了三个关注相同
主题
的
模型: biterm
主题
模型(BTM)、单词网络
主题
模型(WNTM)和潜在特征
LDA
(LF-
LDA
)。我知道对于传统
的
LDA
(我已经使用
R
包topicmodel实现了它),文本
文档
的
非结构化形状通过构造
文档
术语
矩阵
(DTM)转换为计算机
浏览 8
提问于2017-11-14
得票数 1
1
回答
corpora.csvcorpus在gensim
LDA
中
的
CSV
输入
、
、
、
、
我想在gensim中使用
LDA
来对数千个
文档
进行
主题
建模
。因此,我使用
csv
-文件作为输入,格式为
术语
文档
矩阵
。当前,当运行以下代码时会发生错误: AttributeError: module
浏览 0
提问于2018-05-14
得票数 0
回答已采纳
1
回答
使用
LDA
预测
主题
、
、
、
我正在尝试从我用
R
的
'
lda
‘包构建
的
fit中提取
主题
分配。我创建了一个拟合: num.iterationsalpha = alpha, eta = eta, initial = NULL, ...and希望提
浏览 2
提问于2015-09-29
得票数 0
1
回答
tf-国防军文件
术语
矩阵
和
LDA
:
R
中
的
错误消息
、
、
、
、
我们能把tf-国防军
文档
项
矩阵
输入到潜在
的
Dirichlet分配(
LDA
)
中
吗?如果是,怎么做?(我提出一个尽可能简洁
的
问题。所以,如果你需要更多
的
细节,我可以 #################################################################
浏览 1
提问于2017-08-08
得票数 2
回答已采纳
2
回答
Gensim -
LDA
创建
文档
-
主题
矩阵
、
、
、
我正在处理一个项目,其中我需要将
主题
建模
应用于一组
文档
,并且我需要创建一个
矩阵
:我刚接触gensim,到目前为止,我已经创建了一个
文档
列表。2.对
文档
进行预处理和标记化。3.使用corpora.Dictio
浏览 0
提问于2016-03-24
得票数 0
2
回答
主题
建模
-n克还是1,2,3,.n克?
、
、
、
在
主题
建模
中
,人们在
矩阵
分解和生成模型中都使用n克还是1,2,3,……n克?我一直在尝试理解
主题
建模
的
基础知识,并逐渐认识到有两种方法:
矩阵
分解,如LSA和NNMF,以及生成模型,如
LDA
和pLSA。然而,在阅读课文时,我有一个问题--在
主题
建模
中
,人们是使用n克还是1,2,3,……n克来进行
矩阵
分解和生成模型?例如,如果是n=5,那么人们是只使用5克,还是使用所
浏览 0
提问于2022-11-30
得票数 1
1
回答
主题
模型可以用在一个小
的
文本上吗?
、
但是,我想知道我是否可以使用一个
主题
建模
系统来告诉我哪些句子更相关。有可能吗?同时,我
的
主要目标不是对文本进行
主题
建模
,而是将其作为一个特性(这两个句子是否属于同一个
主题
)来完成另一个任务。 我也想知道
主题</
浏览 2
提问于2014-07-23
得票数 2
回答已采纳
2
回答
主题
模型:使用对数似然或困惑进行
交叉
验证
、
、
、
我正在使用
主题
建模
对
文档
进行聚类。我需要想出最优
的
主题
数量。所以,我决定用
主题
10,20,...60做十次折叠
交叉
验证
。我在简历
的
一次讨论中找到了。我
浏览 112
提问于2014-01-26
得票数 25
回答已采纳
1
回答
在
R
中
手动指定
主题
模型
、
、
、
我有一个文本
的
语料库,其中包含
csv
文件
中
的
每一行,唯一地指定了我感兴趣
的
“
主题
”。如果我使用
主题
模型包或
lda
中
的
LDA
或Gibbs方法在这个语料库上运行一个
主题
模型,我将按预期得到每个“
文档
”
中
的
多个
主题
(
CSV
中
的
一行文本,我有一个先验定义为我感兴趣
浏览 2
提问于2015-06-15
得票数 0
1
回答
主题
对齐/
主题
建模
、
、
、
、
什么是最有效
的
方法来检测这篇文章是否主要是关于一个特定
的
主题
,但没有大量
的
数据进行培训?我
的
任务是确定一份文件有多少是关于天气、假期或其他几个特定
主题
的
。我期待
LDA
和TFIDF,但据我所知,这种方法是不受监督
的
,并很好地根据词汇量对大量
文档
进行聚类/分组。这些技术在控制算法应该关注
的
主题
方面有一定
的
局限性。此外,在我
的
例子
中<
浏览 0
提问于2020-04-23
得票数 1
2
回答
主题
建模
:
LDA
vs LSA vs ToPMine
、
、
、
我刚开始学习
主题
建模
。ToPMine比
LDA
和LSA好吗?我知道
LDA
和LSA已经存在了很长时间,并且得到了广泛
的
应用。 谢谢
浏览 0
提问于2022-01-20
得票数 2
回答已采纳
1
回答
如何在
R
中使用seededlda包来保留
主题
的
用户标识
、
、
、
我一直在尝试对MOOC
中
的
一组论坛帖子进行
主题
建模
。我尝试过基本
的
LDA
来创建
主题
,但是这些
主题
毫无意义。因此,现在我正在研究播种我
的
主题
,以创建更好
的
主题
。我找到了seededlda包,它需要一个dfm作为输入,以及一个种子
术语
字典。它工作得很好!我
的
问题是弄清楚每个
文档
或论坛帖子是如何分类
的
。我
的<
浏览 0
提问于2021-02-10
得票数 0
6
回答
是否从
R
主题
模型
中
的
DocumentTermMatrix
中
删除空
文档
?
、
、
、
我正在使用
R
中
的
topicmodels包进行
主题
建模
,我正在创建一个语料库对象,执行一些基本
的
预处理,然后创建一个DocumentTermMatrix:dtm <- DocumentTermMatrix(corpus, control=list(minDocFreq=2, minWordLength=2))
LDA
(dt
浏览 1
提问于2012-12-19
得票数 42
回答已采纳
1
回答
在
文档
术语
矩阵
中
查找
R
中行总数为0
的
行
、
、
我正在尝试对
R
中
的
聊天数据进行
主题
建模
。我很擅长创建
文档
术语
矩阵
的
过程。=0.995)rowTotals <- apply(dtm, 1, sum)ldaGibbs5 <-
LDA
(ldaGibbs5) topics<-colnames(gammaDF)[max.col(g
浏览 0
提问于2017-03-27
得票数 0
5
回答
如何确定
LDA
的
主题
数量?
、
、
我是
LDA
的
大一新生,我想在我
的
工作中使用它。然而,也出现了一些问题。我
的
问题是“一系列”是什么意思?
浏览 0
提问于2013-07-02
得票数 23
1
回答
改进
LDA
中
的
文档
主题
概率
、
、
、
我试图使用
R
中
的
LDA
将IT支持票分类为相关
的
主题
。 我
的
语料库有:5,550个
文档
和1882个
术语
。i以12,000个
术语
开头,但在去掉常见
的
停止词和其他噪音词之后,我用了1800多个单词。在检查LDAvis输出后,算法返回
的
结果/
主题
非常好,我已经通过检查语料库
的
样本来
验证
这一点。我在输出
中
的话是
浏览 1
提问于2016-09-23
得票数 0
6
回答
潜Dirichlet分配与递阶Dirichlet过程
、
、
潜Dirichlet分配(
LDA
)和分级Dirichlet过程(HDP)都是
主题
建模
过程。主要
的
区别是
LDA
要求指定
主题
的
数量,而HDP不需要。为什么会这样?这两种
主题
建模
方法
的
区别、利弊是什么?
浏览 0
提问于2014-05-18
得票数 62
回答已采纳
1
回答
R
-
LDA
主题
模型输出数据
、
、
我正在使用'topicmodels‘包在
R
中
构建一些
主题
模型。在预处理和创建
文档
术语
矩阵
之后,我将应用以下
LDA
Gibbs模型。这可能是一个简单
的
答案,但我是
R
的
新手,所以它是这样
的
。有没有办法将
主题
和
术语
列表连同它们
的
概率一起导出到文本文件或excel文件
中
?我可以在
R
中
打印它们
浏览 0
提问于2014-05-28
得票数 4
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据分享|Python酒店评论文本分析:tfidf、贝叶斯、逻辑回归,支持向量机SVM、K最邻近KNN、随机森林、LDA主题模型
数据分享|Python酒店评论文本分析:tfidf、贝叶斯、逻辑回归,支持向量机SVM、K最邻近KNN、随机森林、LDA主题模型
Spark平台下基于LDA的k-means算法实现
R语言社区主题检测算法应用案例
机器学习当中的数学闪光:如何直观地理解 LDA
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券