腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
textmineR
对
LDA
模型
中
每个
文档
的
主题
标签
、
、
、
、
我正在
使用
textmineR
来适应类似于https://cran.r-project.org/web/packages/
textmineR
/vignettes/c_topic_modeling.html
的
文档
的
LDA
模型
。是否可以获得数据集中
每个
文档
的
主题
标签
?, optimize_alpha
浏览 20
提问于2019-05-19
得票数 0
回答已采纳
1
回答
是否有Gensim或任何其他Python包函数来自动生成
主题
模型
的
标记?
、
、
、
我有一组由Gensim
的
LDA
模型
生成
的
主题
模型
。我希望它们被自动标记,这样我就可以更容易地为
每个
主题
选择有意义
的
标签
。我在R语言
的
textmineR
包
中
遇到了一个名为LabelTopics
的
函数,我相信它可以完成我想要
的
功能。我想知道是否有类似于在Python包(如Gensim )中提到
的
R包
的</e
浏览 4
提问于2022-01-02
得票数 -1
1
回答
标记
LDA
用法
、
、
、
我正在做一个需要应用
主题
模型
LDA
的
项目。因为在我
的
例子
中
,
每个
文档
都是短
的
,所以我必须
使用
标签
LDA
。我
对
这方面的知识不多,我所需要做
的
就是将LLDA应用于我
的
数据。我从部分培训中了解到,有
标签
的
LDA
模型
是:在培训之前,我应该给
每个
输入
浏览 2
提问于2013-05-24
得票数 3
回答已采纳
2
回答
主题
建模,但与已知
的
主题
?
好
的
,通常是
主题
模型
(如
LDA
,pLSI等)用于推断一组
文档
中
可能以无监督方式出现
的
主题
。我想知道是否有人
对
我如何将我
的
问题塞进
LDA
框架有任何想法,因为有非常好
的
工具可以解决
LDA
问题。为了彻底起见,我有以下几条信息作为输入: 在这种情况下,<
浏览 2
提问于2013-05-28
得票数 6
1
回答
sLDA。响应变量可能有多少值?
、
总的来说,我试图理解sLDA是如何工作
的
。与
LDA
不同,它具有“与
每个
文档
关联
的
响应变量”。在培训集中,
每个
文档
都是由一个
主题
标记
的
,还是由多个
主题
标记
的
?如果必须只
使用
一个
主题
作为一个
文档
的
标签
,那么是否存在另一个
LDA
模型
,它为培训集中
的
每个</
浏览 1
提问于2014-03-18
得票数 0
回答已采纳
2
回答
如何
使用
"
textmineR
“包在R
中
通过
LDA
重新尝试将
主题
分配给特定
的
文档
、
、
使用
"
textmineR
“包,我得到了相同
的
主题
。我有以下三个
主题
: t_1 policy 0.092 37.374community 0.004 24.949 community, federal, reserve, more, return, mortgage 能否有人建议我如何将每一个
主题
分配到相关
的<
浏览 0
提问于2020-02-25
得票数 0
回答已采纳
1
回答
主题
提取和文本分类在概念上
的
区别是什么?
、
、
、
我感到困惑
的
是,非常类似的文本挖掘服务有不同
的
名称,比如
主题
提取和文本分类/分类。它们之间在概念上有什么区别?分类示例:
浏览 0
提问于2018-02-28
得票数 1
回答已采纳
3
回答
使用
从潜在Dirichlet分配派生
的
主题
对
文档
进行聚类
、
、
我想
对
一个项目
使用
潜在
的
Dirichlet分配,我正在
使用
Python和gensim库。在找到
主题
之后,我希望
使用
k-方法这样
的
算法对
文档
进行聚类(理想情况下,我希望对重叠
的
集群
使用
一个很好
的
方法,因此欢迎任何建议)。我设法得到了这些
主题
,但它们
的
形式如下: 0.041*部长+0.041*关键+0.041*瞬间+0.041*有争议
的
+0.041*
浏览 0
提问于2014-11-13
得票数 9
2
回答
如何在
LDA
模型
中
获取新
文档
的
主题
、
、
、
、
如何在
LDA
模型
中
动态传递用户给出
的
.txt
文档
?我已经尝试了下面的代码,但是它并没有给出适当
的
文档
主题
。我
的
.txt
的
主题
与体育有关,因此它应该将
主题
命名为Sports。它给出
的
输出如下: Score: 0.5569453835487366 - Topic: 0.008*"bike" + 0.005*"game" +
浏览 10
提问于2020-03-26
得票数 1
回答已采纳
1
回答
如何测量在R中用
textmineR
包制作
的
LDA
模型
上
的
困惑分数?
、
、
我在R
中
建立了一个
LDA
主题
模型
,
使用
textmineR
包,如下所示。## get
textmineR
dtm calc_r2 = TRUE,接下来
的</em
浏览 3
提问于2019-12-19
得票数 2
回答已采纳
1
回答
标签
的
LDA
(gensim)
、
、
我
使用
Gensim包进行
主题
建模。这个想法是为了理解flickr
标签
中
的
主题
是什么。到目前为止,我
使用
的
是这个代码(
文档
是
标签
): texts = [[word for word in document.split(";") if word not in stoplist] for
LDA
,然后为
每个
主题
打印最可能
的
10
浏览 3
提问于2016-03-04
得票数 2
3
回答
主题
发现/发现
的
最佳
模型
、
、
、
、
在简短
的
非结构化
文档
中发现
主题
的
最佳
模型
是什么,例如。短信还是推特消息?潜在
的
狄利克雷分配?
浏览 2
提问于2011-10-07
得票数 3
回答已采纳
1
回答
主题
建模-指定一个以前两个
主题
作为类别
标签
的
文档
-学习潜在
的
Dirichlet分配
、
、
、
、
我现在正在学习
LDA
(潜在Dirichlet分配)
主题
建模方法,以帮助从一组
文档
中提取
主题
。根据我从下面的链接中所了解到
的
,这是一种无监督
的
学习方法,可以对
每个
文档
进行分类/标记,并将其与提取
的
主题
结合起来。 在该链接
中
给出
的
示例代码
中
,定义了一个函数来获取与
每个
主题
相关联
的
顶部单词。model:&
浏览 3
提问于2015-12-23
得票数 9
回答已采纳
1
回答
如何应用
主题
建模?
、
我有5个
主题
的
10000条推文。假设我知道基本事实(
每个
tweet
的
实际
主题
),并将tweet分组为5个
文档
,其中
每个
文档
包含特定
主题
的
tweet。然后,我将
LDA
应用到
主题
数量设置为5
的
5个
文档
上,在这种情况下,我得到了很好
的
主题
词。 现在,如果我不知道tweet
的
基本事实,我如何才能使<e
浏览 2
提问于2015-04-04
得票数 1
1
回答
有没有办法在R
中
的
seededlda
模型
中
获得预测
的
主题
概率?
、
、
我正在
使用
R seededlda包来训练一个种子
lda
模型
()。model = textmodel_seededlda(dfmt, dict, residual = TRUE)我试着从
主题
模型
中
使用
后验,但它给出了一
浏览 3
提问于2021-02-17
得票数 1
2
回答
标记
LDA
+引导式
LDA
主题
建模
、
、
、
、
我
对
机器学习、NLP和
LDA
都比较陌生,所以我甚至不确定我是否完全正确地处理了我
的
问题;但我正在尝试
使用
已知
主题
和多个
主题
选择进行无监督
的
主题
建模。我可以用
每个
单独
的
主题
标记我
的
每一个
文档
,并且我
的
无监督集实际上变成了有监督
的
(LLDA是一种有监督
的
技术)。那么,有没有什么算法(我假设修改了LLDA,但我在这方
浏览 47
提问于2019-02-22
得票数 1
2
回答
LDA
和
主题
模型
、
、
、
我研究过几个weeks.But
的
LDA
和
主题
模型
,由于我
的
数学能力较差,不能完全理解它
的
内部算法,我
使用
了GibbsLDA实现,输入了大量
的
文档
,并将
主题
数设置为100,我得到了一个名为"final.theta“
的
文件,它存储了
每个
document.This
中
每个
主题
的
主题
比例,结果
浏览 0
提问于2012-03-07
得票数 4
1
回答
LDA
模型
中
超参数α和θ
的
设置规则
、
我想知道更多关于在
LDA
模型
中
是否有设置超参数α和θ
的
规则。我运行由库gensim给出
的
LDA
模型
ldamodel = gensim.models.ldamodel.LdaModel(corpus, num_topics=30, id2word = dictionary根据我在库
文档
中
显示
的
内容,这两个超参数都被设置为1/数
的
主题
。假设我
的
模型
浏览 2
提问于2016-09-22
得票数 4
回答已采纳
1
回答
在自然语言中比较几个语料库
的
最佳方法是什么?
、
、
、
、
我一直在为一个研究项目(
使用
Gensim和python)用自然语言编写叙事报告
的
LDA
主题
模型
。我有几个较小
的
语料库(
每个
语料库从1400到200个
文档
-我知道,这很小!)我想进行比较,但除了查看
每个
LDA
模型
(例如
使用
pyLDAviz)之外,我不知道如何进行比较。我
的
学术背景不是CS,而且我
对
NLP还是个新手。 在语料库/
主题
浏览 0
提问于2017-09-01
得票数 4
1
回答
在R
中
手动指定
主题
模型
、
、
、
如果我
使用
主题
模型
包或
lda
中
的
LDA
或Gibbs方法在这个语料库上运行一个
主题
模型
,我将按预期得到
每个
“
文档
”
中
的
多个
主题
( CSV
中
的
一行文本,我有一个先验定义为我感兴趣
的
唯一
主题
)。我认为这是
主题
模型
的
算法和词汇假设
浏览 2
提问于2015-06-15
得票数 0
点击加载更多
相关
资讯
【数据分享】R语言SVM和LDA文本挖掘分类开源软件存储库标签数据和词云可视化
Python之LDA主题模型算法应用
Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集
Spark平台下基于LDA的k-means算法实现
机器学习-话题模型
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券