腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
是否
有
R
包
来
执行
主题
连贯性
和
评估
主题
模型
?
、
在以下链接中: Topic Coherence To Evaluate Topic Models 描述了
主题
连贯性
方法
来
解决
主题
模型
的
评估
。你知道
有
什么
R
包
可以
执行
这个任务吗?
浏览 24
提问于2020-04-23
得票数 1
回答已采纳
1
回答
如何应用
主题
建模?
、
我
有
5个
主题
的10000条推文。假设我知道基本事实(每个tweet的实际
主题
),并将tweet分组为5个文档,其中每个文档包含特定
主题
的tweet。然后,我将LDA应用到
主题
数量设置为5的5个文档上,在这种情况下,我得到了很好的
主题
词。 现在,如果我不知道tweet的基本事实,我如何才能使LDA仍然为我提供描述5个
主题
的良好
主题
词的输入文档。如果在输入文档中出现类似的
主题
混合,该怎么办?LDA
是否
应该像第一段那样找到
浏览 2
提问于2015-04-04
得票数 1
1
回答
文本聚类中的关键字数量
、
、
、
我正在处理一个适当大小的数据集,并希望确定哪些#
主题
是有意义的。我同时使用了NMF
和
LDA (sklearn实现),但关键问题是:什么是衡量成功的合适标准。从视觉上看,我在许多
主题
中只有几个身高-体重关键字(其他权重~ 0),以及一些
主题
具有更多钟形分布的
主题
。目标是什么:一个
主题
只有几个单词,权重高,休息低(尖峰)或钟形分布,在一个大的#关键词NMF上逐渐减少权重 或者LDA方法我还使用了加权jaccard (设置关键字重叠
浏览 1
提问于2021-05-06
得票数 0
5
回答
如何确定LDA的
主题
数量?
、
、
为了获得最佳性能,我想估计最佳
主题
数量。通过阅读“寻找科学
主题
”,我知道我可以首先计算logP(w|z),然后使用一系列P(w|z)的调和平均值
来
估计P(w|T)。 我的问题是“一系列”是什么意思?
浏览 0
提问于2013-07-02
得票数 23
1
回答
在
主题
模型
上有没有
R
包
或发布的代码来说明时间?
、
、
我正在尝试对跨越2个世纪的政治演讲数据集进行
主题
建模,理想情况下,我希望使用考虑时间的
主题
模型
,例如随时间变化的
主题
(McCallum
和
Wang 2006)或动态
主题
模型
(Blei
和
Lafferty 2006然而,鉴于我不是一个
有
经验的程序员,
R
包
或一些实现这两个
主题
模型
的示例代码的帮助将真的很有帮助。 有没有人知道
R
是否
存在这
浏览 0
提问于2017-04-11
得票数 2
1
回答
在
R
中手动指定
主题
模型
、
、
、
我
有
一个文本的语料库,其中包含csv文件中的每一行,唯一地指定了我感兴趣的“
主题
”。如果我使用
主题
模型
包
或lda中的LDA或Gibbs方法在这个语料库上运行一个
主题
模型
,我将按预期得到每个“文档”中的多个
主题
( CSV中的一行文本,我
有
一个先验定义为我感兴趣的唯一
主题
)。我认为这是
主题
模型
的算法
和
词汇假设的结果。( 1)在
R
浏览 2
提问于2015-06-15
得票数 0
1
回答
如何寻找lda的最佳措施
、
使用实现quanteda
包
的ldarequire(quanteda.corpora)require(topicmodels)dfmat_news[ntoken(dfmat_news) > 0,]lda <- LDA(dtm, k = 10)
是否
有
任何指标可以帮助理解适当数量的
主题
我需要这个,因为我的短信很小,而且
浏览 0
提问于2019-08-12
得票数 0
回答已采纳
2
回答
LDA
主题
建模.培训
和
测试
、
我读过LDA,我理解当输入一组文档时如何生成
主题
的数学。有人能解释一下如何使用LDA
来
训练
浏览 5
提问于2012-06-22
得票数 44
1
回答
如何计算元音wabbit中LDA
模型
的对数似然
、
、
我是典型的,
有
规律的,每天的
R
用户。在
R
中,
有
非常有用的lda.collapsed.gibbs.sampler在
包
中,tha使用一个折叠的吉布斯采样器
来
拟合一个潜在的Dirichlet分配(LDA)
模型
,并利用吉布斯抽样的最后一次迭代返回潜在参数的点估计这对于
评估
收敛性
和
比较不同的LDA
模型
(针对不同
主题
的计算)非常有用。 我感兴趣的是,在
模型
中
是否
有这样的选择?
浏览 6
提问于2015-07-22
得票数 3
1
回答
python - sklearn潜在Dirichlet分配变换诉Fittransform
、
我正在使用sklearn的NMF
和
LDA子模块
来
分析未标注的文本。我阅读了文档,但不确定这些模块中的转换函数(NMF
和
LDA)
是否
与
R
的
主题
模型
中的后验函数相同(请参见)。基本上,我正在寻找一个函数,它将允许我使用训练集数据训练的
模型
来
预测测试集中的
主题
。我预测了整个数据集上的
主题
。然后将数据分解为训练集
和
测试集,对训练集
模型
进行训练,并利用该
模型</em
浏览 3
提问于2016-11-14
得票数 7
回答已采纳
2
回答
NLP分析建议
、
、
、
、
我
有
多个调查回答,每项调查都有一个高数量的回答者(3K+),尽管回答这个问题的人数相对较少(通常每项调查50人)。答复很短(通常是一行/句子答复),但我
有
大约20项调查,所以
有
一个合理的语料库可以使用。这里是我的计划(高层次):预处理
和
清理数据,对文本数据本身运行一些描述(弓,词频率,可能是tf-国防军,词云),然后尝试一些
主题
建模
和
可能的情感分析。当我在这个庞大的学习过程中工作时,我的主要问题是: 这种类型的数据集
是否
需要任何特定的
主题
建模
浏览 6
提问于2022-06-01
得票数 0
回答已采纳
2
回答
特定
主题
语言
模型
的评价
、
、
、
我已经在我的自定义数据集上完成了一个预先训练过的语言
模型
(GPT-2)。我希望
有
一种方法
来
评估
我的
模型
生成特定预定义
主题
的句子的能力,以单个关键字的形式给出。例如,给定LM,
模型
的输出与单词计算机指定的
主题
有
多大的关系?我已经尝试过的是:从LM生成足够多的句子,并将这些句子与目标
主题
(或
主题
中的每一个单词,我们
有
多个单词)之间的平均余弦相似度作为这里描述。我不确定这
是否</
浏览 0
提问于2020-10-02
得票数 2
回答已采纳
1
回答
有没有办法在
R
中的seededlda
模型
中获得预测的
主题
概率?
、
、
我正在使用
R
seededlda
包
来
训练一个种子lda
模型
()。model = textmodel_seededlda(dfmt, dict, residual = TRUE)我试着从
主题
模型
中使用后验,但它给出了一个错误。
浏览 3
提问于2021-02-17
得票数 1
3
回答
主题
发现/发现的最佳
模型
、
、
、
、
在简短的非结构化文档中发现
主题
的最佳
模型
是什么,例如。短信还是推特消息?潜在的狄利克雷分配?
浏览 2
提问于2011-10-07
得票数 3
回答已采纳
1
回答
在自然语言中比较几个语料库的最佳方法是什么?
、
、
、
、
我一直在为一个研究项目(使用Gensim
和
python)用自然语言编写叙事报告的LDA
主题
模型
。我
有
几个较小的语料库(每个语料库从1400到200个文档-我知道,这很小!)我想进行比较,但除了查看每个LDA
模型
(例如使用pyLDAviz)之外,我不知道如何进行比较。我的学术背景不是CS,而且我对NLP还是个新手。 在语料库/
主题
模型
中比较
主题
的一些好方法是什么?例如,
是否
可以估计两个LDA
模型
重叠的程度?或
浏览 0
提问于2017-09-01
得票数 4
1
回答
是否
有
Gensim或任何其他Python
包
函数来自动生成
主题
模型
的标记?
、
、
、
我
有
一组由Gensim的LDA
模型
生成的
主题
模型
。我希望它们被自动标记,这样我就可以更容易地为每个
主题
选择有意义的标签。我在
R
语言的textmineR
包
中遇到了一个名为LabelTopics的函数,我相信它可以完成我想要的功能。我想知道
是否
有
类似于在Python
包
(如Gensim )中提到的
R
包
的函数。 请让我知道。
浏览 4
提问于2022-01-02
得票数 -1
1
回答
时间序列
模型
中的外生变量
、
、
我发现,在
R
中的forecast
包
中,我可以很容易地在我的ARIMA
模型
中加入一个外生变量Y
来
预测X。虽然我对我需要经历的过程
有
一个大致的理解,以确定X上正确的ARIMA
模型
,但我不知道我需要了解什么才能将它合并为一个外生变量。我想知道
是否
有人能帮助我理解在我的
模型
中包含这个变量的含义,以及我
是否
可以
执行
任何测试/检查
来
确定在我的
模型
中使用这个变量
是否
是
浏览 0
提问于2016-08-04
得票数 0
1
回答
将多个
模型
转换为1个
模型
、
、
、
目前,为了做到这一点,我们使用机器学习
模型
每项工作。我们向它提供申请人身份的例子。但是,由于训练数据集的大小较小,这通常具有较低的性能。对这一方法的一个潜在改进可能是创建一个单一的
模型
,它接受关于申请人的信息
和
关于工作要求的信息,然后预测
是否
要面试。这种方法
有
可能奏效吗?在任何情况下都在使用/已经研究过这种技术吗?“不同的工作”代表不同的审查
主题
,“工作要求”是纳入的标准,每个“申请人”实际上是一份医学出版物。我使用了这个例子,因为它具有可比性,并且需要更少的领域专门知识<em
浏览 0
提问于2018-06-07
得票数 3
回答已采纳
1
回答
WNTM、BTM
和
LF-LDA等短文本的
主题
模型
是否
创建了类似于文档术语矩阵的内容?
、
、
、
我正在处理短文本的
主题
建模,并遇到了三个关注相同
主题
的
模型
: biterm
主题
模型
(BTM)、单词网络
主题
模型
(WNTM)
和
潜在特征LDA (LF-LDA)。我知道对于传统的LDA (我已经使用
R
包
topicmodel实现了它),文本文档的非结构化形状通过构造文档术语矩阵(DTM)转换为计算机可读的格式。我想知道上面提到的
模型
是否
使用了类似的实现方式,特别是如果它们还创建了一个类似
浏览 8
提问于2017-11-14
得票数 1
1
回答
如何测试任何H264呼叫的流量/媒体质量
、
、
、
、
如何测试任何H264呼叫的流量/媒体质量,包括为基于媒体质量的测试测试/查看什么参数。
浏览 1
提问于2017-03-03
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券