腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9635)
视频
沙龙
1
回答
主题
建模
-
我
已经
使
用了
NMF
和
LDA
,
下一步
是什么
?
、
、
、
、
我
在Python中使
用了
NMF
和
LDA
进行
主题
建模
,使用
NMF
的效果很好,而使用
LDA
的效果很差。
我
的数据是高度领域特定的,有很多独特的/特定的词汇表。
我
正在尝试一些其他的方法来改善
我
的
NMF
输出。 有没有人推荐
我
应该研究/学习的东西? 谢谢
浏览 26
提问于2021-06-27
得票数 1
1
回答
使用
LDA
(
主题
模型):每个
主题
对单词的分布是相似
和
“扁平”的。
、
、
、
潜在Dirichlet分配(
LDA
)是一个寻找潜在变量(
主题
)隐藏在一堆文档中的
主题
模型。
我
使用python包,有两个问题:
我<
浏览 2
提问于2015-02-23
得票数 7
1
回答
文本聚类中的关键字数量
、
、
、
我
正在处理一个适当大小的数据集,并希望确定哪些#
主题
是有意义的。
我
同时使
用了
NMF
和
LDA
(sklearn实现),但关键问题是:什么是衡量成功的合适标准。从视觉上看,
我
在许多
主题
中只有几个身高-体重关键字(其他权重~ 0),以及一些
主题
具有更多钟形分布的
主题
。目标
是什么
:一个
主题
只有几个单词,权重高,休息低(尖峰)或钟形分布,在一个大的#关键词
NMF</
浏览 1
提问于2021-05-06
得票数 0
2
回答
主题
建模
中的LSA、
LDA
或
NMF
?
我
正试图通过Python & NLP实现
主题
建模
,但无法确定
我
应该使用哪种算法。
我
研究过潜在语义分析(LSA)、潜在Dirichlet分配(
LDA
)
和
非负矩阵因式分解(
NMF
),但是如何确定哪一种算法最适合于特定任务?如果
我
只是连续地尝试所有这些,那么如何衡量结果呢?
浏览 0
提问于2020-06-19
得票数 2
1
回答
自动
主题
标注评估指标
、
、
我
正在尝试在一个大型研究论文数据集上做一个
主题
标签问题。
我
的想法是,
我
可以给每篇论文加上一些相关的标签。另外,假设
我
已经
提取了一堆标签,
我
如何从数学上估计它们的准确性?如果没有一大群人做定性分析,<
浏览 0
提问于2020-03-28
得票数 2
1
回答
从Apache中的
LDA
主题
模型中获取自动
主题
标签
、
、
、
我
正在进行来自非结构化数据的某些产品的分类的Apache中的
主题
建模
。 到目前为止,
我
已经
应
用了
主题
建模
(
LDA
)并获得了
主题
,但我想知道是否有任何方法可以从
LDA
提供的
主题
自动推断
主题
标签。
浏览 0
提问于2018-04-02
得票数 0
回答已采纳
1
回答
在scikit-learn的
LDA
实现中,
我
如何在整个语料库中按频率对
主题
进行排序?
、
、
我
已经
使
用了
scikit-学习执行
LDA
主题
建模
,
我
最终想按整个语料库的显着性/频率对
主题
进行排序,但我不知道如何做到这一点。vectorizer = countVectoriz
浏览 0
提问于2021-07-28
得票数 1
回答已采纳
2
回答
主题
建模
内存错误:在处理大量数据时如何进行gensim
主题
建模
、
、
、
我
在使用大量数据进行
主题
建模
时遇到了问题。
我
正在尝试做
LDA
和
NMF
主题
建模
,这是
我
以前做过的,但不是用
我
目前正在处理的大量数据。主要的问题是,
我
不能在创
建模
型的同时将所有数据都保存在内存中。
我
需要模型
和
相关指标。以下是
我
目前如何制作模型的代码 def make_
lda
(dictionary,
浏览 0
提问于2020-09-07
得票数 0
1
回答
WNTM、BTM
和
LF-
LDA
等短文本的
主题
模型是否创建了类似于文档术语矩阵的内容?
、
、
、
我
正在处理短文本的
主题
建模
,并遇到了三个关注相同
主题
的模型: biterm
主题
模型(BTM)、单词网络
主题
模型(WNTM)
和
潜在特征
LDA
(LF-
LDA
)。
我
知道对于传统的
LDA
(
我
已经
使用R包topicmodel实现了它),文本文档的非结构化形状通过构造文档术语矩阵(DTM)转换为计算机可读的格式。
我
想知道上面提到的模型是否使
用了<
浏览 8
提问于2017-11-14
得票数 1
1
回答
如何在twitter数据上形成
LDA
文档
、
、
、
、
我们需要对直播流上的twitter推文进行
主题
建模
,输入
使
spark流,并将数据存储到HDFS。在收集的数据上运行批处理作业。批处理任务是在tweet中查找底层
主题
。为此,我们使用潜在狄利克雷分配(
LDA
)算法来找出
主题
。我们接收最大字符数为140的推文形式的数据,并将其存储为HDFS中的一行。
我
是
LDA
算法的新手,对此有基本的了解,因为
主题
模型是基于n个文档中的单词共现得出的
我
知道有两种方法可以将数据输入到<em
浏览 1
提问于2017-04-17
得票数 1
1
回答
LDA
(潜在Dirichlet分配)的工业应用(S)
、
LDA
( 潜Dirichlet分配) -是数据挖掘领域的一个热门话题.
我
也要感谢关于:https://mathoverflow.net/questions/304352/latent-dirichlet-allocation-math-words-digest的评论
浏览 0
提问于2018-07-06
得票数 1
5
回答
主题
模型
和
LDA
教程
、
我
想知道你们是否有一些关于
主题
模型
和
LDA
的好教程(快速
和
直截了当),直观地教授如何设置一些参数,它们意味着什么,如果可能的话,还有一些实际的例子。
浏览 0
提问于2015-01-08
得票数 9
1
回答
改进聚类结果
、
、
我
是个初学者,
我
试着对多句文字进行聚类,但是
我
的结果很糟糕。有什么建议可以让
我
提高成绩吗?% i,) print (' %s' % termos[ind],)
我
有许多不同的
主题
出现在不同的集群中
我
预处理了
我
的数据(秒字,小写,
我
删除了点状.)。但我仍然有“喜欢取消订单”的一组,而“爱取
浏览 0
提问于2018-07-27
得票数 2
回答已采纳
1
回答
主题
建模
:
LDA
和
BTM
、
这里有人知道话题
建模
吗?
我
急需帮助。非常感谢,非常感谢。
浏览 0
提问于2019-01-15
得票数 0
2
回答
如何从
主题
建模
中制作
主题
百分比条形图?
、
、
、
我
为此绞尽脑汁
已经
一个星期了。 from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.decom
浏览 0
提问于2019-07-11
得票数 1
1
回答
对于
主题
建模
,在Amazon中,
LDA
和
NTM有什么区别?
、
我
在寻找
LDA
和
NTM之间的区别。您将在NTM上使用
LDA
的用例
是什么
?根据AWS文档:虽然您可以同时使用Amazon
和
SageMaker算法进行
主题
建模
,但它们是不同的算法,可以在相同的输入数据上产生不同的结果。
浏览 5
提问于2019-11-29
得票数 5
1
回答
是否可以对单个文档使用
主题
建模
、
、
对于单个文档使用
主题
建模
是否合理,或者更精确地说,对于单个document.If使用
LDA
-gibbs方法在数学上是可以的,那么k
和
seed的值应该
是什么
。此外,对于单个
和
大型文档集,k
和
seed的作用也
是什么
。 K
和
SEED是函数
LDA
的变量(在r studio中)。如果
我
在这个问题中的任何地方都错了,也请让
我
知道。为了讲述
我
的项目,
我
试图找出
浏览 28
提问于2019-04-22
得票数 0
回答已采纳
2
回答
主题
建模
:
LDA
vs LSA vs ToPMine
、
、
、
我
刚开始学习
主题
建模
。ToPMine比
LDA
和
LSA好吗?
我
知道
LDA
和
LSA
已经
存在了很长时间,并且得到了广泛的应用。 谢谢
浏览 0
提问于2022-01-20
得票数 2
回答已采纳
2
回答
从语料库构建词库
、
、
我
正在开发一个自然语言处理应用程序。
我
有一篇文章描述了30个领域。每个域都定义了一个简短的段落来解释它。
我
的目标是从本文中构建一个词库,这样
我
就可以从输入的string中确定哪些域是相关的。
我
的问题是:
我
建立同义词库的想法是合法的,还是应该使用NLP库来分析
我
的语料库
和
输入字符串?目前,
我
已经
计算了按域分组的每个单词的出现总数,因为
我
首先想到的
浏览 1
提问于2014-06-12
得票数 2
回答已采纳
1
回答
使用Python库提取文本的
主题
、
、
我
希望使用Python获取文本的
主题
(或一组主要
主题
)。有提供此功能的Python库吗?
浏览 4
提问于2016-04-01
得票数 0
点击加载更多
相关
资讯
机器学习当中的数学闪光:如何直观地理解 LDA
机器学习中7种常用的线性降维技术总结
R语言对NASA元数据进行文本挖掘的主题建模分析
R语言社区主题检测算法应用案例
Python之LDA主题模型算法应用
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券