腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在R中加载
LDA
函数时出现的问题
、
我正在为R使用
文本
挖掘
tm库。我正在运行R版本3.3.1
lda
<-
LDA
(docterm,k = 3,method = 'Gibbs')topic.terms[1] <- paste(c(<
浏览 2
提问于2016-10-19
得票数 4
回答已采纳
1
回答
LDA
主题模型问题
、
、
我对twitter数据做了一些
文本
挖掘
练习。最初的dataframe有1280行。为避免: rowTotals <- apply(dtm , 1, sum)
lda
<-
LDA
(dtm.new, k = 8) topic <- topics(
lda
, 1)
浏览 4
提问于2017-07-11
得票数 0
回答已采纳
2
回答
R中的
LDA
错误:输入矩阵的每一行至少需要包含一个非零条目
我是一个
文本
挖掘
主题的初学者。当我对一个包含996165个观测值的大型数据集运行
LDA
()时,它显示以下错误:ldaOut<-
LDA
(dtm,k, method="Gibbs", control=list(nstart=nstart, seed = seed, best=best, burnin
浏览 0
提问于2016-06-14
得票数 6
1
回答
LDA
从术语文档矩阵中返回数字而不是单词
、
、
我试图使用
LDA
函数来评估R中的
文本
语料库,但是当我这样做时,它似乎使用的是观察的行名,而不是语料库中的实际单词。我在网上找不到任何关于这个的东西,所以我想我一定是在做一些非常基本的错误的事情。<-
LDA
(ints.dtm, k = 4, control = list(seed = 5421685))chapters_
lda
_td head(int
浏览 0
提问于2018-03-28
得票数 1
回答已采纳
2
回答
错误:
LDA
_VEM§类对象没有整齐的方法
、
、
我实际上是按照“R中的
文本
挖掘
: Tidy方法”第6章中提出的步骤行事。access datasetap_
lda
<-
LDA
(AssociatedPress, k = 2, control = list(seed = 1234)) ap_topics <- tidy(ap_
l
浏览 3
提问于2018-12-11
得票数 0
回答已采纳
1
回答
LDA
(潜在Dirichlet分配)的工业应用(S)
、
LDA
( 潜Dirichlet分配) -是数据
挖掘
领域的一个热门话题. 什么是工业系统使用
LDA
或可能是一些相关的模型?(可能是Google/Amazon/ .)
浏览 0
提问于2018-07-06
得票数 1
1
回答
如何比较
LDA
和TF-国防军?
、
、
、
、
我正在进行
文本
挖掘
,以从文档中提取主题。我从潜在的Dirichlet分配(
LDA
)开始,这很有效,但后来我遇到了TF-以色列国防军的K-均值聚类,这对我来说效果更好。
浏览 0
提问于2017-06-14
得票数 2
1
回答
如何找出这两个句子的相似度?
我想在Airbnb上分析客人的评论
文本
和主持人的评论
文本
。
LDA
可以显示每个段落的主题吗?(不适用于整个
文本
数据)
浏览 2
提问于2016-07-27
得票数 0
2
回答
主题建模:
LDA
vs LSA vs ToPMine
、
、
、
ToPMine比
LDA
和LSA好吗?我知道
LDA
和LSA已经存在了很长时间,并且得到了广泛的应用。 谢谢
浏览 0
提问于2022-01-20
得票数 2
回答已采纳
2
回答
从主题模型中找不到
LDA
的方法
、
、
直接从“R的
文本
挖掘
”运行这个脚本,library(broom) ap_
lda
<-
LDA
(AssociatedPress, k = 2, control = list(seed = 1234))我收到以下错误消息: as.data.frame.default(x)中的错误:无法强制类“结构”(“
LDA
_VEM”,package =“to
浏览 6
提问于2018-02-06
得票数 0
回答已采纳
1
回答
R:如何基于行字符串创建集群
、
、
、
我正在尝试根据每一行的字符串值从数据创建集群。我用的是R语言。我称之为“集群”的是一个大主题(=系列),它可以定义每个关键字。我想象一些基于关键字的自动生成,可能是使用柠檬化或ngram。这是我的输入向量: "free cloud storag
浏览 3
提问于2017-11-13
得票数 3
回答已采纳
1
回答
回归分析中如何实现潜在Dirichlet分配
、
、
、
我希望执行主题建模(
LDA
),并使用从评论中派生的主题以及其他特性来识别最影响评级的功能(评级作为因变量)。 如果我想用线性回归来做这件事,这是否意味着我必须用派生的主题来标记每个评论?(我对一般的
文本
挖掘
和数据科学都是新手。)
浏览 1
提问于2018-11-23
得票数 1
回答已采纳
1
回答
链接相关主题
、
、
、
如何通过
文本
文档链接terms(keywords实体),这些实体之间有一些关系。例如google,当您搜索一个人时,它显示的是与该人有关的其他人员的。我应该如何改进它,还有其他简单但可靠的技术吗?
浏览 1
提问于2016-01-07
得票数 1
1
回答
如何应用主题建模?
、
然后,我将
LDA
应用到主题数量设置为5的5个文档上,在这种情况下,我得到了很好的主题词。 现在,如果我不知道tweet的基本事实,我如何才能使
LDA
仍然为我提供描述5个主题的良好主题词的输入文档。
LDA
是否应该像第一段那样找到好的主题词?
浏览 2
提问于2015-04-04
得票数 1
1
回答
用Pandas加载数据,用SkLearn执行
LDA
、
、
、
我对python的数据
挖掘
非常陌生。我用这样的方式装载:import numpy as npimport matplotlib as plt print data所以当我打印我的数据时,它看起来是这样的:0 -0.864810 0.101410 1np >>> from sklearn.
lda
im
浏览 0
提问于2016-02-04
得票数 1
回答已采纳
2
回答
Gensim
LDA
一致性评分南
、
、
、
、
我创建了一个Gensim
LDA
模型,如本教程所示:它生成10个主题,log_perplexity为:
lda
_model.log_perplexity(data_df‘’bow_‘bow’)= -5.3259661
浏览 0
提问于2020-02-16
得票数 8
回答已采纳
3
回答
主题发现/发现的最佳模型
、
、
、
、
在简短的非结构化文档中发现主题的最佳模型是什么,例如。短信还是推特消息?潜在的狄利克雷分配?
浏览 2
提问于2011-10-07
得票数 3
回答已采纳
1
回答
为什么sklearn
LDA
转换非常慢?
、
、
、
lda
_object适合于
文本
语料库。现在,我们将其与一个
文本
进行拟合,以了解其主题权重。def append_
lda
_features(df,
lda
_vectorizer, tfidf+vector): st = time()
lda
_vector =
lda
_vectorizer.transform(tfidf_vector)
lda</e
浏览 81
提问于2021-02-07
得票数 0
1
回答
数据
挖掘
是否支持英语以外的其他语言?
、
我是数据
挖掘
的新手。我想做一些数据
挖掘
,而这些数据不是英文,而是日语或中文的措辞。如果你能帮忙,我将不胜感激。
浏览 3
提问于2015-01-28
得票数 0
2
回答
难以概念化如何让
LDA
-Ruby读取多个.txt文件
、
、
我正在尝试编写一个Ruby脚本,它将查看一组非结构化的纯
文本
文件,并且我正在努力思考处理这些文件的最佳方法。我的主题建模脚本的当前工作版本如下:
lda
.num_topics = 20topics =
lda
.top_words(10) 我试图修改的是让这个程序读取一个纯
文本
文件的集合这并不像将所有的
文本
文件放到一个文件中那么简单(就像目前files.csv所做的那样),因为据我所知,<
浏览 7
提问于2012-05-01
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【数据分享】R语言SVM和LDA文本挖掘分类开源软件存储库标签数据和词云可视化
Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集
一文看懂什么是文本挖掘
文本挖掘在垃圾邮件的应用
用深度学习挖掘海量文本中的宝藏
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券