腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
Python
中
对
具有
相同
列
的
多个
excel
文档
进行
聚
类
、
、
我有一个任务,需要集群
的
数据从几个
excel
文档
的
能力,以查看从
文档
数据采取
的
文字。 问题是,我不知道如何从这些文件中提取数据,并记住从哪个文件中提取了数据。假设我
在
每个
excel
文档
(col_1、col_2、col_3)中有3
列
,我需要对数据
进行
聚
类
。 我在网上搜索过类似的问题,但是没有结果。 任何帮助都是有帮助
的
!提前感谢您
的</em
浏览 42
提问于2020-04-10
得票数 0
1
回答
选择合适
的
聚
类
方法
进行
潜在语义分析
、
、
我想
对
一些文本
文档
进行
聚
类
,以找到
具有
相同
概念
的
文档
。我已经使用潜在语义分析(LSA)
进行
了语义相似性分析,但我搞不清应该选择哪种
聚
类
方法来实现我
的
目的。谢谢
浏览 1
提问于2015-06-19
得票数 0
2
回答
如何使用k-means (Flann和
python
)对
文档
进行
聚
类
?
、
、
、
、
我想根据相似性对
文档
进行
聚
类
。我已经尝试过ss深处(相似散
列
),非常快,但是我被告知k-means更快,而flann是所有实现中最快
的
,所以我尝试用
python
绑定来尝试flann,但是我找不到如何在文本上这样做
的
例子(它只支持数字数组我
对
这个领域(k-意思,自然语言处理)非常陌生.我需要
的
是速度和准确性。我
的
问题是: 我们是否可以使用KMeans
进行
文档
相似
浏览 9
提问于2012-09-19
得票数 11
回答已采纳
1
回答
如何高效地查找相似
文档
、
、
、
、
我有很多使用
聚
类
算法
进行
聚
类
的
文档
。
在
聚
类
算法
中
,每个
文档
可以属于一个以上
的
聚
类
。我已经创建了一个存储document-cluster赋值
的
表和另一个存储cluster-document信息
的
表。我首先检索它所属
的
集群列表(从document-cluster表
中</e
浏览 0
提问于2015-05-05
得票数 0
1
回答
将概念上相似的
文档
聚在一起?
、
、
、
、
这更多是一个概念性
的
问题,而不是一个实际
的
实现,我希望有人能澄清。我
的
目标是:给定一组
文档
,我希望
对
它们
进行
聚
类
,使属于同一个集群
的
文档
具有
相同
的
“概念”。据我所知,让我找到一个项
文档
矩阵
的
低秩逼近,即给定一个矩阵X,它将X分解为三个矩阵
的
乘积,其中一个是对角矩阵Σ。现在,我将选择一个低秩近似,即只
浏览 2
提问于2011-07-07
得票数 6
回答已采纳
1
回答
如何
对
r
中
充满字符串变量
的
数据集
进行
K-means
聚
类
、
、
现在,我有一个充满字符串变量
的
数据集,但我想在此基础上做一个集群项目。
在
我
对
所有变量应用as.factor()后,nbclust()仍然不能工作,我该怎么办?
浏览 63
提问于2018-05-31
得票数 -1
回答已采纳
3
回答
比tf/idf和余弦相似度更好
的
文本
文档
聚
类
?
、
、
、
我
在
试着把推特上
的
流聚在一起。我想把每个tweet放到一个讨论
相同
主题
的
集群
中
。我尝试使用
具有
tf/idf和余弦相似度
的
在线
聚
类
算法对流
进行
聚
类
,但我发现结果相当糟糕。使用tf/idf
的
主要缺点是它对关键字相似的
文档
进行
聚
类
,因此只能识别接近
相同
的
浏览 0
提问于2013-07-09
得票数 18
1
回答
基于索引
的
文本
聚
类
、
、
、
、
目前,我正在开发一个项目,
对
两百万个文本备忘录
进行
聚
类
。我
的
目标是为这些备忘录创建一个标准(实际上,当我说备忘录时,我指的是包含
对
某事
的
描述
的
文本)。为此,我希望首先
对
相似的备忘录
进行
聚
类
(收集那些可能
具有
相同
含义
的
备忘录),然后为每个
聚
类
或组创建一个标签。由于我是NLP
的
新
浏览 4
提问于2018-03-23
得票数 0
1
回答
使用经过训练
的
K-Means模型预测未见数据
的
正确
聚
类
、
、
、
、
我正在使用K-Means算法
对
一个医学语料库
进行
聚
类
。我正在创建一个术语
文档
矩阵来表示这个语料库。
在
将数据提供给kmeans算法之前,我对数据
进行
截断奇异值分解以
进行
降维。我一直在想,是否有一种方法可以
在
不重新训练整个模型
的
情况下
对
新
的
未见过
的
文档
进行
聚
类
。为了获得新
文档
<e
浏览 18
提问于2019-02-04
得票数 1
1
回答
聚
类
循环
Python
我正在使用kmeans
对
python
中
的
数据集
进行
聚
类
。在对数据集
进行
聚
类
之前,我使用肘形曲线确定了最佳
聚
类
数。 最优
聚
类
数为5。因此,在对数据集
进行
kmeans
聚
类
之后,我得到了5个不同
的
聚
类
。这是我
的
问题。现在我有了5
浏览 1
提问于2022-01-31
得票数 0
回答已采纳
1
回答
多维
聚
类
的
相关性
、
、
我有一个
具有
多个
功能
的
dataframe,其中我选择了3个特性来
进行
集群。例如。| Col3 A | 1 | iC | 2 | k我试图
进行
集群,以便如果在任意两
列
中有匹配
的
值,它将将该行添加到同一集群
中
,用于集群中值
中
的
所有匹配。因此,从这个表
中
,我
浏览 0
提问于2020-07-15
得票数 1
1
回答
集群验证:如何验证和度量预定义
的
集群
、
、
我
对
python
很陌生,我正在开发一个消费数据集,在这里我们使用LCA、K-Means、DBSCAN和谱
聚
类
来计算集群。在所有这些方法
中
,簇
的
数目是不同
的
(
在
K-均值
中
为EG-5簇,而LCA
中
为7),自变量可能是
相同
的
,也可能不是
相同
的
(例如- 12个自变量
在
K-均值
中
,10个
在
LCA
浏览 8
提问于2021-02-23
得票数 0
3
回答
python
中
的
谱
聚
类
图
、
、
、
、
我想使用谱
聚
类
在
python
中
对
图
进行
聚
类
。 谱
聚
类
是一种更通用
的
聚
类
技术,它不仅适用于图形,也适用于图像或任何类型
的
数据,但它被认为是一种特殊
的
图
聚
类
技术。遗憾
的
是,我
在
python
网上找不到谱
聚
<em
浏览 9
提问于2017-09-16
得票数 33
回答已采纳
2
回答
BigQuery群集表:如何创建
多个
集群
我
的
BigQuery表通常使用"where“条件
的
不同组合在一个或更
多个
常见
列
之间
进行
查询,例如跨
列
A、B、C (不按顺序排列)。因此,我想分别为A、B和C
列
添加单独
的
集群。如何为BigQuery表创建
多个
集群?(类似于如何在传统
的
rdbms表上创建
多个
索引)
浏览 5
提问于2020-05-26
得票数 3
回答已采纳
1
回答
用于对地图和
聚
类
上
的
点
进行
分组
的
算法必须
具有
相同
的
第三个要素总和
、
、
、
、
我正在寻找一种
在
地图(纬度/经度)上
对
点(43429)
进行
分组
的
算法:像kmeans这样
的
算法不会使
聚
类
具有
相同
的
“权重”。 你知道做
浏览 0
提问于2020-03-10
得票数 0
1
回答
如何将CSV文件导入Octave并保留
列
标题
、
我正在尝试导入CSV文件,以便可以将其与k-means
聚
类
算法一起使用。该文件包含6
列
和400多行。我使用
的
excel
文档
的
Here is a picture (
在
将其导出为CSV文件之前)。本质上,我希望能够
在
代码中使用
列
标题名称,以便在绘制数据以及对数据
进行
聚
类
时可以使用列名称。BA OPS RBI OBP] = CSVIMPORT( 'MLBdat
浏览 43
提问于2021-04-22
得票数 1
1
回答
基于特定关键字创建集群
、
、
、
、
我正在使用
聚
类
将
文档
中
的
常见单词组合在一起。我
的
要求是根据特定
的
单词列表创建集群,也就是说,我想获得一组通常与用户给定
的
单词列表一起发现
的
单词。从视觉上看,集群应该如下所示。通常,集群技术
的
重点是创建隔离
的
集群,而我需要有一些重叠
的
隔离集群。图像显示了预期结果
的
视图。我尝试过使用k均值
聚
类
、Apriori算法和
Pytho
浏览 0
提问于2021-03-30
得票数 0
1
回答
有哪些方法可以评估
聚
类
的
相似性?
、
、
、
假设我有两种方法
对
同一数据集
进行
聚
类
,并希望计算它们输出
的
相似度。我将不得不计算一些类似于相关性
的
东西,但集群标签是一个分类变量。我考虑过使用卡方,但当
列
联表
中
的
多个
单元格<5时,不建议使用卡方(当
聚
类
非常相似时,这将经常发生)。另一个线索是使用Fisher
的
精确测试,但
Python
scipy实现只适用于2x2
的
浏览 32
提问于2020-03-30
得票数 0
1
回答
如何使用LDA或任何主题建模算法获取
文档
的
意图
、
、
、
我需要基于
文档
的
意图
对
一组
文档
进行
聚
类
,我计划使用LDA(潜在Dirichlet分配-主题建模)。 我可以从主题建模
中
获取意图来对
文档
进行
分组吗?有没有其他算法可以根据
文档
的
意图对
文档
进行
聚
类
。这种使用主题建模
进行
意图
聚
类
的
方法是好
浏览 0
提问于2019-08-20
得票数 0
4
回答
自组织映射(SOM)不能有效地
在
颜色空间中
聚
类
图像?
、
、
、
我试图
在
ai-junkie网站上重现实验,
在
一个更大
的
颜色数据集上使用自组织映射将不同
的
颜色
聚
类
/分组在一起。我使用了大约400张不同纯色
的
图像,因为它们是纯色,所以任何颜色空间(例如,RGB)
中
的
颜色值对于特定图像
中
的
所有点都是
相同
的
。因此,
在
使用SOM
进行
聚
类
之前,我使用
浏览 1
提问于2011-07-07
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何使用python中matplotlib库分析图像颜色
EXCEL的表格排序功能,Python也能轻松应对
手把手教你做一个“渣”数据师,用Python代替老情人Excel
Python实现K-means聚类算法
excel文件之数据处理-python/ExcelLibrary
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券