腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(6264)
视频
沙龙
2
回答
一个热编码/不平衡列会导致
聚类分析
的
偏差吗?
、
、
、
、
我想知道,对于某一特定特性,过多
的
列是否会导致
对
聚类分析
的
偏见。例如,如果我
的
数据
集
有列= “来电”、“对外电话”、“失踪电话”、“年龄”,如果我运行诸如
K-
均值
或混合模型之类
的
聚
类
算法,那么
聚
类
结果是否会有偏差,因为它主要基于调用来分割
数据
集
?另一个例子是,如果我有两个分类列:颜色(‘红色’,‘蓝色’,‘绿色
浏览 0
提问于2020-05-28
得票数 2
3
回答
比k
均值
聚
类
更精确
的
方法
、
、
、
在径向基函数网络(RBF网络)中,选择了隐层中
的
所有原型( RBF函数
的
中心向量)。此步骤可以通过以下几种方式
执行
: 智能选择原型
的
方法之一是在训练
集
上进行k
均值
聚
类
,并使用
聚
类
中心作为原型。我们只知道k
均值
聚
类
的
简
浏览 7
提问于2014-03-06
得票数 1
回答已采纳
2
回答
对
数据
集
执行
k-
均值
聚
类
后
的
聚类分析
技术
、
、
我最近被介绍了集群
技术
,因为我
的
任务是根据我
的
大学教授必须回答
的
一项调查,找到他们
的
“个人资料”或“模式”。我一直在研究一些可用
的
选项来实现这一点,我遇到了k-means
聚
类
算法。因为我
的
大多数
数据
都是分类
的
,所以我必须
执行
一次热编码(将分类变量转换为0-1个单列向量),然后在Excel上进行相关分析,以排除一些冗余变量。之后,我
对
3个集群运行k-means,并使
浏览 39
提问于2020-06-21
得票数 0
1
回答
聚
类
的
重要性是什么?
、
、
在无监督学习中,我们进行
聚类分析
(如
K-
均值
),将
数据
存储到多个
聚
类
中。我认为在
聚
类
过程中,我们正在丢失有关
数据
的
信息。是否有一些实际
的
例子,
聚
类
可能是有益
的
?
浏览 3
提问于2016-05-24
得票数 0
回答已采纳
1
回答
聚
类
二进制
数据
、
、
、
、
我希望
对
以下
数据
执行
聚类分析
(示例): ---------
K-
均值
还是分层
聚
类
最适合于
对
这类
数据
的
代码进行
聚
类
(对于大约100万个不同
的
Is ),以及用哪个距离度量?如果这两种方法都不合适,你认为最合适<
浏览 3
提问于2013-07-27
得票数 3
回答已采纳
1
回答
属性离散化
、
、
我有一个
数据
集
,我需要探索使用无监督
的
技术
(
聚
类
和关联规则)。离散数值属性
的
最佳策略是什么?此外,这(属性离散化)
对
聚
类
(使用
K-
均值
)有意义吗?因为我使用
的
是weka,所以我知道我可以使用离散化过滤器,使用findNumBins选项或useEqualFrequency。但还有其他策略吗?另外,
对
属性使用离散化,然后查找集群(使用
K-</
浏览 0
提问于2015-10-15
得票数 1
1
回答
聚
类
有效性指数是否应该包含与
聚
类
算法相同
的
度量(S)?
我目前正在尝试使用
聚类分析
作为我
的
一个项目的时间序列聚合工具。
数据
集
是高维
的
(386-d),因此无法直观地评估
聚
类
有效性.我使用三种不同
的
聚
类
算法(
k-
均值
++,k-medoids PAM,模糊c-
均值
)来寻找具有代表性
的
周期。由于我不知道
数据
集中有多少个时间段(因此,有多少个中心/medoids),所以我想
对
浏览 0
提问于2019-05-28
得票数 1
回答已采纳
1
回答
在进行
聚
类
之前,通过
对
特性(因此是
数据
)进行探索性
数据
分析,我能获得什么价值?
、
、
、
、
这可能不是一个很好
的
问题,但我仍然会问,在运行
聚
类
算法之前做EDA是否有益?注:我使用
的
是
k-
方法。
浏览 0
提问于2020-01-22
得票数 3
1
回答
将kmeans
聚
类
结果导出到.csv
、
、
我已经
对
从.csv导入
的
数据
进行了k
均值
聚
类
。是否存在将群集结果导出回.csv文件
的
方法?在
k-
均值
聚
类
完成
后
,变量
的
类
不是
数据
帧,而是
k-
均值
。
浏览 3
提问于2015-04-02
得票数 1
回答已采纳
1
回答
核k
均值
和谱
聚
类
之间
的
实际区别是什么?
、
、
、
最近我一直在想核k
均值
和谱
聚
类
算法及其区别。 我知道光谱
聚
类
是一个更广泛
的
术语,不同
的
设置可能会影响它
的
工作方式,但一个流行
的
变体是使用
K-
均值
聚
类
对
亲和矩阵
的
谱嵌入。另一方面,核
K-
均值
直接将
K-
均值
聚
类
应用于亲和矩阵.
浏览 0
提问于2020-01-09
得票数 12
2
回答
选择哪种机器学习算法?
、
、
我想选择一个无监督
的
算法来学习从
数据
中预测$n$输出,例如。图像中
的
4个坐标(像素)。我应该选择哪种算法?我认为将图像中
的
点
的
集合划分为输出(1)或不属于(0)是一种2
类
分类,可能是logistic回归,给出一个点作为输出点
的
概率。但我很困惑,因为分类算法是有监督
的
算法
的
一部分,我们有标签
的
数据
。我是否应该使用
聚
类
来找到两组可以输出
的
点?也许是异
浏览 0
提问于2018-05-25
得票数 2
1
回答
在python中对地理编码/(经度/经度)
数据
点进行
聚类分析
的
最佳方法是什么?
、
、
、
在python中对地理编码/(经度/经度)
数据
点进行
聚类分析
的
最佳方法是什么?我也尝试过使
浏览 2
提问于2016-01-27
得票数 1
1
回答
具有生存
数据
的
K-
均值
聚
类
、
、
、
一个关于生存
数据
的
k
均值
聚类分析
的
基本问题,就像这个:我正在进行k
均值
聚
类
,以确定哪些基因对生存影响最大.但是,我是否将生存时间包括在我
的
k-
均值
函数中,还是应该忽略它?致以亲切
的
问候, 哈希里马
浏览 2
提问于2021-05-18
得票数 0
回答已采纳
4
回答
聚
类
分类
数据
我有一个有分类特征
的
数据
集
。我想使用
聚
类
技术
来分割
数据
。考虑到
数据
具有分类特性这一事实,这个场景
的
可能选择是什么?这里有什么
k-
均值
的
变化吗?
浏览 0
提问于2016-08-07
得票数 2
1
回答
我们如何分析Python中
的
聚
类
特征来制定异常检测模式?
、
、
、
我正在研究ISCX
数据
集
2012,以研究异常检测。我使用Weka库实现Python
的
K-
均值
聚
类
。虽然它打印了集群信息, 我还搜索了其他库来
执行
集群,但是找不到解决方案。是否有其他方法来进行
聚
类
后
形成分析?
浏览 6
提问于2017-03-15
得票数 0
2
回答
哪种
聚
类
方法适合于哪
类
数据
?
、
我想知道 当
k-
均值
失败时,K-means最适合
聚
类
哪种类型
的
数据
??对于哪种类型
的
数据
集
k-
均值
不能给出准确
的
答案? COBWEB最适合于哪种类型
的
数据
的
聚
类
?当COBWEB失败时?对于哪种类型
的
数据
集
,COBWEB没有给出准确
的
浏览 4
提问于2010-06-04
得票数 2
1
回答
机器学习算法在
数据
属性子集中
的
应用
、
、
、
、
我有一个庞大
的
混合
数据
集
,它由数值属性和分类属性组成,在OneHotEncoding上形成一个具有很高维数
的
数据
集
。 将机器学习算法(如
K-
均值
聚
类
、降维和回归)应用于
数据
集子集是否明智?例如,首先将
K-
均值
聚
类
应用于数值列,然后将结果与分类
数据
集
连接起来。
浏览 0
提问于2018-02-28
得票数 1
回答已采纳
3
回答
分层
聚
类
:确定最优
聚
类
数,并从统计学角度描述
聚
类
。
、
、
我可以利用R中
的
一些方法来确定最优
的
簇数,然后用不同
的
统计标准来描述
聚
类
。我是R
的
新手,
对
聚类分析
的
统计基础有基本
的
了解。确定簇数
的
方法:文献中常用
的
一种确定簇数
的
方法是“弯头准则”,即比较不同簇解
的
平方差之和。因此,根据分析中
的
聚
类
数绘制出SSD图,并通过识别图中
的
“肘”(
浏览 2
提问于2012-11-06
得票数 13
回答已采纳
2
回答
机器学习中
的
无监督分类
、
、
聚
类
(例如:
K-
均值
,EM算法等)是利用
数据
点之间
的
距离度量,在
数据
集中形成
聚
类
,用于无监督分类。编辑:是的,我
的
意思是<
浏览 6
提问于2020-11-21
得票数 0
回答已采纳
1
回答
假设非线性模型但没有具体说明时,应该使用哪种统计分析?
、
、
、
这些变量之间
的
关系非常不清楚,但我假设这些变量在本质上是非线性
的
,这意味着我不应该使用线性回归或相关分析(比如说,学习
的
动机,测试
的
结果,以及成就感,对于有阅读障碍的人)。但是,由于我手头没有
数据
,所以
数据
分布
的
性质还不清楚。 我问过我
的
同事们,他们建议我使用GLM (广义线性模型),但我不确定它是否合适,因为它是线性
的
。此外,即使它适用于非线性模型,我假设回归线
的
性质需要指定(例如,二项式),但是你怎么做到
浏览 0
提问于2022-04-18
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
MATLAB用改进K-Means(K-均值)聚类算法数据挖掘高校学生的期末考试成绩
如何理解K-均值的缺陷和假设
聚类分析(一)
一文简述多种无监督聚类算法的Python实现
在 FIFA 20 将技能相似球员进行分组(1):K-均值聚类
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券