腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
python
确定
给定
数据
集
的
最佳
k
均值
、
、
、
、
我对
python
和那些杂乱无章
的
东西还很陌生。现在,我
的
任务是分析一组
数据
,并
使用
弯头和轮廓方法
确定
其最优Kmean。 ? 如图所示,我
的
数据
集
有三个特征,一个是被测试者
的
体重,第二个是被测试者
的
血液胆固醇含量,第三是被测试者
的
性别(‘0’表示女性,'1‘表示男性) 我首先用elbow方法查看不同
k
值下
的
wcss值。然后,我<em
浏览 38
提问于2020-04-11
得票数 0
回答已采纳
1
回答
使用
PyCluster优化
K
(理想簇数)
、
、
、
、
我
使用
PyCluster
的
kMeans来集群一些
数据
--很大程度上是因为SciPy
的
kMeans2()产生了无法克服
的
错误。。无论如何,PyCluster kMeans运行良好,我现在正在尝试优化kMeans集群
的
数量。PyCluster附带
的
文献表明,我可以通过实现EM算法-- --来优化它
的
kMeans,但是我找不到一个例子。 有人能给我指个PyCluster
k
-means优化问题吗?提前感谢您
的
帮助。
浏览 1
提问于2013-05-16
得票数 2
回答已采纳
2
回答
如何选择“
最佳
”
的
无监督机器学习算法来对特定
数据
集
进行聚类?
、
、
、
我想对
数据
集
进行聚类,而不需要事先知道集群
的
正确数量。对于不同
的
算法(即
k
-
均值
,gmm.)我可以迭代不同
的
值,并试图为任何
给定
的
算法(如蜂窝曲线,剪影系数等)找到
最佳
解。但是我得到了非常不同
的
结果--正如不同算法所期望
的
那样。
K
-
均值
对球形团簇是有利
的
,对于完全不同
的
团簇形状则是基于密度
的
方
浏览 0
提问于2020-06-23
得票数 1
1
回答
如何获得
k
均值
簇
的
权重和方差?
、
、
我试图复制这论文
的
结果,但是
使用
python
和HMMlearn库来代替matlab。本文介绍了一种利用隐马尔可夫模型( HMM )预测股票价格
的
方法。本文详细介绍了用四态5混合高斯分布作为模型.转移概率和初始状态概率是一致
的
,但发射概率是根据现有股票价格
数据
集
的
k
均值
算法
的
结果来
确定
的
。后半部分是我陷入困境
的
地方,本文建议
使用
<
浏览 0
提问于2016-04-28
得票数 2
回答已采纳
1
回答
确定
K
-表示
Python
中
的
簇数
、
、
、
我将一个轨迹
数据
集
保存在一个*.csv文件中,并根据月份对其进行排序。我是说,我按月把它分成了不同
的
文件。每个文件中
的
记录数是不同
的
。例如,一月份我有一万张唱片,四月份我有五十万张唱片。我将对每个文件在
python
中执行
k
均值
集群。你能告诉我怎样才能找到或
确定
的
最佳
簇数到初始
的
K
谢谢
浏览 1
提问于2021-03-21
得票数 0
1
回答
将多元高斯分布拟合到
给定
的
数据
集
、
我需要拟合多变量高斯分布,即获得
python
中
给定
音频特征
数据
集
的
最接近多变量高斯
的
均值
向量和协方差矩阵。音频特征(MFCC系数)是N×13矩阵,其中N约为4
K
。谁能概述一下
python
中适合这些
数据
的
高斯分布
的
包和技术吗?
浏览 6
提问于2014-12-01
得票数 13
1
回答
使用
python
实现
给定
数据
集
的
最优
k
-
均值
、
我对
python
和集群
的
最佳
数量还是个新手。现在,我
的
任务是分析两组
数据
,并
使用
弯头和轮廓方法
确定
其最优Kmean。 X表示归一化前
的
原始
数据
。我
使用
elbow方法查看不同
k
值下
的
wcss值,
使用
silhouette方法查看silhouette分数。= range(2,15) km = KMean
浏览 16
提问于2020-11-25
得票数 2
1
回答
聚类和分类
的
详细信息
、
、
、
我有一个文件,大约有10000行,每一行都有一个随机句子,例如 他以前在医疗行业工作过。他在计算机科学领域有5年
的
经验。我所做
的
: 单词格式中
的
切分:在从字符串中词干和清除后,对所有10000句中
的
每个干净单词进行
浏览 3
提问于2014-11-30
得票数 0
回答已采纳
1
回答
如何在
python
中连接N个不同
的
一维数组
、
、
、
我是
python
的
新手。我必须在
python
中实现
k
折交叉验证。我可以将
给定
的
数据
拆分成
k
个大小相等
的
数组,但不能将
k
-1个数组连接起来,这将是训练
数据
集
。我知道numpy中
的
concatenate(),但由于
k
是动态
确定
的
,因此不
确定
如何在此场景中
使用
它。感谢您在这方面的任
浏览 1
提问于2016-02-12
得票数 2
1
回答
如何计算
K
的
BIC --求
最佳
K
、
我对
K
-
均值
聚类技术非常陌生。我想用
K
-
均值
来计算BIC,找出
最佳
的
K
(簇数)。我环顾了一下网络,想在
python
中找到一个解决方案,但是除了之外,没有任何具体
的
例子,我不
确定
它是否正确。
浏览 1
提问于2016-02-13
得票数 0
回答已采纳
1
回答
在
python
中对地理编码/(经度/经度)
数据
点进行聚类分析
的
最佳
方法是什么?
、
、
、
在
python
中对地理编码/(经度/经度)
数据
点进行聚类分析
的
最佳
方法是什么?我也尝试过
使用
DBscan,但我认为它不是基于我
的</em
浏览 2
提问于2016-01-27
得票数 1
1
回答
如何计算
k
均值
何时收敛于tf idf?
、
、
、
、
我是一个
使用
文本
数据
的
新手。在我把它转换成一个稀疏矩阵后,我用5-10个簇来拟合
k
均值
,但我不知道我是否收敛了。
浏览 0
提问于2016-08-06
得票数 0
回答已采纳
1
回答
房地产价格区域分割图
、
我收集了一些权重作为房地产价格
的
积分。我需要把地图分割到房地产价格
的
各个地区。因此,价格接近
的
兄弟区域应该合并。类似Voronoi图但是区域合并。你能给我推荐一些好算法吗。提前谢谢。
浏览 1
提问于2018-12-09
得票数 0
回答已采纳
1
回答
NLP:识别
给定
的
文本是查询还是语句
、
、
、
我正在进行对话式chatbot.How,以
确定
给定
的
文本是要求回答还是提供一些信息?案例二:我想知道波士顿洛根机场到酒店
的
距离。预期结果:问题我有19
k
个查询
的
数据
集
,分类为(问题而不是问题).What是现在继续
的
最佳
方式/模型(
使用
Python
)?
浏览 0
提问于2018-01-19
得票数 1
1
回答
拟合分布参数
、
、
、
、
在为我
的
数据
集
搜索
最佳
匹配分布时,结果是具有以下参数
的
指数修正正态分布:西佩给了我们一种方法,通过以下方法分析分布
的
平
均值
:生成
的
fitt
浏览 1
提问于2018-03-20
得票数 0
回答已采纳
1
回答
在sklearn中
使用
支持向量机时如何实际
使用
验证
集
、
在
使用
SVM时,我发现对原始
数据
集
执行三向拆分是一种很好
的
做法,类似于70/15/15
的
拆分。 这种分割将对应于%70用于培训,%15用于测试,%15对应于所谓
的
“验证”。我很清楚为什么这是一个很好
的
实践,但我不
确定
实际执行这一操作所需
的
具体细节。很多在线资源讨论了这个过程
的
重要性,但是我似乎找不到对这个过程
的
明确描述(或者至少是算法描述)。例如,sklearn讨论了,但在提供任
浏览 1
提问于2014-01-26
得票数 3
1
回答
加权
K
均值
与GPS
数据
、
、
、
目标 我一直在讨论如何将加权变量添加到
k
-
均值
算法中,但我不
确定
对变量进行加权
的
实际过程。如果是这样的话,那么距离不是不适当地倾斜并且错误地代表了仓库配送中心
的
最佳</em
浏览 5
提问于2016-10-05
得票数 1
回答已采纳
1
回答
如何为DBSCAN寻找最优参数?
、
、
、
对于DBSCAN算法,是否有计算挖掘值和eps值
的
工具? 目前,我
使用
sklearn库来应用DBSCAN算法。
浏览 1
提问于2019-11-21
得票数 3
回答已采纳
3
回答
有什么方法来检测
给定
的
图片是否是人
的
脸?
、
、
、
、
是否有任何简单
的
算法来判断
给定
的
图像是脸还是其他(没有希望
的
训练)? 我
的
思想是构造每幅图像
的
特征向量,然后应用一些聚类方法(例如
k
=2
的
k
-
均值
)。但是,即使获得了良好
的
聚类结果,我也不
确定
什么是区分脸/非脸
的
最佳
标准?
浏览 3
提问于2014-03-18
得票数 3
回答已采纳
1
回答
聚类2D曲线
、
、
我在2D空间中有一组曲线,每个曲线表示为一组(抽样)
数据
点。每一组都有或多或少相同
的
项目数量--最终,我想我将
使用
binning来确保点数相同(比如50),如果有帮助的话。第一个维度上可能
的
翻译是不相关
的
。我想把这个问题转化成一个100维空间(50x2),其中每个曲线
的
样本成为特征。 这种方法能起作用吗?有没有更好
的
方法,要么
使用
<e
浏览 0
提问于2021-05-01
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
第33集 python机器学习:K均值对多维数据集的处理
机器学习的第一步:先学会这6种常用算法
一文简述多种无监督聚类算法的Python实现
使用Python实现无监督学习
手把手教你在多种无监督聚类算法实现Python
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券