使用python确定给定数据集的最佳k均值

、、、、

我对python和那些杂乱无章的东西还很陌生。现在，我的任务是分析一组数据，并使用弯头和轮廓方法确定其最优Kmean。 ? 如图所示，我的数据集有三个特征，一个是被测试者的体重，第二个是被测试者的血液胆固醇含量，第三是被测试者的性别(‘0’表示女性，'1‘表示男性) 我首先用elbow方法查看不同k值下的wcss值。然后，我<em

浏览 38提问于2020-04-11得票数 0

回答已采纳

1回答

使用PyCluster优化K(理想簇数)

、、、、

我使用PyCluster的kMeans来集群一些数据--很大程度上是因为SciPy的kMeans2()产生了无法克服的错误。。无论如何，PyCluster kMeans运行良好，我现在正在尝试优化kMeans集群的数量。PyCluster附带的文献表明，我可以通过实现EM算法-- --来优化它的kMeans，但是我找不到一个例子。有人能给我指个PyCluster k-means优化问题吗？提前感谢您的帮助。

浏览 1提问于2013-05-16得票数 2

回答已采纳

2回答

如何选择“最佳”的无监督机器学习算法来对特定数据集进行聚类？

、、、

我想对数据集进行聚类，而不需要事先知道集群的正确数量。对于不同的算法(即k-均值，gmm.)我可以迭代不同的值，并试图为任何给定的算法(如蜂窝曲线，剪影系数等)找到最佳解。但是我得到了非常不同的结果--正如不同算法所期望的那样。K-均值对球形团簇是有利的，对于完全不同的团簇形状则是基于密度的方

浏览 0提问于2020-06-23得票数 1

1回答

如何获得k均值簇的权重和方差？

、、

我试图复制这论文的结果，但是使用python和HMMlearn库来代替matlab。本文介绍了一种利用隐马尔可夫模型( HMM )预测股票价格的方法。本文详细介绍了用四态5混合高斯分布作为模型.转移概率和初始状态概率是一致的，但发射概率是根据现有股票价格数据集的k均值算法的结果来确定的。后半部分是我陷入困境的地方，本文建议使用<

浏览 0提问于2016-04-28得票数 2

回答已采纳

1回答

确定K-表示Python中的簇数

、、、

我将一个轨迹数据集保存在一个*.csv文件中，并根据月份对其进行排序。我是说，我按月把它分成了不同的文件。每个文件中的记录数是不同的。例如，一月份我有一万张唱片，四月份我有五十万张唱片。我将对每个文件在python中执行k均值集群。你能告诉我怎样才能找到或确定的最佳簇数到初始的K 谢谢

浏览 1提问于2021-03-21得票数 0

1回答

将多元高斯分布拟合到给定的数据集

、

我需要拟合多变量高斯分布，即获得python中给定音频特征数据集的最接近多变量高斯的均值向量和协方差矩阵。音频特征(MFCC系数)是N×13矩阵，其中N约为4K。谁能概述一下python中适合这些数据的高斯分布的包和技术吗？

浏览 6提问于2014-12-01得票数 13

1回答

使用python实现给定数据集的最优k-均值

、

我对python和集群的最佳数量还是个新手。现在，我的任务是分析两组数据，并使用弯头和轮廓方法确定其最优Kmean。 X表示归一化前的原始数据。我使用elbow方法查看不同k值下的wcss值，使用silhouette方法查看silhouette分数。= range(2,15) km = KMean

浏览 16提问于2020-11-25得票数 2

1回答

聚类和分类的详细信息

、、、

我有一个文件，大约有10000行，每一行都有一个随机句子，例如他以前在医疗行业工作过。他在计算机科学领域有5年的经验。我所做的：单词格式中的切分:在从字符串中词干和清除后，对所有10000句中的每个干净单词进行

浏览 3提问于2014-11-30得票数 0

回答已采纳

1回答

如何在python中连接N个不同的一维数组

、、、

我是python的新手。我必须在python中实现k折交叉验证。我可以将给定的数据拆分成k个大小相等的数组，但不能将k-1个数组连接起来，这将是训练数据集。我知道numpy中的concatenate()，但由于k是动态确定的，因此不确定如何在此场景中使用它。感谢您在这方面的任

浏览 1提问于2016-02-12得票数 2

1回答

如何计算K的BIC --求最佳K

、

我对K-均值聚类技术非常陌生。我想用K-均值来计算BIC，找出最佳的K(簇数)。我环顾了一下网络，想在python中找到一个解决方案，但是除了之外，没有任何具体的例子，我不确定它是否正确。

浏览 1提问于2016-02-13得票数 0

回答已采纳

1回答

在python中对地理编码/(经度/经度)数据点进行聚类分析的最佳方法是什么？

、、、

在python中对地理编码/(经度/经度)数据点进行聚类分析的最佳方法是什么？我也尝试过使用DBscan，但我认为它不是基于我的</em

浏览 2提问于2016-01-27得票数 1

1回答

如何计算k均值何时收敛于tf idf？

、、、、

我是一个使用文本数据的新手。在我把它转换成一个稀疏矩阵后，我用5-10个簇来拟合k均值，但我不知道我是否收敛了。

浏览 0提问于2016-08-06得票数 0

回答已采纳

1回答

房地产价格区域分割图

、

我收集了一些权重作为房地产价格的积分。我需要把地图分割到房地产价格的各个地区。因此，价格接近的兄弟区域应该合并。类似Voronoi图但是区域合并。你能给我推荐一些好算法吗。提前谢谢。

浏览 1提问于2018-12-09得票数 0

回答已采纳

1回答

NLP:识别给定的文本是查询还是语句

、、、

我正在进行对话式chatbot.How，以确定给定的文本是要求回答还是提供一些信息？案例二:我想知道波士顿洛根机场到酒店的距离。预期结果:问题我有19k个查询的数据集，分类为(问题而不是问题).What是现在继续的最佳方式/模型(使用Python)？

浏览 0提问于2018-01-19得票数 1

1回答

拟合分布参数

、、、、

在为我的数据集搜索最佳匹配分布时，结果是具有以下参数的指数修正正态分布：西佩给了我们一种方法，通过以下方法分析分布的平均值：生成的fitt

浏览 1提问于2018-03-20得票数 0

回答已采纳

1回答

在sklearn中使用支持向量机时如何实际使用验证集

、

在使用SVM时，我发现对原始数据集执行三向拆分是一种很好的做法，类似于70/15/15的拆分。这种分割将对应于%70用于培训，%15用于测试，%15对应于所谓的“验证”。我很清楚为什么这是一个很好的实践，但我不确定实际执行这一操作所需的具体细节。很多在线资源讨论了这个过程的重要性，但是我似乎找不到对这个过程的明确描述(或者至少是算法描述)。例如，sklearn讨论了，但在提供任

浏览 1提问于2014-01-26得票数 3

1回答

加权K均值与GPS数据

、、、

目标我一直在讨论如何将加权变量添加到k-均值算法中，但我不确定对变量进行加权的实际过程。如果是这样的话，那么距离不是不适当地倾斜并且错误地代表了仓库配送中心的最佳</em

浏览 5提问于2016-10-05得票数 1

回答已采纳

1回答

如何为DBSCAN寻找最优参数？

、、、

对于DBSCAN算法，是否有计算挖掘值和eps值的工具？目前，我使用sklearn库来应用DBSCAN算法。

浏览 1提问于2019-11-21得票数 3

回答已采纳

3回答

有什么方法来检测给定的图片是否是人的脸？

、、、、

是否有任何简单的算法来判断给定的图像是脸还是其他(没有希望的训练)？我的思想是构造每幅图像的特征向量，然后应用一些聚类方法(例如k=2的k-均值)。但是，即使获得了良好的聚类结果，我也不确定什么是区分脸/非脸的最佳标准？

浏览 3提问于2014-03-18得票数 3

回答已采纳

1回答

聚类2D曲线

、、

我在2D空间中有一组曲线，每个曲线表示为一组(抽样)数据点。每一组都有或多或少相同的项目数量--最终，我想我将使用binning来确保点数相同(比如50)，如果有帮助的话。第一个维度上可能的翻译是不相关的。我想把这个问题转化成一个100维空间(50x2)，其中每个曲线的样本成为特征。这种方法能起作用吗？有没有更好的方法，要么使用<e

浏览 0提问于2021-05-01得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用PyCluster优化K(理想簇数)

如何选择“最佳”的无监督机器学习算法来对特定数据集进行聚类？

如何获得k均值簇的权重和方差？

确定K-表示Python中的簇数

将多元高斯分布拟合到给定的数据集

使用python实现给定数据集的最优k-均值

聚类和分类的详细信息

如何在python中连接N个不同的一维数组

如何计算K的BIC --求最佳K

在python中对地理编码/(经度/经度)数据点进行聚类分析的最佳方法是什么？

如何计算k均值何时收敛于tf idf？

房地产价格区域分割图

NLP:识别给定的文本是查询还是语句

拟合分布参数

在sklearn中使用支持向量机时如何实际使用验证集

加权K均值与GPS数据

如何为DBSCAN寻找最优参数？

有什么方法来检测给定的图片是否是人的脸？

聚类2D曲线

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐