首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >大型数据集的K均值聚类

大型数据集的K均值聚类
EN

Data Science用户
提问于 2016-11-26 20:45:02
回答 1查看 552关注 0票数 -2

我有一个纬度和经度坐标的数据集,每个数据集中有140000个值,当我使用r应用k均值聚类时,我得到了以下错误:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
"Error in do_one(nmeth) : NA/NaN/Inf in foreign function call (arg 1)"

但是,dataset不包含任何我不认为的缺失值。我应该如何解决这个问题,并使集群离开这些位置?是否有其他适合这方面的演算法?这项任务的目的是让事故发生的地区/地区更多。

EN

回答 1

Data Science用户

发布于 2016-11-27 08:21:24

首先,

“dataset没有任何缺失的值,我不认为”

如果您不确定数据是否是干净的,您可能应该先检查它。您应该检查输入数据帧的两列是否没有NAs,并且所有的值都是数字的。然后检查R中的数据类型和kmeans接受的数据类型。

如果这不会导致任何地方,一个小样本的数据和您的代码将是有帮助的。

关于另一种方法,我可以考虑聚类和dbscan算法,但我认为这不是您的问题。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/15374

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文