我有一个纬度和经度坐标的数据集,每个数据集中有140000个值,当我使用r应用k均值聚类时,我得到了以下错误:
"Error in do_one(nmeth) : NA/NaN/Inf in foreign function call (arg 1)"
但是,dataset不包含任何我不认为的缺失值。我应该如何解决这个问题,并使集群离开这些位置?是否有其他适合这方面的演算法?这项任务的目的是让事故发生的地区/地区更多。
发布于 2016-11-27 08:21:24
首先,
“dataset没有任何缺失的值,我不认为”
如果您不确定数据是否是干净的,您可能应该先检查它。您应该检查输入数据帧的两列是否没有NAs,并且所有的值都是数字的。然后检查R中的数据类型和kmeans接受的数据类型。
如果这不会导致任何地方,一个小样本的数据和您的代码将是有帮助的。
关于另一种方法,我可以考虑聚类和dbscan算法,但我认为这不是您的问题。
https://datascience.stackexchange.com/questions/15374
复制相似问题