我有一个有29个观测和15个变量的数据集。我试图执行k均值聚类分析,当我试图使用NbClust包确定集群数量时,我得到以下错误:
> library(NbClust)
> set.seed(1234)
> nc <- NbClust(df, min.nc=2, max.nc=15, method="kmeans")
Error in solve.default(W) :
system is computationally singular: reciprocal condition number = 1.50527e-17
In addition: Warning messages:
1: In pf(beale, pp, df2) : NaNs produced
2: In pf(beale, pp, df2) : NaNs produced
如果删除一个将观察值增加到41的变量(即,数据帧现在是41x14),NbClust就会工作。
有人能帮助我理解为什么我会得到29x15数据帧的计算奇异误差吗?
此外,即使在41x14数据帧中,我也没有看到wss图中有一个明显的弯曲:
NbClust提出了15个簇。这是否意味着我没有明确的集群?
发布于 2016-02-05 04:25:42
WSS图表明,它的完全不能在上工作。
这样的情节表明可能只有一个集群。
可能是由于预处理不足,或者是因为算法对于这些数据来说是个糟糕的选择。不管是哪种情况,我都会假设结果无效。
https://stackoverflow.com/questions/35183595
复制