KMeans
KMeans是一种无监督学习聚类方法, 目的是发现数据中数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好。...无监督学习,也就是没有对应的标签,只有数据记录.通过KMeans聚类,可以将数据划分成一个簇,进而发现数据之间的关系.
?...:
\(\mu_j=\frac{\sum_{i=1}^n1{(c^i==j)}x^i}{\sum_{i=1}^n1{(c^{(i)}=j)}}\)
}
用语言描述来说,就是:随机确定k个初始点作为簇中心...将数据点分配到最近的质心所代表的簇上
对于每个簇,计算簇中所有点的均值,并将均值作为新的簇中心[质心]
存在问题及其处理方法
必须事先给出k(要生成的簇的数目),而且对初值敏感,对于不同的初始值...另一方面,可以对kmeans进行优化处理,存在一种二分kMeans处理.