K-Means 算法在实际应用中的缺陷
II . K-Means 初始中心点选择不恰当
III . K-Means 优点 与 弊端
IV . 基于密度的聚类方法
V ....必须事先设置聚类分组个数
K
值 : 开始的时候并不知道将数据集分成几组能达到最佳的分组效果 ;
① 学习出
K
值 : 使用其它聚类方法 , 先将数据集学习一遍 , 确定聚类分组个数 ;
②...K-Means 初始中心点选择不恰当
----
下面的数据集 , 如果使用肉眼观察 , 选择的中心点是如下绿色的点 , 但是如果随机选择中心点 , 加入选择的很差 , 如下图中的红色点作为中心点 , 那么迭代之后的聚类分组如下图所示...K-Means 无法处理的情况 : 如下面的聚类 , 将不同形状的样本分开 , 需要识别出凹形的模式 , K-Means 无法完成该聚类操作 ;
IV . 基于密度的聚类方法
----
1 ....示例 : 如 , 先定义好 , 如果进行聚类 , 必须在
1 \times 1
平面内至少有
16
个样本 , 给定一个区域内的点 , 如果该区域的样本密度值大于
16
, 就划分到一个聚类中