)
① 没有类标签 : 虽然将数据集分成若干子集 , 但是以什么依据分 , 事先是不知道的 ;
② 没有训练集 : 分类操作中 , 将数据集先分成训练集 和 测试集 , 但是在聚类中 , 只有一个数据集...分组 与 分类 : 分别是 聚类 和 分类 的结果 ;
① 相同点 : 都是将一个数据集分成若干数据子集 ;
② 分类 : 数据子集有明确的类别标签 , 这个子集是属于哪一类的 ;
③ 聚类 : 这些数据类似...用途 , 位置 , 等因素 , 对该数据集进行聚类分析 , 为数据集分组 , 便于城市规划 ;
③ 地理用途 : 将地球上不同地区的情况当做数据集 , 录入该地区的各种属性 , 聚类分析这些地区 , 并将其分组...⑥ 样本顺序 : 数据集样本 输入的顺序不应该影响聚类结果 ; 基于层次的聚类 , 不同的样本输入顺序 , 会得到不同的聚类分组结果 ;
⑦ 数据维度 : 可以处理 高维度 的 样本数据;
⑧ 用户条件...: 用户会提出各种 限定条件 , 聚类算法可以与这些要求相结合 ;
⑨ 使用性 : 可解释性 与 可使用性 好 ;
VI .